• 제목/요약/키워드: mobile deep learning

검색결과 225건 처리시간 0.029초

구조 인식 심층 합성곱 신경망 기반의 영상 잡음 제거 (Image Denoising Via Structure-Aware Deep Convolutional Neural Networks)

  • 박기태;손창환
    • 한국정보기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.85-95
    • /
    • 2018
  • 스마트폰의 보급이 확산되고 대중화됨에 따라 대부분의 사람들은 사진을 촬영하기 위해 모바일 카메라를 애용하고 있다. 하지만 저조도 환경에서 사진을 촬영할 때 광량이 부족한 이유로 원치 않는 잡음이 발생할 수 있다. 이런 잡음을 제거하기 위해, 최근 심층 합성곱 신경망에 기반한 잡음 제거 기법이 제안되었다. 이 기법은 성능 측면에서 큰 진전을 보였을지라도 여전히 텍스처 및 에지 표현 능력이 부족하다. 따라서 본 논문에서는 영상의 구조를 향상시키기 위해 에지의 방향 정보를 나타내는 호그 영상을 활용하고자 한다. 그리고 잡음 영상과 호그 영상을 스택으로 쌓은 후, 입력 텐서를 형성하여 심층 합성곱 신경망을 학습시키는 기법을 제안하고자 한다. 실험 결과를 통해, 제안한 기법은 기존의 기법보다 정량적인 화질 평가에서 더 우수한 결과를 얻을 수 있었으며 시각적인 측면에서도 텍스처 및 에지의 향상을 달성할 수 있었다.

Framework for Reconstructing 2D Data Imported from Mobile Devices into 3D Models

  • Shin, WooSung;Min, JaeEun;Han, WooRi;Kim, YoungSeop
    • 반도체디스플레이기술학회지
    • /
    • 제20권4호
    • /
    • pp.6-9
    • /
    • 2021
  • The 3D industry is drawing attention for its applications in various markets, including architecture, media, VR/AR, metaverse, imperial broadcast, and etc.. The current feature of the architecture we are introducing is to make 3D models more easily created and modified than conventional ones. Existing methods for generating 3D models mainly obtain values using specialized equipment such as RGB-D cameras and Lidar cameras, through which 3D models are constructed and used. This requires the purchase of equipment and allows the generated 3D model to be verified by the computer. However, our framework allows users to collect data in an easier and cheaper manner using cell phone cameras instead of specialized equipment, and uses 2D data to proceed with 3D modeling on the server and output it to cell phone application screens. This gives users a more accessible environment. In addition, in the 3D modeling process, object classification is attempted through deep learning without user intervention, and mesh and texture suitable for the object can be applied to obtain a lively 3D model. It also allows users to modify mesh and texture through requests, allowing them to obtain sophisticated 3D models.

Automatic Detection of Dead Trees Based on Lightweight YOLOv4 and UAV Imagery

  • Yuanhang Jin;Maolin Xu;Jiayuan Zheng
    • Journal of Information Processing Systems
    • /
    • 제19권5호
    • /
    • pp.614-630
    • /
    • 2023
  • Dead trees significantly impact forest production and the ecological environment and pose constraints to the sustainable development of forests. A lightweight YOLOv4 dead tree detection algorithm based on unmanned aerial vehicle images is proposed to address current limitations in dead tree detection that rely mainly on inefficient, unsafe and easy-to-miss manual inspections. An improved logarithmic transformation method was developed in data pre-processing to display tree features in the shadows. For the model structure, the original CSPDarkNet-53 backbone feature extraction network was replaced by MobileNetV3. Some of the standard convolutional blocks in the original extraction network were replaced by depthwise separable convolution blocks. The new ReLU6 activation function replaced the original LeakyReLU activation function to make the network more robust for low-precision computations. The K-means++ clustering method was also integrated to generate anchor boxes that are more suitable for the dataset. The experimental results show that the improved algorithm achieved an accuracy of 97.33%, higher than other methods. The detection speed of the proposed approach is higher than that of YOLOv4, improving the efficiency and accuracy of the detection process.

이미지 인식 기반 향상된 개인정보 식별 및 마스킹 시스템 설계 및 구현 (Design and Implementation of Personal Information Identification and Masking System Based on Image Recognition)

  • 박석천
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.1-8
    • /
    • 2017
  • 최근 클라우드, 모바일 등 ICT 기술의 발전으로 소셜 네트워크를 통한 이미지 활용이 급증하고 있다. 이러한 이미지는 개인정보가 포함되어 있어, 개인정보 유출 사고가 발생될 수 있다. 이에 이미지에서 개인정보를 인식하고 마스킹하는 연구가 진행되고 있다. 그러나 기존 이미지에서 개인정보를 인식 하는 방법인 광학 문자 인식은 이미지의 밝기, 명암, 왜곡에 따라 인식률의 변화가 심하여 한글 인식이 미흡한 문제가 있다. 따라서 본 논문에서는 광학 문자 인식 방법을 기반으로 CNN 알고리즘에 딥러닝을 적용하여 이미지 인식 기반 향상된 개인정보 식별 및 마스킹 시스템을 설계 및 구현하였다. 또한 구현된 제안 시스템을 동일한 이미지를 가지고 광학 문자 인식과 개인정보 인식률을 비교평가를 진행하고, 제안 시스템의 얼굴 인식률을 측정하였다. 테스트 결과 제안 시스템의 개인정보 인식률은 광학 문자인식에 비해 32.7% 향상되었으며 얼굴 인식률은 86.6%로 확인되었다.

Study on driver's distraction research trend and deep learning based behavior recognition model

  • Han, Sangkon;Choi, Jung-In
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권11호
    • /
    • pp.173-182
    • /
    • 2021
  • 본 논문에서는 운전자의 주의산만을 유발하는 운전자, 탑승자의 동작을 분석하고 핸드폰과 관련된 운전자의 행동 10가지를 인식하였다. 먼저 주의산만을 유발하는 동작을 환경 및 요인으로 분류하고 관련 최근 논문을 분석하였다. 분석된 논문을 기반으로 주의산만을 유발하는 주요 원인인 핸드폰과 관련된 10가지 운전자의 행동을 인식하였다. 약 10만 개의 이미지 데이터를 기반으로 실험을 진행하였다. SURF를 통해 특징을 추출하고 3가지 모델(CNN, ResNet-101, 개선된 ResNet-101)로 실험하였다. 개선된 ResNet-101 모델은 CNN보다 학습 오류와 검증 오류가 8.2배, 44.6배가량 줄어들었으며 평균적인 정밀도와 f1-score는 0.98로 높은 수준을 유지하였다. 또한 CAM(class activation maps)을 활용하여 딥러닝 모델이 운전자의 주의 분산 행동을 판단할 때, 핸드폰 객체와 위치를 결정적 원인으로 활용했는지 검토하였다.

딥러닝 기반의 무기 소지자 탐지 (Armed person detection using Deep Learning)

  • 김건욱;이민훈;허유진;황기수;오승준
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.780-789
    • /
    • 2018
  • 전 세계적으로 총기 사고는 인적이 드문 장소뿐만 아니라 사람들이 많이 모여 있는 공공장소에서도 빈번하게 일어난다. 특히, 권총과 같은 소형 총기 사고의 빈도수가 매우 높다. 그러므로 사람에 비해 상대적으로 매우 작은 크기의 객체인 권총을 가진 사람을 탐지하는 것은 사고의 피해를 최소화하는데 핵심적이다. '권총 든 사람'을 탐지하는 연구가 수행되고 있지만, 사람보다 권총은 상대적으로 크기가 작기 때문에 단일 객체만을 탐지하는 기존 객체 탐지 방법으로 '권총 든 사람'을 탐지하면 오류 발생 빈도수가 매우 높다. 이러한 문제점을 해결하기 위하여 권총으로 무장한 사람을 탐지하는 방법으로 APDA(Armed Person Detection Algorithm)를 제안한다. APDA는 입력 영상에서 합성곱신경망(Convolutional Neural Network, CNN) 기반의 인체 특징점 탐지 모델과 객체 탐지 모델을 병행하여 획득한 양 손목과 권총의 위치를 후처리 작업에서 이용하여 '권총 든 사람'을 탐지한다. APDA는 기존 방식보다 객관적 평가에서 재현율이 46.3% 향상되었고, 정밀도는 14.04% 향상되었다.

FPN(Feature Pyramid Network)을 이용한 고지서 양식 인식 (Recognition of Bill Form using Feature Pyramid Network)

  • 김대진;황치곤;윤창표
    • 한국정보통신학회논문지
    • /
    • 제25권4호
    • /
    • pp.523-529
    • /
    • 2021
  • 4차산업 혁명 시대를 맞아, 기술의 변화가 다양한 분야에 적용되고 있다. 고지서 분야에서도 자동화, 디지털화, 데이터관리가 되고 있다. 사회에서 유통되는 고지서의 형태는 수만 가지 이상이며, 이를 자동화, 디지털화, 데이터관리를 위해서는 고지서 인식이 필수적이다. 현재 다양한 고지서들을 관리하기 위해서 OCR(Optical Character Recognition) 기술을 활용한다. 이때, 정확도를 높이기 위해, 먼저 고지서 양식을 인식하면, OCR 인식 시 더 높은 인식률을 가질 수 있다. 본 논문에서는 고지서 양식을 구분하기 위해 인덱스로 사용할 수 있는 로고를 객체 인식하였으며, 이때 로고의 크기가 전체 고지서 대비 작으므로 딥러닝 기술 중 FPN(Feature Pyramid Network)을 작은 객체 검출에 활용하였다. 결과적으로, 제안하는 알고리즘을 통해서 자원 낭비를 줄이고, OCR 인식 정확도를 높일 수 있었다.

합성곱 신경망을 이용한 딥러닝 기반의 프레임 동기 기법 (Deep Learning based Frame Synchronization Using Convolutional Neural Network)

  • 이의수;정의림
    • 한국정보통신학회논문지
    • /
    • 제24권4호
    • /
    • pp.501-507
    • /
    • 2020
  • 본 논문에서는 합성곱 신경망(CNN)에 기반한 프레임 동기 기법을 제안한다. 기존의 프레임 동기 기법은 프리앰블과 수신 신호 사이의 상관을 통해 수신 신호와 프리앰블이 일치하는 지점을 찾는다. 제안하는 기법은 1차원 벡터로 이루어진 상관기 출력 신호를 2차원 행렬로 재구성하며, 이 2차원 행렬을 합성곱 신경망에 입력하고 합성곱 신경망은 프레임 도착 지점을 추정한다. 구체적으로 가산 백색 가우스 잡음(AWGN) 환경에서 무작위로 도착하는 수신 신호를 생성하여 학습 데이터를 만들고, 이 학습 데이터로 합성곱 신경망을 학습시킨다. 컴퓨터 모의실험을 통해 기존의 동기 기법과 제안하는 기법의 프레임 동기 오류 확률을 다양한 신호 대 잡음 비(SNR)에서 비교한다. 모의실험 결과는 제안하는 합성곱 신경망을 이용한 프레임 동기 기법이 기존 기법 대비 약 2dB 우수함을 보인다.

도로 자산관리를 위한 상태 모니터링 및 경제성 분석 : 세종시를 중심으로 (Infrastructure Health Monitoring and Economic Analysis for Road Asset Management : Focused on Sejong City)

  • 최승현;박정권;도명식
    • 한국ITS학회 논문지
    • /
    • 제20권4호
    • /
    • pp.71-82
    • /
    • 2021
  • 본 연구에서는 세종시 포장도로 구간을 대상으로 모바일매핑시스템(MMS)과 딥러닝 균열 감지시스템을 활용한 도로포장 모니터링 방안을 제시하고 경제성 분석을 통한 최적 유지보수 공법을 제시하였다. 나아가, 기존 대부분의 연구에서는 도로포장 조사 차량에 의해 취득된 데이터를 활용한 사례가 대부분이었으나 본 연구에서는 직접 모니터링 조사를 통해 취득한 도로 포장 상태등급을 기준으로 경제성 분석을 실시하였다. 도로포장 상태 모니터링 결과 일반국도, 시도, 지방도의 순서대로 도로포장 상태가 양호한 것을 확인하였다. 또한 포장파손모델을 활용한 경제성 분석 결과, 예방적 유지보수공법인 마이크로서페이싱 공법을 적용하는 것이 유지보수비용과 이용자 편익 측면에서 가장 경제적인 것으로 나타났다. 본 연구의 성과는 지자체의 기반시설 관리계획 수립을 위한 기초적 자료로 활용될 것으로 기대된다.

합성곱 신경망을 적용한 Optical Camera Communication 시스템 성능 분석 (Performance Analysis of Optical Camera Communication with Applied Convolutional Neural Network)

  • 김종인;박현선;김정현
    • 스마트미디어저널
    • /
    • 제12권3호
    • /
    • pp.49-59
    • /
    • 2023
  • 차세대 무선 통신기술로 알려져 있는 Optical Camera Communication(OCC)은 많은 연구가 진행 되고 있다. 이러한 OCC 기술은 통신 환경에 의해 성능이 좌우되며 이를 개선하기 위해 다양한 전략이 연구되고 있다. 그중 가장 두각을 나타내고 있는 방법은 딥러닝 기술을 사용하여 OCC의 수신기에 CNN을 적용하는 방법이다. 하지만 대부분의 연구에서는 CNN을 단순히 송신기를 검출하는데 사용하고 있다. 본 논문에서는 CNN을 송신기 검출 뿐만 아니라 Rx 복조 시스템에 적용하여 실험한다. 그리고 OCC 시스템의 데이터 이미지는 다른 이미지 데이터셋과는 다르게 비교적 분류가 간단하기 때문에 대부분의 CNN 모델에서 높은 정확도의 결과가 나타날 것이라는 가설을 세웠다. 가설을 증명하기 위해 OCC 시스템을 설계 및 구현하여 데이터를 수집하였고 12가지의 다양한 CNN 모델에 적용하여 실험했다. 실험 결과 파라미터수가 많은 고성능의 CNN 모델 뿐만 아니라 경량화 CNN 모델에서도 99% 이상의 정확도를 달성하였고 이를 통해 스마트폰과 같은 저성능 계산 장치에 OCC 시스템 적용이 가능함을 확인했다.