• Title/Summary/Keyword: 딥러닝 기반 물체 인식

Search Result 44, Processing Time 0.028 seconds

딥러닝 기반 얼굴 검출, 랜드마크 검출 및 얼굴 인식 기술 연구 동향

  • Hwang, Won-Jun
    • Broadcasting and Media Magazine
    • /
    • v.22 no.4
    • /
    • pp.41-49
    • /
    • 2017
  • 본 논문에서는 최근 각광받고 있는 Convolutional Neural Network(CNN)과 같은 딥러닝 기반의 얼굴 인식 연구 동향을 살펴 보고자 한다. 얼굴 인식은 입력 영상이 들어왔을 때 자동으로 누구인지 알아내는 알고리즘으로 크게 얼굴 검출, 얼굴 랜드마크 검출 및 얼굴 특징 추출로 나누어진다. 본 논문에서는 얼굴 검출, 랜드마크 검출 및 얼굴 특징 추출에 특화된 딥러닝 알고리즘을 하나씩 살펴보고 이들이 어떻게 발전해 왔는지를 확인하고자 한다. 특히, 딥러닝 기반 얼굴 인식 알고리즘들은 딥러닝 기반 물체 인식의 발전 방향과 유사하게 진행되어 오다가 최근에는 얼굴 인식에 특화된 딥러닝 아키텍처 형태로 발전하고 있다. 어떤 방향이 얼굴 인식에 더 도움이 될지에 대해서도 확인하고 실제로 어떤 문제를 해결하고 있는지 확인하고자 한다.

Development of Python-based Annotation Tool Program for Constructing Object Recognition Deep-Learning Model (물체인식 딥러닝 모델 구성을 위한 파이썬 기반의 Annotation 툴 개발)

  • Lim, Song-Won;Park, Goo-man
    • Journal of Broadcast Engineering
    • /
    • v.25 no.3
    • /
    • pp.386-398
    • /
    • 2020
  • We developed an integrative annotation program that can perform data labeling process for deep learning models in object recognition. The program utilizes the basic GUI library of Python and configures crawler functions that allow data collection in real time. Retinanet was used to implement an automatic annotation function. In addition, different data labeling formats for Pascal-VOC, YOLO and Retinanet were generated. Through the experiment of the proposed method, a domestic vehicle image dataset was built, and it is applied to Retinanet and YOLO as the training and test set. The proposed system classified the vehicle model with the accuracy of about 94%.

Implementation of Yolov3-tiny Object Detection Deep Learning Model over RISC-V Virtual Platform (RISC-V 가상플랫폼 기반 Yolov3-tiny 물체 탐지 딥러닝 모델 구현)

  • Kim, DoYoung;Seol, Hui-Gwan;Lim, Seung-Ho
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.576-578
    • /
    • 2022
  • 딥러닝 기술의 발전으로 객체 인색, 영상 분석에 관한 성능이 비약적으로 발전하였다. 하지만 고성능 GPU 를 사용하는 컴퓨팅 환경이 아닌 제한적인 엣지 디바이스 환경에서의 영상 처리 및 딥러닝 모델의 적용을 위해서는 엣지 디바이스에서 딥러닝 모델 실행 환경 과 이에 대한 분석이 필요하다. 본 논문에서는 RISC-V ISA 를 구현한 RISC-V 가상 플랫폼에 yolov3-tiny 모델 기반 객체 인식 시스템을 소프트웨어 레벨에서 포팅하여 구현하고, 샘플 이미지에 대한 네트워크 딥러닝 연산 및 객체 인식 알고리즘을 적용하여 그 결과를 도출하여 보았다. 본 적용을 바탕으로 RISC-V 기반 임베디드 엣지 디바이스 플랫폼에서 딥러닝 네트워크 연산과 객체 인식 알고리즘의 수행에 대한 분석과 딥러닝 연산 최적화를 위한 알고리즘 연구에 활용할 수 있다.

레이더 영상 기반 딥러닝을 이용한 물체 인식

  • 이유경;이창민;양영준
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2022.06a
    • /
    • pp.28-30
    • /
    • 2022
  • 본 연구에서는 컴퓨터 비전 기반의 딥러닝 객체 인식 기술을 이용하여 속초해수욕장에서 수집한 레이더 이미지에서 선박, 섬 및 부유체에 대해 탐지(Detection), 인식(Recognition)하는 연구를 수행하였다. 2021년 8월에 수집한 레이더 영상을 이용하여 본 연구를 수행하였으며, 움직이는 물표와 섬 등을 구분하였다. 일부 환경적인 제약에 따라 에러 발생이 있었지만, 향후 현재까지 수집한 레이더 영상을 추가하여 정확도를 높일 예정이다.

  • PDF

Flashing Traffic Light Control Method Based on Deep Learning (딥러닝 기반의 야간 점멸신호 제어 기법)

  • Kim, Dong-Gyu;Lee, Seung-Jun;Park, Joon-Ho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.21-24
    • /
    • 2021
  • 본 논문에서는 딥러닝을 기반으로 하는 야간 점멸신호 제어를 통하여 신호 위반과 과속에 의한 교통사고로부터 보행자와 운전자의 인명피해 최소화를 목표로 한다. 제안된 기법은 딥러닝을 기반으로 하여 교차로에서 심야 보행자 인식률을 향상시키고, 야간 점멸신호를 연동 제어하는 기법을 제안하고 있다. 야간의 영상 인식 과정은 어두운 제약조건의 환경에서 떨어지는 영상인식을 보완하기 위하여 PIR 센서로부터 물체를 인식한다. 아두이노의 PIR 센서에서 인식된 물체에 대하여 보행자 여부를 판단하기 위하여 YOLO 알고리즘을 적용한다. 젯슨자비에NX로부터 수신받은 정보를 기반으로 점멸신호에서 일반 신호등 신호로 전환 후 보행자 횡단 시간을 고려하여 일정 시간이 지난 후 다시 일반 신호등 신호에서 점멸신호로 전환한다. 본 논문은 심야의 제한된 조건에서 보행자 식별을 통하여 교차로에서 보행자와 운전자의 인명피해 줄일 수 있을 것으로 기대한다.

  • PDF

A Technique for detecting a person hidden behind an object in a fire situation (Guided Attention Mechanism을 활용한 화재사고 시 물체에 가려진 사람 탐지 기법)

  • Yeon-Jun Yoo;;Yong-Tae Shin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.740-742
    • /
    • 2023
  • 객체 인식 연구에 있어서 딥러닝 기반의 사람 인식에 있어서 많은 연구들이 공개되고 있다. 특히 화재사고에 있어서 연기로 인해 가시성이 떨어져 인명구조에 어려움이 발생한다. 이에 열화상 카메라와 딥러닝을 통해 사람을 인식하는 기술이 연구되고 있다. 기존 연구에서는 열화상 카메라와 YOLO 딥러닝을 통해 사람을 인식하는데 95%의 성능을 보였지만, YOLO는 그리드 셀에서 하나의 분류만하기 때문에 물체에 가려진 사람을 판별하는데 정확도가 낮았다. 본 논문에서는 이와 같은 한계를 극복하기 위해 기존 Faster R-CNN 알고리즘을 사용한다. 신체부위 Guided Attention mechanism을 사용하여 가중치를 준 Feature Map을 RPN에 적용시켜 학습모델을 구현한다면 더 높은 정확도를 얻을 수 있다. 향후 본 논문에서 제안하는 기법은 많은 실험과 다양한 데이터 셋을 통해 실질적인 검증을 할 예정이다.

A Survey on Deep Learning based Face Recognition for User Authentication (사용자 인증을 위한 딥러닝 기반 얼굴인식 기술 동향)

  • Mun, Hyung-Jin;Kim, Gea-Hee
    • Journal of Industrial Convergence
    • /
    • v.17 no.3
    • /
    • pp.23-29
    • /
    • 2019
  • Object recognition distinguish objects which are different from each other. But Face recognition distinguishes Identity of Faces with Similar Patterns. Feature extraction algorithm such as LBP, HOG, Gabor is being replaced with Deep Learning. As the technology that identify individual face with machine learning using Deep Learning Technology is developing, The Face Recognition Technology is being used in various field. In particular, the technology can provide individual and detailed service by being used in various offline environments requiring user identification, such as Smart Mirror. Face Recognition Technology can be developed as the technology that authenticate user easily by device like Smart Mirror and provide service authenticated user. In this paper, we present investigation about Face Recognition among various techniques for user authentication and analysis of Python source case of Face recognition and possibility of various service using Face Recognition Technology.

Development of Python-based Annotation Tool Program for Constructing Object Recognition Deep-Learning Model (물체인식 딥러닝 모델 구성을 위한 파이썬 기반의 Annotation 툴 개발)

  • Lim, Songwon;Park, Gooman
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.11a
    • /
    • pp.162-164
    • /
    • 2019
  • 본 논문에서는 물체인식 딥러닝 모델 생성에 필요한 라벨링(Labeling)과정에서 사용자가 다양한 기능을 활용하여 효과적인 학습 데이터를 구성할 수 있는 GUI 프로그램을 구현했다. 프로그램의 인터페이스는 파이썬 기반의 GUI 모듈인 Tkinter 를 활용하여, 실시간으로 이미지 데이터를 수집할 수 있는 크롤링(Crawling)기능과 미리 학습된 Retinanet 을 통해 이미지 데이터를 인식함으로써 자동으로 주석(Annotation) 과정을 수행할 수 있는 기능을 구성했다. 또한, 수집한 이미지 데이터를 다양한 효과와 노이즈, 변형 등으로 Augmentation 기능을 추가함으로써, 사용자가 모델을 학습하기 위한 데이터 전처리 단계를 하나의 GUI 프로그램에서 수행할 수 있도록 했다. 또한 사용자가 직접 학습한 모델을 추정 모델(Inference Model)로 변환하여 프로그램에 입력할 수 있도록 설계한다.

  • PDF

Cleaning robot system with deep learning-based sidewalk environment recognition and waste sorting technology (딥러닝 기반 보도(步道) 환경 인식 및 쓰레기 분류 기술을 탑재한 청소로봇 시스템)

  • Lee, Jong-Soo;Lim, Kyeong-Min;Lee, Young-Min;Lim, Jun-Oh;Yang, Woo-Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.925-927
    • /
    • 2022
  • 본 논문에서는 자율주행을 통해 보도를 청소하는 동안 분실물을 인지할 수 있는 로봇 시스템을 개발하였다. 분실물의 종류는 딥러닝 모델에 의해 지정되고 학습되며 로봇은 이를 인식하여 저장한다. 보도 경계 및 장애물을 감지하기 위해 Image-Segmentation 기술을 사용하였으며, 물체 감지에 사용되는 depth 카메라(d435)를 사용하였다. 학습하기 위한 딥러닝 모델로 YOLOv5 를 사용하였으며, 그 결과 정해진 사물을 인식하는 데 평균 84%의 정확도를 보였다. 이 시스템을 로봇에 적용할 경우 예상되는 효과로는 정확한 보도 인식으로 로봇이 경로를 이탈하지 않도록 하는 것, 유실물품의 신속하고 안전한 인계 등이 있다.

A Study on the Pipe Position Estimation in GPR Images Using Deep Learning Based Convolutional Neural Network (GPR 영상에서 딥러닝 기반 CNN을 이용한 배관 위치 추정 연구)

  • Chae, Jihun;Ko, Hyoung-yong;Lee, Byoung-gil;Kim, Namgi
    • Journal of Internet Computing and Services
    • /
    • v.20 no.4
    • /
    • pp.39-46
    • /
    • 2019
  • In recently years, it has become important to detect underground objects of various marterials including metals, such as detecting the location of sink holes and pipe. For this reason, ground penetrating radar(GPR) technology is attracting attention in the field of underground detection. GPR irradiates the radar wave to find the position of the object buried underground and express the reflected wave from the object as image. However, it is not easy to interpret GPR images because the features reflected from various objects underground are similar to each other in GPR images. Therefore, in order to solve this problem, in this paper, to estimate the piping position in the GRP image according to the threshold value using the CNN (Convolutional Neural Network) model based on deep running, which is widely used in the field of image recognition, As a result of the experiment, it is proved that the pipe position is most reliably detected when the threshold value is 7 or 8.