• 제목/요약/키워드: Object recognition system

검색결과 717건 처리시간 0.024초

시각장애인을 위한 시각 도움 서비스를 제공하는 인공지능 시스템 개발 (Development of artificial intelligent system for visual assistance to the Visually Handicapped)

  • 오창현;최광요;이호영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1290-1293
    • /
    • 2021
  • 현재 시각장애인들의 일상생활에 있어 많은 불편함을 겪고 있어 시각장애인에게 도움이 되고자 실시간 객체인식을 하여 보행환경의 정보를 전달하는 안경을 만드는 프로젝트를 진행하였다. 핵심 기능에 해당하는 객체인식은 인공지능 모델 YOLOv4가 사용되었으며, 시각장애인의 입장에서 걸어 다닐 때 인식 되어야 하는 객체들을 선정하고, 이들을 대상으로 학습 데이터를 재구성하고 YOLOv4의 재학습을 진행하였다. 학습 결과 모든 객체들에 대한 정확도는 68%를 보였으나 시각 장애인이 걸어다닐 때 인식되어야 하는 필수객체(Person, Bus, Car, Traffic_light, Bicycle, Motorcycle)들의 인식률은 84%로 측정되었다. 향 후 진행될 학습에선 더욱 다양한 방법으로 학습데이터를 확보하고, YOLOv4가 아닌 darkflow를 이용해 다양한 parameter로 학습을 진행하여 다면적인 성능비교가 필요하다.

접근객체 인식 및 전송을 위한 영상 디지털 도어락 시스템 설계 (Video Digital Doorlock System for Recognition and Transmission of Approaching Objects)

  • 이상락;박진태;우병현;최한고
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권6호
    • /
    • pp.237-242
    • /
    • 2014
  • 기존 사용되고 있는 디지털 도어락 시스템은 사용자의 편의에 중점을 두어 보안 측면에서는 취약한 단점이 있다. 이에 본 논문은 중계기, 서버, 카메라와 센서, 통신 모듈이 결합된 디지털 도어락 시스템화하여 도어락 설치장소 전방에서 접근하는 객체를 감지 및 인식하고 이미지와 문 열림 정보를 사용자의 스마트 디바이스로 전송해 주는 영상 디지털 도어락 시스템을 제안하고자 한다. 제안한 시스템은 실험결과 대상거리 내에서 96~98%의 접근자 인식률과 사용 통신망에 따라 평균 약 17.1~23.9초의 전송시간이 소요되었다. 따라서 도어락 시스템 전방의 상황을 모니터링하여 실시간 보안 대응이 가능할 것으로 판단된다.

RFID를 이용한 RCP 자율 네비게이션 시스템 구현을 위한 연구 (A Study on the Implementation of RFID-Based Autonomous Navigation System for Robotic Cellular Phone (RCP))

  • 최재일;최정욱;오동익;김승우
    • 제어로봇시스템학회논문지
    • /
    • 제12권5호
    • /
    • pp.480-488
    • /
    • 2006
  • Industrial and economical importance of CP(Cellular Phone) is growing rapidly. Combined with IT technology, CP is one of the most attractive technologies of today. However, unless we find a new breakthrough in the technology, its growth may slow down soon. RT(Robot Technology) is considered one of the most promising next generation technologies. Unlike the industrial robot of the past, today's robots require advanced features, such as soft computing, human-friendly interface, interaction technique, speech recognition object recognition, among many others. In this paper, we present a new technological concept named RCP (Robotic Cellular Phone) which integrates RT and CP in the vision of opening a combined advancement of CP, IT, and RT, RCP consists of 3 sub-modules. They are $RCP^{Mobility}$(RCP Mobility System), $RCP^{Interaction}$, and $RCP^{Integration}$. The main focus of this paper is on $RCP^{Mobility}$ which combines an autonomous navigation system of the RT mobility with CP. Through $RCP^{Mobility}$, we are able to provide CP with robotic functions such as auto-charging and real-world robotic entertainment. Ultimately, CP may become a robotic pet to the human beings. $RCP^{Mobility}$ consists of various controllers. Two of the main controllers are trajectory controller and self-localization controller. While the former is responsible for the wheel-based navigation of RCP, the latter provides localization information of the moving RCP With the coordinates acquired from RFID-based self-localization controller, trajectory controller refines RCP's movement to achieve better navigation. In this paper, a prototype of $RCP^{Mobility}$ is presented. We describe overall structure of the system and provide experimental results on the RCP navigation.

LMS algorithm을 이용한 배경분리 알고리즘 구현 및 성능 비교에 관한 연구 (A study on implementation of background subtraction algorithm using LMS algorithm and performance comparative analysis)

  • 김현준;권택구;주양익;서동환
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제39권1호
    • /
    • pp.94-98
    • /
    • 2015
  • 최근 정보화 및 컴퓨터 비전 기술의 발전과 함께 객체의 인식 및 추적 기능을 가진 CCTV시스템이 다양한 분야에서 연구되고 있다. 하지만 실외환경에서 발생할 수 있는 그림자의 변화, 조명의 변화, 움직이는 요소들과 같은 배경의 변화는 객체 인지성능에 영향을 주게 된다. 따라서 실외환경에서 배경의 변화를 실시간으로 갱신하기 위해 본 논문에서는 다양한 배경 모델링 기법들을 분석하고, 가중치를 기반으로 한 배경 갱신 알고리즘을 제안한다. 실험을 통해 제안한 알고리즘의 객체 검출 성능은 이전 연구의 객체 검출 성능을 유지하며, 오인식 된 객체 수가 이전 연구에 비해 감소됨을 확인하였다.

차량 탑승 인원 감지를 위한 트리거 기술에 관한 연구 (A Study on the Trigger Technology for Vehicle Occupant Detection)

  • 이동진;이지원;장종욱;장성진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.120-122
    • /
    • 2021
  • 현재 국내외 자동차 수요가 증가하게 되면서 차량탑승 인원은 적어지고 차량 수는 증가하는 추세이다. 이는 교통체증이 더 심해지게 되는 주요 원인이 된다. 이를 해결하기 위해 다인승 전용차로, HOV(High-occupancy vehicle) lane을 운영하고 있지만, 이용 조건을 무시하고 불법으로 이용하는 사람들이 계속 증가하고 있다. 이러한 불법행위를 경찰이 육안으로 판단하여 단속하기 때문에 단속 정확도도 낮으며 효율이 떨어진다. 본 논문에서는 이와 같은 문제를 해결하기 위해 컴퓨터 비전을 이용한 영상 분석 기술을 이용해서 보다 효율적인 탐지를 할 수 있는 시스템 설계를 제안한다. 기존의 연구되었던 차량 탐지 방법을 개선하여 영상 안에서 트리거를 설정하여 탐지 객체가 선정된 후 대상에 대해서 집중적으로 영상 분석을 진행할 수 있게 설계했으며 딥러닝 객체 인식 모델인 YOLO 모델을 사용하여 실시간 객체 탐지와 정확한 신호를 얻기 위해 영상 내 bounding box로 판단하는 것이 아닌 중심점의 이동량을 이용하는 방법을 제안한다.

  • PDF

물고기 분류를 위한 CNN의 적용 (Application of CNN for fish classification)

  • 황광복;황시랑;최영규;염동혁;박진현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 춘계학술대회
    • /
    • pp.464-465
    • /
    • 2018
  • 국내의 대표적인 생태계 교란 외래어종인 배스와 블루길은 국내 토종 어류 개체군 감소에 가장 중요한 요인으로 보고되고 있다. 그러므로 이러한 외래어종 퇴치를 위한 시스템개발 및 현장 적용기술이 필요한 실정이다. 본 연구는 이러한 시스템개발에 앞서 물고기 인식을 위한 전체적인 시스템을 설계하고자 한다. 최근 들어 물체의 인식, 분류 그리고 학습에 이르는 일련의 과정들을 딥러닝(deep learning) 중 하나인 CNN(convolutional Neural Network)이 매우 뛰어난 성능을 나타내고 있다. 그러나 물체의 인식과 분류작업에 사용된 CNN의 데이터들은 특징들이 확연한 다른 물체의 인식과 분류에 주로 적용되었다. 본 연구는 비슷한 특징들을 갖는 물고기 개체들의 분류에 CNN을 적용하는 시스템을 설계하고자 한다.

  • PDF

Design of Image Extraction Hardware for Hand Gesture Vision Recognition

  • Lee, Chang-Yong;Kwon, So-Young;Kim, Young-Hyung;Lee, Yong-Hwan
    • 한국정보기술학회 영문논문지
    • /
    • 제10권1호
    • /
    • pp.71-83
    • /
    • 2020
  • In this paper, we propose a system that can detect the shape of a hand at high speed using an FPGA. The hand-shape detection system is designed using Verilog HDL, a hardware language that can process in parallel instead of sequentially running C++ because real-time processing is important. There are several methods for hand gesture recognition, but the image processing method is used. Since the human eye is sensitive to brightness, the YCbCr color model was selected among various color expression methods to obtain a result that is less affected by lighting. For the CbCr elements, only the components corresponding to the skin color are filtered out from the input image by utilizing the restriction conditions. In order to increase the speed of object recognition, a median filter that removes noise present in the input image is used, and this filter is designed to allow comparison of values and extraction of intermediate values at the same time to reduce the amount of computation. For parallel processing, it is designed to locate the centerline of the hand during scanning and sorting the stored data. The line with the highest count is selected as the center line of the hand, and the size of the hand is determined based on the count, and the hand and arm parts are separated. The designed hardware circuit satisfied the target operating frequency and the number of gates.

시각장애인을 위한 보행 안내 스마트 안경 플랫폼 설계 (Design of Smart Glasses Platform walking guide for the visually impaired)

  • 이재범;장종욱;장성진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.320-322
    • /
    • 2021
  • 세계적으로 고령 인구가 증가함에 따라 시각장애인의 비율 역시 증가하고 있으며, 여전히 안전상에 문제, 안내정보 부족 등 시각장애인이 외부 활동을 하는 데에 있어서 많은 제약이 존재한다. 이를 해결하기 위해 광학 문자 인식(OCR) 기능이 탑재된 스마트 안경 등 스마트 기기에 관한 연구가 활발히 진행되고 있다. 본 논문에서는 전방에 장애물을 인식해 음성으로 정보를 알려주고, 목적지까지 길을 안내해주는 시스템을 제안한다. 딥러닝 객체 인식 모델인 Yolo를 이용하여 계단, 라바 콘과 같은 위험요소를 장애물로 인식하고 음성으로 정보를 전달해주며, 길 찾기 API와 음성인식, TTS 라이브러리를 사용하여 입력한 목적지까지 음성으로 길 안내를 해줌으로써 시각장애인의 외부 활동 범위가 확대되는 효과를 기대할 수 있다.

  • PDF

서베일런스 네트워크에서 패턴인식 기반의 실시간 객체 추적 알고리즘 (Real-Time Object Tracking Algorithm based on Pattern Classification in Surveillance Networks)

  • 강성관;천상훈
    • 디지털융복합연구
    • /
    • 제14권2호
    • /
    • pp.183-190
    • /
    • 2016
  • 본 논문은 서베일런스 네트워크에서 이동하는 객체 추적 시 영상 데이터의 전송량을 감소시키는 신경망 계산 시간의 단축 알고리즘을 제안한다. 객체 검출은 디지털화 연속된 영상으로부터 객체 존재 유무를 판단하고, 객체가 존재할 경우 영상 내 객체의 위치, 방향, 크기 등을 알아내는 기술로 정의된다. 그러나 영상 내의 객체는 위치, 크기, 빛의 방향 및 밝기, 장애물 등의 환경적 변화로 인해 객체 모양이 다양해지므로 정확하고 빠른 검출이 어렵다. 따라서 본 논문에서는 신경망을 사용하여 몇 가지 환경적 조건을 극복한 정확하고 빠른 객체 검출 방법을 제안한다. 검색 영역의 축소는 영상 내 색상 영역의 분할과 차영상을 이용하였고, 주성분 분석을 통해 신경망의 입력 벡터를 축소시킴으로써 신경망 수행 시간과 학습 시간을 단축시켰다. 실시간으로 입력되는 동영상에서 모두 실험하였으며, 색상 영역의 분할을 사용할 경우 입력 영상의 칼라 설정의 유무에 따른 검출 성공률의 차를 보였다. 실험 결과에서 보면 제안하는 방법으로써 객체의 움직임을 탐지하였을 때 기존의 방법보다 30% 정도 더 높은 인식 성능을 보여준다.

Hellinger 거리 IoU와 Objectron 적용을 기반으로 하는 객체 감지 (Object Detection Based on Hellinger Distance IoU and Objectron Application)

  • 김용길;문경일
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.63-70
    • /
    • 2022
  • 2D 객체 감지 시스템은 최근 몇 년 동안 심층 신경망과 대규모 이미지 데이터세트의 사용으로 크게 개선되었지만, 아직도 범주 내에서 데이터 부족, 다양한 외관 및 객체 형상 때문에 자율 탐색 등과 같은 로봇 공학과 관련된 응용에서 2D 물체 감지 시스템은 적절하지 않다. 최근에 소개되고 있는 구글 Objectron 또한 증강 현실 세션 데이터를 사용하는 새로운 데이터 파이프라인이라는 점에서 도약이라 할 수 있지만, 3D 공간에서 2D 객체 이해라는 측면에서 마찬가지로 한계가 있다. 이에 본 연구에서는 더 성숙한 2D 물체 감지 방법을 Objectron에 도입하는 3D 물체 감지 시스템을 나타낸다. 대부분의 객체 감지 방법은 경계 상자를 사용하여 객체 모양과 위치를 인코딩한다. 본 작업에서는 가우스 분포를 사용하여 객체 영역의 확률적 표현을 탐색하는데, 일종의 확률적 IoU라 할 수 있는 Hellinger 거리를 기반으로 하는 가우스 분포에 대한 유사성 측도를 제시한다. 이러한 2D 표현은 모든 객체 감지기에 원활하게 통합할 수 있으며, 실험 결과 데이터 집합에서 주석이 달린 분할 영역에 더 가까워서 Objectron의 단점이라 할 수 있는 3D 감지 정확도를 높일 수 있다.