• 제목/요약/키워드: Object recognition system

검색결과 714건 처리시간 0.027초

A Fast SIFT Implementation Based on Integer Gaussian and Reconfigurable Processor

  • Su, Le Tran;Lee, Jong Soo
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권3호
    • /
    • pp.39-52
    • /
    • 2009
  • Scale Invariant Feature Transform (SIFT) is an effective algorithm in object recognition, panorama stitching, and image matching, however, due to its complexity, real time processing is difficult to achieve with software approaches. This paper proposes using a reconfigurable hardware processor with integer half kernel. The integer half kernel Gaussian reduces the Gaussian pyramid complexity in about half [] and the reconfigurable processor carries out a parallel implementation of a full search Fast SIFT algorithm. We use a low memory, fine grain single instruction stream multiple data stream (SIMD) pixel processor that is currently being developed. This implementation fully exposes the available parallelism of the SIFT algorithm process and exploits the processing and I/O capabilities of the processor which results in a system that can perform real time image and video compression. We apply this novel implementation to images and measure the effectiveness. Experimental simulation results indicate that the proposed implementation is capable of real time applications.

  • PDF

3차원 형상 인식 시스템에서의 에지 워터마킹 (Edge Watermarking of 3-Dimensional Shape Recognition System)

  • 윤재식;유상욱;성택영;김희정;권성근;이응주;권기룡
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.163-166
    • /
    • 2004
  • 본 논문은 3차원 형상 인식시스템으로부터 스캔 한 3차일 영상 데이터의 깊이정보에 3차원 에지를 추출하여 워터마크를 삽입하는 알고리즘을 제안한다. 제안한 알고리즘에서는 3차원 수직 평형 형상 인식기로 object scanning을 한 데이터 값들을 추출한다. 이 추출된 값들의 특성은 2차원 영상 즉 x, y축에 각각의 픽셀에 깊이정보를 가지는 3차원영상으로서 기존의 3차원영상과는 다른 차이를 가지며 영상의 품질이 우수하며 많은vertex 정보와 메쉬 정보를 가지고 있다. 따라서 획득된 데이터에서 x좌표와 y좌표는 영상에 있어서 위치를 나타내는 정보이고, T좌표는 3차원영상을 형성하는 깊이 정보들이다. 3차원 형상 인식시스템에서 스캔 한 3차원 얼굴영상으로부터 에지를 검출하여 에지가 존재하는 위치에 워터마크를 삽입하는 알고리즘을 제안하였다. 본 논문에서 제안한 워터마킹 알고리즘의 성능 평가를 위한 모의실험 한 결과 워터마크가 삽입된 모텔의 절단(cropping), 리메쉬(remesh) 및 메쉬간소화(mesh simplification) 공격에 대한 견고성이 우수함을 확인함으로써 3차원형상 인식 시스템에 직접적인 워터마크 삽입이 가능함을 증명하였다.

  • PDF

접근객체 인식 및 전송을 위한 영상 디지털 도어락 시스템 (Video Digital Doorlock System for Recognition and Transmission of Accessing Object)

  • 이상락;박진태;우병현;최한고
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.20-23
    • /
    • 2014
  • 기존 사용되고 있는 디지털 도어락은 사용자의 편의에 중점을 두어 보안 측면에서는 매우 취약한 단점이 있다. 이에 본 논문은 카메라와 센서, 통신 모듈이 결합된 디지털 도어락과 중계기, 서버를 시스템화하여 도어락 설치장소 전방에서 접근하는 객체를 감지 및 인식하고 이미지와 문 열림 정보를 사용자의 스마트 디바이스로 전송해 주는 영상 디지털 도어락 시스템을 제안하고자 한다. 제안한 시스템은 실험 결과 대상거리 내에서 96~98%의 접근자 인식률과 사용 통신망에 따라 평균 약 17.1~23.9초의 전송시간이 소요되었다. 따라서 도어락 시스템 전방의 상황을 모니터링하여 실시간 보안 대응이 가능할 것으로 판단된다.

객체 탐지와 행동인식을 이용한 영상내의 비정상적인 상황 탐지 네트워크 (Abnormal Situation Detection on Surveillance Video Using Object Detection and Action Recognition)

  • 김정훈;최종혁;박영호;나스리디노프 아지즈
    • 한국멀티미디어학회논문지
    • /
    • 제24권2호
    • /
    • pp.186-198
    • /
    • 2021
  • Security control using surveillance cameras is established when people observe all surveillance videos directly. However, this task is labor-intensive and it is difficult to detect all abnormal situations. In this paper, we propose a deep neural network model, called AT-Net, that automatically detects abnormal situations in the surveillance video, and introduces an automatic video surveillance system developed based on this network model. In particular, AT-Net alleviates the ambiguity of existing abnormal situation detection methods by mapping features representing relationships between people and objects in surveillance video to the new tensor structure based on sparse coding. Through experiments on actual surveillance videos, AT-Net achieved an F1-score of about 89%, and improved abnormal situation detection performance by more than 25% compared to existing methods.

저전력 온디바이스 비전 SW 프레임워크 기술 동향 (Trends in Low-Power On-Device Vision SW Framework Technology)

  • 이문수;배수영;김정시;석종수
    • 전자통신동향분석
    • /
    • 제36권2호
    • /
    • pp.56-64
    • /
    • 2021
  • Many computer vision algorithms are computationally expensive and require a lot of computing resources. Recently, owing to machine learning technology and high-performance embedded systems, vision processing applications, such as object detection, face recognition, and visual inspection, are widely used. However, on-devices need to use their resources to handle powerful vision works with low power consumption in heterogeneous environments. Consequently, global manufacturers are trying to lock many developers into their ecosystem, providing integrated low-power chips and dedicated vision libraries. Khronos Group-an international standard organization-has released the OpenVX standard for high-performance/low-power vision processing in heterogeneous on-device systems. This paper describes vision libraries for the embedded systems and presents the OpenVX standard along with related trends for on-device vision system.

객체 인식을 활용한 시각장애인용 지하철 길 안내 시스템 (Subway Guidance System for the Visually Impaired Using Object Recognition)

  • 윤성철;박종혁;주세환;한윤원;김성완;김종득
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1278-1281
    • /
    • 2021
  • 본 논문에서는 시각장애인들의 지하철 이용의 불편함을 최소화할 수 있는 내비게이션 앱을 개발하였다. 스마트폰 카메라가 전방을 인식하여 사물을 판단 후 장애물 혹은 위험요소를 사용자에게 음성으로 전달한다. 또한, 사용자의 원활한 지하철 이용을 위해 공공데이터를 활용하여 지하철 환승 정보, 화장실, 출구 정보 등의 이동 편의를 위한 실질적인 정보를 제공한다. 시각장애인은 본 앱을 활용하여 지하철을 더욱 편하고 안전하게 이용할 수 있다.

딥러닝을 활용한 공병 자동 환급 시스템 (Automatic empty-bottles refund system using deep learning)

  • 김도균;김창근;전주성;신성한;정영석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.285-286
    • /
    • 2024
  • 본 연구에서는 현대 사회의 환경 보호 관심 상승과 소비자들의 재활용 참여 욕구를 고려하여 YOLOv5를 활용한 무인 공병 환급기를 개발하였다. 이 시스템은 정확한 물체 감지와 금액 추정 알고리즘을 결합하여 사용자가 간편하게 공병을 반환하고 적절한 보상을 받을 수 있는 효과적인 시스템을 제공한다. 프로젝트의 성공은 재활용 참여율 증가와 지속 가능한 소비 문화 형성에 기여할 것으로 기대된다.

  • PDF

Multiple Moving Person Tracking based on the IMPRESARIO Simulator

  • 김현덕;진태석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.877-881
    • /
    • 2008
  • In this paper, we propose a real-time people tracking system with multiple CCD cameras for security inside the building. The camera is mounted from the ceiling of the laboratory so that the image data of the passing people are fully overlapped. The implemented system recognizes people movement along various directions. To track people even when their images are partially overlapped, the proposed system estimates and tracks a bounding box enclosing each person in the tracking region. The approximated convex hull of each individual in the tracking area is obtained to provide more accurate tracking information. To achieve this goal, we propose a method for 3D walking human tracking based on the IMPRESARIO framework incorporating cascaded classifiers into hypothesis evaluation. The efficiency of adaptive selection of cascaded classifiers have been also presented. We have shown the improvement of reliability for likelihood calculation by using cascaded classifiers. Experimental results show that the proposed method can smoothly and effectively detect and track walking humans through environments such as dense forests.

  • PDF

증강현실 기반의 물체 인식을 통한 게임형 인지 재활 시스템 (Game-type Recognition Rehabilitation System based on Augmented Reality through Object Understanding)

  • 임명재;정희웅;이기영
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.93-98
    • /
    • 2011
  • 본 논문은 마커 기반의 증강현실 시스템을 이용하여 사용자의 지능 개발을 위한 게임형 인지 재활 시스템을 제안한다. 기존의 인지 재활은 타인의 도움을 받거나 키보드나, 마우스 조작을 필요로 하는 불편을 해소 하고자, 마커 카드 제어만을 통해 진행 되는 방식을 적용하였다. 이를 위해 카메라를 통해 얻은 영상의 보정을 위한 영상처리 과정과 마커 검출 및 증강 표현이 가능하도록 하였다. 제시된 완성 모형의 회전을 통해 전체 형태를 확인하고, 멀티 마커의 조합을 통해서 원하는 오브젝트 완성이 가능하며, 대화형 방식으로 처리되어 사용자에게 흥미와 치료에 대한 집중도를 증진할 수 있도록 하였다.

360도 영상에서 이동 물체 감지 및 추적 시스템의 개발 (Development of Moving Objects Recognition and Tracking System on 360 Degree Panorama)

  • 고광만;주수종
    • 한국멀티미디어학회논문지
    • /
    • 제21권2호
    • /
    • pp.289-299
    • /
    • 2018
  • The 360 degree panoramas are picture of a wide range of images on one screen, so we can see a fairly wide range at a time. In particular, cylinderical panoramas are the most widely used spherical image, and its left and right viewing angles reach 360 degree, so you can observe front, rear, left, and right at once. Using 360 degree panorama, all directions can be monitored at the same time, so all directions can be effectively monitored compared to other methods. In this paper, we develop a system to recognize and track the movement of moving objects on a 360 degree panorama, and then present and verify the experimental results. For this goals, first, we developed a system to recognize moving objects in 360 degree panorama using DoF(Difference of Frame) algorithm. Second, based on the TLD algorithm, we developed an application that can track a specific single moving object in a 360 degree panorama and presented the experimental results.