• 제목/요약/키워드: Object recognition system

검색결과 714건 처리시간 0.033초

얼굴 방향과 손 동작 인식을 통합한 가상 공간에 존재하는 Agent들과의 상호 작용 (Interaction with Agents in the Virtual Space Combined by Recognition of Face Direction and Hand Gestures)

  • 조강현;김성은;이인호
    • 전자공학회논문지CI
    • /
    • 제39권3호
    • /
    • pp.62-78
    • /
    • 2002
  • 본 논문에서는 인간의 행동을 컴퓨터에게 인식시켜 가상의 공간에 존재하는 에이전트(agent)들과 상호 작용이 가능한 시스템을 구현하였다. 이 시스템은 크게 행동을 인식하는 인식 시스템과 인식 정보를 통해 미리 구성한 가상 공간에 존재하는 여러 에이전트간의 상호 작용을 하는 시스템으로 구성되어있다. 인식 시스템은 동작자의 연속적인 행동을 CCD카메라로부터 입력받아 각각의 프레임에 대해 머리와 손의 특징을 추출한다. 그리고, 추출된 정보를 연속적인 시간의 흐름에 대해 해석을 한 후, 동작을 인식한다. 상호 작용 시스템을 위해 동작자의 분신인 아바타(avatar), 자율적으로 행동하는 퍼피(puppy), 그리고 비자율적인 객체인 탁자, 문, 창문, 공과 같은 이동이 가능한 오브젝트(object)들이 존재하는 가상 공간을 구현하였다. 인식된 동작은 상호 작용 시스템을 통해 가상 공간의 아바타에게 전달이 된다. 아바타의 동작 천이는 상태 천이도를 바탕으로 이루어진다. 상태 천이도는 각각의 동작이 노드로 정의되고, 그 노드들을 종속적으로 연결한 그래프로 구성된다. 아바타는 문과 창문을 여닫고, 오브젝트를 잡거나 이동할 수 있다. 또 퍼피에게 명령을 내리거나 퍼피의 동작에 대한 응답을 할 수 있다.

이동물체들의 Optical flow와 EMD 알고리즘을 이용한 식별과 Kalman 필터를 이용한 추적 (Detection using Optical Flow and EMD Algorithm and Tracking using Kalman Filter of Moving Objects)

  • 이정식;주영훈
    • 전기학회논문지
    • /
    • 제64권7호
    • /
    • pp.1047-1055
    • /
    • 2015
  • We proposes a method for improving the identification and tracking of the moving objects in intelligent video surveillance system. The proposed method consists of 3 parts: object detection, object recognition, and object tracking. First of all, we use a GMM(Gaussian Mixture Model) to eliminate the background, and extract the moving object. Next, we propose a labeling technique forrecognition of the moving object. and the method for identifying the recognized object by using the optical flow and EMD algorithm. Lastly, we proposes method to track the location of the identified moving object regions by using location information of moving objects and Kalman filter. Finally, we demonstrate the feasibility and applicability of the proposed algorithms through some experiments.

YOLOv4 기반의 소형 물체탐지기법을 이용한 건설도면 내 철강 자재 문자 검출 및 인식기법 (Character Detection and Recognition of Steel Materials in Construction Drawings using YOLOv4-based Small Object Detection Techniques)

  • 심지우;우희조;김윤환;김응태
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.391-401
    • /
    • 2022
  • 최근 딥러닝 기반의 객체 검출 및 인식 연구가 발전해가면서 산업 및 실생활에 적용되는 범위가 넓어지고 있다. 건설 분야에도 딥러닝 기반의 시스템이 도입되고 있지만 아직은 미온적이다. 건설 도면에서 자재 산출이 수작업으로 이뤄지고 있어 많은 소요시간과 부정확한 적산 결과로 잘못된 물량산출의 거래가 생길 수 있다. 이를 해결하기 위해서 빠르고 정확한 자동 도면 인식시스템이 필요하다. 따라서 본 논문은 건설도면 내 철강 자재를 검출하고 인식하는 인공지능기반 자동 도면 인식 적산 시스템을 제안한다. 빠른 속도의 YOLOv4 기반에 소형 객체 검출성능을 향상하기 위한 복제 방식의 데이터 증강기법과 공간집중 모듈을 적용하였다. 검출한 철강 자재 영역을 문자 인식한 결과를 토대로 철강 자재를 적산한다. 실험 결과 제안한 방식은 기존 YOLOv4 대비 정확도와 정밀도를 각각 1.8%, 16% 증가시켰다. 제안된 방식의 Precision은 0.938, Recall은 1, AP0.5는 99.4%, AP0.5:0.95 68.8%의 향상된 결과를 얻었다. 문자 인식은 기존 데이터를 사용한 인식률 75.6%에 비해 건설도면에 사용되는 폰트에 맞는 데이터 세트를 구성하여 학습한 결과 99.9%의 인식률을 얻었다. 한 이미지 당 평균 소요시간은 검출 단계는 0.013초, 문자 인식은 0.65초, 적산 단계는 0.16초로 총 0.84초의 결과를 얻었다.

개선된 터치점 검출과 제스쳐 인식에 의한 DI 멀티터치 디스플레이 구현 (Implementation of a DI Multi-Touch Display Using an Improved Touch-Points Detection and Gesture Recognition)

  • 이우범
    • 융합신호처리학회논문지
    • /
    • 제11권1호
    • /
    • pp.13-18
    • /
    • 2010
  • 멀티터치 관련 연구는 전반사 장애 현상(FTIR: Frustrated Total Internal Reflection)의 원리를 기반으로 기존 방법을 이용하여 단지 구현하는 것이 대부분이다. 또한 멀티 터치점(Blob-Points) 검출이나 사용자 제스쳐 인식에 있어서 성능 향상을 위한 소프트웨어적 해법에 관한 연구는 드문 실정이다. 따라서 본 논문에서는 확산 투광(DI: Diffused Illumination) 방식을 기반으로 개선된 터치점 검출과 사용자 제스쳐 인식에 의한 멀티터치 테이블-탑 디스플레이를 구현한다. 제안된 방법은 실행 중인 어플리케이션 내의 객체들을 위한 동시 변형 멀티터치 명령을 지원하며, 제안한 사전 테스팅(Pre-Testing) 방법에 의해서 멀티 터치점 검출 과정에서 시스템 지연 시간의 감소가 가능하다. 구현된 멀티터치 테이블-탑 디스플레이 장치는 OSC(Open Sound Control) 프로토콜을 기반으로 하는 TUIO(Tangib1e User Interface Object) 환경에서 Flash AS3 어플리케이션을 제작하여 시뮬레이션 한 결과 최대 37% 시스템 지연 시간의 감소와 멀티터치 제스쳐 인식에서 성공적인 결과를 보였다.

포토메트릭 스테레오를 이용한 물체표면방향의 인식 (Recognition of surface orientations in an object using photomeric stereo method)

  • 이종훈;전태현;김도성;이명호
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1990년도 한국자동제어학술회의논문집(국내학술편); KOEX, Seoul; 26-27 Oct. 1990
    • /
    • pp.816-820
    • /
    • 1990
  • This paper is pre-stage for getting EGI which can be used for modeling of an object. It discusses the construction of the vision processing system and its algorithm for getting needle diagram from tie object image. We realize the algorithm with monocular camera system, using Reflectance Map theory and photometric stereo method. We can calculate the surface normal at any point in the image if we take multiple images at the different lighting conditions. From the 3 images taken from different lighting conditions through the experiment, we get the needle diagrams of the sphere and the object. We confirm the validness of the surface, normal acquisition algorithm comparing the experimental needle diagram with the ideal one obtained from the surface normal of the known object.

  • PDF

Development of a Robot arm capable of recognizing 3-D object using stereo vision

  • Kim, Sungjin;Park, Seungjun;Park, Hongphyo;Sangchul Won
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.128.6-128
    • /
    • 2001
  • In this paper, we present a methodology of sensing and control for a robot system designed to be capable of grasping an object and moving it to target point Stereo vision system is employed to determine to depth map which represents the distance from the camera. In stereo vision system we have used a center-referenced projection to represent the discrete match space for stereo correspondence. This center-referenced disparity space contains new occlusion points in addition to the match points which we exploit to create a concise representation of correspondence an occlusion. And from the depth map we find the target object´s pose and position in 3-D space. To find the target object´s pose and position, we use the method of the model-based recognition.

  • PDF

객체의 개념적 인식과 논리적 분석에 의한 재공학 툴에 대한 연구 (A Study on the Reengineering Tool with Concepts Recognition and Logical l Analysis of Objects)

  • 김행곤
    • 한국정보처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.200-210
    • /
    • 1996
  • 소프트웨어 재공학은 시스템 생명주기 전반에 걸쳐 생산성과 품질향상을 가지게 하며 소프트웨어 유지 보수성을 새로운 기법과 유지보수 툴의적용을 통해 기존 시스 템의 성능을 향상시킨다. 또한 기존 시스템의 이해성을 높이고 시스템 전반에 걸쳐 설계 구조나 자료구조와 같은 소프트웨어 컴퍼넌트를 추출하는데도 필요하다. 이들 컴퍼넌트는 시스템 개발 또는 재개발시 재사용된다. 기존의 객체 지향 파라다임은 소 프트웨어 유지 보수성을 향상시키는 방법으로 알려지고 있다. 그러나 객체지향의 개념적 통합을 위한 객체, 속성, 오퍼레이션의 인식과 객체 클래스의 구성과 같은 문제점을 가지고 있다. 따라서, 본 논문에서는 객체지향 시스템의 재공학 기본 방법론과 객체지 향 파라다임의 재공학을 위한 개념 인식에 대해 논하며 또한 기존 절차 중심으로 개발된 프로그램을 객체지향 시스템으로 변경하는 재공학 툴에 대해 논한다. 이툴은 객체지향 인식에서 개념적 무결성 문제를 해결하는 장점을 가진다.

  • PDF

탄성변형 에너지 기반 Hausdorff 거리를 이용한 개선된 객체검출 (An Improved Object Detection Method using Hausdorff Distance based on Elastic Deformation Energy)

  • 원보환;구자영
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권2호
    • /
    • pp.71-76
    • /
    • 2007
  • 주어진 영상 내에서 의미 있는 객체의 존재여부를 판단하는 객체검출과정은 컴퓨터 비전 시스템을 이용한 영상인식의 핵심요소 가운데 하나이다. 템플릿 정합 방식의 객체 검출방식에서 사용되어 얼굴 인식 등에서 좋은 성능을 보이는 Hausdorff 거리는 점의 집합으로 표현된 두 객체 사이의 다른 정도를 정의함으로써 주어진 모델과 가장 차이가 적은 객체를 검출하도록 한다. 본 논문에서는 일반적으로 사용되는 바와 같이 점의 집합이 영상의 에지를 검출하여 얻어진 경우, 에지가 가지고 있는 방향정보를 이용함으로써 검출의 정확성을 높일 수 있는 방법을 제안하고 있다. 일반적으로 사용되는 Euclidean 거리 대신에 방향을 가진 두 점을 일치시키는데 필요한 탄성에너지를 정의함으로써 검출의 정확성을 높이는 방법을 제시하고 있다.

  • PDF

고차 국소 자동 상관 특징 정보를 이용한 외관 기반 객체 인식 (Appearance-based Object Recognition Using Higher Order Local Auto Correlation Feature Information)

  • 강명아
    • 한국정보통신학회논문지
    • /
    • 제15권7호
    • /
    • pp.1439-1446
    • /
    • 2011
  • 본 논문에서는 고차 상관 특정 정보와 주성분 분석을 결합하여 차원을 낮추면서도 객체 인식을 유지하고, 고유 공간 구성 시간을 현저하게 줄이는 알고리즘에 대해 기술한다. 제안된 방법은 기존의 기하학적 정보를 이용하거나 스테레오 영상을 이용하는 방법에 비해 많은 계산량이 요구되지 않기 때문에 실시간 시스템 구축에 매우 적합하다는 것이 실험을 통하여 증명되었다. 또한 인식률을 향상시키기 위해 단순히 기존의 방법인 point to point 방식인 단순 거리 계산은 오차가 많기 때문에 본 논문에서는 개선된 Class to Class방식인 K-Nearest Neighbor을 이용하여 몇 개의 연속적인 입력영상을 인식의 단위로 이용하여 인식 오차를 줄일 수 있었다.

CNN 기반 딥러닝을 이용한 임베디드 리눅스 양각 문자 인식 시스템 구현 (An Implementation of Embedded Linux System for Embossed Digit Recognition using CNN based Deep Learning)

  • 유연승;김정길;홍충표
    • 반도체디스플레이기술학회지
    • /
    • 제19권2호
    • /
    • pp.100-104
    • /
    • 2020
  • Over the past several years, deep learning has been widely used for feature extraction in image and video for various applications such as object classification and facial recognition. This paper introduces an implantation of embedded Linux system for embossed digits recognition using CNN based deep learning methods. For this purpose, we implemented a coin recognition system based on deep learning with the Keras open source library on Raspberry PI. The performance evaluation has been made with the success rate of coin classification using the images captured with ultra-wide angle camera on Raspberry PI. The simulation result shows 98% of the success rate on average.