• 제목/요약/키워드: 3D Visual Object Recognition

검색결과 25건 처리시간 0.03초

컴퓨터 집적 영상 복원 방법을 이용한 비선형 3D 영상 상관기 (Nonlinear 3D image correlator using computational integral imaging reconstruction method)

  • 신동학;홍석민;김경원;이병국
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.155-157
    • /
    • 2012
  • 본 논문에서는 집적 영상 기술에 기반한 컴퓨터 3D 영상 복원을 이용하여 비선형 3D 영상 상관기를 제안한다. 제안하는 방법에서는 먼저 기준 3D 물체와 목표 3D 물체의 요소 영상들을 렌즈 어레이를 통해 픽업한다. 이 픽업된 영상에 컴퓨터 집적 영상 복원 방법을 사용하여 목표 평면 영상과 기준 평면 영상들이 복원된다. 복원된 기준 평면 영상과 목표 평면 영상들 간의 비선형 상호상관을 통해 인식을 수행한다. 제안된 방법의 유용함을 보이기 위해 기존의 방법과 비교하여 기초적인 상관관계 실험을 수행하고 그 결과를 발표한다.

  • PDF

Dual Autostereoscopic Display Platform for Multi-user Collaboration with Natural Interaction

  • Kim, Hye-Mi;Lee, Gun-A.;Yang, Ung-Yeon;Kwak, Tae-Jin;Kim, Ki-Hong
    • ETRI Journal
    • /
    • 제34권3호
    • /
    • pp.466-469
    • /
    • 2012
  • In this letter, we propose a dual autostereoscopic display platform employing a natural interaction method, which will be useful for sharing visual data with users. To provide 3D visualization of a model to users who collaborate with each other, a beamsplitter is used with a pair of autostereoscopic displays, providing a visual illusion of a floating 3D image. To interact with the virtual object, we track the user's hands with a depth camera. The gesture recognition technique we use operates without any initialization process, such as specific poses or gestures, and supports several commands to control virtual objects by gesture recognition. Experiment results show that our system performs well in visualizing 3D models in real-time and handling them under unconstrained conditions, such as complicated backgrounds or a user wearing short sleeves.

비디오에서 양방향 문맥 정보를 이용한 상호 협력적인 위치 및 물체 인식 (Collaborative Place and Object Recognition in Video using Bidirectional Context Information)

  • 김성호;권인소
    • 로봇학회논문지
    • /
    • 제1권2호
    • /
    • pp.172-179
    • /
    • 2006
  • In this paper, we present a practical place and object recognition method for guiding visitors in building environments. Recognizing places or objects in real world can be a difficult problem due to motion blur and camera noise. In this work, we present a modeling method based on the bidirectional interaction between places and objects for simultaneous reinforcement for the robust recognition. The unification of visual context including scene context, object context, and temporal context is also. The proposed system has been tested to guide visitors in a large scale building environment (10 topological places, 80 3D objects).

  • PDF

Image Processing-based Object Recognition Approach for Automatic Operation of Cranes

  • Zhou, Ying;Guo, Hongling;Ma, Ling;Zhang, Zhitian
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.399-408
    • /
    • 2020
  • The construction industry is suffering from aging workers, frequent accidents, as well as low productivity. With the rapid development of information technologies in recent years, automatic construction, especially automatic cranes, is regarded as a promising solution for the above problems and attracting more and more attention. However, in practice, limited by the complexity and dynamics of construction environment, manual inspection which is time-consuming and error-prone is still the only way to recognize the search object for the operation of crane. To solve this problem, an image-processing-based automated object recognition approach is proposed in this paper, which is a fusion of Convolutional-Neutral-Network (CNN)-based and traditional object detections. The search object is firstly extracted from the background by the trained Faster R-CNN. And then through a series of image processing including Canny, Hough and Endpoints clustering analysis, the vertices of the search object can be determined to locate it in 3D space uniquely. Finally, the features (e.g., centroid coordinate, size, and color) of the search object are extracted for further recognition. The approach presented in this paper was implemented in OpenCV, and the prototype was written in Microsoft Visual C++. This proposed approach shows great potential for the automatic operation of crane. Further researches and more extensive field experiments will follow in the future.

  • PDF

3차원 물체 재구성 과정이 통합된 실시간 3차원 특징값 추출 방법 (Real-time 3D Feature Extraction Combined with 3D Reconstruction)

  • 홍광진;이철한;정기철;오경수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권12호
    • /
    • pp.789-799
    • /
    • 2008
  • 상호작용이 가능한 컴퓨팅 환경에서 사람과 컴퓨터 사이의 자연스러운 정보 교환을 위해 동작 인식과 관련한 연구가 활발하게 이루어지고 있다. 기존의 2차원 특징값을 이용하는 인식 알고리즘은 특징값 추출과 인식 속도는 빠르지만, 정확한 인식을 위해서 많은 환경적인 제약이 따른다. 또한 2.5차원 특징값을 이용하는 알고리즘은 2차원 특징값에 비해 높은 인식률을 제공하지만 물체의 회전 변화에 취약하고, 3차원 특징값을 이용하는 인식 알고리즘은 특징값 추출을 위해 3차원 물체를 재구성하는 선행 과정이 필요하기 때문에 인식 속도가 느리다. 본 논문은 3차원 물체 재구성 단계와 특징값 추출 단계를 통합하여 실시간으로 3차원 정보를 가지는 특징값 추출 방법을 제안한다. 제안하는 방법은 기존의 GPU 기반 비주얼 헐 생성 방법의 세부 과정 중에서 동작 인식에 필요한 데이타 생성 부분만을 수행하여 임의의 시점에서 3차원 물체에 대한 3종류의 프로젝션 맵을 생성하고, 각각의 프로젝션 맵에 대한 후-모멘트(Hu-moment)를 계산한다. 실험에서 우리는 기존의 방법들과 단계별 수행 시간을 비교하고, 생성된 후-모멘트에 대한 혼동 행렬(confusion matrix)을 계산함으로써 제안하는 방법이 실시간 동작 인식 환경에 적용될 수 있음을 확인하였다.

헬스케어를 위한 영상기반 기절동작 인식시스템 개발 (Development of a Vision Based Fall Detection System For Healthcare)

  • 소인미;강선경;김영운;이지근;정성태
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권6호
    • /
    • pp.279-287
    • /
    • 2006
  • 이 논문은 스테레오 영상을 이용하여 응급상황을 인식하기 위하여 기절 동작을 인식하는 방법을 제안한다. 사람의 다양한 동작에서 학습과 인식에 필요한 영상 정보를 추출하기 위하여 3차원 정보를 사용하였고, 인식 알고리즘으로는 HMM을 이용하였다. 두 대의 카메라 영상에서 각각 배경을 생성한 다음에 배경 영상과 입력 영상의 차이를 이용하여 움직임 객체를 추출하였다. 그리고 움직임 객체를 포함하는 사각형을 생성한 다음 두 카메라의 캘리브레이션 정보를 이용하여 3차원 정보를 추출하였다. 3차원 공간상에서의 사각형의 너비와 높이의 변화량과 사각형 중심점 위치의 변화량 각각에 대하여 동작 인식률을 실험하였다. 실험 결과 너비와 높이의 특징 값을 이용하는 것보다 중심점의 3차원 위치 변화량을 이용하는 것이 높은 인식률을 보였다.

  • PDF

적응형 깊이 추정기를 이용한 미지 물체의 자세 예측 (Predicting Unseen Object Pose with an Adaptive Depth Estimator)

  • 송성호;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권12호
    • /
    • pp.509-516
    • /
    • 2022
  • 3차원 공간에서 물체들의 정확한 자세 예측은 실내외 환경에서 장면 이해, 로봇의 물체 조작, 자율 주행, 증강 현실 등과 같은 많은 응용 분야들에서 폭넓게 활용되는 중요한 시각 인식 기술이다. 물체들의 자세 예측을 위한 과거 연구들은 대부분 각 인식 대상 물체마다 정확한 3차원 CAD 모델을 요구한다는 한계점이 있었다. 이러한 과거 연구들과는 달리, 본 논문에서는 3차원 CAD 모델이 없어도 RGB 컬러 영상들만 이용해서 미지 물체들의 자세를 예측해낼 수 있는 새로운 신경망 모델을 제안한다. 제안 모델은 적응형 깊이 추정기인 AdaBins를 이용하여 스스로 미지 물체 자세 예측에 필요한 각 물체의 깊이 지도를 효과적으로 추정해낼 수 있다. 벤치마크 데이터 집합들을 이용한 다양한 실험들을 통해, 본 논문에서 제안한 모델의 유용성과 성능을 평가한다.

Object Detection and Localization on Map using Multiple Camera and Lidar Point Cloud

  • Pansipansi, Leonardo John;Jang, Minseok;Lee, Yonsik
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.422-424
    • /
    • 2021
  • In this paper, it leads the approach of fusing multiple RGB cameras for visual objects recognition based on deep learning with convolution neural network and 3D Light Detection and Ranging (LiDAR) to observe the environment and match into a 3D world in estimating the distance and position in a form of point cloud map. The goal of perception in multiple cameras are to extract the crucial static and dynamic objects around the autonomous vehicle, especially the blind spot which assists the AV to navigate according to the goal. Numerous cameras with object detection might tend slow-going the computer process in real-time. The computer vision convolution neural network algorithm to use for eradicating this problem use must suitable also to the capacity of the hardware. The localization of classified detected objects comes from the bases of a 3D point cloud environment. But first, the LiDAR point cloud data undergo parsing, and the used algorithm is based on the 3D Euclidean clustering method which gives an accurate on localizing the objects. We evaluated the method using our dataset that comes from VLP-16 and multiple cameras and the results show the completion of the method and multi-sensor fusion strategy.

  • PDF

CONSIDERATION OF THE RELATION BETWEEN DISTANCE AND CHANGE OF PANEL COLOR BASED ON AERIAL PERSPECTIVE

  • Horiuchi, Hitoshi;Kaneko, Satoru;Sato, Mie;Ozaki, Koichi;Kasuga, Masao
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 IWAIT
    • /
    • pp.695-698
    • /
    • 2009
  • Three-dimensional (3D) shape recognition and distance recognition methods utilizing monocular camera systems have been required for field of virtual-reality, computer graphics, measurement technology and robot technology. There have been many studies regarding 3D shape and distance recognition based on geometric and optical information, and it is now possible to accurately measure the geometric information of an object at short range distances. However, these methods cannot currently be applied to long range objects. In the field of virtual-reality, all visual objects must be presented at widely varying ranges, even though some objects will be hazed over. In order to achieve distance recognition from a landscape image, we focused on the use of aerial perspective to simulate a type of depth perception and investigated the relationship between distance and color perception. The applicability of our proposed method was demonstrated in experimental results.

  • PDF

자기주도 탐색(Active navigation)이 가상환경 내 대상재인에 미치는 효과 (The effects of active navigation on object recognition in virtual environments)

  • 함진선;장기원;이장한;임승락;이강희;김세영;김현택
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.633-638
    • /
    • 2006
  • We investigated the importance and efficiency of active and passive exploration on the recognition of objects in a variety of virtual environments (VEs). In this study, 54 participants (19 males and 35 females) were randomly allocated into one of two navigation conditions (active and passive navigation). The 3D visual display was presented through HMD and participants used joysticks to navigate VEs. The VEs consisted of exploring four rooms (library, office, lounge, and conference room), each of which had 15 objects. 'Active navigation' was performed by allowing participants to self-pace and control their own navigation within a predetermined time limitation for each room. 'Passive navigation' was conducted by forced navigation of the four rooms in random order. Total navigation duration and objects for both navigations were identical. After navigating VEs, participants were asked to recognize the objects that had been in the four rooms. Recognition for objects was measured by response time and the percentage of correct, false, hit, and miss responses. Those in the active navigation condition had a significantly higher percentage of hit responses (t (52) = 4.000 p < 0.01), and a significantly lower percentage of miss responses (t (52) = -3.763, p < 0.01) in object recognition than those in the passive condition. These results suggest that active navigation plays an important role in spatial cognition as well as providing a better explanation about the efficiency of learning in a 3D-based program.

  • PDF