• 제목/요약/키워드: 삼차원 물체 인식

검색결과 9건 처리시간 0.024초

인공신경망을 이용한 삼차원 물체의 인식과 정확한 자세계산 (3D Object Recognition and Accurate Pose Calculation Using a Neural Network)

  • 박강
    • 대한기계학회논문집A
    • /
    • 제23권11호
    • /
    • pp.1929-1939
    • /
    • 1999
  • This paper presents a neural network approach, which was named PRONET, to 3D object recognition and pose calculation. 3D objects are represented using a set of centroidal profile patterns that describe the boundary of the 2D views taken from evenly distributed view points. PRONET consists of the training stage and the execution stage. In the training stage, a three-layer feed-forward neural network is trained with the centroidal profile patterns using an error back-propagation method. In the execution stage, by matching a centroidal profile pattern of the given image with the best fitting centroidal profile pattern using the neural network, the identity and approximate orientation of the real object, such as a workpiece in arbitrary pose, are obtained. In the matching procedure, line-to-line correspondence between image features and 3D CAD features are also obtained. An iterative model posing method then calculates the more exact pose of the object based on initial orientation and correspondence.

삼차원 시각 자극을 이용한 f-MRI 연구 (f-MRI with Three-Dimensional Visual Stimulation)

  • 김치영;박호종;오승준;안창범
    • Investigative Magnetic Resonance Imaging
    • /
    • 제9권1호
    • /
    • pp.24-29
    • /
    • 2005
  • 목적 : 기존의 시각 자극과 관련한 뇌기능 연구가 일반적인 이차원 시각 자극을 이용한 데 반하여 본 논문에서는 삼차원 스트레오스코픽 비젼에 의한 시각 자극을 이용한 뇌기능 영상 연구를 수행하였다. 본 연구를 통하여 삼차원 시각처리와 관련한 뇌의 기능 영역 및 특징을 이차원 시각 자극 결과와 비교 검토하였다. 대상 및 방법 Anaglyph(이차원 그림을 칼라 코딩한 후 왼쪽과 오른쪽에 서로 다른 색깔의 렌즈를 사용하여 스트레오스코픽 비젼을 구현)를 이용하여 삼차원 시각 자극을 주었으며, 이와 비교를 위하여 동일한 영상으로 이차원 시각 자극을 구현하였다. 건강한 volunteer들에 대하여 삼차원 및 이차원 시각 자극에 대한 뇌기능 영상을 3.0 Tesla MRI 시스템에서 얻었다. 결과 : 삼차원 시각 자극에 의하여 활성화된 뇌의 영역은 이차원 시각 자극과 동일하게 후두엽으로 나타났으며, 삼차원 시각 자극에 의한 활성영역이 이차원 시각 자극에 의한 영역 보다 약 $18\%$ 더 넓게 나타났다. 결론 : 사람은 양 눈을 사용하여 삼차원 물체를 인식한다. 삼차원 물체 인식은 스테레오스코픽 비젼에 기인하는데, anaglyph 를 이용하여 삼차원 시각 자극에 대한 뇌기능 영상을 3.0 Tesla MRI 시스템에서 수행하였다. 삼차원 시각 자극에 의하여 활성화된 뇌의 영역은 이차원 시각 자극과 동일하게 후두엽으로 나타났으나, 활성영역이 이차원 자극에 비하여 약 $18\%$ 더 넓게 나타났다. 이것은 삼차원 영상 처리가 이차원 영상 처리에 비하여 왼쪽 영상과 오른쪽 영상의 차이에서 거리 정보를 추출하는 삼차원 시각 처리 기능이 추가됨에 따라 뇌의 처리 영역이 넓어진 것으로 판단된다. 이러한 삼차원 시각 자극 뇌기능 영상은 가상현실이나 3-D 디스플레이, 3-D 멀티미디어 콘텐츠 연구 등 다양한 분야에 활용될 수 있을 것으로 기대한다.

  • PDF

Assembly Modeling

  • 김성환
    • 한국CDE학회지
    • /
    • 제3권3호
    • /
    • pp.57-60
    • /
    • 1997
  • 기계 부품을 설계함에 있어 솔리드 모델링 시스템의 사용을 골격으로 하는 CAD 시스템의 사용은 삼차원 모델링된 단일 물체에 대한 물성치(mass property)의 계산, FEM 해석을 위한 유한요소의 자동생성, 곡면에 대한 NC 공구경로(NC tool path)의 자동계산, 부품의 생산을 위한 가공 정보의 도출 등의 분야에 많은 도움을 주어 설계와 생산, 관리의 전 분야에 혁신적 효율화를 도모해주었다. 한편 이렇게 설계된 단품들은 대개의 경우 조립되어 조립체를 이루게 되고, 그 상태로 혹은 부품간에 상대운동을 하면서 원하는 기능을 구현하게 된다. 단품에 대해서처럼 이 과정에서도 CAD 시스템은 조립체의 삼차원 형상을 인식하고 필요한 정보를 제공해줌으로써 설계자에게 유용한 도구로 사용될 수 있는데 이를 조립체 모델링 시스템(Assembly Modeling System)이라 부르며, 현재에는 대부분의 솔리드 모델링 시스템에 그 기능이 채택되어 있다. 조립체 모델링에 관한 연구동향을 비교적 잘 정리한 문헌으로는 Turner와 Libardi의 것을 들 수 있다. 여기서는 이러한 조립체 모델링 시스템의 연구분야와 동향에 대해 또 나름으로의 시각으로 정리하였다.

  • PDF

강건 스테레오 비전과 허프 변환을 이용한 캐드 기반 삼차원 물체인식 (CAD-Based 3-D Object Recognition Using the Robust Stereo Vision and Hough Transform)

  • 송인호;정성종
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 1997년도 추계학술대회 논문집
    • /
    • pp.500-503
    • /
    • 1997
  • In this paper, a method for recognizing 3-D objects using the 3-D Hough transform and the robust stereo vision is studied. A 3-D object is recognized through two steps; modeling step and matching step. In modeling step, features of the object are extracted by analyzing the IGES file. In matching step, the values of the sensed image are compared with those of the IGES file which is assumed to location and orientation in the 3-D Hough transform domain. Since we use the 3-D Hough transform domain of the input image directly, the sensitivity to the noise and the high computational complexity could be significantly allcv~ated. Also, the cost efficiency is improved using the robust stereo vision for obtaining depth map image which is needed for 3-D Hough transform. In order lo verify the proposed method, real telephone model is recognized. Thc results of the location and orientation of the model are presented.

  • PDF

삼차원 라이더 데이터 기반의 침입 시나리오 구축 및 평가 연구 (A Study on the Construction and Evaluation of Intrusion Scenarios Based on 3D LiDAR Data)

  • 이윤임;이은석;노희전;이성현;김영철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.131-132
    • /
    • 2022
  • 삼차원 라이더 데이터를 기반으로 침입에 대한 분류 및 시나리오를 생성한다. 다양한 실제 침입 사례들을 분석하고 다양화하여 오브젝트를 인식하고 침입에 대한 데이터를 식별, 경계할 수 있는 시스템을 구축하기 위한 연구를 진행하였다. 자동차, 사람, 동물, 자연물 등에 대한 기본 시나리오를 생성하고 이를 반복적으로 테스트하여 시뮬레이션함으로써 침입에 대한 시스템을 구축하고 평가하는데 필요한 분류 체계를 만든다. 최종적으로 구성된 시나리오를 기반으로 차량 및 주변 물체에 대해서 변수를 추가하여 시나리오를 다양화하고, 향후 침입에 대해 정확하고 자동화된 경계 시스템을 구축할 수 있는 기반을 마련한다.

  • PDF

영상처리와 그래픽스 기술의 접목을 위한 자료구조의 설계 및 구현 (Design and Implementation of Data Structure for Combination Image Processing and Graphics)

  • 이태환;채옥삼
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.586-588
    • /
    • 1998
  • 영상처리의 결과로 얻어지는 에지나 선분과 같은 영상특성들은 그래픽의 기본 요소인 프리미티브들로 표현될 수 있다. 영상처리 결과를 그래픽 프리미티브로 표현하게 되면 보다 효율적으로 visualization할 수 있고 그래픽 환경의 편집기능을 이용하여 새로운 그래픽스를 생성할 수 있다. 반대로 그래픽 기술을 이용하여 생성된 영상은 패턴인식이나 Model Based 삼차원 물체인식 등에 사용될 수 있다. 이처럼 영상처리와 그래픽스는 서로 밀접한 관계를 가지고 있지만 이 두 분야를 지원하는 자료구조는 이를 반영하지 않고 있다. 영상처리를 위한 자료구조는 신속한 접근을 목표로 개발된 반면 그래픽스를 위한 자료구조는 공간절약과 빠른 display를 목표로 설계되었다. 본 연구에서는 영상처리와 그래픽스를 동시에 효과적으로 지원할 수 있는 자료구조를 설계하고 구현한다.

  • PDF

Hough 변환을 이용한 캐드 기반 삼차원 물체 인식 (CAD-Based 3-D Object Recognition Using Hough Transform)

  • Ja Seong Ku;Sang Uk Lee
    • 전자공학회논문지B
    • /
    • 제32B권9호
    • /
    • pp.1171-1180
    • /
    • 1995
  • In this paper, we present a 3-D object recognition system in which the 3-D Hough transform domain is employed to represent the 3-D objects. In object modeling step, the features for recognition are extracted from the CAD models of objects to be recognized. Since the approach is based on the CAD models, the accuracy and flexibility are greatly improved. In matching stage, the sensed image is compared with the stored model, which is assumed to yield a distortion (location and orientation) in the 3-D Hough transform domain. The high dimensional (6-D) parameter space, which defines the distortion, is decomposed into the low dimensional space for an efficient recognition. At first we decompose the distortion parameter into the rotation parameter and the translation parameter, and the rotation parameter is further decomposed into the viewing direction and the rotational angle. Since we use the 3-D Hough transform domain of the input images directly, the sensitivity to the noise and the high computational complexity could be significantly alleviated. The results show that the proposed 3-D object recognition system provides a satisfactory performance on the real range images.

  • PDF

하나의 비디오 입력을 위한 모습 기반법과 모델 사용법을 혼용한 사람 동작 추적법 (Human Motion Tracking by Combining View-based and Model-based Methods for Monocular Video Sequences)

  • 박지헌;박상호
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.657-664
    • /
    • 2003
  • 사람의 동작을 믿을 수 있게 따라가는 것은 감시용 비디오나 사람과 컴퓨터간의 사용자 인터페이스 개발에 있어서 필수적이다. 이 논문은 모습 기반법(appearance-based method)과 모델 사용법을 혼용하여 사람을 추적하는 새로운 방법에 관한 논문이다. 하나의 비디오 입력이 화소 단위 및 물체 단위로 처리된다. 화소 단위의 처리에 있어서 개별 화소색을 분류하는 훈련방법으로, 가우스 혼합 모델(Gaussian mixture model)을 사용하였다. 물체 단위의 처리에 있어서 사람 몸에 대한 삼차원 모델링을 하고, 모델 몸체를 투사면(projection plane)에 투사시켰다. 투사된 몸체와 배경을 제외한 영상과 계산 기하 방법을 사용하여, 화소보다 작은 단위로 겹쳐지는 면적을 계산하였다. 우리의 방법은 정방향 기구학 (forward kinematics)을 사용하므로 역방향 기구학(inverse kinematics)을 사용하는 방법과 달리 계산 결함(singularity)을 갖지 않는다. 이 논문에서는 사람의 동작을 추적하기 위한 문제를 비선형 방정식 문제로 바꾸었다. 비선형 방정식의 비용 함수는 전경(foreground)의 영상 실루엣(silhouette)과 투사된 삼차원 모델 몸체의 실루엣의 겹쳐지는 면적이다. 화소 단위의 영상을 화소를 하나의 면적으로 계산함으로써, 겹쳐지는 면적에 대한 실수 단위의 계산은 계산 기하를 사용하였다. 이 논문의 방법은 다양한 사람 동작을 인식하기 위하여 사용되었다. 비디오에 나타나는 사람 동작 추적은 매우 우수하다.

신경망을 이용한 칼라 입력장치의 칼라 보정 (Color correction of tile color input device using the Neural Network)

  • 엄경배;안창선
    • 정보교육학회논문지
    • /
    • 제3권1호
    • /
    • pp.134-142
    • /
    • 1999
  • 칼라 입출력 장비의 가격이 점차로 저렴해짐에 따라 영상으로부터 물체의 형상뿐만아니라 칼라까지도 인식하여 보다 정밀한 정보를 이용하고자하는 요구가 증대되고 있다. 이를 위해서는 칼라 입출력 시스템의 정확한 칼라 표현 및 재현을 위해 칼라 보정에 관한 연구가 선행되어져야한다. 따라서, 본 논문에서는 칼라 입출력장비 중 칼라 스캐너의 칼라 보정에 관하여 연구하였다. 칼라 스캐너의 특성은 gray-balancing과 칼라 변환의 두과정을 나뉜다. 칼라 변환으로부터 gray-balancing을 분리함으로써 칼라 변환을 위해 유도되어진 변환 행렬은 모든 형태의 스캐너에 적용될 수 있어 스캐너 특성의 portability를 가능하게 한다. 또한, gray-balance된 RGB값을 얻기위한 선의 적합을 위해 최소자승법을 이용하였고, 칼라 변환을 위해 gray-balance된 RGB로부터 CIE-XYZ로 비선형적 좌표 변환 문제를 저장공간이 많이 필요하지 않고, 빠른 변환결과를 제공할 수 있는 장점이 있는 신경망 기법을 이용하여 해결 하였다. 삼차원 3자극치 공간에서 신경망 출력은 원하는 출력의 근사치를 제공하는 것을 알 수 있었다. 제안된 칼라 보정 방법은 모듈별로 분해되었기 때문에 스캐너 특성의 portability를 가능하게 하여 모든 형태의 스캐너 보정에 이용될 수 있으리라 기대된다.

  • PDF