• 제목/요약/키워드: 스테레오 이미지

검색결과 97건 처리시간 0.018초

스테레오 입체음향을 위한 머리 움직임 추정 (A Tracking of Head Movement for Stereophonic 3-D Sound)

  • 김현태;이광의;박장식
    • 한국멀티미디어학회논문지
    • /
    • 제8권11호
    • /
    • pp.1421-1431
    • /
    • 2005
  • 입체음향을 구현하는 방법은 두 가지가 있으며, 5.1 채널과 같은 서라운드 시스템(surround system)을 이용하는 방법과 2 채널의 바이노럴 시스템(binaural system)을 이용하는 방법이 있다. 바이노럴 시스템은 사람이 두 귀를 이용하여 음상을 정위하는 원리를 이용하는 방법이다. 일반적으로 라우더 스피커 시스템에서 각 채널사이에 발생하는 크로스토크(crosstalk)는 본래의 입체음향을 재생하기 위해서는 제거되어야만 한다. 이 문제를 해결하기 위해서는 머리의 움직임을 추정할 필요가 있다. 본 논문에서는 청취자의 머리 움직임을 제대로 추정하는 새로운 알고리즘을 제안한다. 제안하는 알고리즘은 얼굴과 눈의 영역 검출을 기본으로 한다. 얼굴 검출은 이미지의 밝기 값을 이용하고 눈 검출은 수학적 형태학(mathematical morphology)을 이용한다. 청취자의 머리가 움직일 때 얼굴 영역과 눈 사이의 경계선의 길이가 변한다. 이 정보를 이용하여 머리 움직임을 추정한다. 컴퓨터 시뮬레이션을 통해 제안하는 알고리즘이 +10오차 범위 내에서 머리의 움직임을 효율적으로 추정하는 것을 확인하였다.

  • PDF

부동 소수점 연산을 이용한 실시간 영상 편위교정 FPGA 하드웨어 구조 설계 (A Real-Time Hardware Architecture for Image Rectification Using Floating Point Processing)

  • 한동일;최재훈;신호철
    • 전자공학회논문지
    • /
    • 제51권2호
    • /
    • pp.102-113
    • /
    • 2014
  • 본 논문은 두 대의 카메라로 찍은 영상을 이용하여 사물의 3D 정보를 계산하는 스테레오 매칭(Stereo Matching) 기법의 전처리 과정에 관한 연구이다. 본 논문에서는 카메라 내부의 왜곡 및 두 카메라간의 정렬 문제로 인해 생긴 영상의 수직시차(vertical parallax)를 제거하기 위한 실시간 편위교정(Rectification) 하드웨어 설계 구조를 제안한다. 이를 위한 사전 단계로 J.Y Bouguet이 설계한 Matlab 툴박스를 이용해 영상의 보정 매개변수(calibration parameter)를 구한 후 Heikkila 와 Silven의 알고리즘을 기반으로 하여 편위교정 하드웨어를 설계하였다. 이때 결과 이미지의 정밀도를 높이기 위하여 Xilinx의 Core 생성기를 이용해 부동소수점 연산기를 생성하여 사용하였으며, 이를 통하여 룩업 테이블(Look-Up Table) 등을 사용하여 설계된 타 편위교정 하드웨어에 비해 높은 정밀도를 가지면서도 실시간으로 작동하는 편위교정 하드웨어를 설계할 수 있음을 확인하였다.

스테레오 비전을 이용한 저전력 적외선 멀티 터치스크린 컨트롤러의 설계 (Design of an Infrared Multi-touch Screen Controller using Stereo Vision)

  • 정성완;권오준;정용진
    • 대한전자공학회논문지SD
    • /
    • 제47권2호
    • /
    • pp.68-76
    • /
    • 2010
  • 최근 터치스크린 기술은 인간이 컴퓨터와 대화할 수 있는 주요 도구로서 급진적인 발전을 이루고 있다. 이 사용자 친화적인 인터페이스는 휴대폰에 이어 데스크탑, TV와 같은 대형스크린 시장까지 확산되어가고 있지만 기존의 저항막방식, 정전용량방식, 초음파방식 등은 기술 및 비용문제로 인하여 중 대형스크린에 적용하기 힘들다. 따라서 본 논문에서는 적외선과 라인스캔 이미지센서를 이용하여 간단하고 저렴한 비용으로 중 대형스크린에 적용할 수 있는 광학 영상 터치스크린 솔루션을 소개하고 이 기술이 갖는 문제점과 해결방안을 제시한다. 멀티 포인트를 추출하기 위한 주요 알고리즘은 범용프로세서를 이용하여 구현 시 약 34ms(29fps)가 소요되었으며 이는 휴먼인터페이스 디바이스로 사용되기에는 불충분하였다. 이를 해결하기 위하여 본 논문에서는 신호처리 및 좌표추출연산을 위한 하드웨어를 설계하여 성능을 향상시키고 광학 영상 터치스크린이 갖는 문제점을 소프트웨어에서 효율적으로 처리할 수 있도록 하였다. 설계한 터치스크린 컨트롤러의 PSM(Power Saving Mode)은 1.8Wh의 적외선 소비에너지를 0.0072Wh 까지 개선하였으며 60인치 대형스크린에서 2개의 실제 좌표를 200fps 속도로 연산해낸다.

스테레오 비전을 이용한 물체의 위치정보 추출 알고리즘 개발 (A Development of Object Position Information Extraction Algorithm using Stereo Vision)

  • 김무현;이지현;이승규;김영희;박무훈
    • 한국정보통신학회논문지
    • /
    • 제14권8호
    • /
    • pp.1767-1775
    • /
    • 2010
  • 무인 운반설비의 자동화 시스템 개발의 한 부분으로써 Stereo vision system에 관한 많은 연구가 진행되고 있다. Stereo vision system에서는 영상을 통해 특정 물체를 검색하고 검색된 물체 정보를 기반으로 Edge를 추출하고, 추출된 Edge를 이용하여 물체의 위치적 특징을 찾고 무인크레인이 이동해야할 위치좌표를 전달한다. 본 논문에서는 실제 산업현장에 가장 보편적인 형상인 Slab와 Coil을 기준으로 두 대의 CCD camera를 이용하여 물체의 형상을 인식하고, 무인크레인의 Hookblock부분이 물체의 중심점을 찾는 알고리즘을 개발하였다. 본 논문에서는 Stereo vision system의 카메라 설치 위치에 따라 직교식과 수평식으로 2가지의 방식을 제안, 실험을 하였다. 본 논문에서 제안한 알고리즘은 무인 운반설비의 자동화 시스템 개발에 도움이 될 것으로 기대된다.

VR, AR 시뮬레이션 및 3D Printing을 활용한 어깨와 팔꿈치 수술실습 (VR, AR Simulation and 3D Printing for Shoulder and Elbow Practice)

  • 임원봉;문영래
    • 전자공학회논문지
    • /
    • 제53권12호
    • /
    • pp.175-179
    • /
    • 2016
  • 최근 의료 영상 기술의 발전은 진단, 수술계획, 또는 교육에 도움이 되는 수술 시뮬레이션을 만들어 왔다. 개선된 고화질 영상과 3차원 시각화는 의료 영상 가용성을 향상시키고 수술, 교육 분야에서 더 잘 이용할 수 있게 되었다. 실제 인간의 시각은 입체이다. 따라서, 외과의사의 판단을 통해 2차원 영상을 스테레오로 재구성하여 처리하는 것이 함께 필요하다. 이러한 과정을 줄이기 위해, 3차원 (3D) 이미지가 사용되어 왔다. 3D 영상은 복잡한 상황에서 외과 의사가 매우 짧은 시간에 판단할 수 있도록 3D 시각화를 강화하여 제공한다. 3D 화상 데이터 세트에 기초하여, 가상 내시경 수술 계획, 실시간 상호 작용 가상 의료 시뮬레이션이 가능하게 되었다. 본 논문은 새로운 이미징 기술의 최근 응용 프로그램을 설명하고 이의 기본과 특별히 주목할만한 의료 3D 복원 기술에 관한 것이다. 최근 CT, MR 및 기타 영상 양식의 기술발전은 흥미로운 새로운 솔루션과 어깨 영상의 활용 가능성을 넓혀왔다. 특히, 의료 기기에서 파생 된 3차원 (3D) 이미지는 고급 정보를 제공한다. 이 프레젠테이션은 어깨와 팔꿈치의 수술실습에서 원리, 3D 영상기술의 잠재적 응용가능성, 시뮬레이션, 3D프린팅을 설명한다.

RGB-D 모델을 이용한 강건한 객체 탐지 및 추적 방법 (A Robust Object Detection and Tracking Method using RGB-D Model)

  • 박서희;전준철
    • 인터넷정보학회논문지
    • /
    • 제18권4호
    • /
    • pp.61-67
    • /
    • 2017
  • 최근 지능형 CCTV는 빅 데이터, 인공지능 및 영상 분석과 같은 분야와 결합하여 다양한 이상 행위들을 탐지하고 보행자와 같은 객체의 전반적인 상황을 분석할 수 있으며, 이러한 지능형 영상 감시 기능에 대한 영상 분석 연구가 활발히 진행되고 있는 추세이다. 그러나 일반적으로 2차원 정보를 이용하는 CCTV 영상은 위상학적 정보 부족으로 인해 객체 오 인식과 같은 한계가 존재한다. 이러한 문제는 두 대의 카메라를 사용하여 생성된 객체의 깊이 정보를 영상에 추가함으로써 해결 할 수 있다. 본 논문에서는 가우시안 혼합기법을 사용하여 배경 모델링을 수행하고, 모델링 된 배경에서 전경을 분할하여 움직이는 객체의 존재 여부를 탐지한다. RGB 정보 기반 분할 결과를 이용하여 깊이 정보 기반 분할을 수행하기 위해 두 대의 카메라를 사용하여 스테레오 기반 깊이 지도를 생성한다. RGB 기반으로 분할된 영역을 깊이 정보를 추출하기 위한 도메인으로 설정하고, 도메인 내부에서 깊이 기반 분할을 수행한다. 강건하게 분할된 객체의 중심점을 탐지하고 방향을 추적하기 위해 가장 기본적인 객체 추적 방법인 CAMShift 기법을 적용하여 객체의 움직임을 추적한다. 실험을 통하여 제안된 RGB-D 모델을 이용한 객체 탐지 및 추적 방법의 우수성을 입증하였다.

W-band Synthetic Aperture Radar 영상 복원을 위한 엔트로피 기반의 6 Degrees of Freedom 추출 (Entropy-Based 6 Degrees of Freedom Extraction for the W-band Synthetic Aperture Radar Image Reconstruction)

  • 이혁빈;김덕진;김준우;송주영
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1245-1254
    • /
    • 2023
  • 77 GHz frequency modulation continuous wave radar를 이용한 W-band synthetic aperture radar (SAR) system에 대한 연구가 활발히 진행되고 있다. 고해상도의 W-band SAR 영상을 복원하기 위해서는 스테레오 카메라 또는 라이다(LiDAR)에서 획득한 point cloud를 6 degrees of freedom (DOF)의 방향에서 변환하여 SAR 영상 신호처리에 적용하는 것이 필요하다. 하지만 서로 다른 센서로부터 획득한 영상의 기하구조가 달라 정합하는데 어려움을 가진다. 본 연구에서 SAR 영상의 엔트로피(entropy)에 따른 경사 하강법을 이용하여 point cloud의 6 DOF를 구하고 최적의 depth map을 추출하는 기법을 제시한다. 구축한 W-band SAR system으로 주요 도로 환경 객체인 나무를 복원하는 실험을 수행하였다. 엔트로피에 따른 경사 하강법을 이용하여 복원한 SAR 영상이 기존의 레이더 좌표에서 복원한 SAR 영상보다 mean square error는 53.2828 감소했고, structural similarity index는 0.5529 증가한 것을 보였다.