• 제목/요약/키워드: 3D image processing

검색결과 1,106건 처리시간 0.045초

다중 평면의 3차원 모서리를 이용한 레이저 거리센서 및 카메라의 정밀 보정 (An Accurate Extrinsic Calibration of Laser Range Finder and Vision Camera Using 3D Edges of Multiple Planes)

  • 최성인;박순용
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권4호
    • /
    • pp.177-186
    • /
    • 2015
  • 레이저 거리센서와 비전 카메라의 정보를 융합하기 위해서는 두 센서 사이의 상대적인 위치관계를 설명하는 외부 파라미터를 정확하게 보정하는 것이 필수적이다. 본 논문에서는 레이저 거리센서와 카메라 좌표계 간의 외부 파라미터를 기존에 알려진 방법보다 쉬우면서도 정확하게 획득할 수 있는 새로운 보정 방법을 제안하고자 한다. 본 논문에서 제안한 방법의 접근법은 레이저 거리센서로 획득한 3차원 구조물의 모서리 정보를 영상으로 투영하였을 때 반드시 하나의 직선상에 존재해야 한다는 것을 제약조건으로 한다. 이러한 제약조건을 만족하는 3차원 기하모델을 제시하고 이 모델의 에너지 함수를 최소화하기 위한 수치적 해법을 소개한다. 또한 높은 정밀도의 보정을 위하여 레이저 거리정보 및 카메라 영상의 획득 과정에 대해서도 상세히 설명한다. 실험을 통해 제안된 방법의 성능이 기존의 방법에 비하여 보다 높은 정밀도를 보임을 확인할 수 있었다.

적대적 생성 신경망을 통한 얼굴 비디오 스타일 합성 연구 (Style Synthesis of Speech Videos Through Generative Adversarial Neural Networks)

  • 최희조;박구만
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권11호
    • /
    • pp.465-472
    • /
    • 2022
  • 본 연구에서는 기존의 동영상 합성 네트워크에 스타일 합성 네트워크를 접목시켜 동영상에 대한 스타일 합성의 한계점을 극복하고자 한다. 본 논문의 네트워크에서는 동영상 합성을 위해 스타일갠 학습을 통한 스타일 합성과 동영상 합성 네트워크를 통해 스타일 합성된 비디오를 생성하기 위해 네트워크를 학습시킨다. 인물의 시선이나 표정 등이 안정적으로 전이되기 어려운 점을 개선하기 위해 3차원 얼굴 복원기술을 적용하여 3차원 얼굴 정보를 이용하여 머리의 포즈와 시선, 표정 등의 중요한 특징을 제어한다. 더불어, 헤드투헤드++ 네트워크의 역동성, 입 모양, 이미지, 시선 처리에 대한 판별기를 각각 학습시켜 개연성과 일관성이 더욱 유지되는 안정적인 스타일 합성 비디오를 생성할 수 있다. 페이스 포렌식 데이터셋과 메트로폴리탄 얼굴 데이터셋을 이용하여 대상 얼굴의 일관된 움직임을 유지하면서 대상 비디오로 변환하여, 자기 얼굴에 대한 3차원 얼굴 정보를 이용한 비디오 합성을 통해 자연스러운 데이터를 생성하여 성능을 증가시킴을 확인했다.

H.264/AVC 기반의 스테레오 영상 디스플레이 시스템 (Stereoscopic Video Display System Based on H.264/AVC)

  • 김태준;김지홍;윤정환;배병규;김동욱;유지상
    • 한국통신학회논문지
    • /
    • 제33권6C호
    • /
    • pp.450-458
    • /
    • 2008
  • 본 논문에서는 양안시차를 이용한 스테레오 영상의 부호화 기법을 H.264/AVC 기반으로 스테레오 영상을 실시간으로 전송하기 위한 효과적인 시스템을 제안한다. OpenCV를 이용하여 스테레오 웹캠으로부터 영상을 획득하고, 전처리 과정으로 입력 시스템을 통해 획득한 스테레오 영상을 YUV 4:2:0 파일 포맷으로 변환한다. 변환된 파일은 스테레오 부호화기로 입력되고 제안된 예측구조에 의해 부호화기의 복잡도를 감소시킴으로써 초당 30프레임 이상의 부호화 속도로 부호화 된다. 부호화된 비트스트림 파일은 복호화기에 입력되어 좌, 우 스테레오 영상으로 재 생성된다. 재 생성된 스테레오 영상은 입체영상으로 합성되어 3D 디스플레이 장치를 통해 사용자에게 보여지게 된다. 제안된 시스템은 기존의 스테레오 코덱을 사용했을 때 보다 최소 1.5dB에서 최대 3dB의 압축효율이 뛰어남을 본 실험을 통하여 검증 및 확인하였다. 본 연구는 저 대역폭, 저 전력의 실시간 전송을 위한 모바일환경에 응용이 가능할 것으로 기대된다.

비선형 보간법을 이용한 수중 이미지 소나의 3 차원 해저지형 실시간 생성기법 (Real-time Data Enhancement of 3D Underwater Terrain Map Using Nonlinear Interpolation on Image Sonar)

  • 이인규;김재선;노세환;신기철;이재준;유선철
    • 센서학회지
    • /
    • 제32권2호
    • /
    • pp.110-117
    • /
    • 2023
  • Reconstructing underwater geometry in real time with forward-looking sonar is critical for applications such as localization, mapping, and path planning. Geometrical data must be repeatedly calculated and overwritten in real time because the reliability of the acoustic data is affected by various factors. Moreover, scattering of signal data during the coordinate conversion process may lead to geometrical errors, which lowers the accuracy of the information obtained by the sensor system. In this study, we propose a three-step data processing method with low computational cost for real-time operation. First, the number of data points to be interpolated is determined with respect to the distance between each point and the size of the data grid in a Cartesian coordinate system. Then, the data are processed with a nonlinear interpolation so that they exhibit linear properties in the coordinate system. Finally, the data are transformed based on variations in the position and orientation of the sonar over time. The results of an evaluation of our proposed approach in a simulation show that the nonlinear interpolation operation constructed a continuous underwater geometry dataset with low geometrical error.

RGB-D 카메라를 이용한 실시간 가상 현실 평면 추정 (A Real-time Plane Estimation in Virtual Reality Using a RGB-D Camera in Indoors)

  • 이주호;조정원
    • 디지털융복합연구
    • /
    • 제14권11호
    • /
    • pp.319-324
    • /
    • 2016
  • 실내에서 카메라를 이용한 로봇 응용이나 가상현실(Virtual Reality) 응용의 경우 평면을 찾고 추정하는 기술은 매우 중요한 기술이다. RGB-D 카메라의 경우 실내의 평면에서 질감 정보가 없는 평면에서도 3차원 관측 데이터를 얻을 수 있지만, 이미지 영역에서 점군 데이터(Point-cloud Data)를 처리하기 위해서는 많은 연산량이 필요하다. 더군다나 현재 관측되고 있는 평면의 개수가 몇 개인지 미리 알 수 없으며, 평면으로 검출(Plane Detection) 하더라도 강인하게 3차원에서 평면을 추정(Plane Estimation)하려면 추가적인 연산이 필요하다. 본 논문에서는 연속 데이터를 이용해 실시간으로 평면의 개수를 선택하며 평면을 추정하는 방법을 제시하고자 한다. 실험 결과를 통해 제안하는 방법이 전체 데이터를 처리하는 것에 비해 약 22배의 속도 개선을 가져 올 수 있음을 보였다.

영화의 합성과 디지털 애니메이션의 가상성에 관한연구 (The Illusion-Image of Digital Animation Used in a Live action Film and 3D Animation)

  • 이종한
    • 만화애니메이션 연구
    • /
    • 통권9호
    • /
    • pp.235-249
    • /
    • 2005
  • 디지털 애니메이션의 환영(幻影-illusion) 이미지를 만드는 과정은 테크놀로지의 수공예적인 수작업(手作業) 즉, 애니메이션 과정, 이미지의 덧붙임, 보정(補整) 등을 통해 만들어진다. 본 논문은 디지털 애니메이션이 전통 예술의 수공예적인 측면을 디지털 제작 과정으로 부활시켜 새로운 예술 개념을 획득하고 있음을 주장하고 있다. 이를 구체화하기 위해서 본 논문은 다음의 단계로 이루어진다. 첫 째는 영화의 복제와 혼성이다. 예술의 '아우라'를 강조 해왔던 예술사에서 기계에 의한 복제는 피할 수 없는 것이 되었고, 디지털로 저장된 다양한 그림 정보와 짜깁기된 영상작업들은 복제와 혼성으로 새로운 영상 작업을 쉽게 할 수 있는 계기가 되었다. 둘째, 디지털 애니메이션의 예술 영역의 확장이다. 이제 디지털 애니메이션은 극사실의 환영성을 통해 새로운 창조적 예술로 인정받고 있다. 결과적으로, 디지털 애니메이션의 제작과정으로 과거의 미디어가 이루지 못한 상상력을 복원하는 새로운 미디어 예술의 특성을 보여주면서 디지털 애니메이션의 새로운 예술로써의 가능성을 획득하고 있다

  • PDF

블록 근사화식의 적응적 선택을 이용한 프랙탈 영상 부호화 (Fractal Image Compression Using Adaptive Selection of Block Approximation Formula)

  • 박용기;박철우;김두영
    • 한국정보처리학회논문지
    • /
    • 제4권12호
    • /
    • pp.3185-3199
    • /
    • 1997
  • 본 논문에서는 블록 근사화식을 적응적으로 선택하여 프랙탈 계수를 결정함으로서 기존의 프랙탈 부호화 방법에서 문제가 되는 부호화 시간을 개선하는 방법과 복원 영상의 화질을 향상시킬 수 있는 방법을 제안한다. 첫 번째로 부호화 시간을 단축하기 위해 밝기값과 분산에 의해 특성이 결정된 Domain 블록을 선형 리스트로 구성한 후 l차 허용오차 임계치에 의해 블록 탐색 시간을 제어할 수 있게 하였다. 두 번째로 블록 분할 레벨을 3단계로 하여 부호화할 때 최저 분할 레벨의 Range 블록이 만족할 만한 근사화 오차를 갖는 Domain블록을 찾지 못하면 그 블록에 한하여 밝기항을 비선형 변환식으로 새로운 변환 계수를 결정하여 화질을 향상시켰다. 제안한 방법으로 실험한 결과 기존의 부호화 방식보다 부호화 시간은 2배이상 향상되었고 동일한 압축율에서 PSNR값은 1-2dB정도가 향상되었다.

  • PDF

모바일 Deep Residual Network을 이용한 뎁스 영상 기반 1 인칭 시점 VR 손동작 인식 (Depth Image based Egocentric 3D Hand Pose Recognition for VR Using Mobile Deep Residual Network)

  • 박혜민;박나현;오지헌;이철우;최형우;김태성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.1137-1140
    • /
    • 2019
  • 가상현실(Virtual Reality, VR), 증강현실(Augmented Reality, AR), 혼합현실(Mixed Reality, MR) 분야에 유용한 인간 컴퓨터 인터페이스 기술은 필수적이다. 특히 휴먼 손동작 인식 기술은 직관적인 상호작용을 가능하게 하여, 다양한 분야에서 편리한 컨트롤러로 사용할 수 있다. 본 연구에서는 뎁스 영상 기반의 1 인칭 시점 손동작 인식을 위하여 손동작 데이터베이스 생성 시스템을 구축하여, 손동작 인식기 학습에 필요한 1 인칭(Egocentric View Point) 데이터베이스를 촬영하여 제작한다. 그리고 모바일 Head Mounted Device(HMD) VR 을 위한 뎁스 영상 기반 1 인칭 시점 손동작 인식(Hand Pose Recognition, HPR) 딥러닝 Deep Residual Network 를 구현한다. 최종적으로, 안드로이드 모바일 디바이스에 학습된 Residual Network Regressor 를 이식하고 모바일 VR 에 실시간 손동작 인식 시스템을 구동하여, 모바일 VR 상 실시간 3D 손동작 인식을 가상 물체와의 상호작용을 통하여 확인 한다.

등각촬영법과 평행촬영법에서의 실책 비교 연구 (A Comparative Study on Rate of Error with Bisecting Angle Technique and Paralleling Technique)

  • 이경희;박일순;정정옥
    • 치위생과학회지
    • /
    • 제11권3호
    • /
    • pp.155-161
    • /
    • 2011
  • 본 연구는 치근단 필름 촬영에 있어서 촬영법에 따른 실책율을 살펴봄으로써 향후 효율적인 촬영기술 습득과 학생의 지도를 위한 기초 자료를 얻고자 시행되었다. 2009년 3월부터 2010년 12월까지 D 보건대학 및 S 보건대학 치위생과 학생들을 대상으로 촬영한 필름 14,402매를 분석하고, 등각촬영법과 평행촬영법의 촬영 실습수업을 이수한 학생 263명을 대상으로 현상과정에서 가장 어려웠던 점에 관한 설문조사를 실시하여 다음과 같은 결과를 얻었다. 1. 등각촬영법으로 촬영한 경우 상 하악 모두 대구치부에서 실책율이 가장 높았다. 2. 평행촬영법으로 촬영한 경우 상악에서는 소구치부, 하악에서는 대구치부에서 실책율이 가장 높았다. 3. 촬영기술상의 실책은 등각촬영법과 평행촬영법 모두 필름위치의 부정확이 가장 높게 나타났으며, 등각촬영법이 평행촬영법에 비해 실책율이 높게 나타났다. 4. 현상기술상의 실책은 등각촬영법과 평행촬영법 모두 어두운 상과 밝은 상이 가장 높게 나타났으며, 등각 촬영법이 평행촬영법에 비해 실책율이 높게 나타났다. 5. 학생들은 현상과정에서 현상의 정도를 파악하는 것을 가장 어려워하는 것으로 나타났다. 이상의 결과로 살펴볼 때, 치근단 촬영 시 실책율을 줄이기 위해서는 구강 내 형태학적, 해부학적 구조의 이해가 필요하며, 충분한 시간을 가지고 여러 번 반복 촬영하여 숙련도를 높이는 것이 중요하다고 생각된다.

딥러닝을 이용한 화강암 X-ray CT 영상에서의 균열 검출에 관한 연구 (Pixel-level Crack Detection in X-ray Computed Tomography Image of Granite using Deep Learning)

  • 현석환;이준성;전성환;김예진;김광염;윤태섭
    • 터널과지하공간
    • /
    • 제29권3호
    • /
    • pp.184-196
    • /
    • 2019
  • 본 연구에서는 화강암 시편에서 수압 파쇄법에 의해 생성된 미세균열의 3차원 형상을 X-ray CT 영상과 딥러닝을 이용하여 추출하였다. 실험으로 생성된 미세균열은 X-ray CT 영상 상에서 일반적인 영상처리방법으로는 추출하기 매우 어렵고 육안으로만 관찰이 가능한 형태를 지닌다. 하지만 본 연구에서 제안한 합성곱 신경망(Convolutional neural network) 기반 인코더-디코더(Encoder-Decoder) 구조의 딥러닝 모델을 통해 미세균열을 정량적으로 추출할 수 있었다. 특히 픽셀 단위의 미세균열 추출을 위해 인코딩 과정에서 소실되는 정보를 디코딩 과정으로 직접 전달하는 디코더 모델을 제안하였다. 또한, 딥러닝 기반 신경망 학습에 필요한 데이터의 수를 증가시키기 위해 이미지의 분할(Division), 회전(Rotation), 그리고 반전(Flipping) 등으로 데이터를 생성하는 영상 증대 방법을 적용하였으며 이때 최적의 조합을 확인하였다. 최적의 영상 학습 데이터 증대 방법을 적용하였을 때 검증 데이터뿐만 아니라 테스트 데이터에서의 성능 향상을 확인하였다. 학습 데이터의 원본 개수가 딥러닝 기반 신경망의 균열 추출 성능에 미치는 영향을 확인하고 딥러닝 기술을 사용하여 성공적으로 미세균열을 추출하였다.