• 제목/요약/키워드: Stereo Coding

검색결과 50건 처리시간 0.028초

고효율 비디오코딩을 위한 입체영상시스템 (Volumetric Image System for High Efficiency Video Coding)

  • 김상현
    • 한국콘텐츠학회논문지
    • /
    • 제16권1호
    • /
    • pp.515-520
    • /
    • 2016
  • 입체영상 시스템은 최근 교육, 3D 영화, 의료 영상 등 다양한 분야에 응용되고 있으나 실용화함에 있어 해결해야할 문제점도 남아있다. 입체영상 디스플레이는 실용화 단계에서 대량의 영상 데이터를 처리해야 하고 실시간 디스플레이를 위해 고효율 비젼 시스템을 설계해야 한다. 입체영상 디스플레이를 위한 스테레오 시스템에서는 움직임 벡터, 변위 벡터 및 오차영상이 전송되며 스테레오 영상 시퀀스를 복원하여 디스플레이를 하게 된다. 그러므로 효율적인 입체영상시스템 설계를 위한 핵심요소는 스테레오 영상간의 효율적인 정합과 강건한 비젼 시스템에 있다. 본 논문에서는 광학 플랫폼 위에 회전이 가능한 회전단과 수평이동이 가능한 단을 설계하고 카메라를 이용하여 순차적으로 스테레오 영상을 취득하여 정합함으로써 정확한 3D 정보를 추출할 수 있는 고효율 비젼 시스템을 제안한다. 제안한 입체영상 시스템 실험결과 간략화된 시스템 구조 보정을 통해 적은 계산량으로 입체영상 디스플레이를 위한 스테레오 정합에러를 최소화할 수 있었다.

Multi-band Approach to Deep Learning-Based Artificial Stereo Extension

  • Jeon, Kwang Myung;Park, Su Yeon;Chun, Chan Jun;Park, Nam In;Kim, Hong Kook
    • ETRI Journal
    • /
    • 제39권3호
    • /
    • pp.398-405
    • /
    • 2017
  • In this paper, an artificial stereo extension method that creates stereophonic sound from a mono sound source is proposed. The proposed method first trains deep neural networks (DNNs) that model the nonlinear relationship between the dominant and residual signals of the stereo channel. In the training stage, the band-wise log spectral magnitude and unwrapped phase of both the dominant and residual signals are utilized to model the nonlinearities of each sub-band through deep architecture. From that point, stereo extension is conducted by estimating the residual signal that corresponds to the input mono channel signal with the trained DNN model in a sub-band domain. The performance of the proposed method was evaluated using a log spectral distortion (LSD) measure and multiple stimuli with a hidden reference and anchor (MUSHRA) test. The results showed that the proposed method provided a lower LSD and higher MUSHRA score than conventional methods that use hidden Markov models and DNN with full-band processing.

스테레오 영상 교정 구조의 간략화를 이용한 고효율 3D 비젼시스템 (High efficient 3D vision system using simplification of stereo image rectification structure)

  • 김상현
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권6호
    • /
    • pp.605-611
    • /
    • 2019
  • 3D Vision system has many applications recently but popularization have many problems that need to be overcome. Volumetric display may process a amount of visual data and design the high efficient vision system for display. In case of stereo system for volumetric display, disparity vectors from the stereoscopic sequences and residual images with the reference images has been transmitted, and the reconstructed stereoscopic sequences have been displayed at the receiver. So central issue for the design of efficient volumetric vision system lies in selecting an appropriate stereo matching and robust vision system. In this paper, we propose high efficient vision system with the reduction of rectification error which can perform the 3D data extraction efficiently with low computational complexity. In experimental results with proposed vision system, the proposed method can perform the 3D data extraction efficiently with reducing rectification error and low computational complexity.

위상 정렬을 이용한 주성분 분석법의 강인한 스테레오 음원 분리 성능유지 기법 (Robust Primary-ambient Signal Decomposition Method using Principal Component Analysis with Phase Alignment)

  • 백용현;현동일;박영철
    • 방송공학회논문지
    • /
    • 제19권1호
    • /
    • pp.64-74
    • /
    • 2014
  • 스테레오 신호에서 방향성을 갖는 주음원 성분과 배경음 성분을 분리하는 과정은 스테레오 음원을 다채널 포맷으로 변환하는 업믹스 기술의 전처리 단계로 필요하다. 이를 위하여 PCA(Principal Component Analysis)가 널리 사용되고 있으나, 기존의 방법에서는 스테레오 음원이 진폭 패닝만 되었다고 가정하고 있기 때문에 채널 신호 간 위상 차이가 발생하는 경우 성능이 저하된다. 본 논문에서는 채널 신호간의 위상차에 의한 주성분 분석 방법의 오차를 분석하고 이를 보완하여 주성분 분석법 성능 저하를 방지하는 방법을 제안한다. 제안된 알고리즘은 주파수 빈(bin) 단위에서 채널 간 위상차를 추정하여 보상하고 임계대역 단위로 주성분과 주변 성분을 분리한다. 실험 결과로부터 위상차가 있는 스테레오 음원에 대하여 제안된 알고리즘이 PCA 분리 성능의 저하를 방지 하며, 패닝 각도, PAR(Primary to Ambient energy ratio)에 영향 받지 않는 강건한 분리 성능을 보임을 확인하였다.

3차원 텔레비전을 위한 에러 은닉 기반 스테레오 영상 압축 (Stereo image compression based on error concealment for 3D television)

  • 박성철;심동규;남궁재찬;오승준
    • 방송공학회논문지
    • /
    • 제10권3호
    • /
    • pp.286-296
    • /
    • 2005
  • 본 논문은 3차원 실감 영상 텔레비전을 위한 스테레오 기반 영상 압축 및 전송장치에 관한 것이다. 본 논문에서는 입력되는 두 개의 스테레오 영상에서 영상처리 기반 disparity map을 추출하고, 추출된 disparity map과 두 개의 스테레오 영상 중에 한 개의 영상만을 전송하거나 저장하는 방식이다 기존의 방식은 occlusion 지역에서 대응점을 결정할 수 없는 문제로 인하여 3차원 영상 복원 시 데이터가 손실되는 단점을 가지고 있다. 본 논문에서는 블록기반 에러 은닉 기법과 루프 필터를 사용한 복원 영상 보정 알고리즘을 제안하여 3차원 영상 복원 시 생길 수 있는 오차를 최소화하였다. 제안한 알고리즘의 효율성을 보이기 위하여 다양한 실제 영상을 사용하였으며 영상 복원 정확성의 객관적 판단기준을 통하여 제안한 알고리즘이 스테레오 영상을 표현하는데 효과적인 방법임을 증명하였다.

HEVC 기반 삼차원 영상의 스케일러블 전송을 위한 확장 시스템 (High-level framework for scalable 3D video coding based on HEVC)

  • 최병두;조용진;박민우;이진영;위호천;김찬열
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.182-184
    • /
    • 2013
  • A HEVC-based scalable 3D video coding system is proposed. The proposed system supports scalable transmission of multiview video data with depth maps. Key technologies in this system are reference picture management, reference picture list construction, and cross-layer dependency signaling. All the proposed technologies are used for the development of video coding system for UHD stereo display and glassless 3D display.

  • PDF

다채널 오디오 코딩을 위한 MPEG Surround-2부: 다양한 모드 및 툴들 (MPEG Surround for Multi-Channel Audio Coding-Part 2: Various Modes and Tools)

  • 방희석
    • 한국음향학회지
    • /
    • 제28권7호
    • /
    • pp.610-617
    • /
    • 2009
  • 본 논문에서는 MPEG Surround의 다양한 모드들과 툴들에 대해서 소개한다. MPEG Surround바이노럴 모드의 경우 HRTFs (Head-Related transfer Functions)를 이용하여 가상의 5.1 채널을 지원하기 때문에 휴대용 오디오 기기에서 헤드폰이나 이어폰을 이용하여 재생할 수 있다. 또한, MPEG Surround는 부가 정보 없이 스테레오 채널을 5.1 채널을 지원하는 Enhanced Matrix 모드, 기존의 3D 코딩 신호에 적용할 수 있는 3D 스테레오 모드, 복호화 과정에서 연산량을 크게 줄일 수 있는 저전력 (Low Power)버전 등을 지원한다. 이 외에도, MPEG Surround는 아티스틱 다운믹스 신호에 대해 적용하는 Arbitrary Downmix Gain (ADG)툴, 기존의 행렬 근거 방법들에 의한 다운믹스 신호에 적용되는 행렬 호환성 (Matrix Compatibility)툴, 고비트율을 사용할 수 있을 때 적용되는 잔차 신호 코딩 (Residual Coding)툴, 박수 소리 등 특정 신호에 대해 사용될 수 있는 GES (Guided Envelope Shaping)툴 등을 지원한다. 중요한 모드 및 툴들에 대해 여러 기관에 의해 수행된 청취 평가의 결과도 함께 보이고 있다.

윤곽선 기반 메쉬 최적화를 이용한 효율적인 스테레오 영상 데이터 표현 (Efficient Data Representation of Stereo Images Using Edge-based Mesh Optimization)

  • 박일권;변혜란
    • 방송공학회논문지
    • /
    • 제14권3호
    • /
    • pp.322-331
    • /
    • 2009
  • 본 논문은 윤곽선 기반 메쉬 최적화를 이용한 스테레오 영상의 효율적인 데이터 표현 방법을 제안한다. 스테레오 영상에 대한 메쉬 기반 2차원 워핑은 주로 제어점 선택과 선택된 제어점들의 시차 정보 추정 성능에 의존한다. 따라서 제안된 방법은 제어점 선택을 위하여 강한 윤곽선과 객체의 경계선만으로 구성된 특징 지도를 생성하고 이를 기반으로 격자형 메쉬를 생성한다. 또한, 지역단위로 2차원 워핑을 수행하며 목적영상과의 오차를 최소로 하는 제어점의 위치를 반복적으로 추정하게 된다. 최적화된 제어점 위치를 찾기 위한 반복적 2차원 워핑 과정은 많은 계산 시간을 요구하기 때문에 이를 개선하기 위하여 입력된 스테레오 영상은 수평 시차만 존재하고 최적의 제어점 위치는 객체의 경계선을 포함한 윤곽선 위에 존재함을 가정한다. 따라서 제안한 윤곽선 기반 워핑 방법은 수평선 위에 윤곽선만을 따라 반복적으로 최적화된 제어점 위치를 탐색한다. 본 논문의 실험에서는 스테레오 영상에 대하여 제어점 수에 따른 신호에 대한 잡음비(PSNR)를 측정하여 기존 방법과 제안한 방법의 품질을 비교 하였다. 뿐만 아니라 최적의 메쉬 생성을 위한 수행시간을 비교하여 평가하였다. 실험 결과를 통하여 제안한 방법은 적은 수의 제어점을 이용하여 품질의 저하를 줄이고 빠르게 최적의 메쉬를 생성함으로써 효율적인 스테레오 영상 표현 방법을 제공하였다.

제로트리 기법을 이용한 스테레오 영상 부호화 (Stereo Image Coding Using Zerotree)

  • 배진우;신철;유지상
    • 한국통신학회논문지
    • /
    • 제26권12A호
    • /
    • pp.2092-2099
    • /
    • 2001
  • 스테레오 영상을 이용하여 3차원 영상 시스템을 구성할 때 많은 양의 정보량이 발생하게 된다. 이 정보량을 줄이기 위해 스테레오 영상에 존재하는 영상간의 과잉정보(redundancy)를 줄임으로써 효율적으로 압축하는 방법이 많이 이용되어 왔다. 본 논문에서는 입체 영상 시스템 중 원 영상과 오타영상(residual image)에 대한 효율적인 압축방법을 주로 연구하였으며 기준영상과 오타영상에 대해 저 비트에서도 양질의 영상품질을 얻을 수 있는 제로트리 기법을 이용하여 새로운 기법을 제안하였다. 제로트리 기법을 이용할 경우 압축 성능과 효율이 좋은 반면, 계산량이 증가한다는 단점이 있는데 이것을 보완하기 위해 변이추정 방법은 ADLS 방식을 적용하였다. 웨이블릿을 기반으로 하는 제로트리 기법을 이용하여 영상의 압축 효율을 향상시킴으로써 제한된 대역폭 내에서 높은 영상품질을 보존 할 수 있다는 것을 실험을 통하여 보였다.

  • PDF

지하철 사고 감시를 위한 스테레오 비디오 부호화 기법 (Stereoscopic Video Coding for Subway Accident Monitoring System)

  • 오세찬;김길동;박성혁
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.484-486
    • /
    • 2005
  • Passenger safety is a primary concern of railway system but, it has been urgent issue that dozens of people are killed every year when they falloff from train platforms. Recently, advancements in IT have enabled applying vision sensors to railway environments, such as CCTV and stereo camera sensors. In this paper, we propose a stereoscopic video coding scheme for subway accident monitoring system. The proposed scheme is designed for providing flexible video among various displays, such as control center, station employees and train driver. We uses MPEG-2 standard for coding the left-view sequence and IBMDC for predicting the P- and B-types of frames of the right-view sequence. IBMDC predicts matching block by interpolating both motion and disparity predicted macroblocks. To provide efficient stereoscopic video service. we define both temporally and spatially scalable layers for each eye's-view by using the concept of Spatio-Temporal scalability. According to the experimental results. we expect the proposed functionalities will play a key role in establishing highly flexible stereoscopic video codec for ubiquitous display environment where devices and network connections are heterogeneous.

  • PDF