• 제목/요약/키워드: 3D video coding

검색결과 193건 처리시간 0.025초

3차원 시각 주의 모델과 이를 이용한 무참조 스테레오스코픽 비디오 화질 측정 방법 (3D Visual Attention Model and its Application to No-reference Stereoscopic Video Quality Assessment)

  • 김동현;손광훈
    • 전자공학회논문지
    • /
    • 제51권4호
    • /
    • pp.110-122
    • /
    • 2014
  • 최근 사용자에게 직접 입체감을 제공하는 3차원 영상기술에 대한 관심이 증대함에 따라 스테레오스코픽 비디오 화질 측정기술개발은 중요한 주제로 많은 연구자에게 관심을 받고 있다. 특히, 스테레오스코픽 비디오 화질 측정에 중요한 역할을 하는 인간시각특성을 고려한 연구가 활발히 진행되지 않고 있어 본 논문에서 스테레오스코픽 비디오를 시청할 때 자극되는 다수의 인간시각특성 요소인 깊이, 움직임, 컬러, 휘도, 대조 등을 고려하여 3차원 시각 주의 모델을 제안한다. 또한, 본 논문에서는 실제 3차원 영상 특정 영역의 화질 열화 정도를 측정하는데 제안된 3차원 시각 주의 모델을 사용하여 무참조 스테레오스코픽 비디오 화질 측정 방법을 제안하였다. 제안 방법을 검증하기 위해 주관평가를 실시하여 기존의 스테레오스코픽 비디오 화질 측정 방법보다 평균 평가점에서 더 높은 연관성을 보였다. 게다가, 3차원 시각 주의 모델을 이용하여 스테레오스코픽 비디오의 관심영역 추출 결과는 공간적, 시간적 요소를 고려하여 추출된 관심영역에 비해 실제 관심영역과 더욱 유사함을 주관적으로 보여 제안 방법의 효율성을 보였다.

Complexity Analysis of Internet Video Coding (IVC) Decoding

  • Park, Sang-hyo;Dong, Tianyu;Jang, Euee S.
    • Journal of Multimedia Information System
    • /
    • 제4권4호
    • /
    • pp.179-188
    • /
    • 2017
  • The Internet Video Coding (IVC) standard is due to be published by Moving Picture Experts Group (MPEG) for various Internet applications such as internet broadcast streaming. IVC aims at three things fundamentally: 1) forming IVC patents under a free of charge license, 2) reaching comparable compression performance to AVC/H.264 constrained Baseline Profile (cBP), and 3) maintaining computational complexity for feasible implementation of real-time encoding and decoding. MPEG experts have worked diligently on the intellectual property rights issues for IVC, and they reported that IVC already achieved the second goal (compression performance) and even showed comparable performance to even AVC/H.264 High Profile (HP). For the complexity issue, however, there has not been thorough analysis on IVC decoder. In this paper, we analyze the IVC decoder in view of the time complexity by evaluating running time. Through the experimental results, IVC is 3.6 times and 3.1 times more complex than AVC/H.264 cBP under constrained set (CS) 1 and CS2, respectively. Compared to AVC/H.264 HP, IVC is 2.8 times and 2.9 times slower in decoding time under CS1 and CS2, respectively. The most critical tool to be improved for lightweight IVC decoder is motion compensation process containing a resolution-adaptive interpolation filtering process.

계층적 깊이 영상으로 표현된 다시점 비디오에 대한 H.264 부호화 기술 (H.264 Encoding Technique of Multi-view Video expressed by Layered Depth Image)

  • 신종홍;지인호
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.43-51
    • /
    • 2014
  • 깊이 영상을 고려한 다시점 비디오는 매우 많은 양의 데이터 때문에 저장과 전송을 위해서 새로운 부호화 압축 기술 개발이 요구된다. 계층적 깊이 영상은 다시점 비디오의 효과적인 표현방법이 된다. 이 방법은 다시점 칼라와 깊이 영상을 합성하는 데이터 구조를 만들어 준다. 이 새로운 콘텐츠를 효과적으로 압축하는 방법으로 3차원 워핑을 이용한 계층적 깊이 영상 표현과 비디오 압축 부호화를 적용하는 방법을 제안하였다. 이 논문은 계층적 영상 표현을 사용한 H.264/AVC 비디오 부호화 기술의 개선된 압축 방법을 제시하여 준다. 컴퓨터 모의시험으로 좋은 압축율과 좋은 성능의 회복 영상을 얻을 수 있음을 제시하였다.

A Cross-Layer Unequal Error Protection Scheme for Prioritized H.264 Video using RCPC Codes and Hierarchical QAM

  • Chung, Wei-Ho;Kumar, Sunil;Paluri, Seethal;Nagaraj, Santosh;Annamalai, Annamalai Jr.;Matyjas, John D.
    • Journal of Information Processing Systems
    • /
    • 제9권1호
    • /
    • pp.53-68
    • /
    • 2013
  • We investigate the rate-compatible punctured convolutional (RCPC) codes concatenated with hierarchical QAM for designing a cross-layer unequal error protection scheme for H.264 coded sequences. We first divide the H.264 encoded video slices into three priority classes based on their relative importance. We investigate the system constraints and propose an optimization formulation to compute the optimal parameters of the proposed system for the given source significance information. An upper bound to the significance-weighted bit error rate in the proposed system is derived as a function of system parameters, including the code rate and geometry of the constellation. An example is given with design rules for H.264 video communications and 3.5-4 dB PSNR improvement over existing RCPC based techniques for AWGN wireless channels is shown through simulations.

H.263의 화질 개선을 위한 적응 양자화기 설계 (The Design of Adaptive Quantizer to Improve Image Quality of the H.263)

  • 신경철;이광형
    • 한국음향학회지
    • /
    • 제18권6호
    • /
    • pp.77-83
    • /
    • 1999
  • H.263은 영상전화, 영상회의 등의 서비스를 64Kbps 이하 전송로에서 가능하게 하는 ITU-T의 국제 표준이다. 이 권고안에서는 움직임 추정/보상, 변환 부호화, 양자화방법을 기본으로 사용하고 있다. H.263의 성능평가에 사용된 TMN5는 변환부호화 방법으로 DCT를 사용하고, DCT 변환계수를 양자화하기 위한 양자화기가 제시되고 있다. 본 논문에서는 TMN5의 구조를 그대로 유지하면서 인간 시각 특성을 고려하여 DCT 계수를 효과적으로 양자화할 수 있는 적응 양자화기를 제안한다. 제안된 DCT 기반 H.263의 양자화기는 같은 전송 속도에서 TMN5보다 더 많은 프레임을 전송 처리함으로 화면 드롭현상을 줄일 수 있었다. 또한 객관적 화질 평가를 위한 평균 PSNR에서 TMN5보다 휘도 신호는 -0.3 ~ +0.7dB의 차이를 보이고 색차 신호에서는 1.5dB 정도의 개선을 나타냈다. 결과적으로 주관적 화질평가에서는 TMN5에 비하여 더욱 선명한 화질의 영상을 얻을 수 있었다.

  • PDF

3DTV를 위한 다시점 동영상 부호화 기법 (Multi-view Video Codec for 3DTV)

  • 배진우;송혁;유지상
    • 한국통신학회논문지
    • /
    • 제31권3A호
    • /
    • pp.337-344
    • /
    • 2006
  • 본 논문에서는 3DTV를 위한 다시점 동영상 부호화 기법을 제안한다. 제안하는 기법에서는 다수의 카메라 입력에 대하여 기존의 MPEG 기반의 부호화 기법에서 사용된 시 공간적 중복성 제거 뿐 아니라 각 시점에 해당하는 영상간의 공간적 중복성을 제거하여 부호화 효율을 재선할 수 있다. 각 시점 영상간의 공간적 중복성을 효율적으로 제거하기 위하여 전역 시차 보상(global disparity compensation)된 집적영상(assembled image)을 사용하였다. 또한 기존의 디지털 TV 전송 표준인 MPEG-2를 기반으로 하였기 때문에 기존의 디지털 TV 표준을 크게 수정하지 않고 3DTV를 구현할 수 있을 뿐만 아니라 각 시점간의 동기화 문제도 해결할 수 있다. 제안하는 기법은 MPEG-2 기법으로 각 시점에 해당하는 영상을 독립적으로 부호화(simulcast 기법)한 결과와 비교하여 객관적 화질 면에서 우수한 결과를 보였으며, 평행식 카메라 구조로 획득된 영상과 유사한 디지털 홀로그램 부호화에도 적용하여 우수한 성능을 얻을 수 있었다.

몰입형 비디오 부호화를 위한 패치 패킹 정보의 효율적인 표현 (Efficient Representation of Patch Packing Information for Immersive Video Coding)

  • 임성균;윤용욱;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.126-128
    • /
    • 2021
  • MPEG(Moving Picture Experts Group) 비디오 그룹은 사용자에게 움직임 시차(motion parallax)를 제공하면서 3D 공간 내에서 임의의 위치와 방향의 시점(view)을 렌더링(rendering) 가능하게 하는 6DoF(Degree of Freedom)의 몰입형 비디오 부호화 표준인 MIV(MPEG Immersive Video) 표준화를 진행하고 있다. MIV 표준화 과정에서 참조 SW 인 TMIV(Test Model for Immersive Video)도 함께 개발하고 있으며 점진적으로 부호화 성능을 개선하고 있다. TMIV 는 여러 뷰로 구성된 방대한 크기의 6DoF 비디오를 압축하기 위하여 입력되는 뷰 비디오들 간의 중복성을 제거하고 남은 영역들은 각각 개별적인 패치(patch)로 만든 후 아틀라스에 패킹(packing)하여 부호화되는 화소수를 줄인다. 이때 아틀라스 비디오에 패킹된 패치들의 위치 정보를 메타데이터로 압축 비트열과 함께 전송하게 되며, 본 논문에서는 이러한 패킹 정보를 보다 효율적으로 표현하기 위한 방법을 제안한다. 제안방법은 기존 TMIV10.0 에 비해 약 10%의 메타데이터를 감소시키고 종단간 BD-rate 성능을 0.1% 향상시킨다.

  • PDF

몰입형 비디오 부호화의 아틀라스 생성을 위한 홀 채움 기법 (A Method of Hole Filling for Atlas Generation in Immersive Video Coding)

  • 임성균;이광순;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.75-77
    • /
    • 2021
  • MPEG 비디오 그룹은 제한된 3D 공간 내에서 움직임 시차(motion parallax)를 제공하면서 원하는 시점(view)을 렌더링(rendering)하기 위한 표준으로 TMIV(Test Model for Immersive Video)라는 테스트 모델과 함께 효율적인 몰입형 비디오의 부호화를 위한 MIV(MPEG Immersive Video) 표준을 개발하고 있다. 몰입감 있는 시각적 경험을 제공하기 위해서는 많은 수의 시점 비디오가 필요하기 때문에 방대한 양의 비디오를 고효율로 압축하는 것이 불가피하다. TMIV 는 여러 개의 입력 시점 비디오를 소수의 아틀라스(atlas) 비디오로 변환하여 부호화되는 화소수를 줄이게 된다. 아틀라스는 선택된 소수의 기본 시점(basic view) 비디오와 기본 시점으로부터 합성할 수 없는 나머지 추가 시점(additional view) 비디오의 영역들을 패치(patch)로 만들어 패킹(packing)한 비디오이다. 본 논문에서는 아틀라스 비디오의 보다 효율적인 부호화를 위해서 패치 내에 생기는 작은 홀(hole)들을 채우는 기법을 제안한다. 제안기법은 기존 TMIV8.0 에 비해 1.2%의 BD-rate 이 향상된 성능을 보인다.

  • PDF

몰입형 비디오 부호화를 위한 신경망 기반 아틀라스 후처리 필터링 (Neural Network-Based Post Filtering of Atlas for Immersive Video Coding)

  • 임성균;이건우;김정우;윤용욱;김재곤
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.239-241
    • /
    • 2022
  • MIV(MPEG Immersive Video) 표준은 제한된 3D 공간의 다양한 위치의 뷰(view)들을 효율적으로 압축하여 사용자에게 임의의 위치 및 방향에 대한 6 자유도(6DoF)의 몰입감을 제공한다. MIV 의 참조 소프트웨어인 TMIV(Test Model for Immersive Video)에서는 몰입감을 제공하기 위한 여러 시점의 입력 뷰들 간의 중복 영역을 제거하고 남은 영역들을 패치(patch)로 만들어 패킹(packing)한 아틀라스(atlas)를 생성하고 이를 압축 전송한다. 아틀라스 영상은 일반적인 영상 달리 많은 불연속성을 포함하고 있으며 이는 부호화 효율을 크게 저하시키다 본 논문에서는 아틀라스 영상의 부호화 손실을 줄이기 위한 신경망 기반의 후처리 필터링 기법을 제시한다. 제안기법은 기존의 TMIV 와 비교하여 아틀라스의 복원 화질 향상을 보여준다.

  • PDF

HEVC 표준화 동향과 Test-Model Version 1의 구성 및 성능

  • 한우진
    • 방송과미디어
    • /
    • 제15권4호
    • /
    • pp.9-22
    • /
    • 2010
  • 최근 full-HD 3D 방송, UD(ultra-definition) 영상 서비스, mobile device 향 양방향 HD급 화상통신 등 기존 영상 서비스의 품질을 월등히 향상시키고자 하는 연구들이 진행되고 있다. 본 기고에서는 기존 H.264/AVC 영상 압축 표준의 성능을 2배 이상 향상시키는 것을 목표로 진행 중인 새로운 차세대 영상 압축 표준인 HEVC(high-efficiency video coding; MPEG-H/H.265)의 표준화 동향을 소개한다. 또한, 현재 HEVC test-model (HM) version 1을 구성하고 있는 요소 기술들을 결정하기 위해 진행되었던 성능 평가 과정에 대해 간략하게 소개하고, 마지막으로 HM의 전반적 구성 및 현재 성능 수준에 대한 평가결과를 보인다.