통합 검색 | Korea Science

강화학습 기반 몰입형 영상 압축 성능 향상 기법 (Improving immersive video compression efficiency by reinforcement learning)

김동신;오병태
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 추계학술대회
- /
- pp.33-36
- /
- 2021
본 논문에서는 강화학습을 이용하여 몰입형 영상의 압축 효율을 향상시키는 기법을 제안한다. 몰입형 영상이란 3DOF+ 영상 혹은 Point Cloud 영상과 같이 사용자가 직접 체험할 수 있는 영상을 의미한다. 또한 몰입형 영상은 그 특성에 의해 방대한 양의 정보를 가지고 있다. 따라서 이를 압축하기 위한 압축 방법들이 연구되고 있으며, 일반적으로 3D 공간의 영상을 2D 공간으로 사영하는 방식을 사용한다. 하지만 이 과정에서 정보가 존재하지 않는 영역이 생성되며 이는 압축 효율 저하의 원인이 된다. 이러한 문제를 해결하기 위하여 영상의 특성을 반영할 수 있도록 강화학습을 통한 채우기 기법을 제안한다. 실험 결과 제안한 기법이 기존 기법에 비해 좋은 성능을 보임을 확인할 수 있다.
PDF

3DoF+ 비디오의 효율적인 부호화를 위한 보호대역을 사용한 패치 패킹 기법 (A Patch Packing Method Using Guardband for Efficient 3DoF+ Video Coding)

김현호;김용주;김재곤
- 방송공학회논문지
- /
- 제25권2호
- /
- pp.185-191
- /
- 2020
MPEG-I에서는 최대 6자유도(6DoF)를 가지는 몰입형 비디오의 압축 표준화를 진행하고 있다. 360 비디오에 움직임 시차(parallax)를 추가한 것으로 정의되는 3DoF+ 비디오의 가상 공간에서, 원하는 위치와 시점의 장면을 제공하려면 3DoF+ 비디오를 구성하는 여러 뷰(view) 비디오를 사용하여 임의의 원하는 시점의 뷰를 렌더링해야 한다. MPEG-I 비쥬얼 그룹에서는 이러한 3DoF+ 비디오의 효율적인 부호화를 위한 표준화가 진행되고 있으며, TMIV(Test Model for Immersive Video)라는 시험모델을 개발하고 있다. 본 논문은 TMIV에서 패치(patch)를 아틀라스(atlas)에 효율적으로 패킹하여 부호화 성능을 향상시킬 수 있는 패치 패킹 방법을 제안한다. 제안기법은 패킹되는 패치들 간에 보호대역(guardband)을 적용하여 패치 간의 거리를 둠으로써 부호화로 인해 발생할 수 있는 아티팩트(artifact)를 줄여 최종 복원 뷰의 화질을 향상시킨다.
https://doi.org/10.5909/JBE.2020.25.2.185 인용 PDF KSCI KPUBS

MPEG 몰입형 비디오를 위한 Geometry Packing 구현 (Implementing Geometry Packing for MPEG Immersive Video)

정종범;이순빈;류은석
- 방송공학회논문지
- /
- 제27권6호
- /
- pp.861-871
- /
- 2022
실사 및 컴퓨터 그래픽을 표현하는 다수의 몰입형 영상을 효율적으로 부호화하는 표준으로 moving picture experts group (MPEG)에서는 MPEG immersive video (MIV) 표준을 개발하였다. MIV 표준은 다수의 몰입형 영상을 압축하여 다수의 출력 영상인 아틀라스를 생성하나, 다수의 아틀라스를 부호화 후 복호화 시 저사양 장비에서 복호기 간 동기화 문제가 발생할 수 있다. 본 논문은 저사양 및 고사양 장비에 모두 대응하여 적응적 복호기 개수 조절을 위한 geometry packing 기법을 제안하고 구현한다. 제안하는 방법은 MIV의 최신 참조 소프트웨어에서 문제없이 동작함을 확인하였다.
https://doi.org/10.5909/JBE.2022.27.6.861 인용 PDF KSCI KPUBS

View synthesis with sparse light field for 6DoF immersive video

Kwak, Sangwoon;Yun, Joungil;Jeong, Jun-Young;Kim, Youngwook;Ihm, Insung;Cheong, Won-Sik;Seo, Jeongil
- ETRI Journal
- /
- 제44권1호
- /
- pp.24-37
- /
- 2022
Virtual view synthesis, which generates novel views similar to the characteristics of actually acquired images, is an essential technical component for delivering an immersive video with realistic binocular disparity and smooth motion parallax. This is typically achieved in sequence by warping the given images to the designated viewing position, blending warped images, and filling the remaining holes. When considering 6DoF use cases with huge motion, the warping method in patch unit is more preferable than other conventional methods running in pixel unit. Regarding the prior case, the quality of synthesized image is highly relevant to the means of blending. Based on such aspect, we proposed a novel blending architecture that exploits the similarity of the directions of rays and the distribution of depth values. By further employing the proposed method, results showed that more enhanced view was synthesized compared with the well-designed synthesizers used within moving picture expert group (MPEG-I). Moreover, we explained the GPU-based implementation synthesizing and rendering views in the level of real time by considering the applicability for immersive video service.
https://doi.org/10.4218/etrij.2021-0205 인용 PDF KSCI

MPEG 몰입형 비디오를 위한 클러스터 기반 MV-HEVC 부호화 모드 결정 (Cluster-based MV-HEVC Coding Mode Decision for MPEG Immersive Video)

한창희;정종범;류은석
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 추계학술대회
- /
- pp.189-192
- /
- 2021
three degree of freedom (3DoF), three degree of freedom plus (3DoF+), six degree of freedom(6DoF) 등 몰입형 비디오의 높은 몰입감을 제공하기 위해 다중 비디오 영상을 효율적으로 처리하는 기법이 활발히 연구되고 있다. 이를 위해 원본의 몰입형 비디오가 입력되면 기본 시점 영상과 추가 시점 영상에서의 중복을 제거하고 기본 시점(basic view)에서는 보이지 않지만 추가 시점(additional view)에서는 보이는 영역을 추출하는 프루닝 과정이 이뤄지는 부호기에서의 부호화 모드 결정은 매우 중요하다. 본 논문은 test model for immersive video (TMIV)의 모드 중 하나인 MPEG immersive video (MIV) view mode 를 통해 만들어진 프루닝 (pruning) 그래프에서 선택된 시점들을 활용하여 뷰 간 중복성을 제거할 수 있는 효율적인 부호화 구조로 클러스터를 기반으로 병렬적으로 부호화하는 클러스터 기반 정렬 기법을 제안한다. 선택된 시점들을 인덱스 순서에 따라 부호화하는 기존 방법에 비해 제안하는 방법은 peak signal-to-noise ratio (Y-PSNR)에서 평균 3.9%의 BD-rate 절감을 보여주었다. 본 연구는 또한 더 객관적인 품질 측정을 위해 immersive video peak signal-to-noise ratio (IV-PSNR)에 의한 비교 결과도 함께 제공하며, 참조 순서에 맞게 정렬한 프루닝 기반 정렬 기법과의 비교도 함께 제공한다.
PDF

실감형 360도 영상 특징점 기술 강인성 지표에 관한 연구 (A Study on Fingerprinting Robustness Indicators for Immersive 360-degree Video)

김영모;박병찬;장세영;유인재;이재청;김석윤
- 전기전자학회논문지
- /
- 제24권3호
- /
- pp.743-753
- /
- 2020
본 논문에서는 실감형 360도 영상의 특징점 기술의 강인성 지표를 제안한다. 이동통신사의 5G 서비스가 본격적으로 서비스됨에 따라 언제 어디서든지 대용량의 실감형 360도 영상저작물을 빠른 속도로 이용할 수 있게 되었다. 그러나 DRM 해체 및 각종 영상 변형을 통해 웹하드, 토렌트 등에서 불법 유통되고 있어 저작권 보호를 위한 강인성이 지원되는 필터링 기술이 요구되고 있다. 본 논문에서는 기존 2D 영상의 강인성 지표를 응용하고 실감형 360도 영상저작물의 특징인 투영방법 및 재생 방법을 고려한 강인성 지표를 제안하였다. 본 제안을 샘플 필터링 시스템에 대하여 적용하여 성능평가를 실시하였고 약 3초대의 실행시간에서 95% 이상의 우수한 인식률을 확인하였다.
https://doi.org/10.7471/ikeee.2020.24.3.743 인용 PDF KSCI

MPEG Immersive Video 를 위한 그룹 기반 적응적 스트리밍 (Towards Group-based Adaptive Streaming for MPEG Immersive Video)

정종범;이순빈;최재열;이광순;곽상운;정원식;이봉호;류은석
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 추계학술대회
- /
- pp.54-57
- /
- 2022
다수의 색상 및 거리 정보로 구성된 몰입형 영상 부호화를 위한 MPEG immersive video (MIV) 표준은 각 시점의 영상 간 중복성 제거 및 잔여 영상 병합을 통한 압축률 향상을 목표로 한다. 시점에 따른 카메라 그룹핑을 통해 압축률 향상이 가능하나, 그룹 기반 MIV 부호화 기술은 최근 활발히 논의되고 있지 않다. 따라서 본 논문은 최신 버전의 MIV 참조 소프트웨어에 그룹 기반 부호화 기술을 이식하고 적응적 스트리밍을 위한 그룹 기반 부호화 기술의 효율을 검증하였다.
PDF

몰입형 비디오 부호화를 위한 패치 패킹 정보의 효율적인 표현 (Efficient Representation of Patch Packing Information for Immersive Video Coding)

임성균;윤용욱;김재곤
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 추계학술대회
- /
- pp.126-128
- /
- 2021
MPEG(Moving Picture Experts Group) 비디오 그룹은 사용자에게 움직임 시차(motion parallax)를 제공하면서 3D 공간 내에서 임의의 위치와 방향의 시점(view)을 렌더링(rendering) 가능하게 하는 6DoF(Degree of Freedom)의 몰입형 비디오 부호화 표준인 MIV(MPEG Immersive Video) 표준화를 진행하고 있다. MIV 표준화 과정에서 참조 SW 인 TMIV(Test Model for Immersive Video)도 함께 개발하고 있으며 점진적으로 부호화 성능을 개선하고 있다. TMIV 는 여러 뷰로 구성된 방대한 크기의 6DoF 비디오를 압축하기 위하여 입력되는 뷰 비디오들 간의 중복성을 제거하고 남은 영역들은 각각 개별적인 패치(patch)로 만든 후 아틀라스에 패킹(packing)하여 부호화되는 화소수를 줄인다. 이때 아틀라스 비디오에 패킹된 패치들의 위치 정보를 메타데이터로 압축 비트열과 함께 전송하게 되며, 본 논문에서는 이러한 패킹 정보를 보다 효율적으로 표현하기 위한 방법을 제안한다. 제안방법은 기존 TMIV10.0 에 비해 약 10%의 메타데이터를 감소시키고 종단간 BD-rate 성능을 0.1% 향상시킨다.
PDF

몰입형 비디오 부호화의 아틀라스 생성을 위한 홀 채움 기법 (A Method of Hole Filling for Atlas Generation in Immersive Video Coding)

임성균;이광순;김재곤
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.75-77
- /
- 2021
MPEG 비디오 그룹은 제한된 3D 공간 내에서 움직임 시차(motion parallax)를 제공하면서 원하는 시점(view)을 렌더링(rendering)하기 위한 표준으로 TMIV(Test Model for Immersive Video)라는 테스트 모델과 함께 효율적인 몰입형 비디오의 부호화를 위한 MIV(MPEG Immersive Video) 표준을 개발하고 있다. 몰입감 있는 시각적 경험을 제공하기 위해서는 많은 수의 시점 비디오가 필요하기 때문에 방대한 양의 비디오를 고효율로 압축하는 것이 불가피하다. TMIV 는 여러 개의 입력 시점 비디오를 소수의 아틀라스(atlas) 비디오로 변환하여 부호화되는 화소수를 줄이게 된다. 아틀라스는 선택된 소수의 기본 시점(basic view) 비디오와 기본 시점으로부터 합성할 수 없는 나머지 추가 시점(additional view) 비디오의 영역들을 패치(patch)로 만들어 패킹(packing)한 비디오이다. 본 논문에서는 아틀라스 비디오의 보다 효율적인 부호화를 위해서 패치 내에 생기는 작은 홀(hole)들을 채우는 기법을 제안한다. 제안기법은 기존 TMIV8.0 에 비해 1.2%의 BD-rate 이 향상된 성능을 보인다.
PDF

몰입형 비디오 부호화를 위한 신경망 기반 아틀라스 후처리 필터링 (Neural Network-Based Post Filtering of Atlas for Immersive Video Coding)

임성균;이건우;김정우;윤용욱;김재곤
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 하계학술대회
- /
- pp.239-241
- /
- 2022
MIV(MPEG Immersive Video) 표준은 제한된 3D 공간의 다양한 위치의 뷰(view)들을 효율적으로 압축하여 사용자에게 임의의 위치 및 방향에 대한 6 자유도(6DoF)의 몰입감을 제공한다. MIV 의 참조 소프트웨어인 TMIV(Test Model for Immersive Video)에서는 몰입감을 제공하기 위한 여러 시점의 입력 뷰들 간의 중복 영역을 제거하고 남은 영역들을 패치(patch)로 만들어 패킹(packing)한 아틀라스(atlas)를 생성하고 이를 압축 전송한다. 아틀라스 영상은 일반적인 영상 달리 많은 불연속성을 포함하고 있으며 이는 부호화 효율을 크게 저하시키다 본 논문에서는 아틀라스 영상의 부호화 손실을 줄이기 위한 신경망 기반의 후처리 필터링 기법을 제시한다. 제안기법은 기존의 TMIV 와 비교하여 아틀라스의 복원 화질 향상을 보여준다.
PDF

검색결과 129건 처리시간 0.02초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)