통합 검색 | Korea Science

CNN-based Fast Split Mode Decision Algorithm for Versatile Video Coding (VVC) Inter Prediction

Yeo, Woon-Ha;Kim, Byung-Gyu
- Journal of Multimedia Information System
- /
- 제8권3호
- /
- pp.147-158
- /
- 2021
Versatile Video Coding (VVC) is the latest video coding standard developed by Joint Video Exploration Team (JVET). In VVC, the quadtree plus multi-type tree (QT+MTT) structure of coding unit (CU) partition is adopted, and its computational complexity is considerably high due to the brute-force search for recursive rate-distortion (RD) optimization. In this paper, we aim to reduce the time complexity of inter-picture prediction mode since the inter prediction accounts for a large portion of the total encoding time. The problem can be defined as classifying the split mode of each CU. To classify the split mode effectively, a novel convolutional neural network (CNN) called multi-level tree (MLT-CNN) architecture is introduced. For boosting classification performance, we utilize additional information including inter-picture information while training the CNN. The overall algorithm including the MLT-CNN inference process is implemented on VVC Test Model (VTM) 11.0. The CUs of size 128×128 can be the inputs of the CNN. The sequences are encoded at the random access (RA) configuration with five QP values {22, 27, 32, 37, 42}. The experimental results show that the proposed algorithm can reduce the computational complexity by 11.53% on average, and 26.14% for the maximum with an average 1.01% of the increase in Bjøntegaard delta bit rate (BDBR). Especially, the proposed method shows higher performance on the sequences of the A and B classes, reducing 9.81%~26.14% of encoding time with 0.95%~3.28% of the BDBR increase.
https://doi.org/10.33851/JMIS.2021.8.3.147 인용 PDF KSCI HTML

스케일러블 비디오 코딩에서 방향성 정보를 이용한 모드 결정 고속화 기법 (Fast Mode Decision Algorithm for Scalable Video Coding (SVC) Using Directional Information of Neighboring Layer)

정현기;홍광수;김병규;김창기;유정주
- 방송공학회논문지
- /
- 제17권1호
- /
- pp.108-121
- /
- 2012
스케일러블 비디오 코딩은 동영상 압축 표준인 H.264/AVC에서 확장된 표준으로써 시간, 공간, 화질적인 측면에서 확장성을 제공하는 부호화 방법이다. 여러 측면에서 제공하는 확장성으로 압축에 대한 효율 등은 좋아졌지만, 상대적으로 복잡도의 큰 증가로 인해 효율적인 사용을 위해서는 복잡도의 감소가 필수적이다. 본 논문에서는 스케일러블 비디오 코딩의 복잡도를 감소시키기 위해서, B-화면에서의 방향성 정보를 이용하여 계층 간 예측을 효율적으로 수행함으로 부호화 과정의 복잡도를 크게 감소시킬 수 있는 모드 결정 고속화 기법을 제안한다. 제안하는 방법은 우선 업-샘플링 (Up-sampling)된 하위 계층의 최적 모드와 이웃한 매크로블록의 최적 모드 정보를 이용하여 간단하게 SKIP 모드를 검색한다. 그런 후 현재 수행하는 매크로블록의 예측에 이웃한 매크로블록의 최적 모드를 사용하게 되는데, 이 때 업-샘플링 된 하위 계층의 최적 모드의 방향성 정보가 순 방향과 역 방향, 양쪽 방향에 따라서 검색 모드 수를 달리하는 방법으로 모드 결정을 고속화하는 방법이다. 이러한 고속화 방법을 수행함으로 얻은 실험 결과는 SVC의 부호화 과정에서 소요되는 시간을 참조 소프트웨어의 원본 대비 53%까지 감소시키며 이에 따른 비트율의 증가나 화질의 열화는 무시할 수 있을 정도로 적음을 실험을 통해 확인한다.
https://doi.org/10.5909/JEB.2012.17.1.108 인용 PDF KSCI

HEVC 화면 내 예측을 위한 FAST 에지 검출 기반의 CU 분할 방법 (CU Depth Decision Based on FAST Corner Detection for HEVC Intra Prediction)

전승수;김남욱;전병우
- 방송공학회논문지
- /
- 제21권4호
- /
- pp.484-492
- /
- 2016
High efficiency video coding (HEVC)은 H.264/AVC와 같은 이전 비디오 압축 표준 보다 더 높은 압축 효율을 갖는 최신 비디오 압축 표준이다. 화면 내 예측에서 최대 압축 단위 (LCU)들은 quadtree 구조를 통해 64x64부터 8x8까지의 크기를 갖는 더 작은 압축 단위 (CU)들로 나누어지고, 이들은 다시 예측 단위 (PU)들로 나누어진다. 가능한 크기까지 CU를 분할하면서 RDO (Rate Distortion Optimization) 과정을 통해 최적의 CU 분할 형태가 선택된다. 이 과정에서 HEVC는 많은 계산량을 필요로 한다. 본 논문에서는 HEVC의 계산량을 줄이기 위해, FAST (Features from Accelerated Segment Test) 코너 검출을 이용하여 화면 내 예측을 위한 고속 CU depth 결정 방법 (FCDD)을 제안한다. 제안하는 방법은 기존의 HEVC와 비교하여 약 0.7%의 BDBR 만큼의 적은 압축 성능 감소와 함께 부호화기에서 약 53.73%의 계산 시간을 감소시켰다.
https://doi.org/10.5909/JBE.2016.21.4.484 인용 PDF KSCI KPUBS HTML

H.264/AVC에서 DCT 계수의 근사화를 이용한 고속 인트라 모드 결정 기법 (Fast Intra Mode Decision for H.264/AVC by Using the Approximation of DCT Coefficient)

라병두;엄민영;최윤식
- 대한전자공학회논문지SP
- /
- 제44권3호
- /
- pp.23-32
- /
- 2007
H.264 영상 부호화 표준은 인트라 예측에서 압축 효율을 향상시키기 위해 율-왜곡 최적화(RDO : Rate Distortion Optimization) 방법을 사용한다. 이러한 방법을 사용함으로써 현재 블록에 대한 최적의 부호화 모드의 선택이 가능해졌지만 복잡도와 연산은 이전대비 더욱 증가하였다. 본 논문은 우세한 에지 방향(DED : Dominant Edge Direction)의 예측을 통한 고속인트라 모드 결정 알고리즘을 제안한다. 이를 위해 이 알고리즘은 이산 코사인 변환(DCT : Discrete Cosine Transform) 계수를 근사화하여 이용한다. DED를 예측함으로써 $4{\times}4$ 휘도 블록의 경우 최적 모드 결정을 위한 율-왜곡 최적화 계산에 9개 모드 중 3개 모드가 선택된다. $16{\times}16$ 휘도 블록과 $8{\times}8$ 색상 블록의 경우 4개 모드 대신에 2개 모드가 최적 모드 결정을 위해 율-왜곡 최적화 계산을 수행한다. 이러한 방법을 이용한 실험 결과 인트라 전체 검색 방법대비 약 72%의 연산시간이 감소하는 결과를 보여준다.
PDF KSCI

다시점 영상 부호화에서 전역 변이 벡터를 이용한 고속 모드 결정 (Fast Mode Decision using Global Disparity Vector for Multi-view Video Coding)

한동훈;조숙희;허남호;이영렬
- 방송공학회논문지
- /
- 제13권3호
- /
- pp.328-338
- /
- 2008
H.264/AVC기반의 다시점 영상 부호화 기술은 시점간 상관성을 이용한 새로운 예측 방법을 이용하여 여러 대의 카메라로부터 촬영된 영상을 효율적으로 부호화하는 기술이다. 그러나 다시점 부호화 기술은 시점의 증가와 시점간 예측의 사용으로 인해 부호화 시간이 크게 증가한다. 본 논문은 부호화 시간을 줄이기 위해 다시점 영상에서 시점간에 대응하는 마크로블록 (Macroblock) 기반 영역 분할 정보와 시점간의 전역 변이 벡터를 이용한 고속 모드 결정 방법을 제안한다. 제안하는 방법은 다시점 영상 부호화 표준의 참조 소프트웨어인 joint multi-view video model (JMVM) 4.0에 비해 약 0.04dB의 화질 열화를 보이지만 전체 부호화 시간을 평균적으로 40% 단축할 수 있었다.
https://doi.org/10.5909/JBE.2008.13.3.328 인용 PDF KSCI

블록 크기 활동도를 이용한 H.264/AVC 부호화 고속 모드 결정 (Fast Mode Decision using Block Size Activity for H.264/AVC)

정봉수;전병우;최광표;오윤제
- 대한전자공학회논문지SP
- /
- 제44권2호
- /
- pp.1-11
- /
- 2007
H.264/AVC의 인터 부호화 기술은, 정교한 움직임 보상 부호화를 위해 다양한 블록 크기의 7가지 모드를, 그리고 인트라 부호화 기술은 2가지의 블록부호화 모드를 사용한다. 이러한 정교한 부호화 기술은 기존 표준에 비해 높은 부호화 효율을 제공 하지만 비트율-왜곡 최적화 기법을 사용할 경우, 많은 계산량을 요구하므로 연산량이 제한된 장치에서는 실시간 구현에 문제점이 발생한다. 따라서 H.264/AVC 부호화 표준의 실시간 구현을 위해서 계산 복잡도를 줄이는 고속 모드 결정법이 필요하다. 본 논문에서 제안한 LBHM(Large Block History Map)을 이용한 블록 크기 활동도 기반 고속 모드 결정 기법은 발생 확률이 낮은 $P8\times8$ 모드를 조기에 생략하여, 부호화 효율의 감소는 최소화 시키면서 H.264/AVC의 전체 부호화 시간을 평균 53% 감소시켰으며, H.264/AVC 참조 모델의 조기 SKIP 모드와 같이 사용할 경우, 전체 부호화 시간을 평균 63% 이상 감소시켰다.
PDF KSCI

H.264/AVC의 인트라 예측에서 예측 블록 크기 정보를 이용한 빠른 예측 모드 결정 기법 (Fast Intra-Prediction Mode Decision Algorithm using Predetermined Prediction Block Size in H.264/AVC)

김영주
- 한국정보통신학회:학술대회논문집
- /
- 한국해양정보통신학회 2009년도 추계학술대회
- /
- pp.211-214
- /
- 2009
H.264/AVC의 인트라 예측에서 미리 현재 블록 내의 정보 및 이전 블록의 예측 모드 정보 등을 이용하여 현재 블록의 예측 부호화 블록 크기가 결정되었을 경우, 예측된 블록 크기에 적합한 예측 모드 결정이 요구된다. 이에 사전에 결정된 예측 블록 크기 정보와 주변 블록과의 화소 변화량을 계산하여 예측 모드를 결정하는 기법을 제안하고 성능을 평가한다.
PDF

HEVC 부호화기에서의 화면 간 예측모드 고속 결정 (Early Decision of Inter-prediction Modes in HEVC Encoder)

한우진;안준형;이종호
- 방송공학회논문지
- /
- 제20권1호
- /
- pp.171-182
- /
- 2015
HEVC는 H.264/AVC에 비해 압축 성능을 크게 개선시킬 수 있지만 부호화기와 복호화기 모두 복잡도가 크게 증가한다. 본 논문에서는 HEVC의 화면 간 예측 모드 결정 과정을 분석하고, 이 결과로부터 부호화기 및 복호화기의 복잡도를 효과적으로 감소시키기 위한 방법을 제안하였다. 제안하는 방법은 단방향 예측 모드의 결과로부터 양방향 예측 모드를 수행하지 않아도 되는 조건을 찾고, 이 조건을 만족하는 경우 미리 종료시킴으로써 부호화 복잡도를 감소시킨다. 실험 결과 압축률 하락 폭이 각각 0.6%, 1.0%, 1.5%인 경우 부호화 복잡도를 12.0%, 14.2%, 17.2% 감소시킬 수 있었으며, 이 때, 양방향 예측 모드의 비율을 각각 6.3%, 11.8%, 16.6% 감소시킴으로써 복호화기의 복잡도도 함께 감소시킬 수 있었다. 마지막으로, 제안한 방법이 HEVC 참조 소프트웨어에 기 적용되어 있는 고속화 알고리즘과 함께 사용되는 경우에도 유사한 효과를 낼 수 있음을 검증하였다.
https://doi.org/10.5909/JBE.2015.20.1.171 인용 PDF KSCI KPUBS HTML

Bayesian-theory-based Fast CU Size and Mode Decision Algorithm for 3D-HEVC Depth Video Inter-coding

Chen, Fen;Liu, Sheng;Peng, Zongju;Hu, Qingqing;Jiang, Gangyi;Yu, Mei
- KSII Transactions on Internet and Information Systems (TIIS)
- /
- 제12권4호
- /
- pp.1730-1747
- /
- 2018
Multi-view video plus depth (MVD) is a mainstream format of 3D scene representation in free viewpoint video systems. The advanced 3D extension of the high efficiency video coding (3D-HEVC) standard introduces new prediction tools to improve the coding performance of depth video. However, the depth video in 3D-HEVC is time consuming. To reduce the complexity of the depth video inter coding, we propose a fast coding unit (CU) size and mode decision algorithm. First, an off-line trained Bayesian model is built which the feature vector contains the depth levels of the corresponding spatial, temporal, and inter-component (texture-depth) neighboring largest CUs (LCUs). Then, the model is used to predict the depth level of the current LCU, and terminate the CU recursive splitting process. Finally, the CU mode search process is early terminated by making use of the mode correlation of spatial, inter-component (texture-depth), and inter-view neighboring CUs. Compared to the 3D-HEVC reference software HTM-10.0, the proposed algorithm reduces the encoding time of depth video and the total encoding time by 65.03% and 41.04% on average, respectively, with negligible quality degradation of the synthesized virtual view.
https://doi.org/10.3837/tiis.2018.04.018 인용 PDF KSCI

지역 통계를 이용한 H.264/AVC의 고속 인터 모드 예측 (A fast Inter Mode Decision Based on Local Statistics in H.264/AVC)

이동식;김영모
- 한국멀티미디어학회논문지
- /
- 제10권8호
- /
- pp.997-1003
- /
- 2007
H.264/AVC는 프레임 간 움직임 추정에서 새로운 인트라 모드(intra mode)와 인터 모드(inter mode) 방식을 도입하여 프레임 간 압축률을 높이고 있다. 이들 두 모드들은 가변 크기 블록 모드를 사용하고 있으며 H.264 인코더는 이들 새로운 예측 모드들을 사용하여 이전 표준안들에 비해 뛰어난 압축률과 유연성을 제공해 준다. 그러나 압축률과 유연성에서 이득을 보는 대신, 이들 두 예측으로 인해 복잡도가 증가하고 부호화 시간을 많이 요구하게 되었다. 본 논문에서는 결과 인트라 모드, 움직임 벡터와 모드 맵의 지역 통계를 사용하여 인터 모드를 예측하는 기법을 제안한다. 인트라와 인터 모드는 선택되는 블록 크기에서 연관성을 보이고 있으며, 영상 내용의 stationary에 따라 주변 매크로 블록의 결과 모드와 움직임 벡터를 이용하여 매크로 블록의 인터 모드를 예측할 수 있다. 본 논문의 결과에서는 다양한 비트율과 여덟 개의 영상 열에서 FMD와 비교하여 PSNR과 비트 율에서 거의 비슷하면서 평균 39.43%의 부호화 시간을 감소시키는 것을 보여 주고 있다.
PDF

검색결과 95건 처리시간 0.027초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)