• 제목/요약/키워드: Inter Mode Prediction

검색결과 78건 처리시간 0.024초

Enhanced Inter Mode Decision Based on Contextual Prediction for P-Slices in H.264/AVC Video Coding

  • Kim, Byung-Gyu;Song, Suk-Kyu
    • ETRI Journal
    • /
    • 제28권4호
    • /
    • pp.425-434
    • /
    • 2006
  • We propose a fast macroblock mode prediction and decision algorithm based on contextual information for Pslices in the H.264/AVC video standard, in which the mode prediction part is composed of intra and inter modes. There are nine $4{\times}4$ and four $16{\times}16$ modes in the intra mode prediction, and seven block types exist for the best coding gain based on rate-distortion optimization. This scheme gives rise to exhaustive computations (search) in the coding procedure. To overcome this problem, a fast inter mode prediction scheme is applied that uses contextual mode information for P-slices. We verify the performance of the proposed scheme through a comparative analysis of experimental results. The suggested mode search procedure increased more than 57% in speed compared to a full mode search and more than 20% compared to the other methods.

  • PDF

지역 통계를 이용한 H.264/AVC의 고속 인터 모드 예측 (A fast Inter Mode Decision Based on Local Statistics in H.264/AVC)

  • 이동식;김영모
    • 한국멀티미디어학회논문지
    • /
    • 제10권8호
    • /
    • pp.997-1003
    • /
    • 2007
  • H.264/AVC는 프레임 간 움직임 추정에서 새로운 인트라 모드(intra mode)와 인터 모드(inter mode) 방식을 도입하여 프레임 간 압축률을 높이고 있다. 이들 두 모드들은 가변 크기 블록 모드를 사용하고 있으며 H.264 인코더는 이들 새로운 예측 모드들을 사용하여 이전 표준안들에 비해 뛰어난 압축률과 유연성을 제공해 준다. 그러나 압축률과 유연성에서 이득을 보는 대신, 이들 두 예측으로 인해 복잡도가 증가하고 부호화 시간을 많이 요구하게 되었다. 본 논문에서는 결과 인트라 모드, 움직임 벡터와 모드 맵의 지역 통계를 사용하여 인터 모드를 예측하는 기법을 제안한다. 인트라와 인터 모드는 선택되는 블록 크기에서 연관성을 보이고 있으며, 영상 내용의 stationary에 따라 주변 매크로 블록의 결과 모드와 움직임 벡터를 이용하여 매크로 블록의 인터 모드를 예측할 수 있다. 본 논문의 결과에서는 다양한 비트율과 여덟 개의 영상 열에서 FMD와 비교하여 PSNR과 비트 율에서 거의 비슷하면서 평균 39.43%의 부호화 시간을 감소시키는 것을 보여 주고 있다.

  • PDF

A Fast Intra Skip Detection Algorithm for H.264/AVC Video Encoding

  • Kim, Byung-Gyu;Kim, Jong-Ho;Cho, Chang-Sik
    • ETRI Journal
    • /
    • 제28권6호
    • /
    • pp.721-731
    • /
    • 2006
  • A fast intra skip detection algorithm based on the ratedistortion (RD) cost for an inter frame (P-slices) is proposed for H.264/AVC video encoding. In the H.264/AVC coding standard, a robust rate-distortion optimization technique is used to select the best coding mode and reference frame for each macroblock (MB). There are three types of intra predictions according to profiles. These are $16{\times}16$ and $4{\times}4$ intra predictions for luminance and an $8{\times}8$ intra prediction for chroma. For the high profile, an $8{\times}8$ intra prediction has been added for luminance. The $4{\times}4$ prediction mode has 9 prediction directions with 4 directions for $16{\times}16$ and $8{\times}8$ luma, and $8{\times}8$ chrominance. In addition to the inter mode search procedure, an intra mode search causes a significant increase in the complexity and computational load for an inter frame. To reduce the computational load of the intra mode search at the inter frame, the RD costs of the neighborhood MBs for the current MB are used and we propose an adaptive thresholding scheme for the intra skip extraction. We verified the performance of the proposed scheme through comparative analysis of experimental results using joint model reference software. The overall encoding time was reduced up to 32% for the IPPP sequence type and 35% for the IBBPBBP sequence type.

  • PDF

Efficient Inter Prediction Mode Decision Method for Fast Motion Estimation in High Efficiency Video Coding

  • Lee, Alex;Jun, Dongsan;Kim, Jongho;Choi, Jin Soo;Kim, Jinwoong
    • ETRI Journal
    • /
    • 제36권4호
    • /
    • pp.528-536
    • /
    • 2014
  • High Efficiency Video Coding (HEVC) is the most recent video coding standard to achieve a higher coding performance than the previous H.264/AVC. In order to accomplish this improved coding performance, HEVC adopted several advanced coding tools; however, these cause heavy computational complexity. Similar to previous video coding standards, motion estimation (ME) of HEVC requires the most computational complexity; this is because ME is conducted for three inter prediction modes - namely, uniprediction in list 0, uniprediction in list 1, and biprediction. In this paper, we propose an efficient inter prediction mode (EIPM) decision method to reduce the complexity of ME. The proposed EIPM method computes the priority of all inter prediction modes and performs ME only on a selected inter prediction mode. Experimental results show that the proposed method reduces computational complexity arising from ME by up to 51.76% and achieves near similar coding performance compared to HEVC test model version 10.1.

3차원 비디오 압축에서의 다시점 부호화를 위한 적응적 시공간적 예측 부호화 (Adaptive Spatio-Temporal Prediction for Multi-view Coding in 3D-Video)

  • 성우철;이영렬
    • 방송공학회논문지
    • /
    • 제9권3호
    • /
    • pp.214-224
    • /
    • 2004
  • 본 논문에서는 차세대 실감형 3차원 영상 처리와 3차원 TV 3차원 화상회의 등과 같은 3차원 실감 미디어의 부호화에 적합한 H.264 기반의 적응적 시공간적 예측 부호화를 제안한다. 첫 번째로, 두 가지의 IPPP와 IBBP GOP(group of picture) 구조에서 기존의 동시방송(simulcast) 방식과 다르게 same-view와 inter-view 영상의 적응적 시공간적 예측 부호화를 제안한다. 두 번째로, GOP 구조가 IBBP에서 제안된 inter-view 방식의 예측 부호화시 B(hi-predictive) 화면이 MB(macroblock) 모드중 하나인 시간적 직접방식(temporal direct mode)을 수행하려고 할 때 참조 화면이 inter-view 영상을 참조하는 경우 현재의 시간적 직접 방식을 효율적으로 수행하기 위해서 2차원 inter-view 직접 방식을 제안한다. 제안된 방식은 실험결과에서 기존의 동시방송 방식과 비교되었으며 각각의 GOP 구조 모두 화질 면에서 우수한 결과를 확인할 수 있었다.

CNN-based Fast Split Mode Decision Algorithm for Versatile Video Coding (VVC) Inter Prediction

  • Yeo, Woon-Ha;Kim, Byung-Gyu
    • Journal of Multimedia Information System
    • /
    • 제8권3호
    • /
    • pp.147-158
    • /
    • 2021
  • Versatile Video Coding (VVC) is the latest video coding standard developed by Joint Video Exploration Team (JVET). In VVC, the quadtree plus multi-type tree (QT+MTT) structure of coding unit (CU) partition is adopted, and its computational complexity is considerably high due to the brute-force search for recursive rate-distortion (RD) optimization. In this paper, we aim to reduce the time complexity of inter-picture prediction mode since the inter prediction accounts for a large portion of the total encoding time. The problem can be defined as classifying the split mode of each CU. To classify the split mode effectively, a novel convolutional neural network (CNN) called multi-level tree (MLT-CNN) architecture is introduced. For boosting classification performance, we utilize additional information including inter-picture information while training the CNN. The overall algorithm including the MLT-CNN inference process is implemented on VVC Test Model (VTM) 11.0. The CUs of size 128×128 can be the inputs of the CNN. The sequences are encoded at the random access (RA) configuration with five QP values {22, 27, 32, 37, 42}. The experimental results show that the proposed algorithm can reduce the computational complexity by 11.53% on average, and 26.14% for the maximum with an average 1.01% of the increase in Bjøntegaard delta bit rate (BDBR). Especially, the proposed method shows higher performance on the sequences of the A and B classes, reducing 9.81%~26.14% of encoding time with 0.95%~3.28% of the BDBR increase.

Efficient Mode Decision Algorithm Based on Spatial, Temporal, and Inter-layer Rate-Distortion Correlation Coefficients for Scalable Video Coding

  • Wang, Po-Chun;Li, Gwo-Long;Huang, Shu-Fen;Chen, Mei-Juan;Lin, Shih-Chien
    • ETRI Journal
    • /
    • 제32권4호
    • /
    • pp.577-587
    • /
    • 2010
  • The layered coding structure of scalable video coding (SVC) with adaptive inter-layer prediction causes noticeable computational complexity increments when compared to existing video coding standards. To lighten the computational complexity of SVC, we present a fast algorithm to speed up the inter-mode decision process. The proposed algorithm terminates inter-mode decision early in the enhancement layers by estimating the rate-distortion (RD) cost from the macroblocks of the base layer and the enhancement layer in temporal, spatial, and inter-layer directions. Moreover, a search range decision algorithm is also proposed in this paper to further increase the motion estimation speed by using the motion vector information from temporal, spatial, or inter-layer domains. Simulation results show that the proposed algorithm can determine the best mode and provide more efficient total coding time saving with very slight RD performance degradation for spatial and quality scalabilities.

H.264/AVC의 빠른 부호화를 위한 효율적인 모드 결정과 탐색영역 제한 (An Efficient Mode Decision and Search Region Restriction for Fast Encoding of H.264/AVC)

  • 천성환;신광무;강진미;정기동
    • 한국멀티미디어학회논문지
    • /
    • 제13권2호
    • /
    • pp.185-195
    • /
    • 2010
  • 본 논문은 H.264/AVC의 빠른 부호화를 위해 인터 및 인트라 예측에서 효율적인 알고리즘을 제안한다. 첫째, 인터 예측모드 결정 방법은 시 공간적 상관성 정보와 픽셀 방향성을 이용하여 빠른 시점에 예측모드를 결정한다. 둘째, 인트라 예측모드 결정 방법은 매크로블록 내 외부의 픽셀값 변화량으로 Smoothness 정도를 판단하여 블록크기를 선택하고, 대표픽셀과 참조픽셀을 이용하여 예측모드를 결정한다. 마지막으로 가변적인 움직임 탐색영역 제한은 주변 블록의 모드 정보와 예측 움직임 벡터를 이용하여 가변적인 탐색영역을 설정하는 방법이다. 실험결과, 제안하는 방법이 기존 JM 14.1과 비교하여 부호화 시간 감소율은 최소 약 18~53% 정도를 보였다. RD 성능 면에서는 PSNR 값의 감소는 거의 없으면서 비트율이 평균 약 4% 정도 근소하게 증가하는 결과를 보였다.

A Fast Inter-prediction Mode Decision Algorithm for HEVC Based on Spatial-Temporal Correlation

  • Yao, Weixin;Yang, Dan
    • Journal of Information Processing Systems
    • /
    • 제18권2호
    • /
    • pp.235-244
    • /
    • 2022
  • Many new techniques have been adopted in HEVC (High efficiency video coding) standard, such as quadtree-structured coding unit (CU), prediction unit (PU) partition, 35 intra-mode, and so on. To reduce computational complexity, the paper proposes two optimization algorithms which include fast CU depth range decision and fast PU partition mode decision. Firstly, depth range of CU is predicted according to spatial-temporal correlation. Secondly, we utilize the depth difference between the current CU and CU corresponding to the same position of adjacent frame for PU mode range selection. The number of traversal candidate modes is reduced. The experiment result shows the proposed algorithm obtains a lot of time reducing, and the loss of coding efficiency is inappreciable.

3D 응용을 위한 다시점 영상 부호화에서 비기준 화면의 빠른 모드결정 기법 (A Fast Mode Decision of Non-anchor Pictures in Multi-view Video Coding for 3D Applications)

  • 정충현;신광무;박성호;정기동
    • 한국멀티미디어학회논문지
    • /
    • 제15권7호
    • /
    • pp.859-869
    • /
    • 2012
  • 다시점 영상 부호화는 시점 간에 변이 정보를 활용하여 부호화 효율을 향상시키기 위해 개발되었다. 하지만 다시점 영상 부호화는 변이 예측 때문에 높은 계산복잡도를 가진다. 본 논문은 다시점 영상 부호화의 계산 시간을 감소시키기 위한 비기준 화면의 빠른 모드결정 기법을 제안한다. 제안하는 기법은 2단계 과정을 수행한다. 계층적인 B 화면 구조의 기준 화면은 비기준 화면의 예측모드 선택과 높은 상관성을 가진다. 따라서 첫 번째 단계에서, 비기준 화면의 예측모드는 기준 화면의 매크로블록 영역을 이용함으로써 선택된다. 두 번째 단계에서, 우리는 7개 블록 크기의 Inter 예측모드의 참조 방향에서 높은 상관성을 이용하여 Inter 예측모드의 참조방향을 선택한다. 제안하는 기법으로 실험한 결과는 부호화 효율에 큰 손실 없이 부호화 시간에서 평균 약 44% 감소시킬 수 있었다.