• Title/Summary/Keyword: 예측부호화

Search Result 688, Processing Time 0.029 seconds

Adaptive Reference Picture Selection Method using Motion Information in H.264 (움직임 정보를 이용한 H.264에서의 적응적 참조 화면 선택 기법)

  • Gwon, Hyeok-Min;Choe, Yun-Sik
    • Proceedings of the KIEE Conference
    • /
    • 2003.11b
    • /
    • pp.343-346
    • /
    • 2003
  • 본 논문에서는 최신 동영상 압축 표준 규격 H.264에서 화면 간 예측 부호화시 참조 화면 수가 제한되어 있을 때 부호화 효율을 최대화할 수 있는 적웅적 참조 화면 선택 기법을 제안하였다. 참조 화면 선택 시 시간적인 거리를 우선시 하는 현재 방식은 부호화 효율 측면에서 최적의 선택과는 거리가 있다. 따라서 참조 화면 선택에 있어서 실시간 온라인 상황을 가정하고 부가적인 계산을 최소화하는 것을 조건으로 했을 때 대표 화면과의 간접 비교를 통하여 현재 참조 화면들 간 상호 유사성이 가장 큰 화면을 제외하는 방법을 통해 문제를 해결하고자 하였다. 화면 간 예측 부호화 시 참조 화면 간 중복되는 요소를 최대한 줄이는 방향으로 참조 화면을 선택해 나감으로서 참조되는 샘플들을 다양화할 수 있다. 참조 화면 간 상호 유사성 판별은 대표 화면과 각 참조 화면 간 움직임 정보를 고려해 화면 간 부호화시 계산되는 8*8 블록의 R-D 비용함수 값을 사용하였다. 실험 결과 기존의 슬라이딩 윈도우 방식을 이용한 참조 화면 선택 방법에 비해 부가적인 계산이 거의 없이 부호화 효율의 개선이 있었으며 그 개선 정도는 기존의 방식에서 참조 화면을 $1{\sim}2$장 더 사용한 결과와 같았다. 이는 기존의 방법에 의해 참조 화면을 선택할 경우 나타나는 참조 화면 간 중복성을 줄였기 때문이다.

  • PDF

Non-Reference P Frame Coding in Multiple Reference Frames of Internet Video Coding (IVC 의 다중참조 프레임에서의 비참조 P 프레임 부호화 기법)

  • Kim, Dong-Hyun;Kim, Jae-Gon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2014.06a
    • /
    • pp.262-263
    • /
    • 2014
  • 현재 MPEG 에서 Royalty-Free 비디오 코덱인 Type-1 표준으로 진행중인 IVC(Internet Video Coding)에서는 저지연 모드(LD: Low-Delay) 부호화 구조에서 비참조 P 프레임 부호화 기법을 적응적으로 사용하여 부호화 이득을 얻고 있다. 비참조 P 프레임 기법은 P 프레임의 타입을 지정하여 고정된 부호화 구조의 비참조 P 프레임을 적용하고 있으나, ITM(IVC Test Model) 9.0 에 구현된 부호화 구조는 다중참조 프레임(MRF: Multiple Reference Frame)을 사용할 때 시간적 예측 거리가 먼 참조 프레임을 먼저 예측하는 단점이 있다. 본 논문에서는 다중참조 프레임에서 기존의 P 프레임 타입 설정을 변경하여 비참조 P 프레임의 부호화 구조를 개선하였다. 실험결과 제안 기법은 시퀀스에 따른 큰 성능 저하 없이 기존 기법 대비 0.6% 정도의 추가적인 비트율 감소로 얻음으로써 비참조 P 프레임 기법이 ITM 9.0 대비 7.9% 정도의 비트율 감소를 얻음을 확인하였다.

  • PDF

Speaker Recognition using LPC cepstrum Coefficients and Neural Network (LPC 켑스트럼 계수와 신경회로망을 사용한 화자인식)

  • Choi, Jae-Seung
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.15 no.12
    • /
    • pp.2521-2526
    • /
    • 2011
  • This paper proposes a speaker recognition algorithm using a perceptron neural network and LPC (Linear Predictive Coding) cepstrum coefficients. The proposed algorithm first detects the voiced sections at each frame. Then, the LPC cepstrum coefficients which have speaker characteristics are obtained by the linear predictive analysis for the detected voiced sections. To classify the obtained LPC cepstrum coefficients, a neural network is trained using the LPC cepstrum coefficients. In this experiment, the performance of the proposed algorithm was evaluated using the speech recognition rates based on the LPC cepstrum coefficients and the neural network.

Adaptive Intra/Inter coding structure of H.264/AVC (H.264/AVC에서 인트라 및 인터블록이 혼합된 코딩 방법)

  • Kim, Min-Jae;Seo, Chan-Won;Han, Jong-Ki
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.11a
    • /
    • pp.106-107
    • /
    • 2010
  • 본 논문에서는 H.264/AVC의 부호화 효율을 향상 시킬 수 있는 방법을 제안하였다. 제안하는 알고리즘은 확장된 매크로 블록에서 향상된 인트라 예측 및 인터 예측 블록 혼합 코딩 방법을 사용한다. 그리고 인터 블록부터 먼저 부호화 및 복호화하여 인트라 예측 시 참조 픽셀로 사용하는 것을 제안한다. 기존의 인트라 예측 방법에서는 현재 블록의 우측 픽셀들과 하단에 위치한 픽셀들을 이용하지 못하기 때문에 예측 정확도가 높지 않았다. 따라서 본 논문에서는 현재 부호화하려는 블록의 상단과 좌측뿐만 아니라 우측 또는 하단의 복호화가 완료된 픽셀을 이용하여, 예측을 수행하는 확장된 인트라 예측 방법을 제안한다. 그리고 실험을 통하여 제안하는 방법이 기존 기술에 비해 효율적인 것을 보인다.

  • PDF

VVC 화면간 예측 부호화 기술

  • Gang, Jeong-Won;Lee, Ha-Hyeon
    • Broadcasting and Media Magazine
    • /
    • v.24 no.4
    • /
    • pp.55-70
    • /
    • 2019
  • VVC(Versatile Video Coding)는 ISO/IEC MPEG과 ITU-T VCEG으로 구성된 JVET(Joint Video Experts Team)에서 개발 중인 새로운 비디오 압축 표준 기술로 HEVC 대비 2배 압축률을 목표로 다양한 기술들이 채택되었다. 본 고에서는 VVC에 채택된 부호화 기술들 가운데 화면간 예측 기술에 대해 설명하고자 한다. VVC는 기존 부호화 표준인 HEVC의 화면간 예측 기술을 확장하고, 복호 과정에서의 움직임 벡터 탐색 및 계산 과정을 통해 전송받은 움직임 벡터를 보정하는 디코더 기반 움직임 벡터 보정 기술들을 채택하였다. 추가로, 확대, 축소, 회전 등과 같은 움직임을 예측할 수 있는 affine 움직임 모델 기반 움직임 예측 기술인 AFFINE 기반 움직임 벡터 예측 기술을 채택하였다. 이러한 기술들의 채택을 통해 VVC는 화면간 예측 정확도를 개선하였다.

Scheme for Reducing HEVC Intra Coding Complexity Considering Video Resolution and Quantization Parameter (비디오 해상도 및 양자화 파라미터를 고려한 HEVC의 화면내 부호화 복잡도 감소 기법)

  • Lee, Hong-Rae;Seo, Kwang-Deok
    • Journal of Broadcast Engineering
    • /
    • v.19 no.6
    • /
    • pp.836-846
    • /
    • 2014
  • To expedite UHD (Ultra High Definition) video service, the HEVC (High-Efficiency Video Coding) technology has recently been standardized and it achieves two times higher compression efficiency than the conventional H.264/AVC. To obtain the improved efficiency, however, it employs many complex methods which need complicated calculation, thereby resulting in a significantly increased computational complexity when compared to that of H.264/AVC. For example, to improve the coding efficiency of intra frame coding, up to 35 intra prediction modes are defined in HEVC, but this results in an increased encoding time than the H.264/AVC. In this paper, we propose a fast intra prediction mode decision scheme which reduces computational complexity by changing the number of intra prediction mode in accordance with the percentage of PU sizes for a given video resolution, and by classifying the 35 intra prediction modes into 4 categories considering video resolution and quantization parameter. The experimental results show that the total encoding time is reduced by about 7% on average at the cost of only 2% increase in BD-rate.

Fast Intra Prediction Mode Decision Algorithm Using Directional Gradients For H.264 (방향성 기울기를 이용한 H.264를 위한 고속 화면내 예측 모드 결정 알고리즘)

  • Han, Hwa-Jeong;Jeon, Yeong-Il;Han, Chan-Hee;Lee, Si-Woong
    • The Journal of the Korea Contents Association
    • /
    • v.9 no.9
    • /
    • pp.1-8
    • /
    • 2009
  • H.264/AVC video coding standard uses the rate distortion optimization method which determines the best coding mode for macroblock(MB) to improve coding efficiency. Whereas RDO selects the best coding mode, it causes the heavy computational burden comparing with previous standards. To reduce the complexity, in this paper, a fast intra prediction mode decision algorithm using directional gradients is proposed. The proposed algorithm is composed of 2-path structure. In the first path, $16{\times}16$ intra prediction mode is determined using directional gradients. In the second path, 3 modes instead of 9 modes are chosen for RDO to decide the best mode for $4{\times}4$ block. Finally, the two modes determined in the two-path decision process are compared to decide the final block mode. Experimental results show that the computation time of the proposed method is decreased to about 77% of the exhaustive mode decision method with negligible quality loss.

Fast CU Decision Algorithm using the Initial CU Size Estimation and PU modes' RD Cost (초기 CU 크기 예측과 PU 모드 예측 비용을 이용한 고속 CU 결정 알고리즘)

  • Yoo, Hyang-Mi;Shin, Soo-Yeon;Suh, Jae-Won
    • Journal of Broadcast Engineering
    • /
    • v.19 no.3
    • /
    • pp.405-414
    • /
    • 2014
  • High Efficiency Video Coding(HEVC) obtains high compression ratio by applying recursive quad-tree structured coding unit(CU). However, this recursive quad-tree structure brings very high computational complexity to HEVC encoder. In this paper, we present fast CU decision algorithm in recursive quad-tree structure. The proposed algorithm estimates initial CU size before CTU encoding and checks the proposed condition using Coded Block Flag(CBF) and Rate-distortion cost to achieve the fast encoding time saving. And, intra mode estimation is also possible to be skipped using the CBF values acquired during the inter PU mode estimations. Experiment results shows that the proposed algorithm saved about 49.91% and 37.97% of encoding time according to the weighting condition.

A fast luminance intra $4{\times}4$ prediction mode decision method by statistical analysis (통계적 분석을 통한 고속 휘도 화면내 $4{\times}4$ 예측 모드 결정 방법)

  • Noh, Dae-Young;Kim, Ji-Eun;Chung, Kwang-Sue;Oh, Seoung-Jun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2011.07a
    • /
    • pp.475-478
    • /
    • 2011
  • 율-왜곡 최적화 기법을 통한 화면내 예측 모드 결정 방법은 부호화 효율이 높지만 복잡도가 크다. 본 논문에서는 H.264/AVC의 율-왜곡 값의 특성을 분석하여 율-왜곡 최적화 기법에 사용되는 예측 모드의 후보를 줄임으로써 보다 빠른 휘도 화면내 $4{\times}4$ 예측 모드 결정 방법을 제안한다. 제안된 방법은 균일한 차분 블록값을 가지는 예측 모드와 균일하지 않은 차분 블록값을 가지는 예측 모드의 통계적 분석을 통해 부호화 속도를 향상시킨다. H.264/AVC의 참조 소프트웨어 JM 14.2와 비교하여 0.04[dB]라는 무시할 수 있는 PSNR의 손실을 가지면서도 0.3[%]의 비트율 절약과 19.6[%]의 부호화 속도 향상을 가져왔다.

  • PDF

Enhanced intra prediction mode decision method for VVC (VVC 부호화기의 화면내 부호화 모드 결정 개선 방법)

  • Yun, ByungJin;Gwon, Daehyeok;Choe, JaeRyun;Choi, Haechul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.11a
    • /
    • pp.191-193
    • /
    • 2019
  • ISO/IEC JTC1 WG11 Moving Picture Expers Group 과 ITU-T SC16 은 Joint Video Experts Team 을 구성하여 차세대 비디오 부호화 표준으로서 Versatile Video Coding(VVC)를 표준화 중이다. VVC 는 현재 블록의 화면내 예측 모드일 가능성이 높은 모드의 집합인 Most Probable Mode(MPM) 리스트를 유도하고, MPM 을 이용하여 효율적으로 화면내 예측 모드를 부호화한다. VVC 참조 소프트웨어는 주변 블록의 화면내 예측 모드가 일치하는지 여부에 따라 1 개 또는 2 개의 모드를 최종 후보 선택을 위한 과정인 Rate-Distortion Optimization(RDO) 과정에 추가한다. 하지만 현재 MPM 은 항상 첫 번째 후보로 Planar 모드가 위치하며 이로 인하여, 주변 블록의 화면내 예측 모드가 RDO 에 추가되지 않는 경우가 존재한다. 따라서 본 논문은 VVC 의 부호화기에서 주변 블록의 화면내 예측 모드가 고려되지 않는 경우가 존재하는 문제를 해결하기 위한 방법을 제안한다. 제안 방법은 MPM 유도 과정에서 RDO 에 포함할 후보의 개수를 수정하여 RDO 과정에 항상 주변 블록의 화면내 예측 모드가 추가되도록 한다. 본 논문은 실험을 통해 제안 방법이 약 0.04%의 부호화 효율을 향상시켰음을 보인다.

  • PDF