• 제목/요약/키워드: Rate-distortion optimization (RDO)

검색결과 48건 처리시간 0.02초

Most Probable Mode 와 Rough Mode Decision 비용을 함께 고려하는 HEVC 고속 화면내 부호화 모드 결정 방법 (HEVC Fast Intra Mode Decision based on Most Probable Mode and Rough Mode Decision Cost)

  • 권대혁;한희지;김민섭;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 추계학술대회
    • /
    • pp.141-142
    • /
    • 2015
  • 본 논문에서는 HEVC(High Efficiency Video Coding)을 위한 고속 부호화 알고리즘을 제안한다. 제안 방법은 HEVC 의 화면내 부호화 과정에서 주변 부호화 모드 정보인 MPM(Most Probable Mode)과 RMD(Rough Mode Decision) 과정의 결과로 얻어지는 후보 모드들의 상관관계를 이용하여 높은 계산 복잡도를 가지는 RDO(Rate-Distortion Optimization) 과정이 고려하는 후보의 개수를 줄여 전체 부호화기의 부호화 복잡도를 낮춘다. 실험 결과에서는 제안 방법이 약 0.29% BD-rate 의 부호화 손실만으로 20.43%의 부호화 복잡도를 감소시켰음을 보인다.

  • PDF

JEM 부호화 속도 향상을 위한 고속 CU 결정 방법 (Fast CU Termination Method for Fast Encoding in JEM)

  • 최한솔;이종석;이스마일;박시내;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.180-181
    • /
    • 2018
  • 본 논문에서는 JEM(Joint Exploration Model)의 부호화기 계산 복잡도 감소를 위한 CU 조기 결정 방법을 제시한다. 기존의 JEM 의 경우 현재 CU(Coding Unit)의 RDO(Rate Distortion Optimization)를 통한 최적의 예측 모드가 Merge SKIP 모드이고 BT(Binary Tree)의 깊이가 2 또는 3 이상일 때 CU 결정을 조기 종료한다. 제안하는 방법에서는 현재 CU 의 최적의 예측모드가 Merge SKIP 이고 BT 일 경우 통계적 분석을 통한 왜곡 값, CU 샘플 수, 시간적 계층 순서, 양자화 파라미터를 고려한 문턱 값을 이용하여 CU 를 조기 결정한다. 실험결과로써 제안하는 방법이 JEM 7.1 대비 Y, U, V 각각 평균 0.86%, 0.08%, 0.18%의 BD-rate 손실이 발생하고 평균 16% 부호화 속도를 개선시킨다.

  • PDF

방향성 기울기를 이용한 H.264를 위한 고속 화면내 예측 모드 결정 알고리즘 (Fast Intra Prediction Mode Decision Algorithm Using Directional Gradients For H.264)

  • 한화정;전영일;한찬희;이시웅
    • 한국콘텐츠학회논문지
    • /
    • 제9권9호
    • /
    • pp.1-8
    • /
    • 2009
  • H.264/AVC 표준은 부호화 효율을 향상시키기 위해 각 매크로블록의 최적 부호화 모드를 결정하는 율-왜곡 최적화 기법을 사용한다. 율-왜곡 최적화 기법은 기존의 비디오 압축 표준보다 부호화 효율을 향상시키지만 매크로블록의 최적 부호화 모드를 결정하기 위해서 전체 모드에 대해 율-왜곡 최적화 과정을 수행해야하므로 부호화기의 복잡도가 매우 증가하게 된다. 본 논문에서는 부호화기의 복잡도 감소를 위해서 방향성 기울기를 이용한 고속 화면내 예측 모드 결정 방법을 제안한다. 제안된 알고리즘은 2-경로 구조로 구성되었다. 첫 번째 경로는 방향성 기울기를 계산하여 제안된 예측 모드 결정 방법에 따라 $16{\times}16$ 화면내 예측 모드를 결정한다. 두 번째 경로는 $4{\times}4$ 화면내 예측의 최적 모드를 결정한다. $4{\times}4$ 화면내 예측에서 지원하는 9가지 예측 모드 중 3가지 예측 모드에 RDO 과정이 수행된다. 각 경로에서 결정된 두 가지 모드의 비용을 비교하여 최적 모드를 결정한다. 모의실험을 통해 제안 방식이 참조 소프트웨어와 비교하여 무시할 수 있는 화질 손실과 평균적으로 77%의 계산량을 감소시킬 수 있음을 확인하였다.

H.264 동영상 부호기를 위한 Feedback 버퍼 제어 방식 (A Feedback Buffer Control Algorithm for H.264 Video Coding)

  • 손남례;이귀상
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.625-632
    • /
    • 2004
  • H.264 부호화 기법은 단방향 및 양방향 예측 모드를 채택하고 있으며, 가변 길이 부호화를 사용하기 때문에 비디오 부호기에서 발생되는 데 이터량은 시간에 따라 변한다. 전송채널 용량이 제한된 고정 비트율 부호기에서는 출력 비트량을 제어하기 위해 버퍼가 사용되는데, 버퍼가 넘치거나(overflow) 고갈되는 것(underflow)을 막기 위해 발생 비트량을 적절한 영역 내에서 제한해야 한다. 기존의 비트량 제어방법 에서는 영상데이터의 왜곡 값과 양자화 계수간의 $\lambda_{MODE}$가 정규 값을 벗어나기 때문에 화질이 열화 된다. 본 논문에서는 H.264 동영상의 왜곡 값에 대한 새로운 양자화 계수론 도출하여 피드백 함으로써 버퍼의 넘침이나 고갈을 방지할 수 있는 알고리즘을 제안하였다. 제안한 기법을 6개의 실험데이터에 적용한 견과 PSNR 값은 기존 방법에서와 비슷하면서도 비트율은 최대 8%까지 감소하였다.

Fast Intra-Prediction Mode Decision Algorithm for H.264/AVC using Non-parametric Thresholds and Simplified Directional Masks

  • Kim, Young-Ju
    • Journal of information and communication convergence engineering
    • /
    • 제7권4호
    • /
    • pp.501-506
    • /
    • 2009
  • In the H.264/ AVC video coding standard, the intra-prediction coding with various block sizes offers a considerably high improvement in coding efficiency compared to previous standards. In order to achieve this, H.264/AVC uses the Rate-distortion optimization (RDO) technique to select the best intraprediction mode for a macroblock, and it brings about the drastic increase of the computation complexity of H.264 encoder. To reduce the computation complexity and stabilize the coding performance on visual quality, this paper proposed a fast intra-prediction mode decision algorithm using non-parametric thresholds and simplified directional masks. The use of nonparametric thresholds makes the intra-coding performance not be dependent on types of video sequences and simplified directional masks reduces the compuation loads needed by the calculation of local edge information. Experiment results show that the proposed algorithm is able to reduce more than 55% of the whole encoding time with a negligible loss in PSNR and bitrates and provides the stable performance regardless types of video sequences.

Fast Enhancement Layer Encoding Method using CU Depth Correlation between Adjacent Layers for SHVC

  • Kim, Kyeonghye;Lee, Seonoh;Ahn, Yongjo;Sim, Donggyu
    • 전자공학회논문지
    • /
    • 제50권6호
    • /
    • pp.260-264
    • /
    • 2013
  • This paper proposes a fast enhancement layer coding method to reduce computational complexity for Scalable HEVC (SHVC) which is based on High Efficiency Video Coding (HEVC). The proposed method decreases encoding time by simplifying Rate Distortion Optimization (RDO)for enhancement layers (EL). The simplification is achieved by restricting CU depths based on the correlation of coding unit (CU) depths between adjacent layers and scalability (spatial or quality) of EL. Comparing with the performance of SHM 1.0 software encoder, the proposed method reduces the encoding time by up to 31.5%.

RoI 추출 방법에 따른 기계를 위한 영상 압축 성능 비교 (Comparison of Image Compression Performance based on RoI Extraction Methods for Machines Vision)

  • 이예지;김신;윤경로
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.146-149
    • /
    • 2022
  • 기존 RDO(Rate Distortion Optimization) 기반 압축 방식은 압축 성능에 초점을 두기 때문에 영상 내 인지 특성이 무시될 수 있다. 따라서 RoI(Region of Interest)을 기반으로 압축률을 조절하는 연구가 고안[1, 2, 3, 4] 되었으며, HVS(Human Visual System) 관점에서 영상 내 중요한 부분에 대해 더 높은 품질로 영상을 압축하는 연구가 대부분이다. 최근 인공지능 기술이 발전함에 따라 지능형 영상 분석에 대한 수요가 증가하고 있으며, 이에 따라 머신 비전을 위한 영상 부호화 및 효율적인 전송에 대한 필요성이 대두되고 있다. 본 논문에서는 VVC(Versatile Video Coding)의 dQP(delta Quantization Parameter)를 활용하여 RoI(Region of Interest) 기반압축 방법을 제안하고, 두가지의 RoI 추출 방식을 소개한다. Detectron2 Faster R-CNN X101-FPN [5]의 첫번째 탐지기를 통해 후보 영역 기반 RoI 을 추출하고, 두번째 탐지기를 통해 객체 기반 RoI 을 추출하여, 영상 내 객체 부분과 비객체 부분으로 나누어 서로 다른 압축률로 압축을 수행하였으며, 이에 따른 성능을 비교하고자 한다.

  • PDF

부호화 효율을 고려한 고속 인터/인트라 모드 결정 알고리즘 (Fast Inter/Intra Mode Decision Algorithm in H.264/AVC Considering Coding Efficiency)

  • 김지웅;김용관
    • 한국통신학회논문지
    • /
    • 제32권8C호
    • /
    • pp.720-728
    • /
    • 2007
  • H.264/AVC 비디오 부호화 표준은 부호화 효율을 향상시키기 위하여 기존의 부호화 표준들과는 다른 새로운 부호화 기법들을 사용한다. 그러나 새로이 채택된 여러 기법들로 인해 H.264/AVC 표준 부호기의 복잡도는 극단적으로 증가하게 되었다. 특히 율-왜곡 최적화 기법에 의한 H.264/AVC의 인터/인트라 모드 결정 방법은 부호기의 복잡도를 증가시키는 가장 큰 원인 중 하나이다. 본 논문에서는 매크로블록 모드 결정 과정의 복잡도 감소 및 전체 부호화 효율 측면에서 우수함을 나타내는 데 주안점을 두며, 이에 대한 고속 매크로블록 모드 결정 알고리즘을 제안한다. 제안한 알고리즘을 적용한 실험 결과, 고속 움직임 추정/보상과 결합한 경우 최대 80%의 부호화 시간을 감소시켰으며, 평균 $8{\sim}10%$의 비트율을 감소시키는데 반해 PSNR의 변화량은 미미하여 전체 부호화 효율 또한 상승시킬 수 있었다.

쿼드트리 구조와 SATD를 이용한 HEVC 인코더의 고속 인트라 예측 방식 (A Fast Intra Prediction Method Using Quadtree Structure and SATD in HEVC Encoder)

  • 김영조;김재석
    • 전자공학회논문지
    • /
    • 제51권3호
    • /
    • pp.129-138
    • /
    • 2014
  • 본 논문은 HEVC(high efficiency video coding) 인코더의 인코딩 시간을 줄이기 위한 고속 인트라 예측 방식을 제안한다. 제안하는 고속 인트라 예측 방식은 쿼드트리 구조와 SATD(Sum of Absolute Transformed Differences)를 사용한다. HEVC는 $8{\times}8$ 이상의 블록에서 SATD 값을 구하기 위해 $8{\times}8$ hadamard 변환을 이용한 $8{\times}8$ SATD 값을 사용한다. 제안하는 방식은 $16{\times}16$ 이상의 블록에서 각각의 $8{\times}8$ SATD 결과를 이용해서 최적 SATD 값을 산출한다. 그 후, RDO를 위한 후보 모드의 SATD와 산출된 최적 SATD의 비교를 기반으로 후보 모드를 제거한다. 후보 모드를 제거함으로써 제안하는 방식은 RDO의 연산을 줄이고 전체 인코딩 시간을 줄이게 된다. 제안하는 방식은 $8{\times}8$ 블록에서는 추가로 $4{\times}4$ SATD를 사용하여 최적 SATD를 구한다. 실험 결과 제안하는 방식은 거의 압축 성능 손실 없이 HM 12.1에 비해 5.33%의 인코딩 시간 감소 효과를 얻을 수 있었다.

H.264/AVC에서의 최고 확률 모드를 이용한 고속 화면 내 예측 모드 결정 (Fast Intra Prediction Mode Decision using Most Probable Mode for H.264/AVC)

  • 김대연;김정필;이영렬
    • 방송공학회논문지
    • /
    • 제15권3호
    • /
    • pp.380-390
    • /
    • 2010
  • 가장 최근에 표준화가 완료된 동영상 압축 코덱인 H.264/AVC는 율-왜곡 최적화를 사용하여 압축률이 상당히 향상되었다. 율-왜곡 최적화는 다수의 후보 모드들 중에서 최적의 모드를 결정하기 위한 수단이며, 모든 모드에 대하여 라그랑지안 비용을 계산하여 그 비용이 가장 적은 모드를 최적의 모드로 결정한다. 하지만 이 방법의 사용으로 인하여 H.264/AVC 부호기의 계산 복잡도가 상당히 증가하였다. 본 논문에서는 H.264/AVC의 화면 내 예측 부호화의 율-왜곡 최적화의 사용으로 인한 계산 복잡도를 감소시키는 고속 화면 내 예측 모드 결정 방법을 제안한다. 제안된 방법은 Intra$4{\times}4$와 Chroma Intra의 부호화 속도를 향상시키기 위하여 최고 확률 모드(MPM)가 가장 최적의 예측 모드인 경우를 미리 판단하여, 이 경우에는 율-왜곡 최적화 과정을 생략하고 최고 확률 모드를 사용하여 부호화한다. 또한 이 방법을 색차 화면 내 예측 모드에 유사하게 적용하였다. 실험 결과, 제안된 방법은 PSNR (Peak Signal-to-Noise Ratio) 손실이 거의 없이 평균 약 63%의 부호화 시간을 절약하였다.