Optimization for H.264/AVC De-blocking Filter on the TMS320C64x+ DSP

TMS320C64x+ DSP에서의 H.264/AVC 디블록킹 필터 최적화

  • 이진섭 (광운대학교 임베디드소프트웨어공학과) ;
  • 강대범 (삼성전자(주)) ;
  • 심동규 (광운대학교 컴퓨터공학과) ;
  • 이수연 (광운대학교 컴퓨터공학과)
  • Received : 2010.11.17
  • Accepted : 2011.02.15
  • Published : 2011.03.25

Abstract

It is important to reduce computational complexity of de-blocking filter for real-time implementation, because it accounts for a great part of total computational complexity of the decoder. Because there are a lot of conditional branches and memory accesses in a decoding loop, it is not easy to speed up the de-blocking filter. Therefore, this paper presents a new algorithm of de-blocking filter minimizing conditional branches and memory accesses. The proposed structure of de-blocking filter enables filter operation to parallelize by software pipelining. The proposed optimization method was implemented on a TMS320DM6467 EVM board and we achieved approximately 46% cycle reduction, compared with that of FFmpeg.

H.264/AVC의 디블록킹 필터는 복호화기 전체의 계산 복잡도 중 큰 비중을 차지하기 때문에, H.264/AVC 복호화기의 실시간 구현을 위해서는 디블록킹 필터의 계산 복잡도를 줄이는 것이 매우 중요하다. 디블록킹 필터의 계산 복잡도가 높은 이유는 여러 단계의 조건 분기문이 많고 메모리 접근이 자주 일어나기 때문이다. 따라서, 본 논문에서는 분기문과 메모리 접근을 최소화하는 디블록킹 필터의 구조를 제안하고, 필터 연산의 병렬화를 위해 소프트웨어 파이프라이닝이 가능하도록 하는 최적화 방법을 제안한다. 제안하는 방법은 TMS320C64x+ 계열의 DSP의 TMS320DM6467 EVM 보드에 구현하여 최적화를 진행하였다. 실험 결과, 최적화된 디블록킹 필터는 FFmpeg의 디블록킹 필터와 비교하였을 때 평균 약 46%의 사이클이 감소되었다.

Keywords

References

  1. M. Horowitz, A. Joch, F. Kossentini and A. Hallapuro, "H.264/AVC baseline profile decoder complexity analysis," IEEE Trans. Circuits and Systems for Video Tech. Vol. 13, no. 7, pp. 704-716, Jul. 2003. https://doi.org/10.1109/TCSVT.2003.814967
  2. S. Y. Shih, C. R. Chang and Y. L. Lin, "A near optimal deblocking filter for H.264 advanced video coding," in Proc. Asia South Pacific Design Automation Conference, pp. 170-175, Jan. 2007.
  3. B. Sheng, W. Gao and D. Wu. "An implemented architecture of deblocking filter for H.264/AVC," in Proc. of IEEE International Conference on Image Processing, vol. 51, pp. 249-255, 2005.
  4. T. Song, Y. Hayashi and T. Shimamoto, "Fast deblocking filter implementation method for H.264/AVC," International Journal of Innovative Computing, Information and Control, Vol. 5, no. 11, Nov. 2009.
  5. C. C. Cheng and T. S. Chang, "An in-place architecture for the deblocking filter in H.264/AVC," IEEE Transactions on circuits and Systems, Vol. 53, no. 7, Jul. 2006.
  6. C. L. Hsu and Y. S. Huang, "A fast-deblocking boundary-strength based architecture design of deblocking filter in H.264/AVC applications," Jounal of Signal Processing Systems, Vol. 52, no.3, pp. 211-229, Sept. 2008. https://doi.org/10.1007/s11265-007-0149-3
  7. J. Lou, A. Jagmohan, D. He, L. Lu and M. T. Sun, "Statistical analysis based H.264 high profile deblocking speedup," IEEE International Symposium on Circuits and Systems, 2007.
  8. Z. Yang, W. Gao, Y. Liu and D. Zhao, "Deeply pipelined DSP solution to deblocking filter for H.264/AVC," IEEE transactions on Consumer Electronics, Jul. 2006.
  9. Texas Instruments, "TMS320DM6446 digital media system-on-chip," SPRS283G, Dec. 2005.
  10. Texas Instruments, "TMS320C64x/C64x+ DSP CPU and instruction set reference guide," SPRU732D, Jul. 2007.
  11. 강대범, 황정우, 심동규, "TMS320C64x+를 이용한 MPEG-4 코덱 최적화," 제 20회 신호처리합동학술대회논문지, 1권, 158쪽, 2007년 10월
  12. 강대범, 심동규, 박호종, 심영석, "Davinci를 위한Sorenson H.263 비디오 디코더 최적화," 제 21회 신호처리합동학술대회논문지, 21권, 1호, 155쪽, 2008년 9월
  13. 강대범, 심동규, "멀티미디어 DSP를 위한 AVS 비디오 복호화기 구현," 전자공학회논문지, 46권 SP편, 제5호, 151-161쪽, 2009년 9월.
  14. 이진섭, 서정한, 심동규, "SVC 디블록킹 필터의 DSP 최적화 구현," 전자공학회하계학술대회논문지, 33권, 제1호, 301-303쪽, 2010년 6월.
  15. FFmpeg, "http://www.ffmpeg.org", Mar. 2009.