H.264/AVC 복호기의 병렬 역변환 구조 및 저면적 역양자화 구조 설계

Parallel Inverse Transform and Small-sized Inverse Quantization Architectures Design of H.264/AVC Decoder

  • 정홍균 (한밭대학교 정보통신전문대학원) ;
  • 차기종 (한밭대학교 정보통신전문대학원) ;
  • 박승용 (한밭대학교 정보통신전문대학원) ;
  • 김진영 (한밭대학교 정보통신전문대학원) ;
  • 류광기 (한밭대학교 정보통신전문대학원)
  • Jung, Hong-Kyun (Graduate School of Information and Communication, Hanbat National University) ;
  • Cha, Ki-Jong (Graduate School of Information and Communication, Hanbat National University) ;
  • Park, Seung-Yong (Graduate School of Information and Communication, Hanbat National University) ;
  • Kim, Jin-Young (Graduate School of Information and Communication, Hanbat National University) ;
  • Ryoo, Kwang-Ki (Graduate School of Information and Communication, Hanbat National University)
  • 발행 : 2011.10.26

초록

본 논문에서는 H.264/AVC 복호기의 병렬 역변환 구조와 공통연산기 구조를 갖는 역양자화 구조를 제안한다. 제안하는 역양자화 구조는 하나의 공통 연산기를 사용함으로써 하드웨어 면적 및 계산 복잡도가 감소한다. 역변환 구조는 1개의 수평 DCT 연산기와 4개의 수직 DCT 연산기를 갖는 병렬구조를 적용하여 역변환 과정을 수행하는데 4 사이클이 소요된다. 또한 역변환 및 역양자화 구조에 2단 파이프라인 구조를 적용하여 1개의 $4{\times}4$ 블록을 처리하는데 5 사이클이 소요되어 수행 사이클 수를 감소시킨다. 제안하는 역변환 및 역양자화 구조를 Magnachip 0.18um CMOS 공정 라이브러리를 이용하여 ASIC 칩으로 설계한 결과 13MHz의 동작 주파수에서 게이트 수는 14.3K이고 제안한 역양자화 구조의 면적은 기존 구조 대비 39.6% 감소되었고, 표준 참조 소프트웨어 JM 9.4에서 추출한 데이터를 이용하여 성능을 측정한 결과 제안하는 구조의 수행 사이클 수가 기존 구조 대비 49.09% 향상되었다.

In this paper, parallel IT(inverse transform) architecture and IQ(inverse quantization) architecture with common operation unit for the H.264/AVC decoder are proposed. By using common operation unit, the area cost and computational complexity of IQ are reduced. In order to take four execution cycles to perform IT, the proposed IT architecture has parallel architecture with one horizontal DCT unit and four vertical DCT units. Furthermore, the execution cycles of the proposed architecture is reduced to five cycles by applying two state pipeline architecture. The proposed architecture is implemented to a single chip by using Magnachip 0.18um CMOS technology. The gate count of the proposed architecture is 14.3k at clock frequency of 13MHz and the area of proposed IQ is reduced 39.6% compared with the previous one. The experimental result shows that execution cycle the proposed architecture is about 49.09% higher than that of the previous one.

키워드