MPEG Audio Layer-III Encoder Using Approximated Psy-choacoustic Model

간략화된 심리음향모델을 이용한 MPEG Audio Layer-III 부호화기

  • 송창준 (연세대학교 전기전자공학과 미디어.통신신호처리연구실) ;
  • 오현오 (연세대학교 전기전자공학과 미디어.통신신호처리연구실) ;
  • 박영철 (연세대학교 신호처리연구센터) ;
  • 윤대희 (연세대학교 전기전자공학과 미디어.통신신호처리연구실)
  • Published : 2001.09.01

Abstract

MPEC Audio Layer-III(MP3)알고리듬은 복호화기에 비해 부호화기가 월등히 많은 연산량을 가지고 있는 비대칭 구조를 가지고 있다. MP3 부호화기의 대부분의 연산량은 복잡한 초월함수 연산이 포함되는 심리음향모델과 반복 루프 과정을 수행하는 비선형 양자화와 비트 할당과정 이 차지한다. 본 논문에서는 MP3 부호화기의 실시간 구현을 위한 알고리듬 레벨의 최적화를 수행하였다. MP3 부호화기의 연산량을 줄이기 위해 심리음향모델을 간략화하고 반복 루프의 회수를 최소화할 수 있는 방법을 제안하였다. 프레임당 한 그래뉼의 심리음향모델 정보를 계산하여 한 프레임 내에서의 심리음향모델 정보를 추정함으로써 연산량을 45% 이상 감소시켰다. 또한 외부 반복 루프의 반복 회수를 줄이기 위하여 외부 반복 루프의 반복에 따른 스케일 팩터(Scale Factor) 및 양자화 스탭의 증가 패턴을 관찰하고 최적화된 스캐일 팩터 증가 방법을 제안하였다. 제안된 고속화 방법은 주관적 음질 평가를 통해 성능을 검증하였다.

Keywords