연속 은닉 마코프 모델을 이용한 한국어 음성 인식을 위한 효율적 음절 모델링

Effective Syllable Modeling for Korean Speech Recognition Using Continuous HMM

  • 김봉완 (원광대학교 음성정보기술산업지원센터) ;
  • 이용주 (원광대학교 전기,전자 및 정보공학부)
  • 발행 : 2003.01.01

초록

최근 연속 음성 인식에서의 성능 향상을 위해 음절을 인식 단위로 사용하고자 하는 노력들이 보고되고 있다. 그러나 음절의 경우 음소에 비해 학습성이 음소에 비해 좋지 않고, 모델의 수가 음소에 비해 매우 많으므로 음절 경계에서의 문맥 종속 모델링이 어렵다는 단점을 갖고 있다. 본 논문에서는 한국어에서의 음절의 학습성을 향상시키기 위한 방법과 음절경계에서의 음소 문맥 종속 음절 모델링을 제안한다. 제안된 방법을 단어 인식 실험에 적용한 결과, 기존의 음절 모델과 비교하여 평균 46.23%의 에러 감소율을 보였다 우측 음소 종속 음절 모델 (right phone dependent syllable model)의 경우 트라이폰(triphone) 모델에 비해 16.7%의 에러 감소율을 볼 수 있었다.

Recently attempts to we the syllable as the recognition unit to enhance performance in continuous speech recognition hate been reported. However, syllables are worse in their trainability than phones and the former have a disadvantage in that contort-dependent modeling is difficult across the syllable boundary since the number of models is much larger for syllables than for phones. In this paper, we propose a method to enhance the trainability for the syllables in Korean and phoneme-context dependent syllable modeling across the syllable boundary. An experiment in which the proposed method is applied to word recognition shows average 46.23% error reduction in comparison with the common syllable modeling. The right phone dependent syllable model showed 16.7% error reduction compared with a triphone model.

키워드

참고문헌

  1. IEEE Trans. on Speech and Audio Processing v.9 no.4 Syllable-based large vocaulary continuous speech recognition Aravind Ganapathiraju;Jonathan Hamaker;Joseph Picone;Mark Ordowski;George R. Doddington
  2. Proc. DARPA Speech Recognition Workshop Copernicus and the ASR challenge-waiting for kepler H.Boulard;H.Hermansky;N.Morgan
  3. 전자공학회 논문집 v.31-B no.1 음절을 기반으로 한 한국어 음성인식 이영호;정궁
  4. 한국음향학회지 v.16 no.3 인식 단위로서의 한국어 음절에 대한 연구 김유진;김회린;정재호
  5. 표준 한국어발음대사전 KBS
  6. KAIST 언어자원 2001년도판, 과학기술부 핵심 소프트웨어 과제 결과물 1995-2000 K.S.Choi
  7. Proc. ICSP 97 v.2 Design and construction of korean speech database for common use B.W.Kim;S.T.Kim;T.W.Kim;Y.I.Kim;Y.J.Lee