정보검색 기법과 동적 보간 계수를 이용한 N-gram 적응

N-gram Adaptation using Information Retrieval and Dynamic Interpolation Coefficient

  • 최준기 (한국과학기술원 전자전산학과 전산학부 음성인터페이스연구실) ;
  • 오영환 (한국과학기술원 전자전산학과 전산학부 음성인터페이스연구실)
  • Choi, Joon-Ki (Voice Interface Laboratory, CS Div, EECS Dept, KAIST) ;
  • Oh, Yung-Hwan (Voice Interface Laboratory, CS Div, EECS Dept, KAIST)
  • 발행 : 2005.11.17

초록

연속음성인식을 위한 언어모델 적응기법은 특정 영역의 정보만을 담고 있는 적응 코퍼스를 이용해 작성한 적응 언어모델과 기본 언어모델을 병합하는 방법이다. 본 논문에서는 추가되는 자료 없이 인식 시스템이보유하고 있는 코퍼스만을 사용하여 적응 코퍼스를 구축하기 위해 언어모델에 기반한 정보검색 기법을 사영하였다. 검색된 적응 코퍼스로 작성된 적응 언어모델과 기본 언어모델과의 병합을 위해 본 논문에서는 입력음성을 분할하여 각 구간에 최적인 동적 보간 계수를 구하는 방법을 제안하였다. 제안된 적응 코퍼스를 구하는 방법과 동적 보간 계수는 기본 언어모델 대비절대 3.6%의 한국어 방송뉴스 인식 성능 향상을 보여주었으며 기존의 검증자료를 이용한 정적 보간 계수에 비해 상대 13.6%의 한국어 방송뉴스 인식 성능 향상을 보여 주었다.

키워드