대한음성학회:학술대회논문집 (Proceedings of the KSPS conference)
- 대한음성학회 2005년도 추계 학술대회 발표논문집
- /
- Pages.107-112
- /
- 2005
정보검색 기법과 동적 보간 계수를 이용한 N-gram 적응
N-gram Adaptation using Information Retrieval and Dynamic Interpolation Coefficient
- Choi, Joon-Ki (Voice Interface Laboratory, CS Div, EECS Dept, KAIST) ;
- Oh, Yung-Hwan (Voice Interface Laboratory, CS Div, EECS Dept, KAIST)
- 발행 : 2005.11.17
초록
연속음성인식을 위한 언어모델 적응기법은 특정 영역의 정보만을 담고 있는 적응 코퍼스를 이용해 작성한 적응 언어모델과 기본 언어모델을 병합하는 방법이다. 본 논문에서는 추가되는 자료 없이 인식 시스템이보유하고 있는 코퍼스만을 사용하여 적응 코퍼스를 구축하기 위해 언어모델에 기반한 정보검색 기법을 사영하였다. 검색된 적응 코퍼스로 작성된 적응 언어모델과 기본 언어모델과의 병합을 위해 본 논문에서는 입력음성을 분할하여 각 구간에 최적인 동적 보간 계수를 구하는 방법을 제안하였다. 제안된 적응 코퍼스를 구하는 방법과 동적 보간 계수는 기본 언어모델 대비절대 3.6%의 한국어 방송뉴스 인식 성능 향상을 보여주었으며 기존의 검증자료를 이용한 정적 보간 계수에 비해 상대 13.6%의 한국어 방송뉴스 인식 성능 향상을 보여 주었다.
키워드