Post-Processing of Speech Recognition Using Phonological Variables and Improved Edit-distance

발음 변이와 개선된 편집 거리를 이용한 음성 인식 후처리

  • Kim, Yejin (Department of Computer Science and Engineering, Sogang University) ;
  • Park, Youngmin (Department of Computer Science and Engineering, Sogang University) ;
  • Kang, Sangwoo (Department of Computer Science and Engineering, Sogang University) ;
  • Jung, Sangkeon (Human Machine Interface Technology Laboratory, SK Telecom Inc.) ;
  • Lee, Cheongjae (Human Machine Interface Technology Laboratory, SK Telecom Inc.) ;
  • Seo, Jungyun (Department of Computer Science and Engineering, Sogang University)
  • Published : 2014.10.07

Abstract

본 논문에서는 오인식된 고유명사의 후처리 방법을 제안한다. 최근 음성 인식 후처리를 위해 통계적 방법을 이용하는 연구가 활발히 진행되어 왔다. 하지만 고유명사의 음성 인식 후처리는 대용량의 데이터 수집에 많은 비용이 필요하므로 통계적 방법을 효과적으로 적용하기 어렵다. 따라서 본 논문에서는 발음 변이 현상을 고려하여 편집 거리 알고리즘을 개선한 기법을 제안한다. 본 논문에서는 고유명사의 음성 오인식 교정 성능을 검증하였고, 그 결과 P@3의 결과가 비교 모델보다 55%의 성능 향상률을 보였다.

Keywords