Post-Processing of Speech Recognition Using Phonological Variables and Improved Edit-distance

Kim, Yejin;Park, Youngmin;Kang, Sangwoo;Jung, Sangkeon;Lee, Cheongjae;Seo, Jungyun;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2014.10a
/
Pages.9-12
/
2014
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Post-Processing of Speech Recognition Using Phonological Variables and Improved Edit-distance

발음 변이와 개선된 편집 거리를 이용한 음성 인식 후처리

Kim, Yejin (Department of Computer Science and Engineering, Sogang University) ;
Park, Youngmin (Department of Computer Science and Engineering, Sogang University) ;
Kang, Sangwoo (Department of Computer Science and Engineering, Sogang University) ;
Jung, Sangkeon (Human Machine Interface Technology Laboratory, SK Telecom Inc.) ;
Lee, Cheongjae (Human Machine Interface Technology Laboratory, SK Telecom Inc.) ;
Seo, Jungyun (Department of Computer Science and Engineering, Sogang University)

김예진 (서강대학교 컴퓨터공학과) ;
박영민 (서강대학교 컴퓨터공학과) ;
강상우 (서강대학교 컴퓨터공학과) ;
정상근 ((주)SK텔레콤) ;
이청재 ((주)SK텔레콤) ;
서정연 (서강대학교 컴퓨터공학과)

Published : 2014.10.07

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

본 논문에서는 오인식된 고유명사의 후처리 방법을 제안한다. 최근 음성 인식 후처리를 위해 통계적 방법을 이용하는 연구가 활발히 진행되어 왔다. 하지만 고유명사의 음성 인식 후처리는 대용량의 데이터 수집에 많은 비용이 필요하므로 통계적 방법을 효과적으로 적용하기 어렵다. 따라서 본 논문에서는 발음 변이 현상을 고려하여 편집 거리 알고리즘을 개선한 기법을 제안한다. 본 논문에서는 고유명사의 음성 오인식 교정 성능을 검증하였고, 그 결과 P@3의 결과가 비교 모델보다 55%의 성능 향상률을 보였다.

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

Post-Processing of Speech Recognition Using Phonological Variables and Improved Edit-distance

발음 변이와 개선된 편집 거리를 이용한 음성 인식 후처리

Abstract

Keywords