Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2022.10a
- /
- Pages.442-446
- /
- 2022
- /
- 2005-3053(pISSN)
N-Best Reranking for Improving Automatic Speech Recognition of Korean
N-Best Re-ranking에 기반한 한국어 음성 인식 성능 개선
- Joung Lee (Jeonbuk National University) ;
- Mintaek Seo (Jeonbuk National University) ;
- Seung-Hoon Na (Jeonbuk National University) ;
- Minsoo Na (NCSOFT Corp.) ;
- Maengsik Choi (NCSOFT Corp.) ;
- Chunghee Lee (NCSOFT Corp.)
- Published : 2022.10.18
Abstract
자동 음성 인식(Automatic Speech Recognition) 혹은 Speech-to-Text(STT)는 컴퓨터가 사람이 말하는 음성 언어를 텍스트 데이터로 전환하는 일련의 처리나 기술 등을 일컫는다. 음성 인식 기술이 다양한 산업 전반에 걸쳐 적용됨에 따라 높은 수준의 정확도와 더불어 다양한 분야에 적용할 수 있는 음성 인식 기술에 대한 필요성이 점차 증대되고 있다. 다만 한국어 음성 인식의 경우 기존 선행 연구에 비해 예사말/높임말의 구분이나 어미, 조사 등의 인식에 어려움이 있어 음성 인식 결과 후처리를 통한 성능 개선이 중요하다. 따라서 본 논문에서는 N-Best 음성 인식 결과가 구성되었을 때 Re-ranking을 통해 한국어 음성 인식의 성능을 개선하는 모델을 제안한다.