Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2018.10a
- /
- Pages.449-452
- /
- 2018
- /
- 2005-3053(pISSN)
Text Transliteration System and Number Transliteration Disambiguation for TTS
음성합성을 위한 텍스트 음역 시스템과 숫자 음역 모호성 처리
- Park, Jeong Yeon (Chungbuk National University) ;
- Shin, Hyeong Jin (Chungbuk National University) ;
- Yuk, Dae Bum (Chungbuk National University) ;
- Lee, Jae Sung (Chungbuk National University)
- Published : 2018.10.12
Abstract
TTS(Text-to-Speech)는 문자열을 입력받아 그 문자열을 음성으로 변환하는 음성합성 기술이다. 그러나 실제 입력되는 문장에는 한글뿐만 아니라 영단어 및 숫자 등이 혼합되어 있다. 영단어는 대소문자에 따라 다르게 읽을 수 있으며, 단위로 사용될 때는 약어로 사용되는 것이므로, 알파벳 단위로 읽어서는 안 된다. 숫자 또한 함께 사용되는 단어에 따라 읽는 방식이 달라진다. 본 논문에서는 한글과 숫자 및 단위, 영단어가 혼합된 문장을 분류하고 이를 음역하는 시스템을 구성하며 word vector를 이용한 숫자 및 단위의 모호성 해소방법을 소개한다.