한국어 연속음성 인식을 위한 발음열 자동 생성

Automatic Generation of Pronunciation Variants for Korean Continuous Speech Recognition

  • 이경님 (서강대학교 컴퓨터학과 음성언어처리연구실) ;
  • 전재훈 (삼성전자 디지털미디어총괄 컴퓨터시스템사업부) ;
  • 정민화 (서강대학교 컴퓨터학과 음성언어처리연구실)
  • 발행 : 2001.02.01

초록

음성 인식이나 음성 합성시 필요한 발음열을 수작업으로 작성할 경우 작성자의 음운변화 현상에 대한 전문적 언어지식을 비롯하여 많은 시간과 노력이 요구되며 일관성을 유지하기도 쉽지 않다. 또한 한국어의 음운 변화 현상은 단일 형태소의 내부와 복합어에서 결합된 형태소의 경계점, 여러 형태소가 결합해서 한 어절을 이룰 경우 그 어절 내부의 형태소의 경계점, 여러 어절이 한 어절을 이룰 때 구성 어절의 경계점에서 서로 다른 적용 양상을 보인다. 본 논문에서는 이러한 문제를 해결하기 위해서 형태음운론적 분석에 기반하여 문자열을 자동으로 발음열로 변환하는 발음 생성 시스템을 제안하였다. 이 시스템은 한국어에서 빈번하게 발생하는 음운변화 현상의 분석을 통해 정의된 음소 변동 규칙과 변이음 규칙을 다단계로 적용하여 가능한 모든 발음열을 생성한다. 각 음운변화 규칙을 포함하는 대표적인 언절 리스트를 이용하여 구성된 시스템의 안정성을 검증하였고, 발음사전 구성과 학습용 발음열의 유용성을 인식 실험을 통해 평가하였다. 그 결과 표제어 사이의 음운변화 현상을 반영한 발음사전의 경우 5-6% 정도 나은 단어 인식률을 얻었으며, 생성된 발음열을 학습에 사용한 경우에서도 향상된 결과를 얻을 수 있었다.

Many speech recognition systems have used pronunciation lexicon with possible multiple phonetic transcriptions for each word. The pronunciation lexicon is of often manually created. This process requires a lot of time and efforts, and furthermore, it is very difficult to maintain consistency of lexicon. To handle these problems, we present a model based on morphophon-ological analysis for automatically generating Korean pronunciation variants. By analyzing phonological variations frequently found in spoken Korean, we have derived about 700 phonemic contexts that would trigger the multilevel application of the corresponding phonological process, which consists of phonemic and allophonic rules. In generating pronunciation variants, morphological analysis is preceded to handle variations of phonological words. According to the morphological category, a set of tables reflecting phonemic context is looked up to generate pronunciation variants. Our experiments show that the proposed model produces mostly correct pronunciation variants of phonological words. Then we estimated how useful the pronunciation lexicon and training phonetic transcription using this proposed systems.

키워드

참고문헌

  1. 국어음운론 개설 배주채
  2. HCI '97 학술대회 논문집 음운변화 규칙을 이용한 음성사전 생성 위선희;정민화
  3. 재27회 한국정보과학회 추계학술발표회 한국어 연속음성인식을 위한 발음사전 구축 이경님;정민화
  4. 제15회 음성통신및 신호처리 워크샵 의사형태소 단위의 연속 음성 인식 이경님;정민화
  5. 한국과학기술원, 전산학과 석사학위논문 Two-level 한국어 형태소 분석기 이성진
  6. 국어음성학 이호영
  7. 표준한국어 발음 대사전 한국방송공사(편저)
  8. 장기기초연구보고서 한국어 특질에 관한 연구: 자동통역 전화시스템 구현을 위한 음운 및 문법구조 연구 한국외국어 대학교
  9. Proc. of International Conference on Spoken Language Processing Automatic Generation of Korean Pronunciation Variants by Multistage Applications of Phonological Rules Jehun Jeon;Sunhwa Cha;Minhwa Chung;Jun Park
  10. Proc. of the 8th International Conference on Computational Linguistics A general compatational model for word from recognition and production Kimmo Koskenniemi
  11. Proc. of International Conference on Spoken Language Processing On Designing Pronunciation Lexicons for Large Vocabulary, Continuous Speech Recognition Lori Lamel;Gilles Adda
  12. Proc. of International Conference on Spoken Language Processing Automatic Generation of German Pronunciation Variants Maria-Barbara Wesenik
  13. The HTK Book(for HTK Verson 2.2) Steve Young;Dan Kershaw;Julian Odell;Dave Ollason;Valtcho Valtcher;Phil Woodland