한국어 숫자음의 음운변화 및 화자 발성특성을 고려한 연결숫자 인식의 성능향상

Performance Improvement of Connected Digit Recognition by Considering Phonemic Variations in Korean Digit and Speaking Styles

  • 발행 : 2002.05.01

초록

한국어 숫자는 모두 단음절로 이루어져 있으며, 연속적으로 발음될 때 인접 숫자들의 상호조음현상에 의해 각 숫자의 고유 발음이 변화하고, 또한 그 숫자들의 경계도 모호해지는 문제점이 있다. 이러한 문제점들과 더불어 배경잡음이나 채널에 의한 왜곡에 따른 문제점들로 인해 한국어 연결숫자의 인식 성능은 만족스럽지 못한 것이 현실이다. 본 논문에서는 연결숫자의 인식성능 향상을 위해서 한국어 숫자들의 음운변화를 고려하여 유사음소 (phonelike units: PLUs)군을 정의하고, 사용자의 여러 가지 발성형태에 따른 다양한 음운 현상의 변화를 흡수할 수 있도록 인식 시스템을 구성하는 방식을 검토하였다. 전화망 4연숫자를 이용한 화자독립 인식 실험을 수행한 결과 제안된 방법의 숫자열 인식률은 상태당 믹스쳐 (mixture) 개수가 1인 경우 83.2%로, 기준 시스템 (baseline)에 대한 오류감소률이 7.2%였고 가장 높은 성능을 나타낸 믹스쳐 개수가 11인 경우 숫자열 인식률은 91.8% 오류감소율은 4.7%였다.

Each Korean digit is composed of only a syllable, so recognizers as well as Korean often have difficulty in recognizing it. When digit strings are pronounced, the original pronunciation of each digit is largely changed due to the co-articulation effect. In addition to these problems, the distortion caused by various channels and noises degrades the recognition performance of Korean connected digit string. This paper dealt with some techniques to improve recognition performance of it, which include defining a set of PLUs by considering phonemic variations in Korean digit and constructing a recognizer to handle speakers various speaking styles. In the speaker-independent connected digit recognition experiments using telephone speech, the proposed techniques with 1-Gaussian/state gave string accuracy of 83.2%, i. e., 7.2% error rate reduction relative to baseline system. With 11-Gaussians/state, we achieved the highest string accuracy of 91.8%, i. e., 4.7% error rate reduction.

키워드

참고문헌

  1. IEEE Trans. on Acoustics, Speech and Signal Processing v.35 no.10 Network-based connected digit recognition M. A. Bush;G. E. Kopec https://doi.org/10.1109/TASSP.1987.1165057
  2. Proc. ICASSP High performance connected digit recognition, using hidden Markov models L. R. Rabiner;J. G. Wilpon;F. K. Soong
  3. Proc. ICASSP Phonetically sensitive discriminants for imporved speech recognition G. R. Doddington
  4. Proc. ICASSP Improvements in connected digit recognition using higher order spectral and energy features J. G. Wilpon;C. H. Lee;L. R. Rabiner
  5. IEEE Trans. on Speech and Audio Processing v.2 no.2 High-performance connected digit recognition using maximum mutual imformation estimation Y. Normandin;R. Cardin;R. De Mori https://doi.org/10.1109/89.279279
  6. 제15회 음성통신 및 신호처리 워크샵 논문집 v.15 no.1 한국어 연결숫자인식을 위한 숫자 모델링에 관한 연구 김기성;김승희;김형순;지민제
  7. 표준 국어문법론 남기심;고영근
  8. 국어음운학;우리말 소리의 오늘 어제 허 웅
  9. 한국음향학회 추계학술발표대회 논문집 v.20 no.2(s) 한국어 숫자음에서의 음운변화를 고려한 연결숫자 인식의 성능향상 송명규;김형순
  10. 한국음향학회 학술발표대회 논문집 v.17 no.2(s) 음소 모델링 방식들의 성능비교 송명규;김형순
  11. Proc. ICSP Performance comparison of several channel compensation methods in connected digit recognition S. G. Chon;M. G. Song;H. S. Kim