Browse > Article
http://dx.doi.org/10.9708/jksci.2010.15.6.073

Phoneme Similarity Error Correction System using Bhattacharyya Distance Measurement Method  

Ahn, Chan-Shik (광운대학교 컴퓨터공학과)
Oh, Sang-Yeob (경원대학교 IT대학 컴퓨터소프트웨어)
Abstract
Vocabulary recognition system is providing inaccurate vocabulary and similar phoneme recognition due to reduce recognition rate. It's require method of similar phoneme recognition unrecognized and efficient feature extraction process. Therefore in this paper propose phoneme likelihood error correction improvement system using based on phoneme feature Bhattacharyya distance measurement. Phoneme likelihood is monophone training data phoneme using HMM feature extraction method, similar phoneme is induced recognition able to accurate phoneme using Bhattacharyya distance measurement. They are effective recognition rate improvement. System performance comparison as a result of recognition improve represent 1.2%, 97.91% by Euclidean distance measurement and dynamic time warping(DTW) system.
Keywords
phoneme likelihood; vocabulary recognition; error correction; Bhattacharyya distance measurement;
Citations & Related Records
Times Cited By KSCI : 6  (Citation Analysis)
연도 인용수 순위
1 Kris Demuynck, Tom Laureys, Dirk van Compernolle, and Hugo van Hamme, "FLaVor:a flexible architecture for LVCSR," In EUROSPEECH-2003, pp.1973-1976, 2003.
2 Eiichi Tanaka and Tamotsu Kasai, "Synchronization and Substitution Error-correcting codes for the Levenshtein Metric," IEEE Trans. Information Theory, Vol. IT-22, No. 2, pp.156-176, 1976.
3 E. K. Ringer and J. F. Allen, "A fertility channel model for post-correction of continuous speech recognition," Proc. ICSLP, pp.897-900, Oct, 1996.
4 박미성, 김미진, 김계성, 최재혁, 이상조, "연속 음성인식후처리를 위한 음절 복원 rule-based 시스템과 형태소분석기법의 적용," 대한전자공학회논문지, 제 36권, 제 3 호, 47-57쪽, 1999년 3월.
5 문광식, 김회린, 정재호, 이영직, "가변어휘 단어 인식에서의 미등록어 거절 알고리즘의 성능비교," 신호처리합동학술대회논문집, 제 12권, 제 1호, 305-308쪽, 1999년 10월.
6 조시원, 이동욱, "음성 인식 후처리를 위한 연속 음절 문장의 키워드 추출 알고리즘," 대한전기학회, 학술대회논문집, 심포지엄 논문집 정보 및 제어부문, 170-171쪽, 2008년 4월.   과학기술학회마을
7 안찬식, 오상엽, "MLHF 모델을 적용한 어휘 인식 탐색최적화 시스템," 한국컴퓨터정보학회지, 제 14권, 제 10호, 217-223쪽, 2009년 10월.   과학기술학회마을
8 L. Rabiner and B. H. Juang, "Fundamentals of Speech Recognition", Prentice-Hall, 1993.
9 T. Jitsuhiro, S. Takatoshi, and K. Aikawa, "Rejection of out-of-vocabulary works using phoneme confidence likelihood," Proc. ICSSP, pp.217-220, May, 1998.
10 한동조, 최기호, "음성인식 후처리에서 음소 유사율을 이용한 오류보정에 관한 연구," 한국ITS학회논문지, 제 6권, 제 3호, 77-86쪽, 2007년 12월.   과학기술학회마을
11 김용현, 정민화, "에러패턴 학습과 후처리 모듈을 이용한 연속 음성 인식의 성능향상," Proc. KISS Spring Semiannual Conf. 제 27권, 제 1호, 441-443쪽, 2000년 4월.   과학기술학회마을
12 방기덕, 강철호, "가변 신뢰도 문턱치를 사용한 미등록어 거절 알고리즘에 대한 연구," 한국멀티미디어학회논문지, 제 11권, 제 11호, 1471-1479쪽, 2008년 11월.   과학기술학회마을
13 송원문, 김명원, "문맥 및 사용 패턴 정보를 이용한 음성인식 후처리," 정보처리학회논문지, 제 13-B권, 제 5호, 553-560쪽, 2006년.   과학기술학회마을
14 김동주, 김한우, "문맥가중치가 반영된 문장 유사도 척도," 대한전자공학회논문지, 제 43권, 제 6호, 496-504쪽, 2006년.   과학기술학회마을
15 M. Ostendorf, "From HMM's to segment models: a unified view of stochastic modeling for speech recognition," Speech and Audio Processing, IEEE, Vol. 4, pp.360-378, 1996.   DOI
16 S. Young, D. Kershaw, J. Odell, D. Ollason, Valtcher, P. Woodland, "The HTK Book," Cambridge University Engineering Department, 2002.
17 M. F. Gales, "Model-based techniques for nosie robust speech recognition," Ph. D. dissertation, University of Cambridge, Sept, 1995.
18 안찬식, 오상엽, "공유모델 인식 성능 향상을 위한 효율적인 연속 어휘 군집화 모델링," 한국컴퓨터정보학회지, 제 15권, 제 1호, 177-183쪽, 2010년 1월.   과학기술학회마을