Browse > Article
http://dx.doi.org/10.9708/jksci.2010.15.1.177

Efficient Continuous Vocabulary Clustering Modeling for Tying Model Recognition Performance Improvement  

Ahn, Chan-Shik (광운대학교 컴퓨터공학과)
Oh, Sang-Yeob (경원대학교 IT대학 컴퓨터미디어학과)
Abstract
In continuous vocabulary recognition system by statistical method vocabulary recognition to be performed using probability distribution it also modeling using phoneme clustering for based sample probability parameter presume. When vocabulary search that low recognition rate problem happened in express vocabulary result from presumed probability parameter by not defined phoneme and insert phoneme and it has it's bad points of gaussian model the accuracy unsecure for one clustering modeling. To improve suggested probability distribution mixed gaussian model to optimized for based resemble Euclidean and Bhattacharyya distance measurement method mixed clustering modeling that system modeling for be searching phoneme probability model in clustered model. System performance as a result of represent vocabulary dependence recognition rate of 98.63%, vocabulary independence recognition rate of 97.91%.
Keywords
clustering modeling; phoneme modeling; tying model; gaussian model; vocabulary recognition;
Citations & Related Records
Times Cited By KSCI : 6  (Citation Analysis)
연도 인용수 순위
1 김동주, 김한우, "문맥가중치가반영된문장유사도척도," 전자공학회논문지, 제43권, 제6호, 496-504쪽, 2006년. 3월
2 김기백, 최종호, "음성인식 기반 컨텐츠 네비게이션 시스템," 한국컴퓨터정보학회지, 제 15권, 제 1호, 99-102쪽, 2007년 6월.   과학기술학회마을
3 S. Ortmanns, A. Eiden, H. Ney, and N. Coenen, "Look-ahead Techniques for Fast Beam Search," InProc. IEEE ICASSP-1997, pp. 1783-1786, 1997.
4 Kris Demuynck, Tom Laureys, Dirk van Compernolle, and Hugo van Hamme, "FLaVor:a flexible architecture for LVCSR," In EUROSPEECH - 2003, pp.1973-1976, 2003.
5 Justin Zobel and Philip Dart, "Phonetic String Matching: Lessons from Information Retrival," SIGIR'96, pp.166-173, 1996.
6 T. Jitsuhiro, S. Takatoshi, and K. Aikawa, "Rejection of out-of-vocabulary words using phoneme confidence likelihood," ICASSP, pp. 217-220, 1998.
7 L. R. Bahl, P. V. deSouza, P. S. Gopalakrishnan, D. Nahamoo, and M. Picheny, "A Fast Match for Continuous Speech Recognition Using Allophonic Models," In Proc. IEEE ICASSP-92, Vol.1, pp.17-21, 1992.
8 W. Daelemans, S. Buchholz, and J. Veenstra, "Memorybased shallow parsing," in Proc. CoNLL, pp.53-60, 1999.
9 S. Young, D. Kershaw, J. Odell, D. Ollason, Valtcher, P. Woodland, "The HTK Book," Cambridge University Engineering Department, 2002.
10 L. R. Rabiner, B. H. Juang, "Fundamentals of speech recognition," Prentice Hall, 1993.
11 안태옥, "혼합 가우시안 군집화를 이용한 상태공유 음향모델 최적화," 대한전자공학회논문지, 제 42권, SP편 제 6호, 167-176쪽, 2005년 11월.   과학기술학회마을
12 D. Jurafsky and J. H. Martin, "Speech and Language Processing," Prentice-Hall, 2000.
13 우인성, 신좌철, 강흥순, 김석동, "다양한 연속밀도 함수를 갖는 HMM에 대한 우리말 음성인식에 관한 연구," 전기전자학회 논문지, 제11권, 제2호, 89-94쪽, 2007년 6월.   과학기술학회마을
14 이호웅, 정희석, "지능형 홈네트워크 시스템을 위한 가변어휘 연속음성인식시스템에 관한 연구," 한국ITS학회 논문지, 제7권, 제2호, 37-42쪽, 2008년 4월.   과학기술학회마을
15 K. Demuynck, J. Duchateau, and D. Van Compernolle, "A static lexicon network repre- sentation for cross-word context dependent phones," In Proc. EUROSPEECH, Vol.1, pp.143-146, 1997.
16 조영수, 이기정, 김광태, 홍재근, "HMM을 이용한 한국어 음소인식," 대한전자공학회 학술발표회 논문집, 제 16권,제 1호, 81-84쪽, 1994년. 6월.
17 M. F. Gales, "Model-based techniques for nosie robust speech recognition," Ph. D. dissertation, University of Cambridge, Sept, 1995.
18 안찬식, 오상엽, "MLHF 모델을 적용한 어휘 인식 탐색 최적화 시스템," 한국컴퓨터정보논문지, 제14권, 제10호, 217-223쪽, 2009년 10월.   과학기술학회마을
19 A. S. Manos and V. W. Zue, "Astudy on out-of-vocabulary word modeling for a segment- based keyword spotting system," Master Thesis, MIT, 1996.
20 김광호, 임민규, 김지환, "지식베이스를 이용한 임베디드용 연속음성인식의 어휘 적용률 개선," 대한음성학회지, 말소리, 제68호, 115-126쪽, 2008년 12월.   과학기술학회마을