DOI QR코드

DOI QR Code

A study on the Stochastic Model for Sentence Speech Understanding

문장음성 이해를 위한 확률모델에 관한 연구

  • 노용완 (성균관대학교 대학원 정보통신공학부) ;
  • 홍광석 (성균관대학교 정보통신공학부)
  • Published : 2003.12.01

Abstract

In this paper, we propose a stochastic model for sentence speech understanding using dictionary and thesaurus. The proposed model extracts words from an input speech or text into a sentence. A computer is sellected category of dictionary database compared the word extracting from the input sentence calculating a probability value to the compare results from stochastic model. At this time, computer read out upper dictionary information from the upper dictionary searching and extracting word compared input sentence caluclating value to the compare results from stochastic model. We compare adding the first and second probability value from the dictionary searching and the upper dictionary searching with threshold probability that we measure the sentence understanding rate. We evaluated the performance of the sentence speech understanding system by applying twenty questions game. As the experiment results, we got sentence speech understanding accuracy of 79.8%. In this case, probability ($\alpha$) of high level word is 0.9 and threshold probability ($\beta$) is 0.38.

본 논문에서는 사전과 시소러스를 이용하여 문장음성 이해를 위한 확률모델을 제안한다. 제안한 확률모델은 입력되는 음성과 텍스트 문장에서 단어를 추출한다. 컴퓨터가 선택한 카테고리의 사전 DB와 입력된 문장에서 추출된 단어와 비교하고 확률모델로부터 확률값을 얻는다. 이때 컴퓨터로부터 상위어 정보를 알아내고 상위어 사전을 검색하여 단어를 추출하고 입력된 단어와 확률 모델을 비교하여 결과값을 얻는다. 사전과 상위어 사전으로부터 얻은 두개의 확률값을 더하고 그 값을 미리 정해진 임계값과 비교하여 문장의 이해도를 측정한다. 이와 같은 이해 시스템을 스무고개 게임에 적용시켜 그 성능을 평가 하였다. 상위어 확률 값($\alpha$)이 0.9이고 임계값 ($\beta$)은 0.38일 때 문장음성 이해의 정확도는 79.8%였다.

Keywords

References

  1. 이정민, '자연어 처리와 인지', 인지과학, Vol.3, No.2, pp.161-176, 1992
  2. 한광록, '한국어 문장이해를 위한 가변패턴네트의 구성과 응용', 정보처리논문지, 제2권 제2호, pp.229-236, 1995
  3. 김영택, '자연언어처리 기술', 전자공학회지, pp.205-212, 1987
  4. 이정민 '자연언어처리와 인지', 인지과학, Korean Journal of Cognituve Science, Vol.3, No.2, pp.161-196, 1992
  5. Biing-Hwang Juang, Sadaoki Furui, 'Automatic Recognition and Understanding of Spoken Language-A Frist Step Toward Natural Human-Machine Communication,' Proceedings of the IEEE, Vol.88, No.9, pp.1142-1165, August, 2000 https://doi.org/10.1109/5.880077
  6. 남지순 '한국어 전자사전', 전자공학회지, 제24권 제9호, pp.1103-1125, 1997
  7. 최병진, 이운재, 이재성, 최기선, '기계가독형 사전 구축을 위한 사전항목의 논리 구조', 인지과학, Vol.7, No.2, pp.75-92, 1996
  8. 김정애, 박종민, 김원중, 양재동, '객체지향 시소러스에서의 참조 질의 조건 완화 기법', 정보과학회 추계학술대회, pp.208-211, 2002
  9. 남영준 '이용자 중심의 시소러스 관리프로그램 설계', Journal of the Institute for Engineering and Technology Jeonju Univ., Vol.4, No.2, pp.225-242, 1998
  10. 이종인, 한광록, '한국어 단어 시소러스 구축 시스템의 설계', 대한전자공학회, 제21권 제1호, pp.313-316, 1998
  11. 박계숙, '객제지향 기법을 이용한 시소러스 관리 시스템의 개발에 관한 연구', 정보처리학회지, 제13권 제2호, pp.5-18, 1996
  12. 노용완, 윤재선, 홍광석 '스무고개 게임을 위한 음성인식', 2002년도 전자공학회 하계 종합 학술대회논문집, 제25권 제1호, pp.203-206, 2002
  13. 윤재선 '한국어 음성인식 Diction System의 구현', 2001년도 박사학위 청구 논문, pp.69-80, 2001
  14. 윤재선, 정광우, 홍광석, '모음열과 VCCV 단위 HMM을 이용한 연속 숫자 음성인식,' 한국음향학회 추계 학술대회논문집, pp.25-28, 2001
  15. Quilici, A, Qiang Yang, Woods, S., 'Knowldege-based Software Engineering Conference,' proceedings of the 11th, pp.25-28, 1996
  16. Li Junjie, Wang Kaizhu, 'Natural language understanding based on background knowledge,' TENCON 93. Proceeding. Computer, Communication, Control and Power Engineering. 1993 IEEE Region 10 Conference on Issue, pp. 460-462, Oct., 1993 https://doi.org/10.1109/TENCON.1993.320026
  17. Schwartz, R., Miller, S., Stallard, D., Markhoul, J., 'Hidden understanding models for statistical sentence understanding,' Acoustics, Speech and Signal Processing, ICASSP97 IEEE International, Vol.2m pp.1479-1482, 1997 https://doi.org/10.1109/ICASSP.1997.596229