Unsupervised Word Grouping Algorithm for real-time implementation of Medium vocabulary recognition

중규모급 단어 인식기의 실시간 구현을 위한 무감독 단어집단화 알고리듬

  • Lim Dong Sik (Dept. of Electronics Engineering. Chonnam National Univ & Research Center for High-Quality Electric Components and Systems) ;
  • Kim Jin Young (Dept. of Electronics Engineering. Chonnam National Univ & Research Center for High-Quality Electric Components and Systems) ;
  • Baek Seong Joon (Dept . of Electrical Engineering. Seoul National Univ)
  • 임동식 (전남대학교 전자공학과 고품질 전기) ;
  • 김진영 (전남대학교 전자공학과 고품질 전기) ;
  • 백성준 (서울대학교 전기공학부)
  • Published : 1999.11.06

Abstract

본 논문에서는 중규모급 단어인식기의 실시간 구현을 위한 무감독 단어집단화 알고리듬을 제안한다. 무감독 단어집단화는 인식대상 어휘 수가 많은 대용량 음성인식 시스템에서 대상 어휘 수를 줄여주는 역할을 하는 전처리기의 성격을 갖는다. 무감독 집단화를 위해 각 단어의 유$\cdot$무성음 고유의 특성을 잘 반영할 수 있는 특징 파라미터 5개를 사용하여 패턴 인식과 회귀분석에서 널리 사용되고 있는 분류$\cdot$회귀트리(Classification And Regression Tree)에 적용시키는 방법으로 접근하였고, 각 단어의 frame 수를 일정하게 n개로 분할(segment)하여 1개의 tree를 생성시키는 방법과 각 segment에 해당하는 tree를 생성시켜 segment들 사이의 교집합 성분으로 단어들을 집단화 하였다 실험결과 탐색 대상단어 22개에서 평균2.21개로 줄어 전체 대상 단어의 $10\%$만을 탐색하여 인식할 수 있는 방법을 제시할 수 있었다.

Keywords