The syllable recovery rule-base system for the post-processing of a continuous speech recognition

연속음성인식 후처리를 위한 음절 복원 rule-base시스템

  • Park, Mi-Seong (Dept. of Computer Engeering, Kyungpook National University) ;
  • Kim, Mi-Jin (Dept. of Computer Engeering, Kyungpook National University) ;
  • Lee, Mun-Hui (Dept. of Computer Engeering, Kyungpook National University) ;
  • Choi, Jae-Hyeok (Dept. of Computer Education, Silla University) ;
  • Lee, Sang-Jo (Dept. of Computer Engeering, Kyungpook National University)
  • 박미성 (경북대학교 컴퓨터공학과) ;
  • 김미진 (경북대학교 컴퓨터공학과) ;
  • 이문희 (경북대학교 컴퓨터공학과) ;
  • 최재혁 (신라대학교 컴퓨터교육과) ;
  • 이상조 (경북대학교 컴퓨터공학과)
  • Published : 1998.10.09

Abstract

한국어가 연속적으로 발음될 때 여러 가지 음운 변동현상이 일어난다. 이것은 한국어 연속음성 인식을 어렵게 하는 주요 요인 중의 한가지이다. 본 논문은 음운변동현상이 반영된 음성 인식 문자열을 규칙에 의거하여 text 기반 문자열로 다시 복원시키고 복원 결과 후보들을 형태소 분석하여 유용한 문자열만을 최종 결과로 생성하게 하는 시스템을 구성하였다. 복원은 4가지 rule 즉, 음절 경계 종성 초성 복원 rule, 모음처리 복원 rule, 끝음절 중성 복원 rule, 한 음절처리 rule에 따라 이루어진다. 규칙 적용 과정중에 효과적인 복원을 위해 x-clustering정보를 정의 하여 사용하고, 형태소 분석기에 입력될 복원 후보수를 제한하기 위해 postfix음절 빈도정보를 구하여 사용한다.

Keywords