Cursor Moving by Voice Command using DTW method

DTW방식을 이용한 음성 명령에 의한 커서 조작

  • 추명경 (동명정보대학교 정보통신공학과) ;
  • 손영선 (동명정보대학교 정보통신공학과)
  • Published : 2001.02.01

Abstract

본 논문에서는 마우스 대신에 음성으로 명령을 입력하여 퍼지 추론을 통해 위도우 화면상의 커서를 이동시키는 인터페이스를 구현하였다. 입력된 음성이 대체로 짧은 언어이기에 이를 인식하기 위하여 고립단어 인식에 강한 DTW방식을 사용하였다. DTW방식의 단점중인 하나가 음성길이가 비슷한 명령을 입력하였을 때 표준패턴 중 오차 값이 가장 작은 패턴으로 인식하는 것이다. 예를 들면 \"아주 많이 이동해\"하는 음성이 입력되었을 때 비슷한 음성길이를 가진 \"아주 많이 오른쪽\"으로 인식하는 경우가 있다. 이런 오류를 해결하고자 각 패턴의 DTW오차 거리 값과 표준 패턴의 음성길이를 기준으로 임계값을 퍼지 추론하여 명령으로서의 수락 여부를 결정하였다. 판단이 애매한 부분은 사용자에게 질의를 하여 응답에 따라 수락 여부를 결정하였다.

Keywords

References

  1. 한국 퍼지및 지능시스템 학회 1999년도 추계학술대회 학술논문발표 논문집 v.9 no.2 퍼지 추론에 의한 커서의 조작 손영선(외4)
  2. Fuzz-IEEE'99 v.I2 A Support System Construction for Multimedia Information Data Acquisition Kbgsuk OH;Gentaek Kang;Kaoru HIROTA
  3. ISFA'97 v.4 CONTRIBUTION TO FUZZY ALGORITHM CONSTRUCTION FOR NATURAL INTELLIGENCE CHORAYAN
  4. 韓國情報科學會論文志 불균형 인식 단위를 이용한 연속음성 인지 퍼지 전문가 시스템 유하진;오영환
  5. 한국 퍼지및 지능시스템 학회 1999년도 추계학술대회 한술 발표 논문집 v.9 no.2 LPC와 RBF 신경망을 이용한 화자 인식 장성령;공성곤
  6. 음성언어정보처리 오영환
  7. 음성의 분석및 합성과 그 응용 박경법
  8. フアヅイ 工學入門 本多中二;大理有生