• 제목/요약/키워드: Continuous speech task

검색결과 24건 처리시간 0.018초

인관과 로봇의 다양한 상호작용을 위한 휴대 매개인터페이스 ‘핸디밧’ (A Portable Mediate Interface 'Handybot' for the Rich Human-Robot Interaction)

  • 황정훈;권동수
    • 제어로봇시스템학회논문지
    • /
    • 제13권8호
    • /
    • pp.735-742
    • /
    • 2007
  • The importance of the interaction capability of a robot increases as the application of a robot is extended to a human's daily life. In this paper, a portable mediate interface Handybot is developed with various interaction channels to be used with an intelligent home service robot. The Handybot has a task-oriented channel of an icon language as well as a verbal interface. It also has an emotional interaction channel that recognizes a user's emotional state from facial expression and speech, transmits that state to the robot, and expresses the robot's emotional state to the user. It is expected that the Handybot will reduce spatial problems that may exist in human-robot interactions, propose a new interaction method, and help creating rich and continuous interactions between human users and robots.

고립단어 인식 시스템에서의 거절기능 구현 (An Implementation of Rejection Capabilities in the Isolated Word Recognition System)

  • 김동화;김형순;김영호
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.106-109
    • /
    • 1997
  • 고립단어 음성인식 시스템이 실용적이 되려면 인식 대상 이외의 단어를 거절할 수 있는 기능이 요구된다. 본 논문에서는 집단화된 음소 모델과 likelihood ratio에 의한 후처리 방법을 사용하여 거절기능을 구현하는 방법을 제안하였다. 기본적인 음성인식 시스템은 단어 단위 연속 HMM을 사용하였고, 6개의 집단화된 음소 모델들은 음성학적으로 균형잡힌 음성 데이터베이스를 이용하여 훈련된 45개의 문맥독립 음소 모델들로부터 통계적 방법에 의하여 생성되었다. 22개의 부서 명칭을 대상으로 한 화자독립 고립단어 인식시스템에서 거절성능을 시험하여 본 결과, 가장 높은 확률값과 두 번째 높은 확률값을 가지는 후보단어들 간의 차이값에 의하여 거절기능을 수행하는 기존의 후처리 방법보다 성능이 향상됨을 알 수 있었다. 또한 이 집단화된 음소모델은 인식 대상 어휘가 다른 고립단어 인식 시스템에도 재훈련 없이 그대로 사용될 수 있다.

  • PDF

장애음성의 음향학적 분석에서 유성음 문장의 임상적 유용성에 관한 연구 (A study on the clinical utility of voiced sentences in acoustic analysis for pathological voice evaluation)

  • 김지성
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.298-303
    • /
    • 2023
  • 본 연구는 장애음성의 평가에 사용되는 연속발화과제로서 유성음 문장의 임상적 유용성을 알아보기 위한 것이다. 이를 위해, 모음연장발성과제의 음향학적 측정치인 주파수 변동률(jitter percent, jitter), 진폭 변동률(shimmer percent, shimmer), 소음대배음비(Noise to Harmonic Ratio, NHR)와 유성음으로만 이루어진 연속발화과제의 음향학적 측정치로 캡스트럼 분석 측정치인 켑스트럼 피크 현저성(Cepstral Peak Prominence, CPP), 저주파수대고주파수 스펙트럼비(Low/High spectral ratio, L/H ratio)의 상관을 분석하였다. 음성장애 환자 65명을 대상으로 수집된 자료를 분석한 결과, 유성음 문장의 음향학적 측정치인 CPP와 모음연장발성의 측정치인 jitter(r = -.624, p = .000), shimmer (r = -.530, p = .000), NHR(r = -.469, p = .000) 간에 유의한 상관이 나타났다. 이는 유성음 문장의 캡스트럼 측정치가 '연속발화 과제의 변동률 기반 분석 불가능', '분석구간과 길이에 따른 결과차이' 등 언어재활 임상현장이 가지고 있는 장애음성의 음향학적 분석의 제한에 대한 대안으로 유용하게 사용될 수 있음을 시사한다.

결정트리 상태 클러스터링에 의한 HM-Net 구조결정 알고리즘을 이용한 음성인식에 관한 연구 (A Study on Speech Recognition Using the HM-Net Topology Design Algorithm Based on Decision Tree State-clustering)

  • 정현열;정호열;오세진;황철준;김범국
    • 한국음향학회지
    • /
    • 제21권2호
    • /
    • pp.199-210
    • /
    • 2002
  • 본 논문은 한국어 음성인식에서 음향모델의 성능개선을 위한 기초적 연구로서 결정트리 상태 클러스터링에 의한 HM-Net (Hidden Markov Network)의 구조결정 알고리즘을 이용한 음성인식에 관한 연구를 수행하였다. 한국어는 다른 언어와 비교하여 많은 문법과 변이음이 존재하는데, 국어 음성학에서 정의한 다양한 변이음을 조사하고, 음소결정트리를 위한 음소 질의어 집합을 작성하였다. 본 논문의 HM-Net 구조결정 알고리즘의 아이디어는 SSS (Successive State Splitting) 알고리즘의 구조를 가지면서 미리 작성해 둔 문맥의존 음향모델의 상태를 다시 분할하는 방법이다. 즉, 모델의 각 상태위치마다 음소 질의어 집합에 의해 음소결정트리를 생성하고, PDT-SSS (Phonetic Decision Tree-based SSS) 알고리즘에 의해 문맥의존 음향모델의 상태열을 다시 학습하는 방법이다. 결정트리 상태 클러스터링에 의한 HM-Net 구조결정 알고리즘의 유효성을 확인하기 위해, 국어공학센터 (KLE)의 452단어와 항공편 예약에 관련된 YNU200 문장을 대상으로 음성인식 실험을 수행하였다. 인식실험 결과, 음소, 단어, 연속음성인식 실험에서 상태분할을 수행한 후 상태수의 변화에 따라 인식률이 점진적으로 향상됨을 확인하였다. 상태수 2,000일 때 음소, 단어 인식률이 평균 71.5%, 99.2%를 각각 얻었으며, 연속음성인식률은 상태수 800일 때 평균 91.6%를 얻었다. 또한 HM-Net 구조결정 알고리즘의 파라미터 공유관계를 비교하기 위해 상태공유를 수행하는 HTK를 이용한 단어인식 실험을 수행하였다. 실험결과, HTK를 이용한 문맥의존 음향모델에 비해 평균 4.0%의 인식률 향상을 보여, 본 논문에서 적용한 결정트리 상태 클러스터링에 의한 HM-Net 구조결정 알고리즘의 유효성을 확인하였다.