• 제목/요약/키워드: Speech Interface

검색결과 249건 처리시간 0.028초

언어장애인을 위한 안드로이드 기반 의사소통보조 어플리케이션 (An Android Application for Speech Communication of People with Speech Disorders)

  • 최윤정;홍기형
    • 말소리와 음성과학
    • /
    • 제6권4호
    • /
    • pp.141-148
    • /
    • 2014
  • Voice is the most common means for communication, but some people have difficulties in generating voice due to their congenital or acquired disorders. Individuals with speech disorders might lose their speaking ability due to hearing impairment, encephalopathy or cerebral palsy accompanied by motor skill impairments, or autism caused by mental problems. However, they have needs for communication, so some of them use various types of AAC (Augmentative & Alternative Communication) devices in order to meet their communication needs. In this paper, a mobile application for literate people having speech disorder was designed and implemented by developing accurate and fast sentence-completion functions for efficient user interaction. From a user study and the previous study on Korean text-based communication for adults having difficulty in speech communication, we identified functionality and usability requirements. Specifically, the user interface with scanning features was designed by considering the users' motor skills in using the touch-screen of a mobile device. Finally, we conducted the usability test for the application. The results of the usability test show that the application is easy to learn and efficient to use in communication with people with speech disorders.

화자 적응 기술을 이용한 한국어 화자 확인 (Korean Speaker Verification Using Speaker Adaptation Methods)

  • 최동진;오영환
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 춘계 학술대회 발표논문집
    • /
    • pp.139-142
    • /
    • 2006
  • Speaker verification systems can be implemented using speaker adaptation methods if the amount of speech available for each target speaker is too small to train the speaker model. This paper shows experimental results using well-known adaptation methods, namely Maximum A Posteriori (MAP) and Maximum Likelihood Linear Regression (MLLR). Experimental results using Korean speech show that MLLR is more effective than MAP for short enrollment utterances.

  • PDF

전자기기 사용이 불편한 장애인이나 노인들을 위한 새로운 인터페이스에 대한 연구 (A study of new interface system for the disabled and old people who do not well using electronic equipment)

  • 정성부;김주웅
    • 한국정보통신학회논문지
    • /
    • 제16권12호
    • /
    • pp.2595-2600
    • /
    • 2012
  • 본 연구에서는 전자기기의 사용이 불편한 장애인이나 노인들을 위한 새로운 인터페이스를 제안한다. 제안한 방식은 대부분의 전자기기에 적용되고 있는 물리적 스위치 방식의 인터페이스를 마이크와 3축 가속도 센서가 달린 헤드셋을 이용하여 음성인식과 모션인식을 통해 전자기기를 사용하는 방식이다. 음성인식은 마이크를 통해 명령이 전달되고 음성인식 모듈을 통해 PC의 마우스를 컨트롤한다. 그리고 모션인식은 머리를 움직여 헤드셋에 있는 3축 가속도 센서가 마우스 포인터를 제어하여 명령을 수행하게 된다. 제안한 인터페이스 방식의 유용성을 확인하기 위해 헤드셋을 제작하고, 제작된 헤드셋을 이용하여 실험실과 식당, 도서관 등에서 실험을 한다.

Interaction using Speech and a Virtual Stick in a CAVE

  • Fujishiro, Kanzan;Takahashi, Hiroki;Nakajima, Masayuki
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵 KOBA Broadcasting Technology Workshop
    • /
    • pp.207-212
    • /
    • 1999
  • In VEs (virtual environments) such as a CAVE system, there are three important operations : executive command decision, object selection and 3-D (three-dimensional) pointing. It is necessary to implement these operations in VEs intuitively and accessibly. In CAVE, it is possible for examines to walk and change their viewpoints freely. Then, the input devices which have excellent portability and rich expression are desired. Speech input satisfies both requirements. It is, however, very difficult for the speech input to indicate an exact point in 3-D space. Therefore, an extendable virtual stick is employed and it supports speech input. This paper proposes a user friendly interface using speech and a virtual stick in CAVE system. In this paper, several applications appropriate for the proposed interface are developed. Some problems are pointed out from the applications.

자동차 환경내의 음성인식 자동 평가 플랫폼 연구 (A Study of Automatic Evaluation Platform for Speech Recognition Engine in the Vehicle Environment)

  • 이성재;강선미
    • 한국통신학회논문지
    • /
    • 제37권7C호
    • /
    • pp.538-543
    • /
    • 2012
  • 주행 중 차량내의 음성인터페이스 에서 음성인식기의 성능은 가장 중요한 부분이다. 본 논문은 차량내 음성인식기의 성능 평가를 자동화하기 위한 플랫폼의 개발에 대한 것이다. 개발된 플랫폼은 주 프로그램, 중계 프로그램 데이터베이스 관리, 통계산출 모듈로 구성된다. 성능 평가에 있어 실제 차량의 주행 조건을 고려한 시뮬레이션 환경이 구축되었고, 미리 녹음된 주행 노이즈와 발화자의 목소리를 마이크를 통해 입력하여 실험하였다. 실험 결과 제안하는 플랫폼에서 얻어진 음성인식 결과의 유효성이 입증되었다. 제안한 플랫폼으로 사용자는 음성인식의 자동화와 인식결과의 효율적인 관리 및 통계산출을 함으로서 차량 음성인식기의 평가를 효과적으로 진행할 수 있다.

Multimodal Interface Based on Novel HMI UI/UX for In-Vehicle Infotainment System

  • Kim, Jinwoo;Ryu, Jae Hong;Han, Tae Man
    • ETRI Journal
    • /
    • 제37권4호
    • /
    • pp.793-803
    • /
    • 2015
  • We propose a novel HMI UI/UX for an in-vehicle infotainment system. Our proposed HMI UI comprises multimodal interfaces that allow a driver to safely and intuitively manipulate an infotainment system while driving. Our analysis of a touchscreen interface-based HMI UI/UX reveals that a driver's use of such an interface while driving can cause the driver to be seriously distracted. Our proposed HMI UI/UX is a novel manipulation mechanism for a vehicle infotainment service. It consists of several interfaces that incorporate a variety of modalities, such as speech recognition, a manipulating device, and hand gesture recognition. In addition, we provide an HMI UI framework designed to be manipulated using a simple method based on four directions and one selection motion. Extensive quantitative and qualitative in-vehicle experiments demonstrate that the proposed HMI UI/UX is an efficient mechanism through which to manipulate an infotainment system while driving.

GMM based Nonlinear Transformation Methods for Voice Conversion

  • Vu, Hoang-Gia;Bae, Jae-Hyun;Oh, Yung-Hwan
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 추계 학술대회 발표논문집
    • /
    • pp.67-70
    • /
    • 2005
  • Voice conversion (VC) is a technique for modifying the speech signal of a source speaker so that it sounds as if it is spoken by a target speaker. Most previous VC approaches used a linear transformation function based on GMM to convert the source spectral envelope to the target spectral envelope. In this paper, we propose several nonlinear GMM-based transformation functions in an attempt to deal with the over-smoothing effect of linear transformation. In order to obtain high-quality modifications of speech signals our VC system is implemented using the Harmonic plus Noise Model (HNM)analysis/synthesis framework. Experimental results are reported on the English corpus, MOCHA-TlMlT.

  • PDF

음성 입출력 API를 이용한 모바일 접근성 지원 인터페이스 구현 (Implementation of Interface to Support Mobile Accessibility Using Speech I/O APIs)

  • 오승철;윤영선
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권1호
    • /
    • pp.71-80
    • /
    • 2013
  • 최근에 모바일 기기의 확산으로 인하여 모바일 접근성에 대한 많은 논의가 이뤄지고 있다. 모바일 접근성이란 모바일 기기를 사용하여 애플리케이션을 이용하고자 하는 장애인, 고령자 등을 포함한 모든 사람들에게 모바일 기기의 활용 가능성이 제공됨을 말한다. 본 논문에서는 음성 서비스 기술을 이용하여 모바일 접근성을 향상하기 위한 인터페이스를 제안하고 구현하였다. 제안된 방법은 안드로이드 스마트폰에서 구현하였으며, 시스템에서 제공하는 음성 인식과 음성 합성 기술을 이용하였다. 또한, 전맹인과 저시력자들의 인터넷 접근을 도와주기 위하여 접근성을 고려한 웹 리더 기능을 응용 프로그램 차원에서 설계하고 구현하였다.

착용형 단말에서의 음성 인식과 제스처 인식을 융합한 멀티 모달 사용자 인터페이스 설계 (Design of Multimodal User Interface using Speech and Gesture Recognition for Wearable Watch Platform)

  • 성기은;박유진;강순주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권6호
    • /
    • pp.418-423
    • /
    • 2015
  • 기술 발전에 따른 착용형 단말의 기능들은 더 다양하고 복잡해지고 있다. 복잡한 기능 때문에 일반 사용자들도 기능을 사용하기 힘든 경우가 있다. 본 논문에서는 사용자에게 편리하고 간단한 인터페이스 방식을 제공하자는데 목적을 두고 있다. 음성 인식의 경우 사용자 입장에서 직관적이고 사용하기 편리할 뿐만 아니라 다양한 명령어를 입력할 수 있다. 하지만 음성 인식을 착용형 단말에서 사용할 경우 컴퓨팅 파워라든지 소모전력 등 하드웨어적인 제약이 있다. 또한 착용형 단말은 언제 사용자가 음성으로 명령을 내릴지 그 시점을 알 수가 없다. 따라서 명령을 입력 받기 위해서는 음성 인식이 항상 동작하여야 한다. 하지만 소모전력 문제 때문에 이와 같은 방법을 사용하기에는 무리가 있다. 음성 인식이 가지고 있는 문제점을 보완하기 위해 제스처 인식을 사용한다. 본 논문에서는 음성과 제스처를 혼합한 멀티 모달 인터페이스로 사용자에게 어떻게 편리한 인터페이스를 제공할 것인지에 대해 설명하고 있다.