• 제목/요약/키워드: 음성사용자인터페이스

검색결과 197건 처리시간 0.027초

장애인을 위한 멀티모달 인터페이스 기반의 홈 네트워크 제어 (Home Automation Control with Multi-modal Interfaces for Disabled Persons)

  • 박희동
    • 디지털융복합연구
    • /
    • 제12권2호
    • /
    • pp.321-326
    • /
    • 2014
  • 최근 장애인을 위한 IT 접근성 향상 기술에 대한 요구가 증대되고 있다. 따라서 장애인 IT 사용자를 위하여 음성 인식, 영상 인식, TTS 등과 같은 멀티모달 인터페이스를 지원하는 것이 매우 중요하다. 본 논문에서는 홈 네트워크 제어에 있어서 장애인 IT 접근성 향상 기술의 적용 방안에 대하여 서술한 후, 장애인이 쉽게 홈 네트워크를 제어할 수 있도록 음성 인식 및 애니메이션 UI (User interfaces)등과 같은 멀티모달 인터페이스 기반의 홈 네트워크 제어 시스템 모델을 구현하였다.

DTW방식을 이용한 음성 명령에 의한 커서 조작 (Cursor Moving by Voice Command using DTW method)

  • 추명경;손영선
    • 한국지능시스템학회논문지
    • /
    • 제11권1호
    • /
    • pp.82-87
    • /
    • 2001
  • 본 논문에서는 마우스 대신에 음성으로 명령을 입력하여 퍼지 추론을 통해 위도우 화면상의 커서를 이동시키는 인터페이스를 구현하였다. 입력된 음성이 대체로 짧은 언어이기에 이를 인식하기 위하여 고립단어 인식에 강한 DTW방식을 사용하였다. DTW방식의 단점중인 하나가 음성길이가 비슷한 명령을 입력하였을 때 표준패턴 중 오차 값이 가장 작은 패턴으로 인식하는 것이다. 예를 들면 \"아주 많이 이동해\"하는 음성이 입력되었을 때 비슷한 음성길이를 가진 \"아주 많이 오른쪽\"으로 인식하는 경우가 있다. 이런 오류를 해결하고자 각 패턴의 DTW오차 거리 값과 표준 패턴의 음성길이를 기준으로 임계값을 퍼지 추론하여 명령으로서의 수락 여부를 결정하였다. 판단이 애매한 부분은 사용자에게 질의를 하여 응답에 따라 수락 여부를 결정하였다.

  • PDF

웹 브라우저 상에서 한국어 음성인식을 이용한 정보검색 시스템 (Information Retrieval System Using Korean Speech Recognition on the Web Browser)

  • 이항섭
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.35-38
    • /
    • 1998
  • 웹 브라우저 상에서 한국어 음성인식을 이용한 정보검색 시스템에 대한 것이다. 이 시스템의 특징은 웹 브라우저 상에서 보여지는 Hypertext Word를 인식할 수 있는 거승로 기존의 웹 브라우저를 마우스 click 대신 음성인식을 이용하여 사용할 수 있다는 것이다. 웹 브라우저를 통해서 보여지는 고정되지 않고 계속 하여 변화하는 인식후보를 인식하기 위해 당 연구실에서 개발한 가변 어휘 인식기를 사용하였다. 시스템은 windows 95/NT 환경에서 개발되었으며, 사용자가 새로운 인터페이스를 배울 필요 없이 바로 사용할 수 있도록 사용자 편의성 부분도 고려하여 개발되었다. 개발된 시스템은 독립 환경, 독립 화자에 대해 실험한 결과 130여개의 단어에 대해 편균 90% 정도의 인식성능을 보인다.

  • PDF

웨어러블 컴퓨터의 인터페이스를 위한 사용자 행동의 의미추출과 적용가능성에 관한 연구 (A Study on the Extraction of the Meaning in the User Behavior and the Possibility to Apply for the Interface of the Wearable Computer)

  • 권숙경;정지홍
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.112-117
    • /
    • 2006
  • 웨어러블 컴퓨터는 사용자를 중심으로 의복과 기술이 결합된 기기로서 직관적이며 유연한 인터페이스가 요구된다. 현재 직관적인 입력방식으로 음성인식과 동작인식에 대한 연구가 활발하게 진행되고 있다. 동작인식의 경우 손동작을 이용한 장갑형태가 가장 많으며, 대부분 사용자 행동의 의미를 고려하지 않은 인위적인 제스처로 학습을 필요로 한다. 본 연구에서는 사용자가 일상적으로 하는 행동에서 의미를 추출하고, 웨어러블 컴퓨터의 인터페이스로서 적용가능성을 보고자 한다. 행동은 자극에 대한 신체의 움직임이다. 문헌을 통하여 신체의 움직임에 대한 66개의 동사를 추출하고 구체적인 움직임에 구문조사를 실시하였다. 조사된 구문에 대한 상황과 의미를 조사한 결과 행동은 의미에 따라 감정표현, 의사전달, 정보교류, 자기제어, 기기제어, 무의식적, 의례적의 7가지로 분류할 수 있었다. 그 중 의사소통과 대상을 제어하기 위한 행동을 중심으로 접근하였다. 행동의 의미와 현재 사용되고 있는 UI의 의미를 비교하여 인터페이스를 대응시켜 보았다.

  • PDF

음성인터페이스 기술 개요 및 스마트폰 환경에서의 서비스 동향

  • 이윤근
    • 정보와 통신
    • /
    • 제29권4호
    • /
    • pp.3-9
    • /
    • 2012
  • 본고에서는 최근 스마트폰 등에서 사용자에게 편리한 인터페이스 수단으로 활용되고 있는 음성인식 기술에 대하여 알아본다. 음성인식 기술은 컴퓨터가 인간의 말을 알아듣는 기술로서 50년 이상의 연구개발 역사를 가지고 있다. 그간 꾸준한 기술개발과 상용화 시도를 통하여 지속적인 발전을 이루어왔으며 최근 들어 스마트폰 활성화에 따라 관심도가 급속히 높아지고 있는 분야이다. 음성인식 기술은 언어와 관련된 기술이니만큼 기술측면과 시장측면에서의 특수성이 있으며 이를 충분히 고려한 연구개발전략이 수립되어야 한다. 현재, 구글, 애플, 마이크로소프트 등 세계적인 IT 선도기업이 음성인식 기술 개발에 많은 노력을 기울이고 있으며 특히 스마트폰 환경에서의 음성인식 응용 서비스인 음성검색, 자동통역, 인공지능 개인비서 등을 시작하며 본격적인 기술, 시장 선점 경쟁에 돌입하였다. 이들 서비스에 대하여 자세히 알아보고 이에 따른 시사점 및 국내 대응현황에 대해 알아본다.

통합 사용자 인터페이스에 관한 연구 : 인공 신경망 모델을 이용한 한국어 단모음 인식 및 음성 인지 실험 (A Study on the Intelligent Man-Machine Interface System: The Experiments of the Recognition of Korean Monotongs and Cognitive Phenomena of Korean Speech Recognition Using Artificial Neural Net Models)

  • 이봉규;김인범;김기석;황희융
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.101-106
    • /
    • 1989
  • 음성 및 문자를 통한 컴퓨터와의 정보 교환을 위한 통합 사용자 인터페이스 (Intelligent Man- Machine interface) 시스템의 일환으로 한국어 단모음의 인식을 위한 시스템을 인공 신경망 모델을 사용하여 구현하였으며 인식시스템의 상위 접속부에 필요한 단어 인식 모듈에 있어서의 인지 실험도 행하였다. 모음인식의 입력으로는 제1, 제2, 제3 포르만트가 사용되었으며 실험대상은 한국어의 [아, 어, 오, 우, 으, 이, 애, 에]의 8 개의 단모음으로 하였다. 사용한 인공 신경망 모델은 Multilayer Perceptron 이며, 학습 규칙은 Generalized Delta Rule 이다. 1 인의 남성 화자에 대하여 약 94%의 인식율을 나타내었다. 그리고 음성 인식시의 인지 현상 실험을 위하여 약 20개의 단어를 인공신경망의 어휘레벨에 저장하여 음성의 왜곡, 인지시의 lexical 영향, categorical percetion등을 실험하였다. 이때의 인공 신경망 모델은 Interactive Activation and Competition Model을 사용하였으며, 음성 입력으로는 가상의 음성 피쳐 데이타를 사용하였다.

  • PDF

ISDN 사용자 정보의 비밀보장을 위한 키 분배 및 인증 방법 (A Method on Key Distribution and Authentication for the Confidentiality of ISDN User Information)

  • 권태경;강명호;송주석
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 1994년도 종합학술발표회논문집
    • /
    • pp.263-274
    • /
    • 1994
  • 협대역 ISDN은 사용자-망 인터페이스가 디지탈화되므로 사용자 정보를 보호하기 위한 기능을 비교적 저렴하게 사용자-망 인터페이스에서 제공할 수 있다. 그러나 음성, 화상, 데이타 등 정보의 종류가 다양하고 여러 채널을 통한 다양한 서비스 기능이 있으므로 실제적인 구현에는 많은 어려움이 따른다. 이러한 문제들을 고려하여 본 논문에서는 ISDN 사용자 정보의 비밀보장 서비스를 위한 키 분배 및 인증 방법을 제안하였다. 따라서 먼저 ITU-T(구 CCITT) 권고안의 표준을 중심으로 ISDN 사용자-망 인터페이스의 구조와 ISDN의 각종 서비스에서 우려되는 정보침해 요소론 분석한 후, 이 분석 자료를 근간으로 하여 비밀보장 서비스를 위한 기본적인 정책을 수립하고 적합한 프로토콜 구조를 제안하였다. 그리고 Diffie-Hellman이 제안한 공개키 분배방식을 기반으로 하여, 호(Call)설정시 Q.931 메세지 교환을 통하여 키 분배 및 인증이 안전하게 이루어지도록 적합한 키 분배 프로토콜을 제안하였으며, 키의 분배 및 인증의 명확성 여부를 GNY 로직을 이용하여 검증하였다.

  • PDF

퍼지 추론을 이용한 음성 명령에 의한 커서 조작 (Cursor Moving by Voice Command using Fuzzy Inference)

  • 추명경;손영선
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
    • /
    • pp.209-212
    • /
    • 2000
  • 본 논문에서 마우스 대신에 음성으로 명령을 입력하여 퍼지 추론을 통해 윈도우 화면상의 커서를 이동시키는 인터페이스를 구현하였다. 입력된 음성이 대체로 짧은 언어이기에 이를 인식하기 위하여 고립단어 인식에 강한 DTW방식을 사용하였다. DTW방식의 단점중인 하나가 음성길이가 비슷한 명령을 입력하였을 때 표준패턴 중 오차 값이 가장 작은 패턴으로 인식하는 것이다. 예를들면 아주 많이 이동해 라는 음성이 입력되었을 때 동일한 음성길이를 가진 아주 많이 오른쪽으로 인식하는 경우가 있다. 이런 오류를 해결하고자 각 패턴의 DTW 오차 값 범위와 표준 패턴의 음성길이를 기준으로 임계값을 퍼지 추론하여 명령으로서 수락 여부를 결정하였다. 판단이 애매한 부분은 사용자에게 질의를 하여 응답에 따라 수락 여부를 결정하였다.

  • PDF

자연어 음성인식 기술을 이용한 음성 대화 서비스 개발동향 (Spoken Dialogue Service Trends Using Natural Speech Recognition Technology)

  • 정호영;송화전;강병옥;정의석;정훈;오유리;권오욱;이기영;이윤근
    • 전자통신동향분석
    • /
    • 제26권5호
    • /
    • pp.14-28
    • /
    • 2011
  • 모바일 혁명과 빅데이터(big data) 시대에 접어들면서 사용자 중심의 자연스러운 인터페이스와 정보검색에 대한 요구가 늘어가고 있다. 모바일 환경에서의 쉽고 자연스러운 검색을 위해 음성인식 기술을 이용한 음성검색 서비스가 대세를 이루고 있으며 대화형 검색 서비스로 발전하게 될 것이다. 음성 대화 서비스의 주요 응용 분야인 음성검색 및 외국어 교육 서비스에서의 자연어 음성인식 기술 역할 및 사용자 경험을 바탕으로 하는 선순환 구조의 인식 성능 개선에 대해 소개한다. 또한 두 응용분야에서의 국내외 개발동향을 소개하고 실제 개발 사례를 통해 무제한급 자연어 음성인식 기술에 기반한 음성 대화 서비스의 가능성을 살펴본다.

  • PDF