• 제목/요약/키워드: 음성사용자인터페이스

검색결과 198건 처리시간 0.027초

정보검색 시스템의 음성 인터페이스 구현 (Implementation of the Speech Interface for Information Retrieving System)

  • 김정철;배건성
    • 전자공학회논문지S
    • /
    • 제36S권5호
    • /
    • pp.104-111
    • /
    • 1999
  • 본 논문에서는 HMM 고립단어인식 기술을 이용하여 정보 사용자들이 윈도즈 환경에서 편리하게 정보를 검색할 수 있는 시스템을 구현하였다. 인식 시스템에서 인식단위로 유사음소모델을 이용하여 인식어의 확장성을 고려하였고 기본모델은 SPHINX 시스템에서 사용하는 형태의 음소모델을 연속분포 HMM으로 구현하였다. 정보검색 도구에서는 기능을 단순화하고 검색절차를 음성으로 출력하도록 하여 사용자의 편의성을 고려하였다.

  • PDF

자동차 환경내의 음성인식 자동 평가 플랫폼 연구 (A Study of Automatic Evaluation Platform for Speech Recognition Engine in the Vehicle Environment)

  • 이성재;강선미
    • 한국통신학회논문지
    • /
    • 제37권7C호
    • /
    • pp.538-543
    • /
    • 2012
  • 주행 중 차량내의 음성인터페이스 에서 음성인식기의 성능은 가장 중요한 부분이다. 본 논문은 차량내 음성인식기의 성능 평가를 자동화하기 위한 플랫폼의 개발에 대한 것이다. 개발된 플랫폼은 주 프로그램, 중계 프로그램 데이터베이스 관리, 통계산출 모듈로 구성된다. 성능 평가에 있어 실제 차량의 주행 조건을 고려한 시뮬레이션 환경이 구축되었고, 미리 녹음된 주행 노이즈와 발화자의 목소리를 마이크를 통해 입력하여 실험하였다. 실험 결과 제안하는 플랫폼에서 얻어진 음성인식 결과의 유효성이 입증되었다. 제안한 플랫폼으로 사용자는 음성인식의 자동화와 인식결과의 효율적인 관리 및 통계산출을 함으로서 차량 음성인식기의 평가를 효과적으로 진행할 수 있다.

위치 기반 교통 신호 안내 시스템의 사용자 인터페이스 설계 (The Design of User Interface for Location Based Traffic Guide Signal System)

  • 고기남;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1111-1112
    • /
    • 2011
  • 본 연구는 최근 널리 보급된 스마트 모바일 단말의 제한된 디스플레이에서 사용자에게 짧은 시간에 효율적으로 핵심 정보를 제공함으로써 사용자 편의성을 향상 시킬 수 있는 사용자 인터페이스(User Interface, UI)를 연구하기 위해 사용자 위치 기반 교통 신호 안내 시스템(Location Based Traffic Signal Guide System, LBTGS) 의 UI 설계에 관한 연구이다. 시각 정보와 음성 정보를 활용하여 짧은 시간에 사용자가 전방 교통 신호 정보를 인지하도록 하여 안전한 도로 운행에 반영할 수 있는 UI 를 효과적으로 설계함으로써 신호 위반으로 인한 교통 사고의 발생을 감소시킬 수 있다. 또한 보다 직관적으로 짧은 시간에 인식할 수 있는 UI 를 설계하여 스마트 모바일 단말의 제한된 디스플레이에서 향상된 사용자 경험을 제공할 수 있을 것으로 기대한다.

Component 기반 Interactive Multimedia Webboard 시스템의 설계 및 구현 (Design and Implementation of Multimedia Webboard System Using Component Technology)

  • 곽미라;김도년;강민숙;조동섭
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1999년도 하계학술대회 논문집 G
    • /
    • pp.2968-2970
    • /
    • 1999
  • 본 논문에서는 컴포넌트 기술을 기반으로 한 인터액티브 멀티미디어 웹보드 시스템을 설계, 구현하고 있다. 이 시스템은 문서를 게시하고 파일을 첨부하는, 일반적인 웹 기반의 게시판을 확장한 것으로, 이러한 기본적 기능 외에 사용자로 하여금 동영상, 음성, 정지영상을 캡쳐하여 전송할 수 있도록 하는 기능을 제공한다. 이와 같은 작업은 ActiveX 컨트롤이 임베드된 웹 페이지 상에서 이루어지므로, 사용자에게는 브라우저 외의 별도의 프로그램이 요구되지 않는다. 이 시스템을 구성하는 주요한 기술적 요소에는 컴포넌트 기술, 웹 데이터베이스 기술 등이 있다. 컴포넌트 기술을 통해 자체적인 인터페이스를 가진 동영상 정지영상, 음성 캡쳐기능의 ActiveX 컨트롤을 구현하였고, MS SQL Server와 ASP를 이용한 웹 데이터베이스 기술을 통해 인터액티브한 인터페이스를 제공하였다.

  • PDF

사용자 제스처 인식을 활용한 유비쿼터스 홈 네트워크 인터페이스 체계에 대한 연구 (A Study on the Ubiquitous Home Network Interface System by Application of User's Gesture Recognition Method)

  • 박인찬;김선철
    • 감성과학
    • /
    • 제8권3호
    • /
    • pp.265-276
    • /
    • 2005
  • 현재의 유비쿼터스 환경의 홈 네트워크 제품 사용자는 단일 사용자가 아닌 다수의 사용자가 사용하는 네트워크 행태를 취하고 있다. 변화하는 사용환경과 시스템들은 현재와는 다른 요구사항을 가지고 있으며, 이에 따른 사용자 중심의 디자인과 제품 인터페이스 체계의 연구활동은 국내외에서 활발하게 이루어지고 있다. 다양한 모바일 디바이스 및 홈 네트워크 제품의 보급화가 빠르게 성장하면서 이를 쉽게 제어하기 위한 다양한 제어방식이 연구되고 있다. 이중 음성인식기술을 비롯한 표정은 안면표정인식기술의 개발이 활발히 진행되고 있다. 모션감지 센서를 활용한 사용자 제스처 콘트롤 체계는 아직까지는 초보적인 단계에 있으나, 제품 제어에 있어서 향후 근미래에는 자연스러운 인터랙티브 인터페이스의 활용도가 높아질 전망이다. 이에 본 연구에서는 효과적인 디바이스 제어를 위한 제스처 유형의 자연스러운 사용언어체계 개발 방법 및 결과 그리고 사용자 맨탈모델와 메타포 실험을 통한 연구내용을 정리하였다. 기존 사용자의 제스처 유형의 자연스러운 사용언어를 분석하면서 디바이스 제어방식으로서 활용 가능성을 검토할 수 있었으며, 동작 감지 카메라 및 센서를 활용한 새로운 디바이스 제어방식 개발과정의 연구를 통하여 제스처 유형의 자연스러운 언어 체계 개발 및 과정을 정립하였다.

  • PDF

HMM을 이용한 음성인식 시스템의 전처리에 관한 연구 (A Study of Preprocessing in the Speech Recognition System Using HMM Algorithm)

  • 이윤주;오세영;이순규;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.668-671
    • /
    • 1999
  • 현대 사회의 컴퓨터 사용자 계층은 점점 그 범위와 수가 커지고 있다 이러한 추세는 앞으로도 계속 증가할 것이다. 따라서 많은 사람들은 더 편리하고 익히기 쉬운 컴퓨터의 사용법을 원하고 생활속에서 더 많이 컴퓨터를 활용하기를 원한다. 그러므로 인간에게 가장 친숙한 음성을 이용함으로써 이런 사용자들의 필요를 충족시킬 수 있을 뿐 아니라 사용자가 쉽게 접할 수 있도록 할 수 있다. 그러므로 본 논문의 목적은 이러한 상황에서 인간과 기계와의 인터페이스를 인간의 기본적인 의사소통 수단인 음성을 이용하여 보다 빨리 작업 할 수 있게 하는 취지에 있다. 기존의 인식알고리즘은 그 복잡성이 높을수록 인식률은 증가하나 계산시간이 많이 걸린다는 단점이 있다. 이러한 계산시간의 증가는 윈도우환경의 컴퓨터 사용시 다른 프로그램의 실행에 지장을 줄 수 있다. 따라서 인식률은 증가시키면서 인식 시간은 감소시킬 수 있는 방법들이 필요하다. 본 논문에서는 컴퓨터 사용시 쓰이는 명령어를 기본으로 하여 보다 빠른 인식 처리를 수행하기 위해 기준 패턴의 후보자를 선정하는 방법을 제안한다

  • PDF

키넥트를 사용한 NUI 설계 및 구현 (A Design and Implementation of Natural User Interface System Using Kinect)

  • 이새봄;정일홍
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권4호
    • /
    • pp.473-480
    • /
    • 2014
  • 오늘날 컴퓨터의 사용이 대중화 되면서 키보드나 마우스와 같은 기존의 사용자 인터페이스에 비해 보다 편리하고 자연스러운 인터페이스에 대한 연구가 활발히 진행되면서, 최근 마이크로소프트의 동작 인식 모듈인 키넥트에 대한 관심이 높아지고 있다. 키넥트는 내장된 센서를 통해 신체의 주요 관절의 움직임 및 깊이 정보를 인식할 수 있으며 내장 마이크를 통해 간단한 음성인식도 가능하다. 본 논문에서는 OpenCV 라이브러리를 키넥트에 접목하여, 키넥트의 깊이 데이터, skeleton tracking, labeling 알고리즘으로 손 영역 추출 및 움직임의 정보를 인식하여 가상 마우스와 가상 키보드를 구현하고, 음성인식을 통해 기존 입력 장치의 기능을 구현하는 것을 목표로 한다.

사용자 인터페이스 에이젼트 환경을 위한 국어 발음 애니메이션 (Korean Talking Animation for User Interface Agent Environment)

  • 최승걸;이미승;김웅순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.284-297
    • /
    • 1996
  • 사용자가 컴퓨터와 자연스럽고 인간적으로 대화할 수 있고, 사람의 요구에 지능적인 해답을 능동적으로 제시할 수 있는 사용자 인터페이스 에이전트가 활발히 연구되고 있다. 음성, 펜, 제스쳐인식 등을 비롯한 다양한 방법을 통하여 사람의 의사전달방식을 컴퓨터의 입력수단으로 구현하여 사용자 편의성을 도모하고 있다. 본 논문에서는 컴퓨터를 블랙박스로 하고, 표면적으로 지능형 3차원 그래픽 얼굴 에이전트와 사용자가 의사소통을 하는 사용자 인터페이스를 대상으로 하였다. 컴퓨터가 단순문제 해결을 위한 도구에서 많은 정보를 다양한 매체를 통해 제공하는 보조자의 역할을 수행하게 되었기 때문에 위의 방법은 보다 적극적인 방법이라 할 수 있다. 이를 위한 기반 기술로써 국어를 발음하는 얼굴 애니메이션을 연구하였다. 발음을 표현하기 위한 데이터로써 디지털 카메라를 사용하여 입술 운동의 특징점의 위치를 조사하였고, 모델링 시스템을 개발하여 데이터를 입력하였다. 적은 데이터로도 복잡한 자유곡면을 표현할 수 있는 B-Spline곡면을 기본데이터로 사용하였기 때문에 애니메이션을 위한 데이터의 양 또한 줄일 수 있었다. 그리고 국어음소의 발음시간 수열에 대한 입술모양의 변화를 조사하여 발음소리와 입술 움직임을 동기화 시킨 발음 애니메이션을 구현하였다.

  • PDF

음성인식을 이용한 차량 번호 조회 시스템의 구현 (An Implementation of Car Number Retrieving System with Speech Recognition)

  • 윤철중;윤재선;홍광석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.127-130
    • /
    • 2000
  • 음성인식 기술은 사용자의 편리성을 제공하는 인터페이스로 많이 환용이 된다. 또한 음성이라는 특성상 새로이 기계를 작동하는 방법을 익히지 않아도 되며 빠르게 정보를 전달 할 수 있다. 본 논문에서는 음성인식 기술을 차량 번호를 조회하는 단말기에 적용하였다. 이것은 기존의 단말기보다 입력이 간편하여 사용자에게 편리함을 제공한다. 또한 잦은 오류를 피할 수 있으며 오류가 발생했다 하더라도 쉽게 수정할 수 있는 기능을 제공한다

  • PDF

VoiceXML 음성 애플리케이션에 기반한 입시정보시스템 설계 및 구현 (Design and Implementation of UEEIS(University Entrance Examination Information System) Based on Voice Application of VoiceXML)

  • 하만석;윤용근;박수현
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2002년도 창립기념 학술대회
    • /
    • pp.268-274
    • /
    • 2002
  • 현재 대부분의 대학 입시정보시스템은 ARS 및 웹기반의 서비스를 병행하여 제공하고 있다. 기존 ARS 기반 시스템의 단점은 전화버튼만으로 입력이 제한된다는 점과 시스템의 구축 및 유지보수가 용이하지 않다는 점이다. 이러한 문제점을 해결하기 위하여 전화버튼뿐만 아니라 음성인식에 의한 입력이 가능한 VoiceXML 음성 애플리케이션을 도입하였다. VoiceXML 및 음성 애플리케이션을 활용하여 입시정보시스템을 설계 및 구현해 본 결과 이러한 문제점들을 상당부분 해결할 수 있었다. 그리고 미리 연관된 키워드를 등록하여 다양한 입력옵션을 제공함으로써 자연어 처리가 좀더 용이해졌다. 이는 XML의 최대장점인 다양한 확장성과 응용성이 향상되는 것이며 사용자에게 기존 시스템보다 훨씬 개선된 사용자 인터페이스를 제공할 수 있게 된 것이다. 또한 기존 웹기반의 서비스에 쉽게 연동이 가능하고 유지보수 또한 기존 시스템보다 쉽게 할 수 있다.

  • PDF