Development of a Voice User Interface for Web Browser using VoiceXML

VoiceXML을 이용한 VUI 지원 웹브라우저 개발

  • Published : 2005.04.01

Abstract

The present web informations are mainly described in terms of HTML, which users obtain through input devices such as mouse, keyboard, etc. Thus the existing GUI environment have not supported human's most natural information acquisition means, that is, voice. To solve the problem, several vendors are developing voice user interface. However these products are deficient in man -machine interactivity and their accommodation of existing web environment. This paper presents a VUI(Voice User Interface) supporting web browser by utilizing more and more maturing speech recognition technology and VoiceXML, a markup language derived from XML. It provides users with both interfaces, VUI as well as GUI. In addition, XML Island technology is applied to the bowser in a way that VoiceXML fragments are nested in HTML documents to accommodate the existing web environment. Also for better interactivity, dialogue scenarios for menu, bulletin, and search engine are suggested.

현재의 웹정보들은 주로 HTML로 기술되어 있으며, 이러한 정보를 얻기 위해 사용자들은 마우스와 키보드와 같은 입력장치를 사용한다. 이와 같이 기존의 GUI 환경은 인간의 가장 자연스러운 정보획득 수단의 하나인 음성을 지원하지 못하고 있다. 이러한 문제를 해결하기 위해 음성 인터페이스를 가진 여러 제품들이 개발되고 있다. 하지만 이들은 상호대화성이나 기존 웹환경을 수용한다는 측면에서 부족한 면을 가지고 있다. 본 논문에서는 현재 무르익어 가는 음성인식 기술과 XML의 파생언어인 VoiceXML을 이용하여, 기존의 인터페이스 환경을 XML 기반의 대화형 음성인터페이스 환경으로 대체하고자 한다. 이를 통해 기존의 인터페이스 환경을 수용한 VUI(Voice User Interface) 환경을 사용자에게 제공할 수 있다. 기존의 환경을 수용하기 위해 "XML Island" 기술을 이용하여 VoiceXML 문서를 HTML 문서에 포함시키며, 대표적인 정보획득화면인 메뉴, 게시판, 검색 엔진에 대한 대화형 음성 시나리오를 제안하고 있다.

Keywords

References

  1. 홍용택, XML과 VoiceXML의 효율적인 통합방안 제시, 군산대학교 석사학위논문, 2002년 2월
  2. VoiceXML 포럼, http://www.voicexml.org
  3. IBM, http://www-4.ibm.com/software/webservers/appserv
  4. IBM, http://www-4.ibm.com/software/speech/enterprise/vtoolkit.html
  5. 김경란, VoiceXML 기반 음성 브라우저의 설계 및 구현, 성신여자대학교 전산학과 석사학위논문, 2001
  6. VoiceXML 포털사이트, http://www.voicexmlplanet.com
  7. 월드와이드웹 컨소시엄, http://www.w3.org/Submission/2001/13/
  8. T.Raman, 'Cascaded speech style sheets,' in Proc. Syxth International World Wide Web Conference(M. R. Genesereth and A. Patterson, eds.), Santa Clara, CA, pp.109-117, 1887
  9. Kuansan Wang, 'SALT: A SPOKEN LANGUAGE INTERFACE FOR WEB-BASED MULTlMODAL DIALOG SYSTEMS,' ICSLP, 2002
  10. Peter j. Danielsen, 'The Promise of a VoiceEnabled Web,' IEEE Computer, VOL.33, NO.3, pp.104-106, Aug. 2000 https://doi.org/10.1109/2.863988
  11. 마이크로 소프트웨어, 2000년 9월
  12. about XML, 박재호. 저, 2001년 1월
  13. 마이크로소프트 닷넷, http://www.microsoft.com/net/
  14. 김경란, 홍기형, 'VXML 편집기와 음성 브라우저의 설계 및 구현', 한국정보과학회 춘계학술발표 논문집, 제 27권 제 1호, pp.414-416, 2002년 4월
  15. 보이스엔조이, http://www.voiccnioy.co.kr
  16. 미디어포드, http://www.mediaford.co.kr
  17. 신현경, 추상구문트리 기반의 VoiceXML 해석기 설계 및 구현, 숭실대학교 컴퓨터과학과 석사학위논문, 2001년 6월
  18. 마이크로소프트 스피치, http://www.microsoft.com/speech/
  19. 보이스닉, http://www.voicenic.co.kr
  20. 보이스웨어, http://www.voiceware.co.kr/