Design and Implementation of Korean Voice Web Browser

한국어 음성 웹브라우저 설계 및 구현

  • 장영건 (청주대학교 컴퓨터정보공학과) ;
  • 조경환 (삼양데이타시스템(주) R&D팀 연구원)
  • Published : 2001.10.01

Abstract

This paper is addressed to a design and implementation of Korean voice web browser using voice technologies for controling web browser and selecting contents in the web document, and converting them to voice after HTML analysis. Main feature of this web browser is universal design which considers both of normal person and visual disabled, allows multi-modal interface. As voice interface for visual disabled, it supports tree structure which allows to recognize web document structure easily by only voice guidance regardless of frame usage, can handle all elements described as tag in the web document, identify them as predefined different voice property according to element property. This method gets rid of additional guidance voice for element property without audio style sheet or additional programming effort.

본 논문은 HTML을 분석하여 추출된 내용을 음성으로 변환시키고, 웹 브라우저 제어 및 웹문서의 내용 지정을 위하여 음성인식을 사용하는 음성 웹 부라우저의 설계와 구현에 관한 것이다. 이 시스템의 특징은 보편적 설계기법을 사용하여 정상인과 시각장애인을 모두 고려하여 설계되었으며, 특히 시각장애인 인터페이스를 위하여 웹 문서의 구조를 쉽게 인식할 수 있는 트리 구조를 도입하였고, 웹 브라우저 상에 태그로 표현된 모든 요소를 추출하고, 각 요소에 따라 출력음성의 속성을 다르게 하여 별도의 요소 안내음성 출력이 없이 요소 특성을 인지할 수 있게 하였다. 이 방식은 음성 특징을 세부적으로 표현할 수 있는 청각 스타일 시트의 사용을 배제한 것으로써 웹 문서 작성자가 특별한 추가적 노력 없이, 사용자가 문서내의 구조와 요소들의 특징을 쉽게 인식할 수 있는 장점이 있다.

Keywords

References

  1. 'Voice Browser Activity,' http./zwwwwd.org/Voice/
  2. 김기원, 정지원, 송정길, '음성인식 웹 브라우저에 관한 연구', 한국정보처리학회 '96춘계 춘계학술발표 논문집, 1996.4
  3. 박찬용, 장병태, '시각장애자를 위한 인터넷 웹 브라우저 개발'. 대한전자공학회 추계학술발표 논문집, 제21권 2호, pp.829-832, 1998
  4. 이항섭 등, '웹 브라우저 상에서 한국어 음성인식을 이용한 정보검색시스템'. 음성통신 및 신호처리 워크샵 논문집, 제15회, pp.35-38, 1998
  5. 이항섭, '가변어휘 단어 인식기를 사용한 음성 명령 웹 브라우저', 한국음향학회지 제18권 2호, pp.48-52, 1999
  6. 김석일, (주)e-Trek Infodigm, '시각장애인용 인터넷 통합 솔루션 패키지 개발', 충북대학교 보도자료, 2000. 4. 18
  7. 이승수, 민경석, 주용덕, 김석일, '시각장애인을 위한 인터넷 솔루션의 구현', 한국정보과학회 제27회 춘계학술대회 논문집, 2000.4
  8. '보이스 익스플로러'. http://www.dnmtech.co.kr
  9. '홈페이지 리더', http://www.austin.ibm.com!sns!hpr. html
  10. http://iapanweb.lycos.co.kr/cgi-bin/unisoft_tg.cgi? URLNAME=www-vox.di. kit.ac.jp/nishi/work/ 2000-03-09-wit.html
  11. M. K. Brown, D. A. Dahl, 'Model Architecture for Voice Browser Systems,' W3C Working Draft, Dec, 1999, http://www.w3.org/TR/1999/WD-voice-architecture-19991223
  12. Dave Raggett, Ben-Natan, 'Voice Browser,' W3C Workshop, Jan, 1998, http://www.w3.org/TR/1998/ NOTE -voice-0128
  13. Mark R. Walker, Andrew Hunt, '음성 인터페이스 체제를 위한 음성 합성 마크업 언어 규칙', http:// www.w3.org/TR/2000/WD-speech - synthesis- 20000 808
  14. Nicole Yankelovich, Gina-Anne Levow, Matt Marx, 'Issues in Speech User Interfaces,' CHI '95 Proceedings papers, 1995
  15. Christian K et aI, 'A comparison of voice controlled and mouse controlled web browsing,' Proc. ACM ASSETS conference, Nov, 2000. https://doi.org/10.1145/354324.354345
  16. Chieko Asakawa et al, 'Annotation Based Transcoding for Nonvisual Web Access,' Proc, ASSET'OO, pp.172-179, Nov., 2000 https://doi.org/10.1145/354324.354588
  17. Hironobu Takagi et al, 'Transcoding Proxy for Nonvisual Access,' Proc. ASSET'OO. pp.164-171, Nov. 2000 https://doi.org/10.1145/354324.354371
  18. Eric Bergman et al,'Towards Accessible HumanComputer Interaction,' http://www.sun.com/access/ developers/updt.HCI.advance.html