• 제목/요약/키워드: 음성XML

검색결과 104건 처리시간 0.022초

사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션에 관한 연구 (A Study on VoiceXML Application of User-Controlled Form Dialog System)

  • 권형준;노용완;이현구;홍광석
    • 정보처리학회논문지B
    • /
    • 제14B권3호
    • /
    • pp.183-190
    • /
    • 2007
  • VoiceXML은 음성을 통해 웹 자원 탐색을 제공하기 위한 목적으로 설계된 XML 기반의 새로운 마크업 언어이다. VoiceXML로 만들어진 어플리케이션은 기계 주도 폼 다이얼로그 구조와 상호 주도 폼 다이얼로그 구조로 분류된다. 이와 같은 다이얼로그 구조들은 어플리케이션 개발자에 의해 서비스 시나리오가 결정되기 때문에 사용자가 자유롭게 웹 자원을 탐색하는 서비스를 구축할 수 없다. 본 논문에서는 사용자의 의도에 따라 서비스 시나리오가 결정되는 음성 웹 서비스의 구축을 위해 사용자 주도 폼 다이얼로그 시스템의 VoiceXML 어플리케이션 구조를 제안한다. 제안하는 어플리케이션은 사용자에 의해 요청된 정보로부터 인식 후보들을 자동적으로 검출하여 음성 앵커로 사용하고 각각의 음성 앵커론 새로운 음성 노드로 연결한다. 제안하는 시스템의 예로 IT 용어사전을 내장한 뉴스 서비스를 구현하여 음성 앵커의 검출 및 등록 여부를 확인하였고, 음성 인식률 및 사용자가 의도한 정보를 성공적으로 제공했는지 판단하는 척도가 되는 적중률과 응답 속도를 측정하였다. 실험 결과, 제안한 시스템이 기존의 VoiceXML 폼 다이얼로그 구조의 시스템보다 더 자유로운 웹 자원의 탐색이 가능함을 확인하였다.

VoiceXML을 사용한 상가 검색 음성인식 시스템의 설계 및 구현 (Design and Implementation of Store Locator Voice Recognition System Using VoiceXML)

  • 김우일;송성균;고경만;윤재석;김국보
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.138-143
    • /
    • 2002
  • 음성은 컴퓨터와 인간 사이의 인터페이스로서 지속적인 연구가 되어 왔다. VoiceXML로 구현된 음성 포털 서비스는 사용자의 음성 질의에 따라 정보를 검색하고 청취할 수 있는 기술로서 현재 다양한 컨텐츠로 서비스가 진행되고 있다. 본 연구에서는 전화나 인터넷 전화 프로그램으로 상가의 위치, 전화 번호, 상가 소개 등의 정보를 음성으로 검색할 수 있는 시스템을 VoiceXML을 이용하여 구현하여 보았다. 웹과 연동할 수 있도록 시스템을 구성하고 다양한 다이얼로그를 표현하기 위해 특히, JSP를 이용하고 각 로직을 자바빈즈 컴포넌트로 구현하였다.

  • PDF

산업용 음성 DB 메타데이터 표준화 (Standardization of XML based Meta-data for Industrial Speech Databases)

  • 주영희;홍기형
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 추계 학술대회 발표논문집
    • /
    • pp.211-214
    • /
    • 2005
  • 본고에서는 산업용 음성 DB를 위한 XML 기반 메타데이터의 표준화에 대한 현재 상황과 표준화 활동에 대하여 소개한다. 산업용 음성 DB는 구축에 많은 시간과 비용을 요구하며, 양질의 음성 처리 시스템 (인식/합성/인증)의 개발을 위해서는 가능한 많은 양의 음성 데이터가 필요하다. 산업용 음성 DB 메타데이터 표준화는 서로 다른 기관에서 구축한 음성 DB의 공유와 재사용을 원활히 하기 위하여, 2004년 9월부터 요구사항 분석을 시작하여, 2005년 3월 초안이 완성되었다. 본 표준안은 음성 DB 메타데이터의 구조를 XML 기반으로 정의한 것이며, 음성 파일 이름, 화자 식별자, 음소 기호와 같은 구조 외의 표준화 대상에 대해서는 다루지 않는다. 이미 ETRI와 SiTEC [5]에서 XML 기반의 메타데이터 구조와 내용 표준안을 제안한 바 있으나. [5]에서 제안한 구조는 평면 구조를 취하고 있어 내용의 중복성등의 단점이 있어, 이를 보완하여 음성 DB 데이터 모델을 객체지향 방식으로 설계하였다.

  • PDF

IIS를 이용한 VoiceXML 실험 환경 구현 (An Implementation of VoiceXML Test Environment Using IIS)

  • 권형준;김정현;홍광석
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
    • /
    • pp.73-76
    • /
    • 2006
  • 유비쿼터스 컴퓨팅에서 중요한 기술 중 하나로 평가되는 음성인식 및 합성기술은 인간과 컴퓨터의 상호 작용에 있어 가장 편리하고 보편적인 방법이다. 음성인식 및 합성기술을 이용한 인간과 컴퓨터 상호작용 기반의 애플리케이션의 개발을 위해 음성 확장성 생성 언어(VoiceXML)을 이용하면 음성 인식 및 합성에 관한 전문 지식이 없어도 애플리케이션 제작을 쉽게 할 수 있다는 장점이 있어서 음성인식 및 합성기술의 인프라 구축과 저변 확대를 목적으로 일부 국내 업체들은 VoiceXML을 이용한 음성 애플리케이션을 제작하고 실험할 수 있도록 VoiceXML 실험 환경을 제공한다. 본 논문에서는 기존에 공개된 실험 환경을 소개하고, 다양한 실험 환경 제공을 위해 기존에 있던 Linux기반의 실험 환경과는 다른 Windows NT기반의 IIS(Internet Information Service)를 이용한 VoiceXML실험 환경을 제안하고 구현하였다. 그 결과 ASP(Active Server Page)와 ADO(ActiveX Data Object)를 이용한 VoiceXML음성 애플리케이션 실험이 가능한 환경을 구축하였고, 사용자 평가 결과 제안한 방법이 유효하다는 것을 확인하였다.

  • PDF

모바일 환경에서 VoiceXML기반의 VUI 개발에 관한 연구 (Study on Development of VUI Based on VoiceXML in Mobile Environment)

  • 임채욱;장민석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.539-542
    • /
    • 2003
  • 기존의 모바일 디바이스(휴대전화, PDA 등)의 인터페이스는 GUI 방식이 주류를 이루고 있으며 약간의 음성인식 기술이 접목되고 있는 실정이다. 그 음성인식 기술의 활용은 음성인식 다이얼링에 제한되어 있는 실정이다. 이러한 한계점을 극복하기 위해 본 논문에서는 VoiceXML 포럼에서 제안한 VoiceXML 버전 2.0 스펙을 따르는 VoiceXML을 모바일 환경에 적용시켜 음성인식 다이얼링 기능뿐만 아니라, 음성인식 및 합성 기술을 이용한 메뉴선택, 정보 청취 등의 기능을 가능하게 하는 목적으로 VoiceXML 기반의 VUI(Voice User Interface) 개발을 위한 요구사항을 제시하고자 한다. 기존의 GUI 방식뿐만 아니라 VUI 방식을 수용하게 함으로써 사용자들에게 인간친화적인 정보획득 환경을 제공할 것이다.

  • PDF

VoiceXML기반 HUVOIS 음성처리 솔루션 (HUVOIS speech service solution based on VoiceXML)

  • 김문식
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
    • /
    • pp.33-34
    • /
    • 2004
  • 통화 위주의 기능이 주류를 이루고 있던 전화 서비스시장에 다양한 정보를 제공하기 위한 첨단 부가서비스를 제공하기 위해서는 인터넷과의 연동, 음성인식, 음성합성, 음성녹음 등의 요소들을 제공할 수 있어야 하며, 여러 고객의 다양한 요구사항을 수용하기 위한 서비스 시나리오의 개발 방법이 제공되어야 한다. HUVOIS solution 은 WWW 콘서시엄의 표준에 따른 VoiceXML 2.0 인터프리터 엔진과 음성인식엔진, 음성합성엔진을 수용하였으며 신규 부가서비스를 쉽고 빠르게 제공할 수 있는 환경을 제공하기 위하여 개발되었다. 본 논문에서는 KT가 개발한 HUVOIS 솔루션과 이를 이용한 각종 서비스 및 사업에 대하여 기술하였다.

  • PDF

HTMLtoVoiceXML 변환기에 관한 연구 (A Study on HTMLtoVoiceXML Converter)

  • 최훈일;장영건
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.373-375
    • /
    • 2001
  • 음성 기술의 발달과 VoiceXML 1.0의 제정으로 인해 표준화된 방식으로 이동 단말기와 전화를 통해 음성으로 웹 컨텐츠에 접근할 수 있게 되였다. 거의 모든 웹 컨텐츠들은 HTML로 작성되어 있으며, 기존의 HTML로 작성된 수많은 웹 컨텐츠에 음성으로 접근하기 위해서는 HTML 문서들을 VoiceXML 문서로 변환하여야 한다. 이를 수동으로 변환하기 위해서는 많은 시간과 비용이 필요하게 된다. 본 논문에서는 이 문제를 해결하기 위해여 HTML 문서률 VoiceXML 문서로 자동 변환하는 HTMLtoVoiceXML변환기의 설계 방안을 제시하였다.

  • PDF

VoiceXML VUI Browser 설계/구현 (Design and Implementation of VoiceXML VUI Browser)

  • 장민석;예상후
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.788-791
    • /
    • 2002
  • 현재의 웹 환경은 HTML로 구성이 되어있으며 이로 인해 하이퍼링크를 따라가기 위해 마우스 클릭을 통해 작업하는 GUI 환경이 주를 이룬다. 하지만 이러한 방법은 인간이 가장 손쉽게 사용하는 음성과 비교해 볼 때 상당히 불편한 축에 속한다. 본 논문에서는 이를 해결하기 위해 현재 무르익은 음성인식/합성 기술과 전화기를 통해 정보를 제공하고자 하는 XML의 파생언어인 VoiceXML을 이용하여, 현재의 HTML주축인 GUI 웹 환경을 VoiceXML을 이용하여 VUI(Voice User Interface) 환경으로 전환해 주는 VoiceXML VUI Browser를 설계/구현하였다.

  • PDF

VoiceXML을 이용한 대화형 음성 인식 증권 거래 시스템 구현 (An Implementation of Interactive Voice Recognition Stock Trading System Using VoiceXML)

  • 조창수;신정훈;홍광석
    • 정보처리학회논문지B
    • /
    • 제11B권4호
    • /
    • pp.517-526
    • /
    • 2004
  • 본 논문에서는 음성 서비스 구현 시 개발시간을 단축시킬 수 있으며, 개발된 서비스간의 컨텐츠를 보다 자유롭게 공유할 수 있는 VoiceXML을 이용하여 응용서비스를 구현하였다. 현재까지의 음성 서비스 개발은 시스템 의존적인 API의 활용 및 C/C++등의 프로그래밍 언어나 전용 개발 도구를 사용하여 이루어져 왔다. 이로 인하여 각 응용서비스간 자원의 재활용이 어려운 실정이었다. 응용 서비스의 내용이 변경되어지거나 시스템이 바뀌게 되면 다시 프로그램을 작성하거나, 적절한 API로의 수정이 필요하였다. 이러한 문제점을 해결하기 위하여 최근에는 VoiceXML을 이용한 서비스 개발이 증가하고 있는 실정이다. 그러나 VoiceXML을 이용한 응용 서비스 구현시 실제 환경에서 발생되는 문제점 및 해결 방안에 대해서는 정확한 파학이 미비한 상황이다. 본 논문에서는 이러한 문제점들을 규명, 해결하기 위하여 VoiceXML에 기반을 둔 음성 인식 증권 거래 시스템을 구현하였으며, 서비스 구현 시 발생하는 문제점과 해결방안을 제시하였다. 또한, 구현 되어진 시스템을 토대로 응용서비스 및 시스템의 장단점을 분석한다.

RDBMS를 이용한 VoiceXML 문서 저장 시스템 설계와 구현 (Design and Implementation of VoiceXML Document Storage System Using RDBMS)

  • 박주현;진민
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.397-401
    • /
    • 2001
  • 대화형 음성 응답 시스템은 비용이 많이 들고 폐쇄된 환경에서만 개발이 가능했었지만 VoiceXML이라는 표준화된 문서의 개발로 인하여 새로운 국면을 맞이하게 되었다. 본 논문에서는 관계형 데이터베이스를 기반으로 한 다이얼로그 단위로 분리 저장하는 VoiceXML 문서 저장 시스템을 설계하고 구현하였다. 음성을 서비스할 수 있는 VoiceXML 문서를 관계 데이터베이스를 이용하여 VoiceXML 문서 저장 모델을 설계하고 VoiceXML 문서의 구조적 정보를 효과적으로 표현하고 저장하는 방법을 제안한다.

  • PDF