• 제목/요약/키워드: 음성XML

검색결과 104건 처리시간 0.027초

멀티모달 상황인지 미들웨어 기반의 홈앤(HomeN) 매니저 시스템 (HomeN manager system based on multimodal context-aware middleware)

  • 안세열;박성찬;박성수;구명완;정영준;김명숙
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 추계학술대회 발표논문집
    • /
    • pp.120-123
    • /
    • 2006
  • The provision of personalized user interfaces for mobile devices is expected to be used for different devices with a wide variety of capabilities and interaction modalities. In this paper, we implemented a multimodal context-aware middleware incorporating XML-based languages such as XHTML, VoiceXML. SCXML uses parallel states to invoke both XHTML and VoiceXML contents as well as to gather composite multimodal inputs or synchronize inter-modalities through man-machine I/Os. We developed home networking service named "HomeN" based on our middleware framework. It demonstrates that users could maintain multimodal scenarios in a clear, concise and consistent manner under various user's interactions.

  • PDF

XML 파싱기법을 이용한 안드로이드 기반의 종합 날씨 정보 앱 설계 및 구현 (Design and Implementation of Android-based Total Weather Information Application using XML Parsing Techniques)

  • 이진욱;윤형수;하수철
    • 디지털콘텐츠학회 논문지
    • /
    • 제12권4호
    • /
    • pp.611-618
    • /
    • 2011
  • 본 논문은 XML(eXtensible Markup Language) 파싱(parsing)기법을 이용한 안드로이드 기반의 날씨 정보 어플리케이션의 설계 및 구현에 관한 사항이다. GPS 위치 프로바이더와 XML 파싱기법 이용하여 현재 위치에 따라 날씨 정보가 변하게 된다. 또한 알람 시스템을 이용하여 어플리케이션의 접속과 종료에 상관없이 알람 이벤트가 발생 될 때의 시간을 기준으로 날씨 정보를 음성(English)으로 출력한다. 모든 어플리케이션에서 사용자 인터페이스는 앱의 첫 인상이 중요하기 때문에 복잡하지 않고, 단순한 방법으로 사용자 인터페이스 설계를 하였다.

음성정보기술을 이용한 통신서비스 - KT 서비스를 중심으로 - (Telecommunication Services Based On Spoken Language Information Technology - In view of services provided by KT -)

  • 구명완;김재인;정영준;김문식;김원우;김학훈;박성준;류창선;김희경
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2004년도 춘계 학술대회 발표논문집
    • /
    • pp.125-130
    • /
    • 2004
  • In this paper, we explain telecommunication services based on spoken language information technology. There are three different kinds of services. The first is based on Advanced Intelligent services(AIN). We built a Intelligent Peripheral(IP)with speech recognition, speech synthesis and VoiceXML interpreter. The second is based on KT-HUVOIS, a proprietary speech platform based on VoiceXML. The third is based on VoiceXML interpreter. We explain various services depending on these platforms in detail.

  • PDF

VXML 편집기와 음성 브라우저의 설계 및 구현 (Design and Implementation of Voice Browser and VXML editor)

  • 김경란;홍기형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.414-416
    • /
    • 2000
  • VXML은 VoiceXML 포럼에서 제안한 대화형 음성 인터페이스 표준으로 음성 관련 소프트웨어 개발을 용이하게 하는 장점이 있다. 또한 음성을 통해 인터넷의 다양한 정보를 검색할 수 있어 급속히 성장하고 있고 웹의 사용과 편리한 인터페이스의 사용자 요구를 충족시킬 수 있다. 본 논문에서는 VXML 문서를 작성할 수 있는 편집기와 VXML 문서를 처리하여 사용자와 상호 작용 할 수 있는 대화형 음성 브라우저의 설계와 구현에 대해 소개한다.

  • PDF

대량의 발신 호를 지원하는 음성 메시지 시스템 (Voice Message System Supporting Massive Outbound Call)

  • 김정곤
    • 대한음성학회지:말소리
    • /
    • 제49호
    • /
    • pp.77-94
    • /
    • 2004
  • In this paper, new voice message system supporting massive outbound call is proposed. Basic idea of the proposed system is to pre-process all the text-to-speech conversion process, mixing of text and attached music file and to store the results of pre-process in the cache server which is connected to the IVR. New voice message system is optimized for the voice message system supporting massive outbound call by distributing the load of the web server caused by server-side script implementation which is accessing database and generating dynamic Voice XML document over client module and server module of web server. The proposed voice message system was test-deployed in one domestic voice message application service provider and it is shown that proposed voice message system reduced the response latency problem of test-bed voice message system.

  • PDF

호 제어 마크업 해석기 개발 및 음성 대화 시스템과의 연동 (Design and Implementation of a Call Control Markup Interpreter and Its Interaction with Voice Dialog Systems)

  • 이경아;권지혜;김지영;홍기형
    • 대한음성학회지:말소리
    • /
    • 제53호
    • /
    • pp.171-183
    • /
    • 2005
  • Call Control eXtensible Markup (CCXML) is a standard language that supports a call control of voice dialog systems such as VoiceXML based systems. CCXML allows developers to handle telephony calls in an easy way without deep knowledge about telephony networks and their switching systems.We design and implement a call control markup interpreter. At the implementation, we use a Dialogic JCT-LS board, but, by designing a wrapping class for CTI (computer telephony board) features, the interpreter can easily adopt other CTI boards. We also design and implement event-based interaction scheme between the interpreter and voice dialog systems. For verifying the interaction scheme, we implement a simple voice dialog system.

  • PDF

음성 DB 부가 정보 기술방안 표준화를 위한 제안 (Standardization for Annotation Information Description of Speech Database)

  • 김상훈;이영직;한민수
    • 대한음성학회지:말소리
    • /
    • 제47호
    • /
    • pp.109-120
    • /
    • 2003
  • This paper presents about the activities of speech database standardization in ETRI. Recently, with the support of government, ETRI and SiTEC have been gathering the large speech corpus for the domestic speech related companies. First, due to the lack of sharing the knowledge of speech database specification, the distributed speech database has a different format. Hence it seems to be needed to have the same format as soon as possible. ETRI and SiTEC are trying to find the better representation format of speech database. Second, we introduce a new description method of the annotation information of speech database. As one of the structured description method, XML based description will be applied to represent the metadata of the speech database. It will be continuously revised through the speech technology standard forum during this year.

  • PDF

음성 인식 사용자 인터페이스를 통한 가전기기 제어 기법 (Home Appliance Control through Speech Recognition User Interface)

  • 송욱;장현수;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.265-268
    • /
    • 2006
  • 유비쿼터스 컴퓨팅 환경이 확대됨에 따라, 기존의 키보드와 마우스만을 사용자 인터페이스로 주로 사용했던 방법에서 벗어나 좀 더 사용자 중심의 멀티모달 유저 인터페이스 적응이 요구되고 있다. 이에 XHTML+Voice는 음성 및 시각을 모두 제공할 수 있는 새로운 서비스 패러다임으로서 기존의 음성정보만을 제공하거나 시각적인 정보만을 제공하는 시스템과는 달리 XHTML내에 VoiceXML을 삽입함으로써 두 언어의 장점을 모두 활용할 수 있다. 본 논문에서는 VoiceXML의 이러한 장점을 살려 스마트 홈을 구성하는 여러 가전기기들의 인터페이스를 미리 템플릿으로 만들어 두어 모바일 디바이스를 통해 이것들을 제어하는 시나리오를 제안하고 구현하는 방법에 대해 실험하였다.

  • PDF

WIPI기반 음성 웹브라우저 구현 방안 (Strategy for Implementing A Voice Web Browser Based WIPI)

  • 유세영;김병기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2006년도 춘계종합학술대회
    • /
    • pp.501-504
    • /
    • 2006
  • 인터넷 및 휴대폰들이 일반화되고 음성처리 기술이 실용화 단계로 발전함에 따라 음성 응용분야가 새로운 이슈로 떠오르고 있다. 음성처리 기술은 사람의 말을 알아들을 수 있는 귀와 사람에게 말을 할 수 있는 입을 마련해주는 새로운 분야다. 그리고, 음성으로 웹의 컨텐츠를 개발하기 위한 표준 언어인 VoiceXML, SALT가 빠르게 보급되고 있다. 음성인식과 음성합성 기술이 꾸준히 발전하여 음성 포털 서비스나 자동 음성 안내 시스템 등에 음성인식과 음성합성 기술이 채택되는 등 상용화 수준에 이르렀다. 사람에게 가장 편리한 정보 습득 방법은 음성이고 이러한 음성을 적용한 음성 웹 브라우저를 현재 유선 상에서 사용하고 있다. 하지만 아직까지 무선 플랫폼에 적용하여 사용하는 브라우저는 개발되지 않고 있다. 사용자에게 친숙한 무선인터넷 환경을 제공하고자 무선 음성 웹 브라우저를 구현방안을 제시하고자 한다.

  • PDF

Voice Browser를 위한 음성 인식 웹서비스 환경에 관한 연구 (A Study of Speech Recognition Web Services Environment for Voice Browser)

  • 홍인숙;김윤중
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.142-145
    • /
    • 2009
  • 음성인터페이스 관련 표준화는 음성 대화, 음성인식/합성, 전화망 등의 접속망을 상호 분리하여 음성정보시스템 구성요소들 각각의 상호 독립적인 개발을 보장해 주며, 각 요소의 이해가 없이도 음성정보시스템을 개발할 수 있도록 함으로써 음성정보기술의 보급 및 확산에 크게 기여하고 있다. 이에 W3C에서는 Voice Browser에 대한 표준화를 현재 진행 중에 있으며 Vocie Browser WG에서 Voice Browser를 위한 SIF(Speech Interface Framework)를 제안하였다. 제안된 SIF에서 Voice Browser가 음성인식을 실행하기 위해서는 많은 자원의 소요와 부하가 생길 수 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 음성인식 웹 서비스를 기존의 SIF에 추가한 새로운 형태의 SIF를 제안하고자 한다. 음성인식은 원격 시스템에서 수행하고 그 결과를 Voice Browser가 사용할 수 있도록 음성인식 웹서비스 환경을 구축하였다. 그리고, XML-SRGS 포멧의 grammar를 음성인식기가 사용하는 EBNF 포멧의 grammar로 변환시키는 변환기를 구현하였다.