• Title/Summary/Keyword: VoiceXML

Search Result 101, Processing Time 0.024 seconds

Web based VAD using HUVOIS solution (웹으로 운용하는 음성인식 무인자동교환시스템)

  • KIM HEE-KYUNG
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.47-48
    • /
    • 2004
  • 최근 음성시장은 VoiceXML 을 이용하여 간단히 시나리오를 작성할 수 있어, 보다 쉽게 다양한 어플리케이션을 개발하여 서비스할 수 있게 되었다. HUVOIS-VAD 는 KT가 자체 개발한 음성인식/합성 플랫폼 시스템인 HUVOIS 에 VXML 을 이용하여 시나리오를 구성한 음성인식/합성 VAD 시스템으로, 사내 및 사외 여러 사이트에 설치 운용 중이다. 특히, Web 을 기반으로 운용시스템을 구축하여 운용자는 어느 곳에서나, 운용 DB를 점검하거나, 인식사전을 구성하고, 운용할 수 있으며, 사용자 또한 개인의 DB 를 직접 관리하도록 하고, 회사의 DB 와 연계하여 개인의 VAD로 동시에 사용할 수 있도록 하고 있다. 본 논문에서는 Web 을 기반으로 구성된 HUVOIS-VAD 시스템에 대하여 기술하고자 한다.

  • PDF

Implementation of Home Appliance Control System with Speech Recognition based User Interfaces in Home Network Environments (홈 네트워크 환경에서 음성인식기반 사용자 인터페이스를 통한 가전기기 제어 시스템 구현)

  • Kim, Youn-Woo;Jang, Hyun-Su;Kim, Gu-Su;Eom, Young-Ik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.735-738
    • /
    • 2007
  • 컴퓨팅 기술의 발전에 따라 유비쿼터스 시대로의 이행이 가속화되고 있다. 이에 따라 홈 네트워크 분야에 대한 연구와 상용화를 위한 노력이 활발해지고 있다. 이와 더불어 가전기기들의 종류는 다양해지고 복잡해지면서 사용자들의 가전기기 이용에 있어 사용법을 익혀야하는 어려움이 있다. 이러한 문제점을 해결하기 위한 일환으로 디지털 장치들을 편하게 사용하기 위한 멀티 모달 사용자 인터페이스가 요구되고 있다. 본 논문에서 네트워크 가전기기 제어가 가능한 홈 네트워크 미들웨어인 UPnP를 사용하여 VoiceXML을 통한 음성인식기반 사용자 인터페이스와 디지털 장치 제어 시스템을 제안하고 구현한 후 실험하였다.

  • PDF

Design and Implementation of the Speech Recognition-based Dynamic EPG Control System in Digital Broadcasting environment (디지털 TV 환경에서 음성인식을 통한 동적 EPG 제어 시스템 설계 및 구현)

  • Kim, Seong-Won;Na, Hee-Joo;Si, Jang-Hyun;Kim, Jung-Hwan;Jung, Moon-Ryul
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.216-221
    • /
    • 2007
  • 디지털 방송은 수많은 프로그램과 기존의 아날로그 방송에서 볼 수 없었던 다양한 서비스를 제공하며 발전하고 있다. 하지만 시청자들에게는 방송 서비스 채널과 기능이 많아질수록 원하는 채널을 검색하고 전환하는 과정이 어렵고 복잡한 일이 되어 버릴 수 밖에 없을 것이다. 이에 본 논문에서는 이러한 정보 획득과정의 축소를 위해 전통적인 리모콘으로 채널을 검색하고 이동하는 절차를 벗어나 음성인식을 통한 동적 EPG(Electronic Program Guide) 제어 시스템을 설계하고 구현하고자 한다. 이는 EPG정보와 시청자의 TV시청 성향 및 History를 기반으로 구동되는 시스템으로 음성대화의 구조적 정의가 가능한 VXML(VoiceXML) 인터프리터를 활용한다. 본 논문에서 제안하는 대화형 인터페이스는 다양한 디지털방송 서비스에 접목이 가능 할 것이며, 새로운 형태의 디지털 가전기기 파일럿 인터페이스 개발에 도움이 될 것이라 기대한다.

  • PDF

Design and Implementation of Multimodal Middleware for Mobile Environments (모바일 환경을 위한 멀티모달 미들웨어의 설계 및 구현)

  • Park, Seong-Soo;Ahn, Se-Yeol;Kim, Won-Woo;Koo, Myoung-Wan;Park, Sung-Chan
    • MALSORI
    • /
    • no.60
    • /
    • pp.125-144
    • /
    • 2006
  • W3C announced a standard software architecture for multimodal context-aware middleware that emphasizes modularity and separates structure, contents, and presentation. We implemented a distributed multimodal interface system followed the W3C architecture, based on SCXML. SCXML uses parallel states to invoke both XHTML and VoiceXML contents as well as to gather composite or sequential multimodal inputs through man-machine interactions. We also hire Delivery Context Interface(DCI) module and an external service bundle enabling middleware to support context-awareness services for real world environments. The provision of personalized user interfaces for mobile devices is expected to be used for different devices with a wide variety of capabilities and interaction modalities. We demonstrated the implemented middleware could maintain multimodal scenarios in a clear, concise and consistent manner by some experiments.

  • PDF

Synchronization of the Train PIS using the reference clock and development of a subtitle authoring tool (레퍼런스 클럭을 이용한 객차 PI 시스템 동기화 및 자막 편집기 개발)

  • Kim, Jung-Hoon;Jang, Dong-Wook;Han, Kwang-Rok
    • Journal of the Korea Society of Computer and Information
    • /
    • v.12 no.4
    • /
    • pp.1-10
    • /
    • 2007
  • This paper describes the development of a network-based passenger information system(PIS) which provides the convenience of the passenger of the train and heightens the effect of the subtitle service, the advertising and the shelter guidance broadcasting against the urgent event. The existing system uses VGA signal distributor in order to broadcast information with image and subtitle and voice guidance. In this paper we improve the existing system by applying the UDP and TCP/IP protocol and use a reference clock to solve a data loss and synchronization problem which occurs in this case. We also developed an XML-based subtitle authoring tool which can edit and play the subtitles with various 3D to improve the automatic guidance broadcasting and advertisement effect according to the operation schedule of the train. The system performance was evaluated through a simulation.

  • PDF

The Conference Management System Architecture for Ontological Knowledge (지식의 온톨로지화를 위한 관리 시스템 아키텍처)

  • Hong, Hyun-Woo;Koh, Gwang-san;Kim, Chang-Soo;Jeong, Jae-Gil;Jung, Hoe-kyung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.2
    • /
    • pp.1115-1118
    • /
    • 2005
  • With the development of the internet technology, The on-line conference system have been producted. Now, the on-line conference system is developing for using pattern recognition system and voice recognition system. Comparing with the off-line conference, the on-line conference is excellent in free from distance limitation. But, the on-line meetings have unavoidable weak points. it is the same as the off-line conference that when the conference goes on, the content orthopedic and the content consistency is weak. So the conference members can not seize the conference flow. Therefore, in this paper, we introduce the ontology concept. Design a new architecture using ontology mining technique for making the conference content and conference knowledge ontological. Then in order to inspection the new architecture, We design and implementation the new conference management system based knowledge.

  • PDF

Extended Design And Implementation of SIP Proxy Server or Improved Additional Internet Telephony Service (향상된 부가 서비스 지원을 위한 SIP 프락시 서버의 확장 설계 및 구현)

  • 민경주;이종화;강신각;박기식
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2002.11a
    • /
    • pp.875-879
    • /
    • 2002
  • CPL is a technique that serves various additional service in Internet telephony such as call forwarding, call blocking etc. IETF IPTEL working group developed this CPL standard. Users could request various additional services such as call forwarding, call blocking etc. by registering XML scripts to location servers. This paper would describe the design and the implementation skill of SIP proxy server that support these improved functionalities in detail. SIP registrar and SIP proxy server are designed and implemented in Linux platform because this platform serves fast and low cost development environment.

  • PDF

Implementation of Android-based Interactive Edutainment Contents Using Authoring Tool Developed for Interactive Animation

  • Song, Mi-Young
    • Journal of the Korea Society of Computer and Information
    • /
    • v.23 no.4
    • /
    • pp.71-80
    • /
    • 2018
  • In this paper, we developed an interactive animation authoring tool and developed the Android based interactive edutainment contents. The authoring tool for creating interactive animations developed in this paper is based on a graphical user interface, so users can easily create interactive animations. Interactive animation contents created by this authoring tool can be created as images and xml files so that they can be used directly on mobile devices. In order to increase learning efficiency for children, Android-based interactive edutainment electronic storybooks, which is implemented using this authoring tool, provided a recording function to listen to the parents' voice as well as an interactive action in which the characters move in accordance with the story line. We also provided a STEAM game that combines creativity and imagination with creative science and technology. Therefore, by creating the edutainment contents through the proposed authoring tool for interactive animation, various interactive animation contents could be produced more easily than the code implementation method. Through this study, I hope that it will be helpful for the development of various interactive edutainment contents to provide educational contents considering the quantity and quality to infants.

Implementation of automated online brain-wave DB building system using the five senses stimulation (오감자극을 활용한 자동화된 온라인 뇌파 DB구축 시스템 구현)

  • Kim, Dae-Jin;Kwon, Tae-Gu;Shin, Jeong-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.05a
    • /
    • pp.729-732
    • /
    • 2008
  • 유비쿼터스 시대의 도래에 따른 서비스의 고급화는 다양한 형태의 사용자 단말기의 개발을 유도 하였으며, 이러한 사용자 단말기의 변화는 다양한 형태의 인간친화형 사용자 인터페이스의 개발로 이어지게 되었다. 이러한 다양한 형태의 인간친화형 사용자 인터페이스 중, 인간의 뇌를 활용한 사용자 인터페이스, 즉 BCI에 관한 연구가 산발적으로 다양하게 진행되고 있다. 현재 진행되어지고 있는 다양한 형태의 BCI관련 연구들은, 연구 초기 수준을 극복하지 못하는 실정이며, 이러한 연구 개발의 지체 이유로는 DB구축부터 시작한 체계적인 연구가 이루어지고 있지 않는 점을 들 수 있다. 또한, 뇌파 신호의 수집 시 효율적인 피험자 지침 관련 연구가 없는 실정이며 기 구현되어진 대부분의 시스템이 로컬시스템 형태로 구성되어져 DB 구축 시 한정적인 피험자 수, 대용량의 뇌파 DB수집 시 한계, 뇌파 DB의 신뢰성이 저하되는 문제점을 야기한다. 본 논문에서는 이러한 문제점을 극복하기 위하여 VoiceXML을 활용한 온라인 기반의 DB구축 시스템 구현을 제안 하며 신뢰성 및 객관성을 확보 하고자 한다.

Design and Implementation of user centric pavilion information guide system based on commercial mobile device (모바일 기기 기반 사용자 중심형 전시관 정보 안내 시스템의 설계 및 구현)

  • Yun Hyun-Joo;Bu So-Young;Choi Yoo-Joo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.11 no.2 s.40
    • /
    • pp.187-199
    • /
    • 2006
  • This paper proposes the design of user centric pavilion information guide system based on mobile device such as PDA. which is composed of system interface factors as user wants. The suggested information guide system is convenient for user carrying because it is based on PDA mobile device and the used liquid browser system makes all data information displayed on a small screen in contrast with the other browser system. Indeed, factors of system interface can be re-composed by user interaction. And this system can effectively provide the detail information about the exhibited objects as various media data such as text, image, voice, music, video etc. The proposed system is made up of media database server. mobile system control server and mobile system interface which accepts user interaction and displays the information. Each system is networked based on TCP/IP and uses XML (extensible Markup Language) and JAVA 2 micro edition to be able to update data. This feature enhances a wide use to be able to load this system on the any mobile device.

  • PDF