• Title/Summary/Keyword: 음성인터페이스

Search Result 401, Processing Time 0.029 seconds

Design & Implementation of Voice-Interface for Web-Browsing (웹 브라우징을 위한 음성 인터페이스 설계 및 구현)

  • Lee, Seung-Ho;Youk, Sang-Cho;Kwon, Young-Mi;Lee, Geuk
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.04a
    • /
    • pp.106-109
    • /
    • 1998
  • WWW은 무한한 확장 가능성을 지닌 HTTP(Hyper-Text Transfer Protocol)와 편리한 웹 브라우져를 통해 질적, 양적 성장 계속해 왔으며 특히 GUI(Graphic User Interface) 환경에서 동작하는 웹 브라우져는 WWW이 수많은 이용자를 확보하는데 일익을 담당했다. 본 논문에서는 이 웹 브라우져에 음성인식 기술을 접목하여 WWW의 이용자가 자신의 음성으로 편리하게 웹 브라우징을 할 수 있도록 하는 음성 인터페이스를 설계, 구현 한다. 본 음성 인터페이스는 계속적으로 입력되는 음성 정보 중 화자의 발성음을 추출하여 음성 인식기에 전달하는 음성 입력기와 화자의 발성을 인식하는 음성 인식기 그리고 인식결과를 웹 브라우져에게 처리 하도록 하는 결과 처리기로 구성되어 있다.

  • PDF

Implementation of Voice Interface for HomeAutomation (홈오토메이션에서 음성인터페이스의 구현)

  • 박정남;이종혁
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2003.10a
    • /
    • pp.300-303
    • /
    • 2003
  • 정보 통신의 발전으로 교육, 문화, 의료, 경제 등 사회 시스템과 가정이 결합하여 주택의 개념이 바뀌고 있다. 따라서 생활의 편의를 위한 가정 내 가전기기 및 각종 기기의 원격 제어 욕구가 증가하여 주택시설의 첨단화가 요구되고 있다. 또한 복잡하고 많은 기기를 쉽고 통합적으로 관리하는 통합관리 시스템이 필요하다. 이에 본 논문에서는 사용자가 직접 음성 명령어를 편집할 수 있는 음성인터 페이스를 제안하고 이를 홈오토메이션 시스템에 적용하여 더 높은 사용자편리성을 제공하였다.

  • PDF

A Study on Voice User Interface for Domestic Appliance (가전제품의 음성 인터페이스 디자인 적용에 대한 연구)

  • Hong, Ji-Young;Jeon, Myoung-Hoon;Han, Kwang-Hee;Chae, Haeng-Suk
    • Science of Emotion and Sensibility
    • /
    • v.10 no.1
    • /
    • pp.55-68
    • /
    • 2007
  • This paper describes a Voice User Interface(VUI) method and a design guideline tool which supports the studies for domestic appliance. This issue covers specification of user requirement and selection of appropriate VUI to represent speech generation. The criteria for paper is interaction design to enhance user engagement. The studies were carried out to measure prototype of domestic appliance such as a refrigerator, a washing machine, a Gimchi refrigerator, an oven range, a dishwasher and an air conditioner. This paper is presented a study of user preferences and suitability. The results of these findings to voice interface design are discussed and it is suggested that VUI guideline and optimal prototyping can provide a useful application tools in the design process.

  • PDF

A Study on the Reliability of Voice Payment Interface (음성결제 인터페이스의 신뢰도에 관한 연구)

  • Gwon, Hyeon Jeong;Lee, Jee Yeon
    • Journal of the Korean Society for information Management
    • /
    • v.38 no.3
    • /
    • pp.101-140
    • /
    • 2021
  • As the payment service sector actively embraces artificial intelligence technology, "Voice Payments" is becoming a trend in contactless payment services. Voice payment services can execute payments faster and more intuitively through "voice," the most natural means of communication for humans. In this study, we selected richness, intimacy, and autonomy as factors for building trust with artificial intelligence agents. We wanted to determine whether the trust will be formed if the factors were applied to the voice payment services. The experiment results showed that the higher the richness and autonomy of the voice payment interface and the lower the intimacy, the higher the trust. In addition, the two-way interaction effects of richness and autonomy were significant. We analyzed and synthesized the collected short-answer system to identify users' anxiety when using voice payment services and proposed speech interface design ideas to increase their trust in the voice payment.

An Implementation of Automobile Information System using VoiceXML (VoiceXML을 이용한 자동차 정보 안내 시스템 구현)

  • Yang, Jung-Su;Kim, Dong-Gyu;Kim, Jung-Hyun;Roh, Yong-Wan;Hong, Kwang-Seok
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2005.11a
    • /
    • pp.290-293
    • /
    • 2005
  • 음성 인식 기술이 발달함에 따라 음성 인식 기술을 이용한 응용의 개발이 중요한 문제로 떠오르고 있다. VoiceXML은 전화기를 통한 음성 인터페이스를 위한 XML 언어로서 손쉬운 방법으로서 음성 인터페이스를 설계, 구현할 수 있도록 만들어진 언어이다. 본 논문에서는 이를 이용해 전화를 통하여 음성으로 자동차 정보 안내 시스템을 사용할 수 있는 사용자 인터페이스를 구현한다. 구현된 시스템 및 서비스는 VoiceXML의 장점을 활용하여 원거리에서 편리하게 사용자가 자동차의 정보를 안내받고 제어할 수 있는 인터페이스 자체보다는 음성 인터페이스의 설계 및 구현에 중점을 두었다. 10인의 피실험자가 각 10회씩 총 100회를 실험한 결과 99.3%의 인식률을 보였다. 추후 차세대 자동차 텔레메틱스 서비스와 연동하면 구현되어진 시스템의 활용이 증대될 것이라 판단된다.

  • PDF

Common ASR Interface format for increasing usability of cloud-based ASR services. (클라우드 기반 음성인식 서비스 활용도 향상을 위한 음성인식 공통 인터페이스 표준 포맷)

  • Oh, Jung-Sup;Lee, Byung-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.423-425
    • /
    • 2022
  • 음성인식은 컴퓨터가 사람의 언어를 이해하여, 소리로 발화하는 사람의 음성을 인식하여 텍스트로 바꾸는 과정을 의미하며, 최근 활용도가 높아지고 있다. 음성인식 엔진은 얼마나 많은 학습데이터를 기반으로 훈련을 했느냐에 따라서 그 성능이 결정되기 때문에, 자신의 서비스 에 맞는 음성인식 엔진을 적절히 선택할 수 있어야 한다. 음성인식 엔진의 성능이 수시로 변경될 수 있기 때문에 표준 인터페이스를 빠른 개발을 진행할 수 있도록 표준 포맷을 제안하였다.

Development of a Voice User Interface for Web Browser using VoiceXML (VoiceXML을 이용한 VUI 지원 웹브라우저 개발)

  • Yea SangHoo;Jang MinSeok
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.11 no.2
    • /
    • pp.101-111
    • /
    • 2005
  • The present web informations are mainly described in terms of HTML, which users obtain through input devices such as mouse, keyboard, etc. Thus the existing GUI environment have not supported human's most natural information acquisition means, that is, voice. To solve the problem, several vendors are developing voice user interface. However these products are deficient in man -machine interactivity and their accommodation of existing web environment. This paper presents a VUI(Voice User Interface) supporting web browser by utilizing more and more maturing speech recognition technology and VoiceXML, a markup language derived from XML. It provides users with both interfaces, VUI as well as GUI. In addition, XML Island technology is applied to the bowser in a way that VoiceXML fragments are nested in HTML documents to accommodate the existing web environment. Also for better interactivity, dialogue scenarios for menu, bulletin, and search engine are suggested.

The Development of Heuristics for Voice Shopping Service through Voice Interface with Display (디스플레이 탑재형 음성 인터페이스를 통한 음성쇼핑 서비스 휴리스틱 개발)

  • Gwon, Hyeon Jeong;Lee, Jee Yeon
    • Journal of the Korean Society for information Management
    • /
    • v.39 no.2
    • /
    • pp.1-33
    • /
    • 2022
  • Voice shopping is gaining attention following the trend of non-contact E-commerce by enabling people to shop via voice command. Therefore, in this study, voice shopping service heuristics using a display-mounted voice interface were developed in preparation for the future where voice shopping becomes a part of daily life in the world. First, as a theoretical approach, a literature survey of 50 papers on the design principles of 'visual interface,' 'voice interface,' and 'shopping service' was conducted to produce a total of 29 draft design principles. Second, as an empirical approach, a focus group interview was conducted on consumer decision-making processes in shopping experiences and information-seeking behavior within the context of shopping to draft the heuristics. This was to supplement the user experience, a weak part of the literature research. Finally, a Delphi survey asked 20 experts in UX, service planning, artificial intelligence development, and shopping to evaluate the heuristics draft developed through the above two stages. After three rounds of Delphi surveys, the final heuristics were proposed.

Speech Interface with Echo Canceller and Barge- In Functionality for Telematic System (텔레매틱스 시스템을 위한 반향제거 및 Barge-In 기능을 갖는 음성인터페이스)

  • Kim, Jun;Bae, Keun-Sung
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.5
    • /
    • pp.483-490
    • /
    • 2009
  • In this paper, we develop a speech interface that has acoustic echo cancelling and barge-in functionalities in the car environment. In the echo canceller, DT (Double-Talk) detection algorithm using the correlation coefficients between reference and desired signals can make DT detection errors often in the background noise. We reduce the DT detection errors by using the average power of noise and echo estimated from the input signal. In addition, to make it possible for drivers to give speech command to the system by interrupting the speaker output, barge-in functionality is implemented with the combination of DT detection and appropriate gain control of the speaker output. Through the computer simulation with the assumed car environment and experiment in the real laboratory environment, implemented speech interface has shown good performance in removing acoustic echo signals in the noisy environment with proper operation of barge-in functionality.

A Study on Preprocessing for Elderly Voice Recognition (노인음성인식을 위한 전처리에 관한 연구)

  • Park, Ji-Woong;Lee, Seoung-Jun;Kwon, Soonil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1646-1648
    • /
    • 2013
  • 고령화 되어 가는 현대 사회에서 노인들이 일반 성인과 동등한 수준에서 정보를 접근 가능하도록 스마트기기의 손쉬운 인터페이스 방법이 요구된다. 음성 인터페이스는 노인들의 스마트기기 활용도를 높여 줄 수 있지만, 성능이 평균적 성인연령 대의 발성행태에 최적화되어 있어, 노인들이 사용할 경우 음성인식률 저하를 초래한다. 그래서 노인 친화형 음성 인터페이스를 개발하기 위한 일환으로 노인음성에 대한 인식률을 향상시켜 줄 수 있는 전처리 알고리즘을 개발하고자 한다. 이를 위해 노인층과 청년층을 대상으로 음성샘플을 수집하여 분석하였고, 그 결과 노인이 청년에 비해 발성속도가 느리며 이는 스마트기기의 음성인식 기능저하로 이어진다는 것을 확인할 수 있었다.