• Title/Summary/Keyword: 음성사용자인터페이스

Search Result 198, Processing Time 0.023 seconds

Moderating Effects of User Gender and AI Voice on the Emotional Satisfaction of Users When Interacting with a Voice User Interface (음성 인터페이스와의 상호작용에서 AI 음성이 성별에 따른 사용자의 감성 만족도에 미치는 영향)

  • Shin, Jong-Gyu;Kang, Jun-Mo;Park, Yeong-Jin;Kim, Sang-Ho
    • Science of Emotion and Sensibility
    • /
    • v.25 no.3
    • /
    • pp.127-134
    • /
    • 2022
  • This study sought to identify the voice user interface (VUI) design parameters that evoked positive user emotions. Six VUI design parameters that could affect emotional user satisfaction were considered. The moderating effects of user gender and the design parameters were analyzed to determine the appropriate conditions for user satisfaction when interacting with the VUI. An interactive VUI system that could modify the six parameters was implemented using the Wizard of OZ experimental method. User emotions were assessed from the users' facial expression data, which was then converted into a valence score. The frequency analysis and chi-square test found that there were statistically significant moderating gender and AI effects. These results implied that it is beneficial to consider the users' gender when designing voice-based interactions. Adult/male/high-tone voices for males and adult/female/mid-tone voices for females are recommended as general guidelines for future VUI designs. Future analyses that consider various human factors will be able to more delicately assess human-AI interactions from a UX perspective.

Performance improvement of Command Speech recognition using Context Information (Context 정보를 이용한 명령어 음성인식의 성능향상)

  • Kim, Young-Ju;Kim, Eun-Ju;Kim, Myung-Won
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.718-720
    • /
    • 2005
  • 이동 단말기의 대중화로 사용자는 시간과 공간의 제약 없이 필요한 다양한 정보 서비스를 쉽게 접할 수 있게 되었다. 그러나 사용자 인터페이스에 있어 이동 단말기는 제약사항이 않음으로 적시적소에 원하는 정보를 접근하기가 어렵기 때문에 음성인식을 통한 인터페이스 연구가 진행되고 있으며, 특히 잡음환경에서 강인한 음성인식 처리를 위한 연구가 활발히 진행되고 있다. 지금까지 잡음환경을 위한 음성인식 접근 방법으로는 언어모델의 개선과 음향모델 개선으로 크게 구분할 수 있다. 그러나 이러한 접근 방법들은 적용하는데 있어 많은 시간과 비용이 요구됨으로 효율성이 떨어진다. 따라서 본 논문에서는 이러한 효율성 문제를 보완하기 위해 음성인식기로부터 인식되어 나오는 결과를 문맥정보와 융합하여 정보를 추출하고 이 정보를 이용한 후처리 모듈을 이용하여 인식시에 발생하는 오류를 적은 비용과 시간으로 수정하여 이동 단말기에 이용할 수 있도록 한다.

  • PDF

User Requirements for Personal Media Management Software (개인용 미디어 관리 소프트웨어에 대한 사용자 요구사항)

  • Seo Hee-Cheol;Kim Hyun-Ki;Jang Myung-Gil
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.124-126
    • /
    • 2006
  • 본 논문은 개인이 소장하고 있는 문서, 이미지, 오디오, 동영상 등의 미디어를 통합 관리하는 개인용 미디어 관리 소프트웨어의 필요성, 기능, 인터페이스 등에 관한 사용자 요구사항을 정리한다. 사용자 요구사항은 사용자 설문을 통해서 조사되었으며, 설문에는 사용자 환경과 개인용 미디어 관리 소프트웨어에 필요한 기능, 인터페이스에 관한 내용을 담고 있다 사용자 요구 사항에서 사용자들은 다수의 미디어를 컴퓨터에 저장하고 있으며, 이들을 효율적으로 관리할 수 있는 소프트웨어를 필요로 하고 있다. 이들을 관리하기 위한 기능으로 미디어 분석, 분류, 검색, 재생 기능을 필요로 한다. 그리고 사용자들은 컴퓨터뿐만 아니라 핸드폰, PDA와 같은 모바일 기기에서도 개인용 미디어를 관리하고자 한다. 인터페이스에서는 키보드와 마우스 입력과 함께 모바일 기기를 위한 음성 인터페이스에 대한 요구가 있다.

  • PDF

The Design and Implementation of Mobile Dictionary App based on Voice Recognition Server (음성 인식 서버를 이용한 모바일 사전 설계 및 구현)

  • Yu, Jae-Seung;Park, Hee-Tae;Park, Mi-So;Song, Min-kyu;Yun, Sung-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1698-1701
    • /
    • 2012
  • 음성 인식은 사용자의 음성을 문자로 변환하는 기술로 최근 스마트폰의 사용자 인터페이스로 사용되면서 그 활용도가 높아지고 있다. 기존의 스마트폰용 사전 프로그램은 좁은 자판으로 인하여 입력과정에 오타가 많이 발생하고, 찾고자 하는 단어의 발음은 알고 있지만 철자를 알지 못 하는 경우에 검색할 수 없다. 본 논문에서는 음성 명령을 이용한 스마트폰용 영한사전 앱을 설계 및 구현하였다. 외부 음성 인식 서버를 이용하여 음성 명령을 이해하고 클라이언트에 SQLite를 이용하여 사전 데이터 베이스를 구축한다. 클라이언트는 서버로 사용자 음성을 전달하고, 서버는 음성 정보를 텍스트로 변환하여 클라이언트에게 제공한다[1]. 클라이언트는 서버로부터 전송받은 텍스트를 이용하여 사전 데이터베이스를 검색하고, 그 결과를 사용자에게 보여준다.

Research on Emotional Factors and Voice Trend by Country to be considered in Designing AI's Voice - An analysis of interview with experts in Finland and Norway (AI의 음성 디자인에서 고려해야 할 감성적 요소 및 국가별 음성 트랜드에 관한 연구 - 핀란드와 노르웨이의 전문가 인뎁스 인터뷰를 중심으로)

  • Namkung, Kiechan
    • Journal of the Korea Convergence Society
    • /
    • v.11 no.9
    • /
    • pp.91-97
    • /
    • 2020
  • Use of voice-based interfaces that can interact with users is increasing as AI technology develops. To date, however, most of the research on voice-based interfaces has been technical in nature, focused on areas such as improving the accuracy of speech recognition. Thus, the voice of most voice-based interfaces is uniform and does not provide users with differentiated sensibilities. The purpose of this study is to add a emotional factor suitable for the AI interface. To this end, we have derived emotional factors that should be considered in designing voice interface. In addition, we looked at voice trends that differed from country to country. For this study, we conducted interviews with voice industry experts from Finland and Norway, countries that use their own independent languages.

VoiceEPG: Speech Interface for Electronic Program Guide (전자프로그램 가이드를 위한 음성 인터페이스)

  • 김한수;황인준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10c
    • /
    • pp.589-591
    • /
    • 2003
  • 최근 디지털 TV 방송의 활성화에 힘입어 수많은 채널을 통한 TV 프로그램 방송이 가능하게 되었다. 이로 인해 디지털 TV 시청자들은 신문 또는 TV 가이드와 같은 기존 인쇄매체를 통해 자신이 원하는 TV 프로그램 스케줄을 얻기가 사실상 매우 어렵게 되었다. 이와 같은 문제점을 해결하기 위해 디지털 TV 환경에서는 전자 프로그램 가이드(EPG: Electronic Program Guide)를 제공한다. 현재 제공되고 있는 EPG 서비스들은 대개 디지털 TV 화면 또는 각 방송사 웹 사이트 그리고 이동 단말기 등을 통해서 서비스 되고 있다. 대부분의 기존 연구들은 EPG 정보를 화면상에 시각적으로 제공하는 측면에만 초점을 두고 있다. 하지만 실질적으로 사용자 입장에서는 원하는 방송 프로그램의 스케줄 정보를 찾기 위해서 수백 채널에 달하는 방송 프로그램에 대한 정보를 일일이 검색하는 것은 매우 힘든 일이다. 게다가 사용자가 원하는 키워드를 직접 입력하는 방식 또한 사용자를 매우 번거롭게 한다. 따라서 본 논문에서는 EPG 서비스 방식에 VoiceXML 관련 기술을 접목하여 이동 단말기상에서 간단한 음성입력을 통해 EPG 서비스를 제공받을 수 있는 음성 인터페이스를 제안한다.

  • PDF

Design of VoiceXML interpreter for search system (검색엔진을 이용한 VoiceXML 검색 인터프리터 개발에 관한 설계)

  • 이동민;윤영선;은성배
    • Proceedings of the IEEK Conference
    • /
    • 2003.07d
    • /
    • pp.1439-1442
    • /
    • 2003
  • 본 연구에서는 휴대 통신 단말 기기나 기존의 전화망에서의 음성 인터페이스를 이용해 인터넷 웹 검색을 가능하게 하는 VoiceXML 인터프리터를 개발하기 위한 설계를 논의한다. 기존의 VoiceXML 인터프리터 시스템은 미리 정해진 시나리오로 구성된 정적 페이지만을 대상으로 하나 제안하는 방법은 인터넷 웹사이트에서 음성 인터페이스만을 이용해 원하는 정보에 대한 검색결과를 HTML로 해석하여 VXML 인터페이스를 통하여 사용자에게 전달한다

  • PDF

The development of an application invocation using speech recognition on PDA (PDA용 음성명령기 개발)

  • Lee Sang-Chul;Jung Yong-Jun
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 2002.08a
    • /
    • pp.213-219
    • /
    • 2002
  • 본 논문은 상용 OS 인 windows CE 기반의 PDA에서 음성으로 각 응용 프로그램 을 실행하는 방법 및 구성을 제시한다. PDA는 기존 desktop PC 에 비해 사용자 입력수단이 많지 않고, 그 사용법조차 까다롭다. 예를 들어 SIP(Soft Input Panel)을 이용하여 채팅을 하거나 인터넷 웹 브라우저에 주소입력조차 쉽지 않다. 이에 KT의 자체 개발한 음성인식엔진을 이용하여 PDA내 응용프로그램 과 사용자입력 요구사항을 원활히 연결, 보다 편리한 사용자 입력인터페이스를 제공한다. KT의 음성인식엔진은 corpus 기반으로 HMM 모델을 이용, 사용자 음성을 인식하여 그 결과를 출력한다. 본 논문에서는 PDA에서의 이러한 음성인식엔진을 이용, 다수의 응용프로그램을 실행하고 제어하는 구성과 패턴을 제시한다.

  • PDF

Customized Speech Synthesis for Children with Characteristic Behavioral Patterns (어린이 행동 패턴에 기반한 개별화된 음성 합성)

  • Lee, Ho-Joon;Park, Jong-C.
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.571-578
    • /
    • 2006
  • 음성을 통한 사용자 간의 정보 교환 방법은 추가적인 훈련 과정이나 장비가 필요하지 않고 공간 제약이 거의 없기 때문에 노약자 등 사용자의 연령대에 관계없이 사용될 수 있다. 또한 음성 정보는 시각이나 촉각 등 다른 정보 수단과의 상호 작용으로 상승 효과를 유발할 수 있기 때문에 사람과 기계 사이의 인터페이스로 활용될 경우 정보 전달력을 높이면서 사용자 친화적인 서비스를 제공할 수 있다. 그러나 동일한 상황에서 동일한 유형의 음성 정보가 사용자에게 지속적으로 제공될 경우 표현상의 단조로움으로 인해 정보 전달력이 급감할 수 있는 문제점도 지니고 있다. 따라서 음성을 통한 정보 전달의 경우 동일 상황이라 하더라도 사용자의 행동 패턴, 심리 상태, 주변 환경 등에 따라 차별화된 문장 구조 및 어휘의 선택으로 긴장감을 유지시켜 줄 수 있어야 한다. 본 논문에서는 5 세 전후의 어린이를 대상으로 그들의 행동 패턴 분석에 기반하여 개별화된 음성 합성 결과를 제공하는 시스템을 제안한다. 이를 위해 유치원이라는 물리적 공간에서 어린이들의 주된 행동 패턴을 분석하고, 현직 유치원 교사를 대상으로 동일한 정보를 전달하는 조건을 통하여 어린이의 행동 패턴과 위치 정보, 연령 및 성격에 따른 발화 문장의 문장 구조와 어휘적 특성을 파악한다. 최종적으로, 개별화된 음성 합성 결과를 위해 유치원 공간을 시뮬레이션 하고 RFID 를 이용하여 어린이의 행동 패턴 및 위치 정보를 파악한다. 그리고 각 상황에 따라 분석된 발화문의 문장 구조와 어휘 특성을 반영하여 음성으로 합성될 문장의 문장 구조 및 어휘를 재구성하여 사용자 개별화된 음성 합성 결과를 생성한다. 이러한 결과를 통해 어린이의 행동 패턴이 발화문의 문장 구조 및 어휘에 미치는 영향에 대해서 살펴보고 재구성된 결과 발화문을 평가한다.

  • PDF

Home Network Speech Interface Using VoiceXML (VoiceXML을 이용한 홈 네트워크 음성 인터페이스)

  • Roh, Yong-Wan;Kim, Dong-Gyu;Shin, Jeong-Hoon;Chung, Kwang-Woo;Hong, Kwang-Seok
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.6 no.3
    • /
    • pp.127-133
    • /
    • 2005
  • In this paper, we propose speech interlace using VoiceXML in home network system Existing home network uses Bluetooth, IrDA, wireless LAN and Home RF but these was able to use a long distance such as outdoors or these was difficult to using method. The proposing VoiceXML speech interlace is supported with home network services more than other interface technology in a long distance also speech interlace controls home server using a wire and a wireless phone and is informed of problems to direct calling for user through VoiceXML server. In this paper, such speech interlace is able to use the aspect of home network and supports to practical remote gauge examination, remote control services. And on the basic of that, we evaluate efficiency of purposed method.

  • PDF