• 제목/요약/키워드: Voice user interface

검색결과 146건 처리시간 0.027초

ARS 메뉴체계 사용성 저해요소에 대한 실험연구 (An Experimental Study on Hindrance Factors of Usability of Menu Structure in ARS)

  • 김호원;김희철
    • 한국정보통신학회논문지
    • /
    • 제15권2호
    • /
    • pp.462-470
    • /
    • 2011
  • 음성자동응답시스템(Automatic Response Systems, ARS)은 VUI(Voice User Interface)와 TTI(Touch Tone Interface)를 기반으로 하고 있으며, 현재 가장 널리 사용되는 커뮤니케이션 시스템 중 하나이다. 그러나 많은 사용에도 불구하고, ARS에 대한 불편 사항들이 끊임없이 지적되고 있다. 이는 기술 개발을 넘어, 사용자와 사용성에 대한 체계적인 연구 부족에서 기인한 측면이 있다. 본 논문에서는 ARS 메뉴체계에서의 사용성 저해 요소를 발견 분석하여, ARS 설계를 위한 개선의 지침을 제공한다. 두 개의 인터넷 서점 ARS를 선정하여 피실험자들이 "도서 반품 신청하기"라는 작업을 실행한 후 정해진 설문조사 결과와 인터뷰 내용을 분석하였다. 본 연구에서 메뉴 구조의 복잡성, 메뉴명의 대표성 부족, 사용자 위치인지의 어려움, 메뉴간 이동의 어려움 등 네 가지 문제들을 발견하였고, 이를 피할 수 있는 방법들을 논의하였다.

Greeting, Function, and Music: How Users Chat with Voice Assistants

  • Wang, Ji;Zhang, Han;Zhang, Cen;Xiao, Junjun;Lee, Seung Hee
    • 감성과학
    • /
    • 제23권2호
    • /
    • pp.61-74
    • /
    • 2020
  • Voice user interface has become a commercially viable and extensive interaction mechanism with the development of voice assistants. Despite the popularity of voice assistants, the academic community does not utterly understand about what, when, and how users chat with them. Chatting with a voice assistant is crucial as it defines how a user will seek the help of the assistant in the future. This study aims to cover the essence and construct of conversational AI, to develop a classification method to deal with user utterances, and, most importantly, to understand about what, when, and how Chinese users chat with voice assistants. We collected user utterances from the real conventional database of a commercial voice assistant, NetEase Sing in China. We also identified different utterance categories on the basis of previous studies and real usage conditions and annotated the utterances with 17 labels. Furthermore, we found that the three top reasons for the usage of voice assistants in China are the following: (1) greeting, (2) function, and (3) music. Chinese users like to interact with voice assistants at night from 7 PM to 10 PM, and they are polite toward the assistants. The whole percentage of negative feedback utterances is less than 6%, which is considerably low. These findings appear to be useful in voice interaction designs for intelligent hardware.

음성결제 인터페이스의 신뢰도에 관한 연구 (A Study on the Reliability of Voice Payment Interface)

  • 권현정;이지연
    • 정보관리학회지
    • /
    • 제38권3호
    • /
    • pp.101-140
    • /
    • 2021
  • 인공지능 기술이 결제 서비스 분야에도 적극 도입됨에 따라 말로 하는 결제 서비스 '음성결제(Voice Payments)'가 언택트 결제 서비스의 트렌드로 주목받고 있다. 음성결제 서비스는 인간의 가장 자연스러운 소통 수단인 '목소리'를 통해 결제를 더 빠르고 직관적으로 실행할 수 있는 서비스이다. 본 연구에서는 인공지능 에이전트와의 신뢰 형성을 위한 요인으로 '구체성', '친밀감', '자율성'을 선정하였으며, 각 특성들이 음성결제 상황의 음성 인터페이스에 적용되었을 때 이용자의 신뢰가 형성되는지 알아보고자 하였다. 실험 결과 음성결제 인터페이스의 구체성과 자율성은 높을수록, 친밀감은 낮을수록 신뢰가 높아졌다. 또한 구체성과 자율성의 이원상호작용효과가 유의하였다. 수집된 주관식 답변들을 분석 및 종합하여 이용자들이 음성결제 서비스를 접할 때 느끼는 불안 요인들을 파악하고, 음성결제에 대한 신뢰를 높일 수 있는 음성 인터페이스 디자인 방안들을 제안하였다.

모바일 환경에서 효과적인 사용자 인터페이스를 이용한 LMS에 관한 연구 (A Study on LMS Using Effective User Interface in Mobile Environment)

  • 김시정;조도은
    • 한국항행학회논문지
    • /
    • 제16권1호
    • /
    • pp.76-81
    • /
    • 2012
  • 다양한 모바일 기기의 보급 확산으로 u러닝 기반의 학습 관리 시스템의 연구가 활발히 진행 되고 있다. u-러닝 기반의 학습 관리 시스템은 콘텐츠 사용자의 접근 시간과 장소 그리고 다양한 접근 기기에 대한 제약이 없다는 점에서 매우 편리하다. 그러나 사용자에 대한 접근의 인증과 학습에 대한 집중 여부에 대한 판단이 매우 어렵다. 본 논문은 일반적인 사용자 이벤트 중심의 인터페이스가 아닌 음성과 사용자 안면 캡춰 인터페이스를 학습 관리 시스템에 적용 하였다. 사용자가 학습 관리 시스템에 접근 시 등록된 본인의 패스워드를 음성 입력하여 로그인 하고, 사용자가 콘텐츠를 통해 학습이 진행 되는 과정에서도 간단한 단어의 응답 발화를 통해 사용자의 학습 태도 및 학습 성과를 판단하게 한다. 제안된 학습 관리 시스템의 평가 결과 사용자의 학습 성취도와 집중도가 향상 되었으며 이에 따른 사용자의 비정상적인 학습태도에 대한 관리자의 모니터링을 가능 하게 했다.

효율적인 탐색과 브라우징을 지원하는 하이퍼미디어 시스템의 사용자 인터페이스 설계 (User-interface design of a hypermedia system for effective searching and browsing)

  • 고영곤;최윤철
    • 대한인간공학회지
    • /
    • 제12권1호
    • /
    • pp.75-86
    • /
    • 1993
  • Hypermedia systems allow the retrieval and representation of multimedia in- formation such as text, graphics, image and voice/sound using navigation and browsing mechanisms. In this study we developed a hypermedia system which provides hierarchical group, local map and cluster view for effective navigation in hyperspace. The system also supports hot link, reference link, move-to link and multiple link to browse the multimedia information space effectively. This system has been designed to integrate the navigation, browsing and searching function of the hypermedia system in hyman factor perspective and provides the user-friendly user interface mechanism.

  • PDF

스마트폰 음성 인터페이스의 사용 현황 및 사용자 인식에 대한 조사 연구 (A Survey Study on the Utilization Status and User Perception of the VUI of Smartphones)

  • 최재호;김훈태
    • 한국전자거래학회지
    • /
    • 제21권4호
    • /
    • pp.29-40
    • /
    • 2016
  • 음성 사용자 인터페이스(VUI)는 인간에게 가장 친숙하고 편안한 인터페이스이다. VUI는 이미 스마트폰에 적용되어 있으며 최근에는 클라우드 및 AI 기술의 발전으로 VUI 적용 제품은 더욱 확대되고 있다. 그러나 가장 많이 보급되어 있는 스마트폰의 경우에도 VUI를 사용하는 사용자는 매우 적은 상황이다. 본 연구의 목적은 현재 스마트폰에서 사용되고 있는 VUI의 이용 현황 및 사용자 인식을 조사하고 문제점을 파악하여 향후 VUI 사용성 제고를 위한 연구 방향을 제시하는 것이다. 163명의 대학생들을 대상으로 스마트폰 VUI의 사용 현황에 대한 설문 조사를 수행하였다. 조사 결과 VUI의 인지도는 높지만 사용률은 매우 낮았으며, 많은 사용자가 음성 인식 속도, 반응 속도 및 작동 방법에 대해 불편함을 느끼고 있는 것으로 나타났다. 대부분의 사용자가 호기심에서 VUI를 사용해봤지만 일부만이 계속 사용하고 있는 것으로 조사되었으며, 많은 사용자들이 기계에게 말하는 것과 다른 사람들이 듣는 것에 거부감을 가지고 있었다. 본 연구의 결과는 VUI의 활용도를 제고하기 위한 향후 연구에 도움이 될 것으로 기대된다.

투명한 입력오버레이를 이용한 필기 및 음성 입력 (Handwriting and Voice Input using Transparent Input Overlay)

  • 김대현;김명준;이진호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권4호
    • /
    • pp.245-254
    • /
    • 2008
  • 본 논문은 IBM ViaVoice와 마이크로소프트 필기-인식 시스템(handwriting-recognition system)과 같은 인식 엔진(recognition engines)을 UMPC와 같은 펜-입력 디스플레이에서 작동하는 일반적인 윈도우 어플리케이션과 연동하기 위한 단일화된 멀티모달 입력 프레임워크(unified multi-modal input framework)를 제안한다. 사용자가 펜-입력 디스플레이에 부탁되어있는 버튼을 한 손으로 누르면, 인터넷 검색 윈도우나 워드 프로세서와 같이 현재 포커스를 갖는 윈도우는 전체 데스크탑을 덮을 수 있는 투명한 윈도우로 덮여진다. 이 위에 사용자는 다른 한 손으로, 현재 working context를 놓치지 않으면서, 필기 입력을 자유롭게 수행할 수 있다. 이런 투명 입력 윈도우를 이용하여 필기 및 음성 입력뿐만 아닐라 다이어그램까지 그릴 수 있게 해준다.

Interface Modeling for Digital Device Control According to Disability Type in Web

  • Park, Joo Hyun;Lee, Jongwoo;Lim, Soon-Bum
    • Journal of Multimedia Information System
    • /
    • 제7권4호
    • /
    • pp.249-256
    • /
    • 2020
  • Learning methods using various assistive and smart devices have been developed to enable independent learning of the disabled. Pointer control is the most important consideration for the disabled when controlling a device and the contents of an existing graphical user interface (GUI) environment; however, difficulties can be encountered when using a pointer, depending on the disability type; Although there are individual differences depending on the blind, low vision, and upper limb disability, problems arise in the accuracy of object selection and execution in common. A multimodal interface pilot solution is presented that enables people with various disability types to control web interactions more easily. First, we classify web interaction types using digital devices and derive essential web interactions among them. Second, to solve problems that occur when performing web interactions considering the disability type, the necessary technology according to the characteristics of each disability type is presented. Finally, a pilot solution for the multimodal interface for each disability type is proposed. We identified three disability types and developed solutions for each type. We developed a remote-control operation voice interface for blind people and a voice output interface applying the selective focusing technique for low-vision people. Finally, we developed a gaze-tracking and voice-command interface for GUI operations for people with upper-limb disability.

효과적 정보전달을 위한 영상정보의 3D 뷰 및 음성정보와의 융합 연구 (A Study on 3D View Design of Images and Voices Integration for Effective Information Transfer)

  • 신준철;이종수
    • 한국통신학회논문지
    • /
    • 제35권1B호
    • /
    • pp.35-41
    • /
    • 2010
  • 본 논문에서는 컴퓨터를 사용한 효과적 정보전달을 위해 2D 영상정보를 3D 가상공간에 배치하고 음성 정보와의 유기적 연결기능을 갖는 3D 뷰 설계를 제안한다. 3D 공간에 배치된 영상정보의 사용자 접속을 어느 시점 또는 어떤 각도에서도 가능하도록 하여, 시각정보 전달효과를 제고하고 있으며, 음성정보의 첨부가 용이하도록 설계하였다. 3D공간에서의 영상 및 음성정보 배치는 단순하지만 효과적인 접속기능을 포함하고 있으며, 이들의 탐색 및 시청을 사용자접속 관점에서 설계하여 정보전달 효과를 제고하였다.

Human-Computer Interaction Based Only on Auditory and Visual Information

  • Sha, Hui;Agah, Arvin
    • Transactions on Control, Automation and Systems Engineering
    • /
    • 제2권4호
    • /
    • pp.285-297
    • /
    • 2000
  • One of the research objectives in the area of multimedia human-computer interaction is the application of artificial intelligence and robotics technologies to the development of computer interfaces. This involves utilizing many forms of media, integrating speed input, natural language, graphics, hand pointing gestures, and other methods for interactive dialogues. Although current human-computer communication methods include computer keyboards, mice, and other traditional devices, the two basic ways by which people communicate with each other are voice and gesture. This paper reports on research focusing on the development of an intelligent multimedia interface system modeled based on the manner in which people communicate. This work explores the interaction between humans and computers based only on the processing of speech(Work uttered by the person) and processing of images(hand pointing gestures). The purpose of the interface is to control a pan/tilt camera to point it to a location specified by the user through utterance of words and pointing of the hand, The systems utilizes another stationary camera to capture images of the users hand and a microphone to capture the users words. Upon processing of the images and sounds, the systems responds by pointing the camera. Initially, the interface uses hand pointing to locate the general position which user is referring to and then the interface uses voice command provided by user to fine-the location, and change the zooming of the camera, if requested. The image of the location is captured by the pan/tilt camera and sent to a color TV monitor to be displayed. This type of system has applications in tele-conferencing and other rmote operations, where the system must respond to users command, in a manner similar to how the user would communicate with another person. The advantage of this approach is the elimination of the traditional input devices that the user must utilize in order to control a pan/tillt camera, replacing them with more "natural" means of interaction. A number of experiments were performed to evaluate the interface system with respect to its accuracy, efficiency, reliability, and limitation.

  • PDF