• Title/Summary/Keyword: 음성사용자인터페이스

Search Result 198, Processing Time 0.022 seconds

A Smartphone Interface for Acquired Visually Impaired (후천적 시각장애인을 위한 스마트폰 인터페이스)

  • Jo, Yoonsoo;Jo, Sangmuk;Park, Myunghoon;Lee, Taeshik;Kang, Kyungtae
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.229-230
    • /
    • 2018
  • 본 논문에서는 시각을 잃기 전 정상적으로 스마트폰을 사용한 경험이 있는 후천적 시각장애인들이 스마트폰의 일부 기능들을 사용할 수 있도록 지원하기 위해 안드로이드 애플리케이션과 컨트롤러로 구성된 새로운 사용자 인터페이스를 구현하였다. 안드로이드 애플리케이션은 컨트롤러의 입력을 받아 전화, 문자 등의 기능을 수행하며 일련의 과정을 음성으로 출력한다. 컨트롤러는 저가의 소형 컴퓨팅 장치인 라즈베리파이를 이용하여 수백만원대의 기존 제품 대비 비용을 절감하고, 휴대성을 확보하였다.

  • PDF

An Analysis of Face Recognition Methods for Recognition of Game Player's Facial Expression (게임 사용자 얼굴표정 인식을 위한 얼굴인식 기법 분석)

  • Yoo, Chae-Gon
    • Journal of Korea Game Society
    • /
    • v.3 no.2
    • /
    • pp.19-23
    • /
    • 2003
  • 컴퓨터 기술의 발전에 따라서 게임분야 역시 다양한 첨단 기술이 적용되고 있다. 예를 들면 강력한 3D가속 기능을 가진 비디오카드, 5.1 채널 사운드, 포스피드백 지원 입력 장치, 운전대, 적외선 센서, 음성 감지기 등이 게임의 입출력 인터페이스로서 이용되고 있다. 전형적인 방법 이외에도 광학방식이나 휴대용 게임기에 대한 플레이 방식에 대한 연구도 활발하다. 최근에는 비디오 게임기에도 사람의 동작을 인식하여 게임의 입력으로 받아들이는 기술이 상용화되기도 하였다. 본 논문에서는 이런 발전 방향을 고려하여 차세대 게임 인터페이스의 방식으로서 사용될 수 있는 사람의 표정 인식을 통한 인터페이스 구현을 위한 접근 방법들에 대하여 고찰을 하고자 한다. 사람의 표정을 입력으로 사용하는 게임은 심리적인 변화를 게임에 적용시킬 수 있으며, 유아나 장애자들이 게임을 플레이하기 위한 수단으로도 유용하게 사용될 수 있다. 영상을 통한 자동 얼굴 인식 및 분석 기술은 다양한 응용분야에 적용될 수 있는 관계로 많은 연구가 진행되어 왔다. 얼굴 인식은 동영상이나 정지영상과 같은 영상의 형태, 해상도, 조명의 정도 등에 따른 요소에 의하여 인식률이나 인식의 목적이 달라진다. 게임플레이어의 표정인식을 위해서는 얼굴의 정확한 인식 방법을 필요로 하며, 이를 위한 비교적 최근의 연구 동향을 살펴보고자 한다.

  • PDF

Determinants of Safety and Satisfaction with In-Vehicle Voice Interaction : With a Focus of Agent Persona and UX Components (자동차 음성인식 인터랙션의 안전감과 만족도 인식 영향 요인 : 에이전트 퍼소나와 사용자 경험 속성을 중심으로)

  • Kim, Ji-hyun;Lee, Ka-hyun;Choi, Jun-ho
    • The Journal of the Korea Contents Association
    • /
    • v.18 no.8
    • /
    • pp.573-585
    • /
    • 2018
  • Services for navigation and entertainment through AI-based voice user interface devices are becoming popular in the connected car system. Given the classification of VUI agent developers as IT companies and automakers, this study explores attributes of agent persona and user experience that impact the driver's perceived safety and satisfaction. Participants of a car simulator experiment performed entertainment and navigation tasks, and evaluated the perceived safety and satisfaction. Results of regression analysis showed that credibility of the agent developer, warmth and attractiveness of agent persona, and efficiency and care of the UX dimension showed significant impact on the perceived safety. The determinants of perceived satisfaction were unity of auto-agent makers and gender as predisposing factors, distance in the agent persona, and convenience, efficiency, ease of use, and care in the UX dimension. The contributions of this study lie in the discovery of the factors required for developing conversational VUI into the autonomous driving environment.

Design and Implementation of Korean Voice Web Browser (한국어 음성 웹브라우저 설계 및 구현)

  • Jang, Young-Gun;Jo, Kyoung-Hwan
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.7 no.5
    • /
    • pp.458-466
    • /
    • 2001
  • This paper is addressed to a design and implementation of Korean voice web browser using voice technologies for controling web browser and selecting contents in the web document, and converting them to voice after HTML analysis. Main feature of this web browser is universal design which considers both of normal person and visual disabled, allows multi-modal interface. As voice interface for visual disabled, it supports tree structure which allows to recognize web document structure easily by only voice guidance regardless of frame usage, can handle all elements described as tag in the web document, identify them as predefined different voice property according to element property. This method gets rid of additional guidance voice for element property without audio style sheet or additional programming effort.

  • PDF

Design of a multimedia interface for the description of human error caused nuclear power plant trips (인적오류로 인한 원자력발전소 고장정지 사건묘사를 위한 멀티미디어 인터페이스 설계)

  • 박근옥
    • Proceedings of the ESK Conference
    • /
    • 1993.10a
    • /
    • pp.65-75
    • /
    • 1993
  • 원자력발전소에서 발생하는 고장정지 사건에 내포된 인적오류의 발생내용을 흥미있고 현장감 있게 묘사시킴과 동시에 종사원들의 인적오류를 저감시키기 위한 새로운 교육훈련방 법으로써 멀티미디어 기술의 사용을 고려하였다. 즉, 컴퓨터 환경하에서 숫자와 텍스트, 음 향 및 음성, 그래픽, 애니메이션, 화상 등의 미디어를 사용하여 인적오류로 인한 고장정지 사건발생의 내용을 전달하는 새로운 교육훈련 방법을 사용하는 것이다. 이를 위하여 고장정 지 사건과 관련한 원자력발전소 구성정보와 종사원의 활동정보를 입출력하기 위한 멀티미디어 인터페이스를 설계하였다. 설계는 멀티미디어 제공환경 구축과 인터페이스 운영논리 설정의 두단계로 구성한 절차에 따라 수행하였다. 멀티미디어 인터페이스는 원자력발전소 구성정보를 설계하여 저장시켜둔 퍼스널 컴퓨터 환경하에서 운영되며, 입력 및 출력의 두가지 인터페이스 를 갖는다. 입력 인터페이스는 인적 오류를 포함한 고장정지 사건의 발생내용을 숫자, 텍스트, 음성 미디어로 받아들여 출력 인터페이스에서 사용될 수 있도록 미디어 결합을 수행하고, 컴퓨터 저장장치에 저장하는 기능을 수행한다. 출력 인터페이스는 저장장치에 기록된 내용을 판독하여 고장정지의 진행경위와 인적오류의 발생내용을 숫자, 문자, 텍스트, 음성, 음향, 그래픽 애니메 이션, 정지화상으로 원자력발전소 종사원들에게 출력시켜 주는 기능을 수행한다. 멀티미디어 출력정보는 사용자가 CRT 화면에 제공되는 버튼 또는 Click Touch 메뉴를 사용함에 따라 이전, 이후의 출력정보로 전이할 수 있도록 하였다.상대적으로 중요한 검사 항목으로 나타났다. 또한 상대적 중요도 결과를 적용한 적성검사 성적이 적용하지 않은 적성검사 성적에 비해 비행성적에 대한 예측 능력이 좋은 것으로 평가되었다.al age)가 있다는 것을 의미하는 것이다. 한편, 생산현장에서는 자동화, 기계화가 진보되어 육체적인 노동이 경감된 결과, 중고령자라도 할 수 있는 작업이 많아지고 있다. 또, VDT (Visual Dislay Terminal) 작업과 같은 정보처리 작업의 수요가 증가하여 그 인재의 부족이 지적되고 있다. 따라서 중고령자의 기능을 조사하여 어떠한 작업에 적합한가를 판단하는 것이 중요한 과제로 되었다. 그러나 노동에는 많은 기능이 관여 하고, 그 내용에 따라서 요구되는 기능이 서로 다르기 때문에 노동적응능력의 기본적인 기능으로 보여지는 것에 좁혀서 작업능력의 연령증가 변화에 대하여다원적 평가를 하는 것이 실제적이라고 할 수 있다. 따라서 본 연구에서는 인간이 가지고 있는 다수의 기능중에서 수지교 치성과 연령증가와의 관계를 조사한다. 만약 연령증가 만으로 수지교치성을 평가 할 수 없는 경우에는 어떠한 요인이 수지기민성의 변화에 영향을 미치는가를 검토한다.t list)에서 자동적으로 사건들의 순서가 결정되도록 확장하였으며, 설비 제어방식에 있어서도 FIFO, LIFO, 우선 순위 방식등을 선택할 수 있도록 확장하였다. SIMPLE는 자료구조 및 프로그램이 공개되어 있으므로 프로그래머가 원하는 기능을 쉽게 추가할 수 있는 장점도 있다. 아울러 SMPLE에서 새로이 추가된 자료구조와 함수 및 설비제어 방식등

  • PDF

Effects of Anthropomorphic Conversational Interface for Smart Home: An Experimental Study on the Voice and Chatting Interactions (스마트홈 대화형 인터페이스의 의인화 효과 음성-채팅 인터랙션 유형에 따른 실험 연구)

  • Hong, Eunji;Cho, Kwangsu;Choi, Junho
    • Journal of the HCI Society of Korea
    • /
    • v.12 no.1
    • /
    • pp.15-23
    • /
    • 2017
  • Applying the concept and components of human nature to the conversational agent in the smart home context, this study investigated the effects of the level of anthropomorphism and interaction type on the emotional user experiences and future use intention. The results of experiment study showed that the high-low condition of anthropomorphism and the voice-chatting interaction type have impacts on the perceived closeness, likability, and future use intention. That is, people evaluate the conversational agent as more close, likable, and useful when they perceive more human nature components and when in the voice interaction mode. Psychological resistance was lower in the voice than in the chatting mode regardless of the level of anthropomorphism. The results also demonstrated an interaction effect of anthropomorphism and interaction type on the future use intention: the effect of anthropomorphism existed only in the voice interaction mode. It leads to the conclusion that a conversational agent with the voice recognition interface should be designed with the higher level of human nature components for the continuous use.

Implementation of the Automatic Segmentation and Labeling System (자동 음성분할 및 레이블링 시스템의 구현)

  • Sung, Jong-Mo;Kim, Hyung-Soon
    • The Journal of the Acoustical Society of Korea
    • /
    • v.16 no.5
    • /
    • pp.50-59
    • /
    • 1997
  • In this paper, we implement an automatic speech segmentation and labeling system which marks phone boundaries automatically for constructing the Korean speech database. We specify and implement the system based on conventional speech segmentation and labeling techniques, and also develop the graphic user interface(GUI) on Hangul $Motif^{TM}$ environment for the users to examine the automatic alignment boundaries and to refine them easily. The developed system is applied to 16kHz sampled speech, and the labeling unit is composed of 46 phoneme-like units(PLUs) and silence. The system uses both of the phonetic and orthographic transcription as input methods of linguistic information. For pattern-matching method, hidden Markov models(HMM) is employed. Each phoneme model is trained using the manually segmented 445 phonetically balanced word (PBW) database. In order to evaluate the performance of the system, we test it using another database consisting of sentence-type speech. According to our experiment, 74.7% of phoneme boundaries are within 20ms of the true boundary and 92.8% are within 40ms.

  • PDF

An Implementation of a VoIP Phone system using ChipSet (ChipSet을 이용한 VoIP PHONE 시스템 개발)

  • 안혁종;황승용;이진형;양희성;이상연;조성호
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.105-108
    • /
    • 2000
  • CTI[1]의 응용 영역 중에서 인터넷 폰이 최근 뜨거운 관심의 대상으로 떠오르고 있다. 인터넷을 이용한 음성전달 기술은 인터넷의 성장 보급과 더불어 나날이발전 하고 있는데, 이러한 음성전달기술을 이용해 개발된 소프트 웨어를 통칭해서 인터넷 폰이라고 부르고 있다. 이러한 변화 속에서 비용의 절감과 비디오 전화, 영상회의와 같은 응용에 적용할 수 있는, 본 개발은 One Encoder One Decoder 지원의 VoIP(Voice over Internet Protocol) Phone에 관한 것으로, 특히 압축하여 인터넷 망에 접속시켜 사용할 수 있는 PC 장착형 One Board 형태의 시스템을 구현하였다. 이 Board에 사용 된 칩셋은 국내 회사인 C&S Technology 사의SEAGUL723이며, PC인터페이스는 PCI(Peripheral Component Interconnect) 버스 방식을 이용하였다. 주요 연구내용에 있어서 하드웨어 부분은 내선제어모듈,PCI 모듈, 칩셋을 이용한 음성신호처리 모듈, Board제어 모듈 등이 있으며, 소프트 웨어 설계 부분에 있어서는 하드웨어 구동을 위한 시스템 드라이브, Application과 인터넷 상의 VoIP 통신을 위한 소프트웨어, 사용자를 위한 User Interface 소프트 웨어 등이 있다.

  • PDF

Design and Implementation of a Usability Testing Tool for User-oriented Design of Command-and-Control Voice User Interfaces (명령 제어 음성 인터페이스 사용자 중심 설계를 위한 사용성 평가도구의 설계 및 구현)

  • Lee, Myeong-Ji;Hong, Ki-Hyung
    • Phonetics and Speech Sciences
    • /
    • v.3 no.2
    • /
    • pp.79-87
    • /
    • 2011
  • Recently, usability has become very important in voice user interface systems. In this paper, we have designed and implemented a wizard-of-oz (WOZ) usability testing tool for command-and-control voice user interfaces. We have proposed the VUIDML (Voice User Interface Design Markup Language) to design the usability test scenario of command-and-control voice interfaces in the early design stages. For highly satisfactory voice user interfaces, we have to select highly preferred voice commands and prompts. In VUIDML, we can specify possible prompt candidates. The WOZ usability testing tool can also be used to collect user-preferred voice commands and feedback from real users.

  • PDF

Usability Test Guidelines for Speech-Oriented Multimodal User Interface (음성기반 멀티모달 사용자 인터페이스의 사용성 평가 방법론)

  • Hong, Ki-Hyung
    • MALSORI
    • /
    • no.67
    • /
    • pp.103-120
    • /
    • 2008
  • Basic components for multimodal interface, such as speech recognition, speech synthesis, gesture recognition, and multimodal fusion, have their own technological limitations. For example, the accuracy of speech recognition decreases for large vocabulary and in noisy environments. In spite of those technological limitations, there are lots of applications in which speech-oriented multimodal user interfaces are very helpful to users. However, in order to expand application areas for speech-oriented multimodal interfaces, we have to develop the interfaces focused on usability. In this paper, we introduce usability and user-centered design methodology in general. There has been much work for evaluating spoken dialogue systems. We give a summary for PARADISE (PARAdigm for Dialogue System Evaluation) and PROMISE (PROcedure for Multimodal Interactive System Evaluation) that are the generalized evaluation frameworks for voice and multimodal user interfaces. Then, we present usability components for speech-oriented multimodal user interfaces and usability testing guidelines that can be used in a user-centered multimodal interface design process.

  • PDF