• 제목/요약/키워드: Voice UI/UX

검색결과 8건 처리시간 0.02초

고령화 사회를 위한 음성 인식 챗봇 시스템 : 기술 개발과 맞춤형 UI/UX 설계 (Voice Recognition Chatbot System for an Aging Society: Technology Development and Customized UI/UX Design)

  • 정윤지;유민성;오주영;황현석;허원회
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권4호
    • /
    • pp.9-14
    • /
    • 2024
  • 본 연구는 고령화 사회의 노년층 우울증과 고독감 문제를 해결하기 위해 음성 인식 챗봇 시스템을 개발하였다. 이 시스템은 Whisper 모델, GPT 2.5, XTTS2를 활용하여 고성능 음성 인식과 자연어 처리, 텍스트-음성 변환 기능을 제공한다. 사용자는 이를 통해 감정과 상태를 표현하고 적절한 반응을 얻을 수 있으며, 지인의 목소리를 이용한 음성인식 기능으로 친숙함과 안정감을 느낄 수 있다. UX/UI는 스마트 시니어 세대의 인지 반응과 시력 저하, 운동 능력 제약 등을 고려하여 설계되었다. 명도와 선명도가 높은 색상, 가독성이 좋은 서체등을 활용하여 고령자의 사용 편의성을 높였다.이 연구는 음성 기반 인터페이스를 통해 노년층의 삶의 질 향상에 기여할 것으로 기대된다.

디지털 소외계층을 위한 지능형 IoT 애플리케이션의 공개 API 기반 대화형 음성 상호작용 기법 (Open API-based Conversational Voice Interaction Scheme for Intelligent IoT Applications for the Digital Underprivileged)

  • 장준혁
    • 스마트미디어저널
    • /
    • 제11권10호
    • /
    • pp.22-29
    • /
    • 2022
  • 음성 상호작용은 스마트 기기의 활용에 능숙하지 못한 디지털 소외계층을 대상으로 하는 애플리케이션에서 특히 효과적이다. 그러나 공개 API를 기반으로 한 애플리케이션들은 기존의 터치스크린 중심의 UI와 제공되는 API의 한계로 인해 음성 신호를 짧고 단편적인 입출력에만 활용하고 있다. 본 논문에서는 사용자와 지능형 모바일/IoT 애플리케이션의 대화형 음성 상호작용 모델을 설계하고, 편집 거리(Levenshtein distance) 기반 키워드 탐지 기법을 제안한다. 제안 모델 및 기법은 안드로이드 환경에서 구현되었으며, 편집 거리 기반 키워드 탐지 기법은 음성인식을 통해 부정확하게 인식된 키워드에 대해 기존 기법보다 높은 인식률을 보였다.

"알렉사, 색상 팔레트를 만들어줄 수 있어?" 지능형 디자인 비서와 자연어로 협업을 수행할 UX/UI 디자이너의 생각 ("Hey Alexa, Would You Create a Color Palette?" UX/UI Designers' Perspectives on Using Natural Language to Interact with Future Intelligent Design Assistants)

  • 레나토 안토니오 베르타오;주재우
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.193-206
    • /
    • 2021
  • AI (인공지능)는 알렉사와 같은 지능형 가상 비서 (IVA)을 통해서 이미 우리의 삶에 침투했으며 디자인 작업에도 도입될 가능성이 높다. 본 연구에서는 AI를 활용하여 개발될 지능형 디자인 비서에 (intelligent design assistant) 대해서, 디자이너들이 어떠한 생각을 가지고 있는지 이해하고자 한다. 이를 위해서 브라질의 UX/UI 디자이너들에게 지능형 가상 비서와 AI 디자인 도구에 관한 설문 조사를 실시했으며, 추가로 알렉사와 (Alexa) 어도비 센세이를 (Adobe Sensei) 결합하여 음성 기반 AI 디자인 비서인 알렉사 센세이를 (Alexa Sensei) 가상의 시나리오로 만든 뒤, 이에 관한 설문도 함께 실시했다. 설문조사 결과, 브라질 디자이너들은 AI와 협업할 기회는 제한되어 있었으나 AI가 디자인 프로세스의 효율성을 개선해줄 것으로 기대한다는 사실을 알아냈다. 또한 응답자의 대다수는 AI 설계 시스템과 창의적으로 협력할 수 있을 것이라고 예측했다. 자연어를 통한 의사소통에는 한계가 있을 것으로 바라보았지만, 이미 지능형 가상 비서를 사용한 경험이 있는 디자이너들은 음성 기반 AI 디자인 비서에 대한 거부감이 낮다는 점도 함께 밝혀졌다.

대화 패턴 연구를 통한 스마트TV 음성 상호작용 모델의 탐구 (Examination of a Voice Interaction Model for Smart TV through Conversation Patterns)

  • 최진해
    • 한국콘텐츠학회논문지
    • /
    • 제17권2호
    • /
    • pp.96-104
    • /
    • 2017
  • 최근의 스마트 기기들은 사용자의 의도와 사용 맥락을 반영하는 지능형 에이전트의 형태로 발전하고 있으며, 기능을 더 쉽고 편리하게 활용할 수 있는 사용자 경험 설계가 경쟁력의 핵심이 되고 있다. 본 연구는 인간중심의 내추럴 인터랙션이 최적의 스마트TV 경험에 필수적이라는 전제하에 TV에 특화된 음성 인터랙션 방식을 탐구하고자 하였다. 사용자가 자연스러운 행태로 TV를 조작하는 모델을 구축하기 위하여 스마트TV의 주요 기능을 지능형 에이전트에 명령하도록 하였고 대화 패턴을 수집하였다. 수집된 문장은 CfA 모델에 대입하여 기능 실행을 위한 반응 별로 분류하였다. 분류된 5가지 대화 패턴은 스마트TV가 실행하는 기능 특성에 따라 '기능 실행'과 '정보 검색'으로 나눌 수 있었다. 사용자와 TV간의 음성 상호작용에서 모호한 요청의 경우 재확인을 위한 CfC1이 발생하고, 복합 의도나 조건부 요청에 대한 대응이 필요한 경우는 CfC2가 발생한다는 부분도 확인하였다. 본 연구의 결론은 스마트TV에서의 음성 UI 설계에서 Simple Request Type이 가장 효율적 모델이라는 점과 대화형 인터랙션은 가능한 사용자의 모호한 요청을 구체화하기 위한 단계에서만 활용되는 것이 적합하다는 것이다.

폐경기 여성을 대상으로 제공하는 디지털 기반 운동 치료: 서비스 디자인 제안 (Study on Digital-based Exercise Therapy for Menopausal Women)

  • 박채은;강현민;서석교;전용관;김진우
    • 한국멀티미디어학회논문지
    • /
    • 제25권4호
    • /
    • pp.640-648
    • /
    • 2022
  • Menopausal women have to care for their health. Menopause is a symptom that needs to be managed in the long term, which requires safe and economical treatment even after long term use. This study proposes digital-based exercise therapy. This study also suggests resistance exercise and walking exercise methods according to the proof of previous studies. It provides motivational contents for those who cannot perform regularly. As motivational methods, self-efficacy and narrative-based history methods are accepted. Self-efficacy is improved through voice agents feedback during exercise. Feedback is a type of messages such as encouragement and motivation. The narrative-based history consists of characters of visualization that improves through values, which leveraged by the exercise.

스마트카의 인터페이스를 위한 경험 디자인 가이드라인 (Experience Design Guideline for Smart Car Interface)

  • 유훈식;주다영
    • 디자인융복합연구
    • /
    • 제15권1호
    • /
    • pp.135-150
    • /
    • 2016
  • 통신 기술의 발달, 지능형교통체계(ITS: Intelligent Transport Systems)의 확산으로 자동차는 단순한 기계장치에서 종합편의 기능을 가진 제2의 생활 공간으로 변모하고 있으며, 이를 위한 인터페이스로써의 역할을 하는 플랫폼으로 진화하고 있다. 탑승자들에게 다양한 정보를 제공하는 인터페이스 영역이 확장됨에 따라 스마트카 기반의 사용자 경험(UX: User Experience) 연구에 대한 중요성이 높아지고 있다. 이 연구는 스마트카의 사용자 경험 요소에 대한 가이드라인을 제안하는데 목적을 두고 있다. 연구의 수행을 위해 기존 연구를 기반으로 스마트카의 사용자 경험 요소를 기능(function), 상호작용(interaction), 표면(surface)으로 정의하였으며, UX/UI 전문가들의 논의를 통해 각 요소 별로 8개의 대표 기술, 14개의 대표 기능, 8개의 유리창의 위치를 정의하였다. 이 후 100명의 운전자를 대상으로 정의된 스마트카 사용자 경험 요소들에 대한 우선순위를 설문조사 방식으로 분석하였다. 분석을 통해 사용자들은 차량에 주요 기술을 적용함에 있어서 안전, 주행, 감성의 순으로, 조작 방식에 있어서는 음성인식, 터치, 제스처, 물리적 버튼, 아이트레킹의 순으로, 디스플레이 위치에 대해서는 운전석을 중심으로 전방에서 후방으로 높은 우선순위를 가지고 있는 것을 알 수 있었다. 성별에 따른 분석에 있어서는 2개의 기능 외에는 큰 차이를 보이지 않아 남성과 여성에 대한 가이드가 공통되게 적용될 수 있음을 알 수 있었다.

암묵 데이터를 활용한 인문학 인풋값과 다중 모달리티의 가중치 할당 방법에 관한 연구 (A Study on the Weight Allocation Method of Humanist Input Value and Multiplex Modality using Tacit Data)

  • 이원태;강장묵
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.157-163
    • /
    • 2014
  • 이용자의 감성은 그 어느 때보다 기업, 정부 그리고 개인 간의 소통에서 중요한 변수로 인식된다. 특히 수많은 연구에서 이용자의 감성을 파악하는 방법으로 음성 톤, 속도, 얼굴 표정, 몸의 이동 방향과 속도, 제스쳐 등이 사용된다. 다중 모달리티는 단일의 모달리티보다 정확도가 높은 반면 멀티 센싱에 따른 인식률 한계와 데이터 처리 부하 그리고 센싱된 값을 추론하는 우수한 알고리즘이 요구된다. 즉 다중 모달리티는 각 모달리티의 개념, 속성이 상이하여 인간의 감성값이라는 표준화된 값으로 전환하는데 오류가 발생할 수 있다. 이 문제를 해결하기 위해 다중 모발리티 중관계망 분석, 문맥 파악, 디지털 필터 등의 기술을 이용하여 이용자에게 우선 순위를 갖는 감성 표현 모달리티를 추출할 필요가 있다. 특정 상황에 우선 순위를 갖는 모달리티와 그 주변을 에워싼 다른 모발리티를 암묵 값으로 처리하면 감성 인식에 있어 컴퓨터 자원의 소비 대비 견고한 시스템을 구성할 수 있다. 본 연구 결과, 암묵 데이터를 활용하여 다중 모발리티 중 가중치를 어떻게 부여할지에 대하여 제안하였다.

Study on Gesture and Voice-based Interaction in Perspective of a Presentation Support Tool

  • Ha, Sang-Ho;Park, So-Young;Hong, Hye-Soo;Kim, Nam-Hun
    • 대한인간공학회지
    • /
    • 제31권4호
    • /
    • pp.593-599
    • /
    • 2012
  • Objective: This study aims to implement a non-contact gesture-based interface for presentation purposes and to analyze the effect of the proposed interface as information transfer assisted device. Background: Recently, research on control device using gesture recognition or speech recognition is being conducted with rapid technological growth in UI/UX area and appearance of smart service products which requires a new human-machine interface. However, few quantitative researches on practical effects of the new interface type have been done relatively, while activities on system implementation are very popular. Method: The system presented in this study is implemented with KINECT$^{(R)}$ sensor offered by Microsoft Corporation. To investigate whether the proposed system is effective as a presentation support tool or not, we conduct experiments by giving several lectures to 40 participants in both a traditional lecture room(keyboard-based presentation control) and a non-contact gesture-based lecture room(KINECT-based presentation control), evaluating their interests and immersion based on contents of the lecture and lecturing methods, and analyzing their understanding about contents of the lecture. Result: We check that whether the gesture-based presentation system can play effective role as presentation supporting tools or not depending on the level of difficulty of contents using ANOVA. Conclusion: We check that a non-contact gesture-based interface is a meaningful tool as a sportive device when delivering easy and simple information. However, the effect can vary with the contents and the level of difficulty of information provided. Application: The results presented in this paper might help to design a new human-machine(computer) interface for communication support tools.