• Title/Summary/Keyword: 음성인터페이스

검색결과 402건 처리시간 0.212초

고령친화 AI음성 O2O 서비스의 서비스가치가 태도와 이용의도에 미치는 영향에 관한 연구

  • 이명숙;고인곤
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2021년도 추계학술대회
    • /
    • pp.125-128
    • /
    • 2021
  • 한국은 2025년 전체 인구 중 65세 이상 인구가 20%을 상회하는 초고령 사회 진입이 전망되면서 노화수준에 맞는 고령친화적인 제품서비스 공급이 요구된다. 특히 시니어 소비자가 사용하기 편리한 인터페이스를 갖춘 서비스가 필요하다. 이에 시니어들은 노화(aging)에 대한 문제의식에 비용을 지불하며 젊은 소비자들과 유사한 소비행태를 보이고, 노화 수준별 건강 유지 및 건강 불안, 돌봄 공백, 사회적 고립 증가 등 사회문제가 복합적으로 심화되면서 고령친화적인 스마트한 Aging Service 공급이 요구된다. 이러한 시기와 맞물려 with코로나시대 시니어 소비자가 사용하기 편리한 인터페이스를 갖는 제품·서비스로 4차 산업혁명의 중심인 AI(Artificial Intelligence)와 정보통신 기술의 노력이 가시화되고 있다. 따라서 IT 기술에 덧입혀 시니어들의 욕구에 부합하는 AI 음성인식 기능을 탑재한 제품 및 서비스가 향후 고령친화산업 성장을 주도할 것으로 전망된다. 이에 본 연구는 '고령친화 AI 음성 O2O 서비스'의 서비스 가치가 태도와 이용의도에 영향을 미치는가를 분석하기 위해 선행이론을 토대로 전문가 델파이 방법을 통해 고령친화 AI 음성 O2O 서비스의 정의를 도출하고 실증분석으로 '고령친화 AI 음성 O2O 서비스'의 서비스가치(상황기반 제공성, 즉시연결성, 위치정확성)와 태도 및 이용의도간의 인과관계를 조사하기 위해 본 연구를 진행하였다.

  • PDF

VoiceXML을 사용한 상가 검색 음성인식 시스템의 설계 및 구현 (Design and Implementation of Store Locator Voice Recognition System Using VoiceXML)

  • 김우일;송성균;고경만;윤재석;김국보
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.138-143
    • /
    • 2002
  • 음성은 컴퓨터와 인간 사이의 인터페이스로서 지속적인 연구가 되어 왔다. VoiceXML로 구현된 음성 포털 서비스는 사용자의 음성 질의에 따라 정보를 검색하고 청취할 수 있는 기술로서 현재 다양한 컨텐츠로 서비스가 진행되고 있다. 본 연구에서는 전화나 인터넷 전화 프로그램으로 상가의 위치, 전화 번호, 상가 소개 등의 정보를 음성으로 검색할 수 있는 시스템을 VoiceXML을 이용하여 구현하여 보았다. 웹과 연동할 수 있도록 시스템을 구성하고 다양한 다이얼로그를 표현하기 위해 특히, JSP를 이용하고 각 로직을 자바빈즈 컴포넌트로 구현하였다.

  • PDF

스마트폰 음성 인터페이스의 사용 현황 및 사용자 인식에 대한 조사 연구 (A Survey Study on the Utilization Status and User Perception of the VUI of Smartphones)

  • 최재호;김훈태
    • 한국전자거래학회지
    • /
    • 제21권4호
    • /
    • pp.29-40
    • /
    • 2016
  • 음성 사용자 인터페이스(VUI)는 인간에게 가장 친숙하고 편안한 인터페이스이다. VUI는 이미 스마트폰에 적용되어 있으며 최근에는 클라우드 및 AI 기술의 발전으로 VUI 적용 제품은 더욱 확대되고 있다. 그러나 가장 많이 보급되어 있는 스마트폰의 경우에도 VUI를 사용하는 사용자는 매우 적은 상황이다. 본 연구의 목적은 현재 스마트폰에서 사용되고 있는 VUI의 이용 현황 및 사용자 인식을 조사하고 문제점을 파악하여 향후 VUI 사용성 제고를 위한 연구 방향을 제시하는 것이다. 163명의 대학생들을 대상으로 스마트폰 VUI의 사용 현황에 대한 설문 조사를 수행하였다. 조사 결과 VUI의 인지도는 높지만 사용률은 매우 낮았으며, 많은 사용자가 음성 인식 속도, 반응 속도 및 작동 방법에 대해 불편함을 느끼고 있는 것으로 나타났다. 대부분의 사용자가 호기심에서 VUI를 사용해봤지만 일부만이 계속 사용하고 있는 것으로 조사되었으며, 많은 사용자들이 기계에게 말하는 것과 다른 사람들이 듣는 것에 거부감을 가지고 있었다. 본 연구의 결과는 VUI의 활용도를 제고하기 위한 향후 연구에 도움이 될 것으로 기대된다.

콘포머 기반 FastSpeech2를 이용한 한국어 음식 주문 문장 음성합성기 (A Korean menu-ordering sentence text-to-speech system using conformer-based FastSpeech2)

  • 최예린;장재후;구명완
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.359-366
    • /
    • 2022
  • 본 논문에서는 콘포머 기반 FastSpeech2를 이용한 한국어 메뉴 음성합성기를 제안한다. 콘포머는 본래 음성 인식 분야에서 제안된 것으로, 합성곱 신경망과 트랜스포머를 결합하여 광역과 지역 정보를 모두 잘 추출할 수 있도록 한 구조다. 이를 위해 순방향 신경망을 반으로 나누어 제일 처음과 마지막에 위치시켜 멀티 헤드 셀프 어텐션 모듈과 합성곱 신경망을 감싸는 마카론 구조를 구성했다. 본 연구에서는 한국어 음성인식에서 좋은 성능이 확인된 콘포머 구조를 한국어 음성합성에 도입하였다. 기존 음성합성 모델과의 비교를 위하여 트랜스포머 기반의 FastSpeech2와 콘포머 기반의 FastSpeech2를 학습하였다. 이때 데이터셋은 음소 분포를 고려한 자체 제작 데이터셋을 이용하였다. 특히 일반대화 뿐만 아니라, 음식 주문 문장 특화 코퍼스를 제작하고 이를 음성합성 훈련에 사용하였다. 이를 통해 외래어 발음에 대한 기존 음성합성 시스템의 문제점을 보완하였다. ParallelWave GAN을 이용하여 합성음을 생성하고 평가한 결과, 콘포머 기반의 FastSpeech2가 월등한 성능인 MOS 4.04을 달성했다. 본 연구를 통해 한국어 음성합성 모델에서, 동일한 구조를 트랜스포머에서 콘포머로 변경하였을 때 성능이 개선됨을 확인하였다.

Voice Browser를 위한 음성 인식 웹서비스 환경에 관한 연구 (A Study of Speech Recognition Web Services Environment for Voice Browser)

  • 홍인숙;김윤중
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.142-145
    • /
    • 2009
  • 음성인터페이스 관련 표준화는 음성 대화, 음성인식/합성, 전화망 등의 접속망을 상호 분리하여 음성정보시스템 구성요소들 각각의 상호 독립적인 개발을 보장해 주며, 각 요소의 이해가 없이도 음성정보시스템을 개발할 수 있도록 함으로써 음성정보기술의 보급 및 확산에 크게 기여하고 있다. 이에 W3C에서는 Voice Browser에 대한 표준화를 현재 진행 중에 있으며 Vocie Browser WG에서 Voice Browser를 위한 SIF(Speech Interface Framework)를 제안하였다. 제안된 SIF에서 Voice Browser가 음성인식을 실행하기 위해서는 많은 자원의 소요와 부하가 생길 수 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 음성인식 웹 서비스를 기존의 SIF에 추가한 새로운 형태의 SIF를 제안하고자 한다. 음성인식은 원격 시스템에서 수행하고 그 결과를 Voice Browser가 사용할 수 있도록 음성인식 웹서비스 환경을 구축하였다. 그리고, XML-SRGS 포멧의 grammar를 음성인식기가 사용하는 EBNF 포멧의 grammar로 변환시키는 변환기를 구현하였다.

음성 사용자 인터페이스 내 피드백 유형이 사용자의 주관적 반응에 미치는 (Effects of Feedback Types on Users' Subjective Responses in a Voice User Interface)

  • 이다솜;이상원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.219-222
    • /
    • 2017
  • 본 연구에서는 음성 사용자 인터페이스가 적용된 시스템 사용 중 오류가 발생했을 때 제공되는 피드백이 시스템에 대한 사용자의 평가에 어떠한 영향을 줄 것인지에 대해 알아보았다. 피드백 유형(확인 피드백, 정교화 피드백)과 오류 유형(인식 실패, 수행 실패)을 독립 변수로 하고 사용자의 주관적 평가와 피드백 수용성, 향후 이용 의도를 종속 변수로 하는 요인설계 실험연구를 진행하였다. 이원 다변량 분산분석을 한 결과, 피드백 유형만 사용자의 주관적 평가와 피드백 수용성, 향후 이용의도에 영향을 미치는 것으로 나타났다. 또한, 피드백 수용성에 대해 피드백 유형과 오류 유형의 상호작용 효과가 발견되었다. 따라서 VUI 설계 시, 오류 정보를 자세히 알려주는 피드백을 제공하는 것을 고려해 볼 수 있을 것이다.

  • PDF

가정환경에서 홈 서비스로봇 인터페이스에 관한 연구 (A Study on home service robot interface in home environment)

  • 문용선;강성률;최형윤
    • 한국정보통신학회논문지
    • /
    • 제10권9호
    • /
    • pp.1710-1717
    • /
    • 2006
  • 현대는 과학의 발달로 점차 고령화 사회가 되면서 인간의 수명이 늘어나고 있어 장애를 갖는 장애인이 늘어나고 있다. 이러한 장애인을 위해 홈에서 가사 일을 도울 수 있는 홈 서비스 로봇의 개발이 이루어지고 있고, 이에 대한 기술로 인터페이스를 중요시하고 있다. 본 논문에서는 홈에서 인간과 로봇간의 인터페이스를 위한 음성 인식과 스테레오 카메라를 이용하여 음성에 따라 스테레오 카메라에 들어오는 물체의 거 리를 측정하였다.

홈 네트워크 환경에서 음성인식기반 사용자 인터페이스를 통한 가전기기 제어 시스템 구현 (Implementation of Home Appliance Control System with Speech Recognition based User Interfaces in Home Network Environments)

  • 김연우;장현수;김구수;엄영익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.735-738
    • /
    • 2007
  • 컴퓨팅 기술의 발전에 따라 유비쿼터스 시대로의 이행이 가속화되고 있다. 이에 따라 홈 네트워크 분야에 대한 연구와 상용화를 위한 노력이 활발해지고 있다. 이와 더불어 가전기기들의 종류는 다양해지고 복잡해지면서 사용자들의 가전기기 이용에 있어 사용법을 익혀야하는 어려움이 있다. 이러한 문제점을 해결하기 위한 일환으로 디지털 장치들을 편하게 사용하기 위한 멀티 모달 사용자 인터페이스가 요구되고 있다. 본 논문에서 네트워크 가전기기 제어가 가능한 홈 네트워크 미들웨어인 UPnP를 사용하여 VoiceXML을 통한 음성인식기반 사용자 인터페이스와 디지털 장치 제어 시스템을 제안하고 구현한 후 실험하였다.

멀티미디어 인터페이스 기술을 이용한 유아 대상의 체감형 게임 설계 : 신체 놀이 활동 중심 (Interactive Game Designed for Early Child using Multimedia Interface : Physical Activities)

  • 원혜민;이경미
    • 한국콘텐츠학회논문지
    • /
    • 제11권3호
    • /
    • pp.116-127
    • /
    • 2011
  • 본 논문에서는 유아를 위한 체감형 게임 개발에 필요한 요소로 콘텐츠, 디자인, 음향, 동작인식, 음성인식 기술을 제안하였다. 유아용 체감형 게임은 유아의 감성에 맞춘 교육적 요구가 반영된 콘텐츠와 밝고 친근감 있으면서 사용이 편리한 디자인 요소들이 반영되어야 하고 유아가 친숙하고도 쉽게 게임을 할 수 있게 유도할 수 있는 배경음악과 설명 대사가 사용되는 것이 좋다. 만약 동작 인식과 음성인식 시스템을 유아용 체감형 게임에 사용할 경우 게임 사용자의 연령에 맞는 동작 데이터와 음성 데이터를 사용해 인식률을 높여야 한다. 특히, 본 논문에서는 피부색과 유아 신체 모델을 사용하여 유아의 얼굴과 손을 인식한 후 그 위치를 고려하여 유아의 동작을 인식하였고 유아의 음성 데이터를 수집해 신경망을 이용한 음성인식 기술을 게임에 적용해 신체 놀이 중심 활동의 줄넘기 게임인 '신나게 폴짝'을 개발하였다.

조음 기관의 시각화를 이용한 음성 동기화 애니메이션 (Speech Animation by Visualizing the Organs of Articulation)

  • 이성진;김익재;고형석
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.843-851
    • /
    • 2006
  • 본 논문에서는 음성에 따른 얼굴 애니메이션을 사실적으로 표현하기 위한 조음기관(혀, 성대 등)의 움직임을 시각화하는 방법을 제시한다. 이를 위해서, 음성에 따른 얼굴 애니메이션을 위한 말뭉치(Corpus)를 생성하고, 생성된 말뭉치에 대해서 음소 단위의 분석(Phoneme alignment) 처리를 한 후, 각 음소에 따른 조음기관의 움직임을 생성한다. 본 논문에서는 조음기관의 움직임 생성을 위해서 얼굴 애니메이션 처리에서 널리 사용되고 있는 기저 모델 기반 형태 혼합 보간 기법(Blend shape Interpolation)을 사용하였다. 그리고 이를 통하여 프레임/키프레임 기반 움직임 생성 사용자 인터페이스를 구축하였다. 구축된 인터페이스를 통해 언어치료사가 직접 각 음소 별 조음기관의 정확한 모션 데이터를 생성토록 한다. 획득된 모션 데이터를 기반으로 각 음소 별 조음기관의 3차원 기본 기저를 모델링하고, 새롭게 입력된 음소 시퀀스(phoneme sequence)에 대해서 동기화된 3차원 조음기관의 움직임을 생성한다. 이를 통해 자연스러운 3차원 얼굴 애니메이션에 적용하여 얼굴과 동기화된 조음 기관의 움직임을 만들어 낼 수 있다.

  • PDF