• 제목/요약/키워드: 음성사용자인터페이스

검색결과 198건 처리시간 0.023초

음성 인터페이스와의 상호작용에서 AI 음성이 성별에 따른 사용자의 감성 만족도에 미치는 영향 (Moderating Effects of User Gender and AI Voice on the Emotional Satisfaction of Users When Interacting with a Voice User Interface)

  • 신종규;강준모;박영진;김상호
    • 감성과학
    • /
    • 제25권3호
    • /
    • pp.127-134
    • /
    • 2022
  • 본 연구의 목적은 음성 인터페이스(Voice User Interface, VUI)를 이루는 설계변수 중 사용자에게 긍정적인 감성을 유발하는 설계변수를 확인하는 것이다. 특히, 사용자의 성별과 설계변수의 조절 효과를 분석하여 VUI와 상호작용하는 동안 사용자가 만족할 수 있는 적절한 설계변수 수준을 찾아보고자 하였다. 선행연구를 통해 VUI에 사용되는 음성설계변수 중에서 사용자의 감성 만족도에 영향을 미칠 수 있는 설계변수 6가지를 도출하였다. 설계변수는 수준을 조절할 수 있도록 Wizard of OZ를 활용하여 VUI 시스템을 구현하였고, 6가지 설계변수의 수준을 조합하여 사용자와 음성으로 대화를 할 수 있도록 구성하였다. 실험에 참여한 사용자는 총 80명으로, 남/여 성비를 고려하여 각 40명씩 모집하였다. 사용자는 VUI와 주어진 임무에 대한 정답을 알아내기 위해 자연스러운 대화를 진행하며, 그동안의 얼굴표정 변화에 대한 이미지 데이터를 수집 및 표정 분석 소프트웨어를 통해 Valence 점수로 변환하였다. Valence 데이터를 기반으로 빈도 및 카이제곱 분석을 통해 확인한 결과, 사용자의 성별과 AI gender간의 조절효과가 유의한 것으로 나타났다. 이 결과는 VUI를 설계할 때 사용자의 성별 차이를 고려하는 것이 좋다는 것을 의미한다. 결론적으로, 남성 사용자의 경우 성인/남성/높은 톤의 음성, 여성 사용자의 경우 성인/여성/중간톤의 음성이 향후 만족스러운 인터랙션 구현을 위한 VUI 설계에 주요한 가이드라인인 것을 확인하였다. 본 연구의 결과를 통해 향후 다양한 인적 요소를 고려하여 UX 관점에서 인간-AI 상호작용을 보다 섬세하게 분석할 수 있을 것이며, 표정을 통한 실시간 감성 측정을 위한 기초연구로 활용될 수 있을 것이다.

Context 정보를 이용한 명령어 음성인식의 성능향상 (Performance improvement of Command Speech recognition using Context Information)

  • 김영주;김은주;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.718-720
    • /
    • 2005
  • 이동 단말기의 대중화로 사용자는 시간과 공간의 제약 없이 필요한 다양한 정보 서비스를 쉽게 접할 수 있게 되었다. 그러나 사용자 인터페이스에 있어 이동 단말기는 제약사항이 않음으로 적시적소에 원하는 정보를 접근하기가 어렵기 때문에 음성인식을 통한 인터페이스 연구가 진행되고 있으며, 특히 잡음환경에서 강인한 음성인식 처리를 위한 연구가 활발히 진행되고 있다. 지금까지 잡음환경을 위한 음성인식 접근 방법으로는 언어모델의 개선과 음향모델 개선으로 크게 구분할 수 있다. 그러나 이러한 접근 방법들은 적용하는데 있어 많은 시간과 비용이 요구됨으로 효율성이 떨어진다. 따라서 본 논문에서는 이러한 효율성 문제를 보완하기 위해 음성인식기로부터 인식되어 나오는 결과를 문맥정보와 융합하여 정보를 추출하고 이 정보를 이용한 후처리 모듈을 이용하여 인식시에 발생하는 오류를 적은 비용과 시간으로 수정하여 이동 단말기에 이용할 수 있도록 한다.

  • PDF

개인용 미디어 관리 소프트웨어에 대한 사용자 요구사항 (User Requirements for Personal Media Management Software)

  • 서희철;김현기;장명길
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.124-126
    • /
    • 2006
  • 본 논문은 개인이 소장하고 있는 문서, 이미지, 오디오, 동영상 등의 미디어를 통합 관리하는 개인용 미디어 관리 소프트웨어의 필요성, 기능, 인터페이스 등에 관한 사용자 요구사항을 정리한다. 사용자 요구사항은 사용자 설문을 통해서 조사되었으며, 설문에는 사용자 환경과 개인용 미디어 관리 소프트웨어에 필요한 기능, 인터페이스에 관한 내용을 담고 있다 사용자 요구 사항에서 사용자들은 다수의 미디어를 컴퓨터에 저장하고 있으며, 이들을 효율적으로 관리할 수 있는 소프트웨어를 필요로 하고 있다. 이들을 관리하기 위한 기능으로 미디어 분석, 분류, 검색, 재생 기능을 필요로 한다. 그리고 사용자들은 컴퓨터뿐만 아니라 핸드폰, PDA와 같은 모바일 기기에서도 개인용 미디어를 관리하고자 한다. 인터페이스에서는 키보드와 마우스 입력과 함께 모바일 기기를 위한 음성 인터페이스에 대한 요구가 있다.

  • PDF

음성 인식 서버를 이용한 모바일 사전 설계 및 구현 (The Design and Implementation of Mobile Dictionary App based on Voice Recognition Server)

  • 유재승;박희태;박미소;송민규;윤성현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1698-1701
    • /
    • 2012
  • 음성 인식은 사용자의 음성을 문자로 변환하는 기술로 최근 스마트폰의 사용자 인터페이스로 사용되면서 그 활용도가 높아지고 있다. 기존의 스마트폰용 사전 프로그램은 좁은 자판으로 인하여 입력과정에 오타가 많이 발생하고, 찾고자 하는 단어의 발음은 알고 있지만 철자를 알지 못 하는 경우에 검색할 수 없다. 본 논문에서는 음성 명령을 이용한 스마트폰용 영한사전 앱을 설계 및 구현하였다. 외부 음성 인식 서버를 이용하여 음성 명령을 이해하고 클라이언트에 SQLite를 이용하여 사전 데이터 베이스를 구축한다. 클라이언트는 서버로 사용자 음성을 전달하고, 서버는 음성 정보를 텍스트로 변환하여 클라이언트에게 제공한다[1]. 클라이언트는 서버로부터 전송받은 텍스트를 이용하여 사전 데이터베이스를 검색하고, 그 결과를 사용자에게 보여준다.

AI의 음성 디자인에서 고려해야 할 감성적 요소 및 국가별 음성 트랜드에 관한 연구 - 핀란드와 노르웨이의 전문가 인뎁스 인터뷰를 중심으로 (Research on Emotional Factors and Voice Trend by Country to be considered in Designing AI's Voice - An analysis of interview with experts in Finland and Norway)

  • 남궁기찬
    • 한국융합학회논문지
    • /
    • 제11권9호
    • /
    • pp.91-97
    • /
    • 2020
  • 사용자와의 인터랙션이 가능한 음성 기반의 인터페이스는 AI 기술의 발달에 따라 사용이 확대되고 있다. 하지만, 현재까지의 음성 기반 인터페이스에 대한 연구는 음성 인식의 정확성 향상 등 기술적인 연구들이 대부분이었다. 이렇다 보니, 대부분의 음성 기반 인터페이스의 목소리는 차별화된 감성을 제공하지 않으며 획일화되어 있다. 본 연구에서는 AI 인터페이스의 음성에 적합한 감성 요소를 더하는 것을 목적으로 한다. 이를 위해 음성 인터페이스 디자인에서 고려되어야 할 감성적 요소를 도출하였다. 또한, 국가별로 차이를 보이는 보이스 트렌드를 조사하였다. 본 연구를 위해 자국의 언어를 독립적으로 사용하는 핀란드와 노르웨이, 두 국가의 음성 산업 전문가들과 인터뷰를 진행하였다.

전자프로그램 가이드를 위한 음성 인터페이스 (VoiceEPG: Speech Interface for Electronic Program Guide)

  • 김한수;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (3)
    • /
    • pp.589-591
    • /
    • 2003
  • 최근 디지털 TV 방송의 활성화에 힘입어 수많은 채널을 통한 TV 프로그램 방송이 가능하게 되었다. 이로 인해 디지털 TV 시청자들은 신문 또는 TV 가이드와 같은 기존 인쇄매체를 통해 자신이 원하는 TV 프로그램 스케줄을 얻기가 사실상 매우 어렵게 되었다. 이와 같은 문제점을 해결하기 위해 디지털 TV 환경에서는 전자 프로그램 가이드(EPG: Electronic Program Guide)를 제공한다. 현재 제공되고 있는 EPG 서비스들은 대개 디지털 TV 화면 또는 각 방송사 웹 사이트 그리고 이동 단말기 등을 통해서 서비스 되고 있다. 대부분의 기존 연구들은 EPG 정보를 화면상에 시각적으로 제공하는 측면에만 초점을 두고 있다. 하지만 실질적으로 사용자 입장에서는 원하는 방송 프로그램의 스케줄 정보를 찾기 위해서 수백 채널에 달하는 방송 프로그램에 대한 정보를 일일이 검색하는 것은 매우 힘든 일이다. 게다가 사용자가 원하는 키워드를 직접 입력하는 방식 또한 사용자를 매우 번거롭게 한다. 따라서 본 논문에서는 EPG 서비스 방식에 VoiceXML 관련 기술을 접목하여 이동 단말기상에서 간단한 음성입력을 통해 EPG 서비스를 제공받을 수 있는 음성 인터페이스를 제안한다.

  • PDF

검색엔진을 이용한 VoiceXML 검색 인터프리터 개발에 관한 설계 (Design of VoiceXML interpreter for search system)

  • 이동민;윤영선;은성배
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1439-1442
    • /
    • 2003
  • 본 연구에서는 휴대 통신 단말 기기나 기존의 전화망에서의 음성 인터페이스를 이용해 인터넷 웹 검색을 가능하게 하는 VoiceXML 인터프리터를 개발하기 위한 설계를 논의한다. 기존의 VoiceXML 인터프리터 시스템은 미리 정해진 시나리오로 구성된 정적 페이지만을 대상으로 하나 제안하는 방법은 인터넷 웹사이트에서 음성 인터페이스만을 이용해 원하는 정보에 대한 검색결과를 HTML로 해석하여 VXML 인터페이스를 통하여 사용자에게 전달한다

  • PDF

PDA용 음성명령기 개발 (The development of an application invocation using speech recognition on PDA)

  • 이상철;정영준
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2002년도 하계학술대회 및 세미나
    • /
    • pp.213-219
    • /
    • 2002
  • 본 논문은 상용 OS 인 windows CE 기반의 PDA에서 음성으로 각 응용 프로그램 을 실행하는 방법 및 구성을 제시한다. PDA는 기존 desktop PC 에 비해 사용자 입력수단이 많지 않고, 그 사용법조차 까다롭다. 예를 들어 SIP(Soft Input Panel)을 이용하여 채팅을 하거나 인터넷 웹 브라우저에 주소입력조차 쉽지 않다. 이에 KT의 자체 개발한 음성인식엔진을 이용하여 PDA내 응용프로그램 과 사용자입력 요구사항을 원활히 연결, 보다 편리한 사용자 입력인터페이스를 제공한다. KT의 음성인식엔진은 corpus 기반으로 HMM 모델을 이용, 사용자 음성을 인식하여 그 결과를 출력한다. 본 논문에서는 PDA에서의 이러한 음성인식엔진을 이용, 다수의 응용프로그램을 실행하고 제어하는 구성과 패턴을 제시한다.

  • PDF

어린이 행동 패턴에 기반한 개별화된 음성 합성 (Customized Speech Synthesis for Children with Characteristic Behavioral Patterns)

  • 이호준;박종철
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.571-578
    • /
    • 2006
  • 음성을 통한 사용자 간의 정보 교환 방법은 추가적인 훈련 과정이나 장비가 필요하지 않고 공간 제약이 거의 없기 때문에 노약자 등 사용자의 연령대에 관계없이 사용될 수 있다. 또한 음성 정보는 시각이나 촉각 등 다른 정보 수단과의 상호 작용으로 상승 효과를 유발할 수 있기 때문에 사람과 기계 사이의 인터페이스로 활용될 경우 정보 전달력을 높이면서 사용자 친화적인 서비스를 제공할 수 있다. 그러나 동일한 상황에서 동일한 유형의 음성 정보가 사용자에게 지속적으로 제공될 경우 표현상의 단조로움으로 인해 정보 전달력이 급감할 수 있는 문제점도 지니고 있다. 따라서 음성을 통한 정보 전달의 경우 동일 상황이라 하더라도 사용자의 행동 패턴, 심리 상태, 주변 환경 등에 따라 차별화된 문장 구조 및 어휘의 선택으로 긴장감을 유지시켜 줄 수 있어야 한다. 본 논문에서는 5 세 전후의 어린이를 대상으로 그들의 행동 패턴 분석에 기반하여 개별화된 음성 합성 결과를 제공하는 시스템을 제안한다. 이를 위해 유치원이라는 물리적 공간에서 어린이들의 주된 행동 패턴을 분석하고, 현직 유치원 교사를 대상으로 동일한 정보를 전달하는 조건을 통하여 어린이의 행동 패턴과 위치 정보, 연령 및 성격에 따른 발화 문장의 문장 구조와 어휘적 특성을 파악한다. 최종적으로, 개별화된 음성 합성 결과를 위해 유치원 공간을 시뮬레이션 하고 RFID 를 이용하여 어린이의 행동 패턴 및 위치 정보를 파악한다. 그리고 각 상황에 따라 분석된 발화문의 문장 구조와 어휘 특성을 반영하여 음성으로 합성될 문장의 문장 구조 및 어휘를 재구성하여 사용자 개별화된 음성 합성 결과를 생성한다. 이러한 결과를 통해 어린이의 행동 패턴이 발화문의 문장 구조 및 어휘에 미치는 영향에 대해서 살펴보고 재구성된 결과 발화문을 평가한다.

  • PDF

VoiceXML을 이용한 홈 네트워크 음성 인터페이스 (Home Network Speech Interface Using VoiceXML)

  • 노용완;김동규;신정훈;정광우;홍광석
    • 융합신호처리학회논문지
    • /
    • 제6권3호
    • /
    • pp.127-133
    • /
    • 2005
  • 본 논문에서는 홈 네트워크 시스템 상에서의 VoiceXML을 이용한 음성 인터페이스를 제안한다. 기존의 홈 네트워크 인터페이스는 블루투스, IrDA, 무선 LAN, Home RF를 사용하지만 집 외부와 같은 원거리에서 사용 할 수 없거나 사용방법이 어려웠다. 본 논문에서 제안한 VoiceXML 음성 인터페이스는 다른 인터페이스 기술들 보다 원거리에서 사용자가 홈 네트워크 서비스를 지원 받을 수 있으며 또한 유무선 전화를 사용하여 흠 서버를 제어하며 VoiceXML server를 통하여 사용자에게 직접 전화를 걸어 문제점을 알려줄 수 있다. 본 논문에서는 이러한 음성 인터페이스를 홈 네트워크 측면에서 활용하였고 실질적인 원격검침, 원격제어 서비스를 구현한다. 그리고 이를 기초로 제안한 방식의 효율성을 평가한다.

  • PDF