• 제목/요약/키워드: 음성인식 에이전트

검색결과 17건 처리시간 0.022초

자동차 음성인식 인터랙션의 안전감과 만족도 인식 영향 요인 : 에이전트 퍼소나와 사용자 경험 속성을 중심으로 (Determinants of Safety and Satisfaction with In-Vehicle Voice Interaction : With a Focus of Agent Persona and UX Components)

  • 김지현;이가현;최준호
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.573-585
    • /
    • 2018
  • 커넥티드카 시스템에서 인공지능 음성인식 인터페이스 기기를 통한 주행 안내 및 엔터테인먼트 서비스가 상용화되고 있다. 이 연구는 차량용 음성 에이전트의 개발사를 IT와 자동차 제조사로 구분하여, 운전자의 안전감과 만족도에 영향을 미치는 에이전트의 퍼소나와 사용자 경험 속성들을 탐색하는 것을 목적으로 하였다. 자동차 시뮬레이터 주행 실험에서, 참가자들은 음성인식 에이전트를 통해 엔터테인먼트와 내비게이션조작 과제를 수행하고 안전감과 만족도를 평가하였다. 회귀분석 결과 안전감에 영향을 미치는 주요 선행요인은 에이전트 제조사의 신뢰도였으며, 퍼소나 요인은 따뜻함과 매력으로 나타났고, UX요인에서는 효율성과 배려로 나타났다. 만족도에서는 선행요인 중 에이전트 제조사의 일치 여부와 운전자 성별이, 퍼소나 속성은 거리감 적음, UX 측면에서는 편리성, 효율성, 사용 용이성, 배려가 유의미한 영향 요인으로 나타났다. 이 연구의 의의와 기여점은 자율주행 환경에서 대화형 VUI를 핵심 인터랙션 모드로 발전시키기 위해 어떤 요인들을 우선해야 할 것인지 선별한 실증적 결과를 제시한 데 있다.

휴대 멀티미디어 단말용 음성인식 시스템 개발 (Development of Continuous Speech Recognition System for Multimedia Mobile Terminal Applications)

  • 김승희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.59-62
    • /
    • 1998
  • 본 논문에서는 한국전자통신연구원의 Handy Combi 응용 도메인을 대상으로 한 화자독립 연속음성인식 시스템 개발에 관하여 기술한다. 불특정화자가 자연스럽게 발음한 연속음성을 인식하는 기술은 펜인식 등과 더불어 멀티모달 인터페이스의 핵심 요소로서, 이동 환경에서 사용자의 다양한 요구사항을 처리하는 지능형 에이전트에 구현을 위해 필수적으로 개발되어야 하는 기술이다. 본 논문에서는 연속확률분포를 가지는 Hidden Markov Model(HMM) 기반의 연속음성인식 시스템을 구현하였다. 개발된 시스템은 음성특징벡터로 MFCC를 사용하였으며, 음소 모델의 강인한 훈련을 위해 음성학적 지식에 기반을 둔 tree-based clustering 방식을 도입하였다. 인식단계에서는 인식속도를 개선시키기 위해 beam-search 기법을 적용하였다. 인식 실험 결과, 99.7%의 어절 인식률과 98.8%의 문장 인식률을 얻었으며, 최종적인 문장의 이해도는 99% 이상이었다.

  • PDF

대화형 에이전트 인식오류 및 신조어 탐지를 위한 알고리즘 개발: 한글 음절 분리 기반의 단어 유사도 활용 (Developing a New Algorithm for Conversational Agent to Detect Recognition Error and Neologism Meaning: Utilizing Korean Syllable-based Word Similarity)

  • 이정원;임일
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.267-286
    • /
    • 2023
  • 인공지능 스피커로 대표되는 대화형 에이전트는 사람-컴퓨터 간 대화형이기 때문에 대화 상황에서 오류가 발생하는 경우가 잦다. 에이전트 사용자의 발화 기록에서 인식오류는 사용자의 발화를 제대로 인식하지 못하는 미인식오류 유형과 발화를 인식하여 서비스를 제공하였으나 사용자가 의도한 바와 다르게 인식된 오인식오류 유형으로 나뉜다. 이 중 오인식오류의 경우, 서비스가 제공된 것으로 기록되기 때문에 이에 대한 오류 탐지가 별도로 필요하다. 본 연구에서는 텍스트 마이닝 기법 중에서도 단어와 문서를 벡터로 바꿔주는 단어 임베딩과 문서 임베딩을 이용하여 단순 사용된 단어 기반의 유사도 산출이 아닌 단어의 분리 방식을 다양하게 적용함으로써 연속 발화 쌍의 유사도를 기반으로 새로운 오인식오류 및 신조어 탐지 방법을 탐구하였다. 연구 방법으로는 실제 사용자 발화 기록을 활용하여 오인식오류의 패턴을 모델 학습 및 생성 시 적용하여 탐지 모델을 구현하였다. 그 결과, 오인식오류의 가장 큰 원인인 등록되지 않은 신조어 사용을 탐지할 수 있는 패턴 방식으로 다양한 단어 분리 방식 중 초성 추출 방식이 가장 좋은 결과를 보임을 확인하였다. 본 연구는 크게 두 개의 함의를 가진다. 첫째, 인식오류로 기록되지 않아 탐지가 어려운 오인식오류에 대하여 다양한 방식 별 비교를 통해 최적의 방식을 찾았다. 둘째, 이를 실제 신조어 탐지 적용이 필요한 대화형 에이전트나 음성 인식 서비스에 적용한다면 음성 인식 단계에서부터 발생하는 오류의 패턴도 구체화할 수 있으며, 오류로 분류되지 않더라도 사용자가 원하는 결과에 맞는 서비스가 제공될 수 있음을 보였다.

대화형 에이전트의 오류 상황에서 사회적 전략 적용: 사전 양해와 사과를 이용한 사례 연구 (Applying Social Strategies for Breakdown Situations of Conversational Agents: A Case Study using Forewarning and Apology)

  • 이유미;박선정;석현정
    • 감성과학
    • /
    • 제21권1호
    • /
    • pp.59-70
    • /
    • 2018
  • 음성인식 기술의 비약적 발전으로 최근 몇 년 사이 대화형 에이전트는 스마트폰, 인공지능 스피커 등을 통해 널리 보급되었다. 음성인식 기술의 인식의 정확도는 인간의 수준까지 발전하였으나, 여전히 말의 의미나 의도를 파악하는 것과 긴 대화를 이해하는 것 등에는 한계를 보이고 있다. 이에 따라 사용자는 대화형 에이전트를 사용함에 있어 다양한 오류 상황들을 경험하고 있으며 이는 사용자 경험에 부정적인 영향을 미칠 수 있다. 또한, 목소리를 주 인터페이스로 하는 인공지능 스피커의 경우, 대화형 에이전트의 기능 및 한계에 대한 피드백의 부족은 지속적 사용을 저해하는 요소로 꼽히고 있다. 따라서 사용자가 대화형 에이전트의 기능 및 한계를 보다 잘 이해하고 오류 상황에서 부정적인 감정을 완화할 수 있는 방안에 대한 연구에 대한 필요성이 높으나, 아직 관련 연구는 미비한 실정이다. 이에 본 연구에서는 사회적 전략 중 '사전 양해'와 '사과'를 대화형 에이전트에 적용하고 이러한 전략이 사용자가 에이전트에 대해 느끼는 인식에 어떠한 영향을 미치는지 조사하였다. 이를 위해 사전 양해와 사과 여부를 나누어 사용자가 대화형 에이전트와 대화하는 데모 영상을 제작하였고, 실험참가자들에게 영상을 보여준 뒤 느끼는 호감도와 신뢰도를 설문을 통해 평가하도록 하였다. 총 104명의 응답을 분석한 결과, 문헌조사를 토대로 한 우리의 예상과는 상반되는 결과를 얻었다. 사전 양해는 오히려 사용자에게 부정적인 인상을 주었으며, 특히 에이전트에 대한 신뢰도에 부정적인 영향을 주었다. 또한 오류 상황에서의 사과는 사용자가 느끼는 호감도나 신뢰도에는 유의미한 영향을 미치지 않았다. 심층인터뷰를 통해 원인을 파악한 결과, 실험참가자들은 인공지능 스피커를 사람과 같은 인격체보다는 단순한 기계에 가깝다고 인식했기 때문에 인간관계에 작용하는 사회적 전략이 영향력을 발휘하지 못한 것으로 해석된다. 이러한 결과는 사용자가 에이전트를 얼마나 기계, 혹은 사람에 가깝게 인식하는지에 따라 오류 상황에 대한 에이전트의 대처 방식 또한 달라져야 함을 보여준다.

스마트홈 대화형 인터페이스의 의인화 효과 음성-채팅 인터랙션 유형에 따른 실험 연구 (Effects of Anthropomorphic Conversational Interface for Smart Home: An Experimental Study on the Voice and Chatting Interactions)

  • 홍은지;조광수;최준호
    • 한국HCI학회논문지
    • /
    • 제12권1호
    • /
    • pp.15-23
    • /
    • 2017
  • 이 연구는 인간성의 개념과 구성 요인들을 스마트 홈 맥락에서 대화형 에이전트에 적용하여, 의인화의 수준과 인터랙션 유형이 사용자 감성 경험과 향후 이용 의도에 미치는 효과를 알아보고자 하였다. 실험연구를 통한 분석 결과 의인화의 고-저 수준과 인터랙션의 음성-채팅 유형은 친밀도, 호감도, 향후 이용 의도에 영향을 미치는 것으로 나타났다. 즉, 의인화 수준이 높고, 음성 인터랙션인 경우 대화형 에이전트를 더 친밀하고 호감이 가며 향후에도 계속해서 이용하고 싶은 대상으로 평가하였다. 또한, 의인화의 고-저 수준과 관계없이, 채팅에 비해 음성 인터랙션이 심리적 저항감이 낮았다. 향후 이용 의도에 대해서 의인화 수준과 인터랙션 유형의 상호작용 효과가 발견되었다. 즉, 채팅 인터랙션은 의인화의 효과가 나타나지 않은 반면, 음성 인터랙션의 경우 의인화의 효과가 나타났다. 따라서, 음성 대화형 스마트홈 에이전트는 의인화 수준을 높이는 방향으로 설계가 되어야 사용자들의 지속적 이용을 기대할 수 있다.

반자율주행 맥락에서 AI 에이전트의 멀티모달 인터랙션이 운전자 경험에 미치는 효과 : 시각적 캐릭터 유무를 중심으로 (The Effect of AI Agent's Multi Modal Interaction on the Driver Experience in the Semi-autonomous Driving Context : With a Focus on the Existence of Visual Character)

  • 서민수;홍승혜;이정명
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.92-101
    • /
    • 2018
  • 대화형 AI 스피커가 보편화되면서 음성인식은 자율주행 상황에서의 중요한 차량-운전자 인터랙션 방식으로 인식되고 있다. 이 연구의 목적은 반자율주행 상황에서 음성뿐만 아니라 AI 캐릭터의 시각적 피드백을 함께 전달하는 멀티모달 인터랙션이 음성 단일 모드 인터랙션보다 사용자 경험 최적화에 효과적인지를 확인하는 것이다. 실험 참가자에게 주행 중 AI 스피커와 캐릭터를 통해 음악 선곡과 조정을 위한 인터랙션 태스크를 수행하게 하고, 정보 및 시스템 품질, 실재감, 지각된 유용성과 용이성, 그리고 지속 사용 의도를 측정하였다. 평균차이 분석 결과, 대부분의 사용자 경험 요인에서 시각적 캐릭터의 멀티모달 효과는 나타나지 않았으며, 지속사용 의도에서도 효과는 나타나지 않았다. 오히려, 정보품질 요인에서 음성 단일 모드가 멀티모달보다 효과적인 것으로 나타났다. 운전자의 인지적 노력이 필요한 반자율주행 단계에서는 멀티모달 인터랙션이 단일 모드 인터랙션에 비해 사용자 경험 최적화에 효과적이지 않았다.

긴급상황에 대한 가상현실 선원 훈련 플랫폼 (VR-simulated Sailor Training Platform for Emergency)

  • 박철웅;정진기;양현승
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2015년도 추계학술대회
    • /
    • pp.175-178
    • /
    • 2015
  • 본 논문은 국내외 해양사고 원인의 60-80%에 해당하는 인적과실을 예방하기 위하여 긴급상황에 대한 가상현실 선원 훈련 플랫폼을 제안한다. 제안된 훈련 플랫폼은 가상현실 기술을 통해 긴급 상황 내 절차 숙달을 위한 상호작용 방법과 가상 선박 환경 내에서 군중 에이전트를 제어하는 군중 제어 방법을 제공한다. 제안된 훈련 플랫폼의 상호작용 방법은 훈련 몰입도를 높이기 위하여 음성인식과 행동인식을 사용한다. 군중 제어는 사회적 특성을 반영한 에이전트의 행동모델을 적용하여 자연스러운 시뮬레이션을 제공한다. 제안된 훈련 플랫폼의 효율성을 실험하기 위해 선박 내 화재 상황에 대한 가상 훈련 시나리오를 standalone 훈련 플랫폼으로써 구현하였다.

  • PDF

캐릭터 에이전트를 이용한 교육용 컨텐츠 저작에 대한 연구 (A Study for Education Contents Production using Character Agent)

  • 박상의;이혜정;정석태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 추계학술발표논문집 (상)
    • /
    • pp.37-40
    • /
    • 2003
  • 본 논문은 LipSynchro 소프트웨어 개발 키트(SDK)를 이용하여 기존 2차원의 정지된 이미지를 모션생성엔진, 음성분석, 인식엔진과 함께 연동함으로서 캐릭터의 움직임을 자동으로 생성하여 사실적이고 살아있는 캐릭터 에이전트를 만들어, 이를 멀티미디어 교육용 컨텐츠저작 툴과 결합하여 보다 나은 교육용 컨텐츠를 생성할 수 있도록 하였다.

  • PDF

A.I.에이전트와의 보이스 인터랙션 : 국내외 IT회사 사례연구 (Voice Interactions with A. I. Agent : Analysis of Domestic and Overseas IT Companies)

  • 이서영
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권4호
    • /
    • pp.15-29
    • /
    • 2021
  • 인공지능 에이전트는 4차 산업혁명의 핵심 기술이고, 현재 많은 기업들이 AI 음성 인식 비서를 탑재 출시함으로써 산업 내 치열한 경쟁을 벌이고 있다. 애플, 마이크로소프트, 구글, 아마존, 삼성 등 고객 충성도를 확보하고 있으며 자사 하드웨어 제품을 내놓고 있는 기업의 경우, AI 비서 서비스를 자사 제품에 적용함으로써 고객 충성도를 높이고, 시장 점유율 역시 극대화뿐 아니라 향후 음성 인터페이스 플랫폼 시장 장악력을 확대하고 있다. 본 연구는 인공지능분야의 해외 및 국내 주요 기업들의 현황을 분석하고 보이스 UI 개발과 혁신 수용 관점에서 사용자 만족을 위한 기술 발전 방향에 초점을 맞추어 미래 전략 방향을 제언했다. B2B 기술적인 측면에서는 음성 인식률을 높이고 하드웨어향상, 자연언어 처리기술 및 빅데이터 및 인공지능 접목한 혁신 기술의 데이터가 쌓인 클라우드 컴퓨팅 활용뿐 아니라 및 Open A.I.언어 인공지능인 GPT-3의 활용 및 사용성, 유용성, 감성 측면에서 사용자 만족을 높일 필요가 있다. 본 연구는 산업계와 학계에 실무적, 이론적 함의를 준다.

최신 대화형 에이전트 기반 상용화 교육 플랫폼 오류 분석 (Error Analysis of Recent Conversational Agent-based Commercialization Education Platform)

  • 이승준;박찬준;서재형;임희석
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.11-22
    • /
    • 2022
  • 최근 교육 분야에서 다양한 인공지능 기술을 활용한 연구와 개발이 이뤄지고 있다. 인공지능을 활용한 교육 중 특히 대화형 에이전트는 시간과 공간의 제약을 받지 않고 음성인식, 번역과 같은 다양한 인공지능 기술과 결합해 더 효과적인 언어 학습을 가능하게 한다. 본 논문은 상용화된 교육용 플랫폼 중 이용자 수가 많고 영어 학습을 위한 대화형 에이전트가 활용된 플랫폼에 대한 동향 분석을 진행하였다. 동향 분석을 통해 현재 상용화된 교육용 플랫폼의 대화형 에이전트는 여러 한계점과 문제점이 존재했다. 구체적인 문제점과 한계점 분석을 위해 사전 학습된 최신 대용량 대화 모델과 비교 실험을 진행하였고, 실험 방법으로 대화형 에이전트의 대답이 사람과 비슷한지를 평가하는 Sensibleness and Specificity Average (SSA) 휴먼 평가를 진행하였다. 실험 내용을 바탕으로, 효과적인 학습을 위해 개선방안으로 대용량 파라미터로 학습된 대화 모델, 교육 데이터, 정보 검색 기능의 필요성을 제안했다.