• 제목/요약/키워드: 음성 기반 에이전트

검색결과 21건 처리시간 0.022초

SIP 기반 인터넷 전화 서비스를 위한 사용자 에이전트의 설계 및 구현 (Design and Implementation of User Agent for Internet Telephony Services based on SW)

  • 허미영;한재천;현욱;박선옥;강신각;김대영
    • 한국정보과학회논문지:정보통신
    • /
    • 제32권3호
    • /
    • pp.350-358
    • /
    • 2005
  • 최근 VoIP 기술이 음성 관련 부가가치 서비스에 쉽게 적용될 수 있어 현재 각광을 받고 있다. 특히, 인터넷 전화 서비스가 기존 전화 서비스를 대체할 수 있어 이에 대한 관심이 커졌다. 인터넷 전화 서비스를 위한 시그날링 프로토콜로 ITU-T에서 정의한 H.323 프로토콜이나 IETF에서 정의한 SIP 프로토콜이 가능하다. 그러나, SIP가 H.323보다 복잡도가 낮고, 확장성이 높아 최근에는 SIP를 선호하는 추세이다. 따라서, 다양한 서비스를 개발하기 위한 SIP 구성요소의 확보가 중요하다. 그러나, 오픈 소스 코드는 기본적인 기능만을 제공하고 있고, 전체적인 구조가 하나로 묶여 있어 확장이 용이하지 않다. 특히, 사용자 에이전트는 VoIP 서비스에서 적용 가능한 다양한 여러 서비스가 결합되는 부분이다. 이는 SIP에서 정의한 사용자 에이전트의 동작(behaviour)을 지원하면서 다양한 여러 서비스의 기능을 제공할 수 있어야 하기 때문이다. 따라서, 본 논문에서는 SIP의 세부 기능에 독립적으로 다양한 서비스 창출이 가능하게 하기위한 사용자 에이전트의 구조 및 응용과의 인터페이스 방법, 사용자 에이전트에서 제공되어야 할 주요 기능 및 내부 처리 절차, 다양한 상호운용성 시험을 통해 도출된 안정화된 사용자 에이전트를 위한 점검 목록들을 제시하고자 한다.

최신 대화형 에이전트 기반 상용화 교육 플랫폼 오류 분석 (Error Analysis of Recent Conversational Agent-based Commercialization Education Platform)

  • 이승준;박찬준;서재형;임희석
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.11-22
    • /
    • 2022
  • 최근 교육 분야에서 다양한 인공지능 기술을 활용한 연구와 개발이 이뤄지고 있다. 인공지능을 활용한 교육 중 특히 대화형 에이전트는 시간과 공간의 제약을 받지 않고 음성인식, 번역과 같은 다양한 인공지능 기술과 결합해 더 효과적인 언어 학습을 가능하게 한다. 본 논문은 상용화된 교육용 플랫폼 중 이용자 수가 많고 영어 학습을 위한 대화형 에이전트가 활용된 플랫폼에 대한 동향 분석을 진행하였다. 동향 분석을 통해 현재 상용화된 교육용 플랫폼의 대화형 에이전트는 여러 한계점과 문제점이 존재했다. 구체적인 문제점과 한계점 분석을 위해 사전 학습된 최신 대용량 대화 모델과 비교 실험을 진행하였고, 실험 방법으로 대화형 에이전트의 대답이 사람과 비슷한지를 평가하는 Sensibleness and Specificity Average (SSA) 휴먼 평가를 진행하였다. 실험 내용을 바탕으로, 효과적인 학습을 위해 개선방안으로 대용량 파라미터로 학습된 대화 모델, 교육 데이터, 정보 검색 기능의 필요성을 제안했다.

대화형 에이전트의 오류 상황에서 사회적 전략 적용: 사전 양해와 사과를 이용한 사례 연구 (Applying Social Strategies for Breakdown Situations of Conversational Agents: A Case Study using Forewarning and Apology)

  • 이유미;박선정;석현정
    • 감성과학
    • /
    • 제21권1호
    • /
    • pp.59-70
    • /
    • 2018
  • 음성인식 기술의 비약적 발전으로 최근 몇 년 사이 대화형 에이전트는 스마트폰, 인공지능 스피커 등을 통해 널리 보급되었다. 음성인식 기술의 인식의 정확도는 인간의 수준까지 발전하였으나, 여전히 말의 의미나 의도를 파악하는 것과 긴 대화를 이해하는 것 등에는 한계를 보이고 있다. 이에 따라 사용자는 대화형 에이전트를 사용함에 있어 다양한 오류 상황들을 경험하고 있으며 이는 사용자 경험에 부정적인 영향을 미칠 수 있다. 또한, 목소리를 주 인터페이스로 하는 인공지능 스피커의 경우, 대화형 에이전트의 기능 및 한계에 대한 피드백의 부족은 지속적 사용을 저해하는 요소로 꼽히고 있다. 따라서 사용자가 대화형 에이전트의 기능 및 한계를 보다 잘 이해하고 오류 상황에서 부정적인 감정을 완화할 수 있는 방안에 대한 연구에 대한 필요성이 높으나, 아직 관련 연구는 미비한 실정이다. 이에 본 연구에서는 사회적 전략 중 '사전 양해'와 '사과'를 대화형 에이전트에 적용하고 이러한 전략이 사용자가 에이전트에 대해 느끼는 인식에 어떠한 영향을 미치는지 조사하였다. 이를 위해 사전 양해와 사과 여부를 나누어 사용자가 대화형 에이전트와 대화하는 데모 영상을 제작하였고, 실험참가자들에게 영상을 보여준 뒤 느끼는 호감도와 신뢰도를 설문을 통해 평가하도록 하였다. 총 104명의 응답을 분석한 결과, 문헌조사를 토대로 한 우리의 예상과는 상반되는 결과를 얻었다. 사전 양해는 오히려 사용자에게 부정적인 인상을 주었으며, 특히 에이전트에 대한 신뢰도에 부정적인 영향을 주었다. 또한 오류 상황에서의 사과는 사용자가 느끼는 호감도나 신뢰도에는 유의미한 영향을 미치지 않았다. 심층인터뷰를 통해 원인을 파악한 결과, 실험참가자들은 인공지능 스피커를 사람과 같은 인격체보다는 단순한 기계에 가깝다고 인식했기 때문에 인간관계에 작용하는 사회적 전략이 영향력을 발휘하지 못한 것으로 해석된다. 이러한 결과는 사용자가 에이전트를 얼마나 기계, 혹은 사람에 가깝게 인식하는지에 따라 오류 상황에 대한 에이전트의 대처 방식 또한 달라져야 함을 보여준다.

몰입형 가상환경에서 가상 보조 에이전트의 인터페이스 응용 (Interface Application of a Virtual Assistant Agent in an Immersive Virtual Environment)

  • 나기리;김진모
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제30권1호
    • /
    • pp.1-10
    • /
    • 2024
  • 본 연구는 혼합현실과 가상현실을 포함하는 몰입형 가상환경에서 OpenAI의 ChatGPT를 활용한 가상 보조 에이전트의 인터페이스 응용에 관한 새로운 방법을 제안한다. 제안하는 응용 방법은 사용자의 질의에 응답하는 정보 에이전트와 사용자의 요구에 맞춰 가상 객체, 환경 등을 제어하는 제어 에이전트로 구성된다. 이를 위해, Unity 3D 엔진, OpenAI, 그리고 가상현실과 혼합현실 사용자 참여를 위한 패키지 및 개발 도구를 통합하는 개발환경을 설정한다. 그리고 음성 입력으로부터 질문 쿼리에서 답변 쿼리, 또는 제어 요구 쿼리에서 제어 스크립트로 생성으로 연결되는 작업 흐름을 설정한다. 이를 기반으로 혼합현실, 가상현실 체험 환경을 직접 제작하고 에이전트의 성능 확인을 위한 실험을 정보 에이전트의 반응 시간, 제어 에이전트의 정확도로 나누어 진행하였다. 결과적으로 제안하는 인터페이스 응용을 통해 사용자 친화적이고 단순하고 반복적인 작업에서의 효율을 높이는데 유용할 수 있음을 확인하였다. 우리는 새롭게 제안하는 인터페이스를 통해 몰입형 가상환경에서 인터페이스로의 응용에 관한 새로운 방향성을 제시하고 발견된 문제점과 현재까지의 한계점을 분명히 밝힌다.

사용자 인터페이스 에이젼트 환경을 위한 국어 발음 애니메이션 (Korean Talking Animation for User Interface Agent Environment)

  • 최승걸;이미승;김웅순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.284-297
    • /
    • 1996
  • 사용자가 컴퓨터와 자연스럽고 인간적으로 대화할 수 있고, 사람의 요구에 지능적인 해답을 능동적으로 제시할 수 있는 사용자 인터페이스 에이전트가 활발히 연구되고 있다. 음성, 펜, 제스쳐인식 등을 비롯한 다양한 방법을 통하여 사람의 의사전달방식을 컴퓨터의 입력수단으로 구현하여 사용자 편의성을 도모하고 있다. 본 논문에서는 컴퓨터를 블랙박스로 하고, 표면적으로 지능형 3차원 그래픽 얼굴 에이전트와 사용자가 의사소통을 하는 사용자 인터페이스를 대상으로 하였다. 컴퓨터가 단순문제 해결을 위한 도구에서 많은 정보를 다양한 매체를 통해 제공하는 보조자의 역할을 수행하게 되었기 때문에 위의 방법은 보다 적극적인 방법이라 할 수 있다. 이를 위한 기반 기술로써 국어를 발음하는 얼굴 애니메이션을 연구하였다. 발음을 표현하기 위한 데이터로써 디지털 카메라를 사용하여 입술 운동의 특징점의 위치를 조사하였고, 모델링 시스템을 개발하여 데이터를 입력하였다. 적은 데이터로도 복잡한 자유곡면을 표현할 수 있는 B-Spline곡면을 기본데이터로 사용하였기 때문에 애니메이션을 위한 데이터의 양 또한 줄일 수 있었다. 그리고 국어음소의 발음시간 수열에 대한 입술모양의 변화를 조사하여 발음소리와 입술 움직임을 동기화 시킨 발음 애니메이션을 구현하였다.

  • PDF

대화형 Teachable Agent를 이용한 영어말하기학습 시스템 (An interactive teachable agent system for EFL learners )

  • 이경아;임순범
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.797-802
    • /
    • 2023
  • 영어가 외국어로서 사용되는 환경에서 영어 말하기 연습 활동에 AI 음성 챗봇을 사용했을 때 영어학습자들은 발화 동기가 높아지고 의사소통 연습의 기회가 많아져 결과적으로 영어 말하기 능력을 향상 시킬 수 있다. 본 연구에서는 초등학생 저학년의 경우에도 쉽게 활용 가능하고 학습효과를 높일 수 있는 가르치기 방식의 AI 음성 챗봇을 제안한다. 시제와 맥락과 기억에 기반한 활동인 언어학습에 Teachable Agent 시스템을 적용하기 위해 Teachable Agent에 학습자의 영어 발음과 수준을 반영하고, 학습자 오류에 맞추어 에이전트의 답변을 생성하는 방식을 적용하여 새로운 방식의 TA를 제안하고 이를 적용한 Teachable Agent AI 챗봇 프로토타입을 구현하였다. 실제 초등 영어 선생님과 초등학생을 대상으로 사용성 평가를 진행하여 학습 효과를 입증하였다. 본 연구 결과는 역할 전환을 통해 학습에 흥미가 없는 학생 또는 초등 저학년들이 학습에 스스로 참여할 수 있는 동기부여를 할 수 있도록 적용할 수 있다.

유비쿼터스 컴퓨팅 환경에서 상황인식 기반 TV 응용 서버스 (Context-aware based TV Application Services in Ubiquitous Computing Environments)

  • 문애경;이강우;김형선;김현;이수원
    • 한국통신학회논문지
    • /
    • 제31권7B호
    • /
    • pp.619-631
    • /
    • 2006
  • 유비쿼터스 컴퓨팅 환경이 도래함에 따라 사용자의 명시적 요구에 따라 제공되는 서비스 보다는 상황정보를 활용하여 능동적인 서비스를 지원할 수 있는 기술이 필요하다. 따라서 본 논문에서는 컨텐츠 추천 서비스 에이전트와 상황인식 기반 태스크를 포함하는 CAMUS(Context-Aware Middleware for URC Systems) 시스템을 이용한 상황인식 기반 능동형 서버스를 제안한다. CAMUS 는 사용자의 요청이 없더라도 로봇 또는 컴퓨터가 현재의 상황을 인식하여 그 상황에 맞는 정보와 서비스를 제공할 수 있도록 지원하는 소프트웨어 프레임워크이다. 제안된 서비스를 평가하기 위하여 TV 응용 도메인에 적용한다. 이를 위해, TV 프로그램 추천 및 TV 제어 서비스 에이전트 그리고 TV 도우미 태스크를 구현한다. TV 도우미 태스크는 사용자 위치, 음성 등의 상황 정보에 따라 TV 프로그램 추천 및 제어 서비스를 실행할 수 있도록 한다.

빅데이터 분석을 활용한 사용자 경험 평가 방법론 탐색 : 아마존 에코에 대한 온라인 리뷰 분석을 중심으로 (Exploration of User Experience Research Method with Big Data Analysis : Focusing on the Online Review Analysis of Echo)

  • 황해정;심혜린;최준호
    • 한국콘텐츠학회논문지
    • /
    • 제16권8호
    • /
    • pp.517-528
    • /
    • 2016
  • 이 연구는 이미 실생활에서 사용되고 있으나 이에 대한 실증적 사용자 경험 조사가 부족한 사물인터넷 기반 제품에 대한 새로운 사용자 경험 방법론을 탐색해보고자 진행되었다. 지금까지의 사용자 경험에 대한 연구가 주로 설문이나 관찰 방법 등을 통해 이루어져 온 것과 달리 본 연구에서는 사물인터넷 기반 제품 중 지능형 에이전트인 아마존 에코(Echo)를 대상으로 사용자들의 온라인 리뷰를 분석하는 빅데이터 분석 기법을 활용하여 사용자 경험을 살펴보았다. 토픽 모델링 분석 결과, 에코의 기능, 음성 인터랙션, 지속적인 기능 개선과 관련된 사용 경험 요인들이 도출되었다. 또한 회귀분석결과 지속적인 기능 개선이 만족도에 가장 큰 영향을 미치는 것으로 나타났다. 연구의 의의는 사용자 경험을 제고할 수 있는 지능형 사물인터넷 제품 연구방법으로서 빅데이터 분석방법론 활용 가능성을 제시한 점이다.

LGKMA의 구조 및 특성 (The structure and features of the LGKMA)

  • 곽종근;은종진;강윤선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.137-144
    • /
    • 1999
  • LGKMA 시스템은 형태소 분석기와 품사 태거 및 명사 추출기로 구성되며, LG 종합기술원에서 연구 개발 중인 다국어 정보 검색, 음성 합성, 개인정보처리 에이전트 및 디지털 TV의 프로그램 안내문을 분석, 검색하는 EPG(Electronic Program Guide) 응용 둥 다양한 응용 프로그램에서 사용되고 있다. 본 논문에서는 형태소 분석기와 태거의 기반 기술보다는 LGKMA(LG Korean Morphological Analyser)의 전반적인 구조와 다른 시스템과 비교했을 때의 특성, 그리고 실제 응용되는 사례를 소개하고자 한다. 또 표준화를 위해서 열렸던 MATEC99에 참가하기 위해서 수행했던 작업들을 보고한다.

  • PDF

차세대 네트워크환경에서의 보안성 지원을 위한 SIP 기반 VoIP 시스템 (A VoIP System for Secure Support in Next Generation Networks based on SIP)

  • 성경;김석훈;박길하
    • 한국정보통신학회논문지
    • /
    • 제10권12호
    • /
    • pp.2321-2328
    • /
    • 2006
  • 인터넷 전화 서비스를 위한 시그널링 프로토콜로 복잡도(complexity)가 낮고, 확장성(extensibility)이 높은 SIP 표준이 차세대 VoIP 표준 기술로 대두되면서 SIP 프로토콜을 VoIP 서비스를 위한 호 설정 시그널링 프로토콜로 사용하고자 하는 움직임이 활발하며, 전세계적으로 SIP 기반 구성요소(component)에 대한 개발에 박차를 가하고 있다. SIP를 이용한 서비스는 인터넷 전화 서비스 외에도 인스턴스 메시징 및 다앙한 멀티미디어 기술 응용이 가능하다. 본 논문에서는 SIP에 대한 표준 인터페이스를 제공하는 JAIN SIP API를 이용하여 단말 및 이동성 지원을 위한 프락시 서버를 설계 및 구현하였고, 구현한 프락시 서 버를 실험하기 위한 인스턴스 메시징과 음성통신이 가능한 사용자 에이전트를 구현하였다.