• Title/Summary/Keyword: 음성 기반 에이전트

Search Result 21, Processing Time 0.025 seconds

Exploring the Applicability of Voice-based Psychological Counseling Agent (음성 기반 심리상담 에이전트의 활용 가능성 탐색 연구)

  • Kim, Ji Geun;Yang, Hyunjung;Lee, Ji-Won
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.7
    • /
    • pp.144-156
    • /
    • 2021
  • This study was conducted to explore important factors to consider when designing voice-based psychological counseling agents amid the increasing use of conversational agents in counseling and psychotherapy. 48 participants selected their preferred agent's voice among four types (young women and men, middle-aged women and men) and had a conversation with a psychological counseling agent. They also evaluated the reasons for voice selection, mood changes, perception of the agent's characteristics, and counseling outcomes. As a results, the agent's voice type selected according to the user's gender was not statistically significant. However, the qualitative analysis showed 'comfort' of the voice was an important factor. Next, the user's mood improved significantly after the conversation with the agent, which confirmed the intervention effect. Finally, it was found that expertness and attractiveness perceptions toward the agent contributed to the counseling outcomes. The implications of the study and suggestions for future research were discussed.

Attribute Based Analysis and Object-oriented Design of NGN Call Agent (NGN 콜 에이전트의 속성기반 분석과 객체 지향 설계)

  • 이조혁
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 2000.04a
    • /
    • pp.84-90
    • /
    • 2000
  • 인터넷을 발전에 따라 데이터의 전송량이 음성 전송량을 능가하고 있으나 현재의 네트워크로는 빠르고 신뢰성 있는 데이터의 전송을 보장할 수 없다. 데이터와 음성 모두의 빠르고 신뢰성 있는 전송과 관리를 위하여 개발된 패킷 중심 네트워크를 NGN이라 한다. NGN에서는 효율적인 전송과 관리를 위하여 기존(PSTN)의 교환기의 콜 에이전트를 소프트웨어로 구성하여 범용컴퓨터에서 운용될 수 있도록 하였다. 본 논문에서는 콜 에이전트를 소프트웨어로 설계하기 위하여 H/W 개발을 위하여 설계된 기본호처리모델인 BCSM을 객체지향방법론의 표준인 UML을 이용하여 설계를 하였다. 그리고 설계된 모델의 검증을 위하여 LSL(LarchShared Language)를 이용하여 정형명세를 하였다.

  • PDF

Emotional Character Agent Design for Cellular-phone System (휴대폰 시스템을 위한 감정 기반 캐릭터 에이전트 설계)

  • 임호섭;김민구;최경희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.322-324
    • /
    • 2002
  • 이동 통신 기술의 발달 및 대중화로 인하여 거의 모든 개인 사용자가 휴대폰을 사용하게 되었으며 휴대폰은 초기의 음성통화 기능 뿐만 아니라 VM(Virtual Machine)을 탑재하여 컴퓨터와 마찬가지로 프로그램을 작성 및 설치하여 사용할 수 있게 되었다. 본 논문은 휴대폰과 같은 특수한 임베디드 환경에서 감정 기반의 캐릭터 에이전트를 구현하기 위한 구조를 제안한다. 임베디드 기기의 특수성을 파악하고 주어진 제한사항을 극복하기 위해 기존의 단일 컴퓨터 상의 에이전트 아키텍처를 휴대폰과 서버의 역할을 분담하는 아키텍처로 변환하여 사용자로 하여금 컴퓨터와 근접한 수준의 캐릭터 에이전트를 이용할 수 있도록 한다.

  • PDF

Design and Implementation of an Agent-Based Guidance System for Mask Dances (에이전트에 기반한 탈놀이 안내 시스템의 설계 및 구현)

  • 강오한
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.7 no.2
    • /
    • pp.40-45
    • /
    • 2002
  • In this paper, we design and implement an agent-based mask dance guidance system which provides multimedia information on traditional masques through WWW. When the server receives a query from the client, it produces the multimedia data by connecting several real full-motion videos, and synthesizing adequate voice data for guiding announcement. To develop an agent-based guidance system, we designed and implemented four agents such as interface agent, user modeling agent coordinator agent and data management agent. The mask dance guidance system also provides the functions of searching using the keyword and learning.

  • PDF

Development of Continuous Speech Recognition System for Multimedia Mobile Terminal Applications (휴대 멀티미디어 단말용 음성인식 시스템 개발)

  • 김승희
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.59-62
    • /
    • 1998
  • 본 논문에서는 한국전자통신연구원의 Handy Combi 응용 도메인을 대상으로 한 화자독립 연속음성인식 시스템 개발에 관하여 기술한다. 불특정화자가 자연스럽게 발음한 연속음성을 인식하는 기술은 펜인식 등과 더불어 멀티모달 인터페이스의 핵심 요소로서, 이동 환경에서 사용자의 다양한 요구사항을 처리하는 지능형 에이전트에 구현을 위해 필수적으로 개발되어야 하는 기술이다. 본 논문에서는 연속확률분포를 가지는 Hidden Markov Model(HMM) 기반의 연속음성인식 시스템을 구현하였다. 개발된 시스템은 음성특징벡터로 MFCC를 사용하였으며, 음소 모델의 강인한 훈련을 위해 음성학적 지식에 기반을 둔 tree-based clustering 방식을 도입하였다. 인식단계에서는 인식속도를 개선시키기 위해 beam-search 기법을 적용하였다. 인식 실험 결과, 99.7%의 어절 인식률과 98.8%의 문장 인식률을 얻었으며, 최종적인 문장의 이해도는 99% 이상이었다.

  • PDF

Developing a New Algorithm for Conversational Agent to Detect Recognition Error and Neologism Meaning: Utilizing Korean Syllable-based Word Similarity (대화형 에이전트 인식오류 및 신조어 탐지를 위한 알고리즘 개발: 한글 음절 분리 기반의 단어 유사도 활용)

  • Jung-Won Lee;Il Im
    • Journal of Intelligence and Information Systems
    • /
    • v.29 no.3
    • /
    • pp.267-286
    • /
    • 2023
  • The conversational agents such as AI speakers utilize voice conversation for human-computer interaction. Voice recognition errors often occur in conversational situations. Recognition errors in user utterance records can be categorized into two types. The first type is misrecognition errors, where the agent fails to recognize the user's speech entirely. The second type is misinterpretation errors, where the user's speech is recognized and services are provided, but the interpretation differs from the user's intention. Among these, misinterpretation errors require separate error detection as they are recorded as successful service interactions. In this study, various text separation methods were applied to detect misinterpretation. For each of these text separation methods, the similarity of consecutive speech pairs using word embedding and document embedding techniques, which convert words and documents into vectors. This approach goes beyond simple word-based similarity calculation to explore a new method for detecting misinterpretation errors. The research method involved utilizing real user utterance records to train and develop a detection model by applying patterns of misinterpretation error causes. The results revealed that the most significant analysis result was obtained through initial consonant extraction for detecting misinterpretation errors caused by the use of unregistered neologisms. Through comparison with other separation methods, different error types could be observed. This study has two main implications. First, for misinterpretation errors that are difficult to detect due to lack of recognition, the study proposed diverse text separation methods and found a novel method that improved performance remarkably. Second, if this is applied to conversational agents or voice recognition services requiring neologism detection, patterns of errors occurring from the voice recognition stage can be specified. The study proposed and verified that even if not categorized as errors, services can be provided according to user-desired results.

A Study on the Presence Classified by Dimensions through Character Agents on E-Learning (온라인 강의 프로그램의 캐릭터 에이전트를 통한 차원별 프레젠스 연구)

  • Kweon, Sang-Hee;Cho, Eun-Joung
    • Journal of Internet Computing and Services
    • /
    • v.10 no.6
    • /
    • pp.123-143
    • /
    • 2009
  • This study examined factors of presence using the experimental method. The design of this study was to analyze presence through the dimensions of character agents(text, voice, 2D, 3D, reality character dimension and gender) for e-learning platforms that used new technology-based content. There were 232 experimental participants in the study. This study was designed to measure their cognitive awareness of presence by agent dimensions in the first level to measure the presence level in the types of users. The results showed that there were significant correlation between types of users and presence. However there were no statistically significant results on dimensions. In addition, there were significant differences on character gender, voice or non-voice, text or non-text and character dimensions.

  • PDF

Design of Agent based QoS Negotiator for Effective Radio Resource Allocation (효율적인 무선자원 할당을 위한 에이전트 기반 QoS 협상자의 설계)

  • Han, In-Gu;Koh, Hee-Chang;Lee, Sei-Hoon;Wang, Chang-Jong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.10b
    • /
    • pp.1597-1600
    • /
    • 2000
  • 현재의 무선 이동통신은 음성통화를 위주로 설계되어 사용되고 있다. 그러나 차츰 인터넷 접속과 같은 데이터 통신 요구가 증대되고 있으며, 특히 이미 가시화된 IMT-2000과 4세대 이동통신망이라 할 수 있는 ALL-IP 망에서는 동영상을 포함한 멀티미디어 서비스에 대한 욕구를 수용하기 위한 연구가 활발히 진행되고 있다. 본 논문에서는 유선 구간에 비해 자원의 제약이 큰 무선 구간에서의 효율적인 자원 할당을 위한 QoS(Qualify of Service) 협상자를 설계하였다. 협상의 전제가 될 수 있는 서비스 등급을 대역폭 할당의 가변 여부에 따라 세 등급으로 분류하였으며, 협상 에이전트는 이 정보들을 기반으로 요구 대역폭과 서비스 종류에 따라 협상을 통해 대역폭 할당량을 정의한다. 이에 따라 QoS 관리자가 적절한 자원을 할당하게 함으로써 전체적인 무선자원의 활용도를 높이도록 하였다.

  • PDF

Multimedia Contents Dissemination using Mobile Communication and Opportunistic Networks (무선 통신과 기회적 네트워크를 활용한 멀티미디어 콘텐츠 배포)

  • Kim, Seokhyun
    • Journal of Digital Contents Society
    • /
    • v.14 no.3
    • /
    • pp.357-365
    • /
    • 2013
  • The popularization of smart phones changes the usage patterns of mobile communication from voice-centric to data-centric communication. The demand for wireless data communications is rapidly increasing, and thus the need for expanding infrastructure for mobile communication is also rapidly increasing. In this paper, we propose a scheme for reducing the cost for the mobile communication infrastructure by exploiting opportunistic networks in dissemination of multimedia contents. By using this scheme, the large portion of the cost for mobile communication infrastructure could be saved, and the need of users for multimedia contents could be also fulfilled. Our scheme is evaluated using agent-based simulations. The simulation results show that about 70% of mobile communication can be replaced with the data communication through opportunistic networks.

An Agent Based IP Transcript System in VoIP Network (VoIP망에서 Agent 기반 IP 녹취 시스템)

  • Lim Jae-Jin;Kim Soo-Hee;Jung In-Sang;Jung In-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.1243-1246
    • /
    • 2006
  • 초고속 통신망의 확대 적용으로 인터넷의 빠른 성장과 함께 음성과 비디오 그리고 데이터를 통합하고자 하는 노력이 시도되고 있다. VoIP(Voice over IP)는 IP를 이용하여 음성과 데이터를 패킷 형태로 통합하여 실시간으로 전송하는 기술이다[1]. 패킷 네트워크에서 VoIP 시그널링 기술을 이용하면 망 자원으 효율적 이용 및 PSTN에 가까운 음질 그리고 인터넷과 연계한 다양한 음성서비스 지원이 가능하다. 콜센터에서도 VoIP를 사용하게 됨에 따라 VoIP망에서의 녹취 시스템이 필요하다. VoIP 녹취 시스템은 상담원과 고객 간의 통화 내용을 자동으로 녹음하여 보관함으로써 고객의 요구사항을 명확하게 파악할 수 있으며 녹취 데이터의 통계 자료 제공으로 효율적인 관리가 가능하고, 선택 녹취, 스케쥴링 녹취, 상담원의 평가 자료를 제공하여 고객 관리의 질적인 향상을 지원한다. 본 논문에서는 성능에 큰 영향을 주지 않고 기존의 VoIP 녹취 시스템의 문제점을 해결한 에이전트를 포함한 VoIP 녹취 시스템을 제안한다.

  • PDF