• Title/Summary/Keyword: 음성 상호작용

Search Result 204, Processing Time 0.038 seconds

TRACE : 상호작용 음성인식 Neural Network모델

  • 김명원
    • Information and Communications Magazine
    • /
    • v.7 no.3
    • /
    • pp.16-26
    • /
    • 1990
  • 본 논문은 음성인식을 위한 neural network의 하나인 TRACE model에 대하여 기술한다. TRACE model은 HEARSAY 음성이해 system의 blackboard 구조와 유사한 trace 구조를 사용하여 정보처리 unit들간의 자극성 내지 억제성 연결에 의한 상호작용의 결과로서 음성을 인식한다. TRACE model은 특징층, 음소층 그리고 단어층의 3층으로 구성되며 층간의 unit들이 상호작용할 뿐 아니라 동일층의 unit들이 상호경쟁함으로써 음성인식에 있어서의 context 효과, segmentation 및 잡음 등의 문제를 해결할 수 있다.

  • PDF

소프트웨어 로봇을 위한 인간-로봇 상호작용

  • Gwak Geun-Chang;Ji Su-Yeong;Jo Yeong-Jo
    • The Magazine of the IEIE
    • /
    • v.33 no.3 s.262
    • /
    • pp.49-55
    • /
    • 2006
  • 인간과 로봇의 자연스러운 상호작용을 위하여 영상과 음성을 기반으로 한 인간-로봇 상호작용 (HRI: Human Robot Interaction) 기술들을 소개한다. URC개념의 서버/클라이언트 구조를 갖는 소프트웨어 로봇에 수행 가능한 얼굴 인식 및 검증, 준 생체정보(semi biometrics)를 이용한 사용자 인식, 제스처인식, 화자인식 및 검증, 대화체 음성인식 기술들에 대하여 살펴본다. 이러한 인간-로봇 상호작용 기술들은 초고속 인터넷과 같은 IT 인프라를 이용하는 URC(Ubiquitous Robotic Companion) 기반의 지능형 서비스 로봇을 위한 핵심기술로서 사용되어진다.

  • PDF

Authoring Toolkit for Interaction with a Virtual Human (가상 휴먼 상호작용 저작 툴킷)

  • Chung, Jin-Ho;Jo, Dongsik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.564-566
    • /
    • 2021
  • 최근 가상 휴먼은 국방, 의료, 교육, 엔터테인먼트 등 다양한 분야에서 널리 활용되고 있다. 가상 휴먼을 이용한 상호작용은 사용자가 현실 세계의 실제 친구와 대화하는 것처럼 자연스럽게 소통하는 방식으로 운용이 되고, 이를 위해서는 사용자의 음성, 동작, 감정 등 다양한 입력을 기반으로 반응하는 가상 휴먼 출력 등 상호작용 매핑 관계를 제작하여야 한다. 하지만, 기존 가상 휴먼 상호작용 방법은 미리 정해진 패턴을 수작업인 프로그래밍을 통해 제작하여 개발 기간이 오래 걸리고, 수정이 용이하지 못한 단점이 있다. 본 논문에서는 가상 휴먼 상호작용을 위해 음성, 동작, 감정 등 사용자의 멀티모달 입력과 가상 휴먼 반응에 대한 저작을 수행하는 툴킷을 제시한다. 본 논문에서 제시한 저작도구를 통해 쉽고 빠르게 사용자와 가상 휴먼 상호작용 표현을 생성할 수 있다.

Open API-based Conversational Voice Interaction Scheme for Intelligent IoT Applications for the Digital Underprivileged (디지털 소외계층을 위한 지능형 IoT 애플리케이션의 공개 API 기반 대화형 음성 상호작용 기법)

  • Joonhyouk, Jang
    • Smart Media Journal
    • /
    • v.11 no.10
    • /
    • pp.22-29
    • /
    • 2022
  • Voice interactions are particularly effective in applications targeting the digital underprivileged who are not proficient in the use of smart devices. However, applications based on open APIs are using voice signals only for short, fragmentary input and output due to the limitations of existing touchscreen-oriented UI and API provided. In this paper, we design a conversational voice interaction model for interactions between users and intelligent mobile/IoT applications and propose a keyword detection algorithm based on the edit distance. The proposed model and scheme were implemented in an Android environment, and the edit distance-based keyword detection algorithm showed a higher recognition rate than the existing algorithm for keywords that were incorrectly recognized through speech recognition.

지능형 서비스 로봇을 위한 인간-로봇 상호작용 기술

  • 유범재
    • Journal of the KSME
    • /
    • v.44 no.4
    • /
    • pp.63-68
    • /
    • 2004
  • 이 글에서는 로봇에 사용할 수 있는 상호작용 기술들이 아직 초기연구 단계에 머무르고 있어 기존의 얼굴인식과 음성인식 기술동향에 대해 간략하게 소개하고 미국 CMU의 Human-Computer Interaction Institute(HCII)에서 진행 중인 ACT-R(Adaptive Character of Thought)' 프로젝트를 통해 보다 자연스러운 인간-로봇 상호작용의 개념을 소개해한다.

  • PDF

Implementation of interaction to increase user immersion in VR conferencing applications (VR 회의 어플리케이션의 사용자의 몰입도 증가를 위한 상호작용 구현)

  • You, Do-jin;Kim, Su-ji;Kang, Ye-jin;Kim, Hwi-jun;Park, Eun-ji;Lee, Chae-hee;Chang, Yu-jin;Jeong, Min-hyuk;Kim, Sang-kyun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.117-119
    • /
    • 2021
  • 본 논문에서는 VR 기반 원격 회의 어플리케이션에서 높은 사용자의 몰입도를 제공하기 위한 상호작용 기능들을 제안한다. 우선, 향기 효과를 구성하여 감각 효과 제공을 통한 상호작용 방법을 제안한다. 다음으로 이모티콘과 아바타의 애니메이션을 통해 다양한 감정적 상호작용을 제안한다. 마지막으로 다수 사용자의 원활한 음성 커뮤니케이션을 위한 테이블 별 음성 채널 분리를 기능을 제안한다. 본 어플리케이션은 Oculus Quest 2 기기를 통하여 VR 환경에서 구현되었다.

  • PDF

Automatic Adaptation Based Metaverse Virtual Human Interaction (자동 적응 기반 메타버스 가상 휴먼 상호작용 기법)

  • Chung, Jin-Ho;Jo, Dongsik
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.11 no.2
    • /
    • pp.101-106
    • /
    • 2022
  • Recently, virtual human has been widely used in various fields such as education, training, information guide. In addition, it is expected to be applied to services that interact with remote users in metaverse. In this paper, we propose a novel method to make a virtual human' interaction to perceive the user's surroundings. We use the editing authoring tool to apply user's interaction for providing the virtual human's response. The virtual human can recognize users' situations based on fuzzy, present optimal response to users. With our interaction method by context awareness to address our paper, the virtual human can provide interaction suitable for the surrounding environment based on automatic adaptation.

Speech emotion recognition for affective human robot interaction (감성적 인간 로봇 상호작용을 위한 음성감정 인식)

  • Jang, Kwang-Dong;Kwon, Oh-Wook
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.555-558
    • /
    • 2006
  • 감정을 포함하고 있는 음성은 청자로 하여금 화자의 심리상태를 파악할 수 있게 하는 요소 중에 하나이다. 음성신호에 포함되어 있는 감정을 인식하여 사람과 로봇과의 원활한 감성적 상호작용을 위하여 특징을 추출하고 감정을 분류한 방법을 제시한다. 음성신호로부터 음향정보 및 운율정보인 기본 특징들을 추출하고 이로부터 계산된 통계치를 갖는 특징벡터를 입력으로 support vector machine (SVM) 기반의 패턴분류기를 사용하여 6가지의 감정- 화남(angry), 지루함(bored), 기쁨(happy), 중립(neutral), 슬픔(sad) 그리고 놀람(surprised)으로 분류한다. SVM에 의한 인식실험을 한 경우 51.4%의 인식률을 보였고 사람의 판단에 의한 경우는 60.4%의 인식률을 보였다. 또한 화자가 판단한 감정 데이터베이스의 감정들을 다수의 청자가 판단한 감정 상태로 변경한 입력을 SVM에 의해서 감정을 분류한 결과가 51.2% 정확도로 감정인식하기 위해 사용한 기본 특징들이 유효함을 알 수 있다.

  • PDF

PRAAT Software: A Spech Interaction Tool to Analyze Teacher Voices (PRAAT 소프트웨어: 교사 목소리 분석을 위한 맞춤법 상호작용 도구)

  • Kidd, Ella Jane
    • Journal of Convergence for Information Technology
    • /
    • v.9 no.9
    • /
    • pp.158-165
    • /
    • 2019
  • Through the use of speech software technology, this paper examines the effects of voice interactions within the inner circle of English. The fundamental frequency (F0) was obtained by analyzing native speakers (aged 30-55) speech effects based on nationality, age, and gender. The findings within this study reveal that the Caucasian British female (age 33) and the Caucasian American male (age 55) produced the most interactive speech. The contributing factor is the students' experience with various language styles throughout their language acquisition studies. The results of this study are compatible with $Traunm{\ddot{u}}eller$ & Eriksson (1995) and previous studies which agree that continuous speech above average is paramount towards student engagement and interactions.

음성인식을 위한 화자적응 기술 동향

  • 김동국
    • Review of Korea Contents Association
    • /
    • v.2 no.1
    • /
    • pp.95-106
    • /
    • 2004
  • 음성인식(speech recognition) 기술이란 사람이 말하는 음성을 기계나 컴퓨터가 이를 분석하고, 인식하여 단어나 문장형태로 변환하여 기계와 인간이 상호작용을 할 수 있도록 관련 알고리즘을 개발 및 구현하는 기술이다. 최근 음성인식 기술이 대두되는 가장 큰 이유는 인간과 기계간의 통신을 원활하게 하는 편리한 휴먼인터페이스 기능이라 할 수 있다. (중략)