• 제목/요약/키워드: conversational

검색결과 292건 처리시간 0.028초

대화체 연속음성 인식을 위한 한국어 대화음성 특성 분석 (Analysis of Korean Spontaneous Speech Characteristics for Spoken Dialogue Recognition)

  • 박영희;정민화
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.330-338
    • /
    • 2002
  • 대화체 연속음성은 자연스러운 발화로 낭독체 문장에 비해 잡음, 간투어와 같은 비문법적인 요소가 많고, 발음의 변이가 심하다. 이런 이유로 대화체 연속음성을 인식하기 위해서는 대화 현상을 분석하고 그 특징을 반영하여야 한다. 본 논문에서는 실제 대화음성에 빈번히 나타나는 대화 현상들을 분류하고 각 현상들을 모델링하여 대화체 연속음성 인식을 위한 기본 베이스라인을 구축하였다. 대화 현상을 묵음 구간과 잡음, 간투어, 반복/수정 발화의 디스풀루언시 (disfluencies), 표준전사와 다른 발음을 갖는 발음변이 현상으로 나누었다. 발음변이 현상은 다시 양성음의 음성음화, 음운축약/탈락현상, 패턴화된 발음변이, 발화오류로 세분화하였다. 대화체 음성인식을 위해서 빈번히 나타나는 묵음구간을 고려한 학습과 잡음, 간투어 처리를 위한 음향모델을 각각 추가하였다. 발음변이 현상에 대해서는 출현빈도수가 높은 것들만을 대상으로 발음사전에 다중 발음열을 추가하였다. 대화현상을 고려하지 않고 낭독체 스타일로 음성인식을 수행하였을 때 형태소 에러율 (MER: Morpheme Error Rate)은 31.65%였다. 이에 대한 형태소 에러율의 절대값 감소는 묵음 모델과 잡음 모델을 적용했을 때 2.08%, 간투어 모델을 적용했을 때 0.73%, 발음변이 현상을 반영했을때 0.92%였으며, 최종적으로 27.92%의 형태소 에러율을 얻었다. 본 연구는 대화체 연속음성 인식을 위한 기초 연구로 음향모델과 어휘모델, 언어모델 각각에 대한 베이스라인으로 삼고자 한다.

노인의 대화기능과 작업기억력 및 이름대기 능력 간의 관련성 연구 (Relationship Between Conversation Skills, Working Memory and Naming Ability in Aging Adults)

  • 문지윤;손은남;이옥분
    • 재활복지
    • /
    • 제22권4호
    • /
    • pp.103-121
    • /
    • 2018
  • 정상적인 노화과정에서 기억력의 감퇴, 단어인출력 저하에 따른 건망증, 청력 저하 등의 보편적인 이유들로 기능적인 의사소통능력에 제한을 겪게 된다. 이 연구는 언어장애가 없는 노인들을 대상으로 그들의 대화기능을 알아보고, 연령증가에 따른 대화기능과 작업기억력 및 이름대기 능력 간의 관련성을 알아보았다. 만 65세 이상의 건강한 노인 85명이 연구에 참여하였다. 대화 샘플링은 대상자들과 친숙한 주제의 일상적인 대화 상황에서 수집되었다. 대화차례 주고받기의 분석요소로써 대화차례 총 빈도, 개시율, 유지율, 중첩율, 중단율이 포함된다. 작업기억력 평가를 위해 숫자외우기, 암산, 단어 따라말하기 과제를 실시하였고, 이름대기 능력 평가를 위해 한국판 보스턴이름대기 검사(K-BNT)를 실시하였다. 연구 결과 첫째, 성별에 따른 대화기능에서 유의한 차가 없었다. 남성 집단에서 연령별 대화차례 주고받기를 비교해본 결과 유의한 차이가 나타나지 않았으나, 여성 집단에서는 유의한 차이가 나타났다. 그리고 대화기능 중 대화차례 주고받기와 총 발화빈도가 세 개의 연령대별 집단 간 유의한 차이(p<.01)가 있는 것으로 나타났다(80세 이상 집단 제외). 둘째, 대화기능 중에서 대화차례 유지비율을 이름대기 검사가 예측하는 것으로 나타났다. 이 연구를 통하여 정상노인의 대화차례 주고받기 기술이 노화가 진행되더라도 비교적 손상을 적게 보인다는 사실을 알 수 있다.

대화 참여자 결정을 통한 Character-net의 개선 (Improvement of Character-net via Detection of Conversation Participant)

  • 김원택;박승보;조근식
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권10호
    • /
    • pp.241-249
    • /
    • 2009
  • 동영상 검색이나 축약과 같은 동영상 분석을 위해 동영상 어노테이션 기술이나 동영상 정보 표현에 대한 다양한 연구가 있어왔다. 이를 위해 본 논문은 대화 참여자 결점을 위한 영상적 요소와 이러한 요소를 이용하여 Character-net 표현을 개선하는 방법을 제안한다. 기존 Character-net이 자막이 뜨는 시간에 나타나는 등장인물들만을 대화참여자로 고려하므로 일부의 청자를 제외시키는 문제점이 있다. 대화 참여자는 대화상황 파악의 극히 중요한 요소로 동영상 검색 시에 기준이 될 수 있으며 동영상의 이야기 전개를 이끌어 나간다. 대화 참여자를 결정하기 위한 영상적 요소에는 자막의 유무, 장면, 인물 등장순서, 시선방향, 패턴, 입의 움직임 등이 있다. 본 논문에서는 이러한 영상적 요소에 근거하여 대화 참여자를 판단하고 동영상 표현방법인 Character-net을 개선하고자 한다. 제안한 여러 요소들이 결합되고 일정한 조건이 만족되었을 때 대화참여자를 정확히 검출할 수 있다. 따라서 본 논문에서는 대화참여자를 결정하기 위한 영상적 요소들을 제안하고 이를 통해 Character-net의 표현성능을 개선하고 실험을 통하여 제안된 방법론이 대화 참여자 판단의 정확성과 Character-net의 표현성능을 제고함을 증명하였다.

App-기반 청자 반응 대화훈련 프로그램이 고기능 자폐스펙트럼 아동의 대화기술 향상에 미치는 효과 (Effect of a Novel App-based Listener Responsiveness Conversation Training Program on Enhancing Conversational Skills in Children with High-Functioning Autism Spectrum Disorder)

  • 조희정;김소연
    • 감성과학
    • /
    • 제26권3호
    • /
    • pp.115-128
    • /
    • 2023
  • 본 연구는 고기능 자폐 스펙트럼 장애아동을 대상으로 App-기반 청자 대화기술 훈련프로그램의 효과를 검증하고자 하였다. 연구대상은 26명의 자폐 스펙트럼 장애, 아스퍼거 증후군, 전반적 발달장애로 진단된 초등학생으로, 연령과 IQ, SCQ, ASSQ 점수를 사용하여 중재 집단과 통제 집단으로 짝지어 분배하였다. 중재 집단은 9주 동안 교사와의 비대면 학습을 주 1회 실시하고, 가정에서도 부모 또는 아동이 앱(App)을 활용하여 대화훈련을 실시하였다. 통제집단은 다른 특별한 프로그램에 참여하지 않았다. 그리고 훈련 전과 후에 평가자와 아동 간의 1:1 대화를 수행하여 대화 자료를 수집하고, 대화차례 주고받기와 주제 운용능력의 변화를 비교하였다. 연구 결과, 중재 집단에서 본 연구에서 개발한 청자 반응 대화훈련 프로그램의 긍정적 효과가 발견되었다. 구체적으로, 중재 집단은 청자 조건에서 적절한 청자 언어 반응이 유지되었고, 통제 집단은 적절한 청자 언어 반응이 감소하였다. 그리고 화자 조건의 대화 차례 주고받기에서는 개시율과 유지율이 증가하고, 주제 운용능력에서는 적절한 주제 개시율이 증가하고, 부적절한 주제 개시율은 감소하였다. 논의에서는 청자 반응 대화훈련 프로그램이 고기능 자폐 스펙트럼 장애아동의 대화 양상변화에 미치는 효과를 중점적으로 논의하였다.

모바일 상황에서 대화형 에이전트와 사용자의 대화 흐름도 도출 연구 (Study of deduction flow map on conversation toward the Embodied conversational agents in the Mobile Environment)

  • 최유정;조윤주;박수이
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.178-183
    • /
    • 2008
  • 본 연구의 목적은 대화형 에이전트와 사용자 간의 대회를 분석하여 대화의 흐름도를 도출해 내는 것에 있다. 특히 본 연구에서는 대화에 대한 전반적인 요소 추출과 더불어 대화형 에이전트와 사용자 간에 발생할 수 있는 대화 유형까지 도출해 내어 대화형 에이전트의 대화 능력 향상에 기여하고자했다. 이를 위해 1대 1 개인 인터뷰를 실시하여 실제 대화형 에이전트와 사용자 간의 대화 데이터를 수집하고 기본적으로 질적 연구 방법론을 바탕으로 대화 분석론과 대화유형학을 참고하여 연구를 실시한 결과 층 6개의 대화 흐름도를 도출하였다. 특히 원활하지 않은 대화는 기존의 사람과 사람과의 대화에서는 찾아보기 힘든 대화이며 그 개수도 52개로 가장 많이 나타났다. 대화 방해 요소가 나타났을 경우 상대에 대한 적대감을 보이거나 대화를 교정하는 행위로 대화가 진행되었다. 본 연구는 포괄적인 대화형 에이전트와 사용자 간의 대회를 분석하여 그 유형을 알아냈다는 점에서 대화형 에이전트 개발자와 사용자, 서비스 제공자 모두에서 긍정적인 영향을 미친다.

  • PDF

학습용 에이전트의 제스처와 얼굴표정이 학습이해도 및 의인화 효과에 미치는 영향 (The Impact of Gesture and Facial Expression on Learning Comprehension and Persona Effect of Pedagogical Agent)

  • 류지헌;유지희
    • 감성과학
    • /
    • 제16권3호
    • /
    • pp.281-292
    • /
    • 2013
  • 이 연구의 목적은 학습용 에이전트의 비언어적 의사소통이 의인화 효과에 미치는 영향을 검증하는 것이다. 대학생 56명을 대상으로 실험이 진행되었으며, 비언어적 의사소통은 제스처(지시적 제스처 vs. 대화적 제스처)와 얼굴표정(적용유무)에 의해서 구현되었다. 학습용 에이전트에 적용된 제스처는 지시적 제스처와 대화적 제스처였다. 지시적 제스처는 주의집중 유도 가설에 의해서 학습용 에이전트의 제스처가 시각단서의 역할을 수행할 것이라는 가설에 근거하고 있다. 대화적 제스처는 사회성 가설에 의한 것으로 학습용 에이전트의 사회적 상호작용을 촉진시키기 위한 것이다. 얼굴표정은 주로 사회성 가설을 지지하는 설계원리로 보았다. 의인화 효과 측정에서는 학습개입에 대한 상호작용이 유의미했다. 대화적 제스처 조건에서 얼굴표정이 있고 없음에 따라서 학습개입에 대한 의인화 효과가 유의미했다. 대화적 제스처와 얼굴표정이 적용되면 학습개입을 촉진하는 것으로 나타났다. 이 연구는 두 가지 시사점을 제공하고 있다. 첫째, 얼굴표정은 학습개입에서 중요한 역할을 한다. 둘째, 제스처와 더불어 얼굴표정과 제스처가 동시에 적용되어야 한다.

  • PDF

배경소음상황에 따른 성인 말더듬화자의 발화 관련 변수 비교 (Effects of Background Noises on Speech-related Variables of Adults who Stutter)

  • 박진;오선영;전제표;강진석
    • 말소리와 음성과학
    • /
    • 제7권1호
    • /
    • pp.27-37
    • /
    • 2015
  • This study was mainly aimed at investigating on the effects of background noises (i.e., white noise, multi-speaker conversational babble) on stuttering rate and other speech-related measures (i.e., articulation rate, speech effort). Nine Korean-speaking adults who stutter participated in the study. Each of the participants was asked to read a series of passages under each of four experimental conditions (i.e., typical solo reading (TR), choral reading (CR), reading under white noise presented (WR), reading with multi-speaker conversational babble presented (BR). Stuttering rate was computed based on a percentage of syllables stuttered (%SS) and articulation rate was also assessed as another speech-related measure under each of the experimental conditions. To examine the amount of physical effort needed to read, the speech effort was measured by using the 9-point Speech Effort Self Rating Scale originally employed by Ingham et al. (2006). Study results showed that there were no significant differences among each of the passage reading conditions in terms of stuttering rate, articulation rate, and speech effort. In conclusion, it can be argued that the two different types of background noises (i.e., white noise and multi-speaker conversational babble) are not different in the extent to which each of them enhances fluency of adults who stutter. Self ratings of speech effort may be also useful in measuring speech-related variables associated with vocal changes induced under each of the fluency enhancing conditions.

2000년대 패션에 표현된 문양의 대화형 디자인에 관한 연구 (The Conversational Pattern Designs Expressed on Fashion in the Early 2000's)

  • 이재윤;김민자
    • 복식
    • /
    • 제57권6호
    • /
    • pp.101-111
    • /
    • 2007
  • The purpose of this study is to examine the features of the conversational patterns presented on the fashion in the early 2000's and analyze it from cultural view. The expression of the patterns is a result of a creative aesthetic activity, mental activity, and the reflection of the common cognition. And the fashion is a part of the life environment. So the patterns presented on the fashion provides a clue to figure out the common unconscious sense for explaining the culture. The patterns have been expressed with different methods belonging to each culture such as weaving and prints. And those of the each cultural group have been communicating each other. The silk came to the Europe in the 6th century. The textile industry which flourished since 15th century. And they shows the chinoiserie or indian prints, not only the european culture. We can observe that the exchange of the techniques and cultures between cultural groups like the east and the west, and the presentation of the patterns is a way to express their own desires. The patterns presented after 2,000 can be classified by the form and the contents. But, more specifically, the patterns classified by the contents, which is Conversational design, can be categorized as followed according to the origin; reflecting cultural identity, Popular culture, Lohas lifestyle, and art movements. Which can be summarized as that the people have more interest on the different cultural group, diversity, retrospectiveness, and exoticism, which the patterns originally belonged to than on the form itself.

웹기반 대화형 에이전트 (A Web-based Conversational Agent)

  • 이승익;오성배
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권5호
    • /
    • pp.530-540
    • /
    • 2003
  • 인터넷 사이트의 정보량이 증가함에 따라 효율적인 정보제공의 필요성이 커지고 있으나, 대부분의 사이트에서 제공하는 핵심어의 불리언 조합에 기반을 둔 정보검색기법은 사용자의 의도를 제대로 표현하기 어렵기 때문에 지나치게 많거나 의도하지 않은 검색결과를 얻기 쉽다는 문제가 있다. 이 논문에서는 자연어 대화를 통하여 사용자에게 보다 정확하고 친절하게 정보를 제공할 수 있는 대화형 에이전트를 제안한다. 이 에이전트는 자연어 질의에 유한상태 오토마타를 적용하여 사용자의 질의의도를 파악하고 이를 답변지식의 구조적 패턴매칭에 활용함으로써, 어순변화에 강건하고 질의의도에 부합하는 답변을 제공한다. 제안한 시스템의 유용성과 가능성을 알아보기 위하여 간단한 웹 페이지를 소개하는 문제에 적용한 결과, 에이전트가 정확하고 친근하게 응답하는 것을 확인할 수 있었다.

광대역ISDN상의 다지점 멀티미디어 통신서비스 I부:DAVIC 표준 STB에서의 대화형 멀티미디어통신 (Multipoint multimedia communcation service in broadband ISDN part I: a conversational communcation on DAVID STB environment)

  • 황대환;이종형;박영덕;조규섭
    • 한국통신학회논문지
    • /
    • 제23권4호
    • /
    • pp.821-835
    • /
    • 1998
  • 유용한 멀티미디어 통신서비스를 제공하기 위한 목적으로 설립된 Digital Audio-Visual Council(DA VIC)은 Movie on Demand(MoD), Teleshopping과 같은 주문형 분배서비스와 인터넷 서비스를 포용한 시스템의 규격을 완료한 이후 현재 Plain Old Telephone Service(POTS) 및 영상전화, 영상회의와 갇은 대화형 통선서비스를 제공하기 위한 작업을 진행하고 있다. 본 논문은 분배형 위주의 서비스만이 가능한 DA VIC 표준 Set-Top Box(STB)에서 대화형 멀티미디어 통신서비스를 제공할 수 있는 효율적인 단말의 구조를 제안한다. 제안한 통신단말은 기 구현된 표준 STB에 서비스에 따르는 기능모듈을 부가하는 형태로 설계, 구현하였다. 구현한 통신단말을 다지점 영상회의와 같은 통신서비스에 적용하기 위해서 본 논문은 다지점 통신의 서비스 품질을 결정하는 Quality of Servic$\xi$(QoS) 요구 사항을 분석하였다. 또한 대화형 통선서비스의 매우 중요한 QoS요소인 단-대-단 지연조건을 만족하고 화질의 열화를 수반하지 않는 새로운 MPEG 비디오 브리지를 이용한 단말의 다지점 멀티미디어통신의 연동방안 및 전체 시스템 구조에 대하여 설명하였다.

  • PDF