• 제목/요약/키워드: 화자표현

검색결과 109건 처리시간 0.025초

제한된 영역의 대화에서 체언구 형태의 발화 이해를 위한 계획기반 생략 처리 (Plan-based Ellipsis Resolution for Utterances in Noun-Phrase-Form in Restricted Domain Dialogues)

  • 윤철진;서정연
    • 인지과학
    • /
    • 제11권1호
    • /
    • pp.81-92
    • /
    • 2000
  • 인간의 자연스러운 대화에서는 생략 현상이 빈번하게 일어난다. 생략 어구로부터 화자의 의도를 파악하는 것은 쉽지가 않다. 생략 어구 자체만 가지고는 그것의 의미와 화자의 의도를 파악하기 힘들며 이전 발화들로부터 구성된, 혹은 영역에 내재된 맥락과의 연관성을 살펴보아야 하기 때문이다. 본 연구에서는 Lambert가 제안한 3단계 계획기반 대화이해모델을 확장함으로써 한국어 대화에서 나타나는 생략 어구로부터 화자의 의도를 인식하는 모델을 제안한다. 먼저 Lambert의 모델에서 고려하지 않은, 생략 어구 형태의 발화를 통해 화자가 의도하는 담화 행위를 새로운 담화 recipe로 정의하여 추가하였다. 한국어에서는 조사가 화자의 의도를 나타내므로 이러한 특성을 이용하여 생략어구를 표층 화행으로 표현할 때, 조사 정보를 포함하여 화자의 의도 인식을 용이하게 함을 볼 수 있었다. 또한 객체와 초점화 이론을 제안하여, 생략 어구를 통해서 화자가 두 개의 계획을 비교하여 고려하는 의도를 인식할 수 있도록 했다.

  • PDF

표현기술언어를 이용한 한국어 생성에 관한 연구 (A Study on the Generation of Korean using Description Directed Control)

  • 권일재;송만석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.117-120
    • /
    • 1995
  • 자연스러운 문장을 생성하는 것은 자연미 생성에서 중요하다. 자연스러운 문장은 개념과 화자의 의도에 의해서 이루어진다. 따라서, 화자의 의도를 반영할 수 있는 한국어 생성 시스템의 설계가 필요하다. 본 논문에서는 언어 현상을 바탕으로 얻은 사람의 발화 모델에 대하여 살펴보고 설정한 한국어의 기본격에 대한 무표어순을 고찰한 후, 이를 바탕으로 화자의 의도를 반영할 수 있는 생성 시스템을 설계한다. 그리고, 이 시스템에서 몇 가지 사람의 언어 행위가 재현되는 과정을 보인다.

  • PDF

문장 유형과 양태 정보를 이용한 합성곱 신경망 기반의 대화체 발화 화행 분석 (CNN Based Speech-act Classification Using Sentence Types and Modalities)

  • 박용신;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.642-644
    • /
    • 2018
  • 화행(Speech-act)이란 어떤 목적을 달성하기 위해 발화를 통해 이루어지는 화자의 행위를 뜻하며, 화행 분석(Speech-act analysis)이란 주어진 발화의 화행을 결정하는 것을 뜻한다. 문장 유형과 양태는 화행의 일종으로, 문장 유형의 경우 화자의 기본적인 발화 의도에 따라 평서문, 명령문, 청유문, 의문문, 감탄문의 다섯 가지 유형으로 나눌 수 있고, 양태는 문장이 표현하는 명제나, 명제가 기술하는 상황에 대해서 화자가 갖는 의견이나 태도를 말한다. 본 논문에서는 종결어미와 보조용언으로부터 비교적 간단하게 추출 가능한 문장 유형과 양태 정보를 활용하여 대화체 발화문의 화행 분석 성능을 높이는 방법을 보인다. 본 논문에서 제안하는 모델은 합성곱 신경망(CNN)을 사용한 기본 모델에 비해 0.52%p 성능 향상을 보였다.

  • PDF

PVPF방법과 퍼지 이론을 이용한 한국어, 영어 및 일본어 화자 인식에 관한 연구 (A Study on Korean, English and Japanese Speaker Recognitions Using the Peak and Valley Pitch Detection and the Fuzzy Theory)

  • 김연숙
    • 한국정보처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.522-533
    • /
    • 1999
  • 본 논문에서는 피지 파라미터와 퍼지 추론을 포함한 화자 인식 알고리즘을 제안한다. 시간영역에서 검출 알고리즘의 장점인 잡음에 강인함을 가진 PVPF 법을 제안하여 피치를 검출한다. 또한 화자 인식에서 특징량들의 애매성을 표현하고 인식하는 방법으로 퍼지 이론을 도입하였다. PVPF는 음의 시간적인 특징을 이용하여 국부적으로 봉우리와 골을 이룬다는 것을 이용한 계산량이 적고 잡음에 강인한 피치 검출법이다.

  • PDF

피치변경을 이용한 화자인식 시스템 (The Speaker Recognition System using the Pitch Alteration)

  • 정종순;배명진
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.115-118
    • /
    • 2002
  • 화자인식에 사용하는 파라미터는 화자의 특징을 충분히 표현함과 더불어 발성 시마다 변동이 작은 것이 바람직하다. 즉, 파라미터의 화자내의 변이보다 화자간의 변이가 큰 특성을 가져야 화자간의 구분이 용이하다. 또한, 화자간 오류를 최소화하기 위해 화자간 구별이 뚜렷한 특징 파라미터뿐만 아니라 분별력이 뛰어난 인식방법도 필요하다. 최근의 실험결과들을 살펴보면 발성기관에 의한 정적인 특징뿐 아니라, 발성습관에 의한 동적인 특징을 같이 이용함으로써 보다 정확한 인식결과를 얻고 있다. 따라서 본 논문에서는 이러한 문제점을 해결하기 위해 다음과 같이 제안한다. 음성의 특징벡터로 운율정보 사용을 제안한다 현재 화자인식 시스템에서 일반적으로 많이 사용되고 있는 특징벡터는 스펙트럼 정보를 모델링하고 있는 것으로 비잡음 환경에서 종은 성능을 보이고 있다. 그러나 잡음 환경변화에 크게 왜곡되며 인식율이 현저하게 저하되는 문제점이 나타난다. 그러므로 본 논문에서는 음성의 동적 변화를 측정할 수 있는 세그먼트로 분할한 피치열을 변경하여 인식의 특징패턴으로 사용한다. 이는 문장의 운율정보를 보여주는 것으로 소음환경에서 강인한 특성을 보였다.

  • PDF

화자인식을 이용한 대화 상황정보 어노테이션 (Conversation Context Annotation using Speaker Detection)

  • 박승보;김유원;조근식
    • 한국멀티미디어학회논문지
    • /
    • 제12권9호
    • /
    • pp.1252-1261
    • /
    • 2009
  • 효율적인 영상의 검색과 동영상의 축약을 위해 선행되어야 하는 것이 동영상 정보에서 의미를 추출하여 영상 정보를 어노테이션 하는 작업이다. 어노테이션을 위한 동영상의 의미 정보는 다양한 방식에 의해 얻어질 수 있다. 동영상의 의미정보는 영상의 개체들의 단순한 정체 정보를 추출하는 방식과 개체들이 만들어 내는 상황정보를 추출하는 방식으로 구분될 수 있다. 하지만 개체들의 단순 정보만으로 어노테이션을 진행하기 보다는 개체들 간의 상호작용이나 관계에 대한 표현을 개체 정보와 함께 고려하여 대화 상황에 대한 온전한 의미를 어노테이션 하는 것이 더욱 좋다. 본 논문은 영상으로부터 화자정보를 추출하고 대화상황을 구성하여 어노테이션 하는 것에 대한 연구이다. 인식된 얼굴 정보로부터 현재 영상에 누가 있는 지 알아낸 후 입의 움직임을 분석하여 화자가 누구인지 알아내고, 화자와 청자 및 자막의 유무를 통해 대화 상황을 추출하여 XML로 변환하는 방법을 본 연구에서 제안한다.

  • PDF

맹사성 <강호사시가>의 짜임새 (A Study on the )

  • 양희찬
    • 한국시조학회지:시조학논총
    • /
    • 제21집
    • /
    • pp.143-164
    • /
    • 2004
  • 이 논문은 <강호사시가>가 한 주제를 형상화하는 데 네 계절의 특징을 담고 있는 서로 다른 글감들을 사용하였지만, 내용의 일관된 통일성을 유지한 연시조이며, 이 통일성 유지는 하나의 일정한 틀을 사용한 데 근거하였음을 해명하려고 한 것이다. 그 일정한 틀은 겉틀과 속틀로 나누었다. 겉틀은 네 작품에 공통된 표현 부분이다. 그 내용은 '화자의 거처(강호)'-'화자(이 몸)'$\cdot$'화자와 임금의 관계(군은)' 및 '강호의 상태(강호에 (가)이 드니)', '화자의 상태(이 몸이 (라)히옴)'를 제시한 것이다. 그리고 초장의 '강호에 (가)이 드니'를 구문의 생성 조건의 측면에서 분석하여 표현의 압축과 간결함을 지적하고, 종장의 '역군은이샷다'를 구문의 생성 의도의 측면에서 분석하여 화자 개인 차원의 삶에 대한 만족을 표출한 것임을 설명하고, 이 삶의 만족을 사회적 차원의 태평성대로 확장할 수 있는지에 대하여 문제제기를 하였다. 속틀은 작품 내용의 세부 짜임이다. 이에 대해서는 네 작품을 초$\cdot$$\cdot$종장 각각으로 묶어 분석한 다음, 네 작품의 공유된 짜임을 설명하고, 각각의 내용 분석을 통하여 곁틀에서 다룬 <강호사시가>의 내용이 갖는 특성을 해명하였다. 네 작품의 초$\cdot$$\cdot$종장을 각각 하나로 묶어 종합 분석하기 위하여 지표기능과 제시기능을 설정하여 그 내용의 짜임을 설명하였다. 초장은 공통으로 네 계절의 흥취를 표현한 것이며, 중장은 지표기능 어휘인 '화자'가 생략되어 제시기능 구절만으로 이루어졌으며, 초장의 흥취를 행위나 상태로 구체적으로 제시하였다. 종장은 중장과 연결하여 함축적 표현이며,사적인 삶과 공적인 가치관(군신유의)의 관계에서 공적인 가치관으로 사적인 삶을 보장받으려는 의도를 내포한 것이다. 이를 종합하면, <강호사시가>의 속틀의 짜임은 '계절의 제시'$\to$'계절에 대한 발흥'$\to$'계절의 즐김 행위'$\to$'(심적$\cdot$신체적) 평안'으로 전개된다. 문맥의 흐름에서 초장은 중장의 단서가 되며, 중장은 초장에 대한 반응이며, 종장은 중장의 응축으로서 평가라는 성격을 가지고 있다. 그리고 속틀의 짜임에 '감군은'이 포함되면 곁틀의 짜임을 확인할 수 있다. 끝으로, 작자가 작품의 본지를 개인의 평안에 둔 것처럼 꾸몄으나, 본래의 발상은 임금의 치적(태평성대)을 송축하려는 것이라고 결론하였다.

  • PDF

청각장애인을 위한 감성자막 편집기 구현 (Implementation of an emotional subtitle editor for deaf and hearing impaired people)

  • 김현순;오주현
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.120-123
    • /
    • 2021
  • 디지털화와 기술의 급격한 발전으로 방송 서비스도 고품질 서비스를 보다 편리하게 이용할 수 있도록 진화하고 있다. 이러한 변화하는 방송 환경에서 비장애인 대비 소외계층의 정보 접근성을 높이기 위한 연구에 대한 필요성이 증가하고 있다. 이러한 연구의 일환으로 UHD 자막 방송 서비스를 개선하기 위한 연구인 '감성표현 자막 서비스 기술' 연구를 진행하였다. 감성표현 자막 서비스 기술은 단순한 텍스트의 전달이 아닌 이미지와 폰트 스타일을 포함한 다양한 시각적 표현을 통해 청각장애인의 방송 내용에 대한 이해도를 향상시키기 위한 기술이다. 본 논문에서는 이러한 감성표현 자막 서비스를 소개하고 해당 서비스를 가능하게 하는 관련 기술과 시스템 구현 결과에 대하여 다룬다. 지상파 UHD 방송을 대상으로 개선된 형태의 자막 서비스를 제공하기 위한 핵심 시스템인 감성자막 편집기를 개발하였다. 감성자막 편집기는 화자의 감정 정보 등을 입력, 편집하고 편집된 감성자막을 영상과 싱크를 맞추어 재생하는 기술과 감성자막을 UHD 송출시스템으로 전송하는 시스템이다.

  • PDF

M-러닝을 활용한 공손 영어 표현 학습에 대한 연구 (A Study on the Learning of Polite Expressions Using M-learning)

  • 김혜정
    • 비교문화연구
    • /
    • 제42권
    • /
    • pp.261-283
    • /
    • 2016
  • 본 연구의 목적은 모바일 애플리케이션을 활용하여 공손 영어 표현 학습의 가능성을 고찰하고자 하는 것이다. 의사소통 능력의 향상을 도모하기 위해서는 문법적, 담화 능력 외에도 사회 언어적 능력이 필요하다. 상대방이 누구인지, 어떠한 대화 상황에 직면했는지, 대화의 주제나 목적 등에 따라 사회적 가치에 맞는 적합한 표현을 구사할 줄 알아야 한다. 상대방의 지위나 나이가 화자보다 높거나 상대방과의 친밀도가 낮을 경우 한국인 화자는 공손한 표현을 구사하게 된다. 한국어는 언어 자체적으로 경어 체계를 지니고 있지만 영어는 이와 다르기 때문에 학습자들은 영어의 공손 표현을 학습할 필요가 있다. 이를 위해 공손 언어 학습에 학습자들이 교실에서 누구나 쉽게 사용할 수 있는 모바일을 접목시키고자 한다. 학습 교재로는 영국의 시대극 "다운튼 애비"(Downton Abbey)를 이용하였는데 이 드라마는 귀족들의 삶을 중심으로 다루었기 때문에 공손 표현을 학습하기에는 매우 적합하다. 모바일 활용을 통한 공손 영어 학습의 효율성과 모바일 애플리케이션의 활용 가능성을 고찰하기 위해 네이버 밴드를 활용한 실험반과 일반적인 팀별 활동을 중심으로 한 통제반을 설정하였다. 두 반의 공손 언어 학습 효과를 확인하기 위해 두 번의 평가가 시행되었고 개방형 설문조사가 실시되었다. 평가 결과 모바일 애플리케이션의 사용은 공손 영어 표현 학습에 긍정적인 효과가 있었으며 모바일이 수업 후 활동으로 사용하기에 효율적인 학습 도구인 것으로 나타났다. 개방형 설문 조사에서 학습자들은 공손 표현을 우아하거나 고급스러운 언어 형식으로 인지하거나 실용적 표현과 구분하는 경향이 있었다. 시대극을 이용하여 공손 언어를 교수할 경우 교수자들은 현대 영어와의 접목을 고려할 필요가 있겠다.

양자 간 대화 상황에서의 화자인식을 위한 문장 시퀀싱 방법을 통한 자동 말투 인식 (Automatic Speech Style Recognition Through Sentence Sequencing for Speaker Recognition in Bilateral Dialogue Situations)

  • 강가람;권오병
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.17-32
    • /
    • 2021
  • 화자인식은 자동 음성시스템에서 중요한 기능을 담당하며, 최근 휴대용 기기의 발전 및 음성 기술, 오디오 콘텐츠 분야 등이 계속해서 확장됨에 따라 화자인식 기술의 중요성은 더구나 부각 되고 있다. 이전의 화자인식 연구는 음성 파일을 기반으로 화자가 누구인지 자동으로 판정 및 정확도 향상을 위한 목표를 가지고 진행되었다. 한편 말투는 중요한 사회언어학적 소재로 사용자의 사회적 환경과 밀접하게 관련되어 있다. 추가로 화자의 말투에 사용되는 종결어미는 문장의 유형을 결정하거나 화자의 의도, 심리적 태도 또는 청자에 대한 관계 등의 기능과 정보를 가지고 있다. 이처럼 종결어미의 활용형태는 화자의 특성에 따라 다양한 개연성이 있어 특정 미확인 화자의 종결어미의 종류와 분포는 해당 화자를 인식하는 것에 도움이 될 것으로 보인다. 기존 텍스트 기반의 화자인식에서 말투를 고려한 연구가 적었으며 음성 신호를 기반으로 한 화자인식 기법에 말투 정보를 추가한다면 화자인식의 정확도를 더욱 높일 수 있을 것이다. 따라서 본 연구의 목적은 한국어 화자인식의 정확도를 개선하기 위해 종결어미로 표현되는 말투(speech style) 정보를 활용한 방법을 제안하는 것이다. 이를 위해 특정인의 발화 내용에서 등장하는 종결어미의 종류와 빈도를 활용하여 벡터값을 생성하는 문장 시퀀싱이라는 방법을 제안한다. 본 연구에서 제안한 방법의 우수성을 평가하기 위해 드라마 대본으로 학습 및 성능평가를 수행하였다. 본 연구에서 제안한 방법은 향후 실존하는 한국어 음성인식 서비스의 성능 향상을 위한 수단으로 사용될 수 있으며 지능형 대화 시스템 및 각종 음성 기반 서비스에 활용될 것을 기대한다.