• Title/Summary/Keyword: 모델 발화

Search Result 206, Processing Time 0.027 seconds

Generation Paraphrase using Pointer Generation Network (포인터 생성 네트워크를 이용한 패러프레이즈 생성)

  • Park, Da-Sol;Kim, Young-kil;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.535-539
    • /
    • 2020
  • 다양한 발화를 모델링하는 요구는 자연어 처리 분야에서 꾸준히 있었으며 단어, 구 또는 문장과 동등한 의미 콘텐츠를 자동으로 식별하고 생성하는 것은 자연어 처리의 중요한 부분이다. 본 논문에서는 포인터 생성 네트워크(Pointer Generate Nework)를 이용하여 패러프레이즈 생성 모델을 제안한다. 제안한 모델의 성능을 측정하기 위해 사람이 직접 구축한 유사 문장 코퍼스를 이용하였으며, 토큰 단위의 BLEU-4 0.250, ROUGE_L 0.455, CIDEr 2.190의 성능을 보였다. 하지만 입력 문장과 동일한 문장을 출력하는 문제점이 존재하여 빔서치(beam search)를 적용하여 입력 문장과 비교하여 생성 문장을 선택하는 방식을 적용하였다. 입력 문장과 동일한 문장을 제외한 문장으로 평가를 진행했으며, 토큰 단위의 BLEU-4 0.234, ROUGE_L 0.459, CIDEr 2.041의 성능을 보였으나, 패러프레이즈 생성 데이터 양이 크게 증가하였다. 본 연구는 문장 간의 의미적으로 동일한 정보를 정확하게 추출할 수 있게 됨으로써 정보 추출, 온톨로지 생성에 도움이 될 것이다. 또한 이러한 기법이 챗봇에서 사용자의 의도 탐지 및 MRC와 같은 자연어 처리의 여러 분야에 유용한 자원으로 사용될 것이다.

  • PDF

On the Predictive Model for Emotion Intensity Improving the Efficacy of Emotionally Supportive Chat (챗봇의 효과적 정서적 지지를 위한 한국어 대화 감정 강도 예측 모델 개발)

  • Sae-Lim Jeong;You-Jin Roh;Eun-Seok Oh;A-Yeon Kim;Hye-Jin Hong;Jee Hang Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.656-659
    • /
    • 2023
  • 정서적 지원 대화를 위한 챗봇 개발 시, 사용자의 챗봇에 대한 사용성 및 대화 적절성을 높이기 위해서는 사용자 감정에 적합한 지원 콘텐츠를 제공하는 것이 중요하다. 이를 위해, 본 논문은 사용자 입력 텍스트의 감정 강도 예측 모델을 제안하고, 사용자 발화 맞춤형 정서적 지원 대화에 적용하고자 한다. 먼저 입력된 한국어 문장에서 키워드를 추출한 뒤, 이를 각성도 (arousal)과 긍정부 정도(valence) 공간에 투영하여 키워드가 내포하는 각성도-긍정부정도에 가장 근접한 감정을 예측하였다. 뿐만 아니라, 입력된 전체 문장에 대한 감정 강도를 추가로 예측하여, 핵심 감정 강도 - 문맥상 감정강도를 모두 추출하였다. 이러한 통섭적 감정 강도 지수들은 사용자 감정에 따른 최적 지원 전략 선택 및 최적 대화 콘텐츠 생성에 공헌할 것으로 기대한다.

Dialogue Strategies to Overcome Speech Recognition Errors in Form-Filling Dialogue (양식 채우기 대화에서 음성 인식 오류의 보완을 위한 대화 전략)

  • Kang Sang-Woo;Lee Song-Wook;Seo Jung-Yun
    • Korean Journal of Cognitive Science
    • /
    • v.17 no.2
    • /
    • pp.139-150
    • /
    • 2006
  • Speech recognition errors cause fatal results in a spoken dialogue system. When a system can not determine the speech-act of u utterance due to speech recognition errors, a dialogue system has a difficulty in continuing conversation. In this paper, we propose strategies for sub-dialogue generation by inferring the speech-act of an utterance with patterns of recognition errors on the field of form-filling dialogue. We used the proposed method on a plan-based dialogue model, corrected 27% of incomplete tasks, and acquired overall 89% of task completion rate.

  • PDF

A Study on the Generation of Korean using Description Directed Control (표현기술언어를 이용한 한국어 생성에 관한 연구)

  • Kwon, Il-Jae;Song, Man-Suk
    • Annual Conference on Human and Language Technology
    • /
    • 1995.10a
    • /
    • pp.117-120
    • /
    • 1995
  • 자연스러운 문장을 생성하는 것은 자연미 생성에서 중요하다. 자연스러운 문장은 개념과 화자의 의도에 의해서 이루어진다. 따라서, 화자의 의도를 반영할 수 있는 한국어 생성 시스템의 설계가 필요하다. 본 논문에서는 언어 현상을 바탕으로 얻은 사람의 발화 모델에 대하여 살펴보고 설정한 한국어의 기본격에 대한 무표어순을 고찰한 후, 이를 바탕으로 화자의 의도를 반영할 수 있는 생성 시스템을 설계한다. 그리고, 이 시스템에서 몇 가지 사람의 언어 행위가 재현되는 과정을 보인다.

  • PDF

구조생성기호학적 관점에서의 디지털게임의 의미생성방식 연구 - 스타크래프트, 리니지, 스페셜포스에 대한 분석을 중심으로 -

  • Park, Tae-Sun
    • 한국게임학회지
    • /
    • v.6 no.1
    • /
    • pp.41-43
    • /
    • 2009
  • 게임에서의 텍스트를 추출하고 이를 분석하고자 하였다. 기본적으로 그레마스의 구조생성기호학을 활용하여 텍스트를 분석하고자 하였는데, 연구방법론에서는 현상학, 해석에서는 정신분석학의 이론에서도 도움을 받았다. 구체적인 분석대상으로는 온라인게임인 스타크래프트, 리니지, 스페셜포스를 선택하였다. 연구문제는 이들 세 게임의 의미생성방식에 대한 탐구로 구성되었다. 각 게임의 의미생성방식은 구조생성기호학의 세 가지 층위에서 구분되어 연구되었다. 즉, 심층구조, 기호-설화구조, 담화구조의 세층위로 전환, 발화되면서 점진적으로 의미가 풍성해지는 과정이 탐구되었다. 각 게임의 차이, 나아가 게임 장르간의 차이는 주로 심층 수준의 차이에서 기인한다고 보인다. 이들 게임의 주요 공통점이자, 다른 매체와의 차이점은 행동자 모델에서 두드러지는데, 바로 이용자가 스스로 주체의 위치를 점하게 되는 것이다. 상호작용성으로 대변되는 게임의 특성은 이용자의 텍스트로의 적극적인 개입을 할 수 있게끔 한다. 이러한 적극적인 개입은 이용자가 스스로 텍스트의 주체가 되도록 허용하는데, 주체가 된다고 함은 곧 스스로의 욕망을 직접 대상에 투사하면서 텍스트를 창출함을 의미한다. 바로 이러한 점이 게임의 의미생성방식의 큰 특징이며 다른 매체들과의 주요한 차이점이기도 하다. 더불어 게임이 우리 문화와 사회에 커다란 영향을 미칠 수 있는 기제임이 입증되는 것이기도 하다.

  • PDF

Simplified Reaction Scheme of Hydrocarbon Fuels and Its Application to Autoignition of n-Heptane (탄화수소계 연료의 축소반응모텔과 노말-헵탄(n-Heptane)의 자발화 현상)

  • 여진구
    • Transactions of the Korean Society of Automotive Engineers
    • /
    • v.10 no.1
    • /
    • pp.76-83
    • /
    • 2002
  • Mathematically and chemically simplified reaction scheme for n(heptane that simulates autoignitions of the end gases in spark ignition engines has been developed and studied computationally. The five(equation model is described, to predict the essential features of hydrocarbon oxidation. This scheme has been calibrated against autoignition delay times measured in rapid compression machines. The rate constants, activation temperatures, Ta, Arrhenius pre-exponential constants, A, and heats of reaction for stoichiometric nheptane/air has all been optimized. Comparisons between computed and experimental autoignition delay times have validated the present simplified reaction scheme. The influences of heat loss and concentration of chain carrier at the beginning of compression upon autoignition delay times have been computationally investigated.

Adversarial Learning for Natural Language Understanding (자연어 이해를 위한 적대 학습 방법)

  • Lee, Dong-Yub;Whang, Tae-Sun;Lee, Chan-Hee;Lim, Heui-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.155-159
    • /
    • 2018
  • 최근 화두가 되고있는 지능형 개인 비서 시스템에서 자연어 이해(NLU) 시스템은 중요한 구성요소이다. 자연어 이해 시스템은 사용자의 발화로부터 대화의 도메인(domain), 의도(intent), 의미적 슬롯(semantic slot)을 분류하는 역할을 한다. 하지만 자연어 이해 시스템을 학습하기 위해서는 많은 양의 라벨링 된 데이터를 필요로 하며 새로운 도메인으로 시스템을 확장할 때, 새롭게 데이터 라벨링을 진행해야 하는 한계점이 존재한다. 이를 해결하기 위해 본 연구는 적대 학습 방법을 이용하여 풍부한 양으로 구성된 기존(source) 도메인의 데이터부터 적은 양으로 라벨링 된 데이터로 구성된 대상(target) 도메인을 위한 슬롯 채우기(slot filling) 모델 학습 방법을 제안한다. 실험 결과 적대 학습을 적용할 경우, 적대 학습을 적용하지 않은 경우 보다 높은 f-1 score를 나타냄을 확인하였다.

  • PDF

Human-like Fuzzy Lip Synchronization of 3D Facial Model Based on Speech Speed (발화속도를 고려한 3차원 얼굴 모형의 퍼지 모델 기반 립싱크 구현)

  • Park Jong-Ryul;Choi Cheol-Wan;Park Min-Yong
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.05a
    • /
    • pp.416-419
    • /
    • 2006
  • 본 논문에서는 음성 속도를 고려한 새로운 립싱크 방법에 대해서 제안한다. 실험을 통해 구축한 데이터베이스로부터 음성속도와 입모양 및 크기와의 관계를 퍼지 알고리즘을 이용하여 정립하였다. 기존 립싱크 방법은 음성 속도를 고려하지 않기 때문에 말의 속도와 상관없이 일정한 입술의 모양과 크기를 보여준다. 본 논문에서 제안한 방법은 음성 속도와 입술 모양의 관계를 적용하여 보다 인간에 근접한 립싱크의 구현이 가능하다. 또한 퍼지 이론을 사용함으로써 수치적으로 정확하게 표현할 수 없는 애매한 입 크기와 모양의 변화를 모델링 할 수 있다. 이를 증명하기 위해 제안된 립싱크 알고리즘과 기존의 방법을 비교하고 3차원 그래픽 플랫폼을 제작하여 실제 응용 프로그램에 적용한다.

  • PDF

Handwritten Hangul Recognition by Dynamic Lattice Search with Structural Constraints (문자의 구조적 제약과 동적 격자 탐색을 이용한 필기 한글 문자 인식)

  • Kang, Kyung-Won;Kim, Jin-Hyung
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.359-364
    • /
    • 2001
  • 필기 한글문자 인식은 다양한 필기 변형, 자모 간의 접촉과 같은 문제들을 내포하고 있다. 최근 이를 해결하기 위한 방법으로 랜덤 그래프를 이용한 필기 한글 모델링이 제안되었으나, 상향식 정보처리의 한계인 시간 복잡도 문제를 겪고 있다. 영어 단어인식에 관한 인지과학적 연구에서는 하향식 정보처리의 주요한 역할 중 하나로 인식 과정에서의 계산 중복을 없애는 필터링의 역할을 들고 있다. 본 논문에서는 랜덤 그래프를 이용한 필기 한글 모델링을 기반으로 하여 필기체에 나타나는 다양한 변형을 흡수하며, 시간 복잡도를 해결하기 위한 한글 문자의 구조에 바탕을 둔 하향식 정보처리 방법을 제안한다. 제안하는 방법은 모델 발화를 이용한 자모 후보 추출 DP 정합과 동적 격자 탐색을 이용한 문자 후보 탐색, 그리고 문자의 구조적 제약을 이용한 후보 제거 기법을 포함한다. 필기 한글 데이터베이스인 SERI-DB에 대한 예비 실험 결과, 제안한 방법은 인식률의 큰 저하 없이 상향식 정보 처리에 바탕을 둔 기존 방법에 비해 높은 속도 향상을 가져 왔다.

  • PDF

Identification and Recovery of Elided Information for Text Animation (텍스트 애니메이션을 위한 생략 정보 파악 및 복원)

  • Chang, Eun-Young;Park, Jong-C.
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.205-213
    • /
    • 2004
  • 음성인식기술을 실제 생활에 적용할 때 발생하는 대표적인 문제로, 인식기의 낮은 인식률로 인한 오동작을 들 수 있다. 본 연구에서는. 텔레뱅킹 도메인에서의 HTK(Hidden Markov Model Toolkit) 연속 음성 인식 시스템과, 최대 엔트로피 기법에 기반한 사용자 발화에서의 핵심이 되는 단어(주로 고유 명사들)들에 대한 인식 신뢰도의 측정 방법을 제시한다. 음향특징과 언어특징들을 모두 고려하여 인식 신뢰도를 구하였으며 인식된 단어들에 대해 오인식 되었음을 약 86%의 정확도로 판단할 수 있음을 확인하였다. 본 인식신뢰도를 이용하여 차후에 음성인식의 확인대화(Clarification Dialog)모델을 개발하는데 활용하고자 한다.

  • PDF