• 제목/요약/키워드: 화행분류

검색결과 22건 처리시간 0.028초

Conditional Random Fields를 이용한 영역 행위 분류 모델 (A Domain Action Classification Model Using Conditional Random Fields)

  • 김학수
    • 인지과학
    • /
    • 제18권1호
    • /
    • pp.1-14
    • /
    • 2007
  • 목적 지향 대화에서 사용자의 의도는 화행과 개념열의 쌍으로 구성된 영역 행위로 표현될 수 있다. 그러므로 지능적인 대화 시스템을 구성하기 위해서는 영역 행위를 정확히 파악하는 것이 매우 중요하다. 본 논문에서는 CRFs (Conditional Random Fields)를 이용하여 화행과 개념열을 동시에 결정하는 통계 모델을 제안한다. 편향 학습 문제를 피하기 위하여 제안한 모델은 어휘와 품사 같은 낮은 수준의 언어 자질을 입력 자질로 사용하며, 카이 제곱 통계량을 이용하여 불필요한 자질들을 제거한다. 일정 관리 영역에서 실험을 수행한 결과, 제안한 모델은 화행 분류 정착률에서 93.0%, 개념열 분류 정확률에서 90.2%의 좋은 성능을 보였다.

  • PDF

주의집중 메커니즘 기반의 양방향 GRU-CRF를 이용한 화행 분석과 슬롯 필링 공동 학습 모델 (A Joint Learning Model for Speech-act Analysis and Slot Filling Using Bidirectional GRU-CRF Based on Attention Mechanism)

  • 윤정민;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.252-255
    • /
    • 2018
  • 화행 분석이란 자연어 발화를 통해 나타나는 화자의 의도를 파악하는 것을 말하며, 슬롯 필링이란 자연어 발화에서 도메인에 맞는 정보를 추출하기 위해 미리 정의되어진 슬롯에 대한 값을 찾는 것을 말한다. 최근 화행 분석과 슬롯 필링 연구는 딥 러닝 기반의 공동 학습을 이용하는 연구가 많이 이루어지고 있고 본 논문에서는 한국어 특허상담 도메인 대화 말뭉치를 이용하여 공동 학습 모델을 구축하고 개별적인 모델과 성능을 비교한다. 또한 추가적으로 공동 학습 모델에 주의집중 메커니즘을 적용하여 성능이 향상됨을 보인다. 최종적으로 주의집중 메커니즘 기반의 공동 학습 모델이 기준 모델과 비교하여 화행 분류와 슬롯 필링 성능이 각각 3.35%p, 0.54%p 향상되어 85.41%, 80.94%의 성능을 얻었다.

  • PDF

Convolutional Neural Network에서 공유 계층의 부분 학습에 기반 한 화자 의도 분석 (Speakers' Intention Analysis Based on Partial Learning of a Shared Layer in a Convolutional Neural Network)

  • 김민경;김학수
    • 정보과학회 논문지
    • /
    • 제44권12호
    • /
    • pp.1252-1257
    • /
    • 2017
  • 대화에서 화자의 의도는 감정, 화행, 그리고 서술자로 표현될 수 있다. 따라서 사용자 질의에 정확하게 응답하기 위해서 대화 시스템은 발화에 내포된 감정, 화행, 그리고 서술자를 파악해야한다. 많은 이전 연구들은 감정, 화행, 서술자를 독립된 분류 문제로 다뤄왔다. 그러나 몇몇 연구에서는 감정, 화행, 서술자가 서로 연관되어 있음을 보였다. 본 논문에서는 Convolutional Neural Netowork를 이용하여 감정, 화행, 서술자를 동시에 분석하는 통합 모델을 제안한다. 제안 모델은 특정 추상화 계층과, 공유 추상화 계층으로 구성된다. 특정 추상화 계층에서는 감정, 화행, 서술자의 독립된 정보가 추출되고 공유 추상화 계층에서 독립된 정보들의 조합이 추상화된다. 학습 시 감정의 오류, 화행의 오류, 서술자의 오류는 부분적으로 역 전파 된다. 제안한 통합 모델은 실험에서 독립된 모델보다 좋은 성능(감정 +2%p, 화행 +11%p, 서술자 +3%)을 보였다.

지지벡터기계(Support Vector Machines)를 이용한 한국어 화행분석 (An analysis of Speech Acts for Korean Using Support Vector Machines)

  • 은종민;이성욱;서정연
    • 정보처리학회논문지B
    • /
    • 제12B권3호
    • /
    • pp.365-368
    • /
    • 2005
  • 본 연구에서는 지지 벡터 기계(Support Vector Machines)를 이용하여 한국어 대화의 화행을 분석하는 방법을 제안한다. 우리는 발화의 어휘 및 품사와 이진 품사 쌍을 문장 자질로 사용하고 이전 발화의 문맥을 문맥 발화로 사용한다. 카이 제곱 통계량을 이용해 적절한 자질을 선택하고 선택된 자질로 지지 벡터 기계를 학습하였다. 학습된 지지 벡터 기계 분류기를 이용하여 각 발화의 화행을 분석하였다. 호텔 예약 영역의 말뭉치에 대해 제안된 시스템을 이용하여 실험한 결과 약 $90.54\%$의 정확률을 얻었다.

자질 선택 기법을 이용한 한국어 화행 결정 (Decision of the Korean Speech Act using Feature Selection Method)

  • 김경선;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.278-284
    • /
    • 2003
  • 화행(speech act)이란 화자의 발화를 통해 나타나는 화자의 의도를 가르키며 자연어로 된 발화를 이해하고 이에 대한 응답을 생성하기 위해 중요한 요소이다. 본 논문에서는 한국어 화행 결정의 성능을 높이기 위해 두 단계 방법을 제안한다. 첫 번째 단계는 형태소 분석결과만을 이용하여 추출된 문장자질과 이전 화행을 이용하여 추출된 문맥자질 중 정보량이 높은 자질을 선택하는 단계이다. 이 단계에서는 형태소 분석 시스템을 사용하여 전체 자질을 구성하고 문서분류 분야의 자질 선택에서 높은 성능을 보인 카이제곱 통계량을 이용하여 효과적인 자질 선택한다. 두 번째 단계는 선택된 자질과 신경망을 이용하여 화행을 분석하는 단계이다. 본 논문에서 제시한 방법은 형태소 분석 결과만을 이용하여 자동적으로 화행을 결정할 수 있는 가능성을 제시하였으며 효과적인 자질 선택을 통해 자질의 수를 감소시키고 정보량이 높은 자질을 사용하여 속도와 성능을 향상 시켰다 본 논문은 제안된 시스템을 실제 영역에서 수집되어 전사된 10,285개의 발화와 17개의 화행으로 이루어진 대화 코퍼스에 대해 실험하였다. 본 논문은 이 코퍼스에서 8,349개 발화를 학습 코퍼스로 사용하여, 실험 코퍼스의 1,936개 발화에 대해 1,709개에 대해 정확한 화행을 제시하여, 88.3%의 정확도를 보였다. 이는 자질 선택을 하지 않았을 때 보다 약 8%가 증가된 결과이다.

화행의 하위 분류 가능성에 대한 고찰 - '이유 말하기'를 중심으로 - (Zur $M\"{o}glichkeit$ der Unterklassifikation von Sprechakttypen. Am Beispiel der $begr\"{u}ndenden$ Sprechhandlungen)

  • 강창우
    • 한국독어학회지:독어학
    • /
    • 제5집
    • /
    • pp.203-221
    • /
    • 2002
  • Die Unterklassifikation von Sprechakttypen stellt einen wichtigen Forschtmgs­gegenstand der Sprechakttheorie dar. Mit den Kriterien, die Searle (1969) vorgeschlagen hat, $k\"{o}nnen\;zwar\;die\;f\"{u}nf$ Haupttypen der Sprechakte voneinander unterschieden werden, aber $f\"{u}r$ deren Unterklassifikation $m\"{u}ssen$ weitere Kriterien herangezogen werden, und zwar solche, mit denen die Untertypen des zu unterklassifizierenden Sprechakttyps deren Handlungscharakter $gem\"{a}{\ss}$ klassifiziert werden $k\"{o}nnen$. Es ist aber nicht einfach festzustellen, was man als Kriterien $f\"{u}r$ die Unterklassifikation eines bestimmten Sprechakttyps nehmen soll. In der vorliegenden Arbeit wird versucht, die $f\"{u}r$ die Unterklassifikation der sogenannten $begr\"{u}ndenden$ Sprechhandlungen (= bSH) wie $ERKL\"{A}REN-WARUM,\;BEGR\"{U}NDEN$, RECHTFERTIGEN und ARGUMENTIEREN angemessenen Kriterien festzustellen und mit diesen die vier Untertypen der bSH zu klassifizieren. Dabei werden zwei Kriterien herangezogen: $n\"{a}mlich$, Gegenstandstyp und Strittigkeit. Je nachdem, urn welchen Gegenstandstyp es bei der bSH geht und ob Strittigkeit vorliegt, wird ein anderer Untertyp der bSH vollzogen. Die Gegenstandstypen der bSH sind wie folgt darzustellen: Gegenstandstypen der bSH Gegenstandstypen im subjektiven Bereich Gegenstandstrypen im objektiven Bereich Einstellungen des Sprechers Handlungen des Sprechers Tatsachen Ereignisse Naturprozesse Handlungen eines Dritten Einstellungen eines Dritten Strittigkeit kann nur in Bezug auf die Gegenstandstypen im subjektiven Bereich entstehen, und zwar in Bezug auf die Richtigkeit der Handlungen und Einstellungen und die Wahrheit der Einstellungen des Sprechers. Mit den beiden Kriterien 'Gegenstandstyp' und 'Strittigkeit' $k\"{o}nnen$ die Untertypen der bSH wie folgt klassifiziert werden:

  • PDF

목적 지향 대화를 위한 효율적 질의 의도 분석에 관한 연구 (Effective Text Question Analysis for Goal-oriented Dialogue)

  • 김학동;고명현;임헌영;이유림;지민규;김원일
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.48-57
    • /
    • 2019
  • 본 연구는 목적 지향 대화 시스템 내에서 단일 한국어 텍스트 형식의 질문으로부터 질의자의 의도를 파악하는 것을 목적으로 한다. 목적 지향 대화 시스템은 텍스트 또는 음성을 통한 사용자의 특수한 요구를 만족시켜주는 대화 시스템을 의미한다. 의도 분석 과정은 답변 생성에 앞서 사용자의 질의 의도를 파악하는 단계로, 목적 지향 대화 시스템 전체의 성능에 큰 영향을 준다. 생활화학제품이라는 특정 분야에 제안 모델을 사용하였고, 해당 분야와 관련된 한국어 텍스트 데이터를 이용하였다. 특정 분야에 독립적이며 범용적인 의도를 의미하는 화행과, 특정 분야에 종속적인 의도를 의미하는 개념열로 나누어 분석한다. 화행과 개념열을 분석하기 위하여 단어 임베딩 모델, 합성곱 신경망을 이용한 분류 방법을 제안한다. 단어 임베딩 모델을 통하여 단어의 의미정보를 추상화하고, 추상화된 단어의 의미정보를 기반으로 합성곱 신경망을 통하여 개념열 및 화행 분류를 수행한다.

화행 유형의 하위분류 가능성과 그 문제점 (Moglichkeit der Unterklassifikation des Sprechakttyps und deren Probleme)

  • 강창우
    • 한국독어학회지:독어학
    • /
    • 제9집
    • /
    • pp.195-215
    • /
    • 2004
  • In der vorliegenden Arbeit wird die $M\"{o}glichkeit$ der Unterklassifikation des Sprechakttyps untersucht. Zur Klassifikation von Sprechakten hat Searle (1969) $zw\"{o}lf$ Kriterien vorgeschlagen, und mit den folgenden drei Kriterien hat er funf Sprechaktklassen herausgearbeitet: $illokution\"{a}rer$ Zweck, Entsprechungsrichtung und psychologischer Zustand. Bei der Unterklassifikation dieser $f\"{u}nf$ Sprechaktklassen $k\"{o}nnen$ aber die von Searle vorgeschlagenen Klassifikationskriterien kaum gebraucht werden, so dass zur Unterklassifikation jeder Sprechaktklasse neue Kriterien $eingef\"{u}hrt$ werden mussten. Dabei stellt sich die Frage, was als Unterklassifikationskriterien dienen und wie ausdifferenziert eine Spreckaktklasse bzw. ein Sprechakttyp unterklassifiziert werden kann. Im 1. Kapitel werden neben den Klassifikationskriterien von Searle die Kriterien, die in den bisherigen Unterklassifikationen der Sprechaktklassen verwendet wurden, kritisch betrachtet. Im 2. Kapitel wird auf die Frage der Ausdifferenzierungsgrenze $n\"{a}her$ eingegangen, wobei diskutiert wird, ob die Unterklassifikation der Fragehandlung von Hindelang (1981) und die des Insistierens von Franke (1990) genugend ausdifferenziert sind oder es noch $M\"{o}glichkeiten$ besteht, sie noch weiter auszudifferenzieren. Die Frage nach der Ausdifferenzierungsgrenze ist mit der Frage gleichzusetzen, inwieweit eine Sprechhandlung ohne Verlust ihres Handlungscharakters in Untertypen zerlegt werden kann. Um diese Frage zu beantworten, wird der Begriff 'Basishandlung' $eingef\"{u}hrt$, den von Wright (1974) im Rahmen seiner Theorie der Kausalitat entwickelt hat. In Analogie zu diesem Begriff wird der Begriff 'Basis-Sprechhandlung' vorgeschlagen und wie folgt definiert: 1. Obere Grenze: Eine Basis-Sprechhandlung ist die Sprechhandlung, die nicht durch den Vollzug der anderen Sprechhandlungen ausgefuhrt werden kann. 2. Untere Grenze: Durch eine $\"{A}u{\ss}erung$ bzw. einen Teil der $\"{A}{\ss}erung$ kann nur dann eine Basis-Sprechhandlung vollzogen werden, wenn sieler eine $\"{A}nderung$ des Wissens oder der Handlung des $H\"{o}rers$ $herbeif\"{u}hrt$. Diese These wird anhand der Beispiele $\"{u}berpr\"{u}ft$, deren kommunikative $Selbst\"{a}ndigkeit$ schon durch andere Studien $best\"{a}tigt$ wurde. Als weiteres Kriterium zur Entscheidung $\"{u}ber$ die $M\"{o}glichkeit$ der Unterklassifikation wird im 4. Kapitel der Begriff 'kommunikativer Zweck' $eingef\"{u}hrt$ und $dar\"{u}ber$ diskutiert, wie der kommunikative Zweck der Untertypen einer Sprechaktklasse bzw. eines Sprechakttyps definiert und beschrieben werden kann. Dabei wird festgestellt, dass er durch die Spezifizierung des kommunikativen Zwecks der Sprechaktklasse bzw. des Sprechakttyps, zu der/zu dem die Untertypen $geh\"{o}ren$, definiert und beschrieben werden kann, wobei die semantischen, die kontextuellen und die sitiativen Aspekte $mitbe\"{u}cksichtigt$ werden sollen.

  • PDF

대화체에서 부대화의 개시/종료 및 화자의 의도, 그리고 청자 논항의 생략 (Subdialogue Cues, Speaker Intention, and the Deletion of Hearer Arguments in Spoken Korean)

  • 홍민표;이현호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.358-364
    • /
    • 1998
  • 본 연구는 한국어 대화인지모형을 구축하는 데 필요한 화용론적 지식에 관한 연구의 일환으로, 부대화의 개시 및 종료 시점에서 나타나는 담화 참여자의 의도 및 그 의도와 관련된 표층표지를 분석하고, 나아가 필수 논항 성분의 하나로서 대화체에서는 자주 생략되어 나타나는 청화자 논항의 의미복원을 위한 예비적 단계로서 술어의 어미 특성 및 화자의 언어행위 혹은 화행과 관련하여 청자 논항의 생략 유형을 분류하고 분석했다. 이러한 연구는 한국어 대화 에이전트를 개발하는데 있어 필수적인 단계로서 향후 대화체 이해시스템 연구에 기초적인 틀을 제공해 줄 수 있다.

  • PDF

DECO-LGG 반자동 증강 학습데이터 활용 멀티태스크 트랜스포머 모델 기반 핀테크 CS 챗봇 NLU 시스템 (Multitask Transformer Model-based Fintech Customer Service Chatbot NLU System with DECO-LGG SSP-based Data)

  • 유광훈;황창회;윤정우;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.461-466
    • /
    • 2021
  • 본 연구에서는 DECO(Dictionnaire Electronique du COreen) 한국어 전자사전과 LGG(Local-Grammar Graph)에 기반한 반자동 언어데이터 증강(Semi-automatic Symbolic Propagation: SSP) 방식에 입각하여, 핀테크 분야의 CS(Customer Service) 챗봇 NLU(Natural Language Understanding)을 위한 주석 학습 데이터를 효과적으로 생성하고, 이를 기반으로 RASA 오픈 소스에서 제공하는 DIET(Dual Intent and Entity Transformer) 아키텍처를 활용하여 핀테크 CS 챗봇 NLU 시스템을 구현하였다. 실 데이터을 통해 확인된 핀테크 분야의 32가지의 토픽 유형 및 38가지의 핵심 이벤트와 10가지 담화소 구성에 따라, DECO-LGG 데이터 생성 모듈은 질의 및 불만 화행에 대한 양질의 주석 학습 데이터를 효과적으로 생성하며, 이를 의도 분류 및 Slot-filling을 위한 개체명 인식을 종합적으로 처리하는 End to End 방식의 멀티태스크 트랜스포머 모델 DIET로 학습함으로써 DIET-only F1-score 0.931(Intent)/0.865(Slot/Entity), DIET+KoBERT F1-score 0.951(Intent)/0.901(Slot/Entity)의 성능을 확인하였으며, DECO-LGG 기반의 SSP 생성 데이터의 학습 데이터로서의 효과성과 함께 KoBERT에 기반한 DIET 모델 성능의 우수성을 입증하였다.

  • PDF