구어 의존 구문 분석을 위한 비유창성 처리 연구

A Study of Disfluency Processing for Dependency Parsing of Spoken

  • 박석원 (연세대학교 언어정보학협동과정) ;
  • 최현수 (연세대학교 언어정보학협동과정) ;
  • 한지윤 (연세대학교 언어정보학협동과정) ;
  • 오태환 (연세대학교 국어국문학과) ;
  • 안의정 (연세대학교 언어정보연구원) ;
  • 김한샘 (연세대학교 언어정보학협동과정)
  • Park, Seokwon (Institute of Language and Information Studies, Yonsei University) ;
  • Choe, Hyonsu (Institute of Language and Information Studies, Yonsei University) ;
  • Han, Jiyoon (Institute of Language and Information Studies, Yonsei University) ;
  • Oh, Taehwan (Institute of Language and Information Studies, Yonsei University) ;
  • Ahn, Euijeong (Institute of Language and Information Studies, Yonsei University) ;
  • Kim, Hansaem (Institute of Language and Information Studies, Yonsei University)
  • 발행 : 2019.10.10

초록

비유창성(disfluency)은 문어와 같이 정연한 구조로 말하지 못하는 현상 전반을 지칭한다. 이는 구어에서 보편적으로 발생하는 현상으로 구어 의존 구문 분석의 난이도를 상향시키는 요인이다. 본 연구에서는 비유창성 요소 유형을 담화 표지, 수정 표현, 반복 표현, 삽입 표현으로 분류하였다. 또한 유형별 비유창성 요소를 실제 말뭉치에서 어떻게 구문 주석할 것인지를 제안한다. 이와 같은 구어 데이터 처리 방식은 대화시스템 등 구어를 처리해야 하는 도메인에서의 자연언어이해 성능 향상에 기여할 것이다.

키워드