Korean Paraphrase Corpus and Building Guidelines for Sentence Similarity Analysis

문장 유사성 분석을 위한 한국어 패러프레이즈 말뭉치 및 구축 가이드라인

  • 오교중 (한국과학기술원 전산학부) ;
  • 김현민 (주식회사 리비, 인공지능 솔루션팀) ;
  • 고보원 (한국과학기술원 전산학부) ;
  • 남제현 (한국과학기술원 전산학부) ;
  • 최호진 (한국과학기술원 전산학부)
  • Published : 2019.10.10

Abstract

최근 각 산업분야에서 대화 시스템과 챗봇 기술의 업무로의 도입이 활발해짐에 따라 한국어 패러프레이즈 기술에 대한 관심이 높아지고 있다. 기존에는 연구와 평가 목적으로 규모는 작아도 잘 정제된 평가셋을 만드는 것이 중요했으나, 최근에는 기계학습 기술의 발달로 학습을 위한 일정 수준의 품질을 보장하는 대량의 말뭉치를 빠르게 확보하는 방법이 중요해지고 있다. 본 논문에서는 현재 수행하고 있는 한국어 패러프레이즈 말뭉치 구축 경험과 방법에 대해 소개한다.

Keywords

Acknowledgement

이 논문은 2019년도 정부(과학기술정보통신부)의 재원으로 정보통신기획평가원의 지원을 받아 수행된 연구임 (No.2013-2-00131, 휴먼 지식증강 서비스를 위한 지능진화형 Wise QA 플랫폼 기술 개발)