Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2017.10a
- /
- Pages.213-219
- /
- 2017
- /
- 2005-3053(pISSN)
Korean Zero Anaphora Resolution Guidelines
한국어 생략어복원 가이드라인
- Ryu, Jihee (Electronics and Telecommunications Research Institute) ;
- Lim, Joon-Ho (Electronics and Telecommunications Research Institute) ;
- Lim, Soojong (Electronics and Telecommunications Research Institute) ;
- Kim, Hyunki (Electronics and Telecommunications Research Institute)
- 류지희 (한국전자통신연구원 언어지능연구그룹) ;
- 임준호 (한국전자통신연구원 언어지능연구그룹) ;
- 임수종 (한국전자통신연구원 언어지능연구그룹) ;
- 김현기 (한국전자통신연구원 언어지능연구그룹)
- Published : 2017.10.13
Abstract
말과 글에서 유추가 가능한 정보에 대해서는 사람들이 일반적으로 생략해서 표현하는 경우를 볼 수 있다. 사람들은 생략된 정보를 문맥적으로 유추하여 이해하는 것이 어렵지 않지만, 컴퓨터의 경우 생략된 정보를 고려하지 못해 주어진 정보를 완전하게 이해하지 못하는 문제를 낳게 된다. 우리는 이러한 문제를 생략어복원을 통해 해결할 수 있다고 여기면서 본 논문을 통해 한국어 생략어복원에 대해 정의하고 기술 개발에 필요한 말뭉치 구축 시의 생략어복원 대상 및 태깅 사례를 포함하는 가이드라인을 제안한다. 또한 본 가이드라인에 의한 말뭉치 구축 및 기술 개발을 통해서 엑소브레인과 같은 한국어 질의응답 시스템의 품질 향상에 기여하는 것이 본 연구의 궁극적인 목적이다.