Verbal Collocation Extraction from Sejong Tagged Corpus

Lee, Jeong-Tae;Cheon, Min-Ah;Kim, Jae-Hoon;

Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))

2015.10a
/
Pages.121-123
/
2015
/
2005-3053(pISSN)

Human and Language Technology (한국정보과학회 언어공학연구회)

Verbal Collocation Extraction from Sejong Tagged Corpus

세종 말뭉치로부터 용언연어 추출

Lee, Jeong-Tae (Korea Maritime and Ocean University) ;
Cheon, Min-Ah (Korea Maritime and Ocean University) ;
Kim, Jae-Hoon (Korea Maritime and Ocean University)

이정태 (한국해양대학교) ;
천민아 (한국해양대학교) ;
김재훈 (한국해양대학교)

Published : 2015.10.17

PDF

Download PDF

⟨ Previous Next ⟩

Abstract

연어는 둘 이상의 단어로 구성된 표현으로 연어에 속하는 개개의 단어의 의미로써 연어의 의미를 유추할 수 없다. 따라서 연어의 의미를 분석하거나 번역할 경우 개개의 단어보다는 연어 그 자체를 하나의 분석 단위로 간주하는 것이 훨씬 더 효과적이다. 이를 위해 본 논문에서는 통계기법을 활용하여 세종 말뭉치로 부터 용언연어의 추출 방법을 제시하고 그 성능을 평가한다. 연어 패턴과 통계 정보를 이용해서 연어를 추출한다. 평가를 위해서 연어 사전과 전문가의 주관적 평가를 동시에 수행했다.

Keywords

verbal collocation