Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2015.10a
- /
- Pages.121-123
- /
- 2015
- /
- 2005-3053(pISSN)
Verbal Collocation Extraction from Sejong Tagged Corpus
세종 말뭉치로부터 용언연어 추출
- Lee, Jeong-Tae (Korea Maritime and Ocean University) ;
- Cheon, Min-Ah (Korea Maritime and Ocean University) ;
- Kim, Jae-Hoon (Korea Maritime and Ocean University)
- Published : 2015.10.17
Abstract
연어는 둘 이상의 단어로 구성된 표현으로 연어에 속하는 개개의 단어의 의미로써 연어의 의미를 유추할 수 없다. 따라서 연어의 의미를 분석하거나 번역할 경우 개개의 단어보다는 연어 그 자체를 하나의 분석 단위로 간주하는 것이 훨씬 더 효과적이다. 이를 위해 본 논문에서는 통계기법을 활용하여 세종 말뭉치로 부터 용언연어의 추출 방법을 제시하고 그 성능을 평가한다. 연어 패턴과 통계 정보를 이용해서 연어를 추출한다. 평가를 위해서 연어 사전과 전문가의 주관적 평가를 동시에 수행했다.