Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2006.10e
- /
- Pages.133-139
- /
- 2006
- /
- 2005-3053(pISSN)
Improving Korean Part-of-Speech Tagging Using The Lexical Specific Classifier
어휘별 분류기를 이용한 한국어 품사 부착의 성능 향상
- Choi, Won-Jong (Natural Language Processing Lab., Korea University) ;
- Lee, Do-Gil (NLP Development Team, NHN corp.) ;
- Rim, Hae-Chang (Natural Language Processing Lab., Korea University)
- Published : 2006.10.13
Abstract
한국어 형태소 분석 및 품사 부착을 위해 지금까지 다양한 모델들이 제안이 되었으며 어절단위 평가로 95%를 넘는 성능을 보여주는 자동 태거가 보고 되었다. 하지만 형태소 분석 및 품사 부착은 모든 자연어처리 시스템의 성능에 큰 영향을 미치므로 작은 오류도 중요하다. 본 연구에서는 대상 어절의 주변 형태소의 어휘와 품사 자질, 그리고 어절 자질을 이용하여 분류기를 학습한 후 자동 태거의 품사 부착 결과를 입력으로 받아 후처리 하는 어휘별 분류기를 제안한다. 실험 결과 어휘별 분류기를 이용한 후처리만으로 어절단위 평가 6.86%
Keywords