한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리) (Annual Conference on Human and Language Technology)
- 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
- /
- Pages.133-139
- /
- 2006
- /
- 2005-3053(pISSN)
어휘별 분류기를 이용한 한국어 품사 부착의 성능 향상
Improving Korean Part-of-Speech Tagging Using The Lexical Specific Classifier
- Choi, Won-Jong (Natural Language Processing Lab., Korea University) ;
- Lee, Do-Gil (NLP Development Team, NHN corp.) ;
- Rim, Hae-Chang (Natural Language Processing Lab., Korea University)
- 발행 : 2006.10.13
초록
한국어 형태소 분석 및 품사 부착을 위해 지금까지 다양한 모델들이 제안이 되었으며 어절단위 평가로 95%를 넘는 성능을 보여주는 자동 태거가 보고 되었다. 하지만 형태소 분석 및 품사 부착은 모든 자연어처리 시스템의 성능에 큰 영향을 미치므로 작은 오류도 중요하다. 본 연구에서는 대상 어절의 주변 형태소의 어휘와 품사 자질, 그리고 어절 자질을 이용하여 분류기를 학습한 후 자동 태거의 품사 부착 결과를 입력으로 받아 후처리 하는 어휘별 분류기를 제안한다. 실험 결과 어휘별 분류기를 이용한 후처리만으로 어절단위 평가 6.86%
키워드