Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 2013.10a
- /
- Pages.9-12
- /
- 2013
- /
- 2005-3053(pISSN)
Semi-CRF or Linear-chain CRF? A Comparative Study of Joint Models for Korean Morphological Analysis and POS Tagging
Semi-CRF or Linear-Chain CRF? 한국어 형태소 분할 및 품사 태깅을 위한 결합 모델 비교
- Na, Seung-Hoon (Natural Language Processing Laboratory Electronics and Telecommunication Research Institute) ;
- Kim, Chang-Hyun (Natural Language Processing Laboratory Electronics and Telecommunication Research Institute) ;
- Kim, Young-Kil (Natural Language Processing Laboratory Electronics and Telecommunication Research Institute)
- Published : 2013.10.06
Abstract
본 논문에서는 한국어 형태소 분할 및 품사 태깅 방법을 위한 결합 모델로 Semi-CRF와 Linear-chain CRF에 대한 초기 비교 실험을 수행한다. Linear-chain방법은 출력 레이블을 형태소 분할 정보와 품사 태그를 조합함으로써 결합을 시도하는 방식이고, Semi-CRF는 출력의 구조가 분할과 태깅 정보를 동시에 포함하도록 표현함으로써, 디코딩 과정에서 분할과 태깅을 동시에 수행하는 방법이다. Sejong품사 부착말뭉치에서 비교결과 Linear-chain방법이 Semi-CRF방법보다 우수한 성능을 보여주었다.