Comparison between Markov Model and Hidden Markov Model for Korean Part-of-Speech and Homograph Tagging

한국어 품사 및 동형이의어 태깅을 위한 마르코프 모델과 은닉 마르코프 모델의 비교

  • Shin, Joon-Choul (Dept. of Computer Engineering & Information Technology, Ulsan University) ;
  • Ock, Cheol-Young (Dept. of Computer Engineering & Information Technology, Ulsan University)
  • 신준철 (울산대학교 컴퓨터정보통신공학) ;
  • 옥철영 (울산대학교 컴퓨터정보통신공학)
  • Published : 2013.10.06

Abstract

한국어 어절은 많은 동형이의어를 가지고 있기 때문에 주변 어절(또는 문맥)을 보지 않으면 중의성을 해결하기 어렵다. 이런 중의성을 해결하기 위해서 주변 어절 정보를 입력받아 통계적으로 의미를 선택하는 기계학습 알고리즘들이 많이 연구되었으며, 그 중에서 특히 은닉 마르코프 모델을 활용한 연구가 높은 성과를 거두었다. 일반적으로 마르코프 모델만을 기반으로 알고리즘을 구성할 경우 은닉 마르코프 모델 보다는 단순하기 때문에 빠르게 작동하지만 정확률이 낮다. 본 논문은 마르코프 모델을 기반으로 하면서, 부분적으로 은닉 마르코프 모델을 혼합한 알고리즘을 제안한다. 실험 결과 속도는 마르코프 모델과 유사하며, 정확률은 은닉 마르코프 모델에 근접한 것으로 나타났다.

Keywords