Morpheme Segmentation and Part-Of-Speech Tagging Using Restricted Resources

제한된 자원을 사용한 한국어 형태소 분석

  • Kang, Sangwoo (Sogang University, Department of Computer science and Engineering) ;
  • Yang, Jaechul (Sogang University, Department of Computer science and Engineering) ;
  • Kim, Harksoo (Kangwon University, Program of Computer and Communications Engineering) ;
  • Seo, Jungyun (Sogang University, Department of Computer science and Engineering)
  • 강상우 (서강대학교, 컴퓨터공학과) ;
  • 앙재철 (서강대학교, 컴퓨터공학과) ;
  • 김학수 (강원대학교, 컴퓨터정보통신공학과) ;
  • 서정연 (서강대학교, 컴퓨터공학과)
  • Published : 2012.10.06

Abstract

한국어 형태소 분석 및 품사 부착에 대한 연구는 지속적으로 이루어져 왔으며 규칙 기반 방법, 통계 기반 방법 등을 중심으로 연구되었다. 본 논문에서는 최근 활용도가 높아지고 있는 모바일 기기에 적합한 한국어 형태소 분석 및 품사 부착 방법을 제안한다. 모바일 기기는 계산 처리 능력과 사용 가능한 메모리가 제한되기 때문에 전통적인 방법을 사용하여 형태소 분석 및 품사 부착을 수행하기에는 한계가 있다. 본 논문에서는 기존의 규칙 기반 형태소 분석 방법인 좌최장일치법을 변형하여 형태소 분석을 수행 하고, 통계적인 방법인 hidden Markov model 을 축소하여 형태소 품사 부착을 수행한다. 제안하는 방법은 기존의 hidden Markov model을 사용한 시스템과 유사한 성능을 보여주며 모바일 기기에 적합하도록 소량의 메모리 사용과 월등히 빠른 속도로 형태소 분석 및 품사 부칙을 수행할 수 있다.

Keywords