Improvement of Analysis Speed in Korean Morphological-Analyzer Using Ameliorated Dictionary

사전 성능개선을 통한 한국어 형태소분석기의 분석속도 향상

  • Kim, Young-Kwan (Department of Computer Science, Pusan National University) ;
  • Park, Min-Sik (Department of Computer Science, Pusan National University) ;
  • Choe, Jin-Suk (Department of Computer Science, Pusan National University) ;
  • Kwon, Hyuk-Chul (Department of Computer Science, Pusan National University)
  • 김영관 (부산대학교 전자계산학과) ;
  • 박민식 (부산대학교 전자계산학과) ;
  • 최진석 (부산대학교 전자계산학과) ;
  • 권혁철 (부산대학교 전자계산학과)
  • Published : 1999.10.08

Abstract

본 논문에서는 사전 구조와 탐색알고리즘을 개선하여 형태소분석기의 분석 속도를 향상시켰다. 형태소분석기의 분석시간은 사전탐색과 제약검사의 비중이 크다. 따라서 형태소분석기의 처리속도는 사전 탐색 기법에 많은 영향을 받는다. 본 논문에서는 한국어 형태소분석기에서 사용되는 사전의 탐색속도 향상과 한 문서에 나타나는 동일한 어절에 대해서 cache를 사용하여 형태소분석기의 처리 속도를 빠르게 하였다. 또한 기존의 형태소분석기에서 속도 증가를 위해 사용하는 어절-형태소분석결과 사전을 활용하여 더 발전시켰다. 본 논문에서는 어절-형태소분석결과 사전을 사용할 때, 분석 속도향상을 위한 새로운 가속기법인 '하이브리드(HyBrid)'방법을 사용하여 어절-형태소분석결과 사전의 적중률을 높였다.

Keywords