pseudo two-level model using extended longest match method in korean morphological analysis

한국어 형태소 분석에서 확장된 최장 일치법을 이용한 의사 투-레벨 모델

  • Han, Y.G. (Dept. of Computer Science, Sohae College) ;
  • Lee, K.Y. (Dept. of Computer Science, Chonbuk National University) ;
  • Lee, G.O. (Dept. of Computer Science, Sohae College) ;
  • Lee, Y.S. (Dept. of Computer Science, Chonbuk National University)
  • 한용기 (서해대학 전자계산과) ;
  • 이근용 (전북대학교 컴퓨터과학과 언어정보공학실) ;
  • 이기오 (서해대학 전자계산과) ;
  • 이용석 (전북대학교 컴퓨터과학과 언어정보공학실)
  • Published : 1999.10.08

Abstract

한국어 형태소 분석 방법 중 좌우 최장일치법은 분석 모델은 단순하지만 분석 후보의 과생성과 backtracking 발생 문제 등으로 인하여 연구가 미진하였다. 또한 Two-level 모델은 최장일치법에서 나타나는 문제점, 많은 two-level 규칙의 필요성, 그리고 중간 결과의 이용 문제로 인하여 한국어에 거의 적용되지 못하고 있다. 본 논문에서는 형태소 분석의 일반적인 모델로 알려진 Two-level 모델의 단점인 backtracking 문제와 분석 후보의 과생성 문제 그리고 중간 결과의 미사용 문제를 좌우 최장일치법을 이용하여 처리하는 방법론을 제안하고 좌우 최장일치법이 한국어 형태소 분석 방법에 효율적으로 적용될 수 있음을 제시한다.

Keywords