Schedule Time Information Extraction System from Itemized Sentences of Korean E-mail

한국어 E-mail의 개조식 부분으로부터 일정의 시간 정보 추출 시스템

  • Published : 2010.10.08

Abstract

최근에 스마트 폰과 같은 모바일 플랫폼의 사용이 증가함에 따라, 모바일 플랫폼에서 사용자의 편의성을 증대시켜주는 시스템 및 프로그램에 대한 요구 사항이 커지고 있다. 본 논문에서는 한국어 E-mail로부터 회의 등의 일정에 관한 정보를 얻어내는 시스템 구조를 제안하고, 그 중 일정의 시간 정보에 대한 구현 및 성능을 제시한다. 본 논문에서는 일정을 서술하기 위해 필요할 것으로 생각되는 12가지의 정보 유형을 정의하였다. 또한, E-mail의 서술 형태를 개조식으로 서술된 부분과 비개조식으로 서술된 부분으로 분류하고, 개조식으로 서술된 부분에 대하여 시간과 관련된 2가지 정보를 추출 하였다. 실험 결과, 일정의 '시작 시간'에 대한 정보 추출의 경우 F-Measure 90.10% 일정의 '종료 시간'에 대한 정보 추출의 경우 F-Measure 84.07%를 달성하였다.

Keywords