An Information Extraction System Using Finite State Automata

유한 오토마타를 이용한 정보 추출 시스템의 구현 및 분석

  • Oh, Hyo-Jung (Department of Computer Science, Chungnam National University) ;
  • Lim, Jeong-Mook (Department of Computer Science, Chungnam National University) ;
  • Lee, Mann-Ho (Department of Computer Science, Chungnam National University) ;
  • Myaeng, Sung-Hyon (Department of Computer Science, Chungnam National University)
  • 오효정 (충남대학교 컴퓨터과학과) ;
  • 임정묵 (충남대학교 컴퓨터과학과) ;
  • 이만호 (충남대학교 컴퓨터과학과) ;
  • 맹성현 (충남대학교 컴퓨터과학과)
  • Published : 1998.10.09

Abstract

인터넷의 사용자가 폭발적으로 증가함에 따라, 인터넷을 이용한 다양한 정보 서비스가 생성되었으며, 이로 인해 일반 사용자들이 접할 수 있는 디지털 문서의 양은 기하 급수적으로 증가 되었다. 본 논문에서는 유사한 정보를 갖는 다량의 문서들로부터 사용자가 원하는 정보만을 추출하는 정보 추출 시스템의 개발 과정 및 결과를 기술한다. 개발된 시스템은 필요한 정보를 포함하는 문장들을 걸러 낸 후, 필요한 사실정보의 출현을 나타내는 패턴을 사용한 유한 오토마타를 통하여 사용자가 원하는 정보를 추출한다. 관광지 안내 텍스트를 대상으로 한 실험 및 분석 결과를 기술한다.

Keywords