Annual Conference on Human and Language Technology (한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리))
- 1998.10c
- /
- Pages.97-104
- /
- 1998
- /
- 2005-3053(pISSN)
An Information Extraction System Using Finite State Automata
유한 오토마타를 이용한 정보 추출 시스템의 구현 및 분석
- Oh, Hyo-Jung (Department of Computer Science, Chungnam National University) ;
- Lim, Jeong-Mook (Department of Computer Science, Chungnam National University) ;
- Lee, Mann-Ho (Department of Computer Science, Chungnam National University) ;
- Myaeng, Sung-Hyon (Department of Computer Science, Chungnam National University)
- Published : 1998.10.09
Abstract
인터넷의 사용자가 폭발적으로 증가함에 따라, 인터넷을 이용한 다양한 정보 서비스가 생성되었으며, 이로 인해 일반 사용자들이 접할 수 있는 디지털 문서의 양은 기하 급수적으로 증가 되었다. 본 논문에서는 유사한 정보를 갖는 다량의 문서들로부터 사용자가 원하는 정보만을 추출하는 정보 추출 시스템의 개발 과정 및 결과를 기술한다. 개발된 시스템은 필요한 정보를 포함하는 문장들을 걸러 낸 후, 필요한 사실정보의 출현을 나타내는 패턴을 사용한 유한 오토마타를 통하여 사용자가 원하는 정보를 추출한다. 관광지 안내 텍스트를 대상으로 한 실험 및 분석 결과를 기술한다.
Keywords