정보추출 기법을 이용한 서열정보분석 데이터베이스 구축 시스템 설계

System Design for Building Sequence Information Analysis Databases using Information Extraction Techniques

  • 이선아 (충북대학교 컴퓨터학과, 첨단정보기술연구센터) ;
  • 전중남 (충북대학교 컴퓨터학과, 첨단정보기술연구센터) ;
  • 이건명 (충북대학교 컴퓨터학과, 첨단정보기술연구센터)
  • 발행 : 2002.10.01

초록

인터넷의 확산과 첨단기술의 발달로 생물학 정보에 대한 온라인 데이터베이스 집합이 급속히 증가하고 있으나, 데이터의 양이 방대하고 이질적인 형태로 제공되기 때문에 실제 현장의 생물학 연구자들이 쉽게 이용하는데는 여러 가지 어려움이 있다. 이 논문에서는 단백질과 핵산 정보를 제공하는 대표적인 온라인 데이터베이스인 NCBL에, 질의를 하여 얻어진 데이터를 포함한 웹 문서로부터, 정보를 추출하여 사용자의 목적에 적합한 맞춤형 데이터베이스를 구축하는 시스템을 제안한다. 온톨로지를 이용하여 질의 처리를 하며, 웹 문서에 대한 정보추출 기법과 계층구조에 따른 유형별 저장방식을 통해 데이터베이스를 구축한다. 한편, 데이터 추출을 위해 식별 및 분류 작업을 수행한다. 제안한 시스템은 서열정보를 분석하는 생물학자들에게 관심대상 정보를 추출하여 맞춤형 데이터베이스를 구축함으로써, 손쉽게 서열정보 분석을 지원하도록 하는데 목적이 있다.

키워드