다국어를 지원하는 XML 문서 검색 시스템: HyREX

HyREX: Universal XML Retrieval Engine for XML

  • 한예지 (호서대학교 컴퓨터공학과) ;
  • 채종대 (호서대학교 컴퓨터공학과) ;
  • 김수희 (호서대학교 컴퓨터공학과)
  • Han, Ye-Ji (Department of Computer Engineering, Hoseo University) ;
  • Chae, Jong-Dae (Department of Computer Engineering, Hoseo University) ;
  • Kim, Su-Hee (Department of Computer Engineering, Hoseo University)
  • 발행 : 2002.11.15

초록

HyREX는 연구용 프로토타입 XML 하이퍼미디어 문서 검색시스템으로 다국어를 지원하고 있다. HyREX는 검색을 위한 효율적인 접근 경로들을 처리하는 물리적 계층 HyPath와 질의어를 처리하는 논리적 계층 XIRQL 그리고 사용자 인터페이스인 HyGate 계층으로 이루어져 있다. 이 연구에서는 영어와 독일어 등의 검색을 지원하는 기존의 HyREX 시스템을 한글 XML 문서 검색시스템으로 확장하기 위해 먼저 한글 데이터타입을 위한 클래스를 구현하였다. 앞으로 한글 XML 문서 검색에서 정확율과 재현율을 향상하기 위해 각 문서의 인덱스에 대해 $tf{\cdot}idf$ 공식을 이용하여 가중치를 부여하고 이를 개발하고자 한다.

키워드