PC Cluster-based Parallel Korean Information Retrieval System

PC 클러스터 기반 병렬 한국어 정보검색 시스템

  • 김진혁 (부산대학교 정보컴퓨터 공학부) ;
  • 장한국 (부산대학교 정보컴퓨터 공학부) ;
  • 최참아 (부산대학교 정보컴퓨터 공학부) ;
  • 류광렬 (부산대학교 정보컴퓨터 공학부) ;
  • 정상화 (부산대학교 정보컴퓨터 공학부) ;
  • 권혁철 (부산대학교 정보컴퓨터 공학부)
  • Published : 1999.10.01

Abstract

대용량의 정보를 다루는 정보검색 시스템은 정보 처리 과정에서 디스크 접근 시간이 큰 오버헤드로 작용한다. 본 논문에서는 단일 기계에서 작동하는 정보검색 시스템이 가지는 이러한 문제점을 해결하기 위해 PC 클러스터 기반 정보검색 시스템을 구현하였다. 색인어 간의 동시 등장 빈도 정보를 이용한 Greedy De-clustering 알고리즘으로 클러스터에 색인어 역파일을 병렬 분산하여 저장하고, SCI 기반의 효율적인 통신 시스템을 구축하여 클러스터 노드간의 통신이 원활하게 하였다. 따라서 사용자 질의어를 처리할 때 질의어별로 가져오는 색인어 역파일의 디스크 접근 시간이 감소하는 효과를 얻을 수 있었으며, 기존의 단일 기계에서 수행되는 정보 검색 시스템보다 수행속도가 2.3배 빠른 시스템을 구현하였음을 실험을 통해 확인하였다.

Keywords