A Reasearch on Signature File Methods for Korean Text Retrieval

한글 텍스트 검색을 위한 요약 화일 기법에 관한 연구

  • Song, Byoung-Ho (Database Lab., Dept. of Computer Eng., Seoul Nat'l University) ;
  • Lee, Suk-Ho (Database Lab., Dept. of Computer Eng., Seoul Nat'l University)
  • 송병호 (서울대학교 컴퓨터공학과 데이터베이스연구실) ;
  • 이석호 (서울대학교 컴퓨터공학과 데이터베이스연구실)
  • Published : 1991.10.18

Abstract

텍스트에 대한 내용 본위 검색 기법으로서 요약 화일(signature file) 기법은 역화일(inverted file)이 허용되지 않을 때 매우 유용하다. 그러나 한글은 영문과 달리 어절의 형성이 복잡하고 띄어쓰기 형태가 고정되지 않음에 따라 기존의 단어 위주 영문 본위 요약 화일 기법을 그대로 적용시킬 수 없다. 본 논문에서는 이를 위하여 띄어쓰기를 무시하고 중복된 2음절 패턴을 도출하여 요약 화일을 구성, 검색하는 기법을 제안한다. 이 기법은 일본어, 중국어 등 비슷한 문제를 가진 외국어에도 적용될 수 있다.

Keywords