The Ecology of the Scientific Literature and Information Retrieval (II)

  • Received : 1985.09.10
  • Published : 1986.06.30

Abstract

This research deals with the problems encountered in designing systems for more efficient and effective information retrieval used in the proliferation of literature. This research was designed to develop and test 1) the partitioning a large bibliographic data base into quality oriented subsets (quality filtering), and 2) a system for effective and efficient Information retrieval within subsets of data base (relevance). In order to accomplish this partitioning, the 'kernel' technique of graph theory was applied. In addition, a method of quality filtering utilizing the 'epidemic' theory and the 'obsolescence' of scientific literature was developed.

본 논문은 좀 더 효율적이고 효과적인 정보 시스팀을 개발하고자 다음 두가지 가설을 제시하였다. 1) 인용 문헌 분석을 통하여 인용빈도가 높고 시간의 흐름에 따른 인용율이 증가하는 문헌은 그 문헌적 가치가 상대적으로 높다(Quality Filtering). 2) 정보 검색에 있어서 확률이론을 통한 문헌간의 상관관계를 규명짓는 클러스터링 기법이 재현율과 정확율을 모두 증가시킬 수 있다(Clustering Technique). 실제로 고프만(Goffman)의 전염성 이론의 미시적 웅용(Micro-epidemic process)은 데이타 베이스 내에서의 문헌의 질적 여과(Quality Filtering)을 위한 한 기법으로서 좋은 경과를 얻어냈으며 많은 정보를 이런 식으로 여과시킴으로써 정보 검색 시스팀의 효율성 또한 높일 수 있었다. 한편, 질적 여과를 거친 소규모 데이터 베이스 내에서 클러스터링 기법에 의한 정보 검색 효율은 수학의 커널 기법(Kernel Technique)의 활용으로 높은 재현율과 정확율을 나타냈을 뿐만 아니라 검색의 폭에 있어서도 많은 융통성을 제시하여 주었다.

Keywords