An Investigation of Automatic Term Weighting Techniques

  • Received : 1984.11.15
  • Published : 1984.12.31

Abstract

The present study has two main objectives. The first objective is to devise a new term weighting technique which can be used to weight the significance value of each word stem in a test collection of documents on the subject of "enteral hyperalimentation." The next objective is to evaluate retrieval performance of proposed term weighting technique, together with four other term weighting techniques, by conducting a set of experiments. The experimental results have shown that the performance of Sparck Jones's inverse document frequency weighting and the proposed term significance weighting techniques produced better recall and precision ratios than the other three complex weighting techniques.

본(本) 연구는 두 개의 중요한 목적(目的)들을 가지고 있다. 첫째 목적(目的)은 새로운 단어(單語) 가중기법(加重技法)을 고안하는 것이다. 두번째 목적(目的)은 제안된 단어(單語) 가중기법(加重技法)과 다른 네개의 단어(單語) 가중기법(加重技法)들의 문헌검색결과들을 평가하는 것이다. 본 연구에서 실행된 실험결과는 비교적 간단한 스파크 죤스(Sparck Jones)의 역문헌빈도 가중기법(加重技法)과 제안된 단어(單語) 가중기법(加重技法)의 검색결과들이 더 복잡한 계산을 요하는 다른 세개의 단어(單語) 가중기법(加重技法)들의 검색결과들보다 더 나았다.

Keywords