• 제목/요약/키워드: MEDLARS

검색결과 6건 처리시간 0.016초

질의 재구성 알고리즘의 검색성능을 측정하기 위한 새로운 평가 방법의 개발 (Development of New Retieval Performance Measures for Query Reformulation Algorithms)

  • 김남호
    • 한국정보처리학회논문지
    • /
    • 제4권4호
    • /
    • pp.963-972
    • /
    • 1997
  • 정보 검색에서 대부분의 질의 재구성 알고리즘들은 초기 입력 문서나 피드백 문을 이용 하여 질의를 재구성하므로, 질의 재구성 알고리즘의 검색 성능은 입력되는 문서들의 질 에 따라 달라진다. 본 연구에서는 질의 재구성 알고리즘의 입력 문서에 대한 성능 감도를 새로운 검색성능 평가방법을 개발하여 분석하였다. 또한 CIRA라고 불리는 새로운 평가기준을 개발하여 질의 재구성 사이의 성능 변화추이를 분석하였다. 세가지의 질의 재구성 알고리즘(질의나무 (query tree), DNF 방법, Dillon 방법)의 감도와 성능변화를 테시트 세트인 CACM, CISI, Medlars 상에서 분석하였다. 세 실험에서 질의나무가 가장 작은 CIRA를 취득했으며, 감도 분석에서는 비록 다른 알고리즘과 차이는 적으나 가장 높은감도를 나타냈다.

  • PDF

불리언 질의 재구성에서 의사결정나무의 학습 성능 감도 분석 (Sensitivity Analysis of Decision Tree's Learning Effectiveness in Boolean Query Reformulation)

  • 윤정미;김남호;권영식
    • 한국경영과학회지
    • /
    • 제23권4호
    • /
    • pp.141-149
    • /
    • 1998
  • One of the difficulties in using the current Boolean-based information retrieval systems is that it is hard for a user, especially a novice, to formulate an effective Boolean query. One solution to this problem is to let the system formulate a query for a user from his relevance feedback documents in this research, an intelligent query reformulation mechanism based on ID3 is proposed and the sensitivity of its retrieval effectiveness, i.e., recall, precision, and E-measure, to various input settings is analyzed. The parameters in the input settings is the number of relevant documents. Experiments conducted on the test set of Medlars revealed that the effectiveness of the proposed system is in fact sensitive to the number of the initial relevant documents. The case with two or more initial relevant documents outperformed the case with one initial relevant document with statistical significances. It is our conclusion that formulation of an effective query in the proposed system requires at least two relevant documents in its initial input set.

  • PDF

Interactive Information Retrieval: An Introduction

  • Borlund, Pia
    • Journal of Information Science Theory and Practice
    • /
    • 제1권3호
    • /
    • pp.12-32
    • /
    • 2013
  • The paper introduces the research area of interactive information retrieval (IIR) from a historical point of view. Further, the focus here is on evaluation, because much research in IR deals with IR evaluation methodology due to the core research interest in IR performance, system interaction and satisfaction with retrieved information. In order to position IIR evaluation, the Cranfield model and the series of tests that led to the Cranfield model are outlined. Three iconic user-oriented studies and projects that all have contributed to how IIR is perceived and understood today are presented: The MEDLARS test, the Book House fiction retrieval system, and the OKAPI project. On this basis the call for alternative IIR evaluation approaches motivated by the three revolutions (the cognitive, the relevance, and the interactive revolutions) put forward by Robertson & Hancock-Beaulieu (1992) is presented. As a response to this call the 'IIR evaluation model' by Borlund (e.g., 2003a) is introduced. The objective of the IIR evaluation model is to facilitate IIR evaluation as close as possible to actual information searching and IR processes, though still in a relatively controlled evaluation environment, in which the test instrument of a simulated work task situation plays a central part.

불리언 질의 구성 알고리즘의 시간복잡도 분석 (Time Complexity Analysis of Boolean Query Formulation Algorithms)

  • 김남호
    • 한국정보처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.709-719
    • /
    • 1997
  • 알고리즘의 성능은 여러 측면에서 측정할 수 있다 하나의 질의 구성(Quvery Formulaiton)알고리즘이 개발되었다고 가정할때, 이 알고리즘 검색 성능의 효과과성 (재현율과 정확율)이 다른 알고리즘에 비해 우수하다하였도 질의 작성 시간적인 측면, 즉 효율성에서 다른 알고리즘에 뒤진다면 모든 면에서 우수하다고 평가하기 어렵다.본 연구에서는 질의나무(Query tree)라고 불리는 자동 질의 재구성 알고리즘과 다른 2개의 알고리즘(DNF method,Dilon's method)을 이론적 측면과 실시간 측정에 Sun SparcsStation 2를 이용하여 비교하여 보았다. 3가지 Test set 인 CACM,CISI,그리고 Medlars을 이용하여 실험한 질과 질의나무 알고리즘이 이론적, 실시간 측면 모두에서 가장빠른 알고리즘이라는 결과가 나왔다.

  • PDF