• 제목/요약/키워드: 검색 적합성

검색결과 520건 처리시간 0.029초

정보 검색 과제별 동적 검색 랭킹 모델 구현 및 검증: 사용자 중심 적합성 판단 모형 평가를 중심으로 (Implementation and Verification of Dynamic Search Ranking Model for Information Search Tasks: The Evaluation of Users' Relevance Judgement Model)

  • 박정아;손영우
    • 감성과학
    • /
    • 제15권3호
    • /
    • pp.367-380
    • /
    • 2012
  • 본 연구는 정보 검색 과제별 주요 적합성 판단 기준을 실제 정보 검색 시스템으로 구현해 보고 사용자 평가를 통해 그 효과를 검증해 보고자 하였다. 이를 위해, 사용자 적합성 판단 기준들을 정보 검색 시스템에서 적합성을 결정하는 검색 랭킹 모델의 랭킹 요소들로 적용하였다. 그리고 정보 검색 과제별 차이가 있는 동적 검색 랭킹 모델과 차이가 없는 정적 검색 랭킹 모델을 시스템으로 구현하였고, 이에 대한 사용자 평가를 진행하여 비교해 보았다. 총 45명의 참가자가 실험에 참여하였고, 정보 검색 과제별 차이가 있는 동적 검색 랭킹 모델과 차이가 없는 정적 검색 랭킹 모델이 적용된 각각의 검색 시스템에서 3개의 검색 과제를 수행하였다. 3개의 정보 검색 과제로는 사실 검색 과제, 문제 해결 검색 과제, 의사 결정 검색 과제가 사용되었다. 각 참가자는 검색 결과 첫 페이지 상위 5 개의 검색 결과에 대해 적합성 정도를 7 점 척도로 평가하였다. 그 결과, 사용자는 전반적으로 모든 검색어에 동일하게 반응하는 정적 검색 랭킹 모델을 적용한 시스템보다 정보 검색 과제별로 사용자 적합성 판단기준의 변화에 따라 랭킹 요소 가중치를 달리한 동적 검색 랭킹 모델을 더 높이 평가하는 것을 확인할 수 있었다. 본 연구는 이를 통해, 정보 검색 과제를 고려한 정보 검색 시스템 디자인의 필요성과 함께, 사용자 중심 적합성 판단 모형 연구 결과를 실제 정보 검색 시스템으로 구현하여 평가함으로써 사용자 중심 적합성 연구 결과의 타당성을 검증하였다는 점, 그리고 사용자 연구 접목을 통한 시스템 개선의 중요성을 강조하였다는 점에서 의의를 가진다.

  • PDF

유사문헌집단에서 적합/부적합정보의 유용성에 관한 연구 (A Study on the Utility of Relevance/Non-relevance Information in Homogeneous Documents)

  • 문성빈
    • 정보관리학회지
    • /
    • 제32권3호
    • /
    • pp.277-293
    • /
    • 2015
  • 본 논문에서는 문헌의 적합성수준을 적합성정도에 따라 4그룹(부적합한, 조금 적합한, 적합한, 매우 적합한)으로 나눈 후 서로 다른 심사자가 적합성 판정을 내린 4개의 적합성 판정세트(A, B, C, D)에서 "조금 적합한" 문헌을 부적합문헌으로 분류했을 때와 적합문헌으로 분류하였을 때에, 초록/표제 시스템과 전문검색시스템에서 적합성피드백으로 인한 검색효율성의 증진은 어느 쪽이 더 혜택을 받게 되는 지를 연구하였다. "조금 적합한" 문헌을 적합문헌으로 포함시켰을 때 초록/표제시스템이 전문검색시스템보다 모든 적합성판정세트에서 검색효율성의 증가율이 높았고, 반면에 전문검색시스템에서는 "조금 적합한" 문헌을 적합문헌그룹에서 제외시켰을 때 검색효율성의 증가율이 일관성 있게 높아지는 것을 발견하였다. 이는 전문검색시스템에서는 적합문헌으로 포함된 "조금 적합한" 문헌으로부터 얻어지는 적합성피드백 정보는 잡음의 역할을 하게 되어 검색효율성의 증진에 도움이 안 되고 있음을 암시하고 있다. 특히, 매우 동질적인 문헌을 색인 및 검색대상으로 하고 있는 전문검색시스템에서는 잡음에 의해 초래되는 낮은 정확률을 개선하는 정교한 검색기법에 대한 연구가 지속되어야만 한다.

한국어 정보검색 시스템을 위한 다양한 적합성 피드백 방법의 실험 (Relevance Feedback Experiments for Korean Information Retrieval Systems)

  • 박수현;권혁철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권5호
    • /
    • pp.682-691
    • /
    • 1999
  • 정보검색 시스템의 검색 효율 향상을 위해서 다양한 적합성 피드백 방법이 개발되었다. 그러나 한국어 정보검색 시스템을 위한 적합성 피드백에 대한 연구는 거의 이루어지지 않은 실정이다. 이 논문에서는 기존에 개발된 적합성 피드백 방법을 한국어 정보 시스템에 적용하여 검색 효율을 비교하고, 새로운 적합성 피드백 방법을 개발 적용하여 기존의 방법들과 검색 효율을 비교분석하였다. 적합성 피드백은 원질의문을 확장할 단어 선택과 선택된 단어 가중치 부여로 이루어진다. 원질의문이 입력되면 검색된 적합문서에서 원질의문을 단어와 밀접한 관계가 있는 단어를 선택하기 위하여 가중치를 부가한후, 원질의문에 추가하여 질의문을 확장한다. 이 논문에서는 원질의문 확장을 위한 단어 선택과 단어 가중치 부여를 위해 3가지 값을 사용한다. 첫째, TF는 적합문서 내의 단어 빈도의 총합이다. 둘째, idf는 해당 문서집단의 역문헌빈도이다. 셋째, r/R은 검색된 적합문서 중에서 해당단어가 있는 적합문서의 비율을 나타낸다. TF와 idf는 정보검색 시스템에서 일반적으로 사용되고있는 값이고 r/R은 이 논문에서 제안한 새로운 값이다.

TAG 정보를 활용한 기업검색의 적합성 향상 기법에 관한 연구 (A Study on the Relevance Improvement of Enterprise Search using Tag Information)

  • 손태식;박병섭;최효현
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권12호
    • /
    • pp.101-108
    • /
    • 2010
  • 기업에서 업무 시스템들을 활용하여 업무를 진행하다 보면 기하급수적으로 증가하는 정보를 얼마나 신속하고 정확하게 사용자에게 제공할 수 있는가 하는 것이 기업 경쟁력의 중요한 요소이다. 검색 적합성 향상을 통한 양질의 검색 결과 제공은 기업 경쟁력의 중요한 요소가 되었으며, 가치 있고 효율적인 검색 서비스 제공을 위해 검색엔진에서 제공하는 단순한 검색 서비스 이상을 제공하는 것이 필요하다. 본 논문에서는 검색 과정에서 Tag 정보와 그 가중치 값을 활용하여 검색 적합성을 향상 시키는 방안에 대해서 연구함으로써 검색엔진에서 제공하는 검색 적합성의 한계를 극복하는 방안을 제안한다. 또한, 제안된 방법에 대한 검색 성능을 비교하기 위해서 제안 기법을 기존 웹 검색 서비스에서 제공하는 검색결과와의 적합성 평가 및 연관 검색어와 비교함으로써 우수성을 검증하였다.

확률적 정보 검색 모델에서의 유사 적합성 피드백 실험 (Experiments on Pseudo Relevance Feedback in Probabilistic Information Retrieval Model)

  • 조봉현;이창기;안주희;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-190
    • /
    • 2001
  • 본 논문은 확률기반 자연어 검색 시스템 POSNIR/E를 이용한 여러 가지 유사 적합성 피드백 방법들이 검색 시스템의 성능 향상에 기여할 수 있는 정도를 보여주고, 확률 기반 정보 검색 시스템에 적합한 유사 적합성 피드백 수행 방법을 제시한다. POSNIR/E는 한국어 자연어 검색 시스템, POSNIR를 기반으로 만들어진 영어 자연어 검색 시스템이다. 이 시스템은 성능 향상을 위한 질의 확장의 방법으로 검색 단계에서 유사 적합성 피드백을 사용한다. 검색 단계에서 영어 태거에 의해 태깅된 사용자 질의로부터 질의어를 추출하고 초기 검색을 수행한다. 유사 적합성 피드백을 위하여 초기 검색 결과 중 상위 5개의 문서에 나타나는 키워드를 중요도에 따라 내림차순 정렬하여 상위 10개의 키워드를 초기 질의어에 확장한다. 이렇게 확장된 질의어로 최종 검색을 수행한다. TREC 평가용 테스트 컬렉션 WT10g와 TREC-9의 질의 적합문서 집합을 이용하여 여러 가지 TSV 함수를 사용하여 검색 성능을 평가 하였다. 실험 결과 유사 적합성 피드백을 사용할 경우 TSV 함수에 확률 모델의 CF 요소 뿐만 아니라 TF 요소 등을 적용 시킬 경우 성능 향상에 기여할 수 있음을 알 수 있었다. 또한 색인어와 검색어로 단일어 뿐만 아니라 복합어도 사용할 경우 성능이 향상됨을 알 수 있다.

  • PDF

질의분해 적합성 피드백을 이용한 검색시스템의 성능 증진에 관한 연구 (A Study on Improving the Effectiveness of Retrieval System Using Query Splitting Relevance Feedback)

  • 김영천;박병권;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2001년도 춘계학술대회 학술발표 논문집
    • /
    • pp.231-235
    • /
    • 2001
  • 순수한 부울 검색 시스템은 문서와 질의 사이의 유사도를 나타내는 문서값을 계산할 수 없기 때문에, 검색된 문서들을 질의를 만족하는 정보에 따라 정렬할 수 없다. 부울 검색 시스템의 이러한 단점을 보완하는 방법으로 MMM 모델, Paice 모델, P-norm 모델이 개발되었다. 본 논문에서는 높은 검색 효과를 제공하는 질의분해 적합성 피드백(QSRF) 모델을 제안한다. 질의 분해 적합성 피드백 모델의 연산 특성이 MMM, Paice, P-norm 모델보다 우수함을 설명하고, 또한 성능 비교를 통하여 이를 입증한다.

  • PDF

정보검색에서의 사용자 중심 적합성 판단 모형 (User-centered relevance judgement model for information retrieval)

  • 박정아;손영우
    • 감성과학
    • /
    • 제12권4호
    • /
    • pp.489-500
    • /
    • 2009
  • 본 연구는 정보검색의 핵심 개념인 적합성을 사용자 중심 관점에서 접근한 연구이다. 적합성에 관한 기존 연구들은 적합성 판단에 영향을 주는 다양한 기준들을 정의해 왔다. 본 연구는 적합성 유형별로 사용자가 적합성을 판단하는 기준과 적합성 유형 간의 관계를 정보 검색 과제별로 연구함으로써 사용자 중심 적합성 판단 모형을 알아보았다. 본 연구는 7개의 사용자 적합성 판단 기준-주제성, 신선성, 신뢰성, 이해가능성, 특수 성, 구체성, 흥미성-과 3가지의 사용자 적합성 유형-인지 적합성, 상황 적합성, 정서 적합성-을 고려하였다. 이를 대학생 사용자들을 대상으로 검색 과제 수행 후 설문에 답하는 반 제어(semi-controlled) 설문 방법을 이용하여 자료를 수집하였고, 구조방정식 모형으로 분석하였다. 연구 결과 주제성, 신뢰성은 모든 검색 과제에 중요한 적합성 판단 기준이었고, 과제 유형별로 볼 때 사실 검색 과제에서는 주제성, 신뢰성, 신선성, 구체성, 흥미성이, 문제 해결 검색 과제에서는 주제성, 신뢰성, 이해가능성, 특수성이, 의사 결정 검색 과제에서는 주제성, 신뢰성, 신선성, 이해가능성, 구체성, 특수성, 흥미성이 적합성을 판단하는 주요 기준들이라는 것을 확인할 수 있었다. 또한 적합성 유형들 간의 관계도 실증적으로 밝힐 수 있었다. 본 연구는 적합성 판단 기준과 적합성 유형 간의 관계를 정보 검색 과제별로 확인함으로써 보다 구체적인 사용자 중심의 적합성 판단 모형을 확립하였다는 점에서 의의를 가진다.

  • PDF

상이한 적합성 판정과 전문검색시스템의 평가에 관한 연구 (Variations in relevance assessments and evaluation of the performance of full-text retrieval system)

  • 문성빈
    • 정보관리학회지
    • /
    • 제14권2호
    • /
    • pp.123-141
    • /
    • 1997
  • 본 논문에서는 문헌의 전문을 대상으로 얻어진 4개의 상이한 적합성 판정 세트가 전문검색시스템의 검색효율성 평가에 미치는 영향을 살펴보았다. 각 적합성 판정 세트간의 검색효율성에는 주목할 만한 차이가 없는 것으로 밝혀졌다. 이는 적합성 개념에 대한 다양한 관점이 검색효율성의 평가에는 커다란 영향을 미치지 못하고 있음을 암시하는 것이다. 그러나, 적합성 정보를 효과적으로 이용하는 정교한 검색기법인 적합성 피이드백을 통합한 검색실험은 계속 연구되어야 할 과제로 제시하고 있다.

  • PDF

피드백 정보를 이용한 불논리 검색 시스템의 성능 증진에 관한 실험적 연구 (A study on improving the effectiveness of a boolean retrieval system with feedback information)

  • 신은자;정영미
    • 정보관리학회지
    • /
    • 제15권1호
    • /
    • pp.129-148
    • /
    • 1998
  • 본 연구의 목적은 기존의 불논리 검색 시스템에서 사용할 수 있는 실용적인 피드백 검색 기법을 찾아내는 것으로서, 이용자의 적합성 평가 부담을 덜어줄 수 있도록 사전에 이용자 모형을 구축하여 놓고 피드백 검색시 시스템이 자동으로 적합성 평가를 하는 이용자 모형 기반 피드백 검색 기법을 제안하고 이의 유용성을 실험적으로 입증하였다. 이를 위하여 먼저 증진된 불논리 검색 모형인 DNF 검색 모형과 P-norm 검색 모형을 사용한 피드백 검색 실험을 실시한 후, 검색효율이 높게 나온 DNF 모형을 채택하여 이용자 모형 기반 피드백 검색을 실시하였다. 실험 결과 모든 피드백 검색은 초기검색에 비해 검색효율이 크게 향상되었으며, 이용자 모형 기반 피드백 검색은 DNF 피드백 검색 결과에는 못미치지만 P-norm 피드백 검색 결과와는 거의 같은 수준의 검색효율을 보였다.

  • PDF

적합성 가중치 검색 및 P-NORM 검색에 관한 연구 -불 논리 검색의 개선을 중심으로- (A Comparative Analysis of the Relevance Weighted Boolean Model and the P-NORM Model: An Improvement on the Boolean Retrieval)

  • 이효숙
    • 정보관리학회지
    • /
    • 제11권1호
    • /
    • pp.31-56
    • /
    • 1994
  • 본 연구에서는 검색실험을 통하여 질문 변환에 의한 불 논리 검색, 적합성 가중치 검색, P-NORM 검색에 대해 평가하였다. 적합성 가중치 검색은 질문 변환에 의한 불 논리 검색 및 P-NORM 검색보다 정확률과 검색순위에 있어 효과적이었다. 정보 탐색과정에서 적합성 정보의 이용수준과 용어에 대한 가중치방법은 검색성능에 영향을 주는 것으로 밝혀졌다.

  • PDF