• 제목/요약/키워드: query expansion

검색결과 129건 처리시간 0.021초

탐색결과에 근거한 자연어질의 자동확장 및 응용에 관한 연구 고찰 (The Pragmatics of Automatic Query Expansion Based on Search Results of Natural Language Queries)

  • 노정순
    • 정보관리학회지
    • /
    • 제16권2호
    • /
    • pp.49-80
    • /
    • 1999
  • 본 연구는 자연어 비불리언 탐색에서 탐색결과에 근거하여 질의를 수정, 확장, 결합하여 검색효과를 향상시키는 시스템들을 개념모델별로 성능을 고찰하고, 성능에 영향을 끼치는 요소들을 분석하여, 이론적인 개념의 틀을 제시하였다. 용어의 가중치기법, 문헌의 순위화방법, 용어선정알고리즘, 질의확장에 사용된 문헌수와 용어수, 적합성판정정보의 출처 및 척도, 배움표본의 크기, 부적합문헌정보의 사용여부, 용어확장방법, 질의의 크기, DB의 종류와 크기 등에 의해 영향을 받는 것으로 분석되었다.

  • PDF

시맨틱 콘텐츠 검색을 위한 질의 확장 시스템 (Query Expansion System for Semantic Contents Retrieval)

  • 이무훈;최의인
    • 디지털융복합연구
    • /
    • 제10권10호
    • /
    • pp.307-312
    • /
    • 2012
  • 최근 논리적으로 표현된 지식 베이스를 사용하는 키워드 기반 검색에서 보다 더 정확한 결과를 제공하기 위해 시맨틱 검색 방법에 대한 연구가 진행되고 있다. 대부분의 사용자는 정형화된 질의어와 스키마를 사용하는 것 보다 사용자 키워드의 의미를 해석해서 사용한다. 본 논문에서는 시맨틱 검색을 위한 사용자 질의 확장을 제안한다. 제안 시스템에서는 지식 베이스와 연관 검색어를 활용한 사용자 질의 확장 콤포넌트와 사용자 질의 해석 결과를 조정하기 위한 콤포넌트를 제공한다. 마지막으로 논문에서 제안한 사용자 질의 의미 해석 기법의 검증을 위해 프로토타입 시스템의 실험 결과를 설명한다.

용어 분포 유사도를 이용한 질의 용어 확장 및 가중치 재산정 (Query Term Expansion and Reweighting using Term-Distribution Similarity)

  • 김주연;김병만;박혁로
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권1호
    • /
    • pp.90-100
    • /
    • 2000
  • 본 논문에서는 사용자의 적합 피드백을 기반으로 피드백 문서들에서 발생하는 용어들과 초기 질의와의 관련 정도를 이용하여 용어의 가중치를 산정하는 방법에 대하여 제안한다. 피드백 문서들에서 발생하는 용어들 중에서 불용어를 제외한 모든 용어들을 질의로 확장될 수 있는 후보 용어들로 선택하고 피드백 문서들에서 발생 빈도 유사성을 이용하여 초기 질의에 대한 후보 용어의 관련 정도를 산정하며, 피드백 문서들에서의 가중치와 관련 정도를 결합하여 후보 용어들의 가중치를 산정 하였다. 본 논문에서는 성능을 평가하기 위하여 KT-set 1.0과 KT-set 2.0을 사용하였으며, 성능의 상대적인 평가를 위하여 질의어를 확장하지 않은 방법, Dec-Hi방법들을 정확률-재현율을 사용하여 평가 하였다.

  • PDF

정보검색에서 웹마이닝을 이용한 동적인 질의확장에 관한 연구 (A Study on Dynamic Query Expansion Using Web Mining in Information Retrieval)

  • 황인수
    • Journal of Information Technology Applications and Management
    • /
    • 제11권2호
    • /
    • pp.227-237
    • /
    • 2004
  • While the WWW offers an incredibly rich base of information, organized as a hypertext, it does not provide a uniform and efficient way to retrieve specific information. When one tries to find information entering several query terms into a search engine, the highly-ranked pages in the result usually contain many irrelevant or useless pages. The problem is that single-term queries do not contain sufficient information to specify exactly which web pages are needed by the user. The purpose of this paper is to describe the employment of association rules in data mining for developing networks and computing associative coefficient among the terms. And this paper shows how the dynamic query expansion and/or reduction can be performed in information retrieval.

  • PDF

클래스의 개념적 분류를 이용한 개념기반 시소러스에 의한 질의 확장 (Query Expansion by Concept-based Thesaurus using conceptual classification of Class)

  • 김귀정
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.352-356
    • /
    • 2004
  • 검색 집합에 대한 정확한 지식 없이는 대부분의 사용자가 효율적인 질의 형성에 많은 어려움을 겪고 있다. 이러한 어려움을 극복하기 위한 방법 중의 하나가 초기 질의로부터 더 좋은 질의를 형성해 가는 질의 확장이다. 본 연구에서는 초기 질의의 결과로 검색된 클래스가 가지고 있는 개념을 이용하여 질의를 확장하는 개념 기반질의 확장 방법을 제안한다.

  • PDF

Department of Computer Science, Chosun University

  • Young-cheon kim;Moon, You-Mi;Lee, Sung-joo
    • 한국지능시스템학회논문지
    • /
    • 제11권7호
    • /
    • pp.659-665
    • /
    • 2001
  • Relevance feedback is the most popular query reformulation strategy in a relevance feedback cycle, the user is presented with a list of the retrieved documents and, after examining them, marks those which are relevant. In practice, only the top 10(or 20) ranked documents need to be examined. The main idea consists of selecting important terms, or expressions, attached to the documents that have been identified as relevant by the user, and of enhancing the importance of these terms in a new query formulation. The expected effect is that the new query will be moved towards the relevant documents and away from the non-relevant ones. Local analysis techniques are interesting because they take advantage of the local context provided with the query. In this regard, they seem more appropriate than global analysis techniques. In a local strategy, the documents retrieved for a given query q are examined at query time to determine terms for query expansion. This is similar to a relevance feedback cycle but might be done without assistance from the user.

  • PDF

A Study on Improving the Effectiveness of Information Retrieval Through P-norm, RF, LCAF

  • Kim, Young-cheon;Lee, Sung-joo
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제2권1호
    • /
    • pp.9-14
    • /
    • 2002
  • Boolean retrieval is simple and elegant. However, since there is no provision for term weighting, no ranking of the answer set is generated. As a result, the size of the output might be too large or too small. Relevance feedback is the most popular query reformulation strategy. in a relevance feedback cycle, the user is presented with a list of the retrieved documents and, after examining them, marks those which are relevant. In practice, only the top 10(or 20) ranked documents need to be examined. The main idea consists of selecting important terms, or expressions, attached to the documents that have been identified as relevant by the user, and of enhancing the importance of these terms in a new query formulation. The expected effect is that the new query will be moved towards the relevant documents and away from the non-relevant ones. Local analysis techniques are interesting because they take advantage of the local context provided with the query. In this regard, they seem more appropriate than global analysis techniques. In a local strategy, the documents retrieved for a given query q are examined at query time to determine terms for query expansion. This is similar to a relevance feedback cycle but might be done without assistance from the user.

개념 검색어 확장을 통해 질의 형식화를 도와주는 “개념 마법사”의 설계 및 구현 (Design and Implementation of “Concept Wizard” Supporting Query Formulation with Concept Term Expansion)

  • 강현규
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.437-444
    • /
    • 2002
  • 정보 검색 시스템이나 웹(Web)이 방대해지고 초보적 수준의 사용자들이 늘어남에 따라 간단한 조작만으로 원하는 정보를 얻어낼 수 있는 도구의 개발이 점점 중요해지고 있다. 일반적으로 정보 검색 시스템이나 검색 엔진을 통한 질의 입력 방법이나 연산자들이 매우 다양하며 일반 사용자들은 질의를 형식화 하는 것이 쉽지 않다. 본 논문은 일반 사용자가 정보 검색 시스템이나 검색 엔진을 통하여 정보를 검색하기 위한 검색어 형식화를 도와주는 개념 마법사를 제안한다. 본 논문에서 제시한 개념 마법사는 실세계 지식의 부족을 시소러스를 이용하여 인터렉티브(interactive) 하게 제시하고 웹을 기반으로 하는 플러그인(plug-in)으로 제공함으로써 유용성 및 확장성이 크다.

자연어 질의 분석과 검색어 확장에 기반한 웹 정보 검색 (Web Information Retrieval based on Natural Language Query Analysis and Keyword Expansion)

  • 윤성희;장혜진
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.235-248
    • /
    • 2004
  • 웹 문서 정색을 위해 키워드와 불리언 연산식을 사용하는 것에 비해 자연어 질의 문장을 입력하는 방법은 검색 시스템 사용자에게 훨씬 이상적인 인터페이스이다. 본 논문은 사용자가 입력하는 자연어 질의 문장을 구문 분석하고 그 구문 구조에 기반하여 검색어를 확장하는 다중 검색 기법을 제안한다. 구문 트리를 순회하여 구조적으로 연관된 복합 명사를 조합하거나 분할하는 과정을 거치고, 이형 표기 및 축약 표기 용어들에 대해 확장 다중 검색함으로써 웹 정보 검색 시스템의 재현율과 정확도를 높일 수 있다.

유사 단어 커뮤니티 기반의 질의 확장 (Query Expansion based on Word Sense Community)

  • 곽창욱;윤희근;박성배
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1058-1065
    • /
    • 2014
  • 질의 확장은 입력된 질의와 관련된 키워드를 사용자에게 제시하여 검색 활동에 도움을 주는 방법이다. 최근에는 사용자가 검색한 내용에서 군집화 방법을 이용하여 도메인을 찾고 키워드를 제시하는 연구가 많이 이루어졌다. 하지만 군집화 방법은 군집의 개수를 정해야하기 때문에 다양한 도메인을 나타내는데 적절하지 않다. 따라서 본 논문은 커뮤니티 인지 알고리즘으로 검색 문서에서 질의마다 다양한 수의 도메인을 찾고 키워드로 선택하여 제시하는 방법을 제안한다. 이를 위해 사용자가 검색한 결과 중 상위 30개 문서를 대상으로 단어를 추출하여 그래프 기반의 커뮤니티를 만들고, 각 커뮤니티에서 키워드를 추출하여 이를 질의 확장에 이용하였다. 본 논문에서 제안한 방법은 구글 검색 엔진과 검색된 문서의 tf-idf를 이용한 키워드 추천 방법과 비교하였다. 제안한 방법이 다른 비교 대상들에 비해 더 다양한 키워드를 추천할 수 있었다.