• 제목/요약/키워드: Query Expansion

검색결과 131건 처리시간 0.025초

질의확장에 의한 단락검색의 성능 향상에 관한 연구 (A Study on the Improvement of Retrieval Performance Query Expansion in Passage-based Retrieval)

  • 박지연;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.143-148
    • /
    • 2001
  • 본 연구에서는 공기기반 질의-용어간 유사도를 이용한 질의확장을 통해 단락검색의 성능을 향상시키는 방안을 제시하고자 하였다 실험을 통해 전체 문헌집단에 출현한 용어들의 공기정보에 기반한 전역적 질의확장과 이용자의 피드백 없이 초기검색 결과 중 상위 10개 문헌에 출현한 용어들의 공기정보에 기반한 지역적 질의확장의 성능을 비교하고 각각의 성능을 향상시키는 방법을 모색하였다. 마지막으로 문헌집단의 전역 정보와 지역 정보를 함께 이용하는 방안을 제시하고 그 성능을 평가하였다.

  • PDF

XML 문서선별과 질의확장을 위한 자동화 모듈 개발 (XML Document Selection and Query Expansion Modules)

  • 김명숙;권혁돈;공용해
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2004년도 춘계학술발표대회논문집
    • /
    • pp.455-458
    • /
    • 2004
  • 본 연구는 다양한 형식을 가지는 XML 문서의 효율적인 정보검색을 위한 다음과 같은 자동화 모듈들을 개발하였다 구현된 모듈은 XML 문서를 획득하는 문서추출 모듈, 온톨로지를 이용한 포괄적 DTD 생성 모듈 생성된 포괄적 DTD와 XML 파서를 이용하여 정보검색 대상 XML 문서를 사전에 선별하는 문서여과 모듈, XML 질의를 확장하는 질의확장 모듈, JDOM의 XPath를 이용한 질의엔진 모듈로 구성된다. 이와 같이 구현한 모듈들을 샘플 XML 문서에 적용하여 XML 문서추출, DTD 생성, 문서여과, 질의확장, 질의엔진의 효과를 실험하였다.

  • PDF

Enhancing the Narrow-down Approach to Large-scale Hierarchical Text Classification with Category Path Information

  • Oh, Heung-Seon;Jung, Yuchul
    • Journal of Information Science Theory and Practice
    • /
    • 제5권3호
    • /
    • pp.31-47
    • /
    • 2017
  • The narrow-down approach, separately composed of search and classification stages, is an effective way of dealing with large-scale hierarchical text classification. Recent approaches introduce methods of incorporating global, local, and path information extracted from web taxonomies in the classification stage. Meanwhile, in the case of utilizing path information, there have been few efforts to address existing limitations and develop more sophisticated methods. In this paper, we propose an expansion method to effectively exploit category path information based on the observation that the existing method is exposed to a term mismatch problem and low discrimination power due to insufficient path information. The key idea of our method is to utilize relevant information not presented on category paths by adding more useful words. We evaluate the effectiveness of our method on state-of-the art narrow-down methods and report the results with in-depth analysis.

정보 검색을 위한 용어 분표 임계치 모델 (Term Distribution Threshold Models for Information Retrieval)

  • 임재현;민태홍
    • 한국정보처리학회논문지
    • /
    • 제7권5호
    • /
    • pp.1482-1490
    • /
    • 2000
  • With the increasing availability of information in electronic form, it becomes more important and feasible to have automatic methods to retrieve relevant information in the Internet. A deficiency of traditional information retrieval systems is that search terms are often different from those indexed by the systems. Thus, users ma either retrieve wrong information or miss what they really want. In this paper, e used an automatic query expansion based expansion based on term distribution to enhance the performance of information retrieval. Also this thesis proposed the method for setting the threshold according to area distribution in order choose additional terms.

  • PDF

패싯(Facet)을 이용한 과학기술분야 시소러스 구축과 활용방안 (Building Thesaurus for Science & Technology Domain Using Facets and Its Application to Inference Services)

  • 황순희;정한민;성원경
    • 정보관리연구
    • /
    • 제37권3호
    • /
    • pp.61-84
    • /
    • 2006
  • 본 논문은 시소러스 구축 시 직면하는 문제점과 구축방법을 비판적으로 검토하고, 여러 가지 구축 방법 중 직접구축 방법을 제안하였다. 또한, 확장검색의 효율성을 보장할 수 있는 시소러스 구축을 위해 의미적 준거인 개념패싯, 관계패싯 등의 도입과 활용을 도입하였으며, 이를 이용하여 구축한 과학기술분야 시소러스의 구축사례를 제시하였다. 특별히, 패싯이 반영된 시소러스에는 다양한 관점이 반영될 수 있으므로 검색의 효율성이 보장된다는 장점이 있고, 인접 과학기술분야에 응용될 수 있다. 일례로 본 시소러스는 과학기술 연구자들의 협업을 지원하기 위한 정보유통 서비스에 응용될 수 있으며, 향후 고도화된 지식 서비스에도 확장 응용될 수 있다.

지식기반 의미 메타 검색엔진 (Knowledge-based Semantic Meta-Search Engine)

  • 이인근;손세호;권순학
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.737-744
    • /
    • 2004
  • 웹으로부터 사용자가 원하는 정보에 잘 부응하는 정보를 추출하는 것은 검색엔진이 갖추어야 할 기본적 요소라 할 수 있다. 그러나 질의어와의 패턴 매칭 방식에 의존하는 기존의 대부분의 검색엔진은 질의어가 갖는 애매성으로 인하여 사용자의 요구에 부합하는 검색결과를 제공하기가 쉽지 않다는 단점을 지니고 있다. 이를 극복하기 위하여 본 논문에서는 다음과 같은 5가지 과정, 즉, (i) 질의어 형성, (ii) 질의어 확장, (iii) 검색, (iv) 순위 재생성 및 (v) 지식베이스로 구성되는 지식기반 의미 메타 검색엔진의 기본 구조를 제안한다 영어로 구현된 웹 문서에 대한 모의실험을 통하여 본 논문에서 제안된 지식기반 의미 메타 검색엔진이 기존의 검색엔진(구글)을 사용하여 얻은 결과보다 좋은 결과를 보임을 확인할 수 있었다.

U-WIN 기반의 의미적 정보검색 기술 (Semantic Information Retrieval Based on User-Word Intelligent Network)

  • 임지희;최호섭;옥철영
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.547-550
    • /
    • 2006
  • 사용자가 원하는 정보를 얼마나 정확하게 제시하느냐가 정보검색시스템 성능을 판단하는 기준이 된다. 그러나 동형이의어만을 질의어로 이용한 검색 결과는 동형이의어 각 의미에 관련된 문서가 혼재되어 있거나, 특정 의미에 관련된 문서만 집중적으로 나타나는 현상을 볼 수 있다. 그래서 본 논문에서는 한국어 사용자 어휘지능망(U-WIN)의 관계정보를 이용하여, 질의어의 모호성을 해결하는 의미적 정보검색의 기반이 되는 기술을 제안한다. 실험에서 질의어는 전문분야에 주로 사용되는 동형이의어와 보편적으로 사용하는 동형이의로 구분하고, '질의어+상위어' 형태의 확장 질의어를 설정한다 그래서 포탈사이트의 웹 문서만을 대상으로 한 정확률은 73.5%, 통합검색의 정확률은 68.7%로 나타났다. 이것은 U-WIN 기반의 의미적 정보검색 기술이 정보검색 시스템에서 효율적임을 알 수 있다.

  • PDF

다차원 색인구조를 위한 효율적인 동시성 제어기법 (An Efficient Concurrency Control Algorithm for Multi-dimensional Index Structures)

  • 김영호;송석일;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권1호
    • /
    • pp.80-94
    • /
    • 2003
  • 이 논문에서는 질의의 지연을 최소화하는 효율적인 동시성제어 알고리즘을 제안한다. 다차원 색인구조에서 탐색연산을 지연시키고 전체적인 동시성을 떨어뜨리는 주 요인은 노드 분할과 MBR 변경연산이다. 제안하는 알고리즘에서는 분할 연산에 의한 질의의 지연을 최소화하기 위해 분할 노드에서의 배타 잠금 시간을 최소화한다. 분할 전체 기간동안 노드에 배타 래치를 획득하는 것이 아니고 분할 과정중 노드의 물리적인 분할 단계에서만 배타 래치를 획득한다. 또한, MBR 변경 시 발생하는 질의의 지연을 줄이기 위해 부분 잠금 결합(PLC: Partial Lock-Coupling)을 사용한다. PLC 기법은 MBR 증가 연산에 비해 상대적으로 발생 빈도가 적은 MBR 감소 연산에서만 잠금 결합을 수행하여 동시성을 향상시킨다. 성능평가를 위해 제안하는 알고리즘과 링크 기법을 기반으로 하는 기존의 동시성 제어 기법을 바다-III DBMS의 자료저장 시스템인 MIDAS-III상에서 구현한다 다양한 환경에서의 성능평가를 통해 제안하는 알고리즘이 기존의 동시성 제어기법보다 처리율 및 응답시간에서 뛰어난 성능을 나타냄을 보인다.

검색 편의성 향상을 위한 패턴 분석 기반 질의어 확장 (Pattern Analysis-Based Query Expansion for Enhancing Search Convenience)

  • 전서인;박건우;남광우;류근호
    • 한국산업정보학회논문지
    • /
    • 제17권2호
    • /
    • pp.65-72
    • /
    • 2012
  • 21세기 정보화시대에 정보자원의 양은 증대되고 있으며 필요한 정보를 손쉽게 취득하게 해주는 정보검색 시스템의 역할이 중요해지고 있다. 일반적으로 사용자가 원활한 검색을 하기 위해서는 검색하고자 하는 정보에 대한 충분한 사전 파악이 필요하며, 키워드를 식별하는 능력 또한 뛰어나야 한다. 하지만 대부분의 사용자들이 충분한 지식을 갖추고 검색을 수행하지 않으며 질의어에 적합한 효율적인 키워드를 연상하는데 많은 시간을 소비한다. 또한 여러 검색엔진에서 연관검색어 서비스를 제공하고 있지만 이는 검색어와 유사한 의미 내용이 대부분이며 사용자에게 맞는 확장/연관검색어를 제공하여 주지 못한다. 본 논문은 질의어 패턴 분석 기반의 사용자 확장 검색어 추출 및 추천을 통해 사용자의 검색 편의성을 제공하기 위한 시스템을 제안한다.

온라인 이용자 피드백을 사용한 정보필터링 시스템의 수정질의 최적화에 관한 연구 (A Study on Query Refinement by Online Relevance Feedback in an Information Filtering System)

  • 최광;정영미
    • 정보관리학회지
    • /
    • 제20권4호통권50호
    • /
    • pp.23-48
    • /
    • 2003
  • 이 연구의 목적은 대량의 최신정보를 제공하는 정보필터링 시스템에서 이용자 피드백에 의해 수정질의를 자동생성하여 재검색을 수행함으로써 검색 성능을 최적화할 수 있는 방안을 찾는 데 있다. 이용자가 입력한 초기질의를 사용하여 정보필터링 시스템이 검색한 문헌에 대해 이용자가 적합성 여부를 온라인으로 입력하도록 하고, 이 피드백 결과를 토대로 '중복제거법'과 ‘저빈도제거법' 두 가지 방법에 의해각각 17개의 수정질의를 생성하여 재검색한 결과를 초기 검색결과와 비교 분석하였다. 수정질의는 각각의 방법마다 17개 패턴의 불논리 질의형태를 미리 만든 다음 초기질의에 디스크립터와 분류기호를 결합하여 생성하였으며, 재검색 결과에 대한 적합성 평가를 통해 최적의 수정질의식을 도출하였다.