• 제목/요약/키워드: Information Retrieval Engine

검색결과 136건 처리시간 0.027초

XML 문서에 대한 RDBMS에 기반을 둔 효율적인 역색인 기법 (An Efficient Inverted Index Technique based on RDBMS for XML Documents)

  • 서치영;이상원;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권1호
    • /
    • pp.27-40
    • /
    • 2003
  • XML 정보검색 시스템이 XML 문서에 대한 포함질의를 지원하기 위해서는 기존의 정의검색 분야에서 널리 쓰이는 역색인 기법을 XML 문서에 대해서도 적용이 가능하도록 확장해야 한다. 본 논문에서는 확장된 역색인 정보를 저장하고 XML 문서에 대한 포함질의를 처리하는 방법을 이전 연구에서와 같이 두 가지 관점에서 제시한다. 하나는 관계형 데이타베이스 관리 시스템(RDBMS)을 이용해서 역색인 정보를 저장하고 질의를 처리하는 방법이고 다른 하나는 RDBMS 대신 역 리스트 엔진(Inverted List Engine)을 이용하는 방법이다. 이전 연구에서 역색인을 확장한 방식은 두 가지 문제점이 존재한다. 하나는 RDBMS를 이용하는 방법이 역 리스트 엔진을 이용하는 방법에 비해 성능 상으로 많이 안 좋다는 점이고, 다른 하나는 RDBMS 상에서 포함질의를 처리 시, 질의의 경로길이에 비례해서 조인연산이 증가하고 조인연산도 크기가 큰 테이블간의 조인이 된다는 점이다. 본 논문에서는 이러한 문제점들을 해결하고자 이전연구와는 다르게 역색인을 확장하여 RDBMS를 이용하는 방법의 효율성을 밝힌다.

HCI를 위한 다중 디스플레이와 웹 정보검색 (MultiDisplay for HCI and Web Information Retrieval)

  • 양현택;박나연;김원중
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.402-404
    • /
    • 2000
  • 현재 WWW(World Wide Web)는 가장 중요한 정보전달 및 획득 수단이 되었다. 대부분의 네트워크 사용자들은 웹에서 정보를 습득하기 위하여 대부분 검색엔진(Search Engine)을 사용한다. 그러나 웹에 등록되는 정보의 종류와 분량이 폭발적으로 증가함에 따라 검색엔진들이 제공하여 주는 인덱스화된 정보의 리스트들이 너무 많고, 또한 많은 문서들은 중복되어 나타나 사용자들이 효율적으로 정보를 검색하는데 문제점이 되고 있다. 본 연구에서는 다중디스플레이(MultiDisplay) 기법을 이용하여 사용자들에게 친숙하고, 웹의 정보검색에 필요한 시간과 노력을 대폭 줄이는 방안을 제시하였다.

  • PDF

논문 검색 결과의 효과적인 브라우징을 위한 단어 군집화 기반의 결과 내 군집화 기법 (A Search-Result Clustering Method based on Word Clustering for Effective Browsing of the Paper Retrieval Results)

  • 배경만;황재원;고영중;김종훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권3호
    • /
    • pp.214-221
    • /
    • 2010
  • 검색 결과 내 군집화(search-result clustering)는 검색 엔진으로부터 검색된 결과 내에서 비슷한 문서를 자동으로 군집화하는 기법이다. 본 논문에서는 논문 검색 서비스에 전문화된 새로운 결과 내 군집화 기법을 제안한다. 제안하는 시스템은 '범주체계생성기(Category Hierarchy Generation System)'와 '논문군집기(Paper Clustering System)'로 구성되어있다. '범주체계생생기'는 KOSEF의 연구 범주 체계를 이용하여 분야 시소러스라 불리는 범주 체계를 생성하고, K-means 알고리즘을 이용한 단어 군집화 알고리즘을 사용하여 분야 시소러스의 키워드 집합을 확장한다. '논문군집기'는 top-down 방식과 bottom-up 방식을 이용하여 각 논문의 범주를 결정한다. 제안하는 시스템은 논문 검색 서비스와 같은 전문 분야에 대한 검색 서비스에 유용하게 사용될 수 있을 것이다.

문자열 부분검색을 위한 색인기법의 설계 및 성능평가 (Design and Performance Evaluation of an Indexing Method for Partial String Searches)

  • 강승헌;유재수
    • 한국정보처리학회논문지
    • /
    • 제6권6호
    • /
    • pp.1458-1467
    • /
    • 1999
  • 신장해슁이나 B+-트리와 같은 기존의 색인구조들은 문자열의 부분검색을 지원하지 못하거나 부분검색에 제약점을 가지고 있다. 최근 웹 환경에서 동작하는 정보검색 엔진들이 사용하는 역파일의 빠른 검색성능을 가지면서 문자열 부분검색을 효율적으로 지원하는 색인기법을 제안한다. 제안된 색인기법은 기본적으로 역파일 구조이며, 2음절 단위의 패턴으로 색인을 구성함으로써 문자열 부분검색을 지원한다. 제안된 색인기법의 특성을 분석하기 위해 제안된 방법의 성능을 다양한 환경에서 실험을 통하여 비교하고 분석한다. 또한 성능평가를 위해 기존의 역파일 기법, 요약 파일 기법들과 제안하는 색인기법의 분석적 모델을 검색시간과 저장공간 측면에서 세시하고, 그 모델을 기반으로 그들의 성능을 비교한다. 분석적 비교모델을 통한 성능비교 결과, 제안된 부분검색을 위한 색인기법은 저장공간의 오버헤드는 크지만 기존 요약 파일 기법에 비해 검색성능을 상당히 향상시킨다.

  • PDF

개인화 정보 검색에 대한 연구 (A Study of Personalized Information Retrieval)

  • 김태환;전호철;최중민
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.683-687
    • /
    • 2008
  • 사람들은 월드 와이드 웹(World Wide Web)상에서 사용자가 원하는 정보를 검색하는 여러 알고리즘들을 구현해 왔다. 이렇게 구현된 검색 알고리즘 중 가장 좋은 기술을 가지고 있는 곳은 페이지랭크(PageRank)방식의 구글이다. 하지만 페이지랭크 방식, 즉 외부에서 강조하는 링크가 많은 문서로 검색하여 가장 많은 링크를 가기고 있는 문서를 상위에 보여주는 방식으론 사용자가 원하는 문서를 찾기 힘들다. 개인에게 가치가 있는 문서를 찾기보다 대중에게 가치가 있는 문서를 찾기 때문이다. 이러한 문제를 해결하기 위하여 본 논문에서는 대중적 가치와 개인적 가치를 혼합한 개인화 검색 엔진을 제안한다.

  • PDF

웹 이용자의 검색엔진 활용 및 탐색 행위와 성향 분석 (Analysis of Search Engine Use, Search Behaviors and Aptitude by Web Users)

  • 이해영
    • 한국문헌정보학회지
    • /
    • 제36권3호
    • /
    • pp.69-91
    • /
    • 2002
  • 본 연구는 웹 이용자들이 검색엔진을 어떻게 선택하여. 어떠한 기능들을 활용하며, 검색결과는 어떻게 평가하는지 그리고 어떤 어려움을 겪고 있는지를 밝혀 보고자 하였다. 28명의 대학의 교수와 대학원생으로 구성된 이용자들을 대상으로 한 인터뷰결과를 분석한다. 연구 결과에 따르면, 본 연구의 참가자들은 검색결과에 대한 평가보다는 특정한 기능이나 익숙함에 근거하여 엔진을 선택하였다. 이들은 통합검색에 대해서는 의견이 양분되어 있었으며, 연산자의 사용이 결과에 미치는 영향이 거의 없다고 보고 있었다. 검색엔진에 대한 평가를 내릴 때에도 검색결과의 정확성외에 결과를 보여주는 인터페이스 디자인에도 상당한 관심을 가지고 있는 것으로 나타났다.

내용기반 영상검색을 위한 색상과 휘도 정보를 이용한 필터 구현 (Implementation on the Filters Using Color and Intensity for the Content based Image Retrieval)

  • 노진수;백창희;이강현
    • 전자공학회논문지CI
    • /
    • 제44권1호
    • /
    • pp.122-129
    • /
    • 2007
  • 영상 정보의 이용도가 증가함에 따라 영상을 효율적으로 관리할 수 있는 시스템의 필요성이 증가하고 있다. 이에 따라, 본 논문에서는 색채 특징과 영상의 형태와 위치 정보의 효율적인 결합에 근거한 내용기반 영상 검색 엔진을 제안한다. 색채 특징으로는 색채의 공간적인 상관관계를 잘 나타내는 HSI 색채 히스토그램을 선택하였고, 형태와 위치 특징들은 HSI의 휘도 성분에서 불변 모멘트를 이용하여 추출하였다. 효율적인 유사도 측정을 위해 추출된 특징(색채 히스토그램, Hu 모멘트)을 결합하여 정확도를 측정하였다. http://www.freefoto.com에서 제공하는 DB를 사용하여 실험한 결과, 제안된 검색엔진은 93%의 정확도를 가지며 성공적으로 영상 검색에 사용될 수 있음을 보였다.

온톨로지 추론 엔진을 이용한 미술 작품 검색 시스템 (An Art Image Retrieval System Using Ontology Reasoning Engine)

  • 한상진;조우상;이복주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.139-141
    • /
    • 2004
  • 본 논문에서는 웹 상의 미술 작품 검색하기 위해 기존의 키워드 매칭 검색 대신에 시맨틱 기반의 확장된 검색 방법을 소개한다. 온톨로지를 만들기 위해서는 많은 온톨로지 관련 언어가 있다. 그 중 최근의 연구 방향은 RDFS/RDF와 OWL로 작성된 온톨로지와 온톨로지의 추론 분야이다. 지금까지의 정보 검색이 단순한 구문중심의 검색이었다면 앞으로의 정보 검색은 의미 중심의 지식 기반의 정보 검색을 발전할 것이다. 이에 본 논문이 온톨로지를 활용한 지식 기반 검색 시스템을 제안한다.

  • PDF

Hop 제약조건이 고려된 최적화 웹정보검색 (Optimized Structures with Hop Constraints for Web Information Retrieval)

  • 이우기;김기백;이화기
    • 한국경영과학회지
    • /
    • 제33권4호
    • /
    • pp.63-82
    • /
    • 2008
  • The explosively growing attractiveness of the Web is commencing significant demands for a structuring analysis on various web objects. The larger the substantial number of web objects are available, the more difficult for the clients(i.e. common web users and web robots) and the servers(i.e. Web search engine) to retrieve what they really want. We have in mind focusing on the structure of web objects by introducing optimization models for more convenient and effective information retrieval. For this purpose, we represent web objects and hyperlinks as a directed graph from which the optimal structures are derived in terms of rooted directed spanning trees and Top-k trees. Computational experiments are executed for synthetic data as well as for real web sites' domains so that the Lagrangian Relaxation approaches have exploited the Top-k trees and Hop constraint resolutions. In the experiments, our methods outperformed the conventional approaches so that the complex web graph can successfully be converted into optimal-structured ones within a reasonable amount of computation time.

웹 상의 온라인 비교 쇼핑을 위한 상품 정보 자동 색인 및 검색 시스템의 설계 및 구현에 대한 연구 (A Study on Design and Implementation of Automatic Product Information Indexing and Retrieval System for Online Comparison Shopping on the Web)

  • 강대기;이제선;함호상
    • 한국전자거래학회지
    • /
    • 제3권2호
    • /
    • pp.57-71
    • /
    • 1998
  • In this paper, we describe the approaches of shopping agents and directory services for online comparison shopping on the web, and propose an information indexing and retrieval system, named InfoEye, with a new method for automatic extraction of product information. The developed method is based on the knowledge about presentation of the product information on the Web. The method from the knowledge about presentation of the product information is derived from both the point that online stores display their products to customers in easy-to-browse ways and heuristics made of analyses of product information look-and-feel of domestic online stores. In indexing process, the method is applied to product information extraction from Hypertext Markup Language (HTML) documents collected by a mirroring robot from online stores. We have made InfoEye to a readily usable stage and transferred the technology to Webnara commercial shopping engine. The proposed system is a cutting-edge solution to help customers as a shopping expert by providing information about the reasonable price of a product from dozens of online stores, saving customers shopping time, giving information about new products, and comparing quality factors of products in a same category.

  • PDF