• Title/Summary/Keyword: 정보검색 시스템

Search Result 5,081, Processing Time 0.033 seconds

Experiments on Pseudo Relevance Feedback in Probabilistic Information Retrieval Model (확률적 정보 검색 모델에서의 유사 적합성 피드백 실험)

  • Cho, Bong-Hyun;Lee, Chang-Kee;An, Joo-Hui;Lee, Gary Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.183-190
    • /
    • 2001
  • 본 논문은 확률기반 자연어 검색 시스템 POSNIR/E를 이용한 여러 가지 유사 적합성 피드백 방법들이 검색 시스템의 성능 향상에 기여할 수 있는 정도를 보여주고, 확률 기반 정보 검색 시스템에 적합한 유사 적합성 피드백 수행 방법을 제시한다. POSNIR/E는 한국어 자연어 검색 시스템, POSNIR를 기반으로 만들어진 영어 자연어 검색 시스템이다. 이 시스템은 성능 향상을 위한 질의 확장의 방법으로 검색 단계에서 유사 적합성 피드백을 사용한다. 검색 단계에서 영어 태거에 의해 태깅된 사용자 질의로부터 질의어를 추출하고 초기 검색을 수행한다. 유사 적합성 피드백을 위하여 초기 검색 결과 중 상위 5개의 문서에 나타나는 키워드를 중요도에 따라 내림차순 정렬하여 상위 10개의 키워드를 초기 질의어에 확장한다. 이렇게 확장된 질의어로 최종 검색을 수행한다. TREC 평가용 테스트 컬렉션 WT10g와 TREC-9의 질의 적합문서 집합을 이용하여 여러 가지 TSV 함수를 사용하여 검색 성능을 평가 하였다. 실험 결과 유사 적합성 피드백을 사용할 경우 TSV 함수에 확률 모델의 CF 요소 뿐만 아니라 TF 요소 등을 적용 시킬 경우 성능 향상에 기여할 수 있음을 알 수 있었다. 또한 색인어와 검색어로 단일어 뿐만 아니라 복합어도 사용할 경우 성능이 향상됨을 알 수 있다.

  • PDF

Improved Concept-base Search System Using HITS algorithm on Conceptual Graph (HITS알고리즘을 적용한 개념그래프 기반검색시스템의 성능개선)

  • 배환국;박호성;이상준;김기태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.470-472
    • /
    • 2003
  • 본 논문에서는 개념 그래프 기반 검색 시스템의 검색의 성능을 개선시키고자 Hits 알고리즘을 적용하였다. 기존 개념 그래프 기반 검색 시스템의 anchor text분석을 통하여 개념을 추출하고 있는 시스템에서 더 나아가 하이퍼 링크의 선호도의 특성을 살려 하이퍼링크에 문서가 얼마나 연결되어 있는지, 참조하고 있는지에 따라 해당 검색된 문서들의 중요도를 찾아서 순위를 매기는 실험을 하였다. 종래에는 해당 검색어의 빈도순으로 개념의 결과를 나타내 주었는데, 본 시스템 구현 후에 랭킹알고리즘을 적용하여 해당검색에 유용한 정보를 가지고 있는 페이지들(authorities)과 유용한 정보를 보유하고 있는 페이지의 링크를 보유하고 있는 페이지들(hubs)를 각각 순위 순으로 보여주게 되었다. 그리하여 사용자는 실제 검색시에 개념상으로 분류된 문서 중에 중요도가 높은 문서를 사용자에게 우선으로 접하게 되었으며, hub어 의해서 중요도가 높은 문서를 한눈에 볼 수도 있을 뿐 아니라, anchor text 어서 나타나지 않은 중요한 정보를 가진 문서도 검색할 수 있었다.

  • PDF

A Study on the STN International (STN International 온라인 정보검색(情報檢索) 시스템)

  • Jeong, Hye-Soon
    • Journal of Information Management
    • /
    • v.23 no.3
    • /
    • pp.45-73
    • /
    • 1992
  • STN International is operated in North America by CAS, a division of the American Chemical Society;by FIZ Karlsruhe in Eruope ; and by JICST in Japan. All three are not-for-profit scientific organizations. This paper describes Messenger software that is designed for fast and efficient information retrieval, the advanced front-end STN Express software that saves time and effort, and databases in STN.

  • PDF

User Adaptation Using User Model in Intelligent Image Retrieval System (지능형 화상 검색 시스템에서의 사용자 모델을 이용한 사용자 적응)

  • Kim, Yong-Hwan;Rhee, Phill-Kyu
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.12
    • /
    • pp.3559-3568
    • /
    • 1999
  • The information overload with many information resources is an inevitable problem in modern electronic life. It is more difficult to search some information with user's information needs from an uncontrolled flood of many digital information resources, such as the internet which has been rapidly increased. So, many information retrieval systems have been researched and appeared. In text retrieval systems, they have met with user's information needs. While, in image retrieval systems, they have not properly dealt with user's information needs. In this paper, for resolving this problem, we proposed the intelligent user interface for image retrieval. It is based on HCOS(Human-Computer Symmetry) model which is a layed interaction model between a human and computer. Its' methodology is employed to reduce user's information overhead and semantic gap between user and systems. It is implemented with machine learning algorithms, decision tree and backpropagation neural network, for user adaptation capabilities of intelligent image retrieval system(IIRS).

  • PDF

Location Mapping Techniques of Textual Spatial Information for Spatial Semantic Web (공간 시멘틱 웹을 위한 텍스트 공간정보의 위치 맵핑 기법)

  • Ha, Tae-Seok;Ha, Su-Wook;Nam, Kwang-Woo
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2010.06a
    • /
    • pp.71-73
    • /
    • 2010
  • 웹에서 다양한 웹 지리 지역 정보를 검색할 수 있는 시스템에 대한 요구가 증가하고 있다. 그러나 현재의 웹 검색 시스템은 사용자가 키워드로 지역 웹 문서를 검색하고 해당 웹 문서를 지도와 비교하여 공간정보를 취득하며, 다른 관련 정보를 얻기 위해서는 검색과 비교를 반복해야 하는 어려움이 있다. 따라서 본 논문에서는 비구조화 된 텍스트 웹 자원으로부터 지리정보 온툴로지(geo-ontology)를 확장할 수 있는 통합된 검색시스템을 제안한다. 이를 위해 문서의 정보에서 위치 정보를 추출하고 공간정보 위치 맵핑 기법을 적용하여 텍스트의 공간정보를 추출한다.

  • PDF

An Implementation of a Image-based Internet Video Search System using Feature Information (특성정보를 이용한 영상기반 인터넷 동영상 검색 시스템의 구현)

  • 손정식;이원석
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.06a
    • /
    • pp.62-65
    • /
    • 2001
  • 본 논문에서는 인터넷 동영상 정보들을 보다 효율적이고 정확하게 검색할 수 있는 시스템을 구현하기 위해, 특성 정보에 기반한 영상기반 검색과 예제를 통한 질의를 사용한 시스템을 제안한다. 기존의 검색 시스템과는 달리 본 시스템에서는 사용자가 진의로 제출한 통영상의 특성정보를 추출하여 데이타마이닝하여 프로파일로 만들고, 인터넷에서 검색된 동영상의 특성정보와 비교하는 기법을 사용한다. 또한 진의 동영상 프로파일들을 통합하고, 특징 영역 세그먼트들의 중요도를 저장해 둠으로써 사용자의 질의를 하나의 척도로 처리하며, 작성된 프로파일과 비교 할 동영상의 특성정보를 영역별로 가중치를 주어 보정함으로 검색을 원하는 동영상의 특징을 강조한 진의가 가능하도록 한다. 끝으로 가중치를 주는 방법의 변화에 따른 시스템이 출력하는 검색 결과의 변화를 관찰하여 보정 방법의 성능을 평가한다.

  • PDF

PC Cluster-based Parallel Korean Information Retrieval System (PC 클러스터 기반 병렬 한국어 정보검색 시스템)

  • 김진혁;장한국;최참아;류광렬;정상화;권혁철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.160-162
    • /
    • 1999
  • 대용량의 정보를 다루는 정보검색 시스템은 정보 처리 과정에서 디스크 접근 시간이 큰 오버헤드로 작용한다. 본 논문에서는 단일 기계에서 작동하는 정보검색 시스템이 가지는 이러한 문제점을 해결하기 위해 PC 클러스터 기반 정보검색 시스템을 구현하였다. 색인어 간의 동시 등장 빈도 정보를 이용한 Greedy De-clustering 알고리즘으로 클러스터에 색인어 역파일을 병렬 분산하여 저장하고, SCI 기반의 효율적인 통신 시스템을 구축하여 클러스터 노드간의 통신이 원활하게 하였다. 따라서 사용자 질의어를 처리할 때 질의어별로 가져오는 색인어 역파일의 디스크 접근 시간이 감소하는 효과를 얻을 수 있었으며, 기존의 단일 기계에서 수행되는 정보 검색 시스템보다 수행속도가 2.3배 빠른 시스템을 구현하였음을 실험을 통해 확인하였다.

  • PDF

Content-based Image Retrieval System using Multi-index Key (멀티인덱스키를 이용한 내용기반 이미지 검색 시스템)

  • 김주연;김지천
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04a
    • /
    • pp.710-712
    • /
    • 2003
  • 본 논문에서는 시각적. 공간적 정보로 멀티미디어 분야에서 다양한 응용이 가능한 이미지검색을 위해 색상특징정보와 모양특징정보를 멀티인덱스키로 구성하여 질의 이미지의 입력 시 자동으로 색상특징정보와 모양특징정보를 동시에 추출하여 유사한 이미지를 검색할 수 있는 내용기반 이미지 검색시스템을 제안하였다. 제안된 시스템은 기존의 단일 특징정보를 이용한 방법이나 2가지 이상의 특징정보를 단계적으로 검색하는 방법에 비해 향상된 효율성과 신속성을 보이고 있다.

  • PDF

Design and Implementation of the User Preference Analysis Search System using the Agent Technology (에이전트 기술을 이용한 사용자 기호 분석 검색 시스템 설계 및 구현)

  • 김정희;고희준;곽호영
    • Journal of the Korea Computer Industry Society
    • /
    • v.3 no.7
    • /
    • pp.881-890
    • /
    • 2002
  • In this paper, by using agent technology, we proposes and implements the search system that supplies the result close to the user preference through the analysis of user preference. To offer better qualified information to user without redundant search results and unnecessary information of legacy search system. this system uses user's information and generates keywords and categories. Comparing user's favorite category with search result of legacy search system through the agent oriented search engine, it supplies only the result close to the user's category. At the same time, search result is saved into the databases according to each category to be used for search work later. As a result, the redundant information of search result was efficiently removed and the information close to the user's favorite category was obtained.

  • PDF

WWW Information Retrieval Using a Genetic Algorithm (유전자 알고리즘을 이용한 WWW 정보검색)

  • 서영우;장병탁
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1998.03a
    • /
    • pp.89-92
    • /
    • 1998
  • 최근 웹 상에서 여러 가지 정보에 대한 접근이 용이하여 많은 사람들이 다양한 검색 시스템을 이용하여 원하는 정보를 얻고 있다. 그러나 웹의 크기가 점점 커지고 그에 따른 사용량 또한 증가함에 딸 원하는 시간 안에 원하는 수준의 정보를 얻기가 매우 어렵다. 본 논문에서는 유전자 알고리즘을 이용하여 사용자의 요구수준에 보다 가까운 저오를 검색하는 학습방법에 대해 고찰한다. 검색 엔진의 초기 검색 결과로부터 만들어진 색인어들이 하나의 염색체로 구성한다. 염색체를 구성하고 있는 각 유전자는 사용자의 기호에 맞는 URL을 추천하기 위해 검색된 문서들과 연관성 값을 비교하여 유전 연산자에 의해 변형된다. 제시된 저오 검색 방식은 기존의 검색 엔진으로부터 반환되는 검색 결과로부터 사용자가 원하는 장보에 연관된 하나 이상의 색인어를 생성한 다음 재검색하여 연관성이 높은 소수의 정보만을 사용자에게 제공한다. 제안된 학습 방식과 기존 검색 엔진으로 검색된 결과를 초기의 사용자 정보 요구와의 연관성에 있어서 비교 분석하였다.

  • PDF