• Title/Summary/Keyword: 메타 검색

Search Result 849, Processing Time 0.025 seconds

A Hybrid Information Retrieval Model Using Metadata and Text (메타데이타와 텍스트 정보의 통합검색 모델)

  • Yoo, Jeong-Mok;Myaeng, Sung-Hyon;Kim, Sung-Soo;Lee, Mann-Ho
    • Journal of KIISE:Databases
    • /
    • v.34 no.3
    • /
    • pp.232-243
    • /
    • 2007
  • Metadata IR model has high precision and low recall because the query in Metadata IR model is strict that is, the query can express user information need exactly, while Full-text IR model has low precision and high recall because the query in Full-text IR model is a kind of simple keyword query which expresses user information need roughly. If user can translate one's information need into structured query well, the retrieval result will be improved. However, it is little possible to make relevant query without understanding characteristics of metadata. Unfortunately, most users do not interested in metadata, then they cannot construct well-made structured query. Amount of information contained in metadata is less than text information. In this paper, we suggest hybrid IR model using metadata and text which can provide users with lots of relevant documents by retrieving from metadata field and text field complementarily.

MetaSearch for Entry Page Finding Task (엔트리 페이지 검색을 위한 메타 검색)

  • Kang In-Ho
    • The KIPS Transactions:PartB
    • /
    • v.12B no.2 s.98
    • /
    • pp.215-222
    • /
    • 2005
  • In this paper, a MetaSearch algorithm for navigational queries is presented. Previous MetaSearch algorithms focused on informational queries. They Eave a high score to an overlapped document. However, the overemphasis of overlapped documents may degrade the performance of a MetaSearch algerian for a navigational query. However, if a lot of result documents are from a certain domain or a directory, then we can assume the importance of the domain or directory. Various experiments are conducted to show the effectiveness of overlap of a domain and directory names. System results from TREC and commercial search engines are used for experiments. From the results of experiments, the overlap of documents showed the better performance for informational queries. However, the overlap of domain names and directory names showed the $10\%$ higher performance for navigational queries.

Object-Oriented Modeling of Metadata for Content-based Retrieval on News On Demand (News On Demand의 내용기반 검색을 위한 메타데이타의 객체지향 모델링)

  • 김용걸;이훈순;진성일;최동훈
    • Proceedings of the Korea Database Society Conference
    • /
    • 1997.10a
    • /
    • pp.463-471
    • /
    • 1997
  • 비디오 데이타는 다양하고 방대한 양의 의미를 포함하고 있어 효율적인 내용기반 검색을 지원하기 위해서는 비디오 데이타를 기술하는 구조적이고 체계화된 형태의 메타데이타가 요구된다. 이러한 메타데이타는 검색 시 색인과 같은 역할을 수행하게 되므로 내용 기반검색의 가장 기본적이고 필수적인 데이타이다. 본 논문에서는 뉴스 응용 분야(News On Demand:NOD)를 적용한 비디오 데이터베이스 시스템의 효율적인 내용 기반 검색을 위한 메타데이타를 분류하고, Rambaugh의 OMT기법을 이용하여 메타데이타를 모델링한 후 질의 유형에 따라 모델의 접근 경로를 검사하여 모델을 검증하였다.

  • PDF

Automatic Generation of RDF Metadata for Semantic Search in Semantic Web (시맨틱 웹에서 의미 검색을 위한 RDF 메타데이타 자동 생성)

  • 강상구;양재영;양승섭;최원종;최중민
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.11a
    • /
    • pp.311-320
    • /
    • 2002
  • 시맨틱 웹은 인간이 이해하는 것처럼 웹 문서의 의미를 컴퓨터가 처리할 수 있도록 하는데 있다. 그러나 인터넷 등 정보통신 기술의 발전으로 인해 정보량이 급증함으로써 이들 정보 자원을 효과적으로 검색하기에는 많은 어려움이 있다. 이러한 문제점을 해결하기 위해 본 논문에서는 주석 에디터를 사용하여 논문에 대한 RDF 메타데이타의 자동 생성 방법을 제안한다. 사용자가 논문을 주석 처리할 때, 문서에 대한 특징을 추출하고 온토로지 인터페이스를 사용하여 문서를 분류한다. 구현된 시스템을 통해 사용자는 추출된 메타데이타를 메타데이타 뷰를 통해 볼 수 있으며, HTML 뷰를 통해 메타데이타를 수동으로 수정이 가능하다. 이 메타데이타는 RDF Repository로 저장할 수 있으며, 주석 뷰를 통하여 RDF 메타데이타 생성을 확인할 수 있다. 이렇게 생성된 RDF 메타데이타는 웹 로봇이 내용의 의미 파악 및 카테고리 정보를 쉽게 알 수 있도록 해준다. 본 논문은 검색 엔진을 통하여 논문 검색시 전체 내용보다 RDF 메타데이타 정보만으로 효율적인 검색을 할 수 있는 방법에 초점을 둔다.

  • PDF

Design of Content-based Image Retrival System using Multilevel Metadata (다계층 메타데이타 기반 이미지 내용검색 시스템 설계)

  • 신용수;홍성용;나연묵
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.142-144
    • /
    • 2002
  • 대부분의 내용기반 이미지 검색 시스템은 이미지의 특징 벡터인 색상, 모양, 그리고 질감에 의해서 유사한 이미지를 검색하는 기법을 제공하고 있다. 최근 이러한 내용기반 이미지 검색 기술은 의료 영상 이미지와 같은 다양한 분야에 적용되고 있으며, 이에 따라서 의료 이미지를 분석하여 저장, 검색하기 위한 데이터베이스 시스템이 증가하고 있다. 그러나, 대량의 이미지로부터 원하는 이미지를 검색하기 위해서는 이미지의 메타데이타를 효율적으로 표현해야 하며, 의미성과 이미지의 특징 데이터를 통합적으로 저장 관리 할 수 있는 이미지 데이터베이스를 설계하고 구축해야만 한다. 본 논문에서는 기존의 내용기반 이미지 검색 기법을 살펴보고. 이미지를 내용기반으로 분류하고 저장할 수 있는 데이터베이스 시스템을 설계하여 효율적인 의미기반 검색을 지원말 수 있는 모델을 제시한다. 다계층 메타데이타 레이어 구조로 이미지에 대한 개념 지식 모델을 표현하고, 이미지내의 객체를 메타데이타로 표현하여 분류할 수 있는 모델을 제안한다. 또한, 이미지 내용검색을 지원하기 위한 시스템 구조를 설계하고, 메타데이타가 저장되기 위한 관계형 모델을 스타 스키마의 형태로 제시한다. 제안된 방법은 의미적인 이미지 내용 검색 방법의 지원에 활용될 수 있다.

  • PDF

Metasearch for Website Finding (사이트 검색을 위한 메타 검색)

  • Lee, Yeo-Jin;Kang, In-Ho;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 2002.10e
    • /
    • pp.245-252
    • /
    • 2002
  • 여러 검색 엔진이 낸 결과를 결합하여 성능의 향상을 얻고자 하는 정보 검색 방법을 메타 검색(metasearch)이라고 한다. 정보 검색에서의 사용자 요구가 다양화되고 있지만, 기존의 메타 검색에 관한 연구는 이를 제대로 반영하지 못하고 웹 문서를 대상으로 검색(topic relevance task)한 결과를 결합하는 데에만 치중해 있다. 최근에는 사이트 검색(entry page finding task)만을 목적으로 한 시스템도 개발되고 있다. 본 논문에서는 사이트 검색 엔진들의 결과를 결합하는 메타 검색 방법을 제시한다. 웹 문서 검색 결과를 결합시에는 여러 검색 엔진에서 중복(overlap)하여 나타난 문서에 가중치를 두는 방법이 효과적이다. 하지만 이 방법을 그대로 사이트 검색에 적용하면 웹 문서 검색에서와 같은 좋은 결과를 낼 수 없다. 본 논문에서는, 여러 검색 엔진에 중복하여 나타난 문서에 가중치를 두는 것보다는 그 문서가 속한 사이트를 고려하여 사이트 단위로 중복된 정도를 반영하는 것이 사이트 검색 엔진의 견과를 결합하는 데 더 효과적임을 보인다.

  • PDF

A Ranking method using link & description information in Meta searching (메타검색에서 링크정보와 요약정보를 이용한 검색결과 통합)

  • 양명석;이석형;강남규;윤화묵
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.118-120
    • /
    • 2002
  • 본 논문은 메타검색엔진 시스템에서 다양한 검색결과를 하나의 검색결과로 통합시켜주는 통합랭킹 방법에 대한 연구이다 검색결과 통합시 메타검색 시스템에서 실질적으로 이용할 수 있는 링크정보와 요약정보를 사용하였다 통해 이루어져 있다. 또한 링크정보와 요약정보에 대한 가중치 값을 변화시키면서 다양한 검색결과들을 얻을 수 있었는데, 요약정보의 가중치를 높여 주었을 때 검색 효율이 좋음을 알 수 있었다.

  • PDF

The metadata management System based on TV-Anytime (TV-Anytime기반 메타데이터 관리 시스템)

  • 이민우;박종현;이용희;정민옥;강지훈
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.442-444
    • /
    • 2004
  • TV-Anytime은 차세대 디지털 방송을 위한 표준으로 기존의 방송시스템에서 방송 서비스 제공자가 사용자에게 방송 프로그램을 일방적으로 전송하는 것과는 달리 사용자가 다 채널 환경하에서 관련 메타데이터를 이용하여 채널을 직접 검색하고 검색한 정보를 저장하였다가 시간과 장소에 무관하게 사용하는 것을 목표로 한다 이러한 환경을 가능하게 하기 위하여 본 논문에서는 TV-Anytime 메타데이터를 저장 및 관리하고 검색하기 위한 시스템을 설계 및 구현한다. TV-Anytime기반 메타데이터 관리 시스템은 메타데이터의 특성을 파악하여 일반적인 메타데이터 관리 방법보다는 TV-Anytime 메타데이터에 특화된 방법으로 설계하고 구현하였다. 또한, 사용자에게 보다 풍부한 질의를 제공하기 위해서 MPEG7을 추가하여 내용기반 검색을 가능하도록 할 뿐만 아니라, XQuery를 검색을 위한 질의어로 사용하여 시스템간의 상호운용성을 보장하였다.

  • PDF

A XML-based Metadata Engine Design for Effective Retrieval in PVR System (PVR 시스템에서 효율적인 검색을 위한 XML 메타데이터 엔진설계)

  • 신은영;박성한
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.574-576
    • /
    • 2004
  • 디지털 방송과 함께 저장매체를 갖는 PVR과 셋탑박스가 출현하였지만 방대한 컨텐츠에 대한 선택의 어려움이 발생하였다. 이러한 문제를 해결하기 위해서 PVR에서는 TV-Anytime과 MPEG-7 표준을 기반으로 멀티미디어 데이터에 대한 메타데이터를 제공한다. 이 메타데이터는 멀티미디어 데이터를 표현하는 특징적인 정보를 포함하고 있어, 컨텐츠에 대한 선택과 검색을 돕는다. 그러나 메타데이터는 그 내용이 방대한 XML document로 구성되어 있어, 효율적이고 빠른 검색이 쉽지 않다. 본 논문은 이러한 XML 메타데이터의 특성을 기반으로 효율적인 검색을 위한 XML 메타데이터 엔진을 설계한다. 제안하는 XML 메타데이터 엔진은 메타데이터의 정보적 특성을 기반으로 인덱싱 구조를 설계하여 XML 메타데이터의 접근 시간을 최소화한다.

  • PDF

Development of an Integrated Retrieval System on Distributed KRISTAL-2002 Systems with Metadata Information (메타데이터 정보를 이용한 분산 KRISTAL-2002 시스템의 통합 검색 시스템 개발)

  • Choe Gui-ja;Kim Jae-Gon;Seo Jung-Hyun;Cho Han-Hyung;Lee Min-Ho;Jung Chang-Hu;Park Dong-In;Nam Young-Kwang
    • The KIPS Transactions:PartD
    • /
    • v.12D no.1 s.97
    • /
    • pp.135-150
    • /
    • 2005
  • In this paper, we propose an integrated information retrieval system for distributed multiple KRISTAL-2002 systems by using the metadata information. This system integrates current systems for different areas or systems for the same area with the different schemas so that the users can get the answers by once from the whole systems. The proposed system composes of the Source Server Manager(SSM) supporting the mapping between the integrated metadata database and source server, the Integrated Metadata Manager(ISM) for registering and managing the metadata and schema mapping, the Distributed Query Processor (DQP) for processing the user query into the source server query, the Distributed Data Set Integrated Manager(DDSIM) for transforming the total retrieval results by merging to the HTML format, and the integrated retrieval engine for managing the query results. It is assumed that the integrated metadata follows ISO/IEC 11179 metadata registration procedure with the metadata registry system which is a subsystem of the proposed system. There are two kinds of queries for users; the basic query and the detailed query. The users may select the databases or organizations for results by their own choices before giving the queries. The proposed system has been developed over KRISTAL-2002 systems with $Visual C^{++}\;and\;C^{++}-CGI$ and tested and verified with the six database systems.