• 제목/요약/키워드: Concept-based Information Retrieval

검색결과 116건 처리시간 0.036초

주제별 분산 지식베이스에 의한 개념기반 정보검색시스템의 성능향상에 관한 연구 (A Study on the Improvement of Performance of Concept-Based Information Retrieval Model Using a Distributed Subject Knowledge Base)

  • 노영희
    • 정보관리학회지
    • /
    • 제19권1호
    • /
    • pp.47-69
    • /
    • 2002
  • 개념기반 정보검색기법은 불리언 검색기법의 문제점을 해소했다고 평가받고 있는 단순 매칭함수 기법이나 P-norm 검색기법보다 높은 성능을 보여주고 있다. 그러나 개념화장에 필수적인 의미망 지식베이스를 구축하는데 시간이 너무 오래 걸리는 단점이 있다. 본 연구에서는 이러한 문제를 해결하기 위해 주제범주별로 지식베이스를 분산 구축함으로써 지식베이스 구축에 소요되는 시간을 단축하면서도 검색성능이 떨어지지 않도록 하는 방안을 모색하고자 하였다.

Text-based Image Indexing and Retrieval using Formal Concept Analysis

  • Ahmad, Imran Shafiq
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제2권3호
    • /
    • pp.150-170
    • /
    • 2008
  • In recent years, main focus of research on image retrieval techniques is on content-based image retrieval. Text-based image retrieval schemes, on the other hand, provide semantic support and efficient retrieval of matching images. In this paper, based on Formal Concept Analysis (FCA), we propose a new image indexing and retrieval technique. The proposed scheme uses keywords and textual annotations and provides semantic support with fast retrieval of images. Retrieval efficiency in this scheme is independent of the number of images in the database and depends only on the number of attributes. This scheme provides dynamic support for addition of new images in the database and can be adopted to find images with any number of matching attributes.

시맨틱검색엔진의 성능평가에 관한 연구 (A Study on the Performance Evaluation of Semantic Retrieval Engines)

  • 노영희
    • 한국비블리아학회지
    • /
    • 제22권2호
    • /
    • pp.141-160
    • /
    • 2011
  • 본 연구에서는 유동성이 크고 데이터의 규모도 상당한 도서관에 일반화시켜 적용할 수 있는 지식베이스 및 검색엔진을 제안하였다. 이를 위해 총 세 개의 지식베이스(트리플 구조 온톨로지, 의미거리기반 의미망지식 베이스, 키워드중심의 도치색인파일)를 구축하였고, 이의 성능을 측정하기 위해 각각 세 개의 검색엔진(추론 규칙기반 제나검색엔진, 개념기반 검색엔진, 키워드기반 루씬검색엔진)을 구축하였다. 시스템 성능평가 결과, 종합적으로 개념기반 검색엔진이 가장 높은 성능을 보여주었고, 다음으로 온톨로지기반 제나검색엔진, 다음으로 일반 키워드 검색엔진 순으로 나타났다.

이동 객체의 내용 및 개념 기반 검색을 위한 시공간 모델링에 근거한 시그니쳐 기반 비디오 색인 기법 (A Signature-based Video Indexing Scheme using Spatio-Temporal Modeling for Content-based and Concept-based Retrieval on Moving Objects)

  • 심춘보;장재우
    • 정보처리학회논문지D
    • /
    • 제9D권1호
    • /
    • pp.31-42
    • /
    • 2002
  • 본 논문에서는 비디오 데이터가 지니는 이동 객체의 궤적(Moving Object's Trajectory)을 효과적으로 모델링할 수 있는 시공간 표현 기법(Spatio-Temporal Representation Scheme)과 궤적을 이용한 사용자 질의에 대해 효율적인 검색을 위한 새로운 시그니쳐 기반 접근 기법을 제안한다. 제안하는 시공간 표현 기법은 궤적을 기반으로 하는 내용 기반 검색(Content-based Retrieval)과 궤적에서 일어나는 위치 정보를 통해 얻어진 개념(의미)을 이용한 개념 기반 검색(Concept-based Retrieval)을 지원한다. 아울러, 제안하는 시그니쳐 기반 접근 기법은 데이터 파일을 직접 접근하기 전에 전체 시그니쳐들은 탐색하여 필터링을 수행한 후, 검색된 후보 시그니쳐들에 대해서만 디스크를 접근하기 때문에 순차 탐색에 비해 많은 수의 디스크 접근 횟수를 감소시킴으로써 검색 성능을 향상시킨다. 마지막으로, 성능 평가를 통해 제안하는 방법이 검색 효과(Retrieval Effectiveness) 및 효율(Retrieval Efficiency) 측면에서 기존의 방법인 Li나 Shan의 방법에 비해 우수함을 보인다.

클라우드 환경에서 전사적 정보 연계를 위한 개념 망 기반의 검색 프레임워크 (Retrieval Framework for Enterprise Information Integration based on Concept Net in Cloud Environment)

  • 정계동;문석재
    • 한국정보통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.453-460
    • /
    • 2013
  • 본 연구에서는 클라우드 환경에서 기하급수적으로 증가하는 전사적 정보 연계를 위한 시맨틱 기반 개념 망을 이용하여 전사적 데이터들의 효율적 연계와 활용이 가능하도록 프레임워크를 제안한다. 개념 망은 기존 온톨로지에 접근하는 방식은 유사하지만, 사용자가 보다 효율적으로 정보 연계 검색을 하고자 객체와 개념 사이의 연관성을 구축 한다. 본 논문에서는 개념 망을 3가지로 구분하여 제안 프레임워크에 적용한다. 본 연구의 개념 망은 마스터 정보 개념 망, 키워드 개념 망, 그리고 비즈니스 프로세스 개념 망을 기반으로 온톨로지 형태로 구축된다. 이 개념 망은 사용자 요구사항에 따라 데이터들 간의 연관성을 기준으로 하여 검색 및 활용을 가능하게 한다. 그리고 마스터 정보 개념과 키워드 개념이 결합되어 검색 키워드의 빈도 및 카테고리의 빈도 추적을 제공함으로써, 사용자의 검색의 편의성과 신속성을 향상시킬 수 있도록 하였다.

개념 네트워크를 이용한 정보 검색 방법 (Document Retrieval using Concept Network)

  • 허원창;이상진
    • Asia pacific journal of information systems
    • /
    • 제16권4호
    • /
    • pp.203-215
    • /
    • 2006
  • The advent of KM(knowledge management) concept have led many organizations to seek an effective way to make use of their knowledge. But the absence of right tools for systematic handling of unstructured information makes it difficult to automatically retrieve and share relevant information that exactly meet user's needs. we propose a systematic method to enable content-based information retrieval from corpus of unstructured documents. In our method, a document is represented by using several key terms which are automatically selected based on their quantitative relevancy to the document. Basically, the relevancy is calculated by using a traditional TFIDF measure that are widely accepted in the related research, but to improve effectiveness of the measure, we exploited 'concept network' that represents term-term relationships. In particular, in constructing the concept network, we have also considered relative position of terms occurring in a document. A prototype system for experiment has been implemented. The experiment result shows that our approach can have higher performance over the conventional TFIDF method.

어휘 번역확률과 질의개념연관도를 반영한 검색 모델 (Retrieval Model Based on Word Translation Probabilities and the Degree of Association of Query Concept)

  • 김준길;이경순
    • 정보처리학회논문지B
    • /
    • 제19B권3호
    • /
    • pp.183-188
    • /
    • 2012
  • 정보 검색에서 성능 저하의 주요 요인은 사용자의 질의와 검색 문서 사이에서의 어휘 불일치 때문이다. 어휘 불일치 문제를 해결하기 위해 본 논문에서는 어휘 번역확률을 이용한 번역기반 언어모델에 질의개념연관도를 반영한 검색 모델을 제안한다. 어휘관계 정보를 획득하기 위하여 문장-다음문장 쌍을 이용하여 어휘 번역확률을 계산하였다. 제안모델의 유효성을 검증하기 위해 TREC AP 컬렉션에 대해 실험하였다. 실험결과에서 제안모델이 언어모델에 비해 아주 우수한 성능향상을 보였고, 번역기반 언어모델에 비해서도 높은 성능을 나타냈다.

모바일 클라우드 환경의 키워드 개념 망을 이용한 정보 검색 시스템 (Information Retrieval System using Keyword-Base Concept Nets in Mobile Cloud)

  • 문석재;윤창표
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.661-663
    • /
    • 2013
  • 본 논문은 모바일 클라우드에서 급격하게 증가하는 정보 검색을 위한 키워드 기반의 개념 망을 이용한 데이터를 효율적으로 검색 가능하도록 한 모델을 제안한다. 키워드 기반의 개념 망은 온톨로지를 적용한 방식이지만, 사용자가 효율적인 정보 검색을 하도록 지원하기 위해 개념 사이의 연관성을 추가한 것이다. 따라서 본 논문에서는 키워드 중심의 개념 망, 전문가 그룹이 추천한 분야 개념 망 그리고 프로세스 개념 망으로 구성한다. 이러한 3가지 종류의 개념을 이용하여 사용자는 모바일 클라우드 내에서 키워드 기반으로 정보를 검색하고, 검색된 결과에 따라 연관성 있는 정보를 검색할 수 있다.

  • PDF

확장된 개념 기반 이미지 검색 시스템 (An Extended Concept-based Image Retrieval System : E-COIRS)

  • 김용일;양재동;양형정
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권3호
    • /
    • pp.303-317
    • /
    • 2002
  • In this paper, we design and implement E-COIRS enabling users to query with concepts and image features used for further refining the concepts. For example, E-COIRS supports the query "retrieve images containing black home appliance to north of reception set. "The query includes two types of concepts: IS-A and composite. "home appliance"is an IS-A concept, and "reception set" is a composite concept. For evaluating such a query. E-COIRS includes three important components: a visual image indexer, thesauri and a query processor. Each pair of objects in an mage captured by the visual image indexer is converted into a triple. The triple consists of the two object identifiers (oids) and their spatial relationship. All the features of an object is referenced by its old. A composite concept is detected by the triple thesaurus and IS-A concept is recolonized by the fuzzy term thesaurus. The query processor obtains an image set by matching each triple in a user with an inverted file and CS-Tree. To support efficient storage use and fast retrieval on high-dimensional feature vectors, E-COIRS uses Cell-based Signature tree(CS-Tree). E-COIRS is a more advanced content-based image retrieval system than other systems which support only concepts or image features.

개념 속성 기반 정보 검색 (Concept and Attribute based Answer Retrieval)

  • 윤보현;서창호
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권3호
    • /
    • pp.1-10
    • /
    • 2005
  • 본 연구에서는 지식검색을 위해 개념 속성을 이용하여 사용자 질의에 가장 적합한 정답 문장들을 검색 할 수 있는 정답검색 시스템을 설계하고 평가한다. 이 시스템은 먼저 사용자 질의를 개념 속성에 대한 불리언 연산으로 분석한 다음, 정답 문서 색인 집합에서 해당 문서들을 검색한다. 사용자는 이 검색된 문서들로부터 자신이 요구한 정답 문장들을 검색할 수 있으며, 또한 특정한 문서를 선택함으로써 그 문서에 포함된 정답 문장들을 검색할 수 있다. 이를 위해서 개념어와 속성어의 색인 단위로 색인된 정답 문서들은 각각의 문장들로 분할되어 색인된다. 그래서 분할된 문장들은 개념어와 속성어 형태로 분석되어 문서 색인 단위와의 관련 정도를 평가함으로써 정답 문장들의 위치를 색인한다. 마지막으로, 100개의 사용자 질의에 대해 정답 검색 시스템의 성능을 다양한 방법으로 평가한다.

  • PDF