• Title/Summary/Keyword: 불리언 검색

Search Result 37, Processing Time 0.021 seconds

The Design and Implementation of an Information Retrieval System Using Lexico-Semantic Pattern and Ontology (어휘 의미 패턴(Lexico-Semantic Pattern)과 온톨로지를 이용한 정보검색기의 설계 및 구현)

  • Kim, Byoung-Woo;Ko, Young-Joong
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.957-962
    • /
    • 2007
  • 본 논문에서 제안하는 정보 검색기는 일반적인 불리언(Boolean) 질의를 통해서 정보를 검색하는 것이 아니라, 문장으로 입력된 질의형태의 패턴을 분석하여 그에 맞는 정보를 직접 제공하는 것에 목적을 둔다. 이를 위해 어휘 의미 패턴(Lexical Semantic Pattern)과 온톨로지(Ontology) 기술이 정보검색기 개발에 적용되었다. 제안된 시스템에서는 다양한 형태로 표현된 문장 질의를 어휘 의미 패턴을 사용해서 문장의 질의 패턴을 추출하고 사용자 질의를 하나의 온톨로지(Ontology) 추론 질의와 매칭함으로써 질의에 대한 정확한 해답을 추출할 수 있다. 또한, 자연어 문장 입력에 대한 검색 질의 생성기를 구축하고 온톨로지로 표현된 지식을 사용하여 정보검색기 질의를 자동으로 확장함으로써 더욱 정확한 정보 검색 결과를 만들어 낼 수 있다.

  • PDF

A Study on the Improvement of Performance of Concept-Based Information Retrieval Model Using a Distributed Subject Knowledge Base (주제별 분산 지식베이스에 의한 개념기반 정보검색시스템의 성능향상에 관한 연구)

  • 노영희
    • Journal of the Korean Society for information Management
    • /
    • v.19 no.1
    • /
    • pp.47-69
    • /
    • 2002
  • The concept based retrieval model has shown a higher performance than those of the simple matching function method or the P-norm retrieval method introduced to compensate the demerits of the Boolean retrieval model. However. it takes too long to create a semantic-net knowledge base, which is essential in concept exploration. In order to solve such demerits. a method was sought out by creating a distributed knowledge base by subjects to reduce construction time without hindering the performance of retrieval.

Query Analysis of Color-Term for Image Retrieval (이미지검색을 위한 색상어 질의 분석)

  • Hur, Jeong;Kim, Hyun-Jin;Park, Sung-Hee;Choi, Jae-Hun;Jang, Myung-Gil
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.48-53
    • /
    • 2001
  • 인터넷 환경의 급속한 성장과 더불어 기존의 텍스트 정보들이 다양한 형태의 멀티미디어 정보(소리, 이미지, 동영상 등)로 대체되었다. 이로 인해 멀티미디어 정보검색의 필요성이 대두되기 시작했다. 멀티미디어 정보검색 중 이미지검색은 크게 주석기반과 특징기반 (color, shape, texture 등) 검색으로 나눌 수 있다. 본 고는 이미지 검색 중 전처리에 해당하는 색상어 질의처리의 한 방법을 제안한다. 즉, 사용자에게 익숙한 자연어 질의로부터 이미지의 특징에 해당하는 색상 정보와 주석에 해당하는 키워드 정보를 중심어 후위원칙기반으로 파싱트리를 구성한 후, 후위순회방식에 의해 불리언 검색을 수행하는 방법을 제안한다.

  • PDF

Improving Patent Information Service System using Vector Space Model and Thesaurus (벡터스페이스모델과 시소러스를 이용한 특허검색시스템의 성능향상)

  • 임성신;정홍석;한기덕;권혁철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.802-804
    • /
    • 2004
  • 지적재산권이 산업의 핵심으로 자리잡음으로써 특허의 중요성이 날로 증가하고 있다. 현재 특허문서 검색을 서비스하고 있는 상용시스템의 경우 문서간의 유사도나, 질의어에 따른 순위(Ranking)가 매겨지지 않는 불리언 모델이 검색에 사용되고 있다. 본 논문에서는 유사도에 기반 한 순위화가 가능한 벡터모델기반의 특허검색시스템을 개발하고 시계분야의 시소러스를 구축하여 시계분야의 특허검색 시스템에 적용하였다. 쿼리확장의 성능을 평가하기 위해 10개의 쿼리로 실험하였고 평균 36.2%의 정확도가 향상되었다. 그리고 검색결과의 오른쪽에 시소러스를 제시함으로써 특허검색시스템을 이용하는 사용자에게 추가 질의어를 쉴게 선택할 수 있도록 하여 인터페이스 부분의 향상을 추구하였다.

  • PDF

Efficient Query Expansion Method using Fuzzy Thesaurus in Component Retrieval (컴포넌트 검색에서 퍼지 시소러스를 이용한 효율적인 질의확장 방법)

  • 김귀정;한정수
    • The Journal of the Korea Contents Association
    • /
    • v.4 no.1
    • /
    • pp.76-82
    • /
    • 2004
  • In this paper, we used query evaluation method through thesaurus for retrieving Components having concept relation with any classes in a query. Queries are presented in boolean and expanded by similar table. Query expansion by thesaurus is the solution of the term mismatching and it enhanced precision and recall of the components retrieval. For efficiency evaluation of query expansion, we defined most critical value through a simulation and compared precision and recall each other.

  • PDF

Concept and Attribute based Answer Retrieval (개념 속성 기반 정보 검색)

  • Yun Bo-Hyun;Seo Chang-ho
    • Journal of the Korea Society of Computer and Information
    • /
    • v.10 no.3 s.35
    • /
    • pp.1-10
    • /
    • 2005
  • This paper presents the information retrieval system which can retrieve the most appropriate answer sentence for user queries by using the concept and the attribute for the knowledge retrieval. The system analyzes the user query into the Boolean queries with the concept and the attribute and then retrieve the relevant documents in the indexing set of answer documents. Users can retrieve the relevant answer sentences from the relevant documents. For this, the answer documents indexed by the concept and the attribute are segmented by each sentence respectively. Thus, the segmented sentences are analyzed into the concept and the attribute of which the relevance degree with indexing units of documents is evaluated. Then, the system indexes the location of answer sentences. In the experiment, we evaluate the performance of our answer retrieval system against 100 user queries and show the experimental results.

  • PDF

Intelligent Information Retrieval Using an Inductive Learning and a Neural Network Model (귀납학습과 신경망조직을 이용한 지능형 정보검색)

  • Kim Seonghee
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.28
    • /
    • pp.267-286
    • /
    • 1995
  • 불리언 논리에 기초한 현재 정보검색 시스템은 두 가지 본질적인 문제점 - 1)부정확하거나 불완전한 질의 표현과 2)일관성 없는 색인 - 이 있다. 많은 연구자들이 신경망조직(neural network) 이 정보경색에 있어서 불완전한 질의표현 문제를 해결할 수 있다고 주장해 온 반면 일관성 없는 문제는 아직 해결하지 못한 채 남아있다. 본고에서는 이러한 두 가지 문제점을 해결하기 위해 신경망 조직과 귀납학습이 소개되고 있다. 또한 이 논문에서는 신경망 조직이 어떻게 귀납학습과 통합해서 효율적인 정보 검색시스템에 응용될 수 있는지를 보여주고 있다.

  • PDF

Design of a Extended Fuzzy Information Retrieval System using User한s Preference (사용자의 선호도를 반영한 확장 퍼지 정보 검색 시스템의 설계)

  • 김대원;이광형
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.10 no.4
    • /
    • pp.299-303
    • /
    • 2000
  • The goal of the information retrieval system is to search the docments which the user wants to obtain in fast and effiecient way. Many information retrieval models, including boolean models, vector models and fuzzy models based on the trasitional fuzzy set theory, have been proposed to achieve these kinds of objectives. However, the previous models have a limitation on the fact that they do not consider the users' preference in the search of documents. In this paper, we proposed a new extenced fuzzy information retrieval System which can handle the shortcomings of the previous ones. In the proposed model, a new similarity measure was applied in order to calculate the degree among documents, which can expliot the users' preference.

  • PDF

Meta Information Retrieval using Sentence Analysis of Korean Dialogue Style (한국어 대화체 문장 분석을 이용한 메타 정보검색)

  • 박인철
    • Journal of the Korea Computer Industry Society
    • /
    • v.4 no.10
    • /
    • pp.703-712
    • /
    • 2003
  • Today, documents existing on internet by the development of communication network increase in number. And it is required the information retrieval system that can efficiently acquire the necessary information. Most information retrieval systems retrieve documents using a simple keyword or a boolean query of keywords. But, the method is not fit for novice users to use and has many difficulties than user's dialogue query from the viewpoint of convenience and precise understanding for query. So, this paper has an aim to suggest the method that will cope with above problems and to design and implement a meta query processing system for information retrieval using Korean dialogue sentences. The system implemented in this paper can generates a new boolean query for a given Korean dialogue sentence and resolve lexical ambiguities through morphological analysis, syntactic analysis and extension of query using thesaurus.

  • PDF

Searching Patents Effectively in terms of Keyword Distributions (키워드 분포를 고려한 효과적 특허검색기법)

  • Lee, Wookey;Song, Justin Jongsu;Kang, Michael Mingu
    • Journal of Information Technology and Architecture
    • /
    • v.9 no.3
    • /
    • pp.323-331
    • /
    • 2012
  • With the advancement of the area of knowledge and information, Intellectual Property, especially, patents have captured attention more and more emergent. The increasing need for efficient way of patent information search has been essential, but the prevailing patent search engines have included too many noises for the results due to the Boolean models. This has occasioned too much time for the professional experts to investigate the results manually. In this paper, we reveal the differences between the conventional document search and patent search and analyze the limitations of existing patent search. Furthermore, we propose a specialized in patent search, so that the relationship between the keywords within each document and their significance within each patent document search keyword can be identified. Which in turn, the keywords and the relationships have been appointed a ranking for this patent in the upper ranks and the noise in the data sub-ranked. Therefore this approach is proposed to significantly reduce noise ratio of the data from the search results. Finally, in, we demonstrate the superiority of the proposed methodology by comparing the Kipris dataset.