• 제목/요약/키워드: Concept-based Information Retrieval

검색결과 116건 처리시간 0.024초

클라우드 환경에서 문서의 유형 분류를 위한 시맨틱 클러스터링 모델 (Semantic Clustering Model for Analytical Classification of Documents in Cloud Environment)

  • 김영수;이병엽
    • 한국콘텐츠학회논문지
    • /
    • 제17권11호
    • /
    • pp.389-397
    • /
    • 2017
  • 최근 시맨틱 웹 문서는 클라우드 기반으로 생성 및 유통되고 문서유형 분류에 따른 쉽고 신속한 정보 검색을 위해 지능형 시맨틱 에이전트를 요구하고 있다. 기존의 웹 문서의 검색은 키워드를 이용하여 해당하는 질의어가 포함된 문서 목록을 결과로 가져오며 사용자의 요구시에 내용을 제시하는 것이 일반적인 형태이다. 이는 웹 문서의 유사도와 시맨틱 관련성을 고려하지 않음으로써 사용자가 내용 검색과 분석에 많은 시간과 노력을 요구한다. 이의 해결을 위해서 빅 데이터 요소 기술인 하둡과 NoSQL을 활용하여 시맨틱 웹 문서에 포함된 키워드 빈도에 기반한 웹 문서의 유형 분류와 유사도를 제시하는 시맨틱 클러스터링 모델을 제안한다. 제안 모델은 실시간 데이터 처리가 요청되는 이종 모델을 가진 공공 데이터와 웹 데이터를 취합하여 일반 사용자가 쉽게 질의할 수 있는 대용량 지식 기반 시스템을 구축하는데 응용 모델로 활용될 수 있다.

FCA 개념 망 기반 개인정보관리 (Personal Information Management Based on the Concept Lattice of Formal Concept Analysis)

  • 김미혜
    • 인터넷정보학회논문지
    • /
    • 제6권6호
    • /
    • pp.163-178
    • /
    • 2005
  • 개인정보관리 시스템의 궁극적인 목표는 개인이 필요로 하는 정보를 수집하고 처리하여 보다 간편하고 효율적인 방법으로 정보를 검색할 수 있도록 조직화하여 관리하는데 있다. 그러나 기존의 개인정보관리 시스템은 자료 저장을 위해 전통적인 계층적 디렉터리 모델을 사용하고 있기 때문에 효율적인 정보관리 및 검색에 한계가 있으며 정보의 연관 관계에 의한 검색이 어렵다는 문제점을 가진다. 이러한 문제점들을 개선하기 위해 본 논문에서는 개인이 필요로 하는 문서를 웹상에서 쉽게 관리하고 유지할 수 있는 더불어 관리된 문서를 쉽게 검색할 수 있는 개인정보관리 메커니즘을 기계학습의 한 기법이 Fornal Concept Analysis의 개념망 모델을 이용하여 제안한다. 실험 결과는 제안된 방법이 계층적인 트리 구조의 단점을 극복하고 제한된 검색을 넘어 개념들 사이의 연관 관계에 의한 검색을 지원할 뿐만 아니라 검색 성능에 있어 계층적인 구조를 기반으로 하는 시스템보다 더 유용한 방법임을 보였다.

  • PDF

A Mobile P2P Semantic Information Retrieval System with Effective Updates

  • Liu, Chuan-Ming;Chen, Cheng-Hsien;Chen, Yen-Lin;Wang, Jeng-Haur
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권5호
    • /
    • pp.1807-1824
    • /
    • 2015
  • As the technologies advance, mobile peer-to-peer (MP2P) networks or systems become one of the major ways to share resources and information. On such a system, the information retrieval (IR), including the development of scalable infrastructures for indexing, becomes more complicated due to a huge increase on the amount of information and rapid information change. To keep the systems on MP2P networks more reliable and consistent, the index structures need to be updated frequently. For a semantic IR system, the index structure is even more complicated than a classic IR system and generally has higher update cost. The most well-known indexing technique used in semantic IR systems is Latent Semantic Indexing (LSI), of which the index structure is generated by singular value decomposition (SVD). Although LSI performs well, updating the index structure is not easy and time consuming. In an MP2P environment, which is fully distributed and dynamic, the update becomes more challenging. In this work, we consider how to update the sematic index generated by LSI and keep the index consistent in the whole MP2P network. The proposed Concept Space Update (CSU) protocol, based on distributed 2-Phase locking strategy, can effectively achieve the objectives in terms of two measurements: coverage speed and update cost. Using the proposed effective synchronization mechanism with the efficient updates on the SVD, re-computing the whole index on the P2P overlay can be avoided and the consistency can be achieved. Simulated experiments are also performed to validate our analysis on the proposed CSU protocol. The experimental results indicate that CSU is effective on updating the concept space with LSI/SVD index structure in MP2P semantic IR systems.

버전제어를 위한 소프트웨어 구성요소의 검색 시스템 (Software Component Retrieval System for Version Control)

  • 오상엽;김흥진;장덕철
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1093-1102
    • /
    • 1996
  • 소프트웨어 재사용과 형상 관리, 그리고 버전제어를 위해서는 소프트웨어 구성 요소를 검색할 수 있는 검색시스템과 라이브러리의 구성이 중요한 문제로 제기된다. 검색 시스템은 많은 구성요소(component)를 저장하고, 빠른 시간 안에 키워드를 이용 하여원하는 구성요소를 검색할 수 있어야 한다. 기존의 검색 방법은 대부분 키워드나 내용을 기반으로한 역 파일 개념 등이 사용되고 있다. 본 논문에서는 객체지향 프로 그래밍 언어인 Smallcoal에서 Set와 Bag 클래스를 이용하여 키워드를 사용하면서도 내용을 기반으로 구성요소를 찾는 검색 시스템을 제안한다. 이방법은 사용자 인터세 이스와 이를 관리하기 위한 기능을 향상시킨다. 또한, 검색시스템과 함께 라이브러 리를 제안하고, 이를 관리하고 제어하기 위한 사용자 인터페이스를 설계 구성하였다. 본 논문의 검색 시스템은 다른 언어와의 인터페이스를 통해 사용될 수 있으며, 이 시스템은 버전 제어를 위한 검색 시스템과 라이브러리를 제공한다.

  • PDF

위성영상 검색에서 사용자 관심영역을 이용한 적합성 피드백 (Relevance Feedback using Region-of-interest in Retrieval of Satellite Images)

  • 김성진;정진완;이석룡;김덕환
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.434-445
    • /
    • 2009
  • 내용 기반 영상 검색(content based image retrieval)은 영상 자체의 정보를 이용하여 유사 영상을 검색하는 기법이다. 하지만 멀티미디어 데이터는 텍스트 데이터와 달리 얻을 수 있는 데이터가 정확하지 않고 또한 시스템에서 표현되는 데이터의 저차원(low-level)의 표현법과 사용자가 인식하는 고차원(high-level)의 개념(concept)은 상당한 차이를 나타내게 된다. 즉 시스템 상에서 벡터들로 표현된 영상 데이터들이 벡터스페이스 상에서는 가깝지만 실제 사용자는 유사하지 않다고 인식하는 문제점이 발생한다. 이를 의미적 간극(semantic-gap) 문제라고 부른다. 이런 의미적 간극 문제로 인해 영상검색 결과는 좋지 않은 성능을 보이게 된다. 이를 해결하기 위해 사용자의 피드백 정보를 이용하여 질의를 수정하는 적합성 피드백 기법이 널리 사용되고 있다. 하지만 기존의 적합성 피드백은 사용자의 관심영역(region-of-interest, 이하 ROI)를 고려하지 않아 적합한(relevant) 영역의 모든 영역들이 새로운 질의 점을 계산하는 과정에서 사용된다. 시스템은 그 스스로 사용자 관심영역을 알지 못하기 때문에 적합성 피드백을 영상수준(image-level)으로 진행하기 때문이다. 이 논문에서는 복잡한 위성영상 영역 검색에서 관심영역을 사용자가 직접 선택하도록 유도하여 더욱 정확한 질의 점을 계산하여 정확도를 높이는 사용자 관심영역 적합성 피드백 방법을 제시한다. 또한 사용자가 선택하지 않은 부정확한 영상 정보를 이용하여 정확도를 향상시키는 프루닝 기법도 함께 제시한다. 실험을 통하여 사용자 관심영역 적합성 피드백의 우수성과 함께 제안한 프루닝 기법의 효율성도 함께 보여준다.

Building Domain Ontology Based on Linguistic Patterns

  • Kim, Kweon-Yang;Lim, Soo-Yeon
    • 한국지능시스템학회논문지
    • /
    • 제16권6호
    • /
    • pp.766-771
    • /
    • 2006
  • In this paper, we focus on the building domain ontology from corpus by extracting concepts and properties relationships based on linguistic patterns. The pharmacy field is selected as an experiment domain and we present an algorithm to extract hierarchical structure for terminology based on the noun/suffix patterns of terminology in domain texts. In order to show usefulness of our domain ontology, we compare a typical keyword based retrieval method with an ontology based retrieval mettled which uses related information in an ontology for a related feedback. As a result, our method shows the improvement of precision by 4.97% without losing recall.

Towards Intelligent Web Interaction

  • Takama, Yasufumi
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.134-137
    • /
    • 2003
  • Both browsing and retrieval with search engines are major operations that establish the interaction between users and the Web. Although both operations are usually combined to locate information from the Web, recent growth of the Web has overtaken the potential of this conventional interaction. This paper proposes the concept of Retrieve, Browse, and Analyze (RBA)-based interactions, as the improvement of the conventional Retrieve and Browse (RB)-based interaction. The prototype interface based on RBA-based interaction is also presented.

  • PDF

공간 위치 정보를 적합성 피드백을 위한 가중치로 사용하는 영역 기반 이미지 검색 시스템 (Region-Based Image Retrieval System using Spatial Location Information as Weights for Relevance Feedback)

  • 송재원;김덕환;이주홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권4호
    • /
    • pp.1-7
    • /
    • 2006
  • 최근 이미지 검색은 검색의 정확성을 높이고자 사용자의 요구를 반영하는 적합성 피드백에 관한 연구가 활발히 진행되고 있다. 본 논문은 이미지 검색 시 나타나는 고수준 개념과 저수준 특징 사이의 의미적 격차를 줄이기 위하여 적합성 피드백에 기반한 영역 기반 이미지 검색의 가중치 기법에 대해서 논의하고 새로운 가중치 기법을 제안한다. 새롭게 제시된 가중치 기법은 한 이미지에 존재하는 영역들의 공간적 위치에 따라 영역의 중요성을 결정한다. 실험 결과는 본 논문에서 제시된 가중치 기법이 평균 재현율에 있어서 크기 백분율 가중치 기법에 비해 약 18%, 역 이미지 빈도수를 적용한 영역 빈도수 가중치 기법에 비해 약 11% 가량 높게 나타나는 것을 보이고 있으며, 검색 시간에 있어서도 영역 빈도수 가중치에 비해 약 1/10인 것을 보이고 있다.

  • PDF

Building Intelligent User Interface Agent for Semantically Reformulating User Query in Medicine

  • Lim, Chae-Myung;Chu, Sung-Joon;Lee, Dong-Hoon;Park, Duck-Whan;Park, Tae-Young;Yang, Jung-Jin
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2003년도 Proceeding
    • /
    • pp.57-64
    • /
    • 2003
  • Achieving the beneficiary goal of recent discovery in human genome project still needs a way to retrieve and analyze the exponentially expanding bio-related information. Research on bio-related fields naturally applies knowledge discovered to the current problem and make inferences to extract new information where shared concepts and data containing information need to be defined and used in a coherent way. In such a professional domain, while the need to help users reduce their work and to improve search results has been emerged. methods for systematic retrieval and adequate exchange of relevant information are still in their infancy. The design of our system aims at improving the quality of information retrieval in a professional domain by utilizing both corpus-based and concept-based ontology. Meta-rules of helping users to make an adequate query are formed into an ontology in the domain. The integration of those knowledge permits the system to retrieve relevant information in a more semantic and systematic fashion. This work mainly describes the query models with details of GUI and a secondary query generation of the system.

  • PDF

볼트의 자동공정계획수립을 위한 CBR시스템의 개발 (Developing CBR System for Bolt's CAPP)

  • 김진백
    • Asia pacific journal of information systems
    • /
    • 제9권2호
    • /
    • pp.19-37
    • /
    • 1999
  • Computer aided process planning(CAPP) is a key for implementing CIM. It is bridge between CAD and CAM and translates the design information into manufacturing instructions. Generally, manufacturing is an area where intelligent systems will not be able to rely on methods requiring formalized knowledge. Manufacturing lacks a body of knowledge that is specific, formalized, and rigorous, and which can be coded as rules or procedures. Thus expertise in manufacturing is developed over a period of many years. Case-based reasoning(CBR) offers a new approach for developing intelligent system. In the case-based approach the problem solving experience of the experts is encoded in the form of cases. CBR's retrieval process can be divided to two step. The first step is matching step, and the second step is selection step. For selecting base case, new preference heuristics were introduced using similarity concept. Similarity concept has three has three dimensions, i.e. entity similarity, structural similarity, and goal similarity. In this paper, bolt's process planning was selected an application domain. Following the test result, the new preference heuristics were approved as a useful procedure in CAPP.

  • PDF