• 제목/요약/키워드: Distributed Information Retrieval

검색결과 169건 처리시간 0.029초

Protecting the iTrust Information Retrieval Network against Malicious Attacks

  • Chuang, Yung-Ting;Melliar-Smith, P. Michael;Moser, Louise E.;Lombera, Isai Michel
    • Journal of Computing Science and Engineering
    • /
    • 제6권3호
    • /
    • pp.179-192
    • /
    • 2012
  • This paper presents novel statistical algorithms for protecting the iTrust information retrieval network against malicious attacks. In iTrust, metadata describing documents, and requests containing keywords, are randomly distributed to multiple participating nodes. The nodes that receive the requests try to match the keywords in the requests with the metadata they hold. If a node finds a match, the matching node returns the URL of the associated information to the requesting node. The requesting node then uses the URL to retrieve the information from the source node. The novel detection algorithm determines empirically the probabilities of the specific number of matches based on the number of responses that the requesting node receives. It also calculates the analytical probabilities of the specific numbers of matches. It compares the observed and the analytical probabilities to estimate the proportion of subverted or non-operational nodes in the iTrust network using a window-based method and the chi-squared statistic. If the detection algorithm determines that some of the nodes in the iTrust network are subverted or non-operational, then the novel defensive adaptation algorithm increases the number of nodes to which the requests are distributed to maintain the same probability of a match when some of the nodes are subverted or non-operational as compared to when all of the nodes are operational. Experimental results substantiate the effectiveness of the detection and defensive adaptation algorithms for protecting the iTrust information retrieval network against malicious attacks.

웨이블릿 변환을 이용한 실시간 화재 감지 알고리즘 (Development of Web-based Bio-Image Retrieval System)

  • Cheong, Kwang-Ho;Ko, Byoung-Chul;Nam, Jae-Yeal
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.227-230
    • /
    • 2006
  • A content-based image retrieval system using MPEG-7 is designed and implemented in this thesis. The implemented system uses existing MPEG-7 Visual Descriptors. In addition, a new descriptor for efficient retrieval of bio images is proposed and utilized in the developed content-based image retrieval system. Comparing proposed CBSD(Compact Binary Shape Descriptor) with Edge Histogram Descriptor(EHD) and Region Shape Descriptor(RSD), it shows good retrieval performance in NMRR. The proposed descriptor is robust to large modification of brightness and contrast and especially improved retrieval performance to search images with similar shapes. Also proposed system adopts distributed architecture to solve increased server overload and network delay. Updating module of client efficiently reduces downloading time for metadata. The developed system can efficiently retrieve images without causing server's overload.

  • PDF

A study on constructing GIS component repository on web using registration/retrieval agents

  • Jo, Myung-Hee;Jo, Yun-Won;Bu, Ki-Dong
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.949-951
    • /
    • 2003
  • To improve the reusability and interoperability of GIS components, we propose the registration/retrieval agents, which can search the locating of users' frequently used components in not only the GIS domain but also other spatial information technologies such as GPS, ITS, RS and FM. The registration/retrieval agents increase the reusability through the GIS component based development under distributed GIS components environment and enables the rapid setting of application on the web. Moreover, users can understand easily the information of GIS component and have the effective investment, timeliness and reliability while they have less maintenance effort by agent. In order to design and implement this system on web, HTML and ASP (Active Serve Page), and JAVA were used. In addition, the performance of this system was verified through comparing others, which are similar to.

  • PDF

분산 저장된 과학기술정보 서비스를 위한 검색 데이터베이스 관리 도구의 설계 및 개발 (Development of the Management Tool for S&T information in distributed retrieval database)

  • 이석형;윤희준;여일연;최성필;윤화묵
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.677-681
    • /
    • 2006
  • 본 논문에서는 과학기술정보의 관리에 필요한 여러 기능을 포함하는 GUI 기반의 검색 데이터베이스 관리 도구(K-Manager)를 제안한다. 일반적으로, 웹 기반의 과학기술정보 서비스를 위해서는 검색 데이터베이스의 구성이 필수적이나, 검색 데이터베이스의 관리 기능이 관계형 데이터베이스와 같은 기능을 모두 지원하지 않을 뿐 만 아니라 TOAD나 GOLDEN과 같은 데이터베이스 관리 도구를 지원하지 않기 때문에, 콘텐츠 관리자나 시스템 관리자가 손쉽게 정보를 처리하기가 어려운 실정이다. 이 도구에는 과학기술정보를 관리하는 콘텐츠 관리자가 필요한 기능과 검색 데이터베이스를 관리하는 시스템 관리자가 필요한 기능이 GUI 기반으로 통합 구성되어 있어 콘텐츠 관리자가 원하는 데이터베이스에 접근하여 각종 데이터 작업을 수행할 수 있고, 데이터베이스 관리자가 데이터베이스의 관리도 수행할 수 있다. 특히 K-Manager는 대용량 과학기술정보의 빠르고 정확한 검색 서비스와 안정적인 관리를 위해 구성된, 분산 검색 데이터베이스에 저장된 정보를 처리하는데 효과적이다. 본 관리 도구는 크게 콘텐츠 관리기와 데이터베이스 관리기로 그 기능을 분류할 수 있으며, 국내 최대 과학기술 포털사이트인 Yeskisti의 콘텐츠 및 데이터베이스 관리를 그 기본 모델로 하였다.

  • PDF

2-포아송 모형의 전문검색시스템 응용에 관한 연구 (Application of the 2-Poisson Model to Full-Text Information Retrieval System)

  • 문성빈
    • 정보관리학회지
    • /
    • 제16권3호
    • /
    • pp.49-63
    • /
    • 1999
  • 본 연구는 질문용어의 분포가 초록/표제 및 전문으로 표현된 문헌 내에서 2-포아송 분포를 따르고 있는지를 조사하였으며 질문용어의 2-포아송 분포여부가 확률이론에 기반을 둔 이진독립모형과 2-포아송 독립모형에서 초록/표제 및 전문의 검색효율성에 미치는 영향을 비교 분석하였다.

  • PDF

A Mobile P2P Semantic Information Retrieval System with Effective Updates

  • Liu, Chuan-Ming;Chen, Cheng-Hsien;Chen, Yen-Lin;Wang, Jeng-Haur
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권5호
    • /
    • pp.1807-1824
    • /
    • 2015
  • As the technologies advance, mobile peer-to-peer (MP2P) networks or systems become one of the major ways to share resources and information. On such a system, the information retrieval (IR), including the development of scalable infrastructures for indexing, becomes more complicated due to a huge increase on the amount of information and rapid information change. To keep the systems on MP2P networks more reliable and consistent, the index structures need to be updated frequently. For a semantic IR system, the index structure is even more complicated than a classic IR system and generally has higher update cost. The most well-known indexing technique used in semantic IR systems is Latent Semantic Indexing (LSI), of which the index structure is generated by singular value decomposition (SVD). Although LSI performs well, updating the index structure is not easy and time consuming. In an MP2P environment, which is fully distributed and dynamic, the update becomes more challenging. In this work, we consider how to update the sematic index generated by LSI and keep the index consistent in the whole MP2P network. The proposed Concept Space Update (CSU) protocol, based on distributed 2-Phase locking strategy, can effectively achieve the objectives in terms of two measurements: coverage speed and update cost. Using the proposed effective synchronization mechanism with the efficient updates on the SVD, re-computing the whole index on the P2P overlay can be avoided and the consistency can be achieved. Simulated experiments are also performed to validate our analysis on the proposed CSU protocol. The experimental results indicate that CSU is effective on updating the concept space with LSI/SVD index structure in MP2P semantic IR systems.

메타데이터 정보를 이용한 분산 KRISTAL-2002 시스템의 통합 검색 시스템 개발 (Development of an Integrated Retrieval System on Distributed KRISTAL-2002 Systems with Metadata Information)

  • 최귀자;김재곤;서정현;조한형;이민호;정창후;박동인;남영광
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.135-150
    • /
    • 2005
  • 본 논문에서는 메타데이터fmf 이용하여 분산된 KRISTAL-2002 기반의 시스템을 통합 검색하는 정보검색시스템의 구현 방법을 제안한다. 이 시스템은 서로 다른 분야에서 사용되고 있는 기개발된 정보검색시스템을 통한 검색하거나, 같은 분야의 시스템이라도 스키마가 다를 경우에 이를 사용자가 마치 하나의 시스템에서 검색하는 것과 같은 통합검색을 수행할 수 있도록 해준다. 본 시스템은 통합메타데이터베이스와 원천서버간의 스키마 매핑을 지원하는 원천서버관리기, 메타데이터를 등록하고 원천서버의 정보와 통합 메타데이터간의 매핑을 관리하고 지원하는 통합메타데이터 관리기, 통합검색을 위한 사용자 신의를 각 원천서버에 적합한 질의로 생성하여 처리하는 분산질의 처리기, 검색된 결과를 통합하여 사용자 화면으로 출력하기 위해 HTML 문서로 변환하는 분산 데이터 셋 관리기, 그리고 통합검색을 위한 통합검색 엔진으로 구성되어 있다. 통합메타데이터는 본 시스템의 일부분인 메타데이터 등록기를 이용하여 ISO/IEC 11179에서 정의된 표준화된 절차고 등록되었다고 가정하여 사용하였다. 사용자는 하나의 통합시스템에서 검색하는 것과 같이 통합검색 화면에서 검색대상 시스템을 선정하고 기본검색과 상세검색을 수행하며, 분야별 혹은 기관별로 검색하고 결과를 볼 수 있도록 하였다. 본 시스템은 KRISTAL-2002 시스템을 기반으로 Visual C++와 C++ CGI를 이용하여 리눅스 상에서 개발되었으며 6개의 서로 다른 데이터베이스fmf 이용하여 실험, 검증하였다.

메타정보 인터페이스를 이용한 이질 구조 분석 XML문서 통합 검색 (Integrated Information Retrieval with Metadata Interface for Heterogeneous Distributed XML Documents)

  • 류성준;황재문;김태훈;남영광
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권11호
    • /
    • pp.1505-1518
    • /
    • 2004
  • 본 논문은 구조적, 의미론적 이질성을 가진 분산 XML 문서의 통합 검색을 위해 반자동으로 생성된 인터페이스를 통해 각 지역 문서에 대한 질의를 생성하여 검색하는 방법을 제안한다. 본 시스템에서는 데이타 통합을 위한 메타데이타 인터페이스인 DDXMI(Distributed Documents XML Metadata Interface)를 정의하고, 분산 데이타에 대한 DTD를 입력으로 받아 사용자로 하여금 전역 DTD와 각 지역 DTD 간의 의미 차이를 극복하기 위한 사용자 인터페이스 생성 방법을 제안하였다. 전역 DTD와 지역 DTD의 특성을 고려하여 인덱스 매핑과 그에 필요한 함수 이름의 매핑 정보를 기반으로 DDXMI가 자동으로 생성된다. XML 질의 언어인 Quilt를 사용하여 생성된 DDXMI를 통해 각 지역 문서에 적합한 질의를 생성, 수행한다 사용자는 검색 대상 문서의 스키마와 통합스키마의 구조를 잘 알고 있다고 가정하였다. XML로 만들어진 석박사 논문, 논문지, 연구보고서에 대한 소규모, 중규모 전역 DTD를 만들어 실제로 질의를 생성하여 검색 결과를 검증할 수 있도록 하였다. 본 시스템은 JavaCC와 Java 서블릿을 이용하여 개발하였다.

Formal Modeling and Verification of an Information Retrieval System using SMV

  • Kim, Jong-Hwan;Park, Hea-Sook;Baik, Doo-Kwon
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2001년도 The Seoul International Simulation Conference
    • /
    • pp.141-146
    • /
    • 2001
  • An Information Retrieval System offers the integrated view of SCM(Supply Chain Management) information to the enterprise by making it possible to exchange data between regionally distributed heterogeneous computers and also to enable these computers to access various types of databases. The Information Retrieval System is modeled using Data Registry Model based on X3.285. We only verify the MetaData Registry Manager(MDR Manager) among the core parts using SMV(Symbolic Model Verifier) in order to verify whether our model satisfies the requirements under the given assumptions.

  • PDF

TMDR 기반의 실시간 통합 검색을 위한 분산질의 변환 기법에 대한 연구 (A Study on Distribution Query Conversion Method for Real-time Integrating Retrieval based on TMDR)

  • 황치곤;신효영;정계동;최영근
    • 한국정보통신학회논문지
    • /
    • 제14권7호
    • /
    • pp.1701-1707
    • /
    • 2010
  • 본 연구는 분산된 이종 정보시스템 사이의 의미적 상호운용성을 제공함으로써 다양한 형태의 데이터를 실시간으로 통합하여 검색할 수 있는 시스템 환경을 구현하는데 있다. 의미적 상호운용성은 온톨로지의 집합체인 TMDR(Topicmaps Metadata Registry)을 제공함으로써 가능하다. TMDR은 MDR(MetaData Registry)과 토픽맵을 결합하여 데이터베이스에 저장한 것으로, 분산 쿼리 작성과 효율적으로 지식을 제공할 수 있다. MDR은 분산된 데이터 관리를 위한 메타데이터 관리 기법이며, 토픽맵은 지식 데이터의 접근을 위한 계층성과 연관성을 고려한 온톨로지 표현 기법이다. 우리는 온톨로지의 한 형태인 TMDR을 제안하고, 이는 데이터와 스키마 레벨에서 의미적 충돌을 탐지하고 해결할 수 있다. 본 시스템은 이종의 정보 소스들을 통합 접근하기 위한 쿼리 프로세싱 기법을 제안한다. 이는 기존의 검색과 달리 주제를 중심으로 한 연관관계를 제공함으로써 효율적임 검색과 추론이 가능하다.