• Title/Summary/Keyword: 색인기법

Search Result 654, Processing Time 0.028 seconds

A Study on Indexing Method for Advanced Retrieval System using Semantics Attributes in XML Links (XML 링크의 의미 속성을 이용한 개선된 검색 시스템을 위한 색인 기법에 대한 연구)

  • Kim, Eun-Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1855-1858
    • /
    • 2002
  • XML 문서에 대한 검색은 문서내 색인어 발생 빈도에 의한 내용 검색과 문서내 특정 엘리먼트에 의한 구조 검색 그리고 내용과 구조를 모두 검색하는 혼합 검색 등이 있다. 본 논문에서는 사용자의 질의에 대하여 문서에 의존하는 것이 아니라, 링크를 검색하여 특정 색인어에 대하여 가장 많은 링크를 설정 받은 문서 또는 특정 엘리먼트를 검색하는 새로운 검색 시스템을 설계한다. 이를 위해 XML 문서를 저장할 때 구조 정보와 함께 링크 정보를 저장하고 XML 링크에서 의미 속성인 ROLE, TITLE을 색인한다. 제안된 색인 모델에서는 정보를 찾는 사용자들의 질의를 보다 다양한 시각에서 검색할 수 있으며, 따라서 이러한 사용자들의 질의 유형과 그 처리 과정을 설명하고 의미를 분서한다.

  • PDF

Grid Decomposition Indexing Method for Efficient Filtering in Spatial Database (공간 데이터베이스에서 효율적인 여과를 위한 격자 분할 색인 기법)

  • 박정민;김성희;이순조;배해영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.31-33
    • /
    • 2001
  • 고비용의 공간 연산을 수행해야 하는 공간 질의 처리는 여과-정제의 2단계 처리가 일반적이다. 그러나, 2단계 색인 방법은 여과율이 좋지 못한 단점이 있으므로, 최근 다단계 여과 과정이 많이 연구되고 있다. 다단계 여과 과정은 1차 여과된 객체에 대하여 더욱 정밀한 필터를 적용함으로써 후부 객체 수를 줄이는 방법으로 접근하고 있으나, 여러 번의 여과 단계를 거치므로 수행 시간이 길어지고 추가 정보유지로 인한 저장 공간 낭비 등의 단점이 있다. 본 논문에서는 전체 공간 영역을 격자로 분할하고, 객체를 격자 위에 구성하는 2단계의 공간 색인 방법을 제안한다. 제안된 색인 방법은 Dead Space의 크기를 줄이고, 한 번의 여과 과정으로 높은 여과율을 갖는다.

  • PDF

The Design and Implementation of System for providing mobile may service in Wireless Devices (무선 단말기에서 지도 서비스를 위한 시스템의 설계 및 구현)

  • 이재호;임덕성;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04b
    • /
    • pp.46-48
    • /
    • 2002
  • 무선 네트웍을 통해 공간 데이터를 요청하고 수신하는 PDA에서 지도 정색을 하기 위해 캐쉬와 공간 색인을 사용하는 한정을 대상으로 한다. 서 대로부터 전송되는 공간 객체들은 캐쉬된 영역의 공간 객체와 중복이 발생하므로 이에 대한 처리 방법이 필요하다. 또한 추가되는 영역의 공간 데이터를 색인에 추가하는 연산은 Bulk-Insertion기법이 효과적이지만 추가영역에 대한 색인 구축 연산이 무선 단말기에 부하를 준다. 그리고 교체로 인한 캐쉬 영역 삭제 시에도 신속한 영역 단위의 삭제 방법이 필요하다 이 논문에서는 먼저 중복 객체에 대한 처리 방법을 분류하고 Bulk-operation을 통해 캐쉬 영역의 빠른 색인 삽입, 삭제 연산을 수행하는 지도 서비스를 위한 시스템을 계시한다. 무선 단말기에 집중된 부하를 분산시키고 성능 향상을 위해 에이전트를 이용한 시스템을 설계하고 구현한다. 구현하여 실험한 결과 클리핑 방법이 효과적이며 전체적인 성능 향상을 보인다

  • PDF

Term Clustering and Interleaving for Parallel Information Retrieval (색인어 군집화를 이용한 효율적인 병렬정보검색시스템)

  • 강재호;양재완;정성원;류광렬;권혁철;정상화
    • Proceedings of the Korea Inteligent Information System Society Conference
    • /
    • 2002.05a
    • /
    • pp.401-409
    • /
    • 2002
  • 인터넷과 같은 대량의 정보에 대응할 수 있는 고성능 정보검색시스템을 구축하기 위해서는 지금까지 고가의 중대형 컴퓨터를 주로 활용하여 왔으나, 최근 가격대 성능비가 높은 PC 클러스터 시스템을 활용하는 방안이 경제적인 대안으로 떠오르고 있다. PC 클러스터 상에서의 병렬정보검색시스템을 효율적으로 운영하기 위해서는 사용자가 입력한 질의를 처리하는데 요구되는 개별 PC의 디스크 I/O 및 검색관련 연산을 모든 PC에 가능한 균등하게 분배할 필요가 있다. 본 논문에서는 같은 질의에 동시에 등장할 가능성이 높은 색인어들끼리 군집 화하고 생성된 군집을 활용하여 색인어들을 각 PC에 분산저장함으로써 보다 높은 수준의 병렬화를 달성할 수 있는 방안을 제시한다. 대용량 말뭉치를 활용한 실험결과 본 논문에서 제시하는 분산저장기법이 충분한 효율성을 가지고 있음을 확인하였다.

  • PDF

Range Continuous Queries for Efficient Processing of Continuous Queries on RFID streaming data (RFID 스트리밍 데이터의 효율적인 연속 질의처리를 위한 영역 연속 질의)

  • Yi, Ki-Han;Park, Jae-Kwan;Hong, Bong-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.425-428
    • /
    • 2006
  • RFID 미들웨어에서 처리하는 데이터는 스트림 데이터로써 질의색인 기법을 사용하면 효과적이다. 질의색인에서는 RFID 미들웨어의 표준 질의 인터페이스인 ECSpec 이 데이터가 되고, 리더가 태그를 인식하면서 발생하는 태그 이벤트는 질의 색인의 점 칠의가 된다. 질의색인의 데이터인 EXSpec 은 태그 및 리더에 대한 수집 조건과 결과집합의 보고 주기를 포함한다. 이때, 태그 이벤트가 발생할 때마다 점 질의를 즉시 수행하는 것보다 보고 주기까지 지연하고 수집된 질의 집합에서 연속되는 태그 이벤트를 영역 질의로 수행하면 질의 수행 횟수를 줄일 수 있다. 본 논문에서는 일정기간 동안의 연속된 태그 이벤트를 영역 연속 질의(a range continuous query)로 처리하기 위한 큐의 구성 방안과 태그 이벤트 집합으로부터 영역질의를 구성하기 위한 자료구조 및 알고리즘을 제안한다.

  • PDF

A Spatial Split Method for Processing of Region Monitoring Queries (영역 모니터링 질의 처리를 위한 공간 분할 기법)

  • Chung, Jaewoo;Jung, HaRim;Kim, Ung-Mo
    • Journal of Internet Computing and Services
    • /
    • v.19 no.1
    • /
    • pp.67-76
    • /
    • 2018
  • This paper addresses the problem of efficient processing of region monitoring queries. The centralized methods used for existing region monitoring query processing assumes that the mobile object periodically sends location-updates to the server and the server continues to update the query results. However, a large amount of location updates seriously degrade the system performance. Recently, some distributed methods have been proposed for region monitoring query processing. In the distributed methods, the server allocates to all objects i) a resident domain that is a subspace of the workspace, and ii) a number of nearby query regions. All moving objects send location updates to the server only when they leave the resident domain or cross the boundary of the query region. In order to allocate the resident domain to the moving object along with the nearby query region, we use a query index structure that is constructed by splitting the workspace recursively into equal halves. However, However, the above index structure causes unnecessary division, resulting in deterioration of system performance. In this paper, we propose an adaptive split method to reduce unnecessary splitting. The workspace splitting is dynamically allocated i) considering the spatial relationship between the query region and the resultant subspace, and ii) the distribution of the query region. We proposed an enhanced QR-tree with a new splitting method. Through a set of simulations, we verify the efficiency of the proposed split methods.

User-based Collaborative Filtering Recommender Technique using MapReduce (맵리듀스를 이용한 사용자 기반 협업 필터링 추천 기법)

  • Yun, So-young;Youn, Sung-dae
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2015.10a
    • /
    • pp.331-333
    • /
    • 2015
  • Data is increasing explosively with the spread of networks and mobile devices and there are problems in effectively processing the rapidly increasing data using existing recommendation techniques. Therefore, researches are being conducted on how to solve the scalability problem of the collaborative filtering technique. In this paper applies MapReduce, which is a distributed parallel process framework, to the collaborative filtering technique to reduce the scalability problem and heighten accuracy. The proposed technique applies MapReduce and the index technique to a user-based collaborative filtering technique and as a method which improves neighbor numbers which are used in similarity calculations and neighbor suitability, scalability and accuracy improvement effects can be expected.

  • PDF

Top-down Hierarchical Clustering using Multidimensional Indexes (다차원 색인을 이용한 하향식 계층 클러스터링)

  • Hwang, Jae-Jun;Mun, Yang-Se;Hwang, Gyu-Yeong
    • Journal of KIISE:Databases
    • /
    • v.29 no.5
    • /
    • pp.367-380
    • /
    • 2002
  • Due to recent increase in applications requiring huge amount of data such as spatial data analysis and image analysis, clustering on large databases has been actively studied. In a hierarchical clustering method, a tree representing hierarchical decomposition of the database is first created, and then, used for efficient clustering. Existing hierarchical clustering methods mainly adopted the bottom-up approach, which creates a tree from the bottom to the topmost level of the hierarchy. These bottom-up methods require at least one scan over the entire database in order to build the tree and need to search most nodes of the tree since the clustering algorithm starts from the leaf level. In this paper, we propose a novel top-down hierarchical clustering method that uses multidimensional indexes that are already maintained in most database applications. Generally, multidimensional indexes have the clustering property storing similar objects in the same (or adjacent) data pares. Using this property we can find adjacent objects without calculating distances among them. We first formally define the cluster based on the density of objects. For the definition, we propose the concept of the region contrast partition based on the density of the region. To speed up the clustering algorithm, we use the branch-and-bound algorithm. We propose the bounds and formally prove their correctness. Experimental results show that the proposed method is at least as effective in quality of clustering as BIRCH, a bottom-up hierarchical clustering method, while reducing the number of page accesses by up to 26~187 times depending on the size of the database. As a result, we believe that the proposed method significantly improves the clustering performance in large databases and is practically usable in various database applications.

An Index Structure based on Space Partitions and Adaptive Bit Allocations for Multi-Dimensional Data (다차원 데이타를 위한 공간 분할 및 적응적 비트 할당 기반 색인 구조)

  • Bok, Kyoung-Soo;Kim, Eun-Jae;Yoo, Jae-Soo
    • Journal of KIISE:Databases
    • /
    • v.32 no.5
    • /
    • pp.509-525
    • /
    • 2005
  • In this paper, we propose the index structure based on a vector approximation for efficiently supporting the similarity search of multi-dimensional data. The proposed index structure splits a region with the space partition method and allocates to the split region dynamic bits according to the distribution of data. Therefore, the index structure splits a region to the unoverlapped regions and can reduce the depth of the tree by storing the much region information of child nodes in a internal node. Our index structure represents the child node more exactly and provide the efficient search by representing the region information of the child node relatively using the region information of the parent node. We show that our proposed index structure is better than the existing index structure in various experiments. Experimental results show that our proposed index structure achieves about $40\%$ performance improvements on search performance over the existing method.

lpCSB+- tree : An Enhanced Main Memory Index Structure Employing the Level Prefetching Technique (lpCSB+-트리 : 레벨 프리페칭 기법을 이용하는 향상된 주기억장치 상주형 색인구조)

  • Hong Hyun Taek;Pee Jun Il;Song Seok Il;Yoo Jae Soo
    • Journal of KIISE:Databases
    • /
    • v.31 no.6
    • /
    • pp.675-683
    • /
    • 2004
  • In main-memory resident index structures, secondary cache misses considerably have an effect on the performance of index structures. Recently, several main-memory resident index structures that consider cache have been proposed to reduce the impact of secondary cache misses. However they still suffer from full secondary cache misses whenever visiting each level of a index tree. In this paper, we propose a new index structure that eliminates cache misses even when visiting each level of index tree. The proposed index structure prefetches the grandchildren of a current node. The basic structure of the proposed index structure is from CSB+-tree that uses the concepts of the node group to increase fan-out. However the insert algorithm of the proposed index structure reduces the cost of a split significantly. Also, we show the superiority of our algorithm through various performance evaluation.