• 제목/요약/키워드: Hash index

검색결과 47건 처리시간 0.026초

다차원 데이터 및 동적 이용자 선호도를 위한 색인 구조의 연구 (An Index Structure for Efficiently Handling Dynamic User Preferences and Multidimensional Data)

  • 최종혁;류관희;나스리디노프 아지즈
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권7호
    • /
    • pp.925-934
    • /
    • 2017
  • 다차원 색인 구조 중 대표적인 것은 R-tree에 기초한 색인으로써 공간 정보 등에 있어 강력한 성능을 보인다. 하지만 R-tree의 경우 차원의 수가 증가하거나 이용자 선호에 따라 부분 차원만을 이용하는 경우, 색인을 생성하는 시간이 크게 증가하고 생성된 색인의 효율성이 감소하는 문제를 갖고 있다. 따라서 지속적으로 차원이 증가하고 있는 최근의 다차원 데이터에는 해당 방법들은 적합하지 않다. 본 논문에서는 이런 문제를 해결하기 위해 해시 색인에 기반한 새로운 다차원 색인 구조인 다차원 해시 색인을 제안한다. 다차원 해시 색인은 해시 함수를 통해 데이터들을 유클리드 공간의 버킷들로 분류하여 색인을 생성하고 이후 탐색이 요청되었을 때 이용자 선호도에 따라 선택된 부분 차원의 공간을 탐색할 수 있는 해시 탐색 트리를 생성하여 효과적인 탐색을 수행한다. 실험 결과, 해당 기법은 R-tree와 비교하여 색인 생성에 있어 매우 큰 성능의 향상과 함께 탐색에서도 유사한 탐색 성능을 보이는 것을 확인할 수 있었다.

가상 메시 오버레이 네트워크상에서의 P2P VOD 서비스를 위한 클러스터 세그먼트 인덱스 기법 (Clustered Segment Index Scheme for P2P VOD Service on Virtual Mesh Overlay Network)

  • 림펑언;최황규
    • 전기학회논문지
    • /
    • 제65권6호
    • /
    • pp.1052-1059
    • /
    • 2016
  • Video-on-Demand(VoD) is one of the most popular media streaming which attracted many researchers' attention. VMesh is one of the most cited works in the field of the VoD system. VMesh is proposed to solve the problem of random seeking functionality. However, a large number of the DHT(Distributed Hash Table) searches in VMesh is sill the main problem which needs to be solved. In order to reduce the number of the DHT searches, the clustered segment index(CSI) scheme is proposed. In this scheme, the video segments are divided into clusters. The segment information of the video segments, which are clustered into the same cluster, are stored in the same clustered segment index that can be searched by using the hash key. Each peer also can request the required segments by using this clustered segment index. The experiment results show that the number of the DHT searches in the proposed scheme is less than that of VMesh even in case of peers leave and join the network or peers perform the fast forward/backward operations.

Hyper-TH : 실시간 주기억장치 데이터베이스 시스템을 위한 색인기법 (Hyper-TH : An Index Mechanism for Real-Time Main Memory Database Systems)

  • 민영수;신재룡;이병엽;유재수
    • 정보기술과데이타베이스저널
    • /
    • 제8권2호
    • /
    • pp.103-114
    • /
    • 2001
  • In this paper, we propose an efficient index mechanism for real-time main memory database systems. Existing main memory index structures based on the tree can effectively support range searches. However, it doesn't guarantee the real-time characteristic because difference between the access time of a node and an average access time can be high. The index structures based on the hash have always a regular random access time on the simple searches and that speed is very fast. However they do not support range searches. To solve such problems, we propose a new index mechanism called Hyper Tree-Hash (Hyper-TH) that combines ECBH (Extendible Chained Bucket Hashing) and T*-tree. ECBH can be dynamically extended and has a very fast access time. T*-tree effectively supports the range searches. We show through our experiments that the proposed mechanism outperforms existing other index structures.

  • PDF

HashMap 기반의 트라이를 이용한 파일 내용 검색 프로그램 (File Content Retrieval Program Using HashMap-based Trie)

  • 김성완;이우순
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.467-468
    • /
    • 2014
  • 본 논문에서는 파일 내용 기반 검색 프로그램을 설계하고 구현하였다. 역 인덱스 구조를 이용하여 설계하였으며 별도의 정보 검색 라이브러리 사용 없이 구현하였다. 인덱스 파일은 트라이 자료 구조를 직접 설계 및 구현 하였으며 자바 언어의 HashMap 구조를 중첩 형태로 구현하였다. 개발 시스템의 유용성을 테스트하기 위해 GRE 단어집에 수록된 약 3,300개의 단어를 사용하여 임의 생성한 텍스트 파일 집합을 사용하였다.

  • PDF

효과적인 이미지 검색을 위한 연장 해쉬(Extendible hash) 기반 인덱싱 및 검색 기법 (Indexing and Matching Scheme for Content-based Image Retrieval based on Extendible Hash)

  • 탁윤식;황인준
    • 전기전자학회논문지
    • /
    • 제14권4호
    • /
    • pp.339-345
    • /
    • 2010
  • 보다 빠른 내용 기반 이미지 검색을 위해, 다차원 특징 정보의 효과적인 인덱싱에 대한 다양한 연구들이 수행되고 있다. 하지만, 대부분의 인덱싱 기법들은 특징 정보의 차원이 커질수록 성능이 저하되는 문제를 가지고 있으며, 이를 대체하기 위해서 '높은 확률'로써 사용자가 원하는 결과를 제공해 주기 위한 휴리스틱 (heuristic) 알고리즘을 사용한 기법들이 제안되었다. 본 논문에서는 이러한 다차원 특징 정보를 효과적으로 인덱싱 하기 위해, 연장 해쉬 기반의 새로운 인덱싱 기법을 제안한다. 제안된 인덱싱 기법은 기존의 기법들이 가졌던 문제들을 해결하기 위해, 검색의 정확도에 영향을 주지 않으면서 빠른 검색이 가능하도록 설계되었다. 다양한 실험을 통해, 제안된 기법이 월등한 성능을 가질 수 있음을 보였다.

이동체의 현재 위치 색인을 위한 동적 해슁 구조의 설계 및 구현 (Design and Implementation of the dynamic hashing structure for indexing the current positions of moving objects)

  • 전봉기
    • 한국정보통신학회논문지
    • /
    • 제8권6호
    • /
    • pp.1266-1272
    • /
    • 2004
  • 위치 기반 서비스는 이동체의 위치에 종속적인 결과를 얻는 위치 기반 질의를 필요로 한다. 이동체의 위치는 연속적으로 변하기 때문에, 이동체의 색인은 변경된 위치 정보를 유지하기 위하여 빈번한 갱신 연산을 수행해야 한다. 기존의 공간 색인들(그리드 파일, R-트리, KDB-트리 등)은 정적 데이터를 검색하는데 효과적인 색인이다. 이들 색인은 연속적으로 위치 데이터가 변경되는 이동체 데이터베이스의 색인으로는 적합하지 않다. 본 논문에서는 삽입/삭제 비용이 적은 동적 해슁 색인을 제안한다. 동적 해슁 색인 구조는 해쉬와 트리를 결합한 동적 해슁 기술을 공간 색인에 적용한 것이다. 실험 결과에서 동적 해슁 색인은 $R^*$-tree와 고정 그리드 보다 성능이 우수하였다.

이동체 데이터베이스를 위한 색인 구조의 비용모델 (Cost Model of Index Structures for Moving Objects Databases)

  • 전봉기
    • 한국정보통신학회논문지
    • /
    • 제11권3호
    • /
    • pp.523-531
    • /
    • 2007
  • 본 논문에서는 이동체들을 관리하기에 적합한 새로운 색인 기법을 개발하고, 이 기법의 비용 모델을 제안한다. 또한 삽입/삭제 비용이 적은 동적 해싱 색인을 제안한다. 동적 해싱 색인 구조는 해쉬와 트리를 결합한 동적 해싱 기술을 공간 색인에 적용한 것이다. 본 논문에서는 이동체의 빈번한 위치 변경에 대한 비용 모델과 동적 색인 구조를 분석하였고, 성능 평가 실험을 통하여 검증하였다. 실험 결과에서 새로이 제안하는 색인 기법(동적 해싱 색인)은 R-tree와 고정 그리드 보다 성능이 우수하였다.

벡터 블룸 필터를 사용한 IP 주소 검색 알고리즘 (IP Address Lookup Algorithm Using a Vectored Bloom Filter)

  • 변하영;임혜숙
    • 전기학회논문지
    • /
    • 제65권12호
    • /
    • pp.2061-2068
    • /
    • 2016
  • A Bloom filter is a space-efficient data structure popularly applied in many network algorithms. This paper proposes a vectored Bloom filter to provide a high-speed Internet protocol (IP) address lookup. While each hash index for a Bloom filter indicates one bit, which is used to identify the membership of the input, each index of the proposed vectored Bloom filter indicates a vector which is used to represent the membership and the output port for the input. Hence the proposed Bloom filter can complete the IP address lookup without accessing an off-chip hash table for most cases. Simulation results show that with a reasonable sized Bloom filter that can be stored using an on-chip memory, an IP address lookup can be performed with less than 0.0003 off-chip accesses on average in our proposed architecture.

편중 데이타의 효율적인 처리를 위한 공간 해쉬 스트립 조인 알고리즘 (A Spatial Hash Strip Join Algorithm for Effective Handling of Skewed Data)

  • 심영복;이종연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.536-546
    • /
    • 2005
  • 이 논문은 공간 조인연산 시 인덱스가 존재하지 않는 두 입력 테이블에 대한 후보 객체들의 여과 단계 처리이다 이 분야에 대한 기존 알고리즘들은 대개 공간 데이타의 조인 연산에서는 우수한 성능을 나타내고 있지만 입력 테이블에 객체들이 편중되어 있을 경우 성능이 저하되는 문제를 가지고 있으며, 이러한 단점을 보완할 수 있는 방법에 대한 연구는 미흡한 상태이다 따라서, 이 논문에서는 인덱스가 존재하지 않는 두 입력 테이블의 편중된 객체에 대한 문제를 해결하기 위해 기존 연구인 Spatial Hash Join 알고리즘을 개선한 Spatial Hash Strip loin 알고리즘을 제안한다. SHSJ 알고리즘과 기존 SHJ 알고리즘의 차이점은 입력 데이타 집합을 버킷에 할당 시 버킷 용량에 제한을 두지 않는다는 점과 버킷의 조인 단계에서 SSSJ 알고리즘을 사용한다는 것이다. 제안한 SHSJ 알고리즘의 성능 평가를 위해 Tiger/line 데이타를 사용하여 평가한 결과 인덱스가 존재하지 않으며 편중 분포를 갖는 입력 테이블에 대한 공간 조인 연산의 성능이 기존 SHJ와 SSSJ 알고리즘보다 우수함이 검증되었다.

Fast Search with Data-Oriented Multi-Index Hashing for Multimedia Data

  • Ma, Yanping;Zou, Hailin;Xie, Hongtao;Su, Qingtang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권7호
    • /
    • pp.2599-2613
    • /
    • 2015
  • Multi-index hashing (MIH) is the state-of-the-art method for indexing binary codes, as it di-vides long codes into substrings and builds multiple hash tables. However, MIH is based on the dataset codes uniform distribution assumption, and will lose efficiency in dealing with non-uniformly distributed codes. Besides, there are lots of results sharing the same Hamming distance to a query, which makes the distance measure ambiguous. In this paper, we propose a data-oriented multi-index hashing method (DOMIH). We first compute the covariance ma-trix of bits and learn adaptive projection vector for each binary substring. Instead of using substrings as direct indices into hash tables, we project them with corresponding projection vectors to generate new indices. With adaptive projection, the indices in each hash table are near uniformly distributed. Then with covariance matrix, we propose a ranking method for the binary codes. By assigning different bit-level weights to different bits, the returned bina-ry codes are ranked at a finer-grained binary code level. Experiments conducted on reference large scale datasets show that compared to MIH the time performance of DOMIH can be improved by 36.9%-87.4%, and the search accuracy can be improved by 22.2%. To pinpoint the potential of DOMIH, we further use near-duplicate image retrieval as examples to show the applications and the good performance of our method.