• 제목/요약/키워드: Index search

검색결과 751건 처리시간 0.024초

유사도 검색을 위한 데이터 재배열을 이용한 공간 효율적인 역 색인 기법 (A Space-Efficient Inverted Index Technique using Data Rearrangement for String Similarity Searches)

  • 임마누;김종익
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1247-1253
    • /
    • 2015
  • 유사도 검색에서는 효율적으로 유사성을 만족하는 문자열을 찾기 위해서 데이터에 대한 역 색인을 구축하여 이용한다. 일반적으로 기존의 기법들은 빠른 응답속도의 질의처리를 위해서 역 색인을 메모리에 상주시킨다. 하지만 구축된 역 색인은 그 크기가 매우 크다는 문제점을 가지고 있다. 따라서 데이터의 크기가 매우 큰 경우나 자원이 제약적인 환경에서는 역 색인을 이용한 질의처리가 불가능할 수 있다. 본 논문에서는 동일한 q-그램을 포함하는 문자열들이 서로 인접한 위치가 되도록 재배치시킨 후 해당 문자열들을 범위로 표현한다. 실험을 통하여 질의처리의 성능을 희생하지 않으면서도 색인의 크기가 줄어드는 것을 보인다.

다차원 데이타를 위한 공간 분할 및 적응적 비트 할당 기반 색인 구조 (An Index Structure based on Space Partitions and Adaptive Bit Allocations for Multi-Dimensional Data)

  • 복경수;김은재;유재수
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권5호
    • /
    • pp.509-525
    • /
    • 2005
  • 본 논문에서는 다차원 데이타의 유사도 검색을 효율적으로 지원하기 위한 벡터 근사 기반의 색인 구조를 제안한다. 제안하는 색인 구조는 공간 분할 방식으로 영역을 분할하고 실제 데이타들이 존재하는 영역에 대해 동적 비트를 할당하여 영역을 표현한다. 따라서, 분할된 영역들 사이에 겹침이 발생하지 않으며 하나의 중간 노드에 많은 영역 정보를 저장할 수 있어 트리의 깊이를 감소시킨다. 또한, 특정 영역에 군집화되어 있는 데이타에 대해서 효과적인 표현 기법을 제공하며 자식 노드의 영역 정보는 부모 노드의 영역 정보를 이용하여 상대적으로 표현함으로써 영역 표현에 대한 정확성을 보장한다. 이를 통해 검색성능 향상을 제공한다. 제안하는 색인 구조의 우수성을 보이기 위해 기존에 제안된 다차원 색인 구조와의 다양한 실험을 통하여 성능의 우수성을 입증한다. 성능 평가 결과를 통해 제안하는 색인 구조가 기존 색인 구조보다 $40\%$정도 검색 성능이 향상됨을 증명한다.

블록 저밀도 패리티 검사 부호 설계를 위한 테너 그래프 기반의 저복잡도 순환 주기 탐색 알고리즘 (Tanner Graph Based Low Complexity Cycle Search Algorithm for Design of Block LDPC Codes)

  • 명세창;전기준;고병훈;이성로;김광순
    • 한국통신학회논문지
    • /
    • 제39C권8호
    • /
    • pp.637-642
    • /
    • 2014
  • 본 논문은 블록 LDPC(low density parity check) 부호 설계를 위한 순환 천이 값(shift index)을 탐색하는 효율적인 알고리즘을 제안한다. 여기에는 메시지-패싱(message-passing) 기반의 순환 주기(cycle) 탐색 알고리즘과 ACE(approximate cycle extrinsic message degree) 알고리즘이 결합되어 있다. LDPC 부호 성능에 영향을 미치는 요인들에 우선순위를 두어 효율적으로 순환 천이 값을 찾을 수 있도록 했다. 이 알고리즘을 통해 기존의 탐색 알고리즘 보다 훨씬 낮은 복잡도로 행렬 저장 공간을 절약하면서 좋은 성능의 패리티 검사 행렬(parity check matrix)을 만들 수 있다.

인덱스 테이블을 이용한 고속 VQ 코드북 탐색 알고리즘 (Fast VQ Codebook Search Algorithms Using Index Table)

  • 황재호;곽윤식;홍충선;이대영
    • 한국정보처리학회논문지
    • /
    • 제7권10호
    • /
    • pp.3272-3279
    • /
    • 2000
  • 본 논문에서는 Wavelet/VQ 코딩 기법에 효율적인 두 가지의 고속 VQ 코드북 탐색 알고리즘을 제안한다. 웨이브렛 계수 블록 내에서 코드북의 코드워드들의 원소, 즉 웨이브렛 계수가 큰 값을 가질 확률이 적다. 이러한 특성을 코드북 탐색에 이용하기 위하여 각 서브밴드에서 코드워드의 에너지 크기로 재정렬된 인덱스 테이블을 이용한다. 코드북 탐색 시 인덱스 테이블을 이용하여 코드워드의 큰 계수 값과 그에 대응하는 입력벡터의 원소를 먼저 비교함으로써 PDE의 탈출 조건을 조기에 만족하게 되어 탐색 시간이 줄어들게 된다.

  • PDF

대용량 압축 데이터베이스를 위한 비대칭 색인 관리 기법 (Asymmetric Index Management Scheme for High-capacity Compressed Databases)

  • 변시우;장석우
    • 한국산학기술학회논문지
    • /
    • 제17권7호
    • /
    • pp.293-300
    • /
    • 2016
  • 전통적인 기존의 데이터베이스는 높은 성능을 얻기 위하여 느린 하드 디스크에서 관련된 레코드가 연속적으로 저장되어 있는 레코드 기반 모델을 활용한다. 그러나 읽기 집중적인 데이터 분석 시스템을 위해서는 컬럼 기반 압축 데이터베이스가 월등한 판독 성능으로 인하여 더 적합한 모델이 되고 있으며, 최근 플래시 메모리 SSD가 고속 분석용 시스템에 적합한 저장 매체로 선호되고 있다. 본 논문에서는 세로로 저장하는 컬럼 기반 스토리지 모델을 소개하고, 대용량 데이터웨어하우스 시스템을 위한 새로운 인덱스와 데이터 관리 기법을 제안한다. 제안된 인덱스 관리 기법은 두 개의 인덱스를 사용하는 비대칭 인덱스 이중화이며, 갱신용 마스터 인덱스와 판독용 컴팩트 인덱스를 활용하여 특히 읽기가 집중된 빅 데이터베이스에서 우수한 검색 성능을 얻는다. 그리고 본 데이터 관리 기법은 관련된 컬럼 압축과 두 개의 플래시 메모리 SSD를 이중화하여 높은 판독 성능과 처리 안정성에 도움을 준다. 고부하 워크로드 조건의 성능 평가 결과를 기반으로, 본 데이터 관리 기법이 기존 기법보다 검색 처리 및 응답 시간 측면에서 더 우수함을 보이고자 한다.

과거 위치 색인에서 입력/검색 비용 조정을 위한 가변 버퍼 노드 기법 설계 (Design of the Flexible Buffer Node Technique to Adjust the Insertion/Search Cost in Historical Index)

  • 정영진;안부영;이양구;이동규;류근호
    • 정보처리학회논문지D
    • /
    • 제18D권4호
    • /
    • pp.225-236
    • /
    • 2011
  • 무선 통신 기술의 발달과 컴퓨터의 소형화에 힘입어 사용자의 위치에 따라 맞춤형 서비스를 제공하기 위하여 다양한 위치 기반 서비스 응용들이 개발되고 있다. 그리고 대용량의 차량 위치 데이터를 효과적으로 처리하기 위하여 차량 위치 감지 및 전송, 데이터의 삽입 및 검색과 사용자 질의 처리 기술이 요구된다. 이 논문에서는 대용량의 과거 차량 위치 정보를 빠르게 입력, 검색하는 과거 위치 색인을 설계하고 상황에 따라 입력과 검색 비용을 조절할 수 있는 가변 버퍼 노드인 기법을 제안한다. 설계된 색인은 GIP+와 같이 효과적인 입력을 위해 버퍼 노드를 사용하고 빠른 검색을 위해 프로젝션 스토리지를 사용한다. 그리고 사용자가 지정한 시간 간격에 따라 버퍼 노드에 저장되는 데이터의 개수를 조절하여 입력과 검색 비용을 조절할 수 있다. 실험에서는 버퍼 노드 크기에 따라 비단말 노드 수가 달라지며, 이로 인해 입력과 검색 성능이 달라짐을 확인할 수 있다. 제안된 가변 버퍼 노드 방식은 위치 기반 서비스 응용에 따라 과거 위치 색인의 성능을 조절하는데 효과적으로 사용 가능하다.

Search-based Sentiment and Stock Market Reactions: An Empirical Evidence in Vietnam

  • Nguyen, Du D.;Pham, Minh C.
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제5권4호
    • /
    • pp.45-56
    • /
    • 2018
  • The paper aims to examine relationships between search-based sentiment and stock market reactions in Vietnam. This study constructs an internet search-based measure of sentiment and examines its relationship with Vietnamese stock market returns. The sentiment index is derived from Google Trends' Search Volume Index of financial and economic terms that Vietnamese searched from January 2011 to June 2018. Consistent with prediction from sentiment theories, the study documents significant short-term reversals across three major stock indices. The difference from previous literature is that Vietnam stock market absorbs the contemporaneous decline slower while the subsequent rebound happens within a day. The results of the study suggest that the sentiment-induced effect is mainly driven by pessimism. On the other hand, optimistic investors seem to delay in taking their investment action until the market corrects. The study proposes a unified explanation for our findings based on the overreaction hypothesis of the bearish group and the strategic delay of the optimistic group. The findings of the study contribute to the behavioral finance strand that studies the role of sentiment in emerging financial markets, where noise traders and limits to arbitrage are more obvious. They also encourage the continuous application of search data to explore other investor behaviors in securities markets.

GOOD 2.0 : 공간 인덱스를 사용한 지리 데이타 관리기 (GOOD 2.0 : a Geographical Data Manager using Spatial indices)

  • 오병우;한기준
    • 대한공간정보학회지
    • /
    • 제3권2호
    • /
    • pp.137-149
    • /
    • 1995
  • 점차 중요성이 증가하고 있는 지리 정보 시스템의 효율적인 검색을 위해서는 공간 인덱스가 필요하다. 이를 위하여 본 논문에서는 기존에 개발한 지리 정보 시스템을 위한 데이타 관리기인GOOD 1.0에 공간 인덱스를 처리할 수 있는 공간 인덱스 처리 모듈을 추가하여 GOOD 2.0을 설계 및 구현한다. 즉, 공간 인덱스로는 R tree 및 R* tree를 지원하여 효율적인 검색이 가능하도록 한다. 그리고, 효율성의 향상 정도를 측정하기 위해 성능 평가를 길시하고 결과를 분석한다. 성능 평가 시에는 다양한 환경 요소들을 고려하여 지리 정보 시스템 관리자가 해당 도메인에 적합한 공간 인덱스를 선택하는데 기초 자료로서 사용될 수 있도록 한다.

  • PDF

Lossless VQ Indices Compression Based on the High Correlation of Adjacent Image Blocks

  • Wang, Zhi-Hui;Yang, Hai-Rui;Chang, Chin-Chen;Horng, Gwoboa;Huang, Ying-Hsuan
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권8호
    • /
    • pp.2913-2929
    • /
    • 2014
  • Traditional vector quantization (VQ) schemes encode image blocks as VQ indices, in which there is significant similarity between the image block and the codeword of the VQ index. Thus, the method can compress an image and maintain good image quality. This paper proposes a novel lossless VQ indices compression algorithm to further compress the VQ index table. Our scheme exploits the high correlation of adjacent image blocks to search for the same VQ index with the current encoding index from the neighboring indices. To increase compression efficiency, codewords in the codebook are sorted according to the degree of similarity of adjacent VQ indices to generate a state codebook to find the same index with the current encoding index. Note that the repetition indices both on the search path and in the state codebooks are excluded to increase the possibility for matching the current encoding index. Experimental results illustrated the superiority of our scheme over other compression schemes in the index domain.

EEIRI: Efficient Encrypted Image Retrieval in IoT-Cloud

  • Abduljabbar, Zaid Ameen;Ibrahim, Ayad;Hussain, Mohammed Abdulridha;Hussien, Zaid Alaa;Al Sibahee, Mustafa A.;Lu, Songfeng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권11호
    • /
    • pp.5692-5716
    • /
    • 2019
  • One of the best means to safeguard the confidentiality, security, and privacy of an image within the IoT-Cloud is through encryption. However, looking through encrypted data is a difficult process. Several techniques for searching encrypted data have been devised, but certain security solutions may not be used in IoT-Cloud because such solutions are not lightweight. We propose a lightweight scheme that can perform a content-based search of encrypted images, namely EEIRI. In this scheme, the images are represented using local features. We develop and validate a secure scheme for measuring the Euclidean distance between two descriptor sets. To improve the search efficiency, we employ the k-means clustering technique to construct a searchable tree-based index. Our index construction process ensures the privacy of the stored data and search requests. When compared with more familiar techniques of searching images over plaintexts, EEIRI is considered to be more efficient, demonstrating a higher search cost of 7% and a decrease in search accuracy of 1.7%. Numerous empirical investigations are carried out in relation to real image collections so as to evidence our work.