• 제목/요약/키워드: query indexing

검색결과 278건 처리시간 0.028초

A Review of Window Query Processing for Data Streams

  • Kim, Hyeon Gyu;Kim, Myoung Ho
    • Journal of Computing Science and Engineering
    • /
    • 제7권4호
    • /
    • pp.220-230
    • /
    • 2013
  • In recent years, progress in hardware technology has resulted in the possibility of monitoring many events in real time. The volume of incoming data may be so large, that monitoring all individual data might be intractable. Revisiting any particular record can also be impossible in this environment. Therefore, many database schemes, such as aggregation, join, frequent pattern mining, and indexing, become more challenging in this context. This paper surveys the previous efforts to resolve these issues in processing data streams. The emphasis is on specifying and processing sliding window queries, which are supported in many stream processing engines. We also review the related work on stream query processing, including synopsis structures, plan sharing, operator scheduling, load shedding, and disorder control.

객체 데이터베이스에서 스타 조인의 빠른처리를 위한 비트맵 색인 기법과 그의 선정 문제 (Bit-map Indexes and Their Selection Problem for Efficient Processing of Star Joins in Object Databases)

  • 조완섭;정태성;이현철;장혜경;안명상
    • Journal of Information Technology Applications and Management
    • /
    • 제10권2호
    • /
    • pp.19-31
    • /
    • 2003
  • We propose an indexing technique and an index selection algorithm for optimal OLAP query processing in object database systems, Although there are many research results on the relational database systems for OLAP Query processing, few researches have been done on the object database systems. Since OLAP queries represent complex business logic on a huge data ware-house, object database systems supporting the OLAP queries should have higher performance. Proposed bitmap index structure is an extension of conventional bitmap indexes for adapting object databases and provides higher performance with lower space overhead. We also propose a linear time solution of the index selection problem that will be used in the OLAP query optimization process.

  • PDF

데이터스페이스의 질의 처리를 위한 향상된 인덱싱 기법 (An Improved Indexing Method for Query Processing of Dataspaces)

  • 황욱광;이동욱;신숭선;백성하;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.317-320
    • /
    • 2009
  • Dataspaces are the collections of heterogeneous and partially unstructured data. It is difficult for the users to explore the data from varies data sources using a single schema. And the queries supposed should be allowed to specify varying degrees of structure, spanning keyword queries to more structure-aware queries. Utilizing give the model of heterogeneous data and the definitions of two mainly types of query on dataspaces, in this paper we propose an improved method which can suppose the flexibly query more efficiently.

클러스터링을 이용한 시소러스 브라우저의 설계에 대한 이론적 연구 (A Theoretical Study of Designing Thesaurus Browser by Clustering Algorithm)

  • Seo, Hwi
    • 한국도서관정보학회지
    • /
    • 제30권3호
    • /
    • pp.427-456
    • /
    • 1999
  • This paper deals with the problems of information retrieval through full-test database which arise from both the deficiency of searching strategies or methods by information searcher and the difficulties of query representation, generation, extension, etc. In oder to solve these problems, we should use automatic retrieval instead of manual retrieval in the past. One of the ways to make the gap narrow between the terms by the writers and query by the searchers is that the query should be searched with the terms which the writers use. Thus, the preconditions which should be taken one accorded way to solve the problems are that all areas of information retrieval such as should taken one accorded way to solve the problems are that all areas of information retrieval such as contents analysis, information structure, query formation, query evaluation, etc. should be solved as a coherence way. We need to deal all the ares of automatic information retrieval for the efficiency of retrieval thought this paper is trying to solve the design of thesaurus browser. Thus, this paper shows the theoretical analyses about the form of information retrieval, automatic indexing, clustering technique, establishing and expressing thesaurus, and information retrieval technique. As the result of analyzing them, this paper shows us theoretical model, that is to say, the thesaurus browser by clustering algorithm. The result in the paper will be a theoretical basis on new retrieval algorithm.

  • PDF

영상 검색을 위한 적합성 피드백의 개선 (Improvement of Relevance Feedback for Image Retrieval)

  • 윤사정;박동권;원치선
    • 전자공학회논문지CI
    • /
    • 제39권4호
    • /
    • pp.28-37
    • /
    • 2002
  • 본 논문에서는, 확률적 방법과 질의 위치 이동 방법을 융합하여 검색 성능을 향상시키는 영상검색 방법을 제안한다. 제안한 알고리즘은, 질의 영상과 데이터베이스 영상 사이의 유사도 계산에서, 확률적 방법의 유사도와 질의 위치 이동 방법의 유사도를 융합한다. 본 논문에서 이용된 확률적 방법은 부정적 예제들을 다루기에 적합하다. 반면에, 질의 위치 이동 방법은 긍정적예제의 통계적인 특성을 다룬다. 본 논문의 목적은 이러한 두 방법을 융합함으로써, 각각의 방법이 가지고 있는 단점을 극복하는 것이다. 실험결과는 제안한 방법이 확률적 방법과 질의 위치 이동 방법을 각각 적용한 경우보다 더 나은 성능을 나타낸다는 것을 보여준다.

대용량 그래프 스트림 환경에서 데이터 재사용을 고려한 근사 Top-k 서브 그래프 매칭 기법 (Approximate Top-k Subgraph Matching Scheme Considering Data Reuse in Large Graph Stream Environments)

  • 최도진;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제20권8호
    • /
    • pp.42-53
    • /
    • 2020
  • 소셜 네트워크 서비스의 발전과 함께 다양한 응용에서 객체 간의 관계를 표현하기 위한 그래프 자료구조가 자주 활용되고 있다. 최근에는 실시간 그래프 스트림에서 서브 그래프 매칭의 요구가 늘어나고 있다. 따라서 실시간 그래프 스트림에서 높은 응답성을 위한 효율적인 근사 Top-k 매칭 기술이 필요하다. 본 논문에서는 그래프 스트림 환경에서 데이터 재사용을 고려한 근사 Top-k 서브 그래프 매칭 기법을 제안한다. 제안하는 기법은 대용량 스트림을 효율적으로 처리하기 위해서 기존 분산 스트림 처리 플랫폼인 스톰을 활용하고 스트림 처리 비용을 감소시키기 위한 기존 데이터 재사용 방법을 활용한다. Top-k 결과 생성을 위해서 거리 기반의 요약 색인 기법을 제안한다. 제안하는 요약 색인은 사전에 선택된 정점 간의 거리 값만을 저장하기 때문에 색인의 부하가 적다. 제안하는 요약 색인에서의 근사 Top-k를 수행하여 사용자에게 근사한 k개의 결과를 제공한다. 제안하는 기법의 우수성을 입증하기 위해 다양한 실세계 그래프 데이터 집합에서의 성능 평가를 수행한다.

LBS 응용에서 이동 객체의 궤적 색인을 위한 직접 테이블 기반의 확장된 TB-트리의 구현 (Implementation of Extended TB-Trees Based on Direct Table for Indexing Trajectories of Moving Objects in LBS Applications)

  • 신용원;박병래;심춘보
    • 한국콘텐츠학회논문지
    • /
    • 제5권2호
    • /
    • pp.187-197
    • /
    • 2005
  • 본 논문에서는 위치 기반 서비스에서 이동 객체의 궤적을 색인하기 위해 기존에 제안되었던 TB-트리의 성능을 개선시킬 수 있는 확장된 TB-트리(Extented TB-Tree:ETB-Tree)를 제안한다. ETB-트리는 선행 노드를 직접적으로 접근하기 위해 이동 객체의 처음 세그먼트와 마지막 세그먼트가 저장된 단말 노드를 가리키는 포인터 정보와 더불어 디스크에서의 페이지를 가리키는 페이지 번호를 별도의 테이블에 같이 유지함으로써 저장시 동일한 이동 객체의 선행노드를 빨리 검색할 수 있고, 궤적 질의시에도 바로 디스크에 접근해 해당 객체의 제적들을 검색함으로써 검색 성능을 향상시킬 수 있다. 아울러 ETB-트리는 새로운 이동 객체의 제적 정보가 삽입될 때마다 메모리 상의 트리 구조 뿐만 아니라 디스크에 반영함으로써 트리의 일관성을 유지한다. 마지막으로, 성능 평가를 분석한 결과, 제안하는 색인 기법이 기존의 색인 기법들에 비해 삽입과 제적 질의의 검색 측면에서 더 우수함을 보임을 알 수 있다.

  • PDF

B2V-Tree: 무선 데이타 스트림에서 부분 부합 질의를 위한 색인 기법 (B2V-Tree: An Indexing Scheme for Partial Match Queries on Wireless Data Streams)

  • 정연돈;이지연
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.285-296
    • /
    • 2005
  • 이동 분산 환경에서는 무선 데이타 방송 기법을 통하여 서버의 데이타 레코드들을 이동 사용자들에게 전달하는 방식이 많이 사용된다. 그리고, 무선 방송 스트림에서 데이타를 에너지 효율적으로 접근하기 위해서는 색인 기법이 필요하다. 하지만, 기존의 색인 기법들은 데이타 레코드의 키 값을 이용한 트리 형태의 색인 구조를 사용하고 있다. 따라서 부분 부합 질의 등과 같은 내용 기반 검색 질의를 지원할 수 없었다. 본 논문에서는 무선 방송으로 이동 사용자들에게 전달되는 데이타 스트림에서 내용 기반 검색인 부분 부합 질의를 지원하기 위해 B2V-Tree라고 불리는 색인 기법을 제안한다. 본 논문에서 제안하는 B2V-Tree는 데이타 레코드들의 애트리뷰트 값을 다중 애트리뷰트 해싱을 통해 비트 벡터로 생성한 다음, 이들을 색인 트리로 구성하는 색인 기법이다.

NVST DATA ARCHIVING SYSTEM BASED ON FASTBIT NOSQL DATABASE

  • Liu, Ying-Bo;Wang, Feng;Ji, Kai-Fan;Deng, Hui;Dai, Wei;Liang, Bo
    • 천문학회지
    • /
    • 제47권3호
    • /
    • pp.115-122
    • /
    • 2014
  • The New Vacuum Solar Telescope (NVST) is a 1-meter vacuum solar telescope that aims to observe the fine structures of active regions on the Sun. The main tasks of the NVST are high resolution imaging and spectral observations, including the measurements of the solar magnetic field. The NVST has been collecting more than 20 million FITS files since it began routine observations in 2012 and produces maximum observational records of 120 thousand files in a day. Given the large amount of files, the effective archiving and retrieval of files becomes a critical and urgent problem. In this study, we implement a new data archiving system for the NVST based on the Fastbit Not Only Structured Query Language (NoSQL) database. Comparing to the relational database (i.e., MySQL; My Structured Query Language), the Fastbit database manifests distinctive advantages on indexing and querying performance. In a large scale database of 40 million records, the multi-field combined query response time of Fastbit database is about 15 times faster and fully meets the requirements of the NVST. Our slestudy brings a new idea for massive astronomical data archiving and would contribute to the design of data management systems for other astronomical telescopes.

구조화된 비디오 문서의 데이터 모델 및 질의어와 색인 기법 (Data Model, Query Language, and Indexing Scheme for Structured Video Documents)

  • 류은숙;이규철
    • 한국멀티미디어학회논문지
    • /
    • 제1권1호
    • /
    • pp.1-17
    • /
    • 1998
  • 비디오 정보는 전자 도서관이나 WWW 및 주문형 비디오 (VOD) 시스템과 같은 다양한 응용분야에서 중요한 요소로 부각되고 있다. 비디오 정보는 특성상 계층적으로 구조화된 문서 형태를 가지기 때문에 본 논문에서는 이를 “구조화된 비디오 문서”라 부른다. 본 논문에서는 구조화된 비디오 문서를 데이터베이스에 효율적으로 저장하고, 검색하기 위한 데이터 모델과 질의어 및 색인 기법을 제안한다. 구조화된 비디오 문서는 논리적인 계층 구조 특성을 지니기 때문에, 본 논문에서는 객체 지향 데이터 모델을 이용하여 비디오 문서를 복합 객체로 모델링하고, 이를 저장하기 위한 객체 타입들을 정의한다. 또한 본 논문에서는 비디오 데이터의 캡션이나 주석을 기반으로 한 내용 기반 검색과 비디오 문서의 논리적 구조를 기반으로 한 구조 기반 검색을 제공하며, 비디오 문서의 시공간 관계 연산을 이용한 검색도 지원한다. 그리고, 구조화된 비디오 문서의 효율적인 질의와 색인 공간의 오버헤드를 줄이기 위해 최적화된 역 색인 기법을 제시한다.

  • PDF