• 제목/요약/키워드: Query Index

검색결과 412건 처리시간 0.033초

ORDMS 기반 데이터 웨어하우스에서 효율적인 질이 처리를 위한 AH 인덱스 (The AH Index for Efficient Query Processing in ORDBMS-based Data Warehouses)

  • 장혜경;이정남;조완섭;이충세;김홍기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.137-139
    • /
    • 2000
  • 본 논문에서는 차세대 DBMS로 각광을 받고 있는 객체-관계형 DBMS(Object-Relational DBMS : ORDBMS)기반의 데이터 웨어하우스(data warehouse)에서 질의 처리의 성능을 향상시키는 AH(Attribute Hierarchy) 인덱스와 이를 이용한 질의 처리 기법을 제안한다. 지금까지 관계 DBMS를 이용한 데이터 웨어하우스의 성능 향상에 관한 연구는 거의 이루어지지 않고 있다. 데이터 웨어하우스는 기존의 데이터베이스와는 비교할 수 없을 만큼의 대용량 데이터를 가정하므로 ORDBMS를 이용하여 데이터 웨어하우스를 구축하는 경우에서도 적절한 성능의 보장이 필수적으로 요구된다. 이 논문에서 제안된 AH 인덱스를 사용함으로써 데이터 웨어하우스 분석용 질의에서 자주 사용되는 조인과 그루핑 연산은 비용이 저렴한 인덱스 액세스 연산으로 대치되며, 데이터의 량과 무관하게 질의 처리비용이 거의 고정되는 효과를 얻을 수 있다.

  • PDF

객체 관계형 실시간 DBMS, Tachyon의 데이터 타입과 객체지향 질의 설계 및 구현 (A Design and Implementation of Object-Relational Queries and Data types for the Objest-Relational Real-time DBMS, Tachyon)

  • 박유미;배명남;최완
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.219-221
    • /
    • 2000
  • 본 논문은 객체 관계형 실시간 DBMS인 Tachyon이 제공하는 데이터 타입과 객체지향 질의의 설계 및 구현을 기술한다. Tachyon은 고성능 데이터 처리를 지원하는 객체 관계형 메모리상주 데이터베이스 시스템(Main-memory resident ORDBMS)로 Tachyon의 데이터 타입과 SQL은 ANSI SQL 3 draft를 기반으로 설계되었으며, 객체 관계형 질의 처리를 위한 OID 데이터 타입을 추가하였다. Tachyon은 클래스 간의 수직적 관계(상속)와 수평적 관계를 정의하고 조작할 수 있는 객체지향 질의를 통하여 융통성있는 데이터 조작이 가능하며, OID를 기반으로 경로식(path expression)을 이용한 향해 질의(navigational query)를 통하여 죠인(join) 비용을 절감하고, index를 통한 인스턴스 접근 등을 통하여 효율적인 데이터베이스 접근을 시도할 수 있다.

  • PDF

고차원 공간에서 최근접 질의를 효과적으로 처리하기 위한 새로운 인덱싱 기법 (A New Indexing Technique for Processing Nearest Neighbor Queries in High Dimensional Space)

  • 김상욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.83-85
    • /
    • 2000
  • 최근접 질의(nearest neighbor query)는 멀티미디어 데이터베이스에서 주어진 질의 객체와 가장 유사한 객체를 찾기 위한 매우 중요한 연산으로 사용된다. 대부분의 최근접 질의 처리 기법들은 객체의 효과적인 인덱싱을 위하여 다차원 인덱스(multidimensional index)를 사용한다. 그러나 N차원 시각형 혹은 원을 사용하여 객체 클러스터의 캡슐을 표현하는 기존의 다차원 인덱스들은 차원 수가 높아짐에 따라 검색 성능이 크게 떨어진다. 본 논문에서는 이러한 문제를 해결하는 새로운 인덱스 구조를 제시하고, 이를 이용하는 최근접 질의 처리 방안을 제안한다. 또한, 다양한 실험에 의한 성능 평가를 통하여 제안된 기법의 우수성을 검증한다.

  • PDF

공간 네트워크상의 이동객체를 위한 궤적기반 색인구조 및 질의 처리 알고리즘의 설계 (Design of Trajectory-based Index Structure and Query Processing Algorithm for Moving Object on Spatial Network)

  • 엄정호;장재우;양재동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.121-123
    • /
    • 2005
  • 유클리디언(Euclidean)공간을 가정한 이동객체를 위한 색인구조 연구가 많이 진행되어 왔다. 그러나 LBS(Location Based System) 및 텔레매틱스 응용이 활발해짐에 따라, 이를 효과적으로 지원하기 위해서 도로 철도와 같은 공간 네트워크를 고려한 색인구조 연구가 요구된다. 따라서 본 논문에서는 공간 네트워크상에서 이동객체를 효율적으로 색인할 수 있는 궤적기반 색인구조를 설계한다. 이를 위해 공간 데이터와 시간 데이터를 분리하여 색인하고, 실세계에서 공간네트워크상의 이동객체에 대한 질의를 시공간+궤적 질의, k-최근접 질의, 시간+궤적 질의로 분류하고, 이를 위한 질의 처리 알고리즘을 설계한다.

  • PDF

SSF: Sentence Similar Function Based on word2vector Similar Elements

  • Yuan, Xinpan;Wang, Songlin;Wan, Lanjun;Zhang, Chengyuan
    • Journal of Information Processing Systems
    • /
    • 제15권6호
    • /
    • pp.1503-1516
    • /
    • 2019
  • In this paper, to improve the accuracy of long sentence similarity calculation, we proposed a sentence similarity calculation method based on a system similarity function. The algorithm uses word2vector as the system elements to calculate the sentence similarity. The higher accuracy of our algorithm is derived from two characteristics: one is the negative effect of penalty item, and the other is that sentence similar function (SSF) based on word2vector similar elements doesn't satisfy the exchange rule. In later studies, we found the time complexity of our algorithm depends on the process of calculating similar elements, so we build an index of potentially similar elements when training the word vector process. Finally, the experimental results show that our algorithm has higher accuracy than the word mover's distance (WMD), and has the least query time of three calculation methods of SSF.

해시 색인 군집화 기반 스카이라인 질의 (Clustered Hash Index-based Skyline Query)

  • 최종혁;나스리디노프 아지즈
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2018년도 동계학술대회
    • /
    • pp.45-48
    • /
    • 2018
  • 스카이라인 질의는 지배라는 개념을 활용, 주어진 데이터로부터 데이터를 대표할 수 있는 데이터들을 탐색하기 때문에 사용자의 요청에 부합하는 최적의 결과를 탐색하거나 기업에서 의사결정을 이루기 위해 사용되는 등 넓은 활용을 보이고 있다. 하지만 스카이라인 질의는 데이터의 차원이 증가하는 경우 전체적인 성능의 감소와 함께 스카이라인으로 선택되는 데이터의 수가 급증하여 사용자에게 유용한 결과를 반환하지 못하게 된다. 이러한 문제를 해결하기 위해 최근에는 Top-k 질의 기반의 방식이나 군집화 기반의 기법을 적용한 방식의 스카이라인 질의들이 새롭게 제안되고 있지만 이들은 데이터의 편향이나 사용자로부터 입력된 k에 큰 영향을 받는 등 해당 질의 결과가 데이터들을 충분히 대표하거나 다양성을 만족시키지 못했다. 이러한 문제를 해결하기 위해 본 논문에서는 해시 색인 기법과 군집화 기법인 DBSCAN을 통해 주어진 데이터들을 충분히 대표함과 동시에 다양성을 만족할 수 있는 새로운 방식의 스카이라인인 CHI-SQ의 이론적 배경을 제안하고자 한다.

  • PDF

고정 그리드 인덱싱에서 VP 필터링을 이용한 범위 질의 처리 (Range Query Processing using VP Filtering in Fixed Grid Index Structures)

  • 전세길;나연묵
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (하)
    • /
    • pp.1531-1534
    • /
    • 2003
  • 최근 들어 이동 통신 서비스에서 이동하는 고객의 위치 정보와 관련된 서비스가 중요한 서비스로 부각되고 있다. 이동객체의 경우 갱신 연산이 많고, 부하가 특정 지역에 집중되는 특징이 있다. 이러한 위치 기반 서비스에서 범위질의는 중요한 질의 중 하나이다. 범위 질의는 윈도우나 원 형태로 수행되는데 윈도우의 경우에는 질의 범위 밖에 해당하는 객체를 쉽게 필터링 할 수 있는 반면 원 형태일 경우에는 대부분의 경우 거리 계산을 해야 하는 불편함이 있다. 본 논문에서는 객체의 위치 갱신 연산에 따른 인덱스 구조의 변화를 최소화하기 위해 고정 그리드 방식을 사용하고 VP 필터링 기법을 적용하여 원 범위 질의에서 범위 밖의 객체를 필터링하기 위한 방법을 제시한다.

  • PDF

물류 데이터의 연속 질의 처리를 위한 다차원 색인 기법 (Multi dimensional index technique for continuous Query of logistics data)

  • 추병조;홍봉희;김기홍
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동춘계학술대회
    • /
    • pp.82-88
    • /
    • 2008
  • EPCglobal은 기업 간의 물류 활동 촉진과 글로벌 유통물류 시스템 구축을 위하여 EPCglobal Architecture Framework을 제시 하였다. EPCglobal Architecture Framework의 한 구성요소인 EPCIS(Electronic Product Code Information Services)는 EPC 기반 물류 관련 정보에 대한 저장 및 검색 서비스를 제공한다. EPCIS는 단발성 질의(poll)와 연속 질의(subscribe) 검색 서비스를 제공한다. EPCIS의 연속 질의는 시스템 자동화 및 재고 관리, 공급망 관리를 위해 다양한 응용에서 활용이 가능하다. 일반적으로 연속 질의의 성능을 향상시키기 위해서는 질의 색인을 사용한다. 그러나 EPCIS는 13차원의 도메인과 모든 데이터 필드가 필수 조건이 아니라는 것으로 인해, 차원의 저주 및 무한 영역 질의 문제를 발생 시킨다. 본 논문에서는 EPCIS의 물류 데이터의 연속 질의 처리를 위한 다차원 색인 기법을 제안한다. 13차원의 도메인을 여러 개의 질의 색인으로 구성하고, 등록된 질의 및 입력되는 데이터에 의해 변경되는 동적 질의 실행 계획을 제안함으로써, 차원의 저주와 무한 영역 질의의 문제를 해결하고, EPCIS에서 다수의 연속 질의 등록 시 효율적으로 처리가 가능하도록 한다.

  • PDF

데이터베이스 시스템을 위한 EBORD 성능 평가 방법론 (The EBORD Benchmark for Database Systems)

  • 정회진;이상호
    • Journal of Information Technology Applications and Management
    • /
    • 제12권2호
    • /
    • pp.29-43
    • /
    • 2005
  • The paper presents the EBORD (Extended Benchmark for Object-Relational Databases) benchmark, which is an extension of the BORD benchmark for object-relational databases. The EBORD benchmark is developed to evaluate the database common functions that should be supported in modern database systems. Besides the 36 test queries already defined in the BORD benchmark, totally 22 test queries in five categories are newly defined in order to measure the index-relevant performance issues and database import capabilities. The EBORD benchmark also features scalability, use of a synthesized database, and a query-oriented evaluation. In order to show the feasibility of the proposed benchmark, we implement it with two commercial database systems. The experimental results and analyses are also reported.

  • PDF

대화 예제를 이용한 상황 기반 대화 관리 시스템 (A Situation-Based Dialogue Management with Dialogue Examples)

  • 이청재;정상근;이근배
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2005년도 추계 학술대회 발표논문집
    • /
    • pp.113-115
    • /
    • 2005
  • In this paper, we present POSSDM (POSTECH Situation-Based Dialogue Manager) for a spoken dialogue system using a new example and situation-based dialogue management techniques for effective generation of appropriate system responses. Spoken dialogue system should generate cooperative responses to smoothly control dialogue flow with the users. We introduce a new dialogue management technique incorporating dialogue examples and situation-based rules for EPG (Electronic Program Guide) domain. For the system response inference, we automatically construct and index a dialogue example database from dialogue corpus, and the best dialogue example is retrieved for a proper system response with the query from a dialogue situation including a current user utterance, dialogue act, and discourse history. When dialogue corpus is not enough to cover the domain, we also apply manually constructed situation-based rules mainly for meta-level dialogue management.

  • PDF