• 제목/요약/키워드: Query processing algorithm

검색결과 255건 처리시간 0.027초

Spatial Selectivity Estimation Using Wavelet

  • Lee, Jin-Yul;Chi, Jeong-Hee;Ryu, Keun-Ho
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 ISIS 2003
    • /
    • pp.459-462
    • /
    • 2003
  • Selectivity estimation of queries not only provides useful information to the query processing optimization but also may give users with a preview of processing results. In this paper, we investigate the problem of selectivity estimation in the context of a spatial dataset. Although several techniques have been proposed in the literature to estimate spatial query result sizes, most of those techniques still have some drawback in the case that a large amount of memory is required to retain accurate selectivity. To eliminate the drawback of estimation techniques in previous works, we propose a new method called MW Histogram. Our method is based on two techniques: (a) MinSkew partitioning algorithm that processes skewed spatial datasets efficiently (b) Wavelet transformation which compression effect is proven. We evaluate our method via real datasets. With the experimental result, we prove that the MW Histogram has the ability of providing estimates with low relative error and retaining the similar estimates even if memory space is small.

  • PDF

ORDBMS를 사용한 XML 질의 캐쉬의 효율적인 지연 갱신 (Efficient Deferred Incremental Refresh of XML Query Cache Using ORDBMS)

  • 황대현;강현철
    • 정보처리학회논문지D
    • /
    • 제13D권1호
    • /
    • pp.11-22
    • /
    • 2006
  • XML 문서의 생성 및 활용도가 증가함으로 인해 XML 문서를 데이터베이스에 저장하여 관리하는 기법이 활발히 연구되고 있다. 관계형 또는 객체 관계형 데이터베이스 관리 시스템(RDBMS/ORDBMS)을 XML 문서의 저장소로 사용하는 것은 현재 가장 실용적인 방법으로 받아들여지고 있다. 데이터베이스에 저장된 XML 문서에 대한 빠른 질의 처리를 위하여 XML 질의 캐쉬를 사용할 수 있다. 그러나 XML 질의 캐쉬의 사용은 하부 자료의 변경에 대한 일관성 유지비용이 든다. 본 논문에서는, ORDBMS를 XML 질의 캐쉬와 하부 XML 자료의 저장소로 사용하고 변경로그를 사용하여 XML 질의 캐쉬를 지연 갱신할 때, XML 질의 캐쉬에 대한 비효율적인 갱신의 원인인 변경로그에 저장된 동일한 XML 문서에 대한 중복 변경을 제거 또는 여과하는 알고리즘을 제시한다. 또한 이를 바탕으로 XML 질의 캐쉬의 갱신에 사용할 최적화된 SQL 문을 생성한다. 실험을 통해 본 논문에서 제안한 XML 질의 캐쉬의 지연 갱신 방법의 효율성을 보인다.

SSF: Sentence Similar Function Based on word2vector Similar Elements

  • Yuan, Xinpan;Wang, Songlin;Wan, Lanjun;Zhang, Chengyuan
    • Journal of Information Processing Systems
    • /
    • 제15권6호
    • /
    • pp.1503-1516
    • /
    • 2019
  • In this paper, to improve the accuracy of long sentence similarity calculation, we proposed a sentence similarity calculation method based on a system similarity function. The algorithm uses word2vector as the system elements to calculate the sentence similarity. The higher accuracy of our algorithm is derived from two characteristics: one is the negative effect of penalty item, and the other is that sentence similar function (SSF) based on word2vector similar elements doesn't satisfy the exchange rule. In later studies, we found the time complexity of our algorithm depends on the process of calculating similar elements, so we build an index of potentially similar elements when training the word vector process. Finally, the experimental results show that our algorithm has higher accuracy than the word mover's distance (WMD), and has the least query time of three calculation methods of SSF.

다차원 지리정보시스템을 위한 저장기법 및 분리된 저장구조 (Storage Strategy and Separated Storage Structure for Multi-dimensional Geographic Information System)

  • 박동선;배해영
    • 한국정보처리학회논문지
    • /
    • 제7권1호
    • /
    • pp.1-11
    • /
    • 2000
  • 최근에 기존의 2차원적인 지리정보시스템에 시간차원을 포함하는 다차원 지리정보 데이터를 저장하기 위한 연구가 진행되고 있지만 대부분이 실제 구현에는 적용하기 어려운 개념적인 데이터모델의 설계단계에 머물고 있다. 본 논문에서는 기존 모델들의 문제점인 데이터 중복을 최소로 하고, 시간을 포함하는 질의에 대한 연산을 빠르게 수행할 수 있는 저장 기법인 MBNF기법을 설계하고, 데이터의 시간적 특성을 고려해서 과거 데이터베이스와 현재 데이터베이스에 분리하여 저장하는 분리된 저장구조를 설계하며, 분리된 데이터베이스간의 데이터 이동 알고리즘과 시간을 포함하는 질의를 효율적으로 수행하기 위한 검색 알고리즘을 설계한다.

  • PDF

센서 네트워크에서 효율적인 KNN 질의처리 방법 (An Efficient KNN Query Processing Method in Sensor Networks)

  • 손인근;현동준;정연돈;이은규;김명호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권4호
    • /
    • pp.429-440
    • /
    • 2005
  • 전기전자 기술의 발달로 센서의 기능이 더욱 강력해지면서, 센서 네트워크의 활용 분야는 더욱 다양해지고 있다. 센서 네트워크 어플리케이션을 사용하는 주 목적은 관심 지역(예, 공장 물품 창고, 재난지역, 야생 서식지 등)에서 발생하는 현상들을 관찰하고, 유용한 정보를 얻기 위한 것이다. k-근접 노드(KNN: K Nearest Neighbor) 탐색 질의는 특정 위치에서 지리적으로 근접한 k개의 이웃 객체를 찾기 위한 질의로서, 센서 네트워크 환경에서도 중요한 어플리케이션 중 하나이다. 그러나 이전 방법들은 센서 네트워크 환경에서 사용하기 부적합하거나 에너지 효율성 문제를 가지고 있었다. 본 논문에서는 센서 네트워크 환경의 특성을 고려하면서, k개의 근접 노드를 에너지 효율적으로 탐색할 수 있는 방법을 제안한다. 제안하는 방법은 k개의 근접 노드를 찾을 때까지 탐색 영역을 점진적으로 확장하고, 영역 내 센서들을 선별적으로 방문하여 원하는 위치 정보를 얻어내는 것이다. 이를 통해 원하는 k개의 근접 노드를 찾아내면서도 에너지 소모를 줄일 수 있다 본 논문에서는 제안하는 방법이 기존의 방법보다 효율적이라는 것을 다양한 조건의 실험을 통해 설명한다.

센서 네트워크에서 시놉시스와 인코딩을 이용한 에너지 효율적인 인-네트워크 조인 질의 처리 (An Energy-Efficient In-Network Join Query Processing using Synopsis and Encoding in Sensor Network)

  • 여명호;장용진;김현주;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제11권2호
    • /
    • pp.126-134
    • /
    • 2011
  • 최근 많은 연구자들은 서로 다른 영역에 저장된 센서 데이터를 이용한 조인 질의에 관심을 갖고 있다. 기존 기법은 예비 조인 조정자가 센서 노드로부터 시놉시스를 수집하고, 조인 질의 처리에 필요한 센서 데이터를 결정한다. 기지국은 전체 데이터를 수집하는 대신 일부 센서 데이터를 수집하여 최종 조인 처리를 수행한다. 하지만, 예비 조인을 수행하는 과정에서 통신 오버헤드를 발생시키는 단점을 가지고 있다. 본 논문에서는 이와 같은 문제점을 해결하는 새로운 에너지 효율적인 인-네트워크 조인 기법을 제안한다. 제안하는 기법은 네트워크 내부에서 예비 조인 조정자를 선정한다. 예비 조인 조정자는 조인의 초기 단계에서 조인 결과에 포함되지 않는 데이터를 제거하고 센서 데이터의 압축을 수행한다. 기지국은 압축된 데이터의 일부와 데이터 압축을 위한 인코딩 테이블을 수집하고 조인 결과를 결정한다. 그 결과, 제안하는 기법은 예비 조인 처리를 위한 통신 비용을 줄이고 네트워크 수명을 연장시킨다.

통합 영상 특징에 의한 지폐 분류 시스템의 구현 (System Implementation of Paper Currency Discrimination by Using Integrated Image Features)

  • 강현인;최태완
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.471-480
    • /
    • 2002
  • 본 논문에서는 블록화된 영상의 관심영역 가중치 비교 알고리즘과 형상특징 가중치 비교 알고리즘을 결합하여 지폐를 실시간으로 분류하는 시스템을 하드웨어로 구현하였다. 구현된 시스템은 영상획득부, 전처리 및 영상처리부로 구성되어 있다. 영상획득부는 CIS(contact image sensor)에 의해 영상이 얻어지고, A/D 변환기와 PLD에서 전처리를 한다. 영상처리부는 전처리된 영상을 제안된 알고리즘에 의해 DSP에서 수행한다. 제안한 방법은 시뮬레이션을 통해 질의영상과 비교영상간의 식별율을 높일 수 있고 오염되거나 회전, 이동된 지폐에서도 향상된 성능을 가진다. 그리고 제안 방법은 영상의 블록화 효과에 따른 계산량의 감소와 병렬처리를 할 수 있는 시스템으로 구성할 수 있어서 검색율을 높이거나 검색시간을 줄일 수 있는 장점이 있다.

Top-n 스카이라인 질의를 이용한 다차원 외판원 순회문제 기법 (Multi-Dimensional Traveling Salesman Problem Scheme Using Top-n Skyline Query)

  • 진창균;오덕신;김종완
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권1호
    • /
    • pp.17-24
    • /
    • 2020
  • 외판원 순회문제(Traveling Salesman Problem)는 세일즈맨이 한 도시(node)를 출발하여 모든 도시를 한 번씩 방문한 후 다시 출발점으로 되돌아오는 최적 경로를 반환한다. 이 기법은 도시의 수가 늘어날수록 연산횟수가 기하급수적으로 늘어나는 단점으로 인해 실생활에서 여러 노드(node)를 방문해야 하는 놀이동산이나 택배에 적용하기에는 탐색 성능에 한계가 있다. 또한, 최적 경로 탐색은 각 노드 사이의 거리를 1차원 속성으로 사용하기 때문에 이동시간, 관심도, 대기시간 등의 다차원속성을 고려하는 사용자의 요구를 만족하기 어렵다. 본 논문에서는 이와 같은 단점을 해결하기 위하여 Top-n 스카이라인 질의(Skyline query)를 이용한 다차원 외판원 순회문제(TS-MDT, Top-n Skyline-Multi Dimensional TSP) 알고리즘을 제안한다. 제안기법은 스카이라인의 지배원칙에 따라 다중 속성의 노드들을 제거함으로써 연산횟수의 감소를 통한 신속한 연산과 최적 경로를 반환한다. 실험에서는 1차원 속성의 데이터를 사용한 기존의 동적 계획법과 다차원속성을 처리하는 제안기법의 연산시간을 비교한 결과, 같은 데이터 개수일 때 다차원속성을 처리하는 제안기법이 더 빠른 것으로 나타났다.

범주형 데이터에 대한 스카이라인 질의 알고리즘 (Skyline Query Algorithm in the Categoric Data)

  • 이우기;최중호;송종수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권7호
    • /
    • pp.819-823
    • /
    • 2010
  • 스카이라인 질의는 다차원, 대량의 데이터 검색에서 효율적인 방법이다. '지배한다'의 개념을 활용하여 약 95%이상으로 알려진 불필요한 데이터 집합을 검색 대상에서 제외하고 필요한 데이터에 집중하게 만들기 때문이다. 지금까지의 스카이라인 질의 알고리즘들은 데이터 집합이 모두 수치형 데이터일 경우에만 한정하여 개발되었다. 따라서 데이터베이스 등에 저장된 대부분의 텍스트 데이터들은 기존 스카이라인 질의 알고리즘을 사용하여 결과를 얻을 수 없었다. 본 연구는 스카이라인 질의의 대상을 범주형 데이터라는 전혀 새로운 영역을 개척한 점에서 의미가 있다. 우선 범주형 데이터 거리를 2종류를 개발하고 이를 스카이라인 질의에 적용하였고, 실험에서는 ACM의 실제 논문데이터를 사용하여 처리시간 및 정확도 비율 등에서 그 효과성을 입증하였다.