• 제목/요약/키워드: Analysis of Query

검색결과 457건 처리시간 0.025초

그리드 인덱스 기반 뷰 선택 기법을 이용한 효율적인 Top-k 질의처리 알고리즘 (Efficient Top-k Query Processing Algorithm Using Grid Index-based View Selection Method)

  • 홍승태;윤들녁;장재우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권1호
    • /
    • pp.76-81
    • /
    • 2015
  • 최근 대용량 데이터의 분석을 위한 top-k 질의처리 알고리즘에 대한 관심이 고조되고 있다. 그러나 기존 top-k 질의처리 알고리즘은 효율적인 인덱스 구조를 제공하지 않기 때문에, 높은 탐색 비용을 야기하며, 아울러 다양한 질의 유형을 지원하지 못하는 문제점이 존재한다. 이러한 문제점을 해결하기 위해, 본 논문에서는 그리드 인덱스 기반 뷰 선택 기법을 이용한 top-k 질의처리 알고리즘을 제안한다. 제안하는 기법은 그리드 인덱스 기반의 뷰 선택 기법을 통해 주어진 질의 영역에 대하여 최소한의 그리드 셀만을 탐색함으로써 질의처리 시간을 감소시킨다. 마지막으로, 성능 평가를 통해 제안하는 top-k 질의처리 알고리즘이 기존 알고리즘에 비해 질의처리 시간 및 질의 결과 정확도 측면에서 우수함을 나타낸다.

동적 다변량 그래프의 연속적 분석을 위한 질의 모델 설계 및 구현 (A Query Model for Consecutive Analyses of Dynamic Multivariate Graphs)

  • 배예찬;함도영;김태양;정혜진;김동윤
    • 컴퓨터교육학회논문지
    • /
    • 제17권6호
    • /
    • pp.103-113
    • /
    • 2014
  • 본 연구에서는 동적 다변량 그래프 데이터의 연속적 분석이 가능한 질의 모델을 설계 및 구현하였다. 먼저, 질의 모델을 판별함수 설정과 시간에 따른 통합 방법 선택의 두 단계로 설계하고, 질의 패널, 그래프 시각화 패널, 속성 패널로 구성된 질의 시스템으로 구현하였다. 또한, 그래프 표현에는 노드-링크 다이어그램과 Force-Directed Graph Drawing 알고리즘을 이용하였으며, 질의 결과로 선택된 대상들에 효과를 적용하여 사용자가 시각적으로 구분할 수 있도록 처리하였다. 마지막으로, 세계 소형 무기 거래량 데이터를 이용하여, 본 연구에서 설계한 동적 다변량 그래프 질의 모델을 검증하였다. 본 연구는 동적 그래프의 연속적 분석이 가능한 새로운 질의 모델을 설계하는 것을 통해, 기존 모델이 동적 그래프를 시점별로 이산적으로만 분석할 수 있는 한계를 개선하였다는데 의의가 있다. 본 연구는 추세 분석이나, 복잡계 네트워크 해석 등 동적 그래프를 사용하는 연구에 기여할 수 있을 것으로 기대된다.

  • PDF

맵리듀스를 이용한 그리드 기반 인덱스 생성 및 k-NN 조인 질의 처리 알고리즘 (Grid-based Index Generation and k-nearest-neighbor Join Query-processing Algorithm using MapReduce)

  • 장미영;장재우
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1303-1313
    • /
    • 2015
  • 맵리듀스는 대용량 데이터 처리를 위한 시스템 안정성과 유용성을 제공한다. 맵리듀스 기반 k-최근접점 조인 질의처리 알고리즘은 두 데이터 집합 R과 S를 기반으로 R의 모든 레코드에 대해 S의 데이터 중 가장 인접한 k개의 레코드를 탐색하는 알고리즘으로써, 대용량 데이터 분석을 위한 중요한 질의 처리 알고리즘이다. 그러나 기존 k-최근접점 조인 질의처리 알고리즘은 높은 인덱스 구축비용 문제로 인해 대용량 데이터 처리에 적합하지 않은 문제점을 지닌다. 따라서, 본 논문에서는 그리드 기반 인덱스 생성 및 k-최근접점 질의 처리 알고리즘을 제안한다. 제안하는 기법은 질의 셀로부터 인접한 데이터만을 찾아 맵리듀스 테스크에 전송함으로써 데이터 전송 및 k-최근접점 연산 오버헤드를 줄인다. 성능평가를 통해, 제안하는 기법이 정확 매칭 질의를 제공하는 동시에 기존 기법에 비해 질의 처리 시간 측면에서 최대 7배의 성능을 개선함을 보인다.

국가기록원 질의로그 빅데이터 기반 이용자 정보요구 유형 분석 (User Information Needs Analysis based on Query Log Big Data of the National Archives of Korea)

  • 백지연;오효정
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.183-205
    • /
    • 2019
  • 이용자의 정보요구를 파악하기 위한 다양한 방법 중 로그 분석 방법은 이용자의 실제 검색 행위를 사실적으로 반영하고, 대다수 이용자의 전반적인 이용행태를 분석할 수 있다. 이에 본 연구에서는 국가기록원 웹 포털서비스를 통해 입수된 대량의 질의로그 빅데이터를 기반으로 이용자의 정보요구를 파악하기 위해 1) 질의에 내포된 정보요구 유형별과 2) 검색결과로 제공한 기록 유형별 분석을 진행하였다. 분석에 활용한 질의로그는 국가기록원이 웹을 통해 검색서비스를 제공한 2007년부터 2018년 12월까지, 총 141개월 동안 수집된 월별 상위 100개 질의어 1,571,547개를 대상으로 하였다. 나아가 분석결과를 토대로 이용자 검색 만족도를 향상시킬 수 있는 개선방안을 제안하였다. 본 연구의 결과는 국가기록원 검색 서비스 개선 및 고도화를 위한 구체적이고 실질적 방안을 제시했다는 점에서 의의가 있다.

이미지 검색 과정에 나타난 질의 전환 및 재구성 패턴에 관한 연구 (Examining Categorical Transition and Query Reformulation Patterns in Image Search Process)

  • 정은경;윤정원
    • 정보관리학회지
    • /
    • 제27권2호
    • /
    • pp.37-60
    • /
    • 2010
  • 이 연구는 이미지 특성 범주와 관련하여 질의 재구성 패턴을 탐색하고자 하였다. 이러한 연구 목적을 수행하기 위해서 Excite 웹검색 엔진 로그 데이터가 사용되었으며, 총 592 세션과 2,445 질의어가 분석되었다. 데이터 분석은 Batley의 정보 형태 구분과 선행 연구에서 밝혀진 팻싯과 서브팻싯을 활용하여 수행되었다. 분석결과는 두가지 형태로 구분하여 제시되었다. 첫째, 질의 재구성에 관한 분석결과이다. 질의 분석 결과, 가장 많은 부분을 차지하는 범주는 특정어(specific)와 지칭어(nameable)이며, 이러한 경향은 다양한 정보 탐색 단계에서도 지속적으로 나타났다. 둘째, 질의 재구성 패턴과 관려하여, 평행이동이 가장 많이 나타났으며, 이러한 경향은 최초 혹은 직전 질의 범주에 따라 근소한 차이를 보였다. 범주 전환 분석에서는 높은 비율(60%-80%)로 검색 질의의 범주가 지속적으로 동일한 범주에 머무르는 경향을 밝혀내었다. 이러한 결과는 이미지 검색 시스템 설계와 구현에 있어서, 이용자의 질의 선정 과정에 도움을 제공하고 효과적인 시소러스 구축 등에 활용될 수 있을 것으로 기대된다.

Binding Query를 활용한 Proxy Mobile IPv6의 성능 향상 기법 (Performance Enhancement of Proxy Mobile IPv6 using Binding Query)

  • 박재완;김지인;고석주
    • 한국통신학회논문지
    • /
    • 제36권11B호
    • /
    • pp.1269-1276
    • /
    • 2011
  • Proxy Mobile IPv6 (PMIPv6) 프로토콜에서는 단말간 통신 시에 모든 데이터 패킷이 Local Mobility Anchor (LMA)를 거쳐 전달되어 통신단말이 모두 동일 망에 위치한 경우 데이터 패킷이 최적화되지 않은 경로를 사용함으로 인해 성능이 저하된다. 본 논문에서는 Binding Query를 활용한 PMIPv6의 경로최적화 기법을 제안한다. 제안되는 Query-based PMIPv6 (Q-PMIPv6) 기법에서 Correspondent Node (CN)의 Mobile Access Gateway (MAG)는 Mobile Node (MN)의 Proxy Care-of-Address를 획득하기 위하여 LMA로 Binding Query를 보내고, 이후에 CN과 MN는 최적화된 경로를 이용하여 데이터 전송을 수행한다. 성능분석을 위해 제안하는 Q-PMIPv6 기법과 기존의 PMIPv6 및 PMIPv6 Localized Routing (PMIPv6-LR) 기법을 이론적인 수치 분석 및 ns-2 시뮬레이션을 통해 비교하였다. 비교 분석 결과, 제안하는 Q-PMIPv6 기법이 시그널링 비용 및 데이터 전달 비용 측면에 서 기존 PMIPv6 및 PMIPv6-LR 기법에 비해 우수함을 확인하였다.

OWL 요소와 질의 패턴에 대한 관계 분석에 웹 온톨로지 저장소의 구현 및 평가 (Implementation and Evaluation of a Web Ontology Storage based on Relation Analysis of OWL Elements and Query Patterns)

  • 정동원;최명회;정영식;한성국
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권3호
    • /
    • pp.231-242
    • /
    • 2008
  • W3C에서 OWL을 웹 온톨로지 기술을 위한 표준으로 채택함으로써 OWL 웹 온톨로지를 효과적으로 저장할 수 있는 저장 모델에 대한 필요성이 제기되었다. 지금까지 Jena, Sesame, DLDB 등과 같은 관계형 모델 기반의 저장 시스템이 개발되었나 여전히 여러 가지 문제점을 지니며, 특히 비효율적인 질의 처리 성능을 제공한다. 질의 처리 성능이 저하되는 구조적인 문제점을 하면 다음과 같다. Jena의 경우, 정규화가 이루어지지 않은 매우 단순한 구조를 지니며 단일 테이블에 대부분의 정보를 저장한다. 이는 단순 검색은 물론 조인 연산이 요구되는 질의 처리시 불필요한 정보까지 비교함으로써 성능을 급격하게 저하시킨다. Sesame와 같은 저장소는 지나치게 정규화 된 구조를 지니기 때문에 질의 처리시 많은 조인 연산이 요구된다. 심지어 단순한 특정 클래스를 검색할 경우에도 많은 조인 연산이 요구된다. 이 논문에서는 이러한 기존 저장모델의 비정규화 혹은 지나친 정규화로 인해 발생하는 질의 처리 성능 저하 문제를 해결할 수 있는 저장 모델을 제안한다. 이를 위해 OWL 요소와 질의 패턴과의 관계를 분석하고 기존 저장 모델의 구조적인 문제점을 분석한다. 이러한 분석 결과를 통해 정의된 제안 모델은 적정 수준의 정규화 된 구조를 지니며 조인 연산이나 불필요한 정보에 대한 비교를 최소할 수 있는 구조를 제공한다. 질의 처리 성능 실험을 위해 LUBM 데이타 셋을 이용하며, 검색 대상 및 대상의 계층 관계를 고려한 질의 유형을 정의한다. 추가적으로, 제안된 저장모델의 데이타 손실 여부를 확인하기 위해 질의 결과의 정확성 및 완전성에 대해 실험하고 그 결과를 기술한다. 비교 평가 결과에서, 제안 모델이 기존 저장 모델보다 나은 성능을 보였다.

Spatio-Temporal Query Processing Over Sensor Networks: Challenges, State Of The Art And Future Directions

  • Jabeen, Farhana;Nawaz, Sarfraz;Tanveer, Sadaf;Iqbal, Majid
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권7호
    • /
    • pp.1756-1776
    • /
    • 2012
  • Wireless sensor networks (WSNs) are likely to be more prevalent as their cost-effectiveness improves. The spectrum of applications for WSNs spans multiple domains. In environmental sciences, in particular, they are on the way to become an essential technology for monitoring the natural environment and the dynamic behavior of transient physical phenomena over space. Existing sensor network query processors (SNQPs) have also demonstrated that in-network processing is an effective and efficient means of interaction with WSNs for performing queries over live data. Inspired by these findings, this paper investigates the question as to whether spatio-temporal and historical analysis can be carried over WSNs using distributed query-processing techniques. The emphasis of this work is on the spatial, temporal and historical aspects of sensed data, which are not adequately addressed in existing SNQPs. This paper surveys the novel approaches of storing the data and execution of spatio-temporal and historical queries. We introduce the challenges and opportunities of research in the field of in-network storage and in-network spatio-temporal query processing as well as illustrate the current status of research in this field. We also present new areas where the spatio-temporal and historical query processing can be of significant importance.

EMRQ: An Efficient Multi-keyword Range Query Scheme in Smart Grid Auction Market

  • Li, Hongwei;Yang, Yi;Wen, Mi;Luo, Hongwei;Lu, Rongxing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권11호
    • /
    • pp.3937-3954
    • /
    • 2014
  • With the increasing electricity consumption and the wide application of renewable energy sources, energy auction attracts a lot of attention due to its economic benefits. Many schemes have been proposed to support energy auction in smart grid. However, few of them can achieve range query, ranked search and personalized search. In this paper, we propose an efficient multi-keyword range query (EMRQ) scheme, which can support range query, ranked search and personalized search simultaneously. Based on the homomorphic Paillier cryptosystem, we use two super-increasing sequences to aggregate multidimensional keywords. The first one is used to aggregate one buyer's or seller's multidimensional keywords to an aggregated number. The second one is used to create a summary number by aggregating the aggregated numbers of all sellers. As a result, the comparison between the keywords of all sellers and those of one buyer can be achieved with only one calculation. Security analysis demonstrates that EMRQ can achieve confidentiality of keywords, authentication, data integrity and query privacy. Extensive experiments show that EMRQ is more efficient compared with the scheme in [3] in terms of computation and communication overhead.

순환검색거리를 이용하는 최대근접 질의처리의 성능분석 (The Performance Analysis of Nearest Neighbor Query Process using Circular Search Distance)

  • 선휘준;김원호
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.83-90
    • /
    • 2010
  • 최대근접질의의 처리비용을 최적화하기 위해서는 색인에서 검색되는 노드의 수와 연산시간을 최소화할 수 있어야 한다. 이를 위해 최대근접질의 처리시 검색대상을 정확히 선택하고 객체들의 순환적 위치 속성이 고려된 검색거리 측도가 필요하다. 본 논문은 순환도메인을 갖는 검색공간에서 객체의 순환적 위치속성을 고려한 최대근접질의 처리방법을 제안하고 그 성능을 실험을 통하여 입증한다. 제안한 방법은 최대근접질의의 처리비용을 최적화하기 위한 검색거리 측도인 순환최소거리와 순환최적거리를 사용한다.