• 제목/요약/키워드: Skyline Query Processing

검색결과 40건 처리시간 0.022초

Equivalence Heuristics for Malleability-Aware Skylines

  • Lofi, Christoph;Balke, Wolf-Tilo;Guntzer, Ulrich
    • Journal of Computing Science and Engineering
    • /
    • 제6권3호
    • /
    • pp.207-218
    • /
    • 2012
  • In recent years, the skyline query paradigm has been established as a reliable method for database query personalization. While early efficiency problems have been solved by sophisticated algorithms and advanced indexing, new challenges in skyline retrieval effectiveness continuously arise. In particular, the rise of the Semantic Web and linked open data leads to personalization issues where skyline queries cannot be applied easily. We addressed the special challenges presented by linked open data in previous work; and now further extend this work, with a heuristic workflow to boost efficiency. This is necessary; because the new view on linked open data dominance has serious implications for the efficiency of the actual skyline computation, since transitivity of the dominance relationships is no longer granted. Therefore, our contributions in this paper can be summarized as: we present an intuitive skyline query paradigm to deal with linked open data; we provide an effective dominance definition, and establish its theoretical properties; we develop innovative skyline algorithms to deal with the resulting challenges; and we design efficient heuristics for the case of predicate equivalences that may often happen in linked open data. We extensively evaluate our new algorithms with respect to performance, and the enriched skyline semantics.

빅데이터 전처리 기반의 실시간 사용자 선호 데이터 추천을 위한 개선된 스카이라인 질의 기법 (An Improved Skyline Query Scheme for Recommending Real-Time User Preference Data Based on Big Data Preprocessing)

  • 김지현;김종완
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권5호
    • /
    • pp.189-196
    • /
    • 2022
  • 스카이라인 질의(Skyline Query)는 객체의 다중 속성을 기준으로 사용자 선호에 적합한 대상을 탐색하는 기법이다. 기존 스카이라인 질의는 탐색 결과를 일괄처리(batch processing)로 반환하지만, 대화형 앱이나 모바일 환경의 등장으로 실시간 탐색 결과의 필요성이 증가하였다. 스카이라인을 위한 온라인 알고리즘(online algorithm)은 객체의 반환 속도를 향상해 실시간으로 선호 객체를 제공한다. 하지만 객체 탐색 과정에서 기존에 탐색한 영역을 재방문하여 반복 비교하는 불필요한 연산 시간이 소요된다. 본 논문은 온라인 알고리즘에서 불필요한 탐색 시간을 제거하여 스카이라인 질의 결과를 실시간으로 제공하기 위한 스카이라인 온라인 전처리 알고리즘을 제안한다. 제안 기법은 기존의 온라인 알고리즘에서 전처리를 수행함으로써 반복적으로 재탐색 되는 영역을 미리 제거하여 탐색 성능을 향상하였다. 실험 결과, 기존 온라인 알고리즘과 비교 시 이산 데이터 집합의 표준 분포, 편향 분포, 양의 상관 및 음의 상관분포에서 향상된 성능을 보였다. 제안 기법은 비교 대상을 최소화하여 탐색 성능을 향상하므로 모바일 장치의 사용이 증가하는 현실에서 사용자들에게 신속한 서비스를 제공할 수 있는 새로운 기준이 될 것이다.

분기한정법을 이용한 효율적인 리버스 스카이라인 질의 처리 (Efficient Reverse Skyline Processing using Branch-and-Bound)

  • 한아;박영배
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권1호
    • /
    • pp.12-21
    • /
    • 2010
  • 최근 이슈가 되고 있는 "정보 중심의 서비스"는 정보(정보 제공자)가 질의의 주체가 되어 정보 스스로 자신이 필요할 것 같은 고객을 찾아 제공되는 새로운 서비스 이다. 이러한 서비스는 정보를 사용할 가능성이 높은 특정한 고객들에게만 선택적으로 제공하기 때문에 적은 비용으로 높은 효과를 얻을 수 있다. 정보 중심의 서비스를 처리하기 위해 리버스 스카이라인기법을 제안한다. 리버스 스카이라인 기법 중 RSSA(Reverse Skyline using Skyline Approximations) 기법은 가장 정형화되고 성능이 증명된 방법이다. 그러나 메모리의 낭비와 실행시간의 낭비가 서로 상충작용을 하여 반복적인 한계를 유발하는 문제점이 있다. 본 논문에서는 리버스 스카이라인을 보다 효율적으로 구하기 위한 ERSL(Efficient Reverse Skyline) 알고리즘을 제안한다. ERSL 알고리즘은 BBS(Branch and Bound Skyline) 알고리즘을 발전시킨 새로운 기법으로 메모리와 실행시간의 낭비를 최소화 하고, 객체의 변화에 유연하여 추가적인 처리과정이 필요 없는 장점이 있다. ERSL의 성능을 평가하기 위해 대상객체의 수의 변화와 차원의 변화에 따른 실행시간을 측정하는 모의실험을 수행하였다. 그 결과 ERSL기법은 데이터양과 차원의 변화에 크게 영향을 받지 않고 일정한 성능을 유지하여 가장 효율적인 기법으로 증명되었다.

영역객체를 위한 리버스 스카이라인 질의 처리 (Reverse Skyline Query Processing for Region Objects)

  • 한아;이종혁;박영배
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권4호
    • /
    • pp.185-196
    • /
    • 2010
  • 이전의 리버스 스카이라인 질의 처리 기법들은 고정된 조건 값을 가지는 점객체 환경만을 고려하기 때문에, "가격이 5만원~7만원이고, 해변까지의 거리가 1km~2km인 호텔"와 같이 조건이 범위로 주어지는 영역객체 환경에서의 질의처리에는 부적합하다. 이러한 한계를 극복하기 위하여, 본 논문에서는 점객체 뿐만 아니라 영역객체 또한 지원 가능한 리버스 스카이라인 질의 처리 기법을 제안한다. 이는 첫째, 점객체 환경에서의 리버스 스카이라인 질의처리 기법 중 효율이 좋은 ERSL기법을 확장한 기법으로써 높은 성능을 기대할 수 있다. 또한 둘째, 영역객체와 제안하는 가지치기 기법과의 겹침 관계에 따라 결과객체의 중요도를 다르게 하여 질의자가 결과객체를 차별적으로 사용할 수 있도록 선택권을 제공한다는 새로운 특징이 있다. 본 기법은 영역객체를 지원하는 최초의 기법으로써 성능을 비교할 다른 대상기법이 없다. 그러므로 제안하는 기법의 성능 및 질의결과에 영향을 주는 조건이 무엇이며, 그에 따라 소모되는 실행시간을 측정하여 본 기법의 효율성을 증명하였다.

범주형 데이터에 대한 스카이라인 질의 알고리즘 (Skyline Query Algorithm in the Categoric Data)

  • 이우기;최중호;송종수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권7호
    • /
    • pp.819-823
    • /
    • 2010
  • 스카이라인 질의는 다차원, 대량의 데이터 검색에서 효율적인 방법이다. '지배한다'의 개념을 활용하여 약 95%이상으로 알려진 불필요한 데이터 집합을 검색 대상에서 제외하고 필요한 데이터에 집중하게 만들기 때문이다. 지금까지의 스카이라인 질의 알고리즘들은 데이터 집합이 모두 수치형 데이터일 경우에만 한정하여 개발되었다. 따라서 데이터베이스 등에 저장된 대부분의 텍스트 데이터들은 기존 스카이라인 질의 알고리즘을 사용하여 결과를 얻을 수 없었다. 본 연구는 스카이라인 질의의 대상을 범주형 데이터라는 전혀 새로운 영역을 개척한 점에서 의미가 있다. 우선 범주형 데이터 거리를 2종류를 개발하고 이를 스카이라인 질의에 적용하였고, 실험에서는 ACM의 실제 논문데이터를 사용하여 처리시간 및 정확도 비율 등에서 그 효과성을 입증하였다.

불완전 데이터를 위한 효율적 Top-k(g) 스카이라인 그룹 질의 처리 기법 (An Efficient Processing Method of Top-k(g) Skyline Group Queries for Incomplete Data)

  • 박미라;민준기
    • 정보처리학회논문지D
    • /
    • 제17D권1호
    • /
    • pp.17-24
    • /
    • 2010
  • 최근에 스카이라인 질의에 대한 관심이 점차 증가하고 있다. 대부분의 스카이라인 질의에 대한 연구는 데이터들이 널 값을 가지지 않는다는 가정에서 이루어진다. 그러나 우리가 웹이나 다른 도구로 데이터베이스에 자료를 입력할 때는 널 값을 가지는 불완전한 데이터가 존재한다. 따라서 불완전한 데이터를 위한 다양한 스카이라인 처리 기법들이 제안되었다. 그러나 기존의 불완전한 데이터를 위한 스카이라인 질의 처리 기법은 불완전한 데이터만을 고려함으로써 완전한 데이터와 불완전한 데이터가 공존하는 환경을 고려하지 않았다. 본 논문에서는 완전한 데이터를 위한 스카이라인 질의와 불완전한 데이터를 위한 스카이라인 질의를 모두 처리 하는 스카이라인 그룹 질의 처리 기법을 제안한다. 이를 위하여, 사용자 정의에 의한 차원의 선호도에 따라서 g개의 스카이라인 그룹을 검색하는 top-k(g) 스카이라인 그룹 질의를 도입하고, 이를 질의 처리하는 기법을 제안한다. 그리고 모의실험을 통하여 제안한 방식의 성능을 보인다.

센서 네트워크에서 다차원 데이터 스카이라인 질의 처리를 위한 CMF 기반의 우선처리 기법 (CMF-based Priority Processing Method for Multi-dimensional Data Skyline Query Processing in Sensor Networks)

  • 김진환;이광모
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권1호
    • /
    • pp.7-18
    • /
    • 2012
  • 데이터베이스 분야에서 다수의 속성을 갖는 데이터의 효율적인 의사 결정을 지원하는 스카이라인 질의에 관한 연구가 활발히 진행되고 있다. 스카이라인 질의란 대량의 데이터에서 필요한 관심 정보를 검색할 때 모든 속성의 데이터를 탐색하지 않고 속성 내에 의미 있는 데이터만 탐색하는 것이다. 이와 같은 스카이라인 질의는 센서 네트워크에서 다양한 환경 및 상황정보를 수집하여 사용자에게 제공하기 위해 유용하게 활용할 수 있다. 그러나 기존의 스카이라인 선출 방식은 다차원 데이터에서 스카이라인 선출시 센서의 수와 차원이 증가함에 따라 비교 계산 횟수가 급격히 증가하며 또한 지배력이 큰 값에 의해 단일 속성으로도 의미 있는 값이 제외될 수 있다. 따라서 본 논문에서는 싱크 노드로 부터 관심(interest) 질의를 하위 노드로 전송할 때 전체 데이터 중 일부 데이터들의 선호도(preference)를 판별할 수 있는 카테고리 기반 소속 함수(CMF : Category Based Member Function)를 함께 전송하여 스카이라인 선출 시 차원의 증가로 발생할 수 있는 비교 계산의 복잡성을 감소시키고 선호도 높은 우선순위 데이터를 처리하는 기법을 제안한다. 제안된 기법의 우수성을 보이기 위해 시뮬레이션을 통한 성능평가를 수행하였으며 그 결과 다차원의 센서 데이터 집합에서 데이터 검출 시 카테고리 기반 소속 함수를 기반으로 한 처리기법에서 시간 복잡도가 감소함을 보였으며 지배력이 큰 스카이라인으로부터 제외된 의미 있는 속성 값을 검출할 수 있었다.

2-계층 그리드 블록을 이용한 효과적인 맵리듀스 기반 스카이라인 질의 처리 기법 (An Efficient MapReduce-based Skyline Query Processing Method with Two-level Grid Blocks)

  • 유형철;정성원
    • 정보과학회 논문지
    • /
    • 제44권6호
    • /
    • pp.613-620
    • /
    • 2017
  • 스카이라인 질의는 사용자들의 다양한 기준을 만족하는 데이터를 찾기 때문에 의사 결정 문제 등에서 폭넓게 사용되고 있다. 최근의 스카이라인 질의는 대용량 데이터베이스 처리를 위해 맵리듀스 프레임워크를 사용하는 연구들이 많이 진행되었으며 특히 맵리듀스에 기존의 색인 구조를 적용하는 방식으로 연구가 활발히 진행되고 있다. 스카이라인의 특징 중 하나는 원점에서 가까운 데이터일수록 더 많은 영역을 지배한다는 점이다. 하지만 기존의 색인 구조는 이와 같은 스카이라인의 특징을 반영하지 못하는 단점이 있었다. 본 논문에서는 그리드의 셀들을 스카이라인의 특징을 고려하여 묶는 그리드 블록 구조와 원점과 가까운 데이터가 없을 때도 사용 가능한 2계층 그리드 블록 구조, 그리고 2계층 그리드 블록 구조를 사용한 효율적인 스카이라인 질의 기법을 제안하였다.

An Efficient Grid Method for Continuous Skyline Computation over Dynamic Data Set

  • Li, He;Jang, Su-Min;Yoo, Kwan-Hee;Yoo, Jae-Soo
    • International Journal of Contents
    • /
    • 제6권1호
    • /
    • pp.47-52
    • /
    • 2010
  • Skyline queries are an important new search capability for multi-dimensional databases. Most of the previous works have focused on processing skyline queries over static data set. However, most of the real applications deal with the dynamic data set. Since dynamic data set constantly changes as time passes, the continuous skyline computation over dynamic data set becomes ever more complicated. In this paper, we propose a multiple layer grids method for continuous skyline computation (MLGCS) that maintains multiple layer grids to manage the dynamic data set. The proposed method divides the work space into multiple layer grids and creates the skyline influence region in the grid of each layer. In the continuous environment, the continuous skyline queries are only handled when the updating data points are in the skyline influence region of each layer grid. Experiments based on various data distributions show that our proposed method outperforms the existing methods.

센서 네트워크에서 연속 스카이라인 질의 처리를 위한 상향식 필터링 투플 선정 방법 (A Bottom up Filtering Tuple Selection Method for Continuous Skyline Query Processing in Sensor Networks)

  • 선진호;정진완
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권4호
    • /
    • pp.280-291
    • /
    • 2009
  • 스카이라인 질의 처리는 센서 네트워크 응용에서 다차원 데이터를 효과적으로 활용할 수 있어서 그 역할이 중요하다. 센서 네트워크는 배터리 제약 사항을 가지고 있기 때문에, 센서 네트워크에서의 스카이라인에 관한 연구는 에너지 소비를 최소화 하는데 그 목표를 두고 있다. 이를 위해 기존연구에서 필터링 기법이 제안되었다. 하지만 기존 필터링 기법은 일회성 질의에 초점을 맞추고 있고, 상위 노드의 정보만을 활용하기 때문에 그 성능의 한계가 있다. 본 논문에서는 연속스카이라인 질의 처리를 위한 상향식 필터링 투플 선정 방법을 제안한다. 하위노드에서 생성된 이전 스카이라인 정보를 각 센서노드에 저장하고, 필터링 투플 선정에 활용함으로써 불필요한 데이터 통신을 감소시킬 수 있다, 이와 더불어 추가 필터링 투플을 선택할 때 사용될 수 있는 SFT(Support Filtering Tuple)방법을 제안한다. 센서 데이터의 경우, 이전 센싱된 데이터와 현재 데이터 간의 시간 관계성(temporal correlation)의 특징을 갖고 있다. SFT 방법은 저장된 과거 데이터를 기반으로 현재데이터를 예측하여 추가 필터링 투플을 선정하여 필터링 성능을 향상시킨다. 실험 결과를 통해, 제안하는 방법들이 기존 방법에 비해 데이터 감소율과 총 통신량 측면에서 효율적임을 보여준다.