DOI QR코드

DOI QR Code

An Efficient Processing Method of Top-k(g) Skyline Group Queries for Incomplete Data

불완전 데이터를 위한 효율적 Top-k(g) 스카이라인 그룹 질의 처리 기법

  • 박미라 (한국기술교육대학교 정보미디어공학과) ;
  • 민준기 (한국기술교육대학교 인터넷미디어공학부)
  • Published : 2010.02.28

Abstract

Recently, there has been growing interest in skyline queries. Most of works for skyline queries assume that the data do not have null value. However, when we input data through the Web or with other different tools, there exist incomplete data with null values. As a result, several skyline processing techniques for incomplete data have been proposed. However, available skyline query techniques for incomplete data do not consider the environments that coexist complete data and incomplete data since these techniques deal with the incomplete data only. In this paper, we propose a novel skyline group processing technique which evaluates skyline queries for the environments that coexist complete data and incomplete data. To do this, we introduce the top-k(g) skyline group query which searches g skyline groups with respect to the user's dimensional preference. In our experimental study, we show efficiency of our proposed technique.

최근에 스카이라인 질의에 대한 관심이 점차 증가하고 있다. 대부분의 스카이라인 질의에 대한 연구는 데이터들이 널 값을 가지지 않는다는 가정에서 이루어진다. 그러나 우리가 웹이나 다른 도구로 데이터베이스에 자료를 입력할 때는 널 값을 가지는 불완전한 데이터가 존재한다. 따라서 불완전한 데이터를 위한 다양한 스카이라인 처리 기법들이 제안되었다. 그러나 기존의 불완전한 데이터를 위한 스카이라인 질의 처리 기법은 불완전한 데이터만을 고려함으로써 완전한 데이터와 불완전한 데이터가 공존하는 환경을 고려하지 않았다. 본 논문에서는 완전한 데이터를 위한 스카이라인 질의와 불완전한 데이터를 위한 스카이라인 질의를 모두 처리 하는 스카이라인 그룹 질의 처리 기법을 제안한다. 이를 위하여, 사용자 정의에 의한 차원의 선호도에 따라서 g개의 스카이라인 그룹을 검색하는 top-k(g) 스카이라인 그룹 질의를 도입하고, 이를 질의 처리하는 기법을 제안한다. 그리고 모의실험을 통하여 제안한 방식의 성능을 보인다.

Keywords

References

  1. S. Borzsonyi, D. Kossmann, and K. Stocker, “The Skyline Operator,” ICDE, pp.421-430, 2001.
  2. W. Jin, J. Han, and M. Ester, “Mining thick skylines over large databases,” PKDD, 2004.
  3. V. Hristidis, N. Koudas, and Y. Papakonstantinou, “PREFER: A system for the efficient execution of multi-parametric ranked queries,” SIGMOD, 2001.
  4. Y. Yuan, X. Lin, Q. Liu, W. Wang, J. X. Yu, and Q. Zhang, 2005“Efficient computation of the skyline cube,” VLDB, 2005.
  5. J. W. Lee, G. W. You, and S. W. Hwang, “Telescope: Zooming to Interesting Skylines,” DASFAA, 2007.
  6. T. Xia, and D. Zhang, “Refreshing the Sky: The Compressed Skycube with Efficient Support for Frequent Updates,” ACM SIGMOD, 2006.
  7. M. E. Khalefa, M. F. Mokbel, and J. J. Levandoski, “Skyline Query Processing for incomplete Data,” ICDE, 2008.
  8. J. Pei, W. Jin, M. Ester, and Y. Tao, “Catching the best views of skyline: A semantic approach based on decisive subspaces,” VLDB, 2005.
  9. C. Y. Chan, H. V. Jagadish, K. L. Tan, A. K. H. Tung, and Z. Zhang, “Finding k-Dominant Skylines in High Dimensional Space,” SIGMOD, 2006.
  10. Y. Tao, and D. Papadias, “Maintaining Sliding Window Skyline on Data Streams,” TKDE, 2006.
  11. X. Lin, Y. Yuan, and W. Wang, “Stabbing the Sky: Efficient Skyline Computation over Sliding Windows,” ICDE, 2005.
  12. C. Y. Chan, H. V. Jagadish, A. K. H. Tung, and Z. Zhang, “On high dimensional skylines,” EDBT, 2006.
  13. N. Bruno, L. Gravano, and A. Marian, “Evaluating Top-k Queries over Web-accessible Databases,” ICDE, 2002.