DOI QR코드

DOI QR Code

A Review of Science of Databases and Analysis of Its Case Studies

데이터베이스의 과학에 대한 고찰 및 연구 사례 분석

  • 서영균 (KISTI 국가슈퍼컴퓨팅연구소) ;
  • 김종욱 (상명대학교 미디어소프트웨어)
  • Received : 2015.11.17
  • Accepted : 2016.01.05
  • Published : 2016.02.15

Abstract

In this paper we introduce a novel database research area called science of databases (SoDB) and carry out a comprehensive analysis of its case studies. SoDB aims to better understand interesting phenomena observed across multiple database management systems (DBMSes). While mathematical and engineering work in the database field has been dominant, less attention has been given to scientific approaches through which DBMSes can be better understood. Scientific investigations can lead to better engineered designs through deeper understanding of query optimizers and transaction processing. The SoDB research has investigated several interesting phenomena observed across different DBMSes and provided several engineering implications based on our uncovered results. In this paper we introduce a novel scientific, empirical methodology and describe the research infrastructure to enable the methodology. We then review each of a selected group of phenomena studied and present an identified structural causal model associated with each phenomenon. We also conduct a comprehensive analysis on the case studies. Finally, we suggest future directions to expand the SoDB research.

본 논문은 새로운 연구 분야인, 데이터베이스의 과학을 소개하고 그에 대한 연구 사례들을 분석한다. 데이터베이스에 대한 과학은 다중의 데이터베이스 관리 시스템에서 교차되어 관찰되는 흥미로운 현상을 더 잘 이해하는데 목적이 있다. 그동안 데이터베이스 연구 분야에서 수학적이고 공학적인 연구가 주류를 이루어 온데 반해, 데이터베이스 관리 시스템을 잘 이해할 수 있는 과학적인 연구는 다소 덜 주목받아 왔다. 사실 과학적인 연구는 질의 최적화 및 트랜잭션 처리에 대한 더 깊은 이해를 이끌어 내어 궁극적으로 기존 데이터베이스 관리 시스템의 성능을 개선하는데 간접적으로 기여할 수 있다. 데이터베이스에 대한 과학 분야는 현재까지 서로 다른 데이터베이스 관리 시스템으로부터 관찰된 다수의 현상 사례들을 연구하고 발견된 결과를 토대로 다수의 공학적 함의를 제공해 왔다. 본 논문은 데이터베이스에 대한 과학적, 실증적 연구 방법론을 살펴보고, 이를 지원하는 사이버 인프라를 소개한다. 이어서 지금까지 다뤄진 현상 연구 사례들을 복개하고 각 현상의 설명을 위해 제안된 실증적으로 검증된 구조 인과 모델을 논의한다. 끝으로, 연구 사례들을 종합적으로 분석 한 후, 관심 연구자들을 위한 향후 연구 방향을 제시한다.

Keywords

Acknowledgement

Supported by : 한국연구재단

References

  1. T. Horikawa, "An Approach for Scalability-Bottleneck Solution: Identification and Elimination of Scalability Bottlenecks in a DBMS," SIGSOFT SEN 36, pp. 31-42, 2011.
  2. S. Chaudhuri and U. Dayal, "An Overview of Data Warehousing and OLAP Technology," SIGMOD Record 26, pp. 65-74, 1997. https://doi.org/10.1145/248603.248616
  3. S. A. Schuster, "Relational Data Base Management for On-Line Transaction Processing," Technical Report 81.5, Tandem Computers Incorporated, 1981.
  4. R. Snodgrass and llsoo Ahn, "Temporal Databases," IEEE Computer, Vol. 19, No. 9, pp. 35-42, 1986.
  5. R. Kallman, et. al., "H-Store: a High-Performance, Distributed Main Memory Transaction Processing System," PVLDB, Vol. 1, No. 2, pp. 1496-1499, 2008.
  6. M. Stonebraker, et. al., "C-store: a Column-oriented DBMS," VLDB, pp. 553-564, Aug. 2005.
  7. R. Snodgrass, [Online]. Available: http://www.cs.arizona.edu/projects/soc/sodb/, viewed on October 26, 2015.
  8. R. Snodgrass, [Online]. Available: http://www.cs.arizona.edu/-rts/ergalics, viewed on October 26, 2015.
  9. R. Snodgrass and P. Denning, "The Science of Computer Science: Closing Statement: The Science of Computer Science (Ubiquity Symposium)," Ubiquity, 2014(6):1-11, Jun. 2014.
  10. C. Morrison and R. Snodgrass, "Computer Science Can Use More Science," Communications of the ACM, Vol. 54, No. 7, pp. 36-39, Jun. 2011.
  11. P. Cohen, Empirical Methods for Artificial Intelligence, MIT Press, 1995.
  12. L. Peterson, et. al., "Experiences Building Planet-Lab," OSDI, pp. 351-366, 2006.
  13. G. Werner-Allen, et. al., "MoteLab: A Wireless Sensor Network Testbed," IPSN, pp. 483-488, 2005.
  14. G. Larkou, et. al., "Managing Smartphone Testbeds with SmartLab," LISA, pp. 115-132, 2013.
  15. E. Cuervo, et. al., "Crowdlab: An Architecture for Volunteer Mobile Testbeds," COMSNETS, pp. 1-10, 2011.
  16. R. Naveen and J. R. Haritsa, "Analyzing Plan Diagrams of Database Query Optimizers," VLDB, pp. 1228-1239, 2005.
  17. Y-K. Suh, et. al., "AZDBLab: A Laboratory Information System for Large-scale Empirical DBMS Studies," PVLDB, Vol. 7, No. 13, pp. 1641-1644, 2014.
  18. S. Currim, et. al., "DBMS Metrology: Measuring Query Time," SIGMOD, pp. 421-432, Jun. 2013.
  19. Y.-K. Suh (2015). Exploring Causal Factors of DBMS Thrashing (Doctoral dissertation). Dept. of Computer Science, Univ. of Arizona, Tucson, AZ.
  20. TPC-H, [Online]. Available: http://www.tpc.org/tpch, viewed on Dec. 2015.
  21. TPC-C, [Online]. Available: http://www.tpc.org/tpcc, viewed on Dec. 2015.
  22. A. F. Hayes, Introduction to Mediation, Moderation, and Conditional Process Analysis: A Regression-Based Approach, Guilford, 2013.