DOI QR코드

DOI QR Code

Column-aware Transaction Management Scheme for Column-Oriented Databases

컬럼-지향 데이터베이스를 위한 컬럼-인지 트랜잭션 관리 기법

  • Received : 2014.01.06
  • Accepted : 2014.04.02
  • Published : 2014.08.30

Abstract

The column-oriented database storage is a very advanced model for large-volume data analysis systems because of its superior I/O performance. Traditional data storages exploit row-oriented storage where the attributes of a record are placed contiguously in hard disk for fast write operations. However, for search-mostly datawarehouse systems, column-oriented storage has become a more proper model because of its superior read performance. Recently, solid state drive using MLC flash memory is largely recognized as the preferred storage media for high-speed data analysis systems. The features of non-volatility, low power consumption, and fast access time for read operations are sufficient grounds to support flash memory as major storage components of modern database servers. However, we need to improve traditional transaction management scheme due to the relatively slow characteristics of column compression and flash operation as compared to RAM memory. In this research, we propose a new scheme called Column-aware Multi-Version Locking (CaMVL) scheme for efficient transaction processing. CaMVL improves transaction performance by using compression lock and multi version reads for efficiently handling slow flash write/erase operation in lock management process. We also propose a simulation model to show the performance of CaMVL. Based on the results of the performance evaluation, we conclude that CaMVL scheme outperforms the traditional scheme.

컬럼-지향 데이터베이스 저장소는 우수한 입출력 성능으로 대용량 데이터 분석 시스템을 위한 매우 진보적인 모델이다. 전통적인 데이터 저장소는 빠른 쓰기 연산을 위하여 한 레코드의 속성들을 하드디스크에 연속적으로 배치되어 있는 가로-지향 저장 모델을 활용하였다. 하지만 검색이 대부분인 데이터웨어하우스 시스템을 위해서는 월등한 판독 성능 때문에 컬럼-지향 저장소가 더 적합한 모델이 되고 있다. 또한 최근에는 플래시 메모리를 사용한 SSD가 고속 데이터 분석 시스템을 위한 적합한 저장 매체로 인식되고 있다. 이제 플래시 메모리는 비휘발성, 낮은 전력소모, 빠른 데이터 접근 속도 등의 특징으로 최신 데이터베이스 서버의 핵심 저장 요소로 충분한 기반이 되었다. 하지만 컬럼 압축의 느린 특성과 일반 RAM 메모리에 비하여 상대적으로 느린 플래시 메모리 연산 특성을 고려하여 기존의 트랜잭션 처리 기법을 개선할 필요가 있다. 본 연구에서는 효율적인 트랜잭션 처리를 위하여 컬럼-인지 다중 버전로킹(CaMVL) 기법을 제안한다. CaMVL은 로크 관리 과정에서 플래시의 느린 쓰기 연산과 지우기 연산을 효과적으로 제어하기 위하여 멀티 버전 읽기를 허용하고 압축 로크를 허용하여 트랜잭션 처리 성능을 높인다. 또한 성능 검증을 위하여 시뮬레이션 모델을 제안하였으며 실험 결과 분석을 통하여 CaMVL이 기존의 트랜잭션 처리 기법보다 우수함을 확인하였다.

Keywords

References

  1. S. Ahn, K. Kim. "A Join Technique to Improve the Performance of Star Schema Queries in Column- Oriented Databases," Journal of Korean Institute of Information Scientist and Engineers, Vol. 40, no.3, pp. 209-218, 2013.6.
  2. S. Byun. "Column-aware Polarization Scheme for High-Speed Database Systems," Journal of Korean Society Internet Information, Vol. 13, no.3, pp. 83- 91, 2012. https://doi.org/10.7472/jksii.2012.13.3.83
  3. D. Abadi, A. Boncz, and S. Harizopoulos, "Columnoriented Database Systems," Proc. of the VLDB, Lyon, France, August 24-28 2009.
  4. S. Harizopoulos, V. Liang, D. J. Abadi, and S. Madden, "Performance tradeoffs in read-optimized databases," Proc. of VLDB, pp. 487-498, 2006.
  5. S. Byun, M. Hur, "Flash memory Lock management for portable information systems," International Journal of Cooperative Information Systems, Vol. 15, no. 3, pp. 461-479, Aug. 2006 https://doi.org/10.1142/S0218843006001438
  6. Lucas Mearian, "Analysis: SSD performance -- is a slowdown inevitable?," Available From: http://www. computerworld.com/s/article/9132668/Analysis_SSD_ performance_is_a_slowdown_inevitable_?taxonomyId =19& pageNumber=3, 2013.
  7. D. Abadi, S. Madden, and M. Ferreira. "Integrating compression and execution in column-oriented database systems," Proc. of SIGMOD, pp. 671-682, 2006.
  8. Jeffrey Bausch, "MLC vs. SLC NAND flash memory," http://www2.electronicproducts.com/MLC_vs_ SLC_NAND_flash_memory-article-nand_flash_jul201 1-html.aspx, 2013.
  9. Samsung, Samsung, "what is NAND Flash based SSD?," http://www.samsung.com/global/business/ semiconductorproducts/flash/Products_FlashSSD. html, 2013.
  10. D. Abadi, D. Myers, D. DeWitt, and S. Madden. "Materialization strategies in a column-oriented dbms," MIT CSAIL Technical Report. MIT-CSAIL- TR-2006-078, 2006.
  11. Tamer Ozsu, and Patrick Valduriez, "Principles of Distributed Database Systems," Springer New York, 2011.
  12. Ramez Elmasri, Shamkant B. Navathe, "Fundamentals of Database Systems," Addison Wesley, 2007.
  13. Mesquite, "CSIM2.0 Development Toolkit for Simulation and Modeling," http://www.Mesquite.com/documentation/ documents/CSIM20_User_ Guide-C.pdf, 2013.