DOI QR코드

DOI QR Code

A Selective Compression Strategy for Performance Improvement of Database Compression

데이터베이스 압축 성능 향상을 위한 선택적 압축 전략

  • Received : 2015.07.28
  • Accepted : 2015.08.24
  • Published : 2015.09.30

Abstract

The Internet of Things (IoT) significantly increases the amount of data. Database compression is important for big data because it can reduce costs for storage systems and save I/O bandwidth. However, it could show low performance for write-intensive workloads such as OLTP due to the updates of compressed pages. In this paper, we present practical guidelines for the performance improvement of database compression. Especially, we propose the SELECTIVE strategy, which compresses only tables whose space savings are close to the expected space savings calculated by the compressed page size. Experimental results using the TPC-C benchmark and MySQL show that the strategy can achieve 1.1 times better performance than the uncompressed counterpart with 17.3% space savings.

사물인터넷 (IoT)은 데이터의 양을 상당히 증가시킨다. 데이터베이스 압축은 저장 시스템 비용과 I/O 대역폭을 절약할 수 있기 때문에 빅데이터에 있어서 중요하다. 그러나 데이터베이스 압축은 압축된 페이지에 대한 업데이트로 인해 OLTP와 같은 쓰기 집중적인 워크로드에 대해 낮은 성능을 보일 수 있다. 본 논문에서는 데이터베이스 압축의 성능 향상을 위한 실용적 가이드라인을 제시한다. 특히, 압축 페이지 크기에 의한 계산으로부터 예상되는 공간 절약과 거의 같은 공간 절약을 보이는 테이블들만을 압축하는 SELECTIVE 전략을 제시한다. TPC-C 벤치마크와 MySQL을 이용한 실험을 통해 SELECTIVE 전략이 압축하지 않는 방법에 비해 1.1배 높은 성능을 보이면서 17.3%의 공간을 절약한다는 것을 보였다.

Keywords

References

  1. K.-H. Lee, "Performance Improvement of Database Compression for OLTP Workloads," IEICE Trans. on Information and Systems, Vol.E97-D, No.4, pp.976-980, Apr., 2014. https://doi.org/10.1587/transinf.E97.D.976
  2. M. Poess and D. Potapov, "Data Compression in Oracle," In Proc. the Int'l Conf. on Very Large Data Bases (VLDB), pp.937-947, Sept., 2003.
  3. MySQL 5.5 Reference Manual, https://dev.mysql.com/doc/refman/5.5/en/
  4. Transaction Processing Performance Council (TPC), TPC BENCHMARK C, Standard Specification, Revision 5.11, Feb., 2010.
  5. B. Bhattacharje et al., "Efficient index compression in DB2 LUW," In Proc. the Int'l Conf. on Very Large Data Bases (VLDB), pp.1462-1473, Aug., 2009.
  6. N. Ordulu and J. Tolmer, "InnoDB Compression: Present and Future," Percona Live MySQL Conference, Apr., 2013.
  7. zlib, http://zlib.net
  8. M. A. Roth and S. J. V. Horn, "Database Compression," ACM SIGMOD Record, Vol.22, No.3, pp.31-39, Sept., 1993. https://doi.org/10.1145/163090.163096
  9. Database Test 2 (DBT2), http://sourceforge.net/apps/mediawiki/osdldbt
  10. P. Zaitsev, "MySQL/InnoDB Performance, Server and Schema," MySQL Users Conference, Apr., 2004.
  11. CrystalDiskMark, http://crystalmark.info/?lang=en
  12. E.-M. Lee, S.-W. Lee, and S. Park, "Optimizing Index Scans on Flash Memory SSDs," ACM SIGMOD Record, Vol.40, No.4, pp.5-10, Dec., 2011. https://doi.org/10.1145/2094114.2094116