DOI QR코드

DOI QR Code

Performance Optimization in GlusterFS on SSDs

SSD 환경 아래에서 GlusterFS 성능 최적화

  • 김덕상 (서울대학교 컴퓨터공학부) ;
  • 엄현상 (서울대학교 컴퓨터공학부) ;
  • 염헌영 (서울대학교 컴퓨터공학부)
  • Received : 2015.09.09
  • Accepted : 2015.11.13
  • Published : 2016.02.15

Abstract

In the current era of big data and cloud computing, the amount of data utilized is increasing, and various systems to process this big data rapidly are being developed. A distributed file system is often used to store the data, and glusterFS is one of popular distributed file systems. As computer technology has advanced, NAND flash SSDs (Solid State Drives), which are high performance storage devices, have become cheaper. For this reason, datacenter operators attempt to use SSDs in their systems. They also try to install glusterFS on SSDs. However, since the glusterFS is designed to use HDDs (Hard Disk Drives), when SSDs are used instead of HDDs, the performance is degraded due to structural problems. The problems include the use of I/O-cache, Read-ahead, and Write-behind Translators. By removing these features that do not fit SSDs which are advantageous for random I/O, we have achieved performance improvements, by up to 255% in the case of 4KB random reads, and by up to 50% in the case of 64KB random reads.

빅데이터, 클라우드 컴퓨팅 시대가 오면서 데이터 사용량이 점점 증가하고 있고 이러한 빅데이터를 신속히 처리하기 위한 시스템들이 개발되고 있다. 그 중 데이터를 저장하기 위한 시스템으로 분산 파일 시스템이 널리 사용되고 있다, 이러한 분산 파일 시스템 중에는 글러스터 파일 시스템(GlusterFS)이 있다. 또한 기술의 발달로 고성능 장비인 Nand flash SSD (Solid State Drive)의 가격이 하락함에 따라서 데이터센터로 도입이 증가되는 추세이다. 따라서 GlusterFS에서도 SSD를 도입하려고 하지만, GlusterFS는 하드디스크를 기반으로 설계되었기 때문에 SSD를 이용했을 시 구조적인 문제로 성능 저하가 발생하게 된다. 이러한 구조적인 문제점들에는 I/O-cache, Read-ahead, Write-behind Translator들이 있다. 랜덤 I/O에 장점이 있는 SSD에 맞지 않는 기능들을 제거함으로써, 4KB 랜덤 읽기의 경우 255%까지의 성능 향상 결과와, 64KB 랜덤 읽기의 경우 50%까지의 성능 향상 결과를 얻었다.

Keywords

Acknowledgement

Grant : 빅데이터 처리 고도화 핵심기술개발 사업 총괄 및 고성능컴퓨팅 기술을 활용한 성능 가속화 기술 개발

Supported by : 삼성전자, 한국연구재단, 정보통신기술진흥센터, 한국과학기술정보연구원

References

  1. S. Weil, S. Brandt, E. Miller, D. Long, and C. Maltzahn, "Ceph: A Scalable, High-Performance Distributed File System," Proc. of the 7th Symposium on Operating Systems Design and Implementation, 2006.
  2. Red Hat. (2015, Sep. 9). GlusterFS [Online]. Available: http://www.gluster.org (downloaded 2015, Sep. 9)
  3. A. Davies and A. Orsaria, "Scale out with glusterfs," Linux Journal, Vol. 2013, No. 235, Nov. 2013.
  4. J. Axboe. (2015, Sep. 9). Flexible IO Tester [Online]. Available: http://git.kernel.dk/?p=fio.git;a=summary (downloaded 2015, Sep. 9)
  5. C. Park, P. Talawar, D. Won, M. Jung, J. Im, S. Kim, and Y. Choi, "A High Performance Controller for NAND Flash-based Solid State Disk (NSSD)," Proc. of the 21st IEEE Non-Volatile Semiconductor Memory Workshop, Monterey, 2006.
  6. C. Dirik and B. Jacob, "The performance of PC solid-state disks (SSDs) as a function of bandwidth, concurrency, device architecture, and system organization," Proc. of the 36th Annual International Symposium on Computer Architecture, 2009.
  7. D. Narayanan, E. Thereska, A. Donnelly, S. Elnikety, and A. Rowstron, "Migrating server storage to SSDs: analysis of trade-offs," Proc. of the 4th ACM European Conference on Computer Systems, 2009.