DOI QR코드

DOI QR Code

클러스터 파일 시스템에서 인라인 데이터 중복제거 설계 및 구현

Design and Implementation of Inline Data Deduplication in Cluster File System

  • 김영철 (한국전자통신연구원 고성능컴퓨팅연구부) ;
  • 김재열 (한국전자통신연구원 고성능컴퓨팅연구부) ;
  • 이상민 (한국전자통신연구원 고성능컴퓨팅연구부) ;
  • 김영균 (한국전자통신연구원 고성능컴퓨팅연구부)
  • 투고 : 2016.03.16
  • 심사 : 2016.06.02
  • 발행 : 2016.08.15

초록

클라우드 컴퓨팅 환경에서 가상 컴퓨팅 및 스토리지 자원에 대한 요구가 대규모로 증가하면서 스토리지 시스템에서는 스토리지 공간을 효율적으로 절감하고 활용할 수 있는 중복제거 기법을 적용하고 있다. 특히 가상 데스크탑 인프라 환경에서 가상 데스크탑 이미지들에 대해 동일한 데이터가 중복되어 저장되는 것을 방지함으로써 스토리지 공간을 절감하는데 큰 효과를 얻을 수 있다. 하지만 안정적인 가상 데스크탑 서비스를 제공하기 위해서는 중복제거로 인한 가상 데스크탑의 성능 오버헤드와 주기적으로 발생하는 데이터 입출력 폭증, 그리고 빈번한 랜덤 입출력 동작과 같은 가상 데스크탑이 가지고 있는 특이한 워크로드를 효과적으로 처리할 수 있는 스토리지 시스템이 필요하다. 본 논문에서는 클라우드 컴퓨팅 환경에서 가상 데스크탑 및 스토리지 서비스를 지원하기 위해 개발된 클러스터 파일 시스템을 제시한다. 여기에서는 가상 데스크탑 이미지들에서 중복된 데이터가 스토리지에 저장되기 이전에 실시간으로 검출하고 제거하는 인라인 데이터 중복제거 기법을 통해 스토리지 공간을 절감한다. 또한 가상 데스크탑 이미지에 대한 중복제거 처리를 가상 호스트가 아니라 가상 데스크탑 이미지가 실제로 저장되는 데이터 서버에서 수행함으로써 중복제거 처리로 인한 가상 데스크탑의 성능 오버헤드를 줄인다.

The growing demand of virtual computing and storage resources in the cloud computing environment has led to deduplication of storage system for effective reduction and utilization of storage space. In particular, large reduction in the storage space is made possible by preventing data with identical content as the virtual desktop images from being stored on the virtual desktop infrastructure. However, in order to provide reliable support of virtual desktop services, the storage system must address a variety of workloads by virtual desktop, such as performance overhead due to deduplication, periodic data I/O storms and frequent random I/O operations. In this paper, we designed and implemented a clustered file system to support virtual desktop and storage services in cloud computing environment. The proposed clustered file system provides low storage consumption by means of inline deduplication on virtual desktop images. In addition, it reduces performance overhead by deduplication process in the data server and not the virtual host on which virtual desktops are running.

키워드

과제정보

연구 과제번호 : (ICBMS-총괄) ICBMS(IoT, 클라우드, 빅데이터, 모바일, 정보보호) 핵심 기술 개발 사업 총괄 및 엑사스케일급 클라우드 스토리지 기술 개발

연구 과제 주관 기관 : 정보통신기술진흥센터

참고문헌

  1. K. Jin et al., "The Effectiveness of Deduplication on Virtual Machine Disk Images," Proc. of ACM SYSTOR, 2009.
  2. Data Deduplication, [Online]. Available: http://en.wikipedia.org/wiki/Data_deduplication
  3. C. Dubnicki, et al., "Hydrastor: A Scalable Secondary Storage," Proc. of USENIX FAST, 2009.
  4. J. Wei, et al., "Mad2: A Scalable High-Throughput Exact Deduplication Approach for Network Backup Services," Proc. of IEEE 26th Symp. MSST, 2010.
  5. ZFS, [Online]. Available: http://en.wikipedia.org/wiki/ZFS
  6. SDFS, [Online]. Available: http://opendedup.org
  7. LessFS, [Online]. Available: http://sourceforge.net/projects/lessfs
  8. C. Ng et al., "Live Deduplications Storage of Virtual Machine Images in an Open-Source Cloud," Proc. of the ACM/IFIP/USENIX 12th International Middleware Conf., Dec. 2011.
  9. Y. Kim, et al., "MAHA-FS: A distributed file system for high performance metadata processing and random IO," KIPS TSDE, Vol. 2, No. 2, 2013.
  10. J. Kim et al., "Performance Enhancement of Distributed File System as Virtual Desktop Storage using Client Side SSD Cache," KIPS TCCS, Vol. 3, No. 12, 2014.
  11. FUSE: Filesystem in Userspace, [Online]. Available: http://fuse.sourceforge.net
  12. A. Gulati, et. al., "Storage Workload Characterization and Consolidation in Virtualized Environments," VPACT, 2009.
  13. Y. Kim et al., "File-based Snapshot for Desktop Virtualization," Proc. of Spring Conf. of KIPS, 2014.
  14. Virtual disk image, [Online]. Available: http://en.wikipedia.org/wiki/Virtual_disk_image
  15. OpenSSL, [Online]. Available: http://www.openssl.org
  16. AES-NI, [Online]. Available: http://software.intel.com/en-us/articles/intel-advanced-encryption-standardinstructions-aes-ni
  17. The qcow2 image format, [Online]. Available: https://people.gnome.org/-markmc/qcow-image-format.html
  18. Iometer, [Online]. Available: http://www.iometer.org
  19. White paper, "Windows 7 IOPS for VDI: Deep Dive," Atlantis Computing Inc., 2016.