쿠버네티스 환경에서 Cool Down Time 설정에 따른 CPU 사용량 및 서비스 응답시간 분석

An Analysis of CPU Utilization and Service Latency Based on Cool Down Time Configuration in Kubernetes

  • 권서은 (고려대학교 정보대학 컴퓨터학과) ;
  • 김동균 (고려대학교 정보대학 컴퓨터학과) ;
  • 유헌창 (고려대학교 정보대학 컴퓨터학과)
  • Seoeun Kwon (Dept. of Computer Science and Engineering, Korea University) ;
  • Donggyun Kim (Dept. of Computer Science and Engineering, Korea University) ;
  • Heonchang Yu (Dept. of Computer Science and Engineering, Korea University)
  • 발행 : 2024.10.31

초록

쿠버네티스의 HPA(Horizontal Pod Autoscaling) 기법은 워크로드의 규모에 따라 동적으로 컨테이너 리소스를 조정하여 시스템 성능을 최적화하고 자원 활용 효율성을 높이는 역할을 한다. 그러나 HPA의 주요 문제점인 pod flapping을 해결하기 위해 CDT(Cool Down Time)가 도입되었다. 본 논문은 다르게 설정한 CDT 값에 따라 각 CPU 자원 할당량 별 지연 시간과 자원 사용량을 분석했다. 실험 결과 CDT 설정값이 성능과 자원 사용량에 영향을 미치는 것을 파악했고, 이를 바탕으로 자원 사용량과 SLO(Service-level Objective) 만족률을 모두 고려한 최적의 CDT 설정의 필요성을 제고한다.

키워드

과제정보

본 연구는 2024년 과학기술정보통신부 및 정보통신기획평가원의 SW중심대학사업 지원을 받아 수행되었음(2023-0-00044)

참고문헌

  1. Ramperez, Victor, et al. "FLAS: A combination of proactive and reactive auto-scaling architecture for distributed services." Future Generation Computer Systems 118 (2021): 56-72.
  2. https://kubernetes.io/ko/docs/tasks/run-application/horizontal-pod-autoscale/
  3. Dogani, Javad, Farshad Khunjush, and Mehdi Seydali. "K-agrued: A container autoscaling technique for cloud-based web applications in kubernetes using attention-based gru encoder-decoder." Journal of Grid Computing 20.4 (2022): 40.