• 제목/요약/키워드: HTCondor

검색결과 3건 처리시간 0.021초

HTCondor 클러스터를 위한 동적 자원 스케줄링 (Dynamic Resource Scheduling for HTCondor Cluster)

  • 이정하;염재근;정기문;조혜영;정대용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.250-252
    • /
    • 2015
  • 다양한 분야에서 활발히 연구되는 빅 데이터와 최근 이슈가 되고 있는 딥러닝(Deep-learning) 등은 컴퓨터공학 분야뿐만 아니라 다양한 분야와 접목하여 이에 대한 관심이 증가하고 있다. 대규모 클러스터를 통하여 빅데이터와 딥러닝 같은 계산 집약적인(computational-intensive) 작업을 빠르게 처리할 수 있다. 하지만 대규모 클러스터의 잦은 유휴상태는 클러스터의 활용률은 매우 낮아지게 한다. 본 논문에서는 작업 실행 시간 개선과 클러스터 활용 효율성을 향상시키는 HTCondor 클러스터를 위한 동적 자원 스케줄링 기법을 제안한다. 동적으로 자원 할당을 위해 가상머신으로 HTCondor 클러스터 환경을 구성하였으며, 가상머신의 관리를 위해 OpenStack을 사용하였다. OpenStack기반 HTCondor 클러스터 환경에서 HTCondor Python API와 OpenStack Python API를 사용하여 우리가 제안하는 동적 자원 스케줄링 기법을 구현하였으며, 실험을 통해 제안하는 기법의 성능 및 실현 가능성을 확인하였다.

사용자 맞춤형 분산 컴퓨팅을 위한 컨테이너 기반 클러스터 관리 시스템 (Container-based Cluster Management System for User-driven Distributed Computing)

  • 박주원;함재균
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권9호
    • /
    • pp.587-595
    • /
    • 2015
  • 전통적으로 고에너지 물리, 해양, 기상, 천문 우주 등 다양한 과학 분야에서 수천 코어 이상의 CPU를 사용하는 대규모 워크플로우 지원을 요구하고 있으며 이를 위해 대부분 슈퍼컴퓨터와 같은 클러스터 기반의 대용량 시스템이 활용되고 있다. 이러한 시스템은 다수의 사용자 및 기관에 의해 공유되고 있으며, 사용자들의 다양한 요구 사항으로 인해 시스템 운영 및 관리에 많은 어려움이 있다. 본 논문에서는 가상화로 인한 성능 저하 문제를 최소화하고 사용자가 원하는 환경을 동적으로 제공하기 위해 컨테이너 기반 클러스터 관리 플랫폼 방안을 제시하고 구축 사례를 소개한다. 본 논문의 의의는 다음 3가지로 볼 수 있다. 먼저, 컨테이너 기반 가상화 기술과 스케줄러 기능을 연동하여 큰 성능 저하 없이 대규모의 과학워크플로우 지원을 위한 클러스터 구성 및 관리 방안을 제시하였다. 둘째, Docker 와 HTCondor를 활용하여 제시된 방안을 손쉽게 구축한 사례를 소개하였다. 셋째, 널리 활용되는 벤치마크 툴을 이용하여 Docker 성능을 검증하였으며, 다양한 프로그램 언어로 구현된 몬테카를로 시뮬레이션을 통해 과학 워크플로우 지원 예제를 제시하였다.

A Workflow Execution System for Analyzing Large-scale Astronomy Data on Virtualized Computing Environments

  • Yu, Jung-Lok;Jin, Du-Seok;Yeo, Il-Yeon;Yoon, Hee-Jun
    • International Journal of Contents
    • /
    • 제16권4호
    • /
    • pp.16-25
    • /
    • 2020
  • The size of observation data in astronomy has been increasing exponentially with the advents of wide-field optical telescopes. This means the needs of changes to the way used for large-scale astronomy data analysis. The complexity of analysis tools and the lack of extensibility of computing environments, however, lead to the difficulty and inefficiency of dealing with the huge observation data. To address this problem, this paper proposes a workflow execution system for analyzing large-scale astronomy data efficiently. The proposed system is composed of two parts: 1) a workflow execution manager and its RESTful endpoints that can automate and control data analysis tasks based on workflow templates and 2) an elastic resource manager as an underlying mechanism that can dynamically add/remove virtualized computing resources (i.e., virtual machines) according to the analysis requests. To realize our workflow execution system, we implement it on a testbed using OpenStack IaaS (Infrastructure as a Service) toolkit and HTCondor workload manager. We also exhaustively perform a broad range of experiments with different resource allocation patterns, system loads, etc. to show the effectiveness of the proposed system. The results show that the resource allocation mechanism works properly according to the number of queued and running tasks, resulting in improving resource utilization, and the workflow execution manager can handle more than 1,000 concurrent requests within a second with reasonable average response times. We finally describe a case study of data reduction system as an example application of our workflow execution system.