• Title/Summary/Keyword: 클러스터 컴퓨팅 환경

Search Result 147, Processing Time 0.027 seconds

Design of a Large-Scale Qualitative Spatial Reasoner Based on Hadoop Clusters (하둡 클러스터 기반의 대용량 정성 공간 추론기의 설계)

  • Kim, Jonghwan;Kim, Jonghoon;Kim, Incheol
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1316-1319
    • /
    • 2015
  • 본 논문에서는 대규모 분산 병렬 컴퓨팅 환경인 하둡 클러스터 시스템을 이용하여, 공간 객체들 간의 위상 관계를 효율적으로 추론하는 대용량 정성 공간 추론기를 제안한다. 본 논문에서 제안하는 공간 추론기는 추론 작업의 순차성과 반복성을 고려하여, 작업들 간의 디스크 입출력을 최소화할 수 있는 인-메모리 기반의 아파치 스파크 프레임워크를 이용하여 개발하였다. 따라서 본 추론기에서는 추론의 대상이 되는 대용량 공간 지식들을 아파치 스파크의 분산 데이터 집합 형태인 PairRDD와 RDD로 변환하고, 이들에 대한 데이터 오퍼레이션들로 추론 작업들을 구현하였다. 또한, 본 추론기에서는 추론 시간의 많은 부분을 차지하는 이행 관계 추론에 필요한 조합표를 효과적으로 축소함으로써, 공간 추론 작업의 성능을 크게 향상시켰다. 대용량의 공간 지식 베이스를 이용한 성능 분석 실험을 통해, 본 논문에서 제안한 정성 공간 추론기의 높은 성능을 확인할 수 있었다.

Development of Retargetable Hadoop Simulation Environment Based on DEVS Formalism (DEVS 형식론 기반의 재겨냥성 하둡 시뮬레이션 환경 개발)

  • Kim, Byeong Soo;Kang, Bong Gu;Kim, Tag Gon;Song, Hae Sang
    • Journal of the Korea Society for Simulation
    • /
    • v.26 no.4
    • /
    • pp.51-61
    • /
    • 2017
  • Hadoop platform is a representative storing and managing platform for big data. Hadoop consists of distributed computing system called MapReduce and distributed file system called HDFS. It is important to analyse the effectiveness according to the change of cluster constructions and several parameters. However, since it is hard to construct thousands of clusters and analyse the constructed system, simulation method is required to analyse the system. This paper proposes Hadoop simulator based on DEVS formalism which provides hierarchical and modular modeling. Hadoop simulator provides a retargetable experimental environment that is possible to change of various parameters, algorithms and models. It is also possible to design input models reflecting the characteristics of Hadoop applications. To maximize the user's convenience, the user interface, real-time model viewer, and input scenario editor are also provided. In this paper, we validate Hadoop Simulator through the comparison with the Hadoop execution results and perform various experiments.

QoS Guarantee in Partial Failure of Clustered VOD Server (클러스터 VOD 서버의 부분적 장애에서 QoS 보장)

  • Lee, Joa-Hyoung;Jung, In-Bum
    • The KIPS Transactions:PartC
    • /
    • v.16C no.3
    • /
    • pp.363-372
    • /
    • 2009
  • For large scale VOD service, cluster servers are spotlighted to their high performance and low cost. A cluster server usually consists of a front-end node and multiple back-end nodes. Though increasing the number of back-end nodes can result in the more QoS streams for clients, the possibility of failures in back-end nodes is proportionally increased. The failure causes not only the stop of all streaming service but also the loss of the current playing positions. In this paper, when a back-end node becomes a failed state, the recovery mechanisms are studied to support the unceasing streaming service. For the actual VOD service environment, we implement a cluster-based VOD servers composed of general PCs and adopt the parallel processing for MPEG movies. From the implemented VOD server, a video block recovery mechanism is designed on parity algorithms. However, without considering the architecture of cluster-based VOD server, the application of the basic technique causes the performance bottleneck of the internal network for recovery and also results in the inefficiency CPU usage of back-end nodes. To address these problems, we propose a new failure recovery mechanism based on the pipeline computing concept.

Optimization and Performance Analysis of Cloud Computing Platform for Distributed Processing of Big Data (대용량 데이터의 분산 처리를 위한 클라우드 컴퓨팅 환경 최적화 및 성능평가)

  • Hong, Seung-Tae;Shin, Young-Sung;Chang, Jae-Woo
    • Spatial Information Research
    • /
    • v.19 no.4
    • /
    • pp.55-71
    • /
    • 2011
  • Recently, interest in cloud computing which provides IT resources as service form in IT field is increasing. As a result, much research has been done on the distributed data processing that store and manage a large amount of data in many servers. Meanwhile, in order to effectively utilize the spatial data which is rapidly increasing day by day with the growth of GIS technology, distributed processing of spatial data using cloud computing is essential. Therefore, in this paper, we review the representative distributed data processing techniques and we analyze the optimization requirements for performance improvement of the distributed processing techniques for a large amount of data. In addition, we uses the Hadoop and we evaluate the performance of the distributed data processing techniques for their optimization requirements.

Effective Dynamic Load Balancing for Association Rule Mining (병렬 연관규칙 마이닝을 위한 동적 부하 분산 설계 및 구현)

  • ;;;R.S. Ramakrishna
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.04a
    • /
    • pp.655-657
    • /
    • 2002
  • 데이터 마이닝 기술 중 하나인 연관규칙 마이닝의 병렬 알고리즘들은 동형질의 병렬 컴퓨팅 시스템을 대상으로 하여 개발되었다. 그러나, 이러한 병렬 알고리즘들은 클러스터 시스템 또는 Network Of Workstation(NOW)과 같은 저가의 프로세서들로 구성된 집합적인 병렬 컴퓨팅 시스템에서는 부적당하다. 이는 이들 시스템이 다른 성능을 가진 프로세서로 구성되어 있거나 여러 사용자의 접근을 허용하는 등의 이형성을 가지기 때문이다. 결과적으로 이러한 환경을 고려하지 않은 기존의 병렬 연관규칙 알고리즘들은 전체 시스템의 성능을 활용하지 못하게 되어 성능저하를 피할 수 없다. 본 논문에서는 대표적인 병렬 연관규칙 알고리즘인 Data Distribution 알고리즘을 위만 효과적이고 확장성 있는 동적 부하분산 알고리즘의 설계와 구현을 다룬다.

  • PDF

A Fundamental Study of Thermal-Fluid Flow Analysis using High Performance Computing under the GRID (그리드 환경하에서 고성능 컴퓨팅을 이용한 열유동 해석 기법에 관한 기초연구)

  • Hong, Seung-Do;Lee, Dae-Sung;Lee, Jae-Ryong;Ha, Man-Yeong;Lee, Sang-San
    • Proceedings of the KSME Conference
    • /
    • 2003.11a
    • /
    • pp.928-933
    • /
    • 2003
  • For simulation of three-dimensional turbulent flow with LES and DNS takes much time and expense with current available computing resources. It is nearly impossible to simulate turbulent flow with high Reynolds number. So, the emerging alternative is the Grid computing for needed computation power and working environment. In this study, the CFD code was parallelized to adapt it for the parallel computing under the Grid environment. In the first place, the Grid environment was built to connect the PC-Cluster facilities belong to the different institutions using communication network system. And CFD applications were calculated to check the performance of the parallel code developed for the Grid environment. Although it is a fundamental study, it brings about a important meaning as first step in research of the Grid.

  • PDF

An Efficient Reduction Scheme of Virtual Machine Resource in Cloud Computing Environment (클라우드 컴퓨팅 환경에서 가상머신의 효율적인 자원 감축 기법)

  • Kim, Chang-Hyeon;Lee, Won-Joo;Jeon, Chang-Ho
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.01a
    • /
    • pp.5-6
    • /
    • 2012
  • 본 논문에서는 가상머신에서 수행되는 어플리케이션의 서비스 품질을 보장하고, 클라우드 클러스터의 운영비용을 절감시킬 수 있는 자원 할당 감축기법을 제안한다. 이 기법은 가상머신의 자원 사용량 변화 추세를 분석하고 이를 토대로 확률적인 접근을 사용하여 새로운 자원 할당 감축량을 결정한다. 가상머신의 자원 사용량이 할당량을 초과하면 가상머신의 이주가 필요하다. 이때 발생하는 다운타임동안 가상머신의 어플리케이션은 서비스를 수행할 수 없기 때문에 클라우드 시스템의 성능이 저하된다. 따라서 성능평가에서는 가상머신의 자원 사용량이 할당량을 초과하는 횟수를 측정하여 Greedy 기법과 비교 평가함으로써 제안한 기법이 자원 할당 감축에 우수함을 검증한다.

  • PDF

User Pattern-based Dynamic Virtual Machine Allocation Scheme in Cloud Computing (클라우드 컴퓨팅에서 사용자 패턴 분석 기반 동적 가상 머신 할당 기법)

  • Bae, Jun-Sung;Choi, Gyeong-Geun;Lee, Bong-Hwan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.906-908
    • /
    • 2010
  • 클라우드 컴퓨팅 환경을 구축할 수 있게 하는 OpenNebula는 ONE 스케줄러를 통해 가상머신들의 라이프 사이클을 관리한다. ONE 스케줄러는 가상머신을 할당 할 때, 클러스터 노드의 물리적 자원 할당 여부만을 고려하기 때문에 가상 머신 생성 후의 부하를 예측하기 힘들다. 본 논문에서는 사용자의 이전 가상 머신 사용 패턴을 기반으로 부하 등급을 나누고 이 등급에 따라 가상머신을 동적으로 할당하는 기법을 제안한다.

Hot Spot and Data Distribution Process in Specific Situation for Cloud Computing (클라우드 컴퓨팅을 위한 특정한 상황에서의 병목현상과 데이터 분산 처리)

  • Oh, Sung-Jun;Hwang, Myung-Jin;Youn, Hee-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.95-96
    • /
    • 2009
  • 클라우드 컴퓨팅은 대규모의 분산 시스템을 기반으로 페타바이트급 이상의 처리가 가능해진 최근에 각광받고 있는 기술이다. 대부분 비 대칭 분산 구조로 객체기반 클러스터 파일 시스템으로 이루어져있다. 이런 환경에서 효율성과 신뢰성 등을 고려하여 많은 연구가 진행 중이다. 본 논문에서는 특정한 상황에서 병목현상과 메타 데이터 서버간의 부하분산을 처리함으로써, 한 특징인 효율적인 측면에서 향상이 가능한 기법을 제안하였다.

DNN Hybrid Scheduling Algorithm in Smart Camera Edge Cluster (스마트 카메라 엣지 클러스터에서 DNN 하이브리드 스케줄링 알고리즘)

  • Chan-Min Lee;Min-Seok Seo;Ju-Seong Park;Min-Gyu Jin;Hyung-Bin Park;Su-Kyoung Lee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.84-85
    • /
    • 2023
  • 본 논문에서는 엣지 컴퓨팅에서 다수의 스마트 카메라를 클러스터링하여 협업하며 로드 밸런싱을 수행하는 알고리즘을 제안하고, Kubernetes 환경에서 시뮬레이션을 통해 여러 가지 상황에서 성능을 검증하여 엣지 컴퓨팅에서의 AI 연산을 보다 효율적으로 수행할 수 있는 방법을 제시한다.