• Title/Summary/Keyword: 고성능컴퓨팅

Search Result 164, Processing Time 0.031 seconds

A Design of Optimal Resource Selection Broker in Grid Computing Systems (그리드 컴퓨팅 시스템에서 최적 자원 선택 브로커 설계)

  • 진성호;정광식;이화민;이대원;유헌창;정순영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04d
    • /
    • pp.124-126
    • /
    • 2003
  • 그리드 컴퓨팅은 광범위 분산 컴퓨팅 시스템(wide area distributed computing system)으로, 고성능의 유휴 컴퓨팅 자원을 서로 공유하여 효율적으로 작업을 수행하는 것을 목적으로 한다. 그리드 컴퓨팅에서 사용자가 요구하는 자원의 검색, 선택, 할당하는 문제는 시스템 성능에 큰 영향을 미친다. 그리드 컴퓨팅을 지원하는 대표적인 미들웨어인 글로버스(Globus Toolkit)에서는 위와 같은 과정들이 사용자에 의해 수동적으로 이루어지며, 검색된 후보 자원의 최적 선택 방법은 제공하지 않고 있다. 본 논문에서는 글로버스에서 사용자의 요구에 의해 검색된 후보 자원들 중 최적화된 자원 선택과 할당 요청을 담당하는 최적 자원 선택 브로커를 설계하였다. 이 브로커는 유전자 알고리즘을 이용하여 최적 자원을 선택하므로 사용자의 임의적 자원 선택으로 인한 시스템의 성능 저하를 막아준다. 자원 검색, 선택, 할당 요청이 하나의 브로커에서 이루어짐으로써 작업 수행 시 발생하는 사용자의 불필요한 관여를 막아 작업 수행에 대한 편의성을 제공한다.

  • PDF

Task Allocation Methods and Performance Comparison for Parallel Computation Based on Multi-Agent System (다중 에이전트 시스템 기반의 병렬 계산을 위한 작업 할당 기법과 성능비교)

  • 김경하;김영학;오길호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10c
    • /
    • pp.502-504
    • /
    • 2000
  • 최근 높은 컴퓨팅 파워를 요구하는 응용문제 처리를 위해 고 비용의 슈퍼컴퓨터 대신 인터넷상에 분산된 다수의 일반 컴퓨터들을 이용하는 병렬처리에 관한 연구가 진행되고 있다. 본 연구에서는 다중 에이전트 시스템을 기반으로 하여 이질적인 성능을 갖는 컴퓨터들을 병렬 컴퓨팅 환경으로 구성하고 각 호스트의 성능측정 결과에 따라 효율적으로 작업을 분산하는 기법을 제안한다. 또한 본 연구에서 제안한 방법을 다중 에이전트 시스템인 IBM의 AgletsTM을 사용하여 실험적으로 성능을 평가하고, 기존 연구와 비교한다.

  • PDF

Performance Evaluation for Scheduling Algorithm on GRID Environment (GRID 환경에서의 스케줄링 알고리즘 성능분석)

  • 조정우;김진석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.454-456
    • /
    • 2003
  • 최근 들어 이질적인 컴퓨팅 자원들을 이용하는 GRID같은 연구가 진행 중에 있다. 이는 여러 지역에 분산되어있는 고성능의 시스템들을 네트워크로 연결하여 작업을 좀더 빠르게 수행시키는데 목적을 두고 있다. 이러한 시스템에서 작업을 수행하면 수행시간을 단축시킬 수 있다는 장점을 가지고 있으나 컴퓨팅 자원들이 여러 지역에 분산되어 있고 각 자원들의 성능이 모두 다르다는 단점 또한 가지고 있다. 따라서 이러한 시스템에서 스케줄링 정책은 자원의 특성을 고려해야 한다는 문제점을 갖는다. 본 논문에서는 GRID 환경에서 기존의 스케줄링 알고리즘을 적용가능한지, 그리고 기존의 성능과 유사한 결과를 보이는지를 시뮬레이션을 통해 살펴보았다.

  • PDF

Trends of the CCIX Interconnect and Memory Expansion Technology (CCIX 연결망과 메모리 확장기술 동향)

  • Kim, S.Y.;Ahn, H.Y.;Jun, S.I.;Park, Y.M.;Han, W.J.
    • Electronics and Telecommunications Trends
    • /
    • v.37 no.1
    • /
    • pp.42-52
    • /
    • 2022
  • With the advent of the big data era, the memory capacity required for computing systems is rapidly increasing, especially in High Performance Computing systems. However, the number of DRAMs that can be used in a computing node is limited by the structural limitations of the hardware (for example, CPU specifications). Memory expansion technology has attracted attention as a means of overcoming this limitation. This technology expands the memory capacity by leveraging the external memory connected to the host system through hardware interface such as PCIe and CCIX. In this paper, we present an overview and describe the development trends of the memory expansion technology. We also provide detailed descriptions and use cases of the CCIX that provides higher bandwidth and lower latency than cases of the PCIe.

Data Structure Improving Prefetch Performance for Urban Computing File System (도시 컴퓨팅 파일 시스템에서 미리 읽기 성능 향상을 위한 자료구조)

  • Yoon, Ik-June;Ko, Kwang-Jin;Shin, Heon-Shik
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06a
    • /
    • pp.311-312
    • /
    • 2012
  • 도시 컴퓨팅에서의 파일 시스템은 하나의 메타 데이터 서버와 여러 개의 데이터 저장 서버로 구성되어 있다. 이 데이터 저장 서버의 자료구조를 사용자의 두 가지 질의에 맞게 구성함으로써 미리읽기의 성능을 향상시킨다. 또한 데이터의 손실을 방지하기 위해 복사본을 만들 때, 두 가지의 형태로 바꿔 저장함으로써 데이터의 손실을 막고 여러 질의에 대응하여 좋은 성능을 낼 수 있다.

A Study of Performance Improvement of CFCS SW Using HPC (HPC를 활용한 지휘무장통제체계 SW 성능향상 연구)

  • Baek, Chi-Sun
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2017.07a
    • /
    • pp.1-2
    • /
    • 2017
  • 본 논문에서는 지휘무장통제체계(이하 CFCS) 소프트웨어의 성능 향상 기법으로 고성능 컴퓨팅(이하 HPC) 시스템 활용 기법을 제안한다. 이 기법으로 본 논문에서는 HPC 분야인 멀티코어 프로세서를 활용하는 방법을 제안한다. 복잡한 반복연산을 하는 작업이 많은 CFCS의 특정 SW모듈에 대해 멀티코어 프로세싱 아키텍처를 이용한 병렬처리를 적용하여 기존 순차처리 대비 작업실행시간을 단축함으로써 작업 응답시간을 상당히 줄일 수 있다. 본 논문에서는 CFCS 시험 환경의 일부 특정 SW모듈 상에서 기존의 순차처리 방식으로 수행한 연산 결과와 다중 처리 프로그래밍 API인 OpenMP를 적용하여 수행한 연산 결과를 비교하여 CFCS에서의 멀티코어 프로세싱이 체계 전반의 성능 향상 면에서 효율적으로 사용될 수 있음을 보인다.

  • PDF

A Performance Study on CPU-GPU Data Transfers of Unified Memory Device (통합메모리 장치에서 CPU-GPU 데이터 전송성능 연구)

  • Kwon, Oh-Kyoung;Gu, Gibeom
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.11 no.5
    • /
    • pp.133-138
    • /
    • 2022
  • Recently, as GPU performance has improved in HPC and artificial intelligence, its use is becoming more common, but GPU programming is still a big obstacle in terms of productivity. In particular, due to the difficulty of managing host memory and GPU memory separately, research is being actively conducted in terms of convenience and performance, and various CPU-GPU memory transfer programming methods are suggested. Meanwhile, recently many SoC (System on a Chip) products such as Apple M1 and NVIDIA Tegra that bundle CPU, GPU, and integrated memory into one large silicon package are emerging. In this study, data between CPU and GPU devices are used in such an integrated memory device and performance-related research is conducted during transmission. It shows different characteristics from the existing environment in which the host memory and GPU memory in the CPU are separated. Here, we want to compare performance by CPU-GPU data transmission method in NVIDIA SoC chips, which are integrated memory devices, and NVIDIA SMX-based V100 GPU devices. For the experimental workload for performance comparison, a two-dimensional matrix transposition example frequently used in HPC applications was used. We analyzed the following performance factors: the difference in GPU kernel performance according to the CPU-GPU memory transfer method for each GPU device, the transfer performance difference between page-locked memory and pageable memory, overall performance comparison, and performance comparison by workload size. Through this experiment, it was confirmed that the NVIDIA Xavier can maximize the benefits of integrated memory in the SoC chip by supporting I/O cache consistency.

Implementation and Performance Analysis of Hadoop MapReduce over Lustre Filesystem (러스터 파일 시스템 기반 하둡 맵리듀스 실행 환경 구현 및 성능 분석)

  • Kwak, Jae-Hyuck;Kim, Sangwan;Huh, Taesang;Hwang, Soonwook
    • KIISE Transactions on Computing Practices
    • /
    • v.21 no.8
    • /
    • pp.561-566
    • /
    • 2015
  • Hadoop is becoming widely adopted in scientific and commercial areas as an open-source distributed data processing framework. Recently, for real-time processing and analysis of data, an attempt to apply high-performance computing technologies to Hadoop is being made. In this paper, we have expanded the Hadoop Filesystem library to support Lustre, which is a popular high-performance parallel distributed filesystem, and implemented the Hadoop MapReduce execution environment over the Lustre filesystem. We analysed Hadoop MapReduce over Lustre by using Hadoop standard benchmark tools. We found that Hadoop MapReduce over Lustre execution has a performance 2-13 times better than a typical Hadoop MapReduce execution.

A Study on the Availability of Surplus Computing Resources in Edge Cloud Environment (엣지 클라우드 환경 잉여 컴퓨팅 자원의 활용을 위한 가용성 확보 방법 연구)

  • Kim, Dong-Wan;Shin, Yong-Tae
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.637-640
    • /
    • 2022
  • 최근 빅데이터 및 인공지능의 중요성이 커짐에 따라 클라우드 시스템을 효율적으로 설계하고 관리하기 위한 연구가 활발히 진행 중이다. 본 논문은 기술 발전으로 각 개인은 고성능의 컴퓨팅 자원을 소유하고 있지만, 이 자원이 대부분 잉여 자원으로써 낭비되고 있다는 점을 착안하여, 잉여 컴퓨팅 자원을 효율적으로 활용하기 위해 엣지 클라우드 환경에서 분산된 자원의 가용성을 확보하기 위한 방법을 제안한다.

  • PDF