• Title/Summary/Keyword: 병렬 계산 환경

Search Result 164, Processing Time 0.029 seconds

High Performance Parallel Computer for Scientific Computations (과학계산전용 병렬처리 컴퓨터 구조)

  • 박규호;정봉준
    • The Magazine of the IEIE
    • /
    • v.22 no.9
    • /
    • pp.14-27
    • /
    • 1995
  • KAICUBE/한빛-1호는 하이퍼큐브 형태의 연결망을 가진 병렬 컴퓨터이고 각 노드는 i860프로세서와 통신용의 i82380 DMA 콘트롤러를 탑재하고 있다. 40Mh2 CPU클럭을 사용하는 32노드로 구성되어 있고 컴퓨터의 최고 속도는 2.5G-flops 정도로써 이것은 국내 최초의 Giga급 컴퓨터이다. DMA콘트롤러에 의해 구동되는 노드간 통신은 채널 대역폭이 100Mbps정도이다. 0번 노드는 UNIX를 탑재한 호스트 컴퓨터와 연결되어 있고 호스트 컴퓨터는 병렬 프로그래밍 환경과 각 노드를 관리하는 역할을 한다. 익스프레스는 호스트 컴퓨터에 탑재된 병렬 운영 체제이고 사용하기 간편한 사용자 환경과 프로그래밍 방법에 따라 호스트-노드방법과 cubits 프로그래밍 환경을 각각 제공한다. 그밖에 고수준의 병렬 프로그래밍 환경으로써 기존의 순차 프로그램에 기초한 입력 프로그램을 병렬 프로그램으로 자동 변환 해주는 KAPPA가 있다. 여러 분야의 과학 계산용 프로그램이 수행되고 있으며 그의 성능 측정을 통하여 탁월한 성능을 보여 주었다. 보다 편리한 병렬 프로그래밍 환경의 개발과 범용 계산 전응 서버로써 자유로이 사용할 수 있도록 네트워크 기능을 강화하는 일이 남아있다.

  • PDF

On parallel computation for 3-d analysis of flow/wave field (3차원 유동/파동장 해석을 위한 병렬계산에 관한 고찰)

  • Lee, Woo-Dong;Hur, Dong-Soo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.88-88
    • /
    • 2019
  • 컴퓨터 성능향상과 수치해석기법의 발달로 인해 Navier-Stokes 방정식에 기초한 수치모델을 활용한 3차원 유동/파동장 해석이 증가하고 있는 추세이다. 그러나 아직까지 Navier-Stokes 방정식 모델의 계산부하를 PC에서 소화하기에는 무리가 따른다. 게다가 실험실 스케일을 벗어나, 실제 현장을 계산영역으로 설정할 경우에는 계산량이 엄청나게 증가하게 된다. 이것을 극복하기 위해서는 반듯이 병렬계산을 수행하여야 한다. 본 연구에서는 계산부하가 큰 Navier-Stokes 방정식 기반의 3차원 수치모델 LES-WASS-3D를 활용한 대용량 병렬계산체계를 구축한다. 나아가 3차원 정밀 또는 광역의 유동/파동장 해석에 있어서 병렬계산체계의 성능과 적용성을 검토한다. 현재 보급되고 있는 PC들은 모두 멀티프로세서가 장착됨으로 손쉽게 병렬계산을 수행할 수 있다. 그러나 정밀 또는 광역해석을 위해서는 대용량 병렬계산 컴퓨터가 요구된다. 따라서 본 연구에서는 보조프로세서를 장착한 공유메모리 환경의 고성능 병렬계산체계를 구축한다. 나아가 포트란 기반의 순차코드로 구축된 기존 3차원 Navier-Stokes 방정식 모델 LES-WASS- 3D를 병렬코드로 변환한다. 병렬계산 성능 및 적용성을 검토하기 위한 수치해석을 수행한다. 이상의 과정을 통해 본 연구에서 구축한 병렬계산체계의 성능 및 적용성을 확인할 수 있었다. 그리고 3차원 유동/파동장 해석에 있어서 정확도 향상뿐 아니라, 계산영역을 확장할 수 있는 계기가 마련되었다. 또한 유동/파동 해석보다 많은 계산시간이 필요한 지형변동 해석에도 충분히 적용될 수 있다고 판단된다.

  • PDF

Parallelized PI($\pi$) Calculation Algorithm using MPI (MPI를 활용한 PI($\pi$)값 계산 병렬화 알고리즘)

  • Choi, Min;Maeng, Seung-Ryoul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04a
    • /
    • pp.91-93
    • /
    • 2004
  • 정확한 $\pi$값의 계산은 자연과학의 여러 분야에 도움을 준다 이와 같이 $\pi$값을 계산하는 여러 가지 방법이 제안되어 있으며 널리 사용되고 있으나, 본 논문에서는 MPI 라이브러리를 활용한 $\pi$값 계산의 병렬화 알고리즘을 소개한다. tan$^{-1}$($\chi$)의 정의를 이용하는 $\pi$값 계산 방법은 다항식의 계산과정에서 각 항(term)들의 종속성으로 인하여 병렬화 수행이 힘든 단점이 있다. 본 논문에서는 tan$^{-1}$($\chi$)를 맥클로린 수열(Maclaurin Series)을 통하여 다항함수로 표현하고, 병렬화 수행에 적합한 적분형태로 변형한다. 따라서. MPI 환경에서 수행하기 적합한 $\pi$값 계산의 병렬화 알고리즘을 제안하고 8노드 클러스터 환경에서 성능을 비교해본다. 또한, 직렬화된 방법에 대한 성능향상(speedup)을 측정한다.

  • PDF

Implementation of high performance parallel LU factorization program for multi-threads on GPGPUs (GPGPU의 멀티 쓰레드를 활용한 고성능 병렬 LU 분해 프로그램의 구현)

  • Shin, Bong-Hi;Kim, Young-Tae
    • Journal of Internet Computing and Services
    • /
    • v.12 no.3
    • /
    • pp.131-137
    • /
    • 2011
  • GPUs were originally designed for graphic processing, and GPGPUs are general-purpose GPUs for numerical computation with high performance and low electric power. In this paper, we implemented the parallel LU factorization program for GPGPUs. In CUDA, which is computational environment for Nvidia GPGPUs, domains are divided into blocks, and multi-threads compute each sub-blocks Simultaneously. In LU factorization program, computation order should be artificially decided due to the data dependence. To resolve the data dependancy, we suggested a parallel LU program for GPGPUs, and also explained parallel reduction algorithm for partial pivoting of LU factorization. We finally present performance analysis to show efficiency of the parallel LU factorization program based on multi-threads on GPGPUs.

Serial Algorithm for D-Class computation with an Improved Inner Loop on the Linux Platform (내부 순환문 개선을 통한 Linux 기반의 D-클래스 계산 고효율 순차 알고리즘)

  • Shin, Chul-Gyu;Han, Jae-Il
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2005.05a
    • /
    • pp.526-531
    • /
    • 2005
  • D-클래스는 보안에 응용될 수 있는 가능성을 가지고 있으나 D-클래스의 계산은 NP-완전문제로서 행렬크기 증가에 의한 연산 량 증가 문제 해결을 위해 병렬 컴퓨팅 환경에서의 병렬 알고리즘 설계 및 구현이 필요하다. 본 논문은 그리드 컴퓨팅 환경에서의 D-클래스 계산을 위해 Globus 가 설치된 클러스터를 구축하고. MPICH를 이용 효율적인 D-클래스 계산 알고리즘을 설계 및 구현, 실행 결과 그리고 연산 량을 줄일 수 있는 수식 연구와 연구한 수식에 기반한 순차 알고리즘을 논한다.

  • PDF

A Study on the Communication Performance Improvement of the Parallel Finite-Different Time-Domain Simulator by using the MPI Persistent Communication (MPI의 지속 통신 메커니즘을 이용한 병렬 유한차분시간영역 전산모사 프로그램의 통신 성능 향상에 관한 연구)

  • Kim, Huioon;Chun, Kyungwon;Kim, Hyeong-gyu;Hong, Hyunpyo;Chung, Youngjoo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.942-945
    • /
    • 2009
  • 유한차분시간영역 방법은 전자기파 관련 분야의 전산모사에 많이 사용되는 수치해석기법이다. 이 방법을 이용하여 구현한 전산모사 프로그램은 많은 계산 자원 필요로 하기 때문에 병렬 계산 환경을 이용하게 되는 경우가 많다. 병렬 계산 환경에서 전산모사를 수행할 경우, 병렬로 수행되는 각 프로세스 간의 통신 속도와 네트워크의 지연 시간은 계산의 병목 현상을 초래하여 전체적인 성능을 저하시키는 원인이 된다. 따라서, 본 논문에서는 MPI의 지속 통신 메커니즘을 이용하여 병렬 프로세스 간 동기화 속도를 증가시킴으로써 유한차분시간영역 전산모사 프로그램에서의 MPI 통신 성능의 향상을 꾀하고, 그 결과를 그래프로 도시하였다. 또한 기존의 양방향 통신과 단방향 통신 메커니즘을 사용했을 때의 성능과 비교/분석하여, 병렬 유한차분시간영역 전산모사 프로그램에 있어서 지속 통신 메커니즘의 장/단점을 제시하고, 그 효용성에 관해 논의한다.

고성능 병렬처리 컴퓨터 KAICUBE-860

  • 박규호
    • The Magazine of the IEIE
    • /
    • v.20 no.7
    • /
    • pp.104-114
    • /
    • 1993
  • 본 연구 개발에서는 계속적으로 그 필요가 증가하는 대규모 계산을 위한 슈퍼급의 성능을 가지는 병렬처리 시스템의 구현, 구축을 목표로 하고 있다. 우리는 슈퍼급의 컴퓨터 시스템을 개발하기 위해 최신의 i860 프로세서를 사용한 단위컴퓨터를 설계, 제작하여 최대 40 MFLOPB의 성능을 가지는 단위 컴퓨터를 구현하였고, 8개의 단위컴퓨터를 연결하여 320MFLOPS컴퓨터를 개발하였다. 최종 목표는 128개의 단위 컴퓨터를 연결하여 5 GFLOPS 최대 계산능력을 갖는 7차원 하이퍼큐브 컴퓨터 시스템 KAICUBE-860을 구성하고자 한다. 대부분의 사람들은 그 생각방식이나 행동형태가 순차적인 구조를 가지고 있기 때문에 병렬적인 프로그램의 개발이 쉽지가 않고 때문에 사용자로 하여금 보다 쉽게 병렬시스템에 접근할 수 있도록 사용자 환경을 적절히 구축하여야만 한다. 따라서 우리의 최종 목표는 슈퍼급 성능의 병렬 처리 시스템이고 그 사용 방법은 보통순차적 컴퓨터를 사용하듯이 간단한 사용자 환경을 제공하는 시스템이다. 이를 위해 시스템 소프트웨어와 사용자 환경을 계속 개발 중에 있다.

  • PDF

Development of High Performance Massively Parallel Processing Simulator for Semiconductor Etching Process (건식 식각 공정을 위한 초고속 병렬 연산 시뮬레이터 개발)

  • Lee, Jae-Hee;Kwon, Oh-Seob;Ban, Yong-Chan;Won, Tae-Young
    • Journal of the Korean Institute of Telematics and Electronics D
    • /
    • v.36D no.10
    • /
    • pp.37-44
    • /
    • 1999
  • This paper report the implementation results of Monte Carlo numerical calculation for ion distributions in plasma dry etching chamber and of the surface evolution simulator using cell removal method for topographical evolution of the surface exposed to etching ion. The energy and angular distributions of ion across the plasma sheath were calculated by MC(Monte Carlo) algorithm. High performance MPP(Massively Parallel Processing) algorithm developed in this paper enables efficient parallel and distributed simulation with an efficiency of more than 95% and speedup of 16 with 16 processors. Parallelization of surface evolution simulator based on cell removal method reduces simulation time dramatically to 15 minutes and increases capability of simulation required enormous memory size of 600Mb.

  • PDF

Molecular Docking System using Parallel GPU (병렬 GPU를 이용한 분자 도킹 시스템)

  • Park, Sung-Jun
    • The Journal of the Korea Contents Association
    • /
    • v.8 no.12
    • /
    • pp.441-448
    • /
    • 2008
  • The molecular docking system needs a large amount of computation and requires super-computing power. Since the experiment requires a large amount of time, the experiment is conducted in the distributed environment or in the grid environment. Recently, researches on using parallel GPU of far higher performance than that of CPU in scientific computing have been very actively conducted. CUDA is an open technique by which a parallel GPU programming is made possible. This study proposes the molecular docking system using CUDA. It also proposes algorithm that parallels energy-minimizing-computation. To verify such experiments, this study conducted a comparative analysis on the time required for experimenting molecular docking in general CPU and the time and performance of the parallel GPU-based molecular docking which is proposed in this study.

구조해석에서의 병렬처리

  • 송윤환
    • Computational Structural Engineering
    • /
    • v.5 no.2
    • /
    • pp.28-30
    • /
    • 1992
  • 본 고에서는 현재 많은 관심의 대상이 되고 있는 병렬처리에 대해서 현재까지 연구되어온 병렬 환경에 적합한 구조해석 알고리즘에 대하여 간략히 설명하였다. 앞으로 병렬 컴퓨터가 더욱 일반화되고 표준화되리라 예상되므로, 방대한 계산량을 요구하는 유한요소해석에 대한 보다 효율적인 병렬 알고리즘의 개발을 위하여 현재까지 진행된 연구에 대한 분석 및 더욱 많은 노력을 기대한다.

  • PDF