• 제목/요약/키워드: parallel library

검색결과 188건 처리시간 0.032초

병렬처리를 위한 고성능 라이브러리의 구현과 성능 평가 (Implementation and Performance Analysis of High Performance Computing Library for Parallel Processing)

  • 김영태;이용권
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권7호
    • /
    • pp.379-386
    • /
    • 2004
  • 본 연구에서는 병렬프로그램을 효율적으로 개발할 수 있고 병렬처리 프로그램의 성능을 향상시키는 이식성을 갖는 고성능 병렬 라이브러리인 HPCL(High Performance Computing Library)을 구현하였다. HPCL은 C 언어와 Fortran 언어로 구현되었으며, Fortran 프로그램에서 메시지 전송 인터페이스인 MPI(Message Passing Interface)를 효율적으로 사용할 수 있도록 하였다. 성능 분석은 PC 클러스터와 상업용 슈퍼컴퓨터인 IBM SP4를 이용하여 병렬프로그램의 성능 향상 및 통신 오버헤드 등에 대하여 다양하게 이루어졌다.

Parallel FFT and Quick-Merge Sort on the Reflective Memory Networked Computers and a Cluster of Work-stations

  • Lee, Changhun;Kwon, Wook-Hyun
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2002년도 ICCAS
    • /
    • pp.94.1-94
    • /
    • 2002
  • This paper is concerned with parallel FFT and Quick-Merge Sort. They are implemented on computers interconnected by VMIC 5579 reflective memory and a cluster of workstations (PCs) interconnected via Fast Ethernet. Message passing interface (MPI) parallel library is used for communication in a cluster of workstations. An improved parallel FFT is also presented to decrease an execution time in the case of a small number of hosts. Distributed shared memory (DSM), VMIC 5579 reflective memory (RM), a cluster of workstations (COW) and message passing interface (MPI) parallel library are described.

  • PDF

GPU Library CUDA를 이용한 효율적인 Delaunay 격자 생성에 관한 연구 (A STUDY OF THE APPLICATION OF DELAUNAY GRID GENERATION ON GPU USING CUDA LIBRARY)

  • 송지홍;김상현;김경민;김병수
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2011년 춘계학술대회논문집
    • /
    • pp.194-198
    • /
    • 2011
  • In this study, an efficient algorithm for Delaunay triangulation of a number of points which can be used on a GPU-based parallel computation is studied The developed algorithm is programmed using CUDA library. and the program takes full advantage of parallel computation which are concurrently performed on each of the threads on GPU. The results of partitioned triangulation collected from the GPU computation requires proper stitching between neighboring partitions and calculation of connectivities among triangular cells on CPU In this study, the effect of number of threads on the efficiency and total duration for Delaunay grid generation is studied. And it is also shown that GPU computing using CUDA for Delaunay grid generation is feasible and it saves total time required for the triangulation of the large number points compared to the sequential CPU-based triangulation programs.

  • PDF

Solid-phase Parallel Synthesis of a Novel N-[Alkylsulfonamido-spiro(2H-1-benzopyran-2,4-piperidine)-6-yl] substituted Amide and Amine Drug-like Libraries

  • Kim, Ji-Hye;Gong, Young-Dae;Lee, Gee-Hyung;Seo, Jin-Soo
    • Bulletin of the Korean Chemical Society
    • /
    • 제33권1호
    • /
    • pp.128-136
    • /
    • 2012
  • We report the solid-phase library construction of 222 number of a novel N-[alkyl sulfonamido-spiro(2H-1-benzopyran-2,4-piperidine)-6-yl] substituted amide 1A and amine 1B derivatives. The polymer-bound N-[alkylsulfonamido-spiro(2H-1-benzopyran-2,4-piperidine)-6-yl] substituted amide 9 and amine 10 derivatives were obtained by first diversity generation with various acid chlorides and alkyl halides. Further reactions on the resins 9 and 10 with substituted sulfonyl chlorides produced the desired N-[alkylsulfonamido-spiro(2H-1-benzopyran-2,4-piperidine)-6-yl] substituted amide 1A and amine 1B analogues.

병렬알고리즘 이용한 비압축, 비투과성 포화 다공질매체의 혼합유한요소해석 (The Mixed Finite Element Analysis for Nearly Incompressible and Impermeable Porous Media Using Parallel Algorithm)

  • 탁문호;강윤식;박대효
    • 한국전산구조공학회논문집
    • /
    • 제23권4호
    • /
    • pp.361-368
    • /
    • 2010
  • 본 논문에서는 Park and Tak(2010)이 제안한 다공질매체 스태거드 방법의 효율성을 제고하기 위해 MPI(Message- Passing Interface) 라이브러리를 통한 병렬해석이 소개된다. 이를 위해 비압축, 비투과성 포화 다공질매체와 FEM을 통한 스태거드 방법이 간략히 소개된다. 그리고 병렬해석을 위한 MPI 라이브러리를 소개하고 스태거드 방법에 블록킹, 논블록킹 MPI 라이브러리를 접목시킨 병렬해석 알고리즘을 제안한다. 여기서는 변위와 간극수압 계산에서의 CPU 할당방법과 MPI 통신 규약을 통한 효율적인 프로그래밍 방법을 제시하고, 수치효율성을 검증하기 위한 2차원 모델의 순차해석과 병렬 해석 결과 값들을 요소개수에 따라 계산시간이 비교 검증된다.

그래프 컬러링과 OpenMP를 이용한 병렬 메쉬 스무딩 알고리즘의 성능 분석 (Performance Analysis of a Parallel Mesh Smoothing Algorithm using Graph Coloring and OpenMP)

  • 신명규;김지범
    • 전자공학회논문지
    • /
    • 제53권6호
    • /
    • pp.80-87
    • /
    • 2016
  • 본 논문에서는 그래프 컬러링과 OpenMP를 사용한 병렬 메쉬 스무딩 알고리즘을 제안하고 공유메모리 기반의 슈퍼컴퓨터를 이용하여 제안하는 병렬 메쉬 스무딩 알고리즘의 성능 분석을 수행하였다. 제안하는 병렬 메쉬 스무딩 알고리즘은 그래프 컬러링 방법을 통해 전체 메쉬를 여러 개의 독립적인 집합 (색깔)으로 나눈 후 각각의 독립적인 집합에 대하여 OpenMP 라이브러리를 사용하여 순차적으로 병렬 메쉬 스무딩을 수행하는 방법이다. 실험을 통하여 여러 가지 그래프 컬러링 방법과 색깔 순서 재배열 방법이 병렬 메쉬 스무딩의 효율성에 미치는 영향에 대해서 알아보았다. 또한, OpenMP의 루프 스케줄링 방법이 병렬 메쉬 스무딩의 효율성에 끼치는 영향에 대해서 알아보았다.

용접공정 유한요소 해석의 병렬 처리 적용 (Application for parallel computation for finite element analysis of welding processes)

  • 임세영;김주완;최강혁
    • 대한용접접합학회:학술대회논문집
    • /
    • 대한용접접합학회 2004년도 춘계 학술발표대회 개요집
    • /
    • pp.273-275
    • /
    • 2004
  • A parallel multi-frontal solver is developed for finite element analysis of an arc-welding process, which entails phase evolution, heat transfer, and deformations of structure. We verify the code via comparison to a commercial code,SYSWELD. Attention is focused on the implementation of the parallel solver using MPI library, on the speedup by parallel computation, and on the effectiveness of the solver in welding application

  • PDF

UTLIZATION OF FUZZY AND VOLETTRA ALGORITHM FOR 3D BATHYMETRY SIMULATION FROM TOPSAR POLARISED DATA

  • Marghany, Maged;Hussien, Mohd. Lokman
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.432-434
    • /
    • 2003
  • The main objective of this research is to utilize the parallel Fuzzy arithmetic for constructing ocean bathymetry from polarized remote sensing data such as TOPSAR image. In doing so, the parallel library for Fuzzy arithmetic has been developed. Three- dimensional surface modeling consisted of Volettra model, non-linear model which construct a global topological structure between the data points, used to support an approximation of real surface. The output of the parallel library was a digital terrain model for bathymetry along the coastal waters of Kuala Terengganu Malaysia. This paper describes the principles behind the Fuzzy algorithm, indicates for what type of application it might be useful, notes on the accuracy and gives an example of an application.

  • PDF

IBM SP2와 SGI Origin 2000에서의 병렬 VHDL 시뮬레이션 (Parallel VHDL Simulation on IBM SP2 and SGI Origin 2000)

  • 정영식
    • 한국시뮬레이션학회논문지
    • /
    • 제7권1호
    • /
    • pp.69-83
    • /
    • 1998
  • In this paper, we present the results of simulation by running parallel VHDL simulation on typical MPP(Massively Parallel Processor) systems such as IBM SP2 and SGI Origin 2000. Parallel simulation uses the synchronous protocol and parallel program is implemented using MPI(Message Passing Interface) based on message passing model, so that it can urn on any parallel programming environment which supports MPI, a standard communication library. And then GVT(Global Virtual Time) computation for parallel simulation is based on the global broadcasting with MPI_Bcast(), which is a standard function in MPI and piggybacking. Our benchmark exhibits that as size of VHDL grows, the parallel simulation has a better performance compared with the sequential simulation. In addition, we also show the results of comparison between IBM SP2 and SGI Origin 2000 by applying the same application to those indirectly.

  • PDF

Lock-free unique identifier allocation for parallel macro expansion

  • Son, Bum-Jun;Ahn, Ki Yung
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.1-8
    • /
    • 2022
  • 이 논문에서는 싱글 프로세스 멀티코어 환경의 매크로 확장에서 Lock이 필요하지 않은 더 효과적인 고유식별자 할당 방식을 제안한다. 이 할당 방식의 핵심 아이디어는 나머지 연산을 이용해 순차적 의존성을 제거하는 것이다. 우리가 고안한 방식이 멀티코어 병렬 환경에서 매크로 확장의 성능 개선에 적합함을 확인하기 위해, 기존에 순차적 방식의 고유식별자 생성으로 구현된 라이브러리를 우리가 고안한 방식으로 변경하여 변경 전의 버전과 후의 버전의 라이브러리로 작성된 같은 프로그램의 성능을 비교하는 벤치마크를 수행하였다.