• Title/Summary/Keyword: LAPACK

Search Result 5, Processing Time 0.023 seconds

PoLAPACK : Parallel Factorization Routines with Algorithmic Blocking (PoLAPACK : 알고리즘적인 블록 기법을 이용한 병렬 인수분해 루틴 패키지)

  • Choe, Jae-Yeong
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.28 no.5
    • /
    • pp.228-235
    • /
    • 2001
  • 본 논문에서는 분산메모리를 가진 병렬 컴퓨터에서 밀집 행렬 연산을 위한 PoLAPACK 패키지를 소개한다. PoLAPACK은 새로운 연산 기법을 적용한 LU, QR, Cholesky 인수분해 알고리즘들을 포함하고 있다. 블록순환분산법으로 분산되어 있는 행렬에 알고리즘적인 블록 기법(algorithimic blocking)을 적용하여, 실제 행렬의 분산에 사용된 블록의 크기와 다른, 최대의 성능을 보일 수 있는 최적의 블록 크기로 연산을 수행할 수 있다. 이러한 연산 방식은 분산되어 있는 원래의 행렬 A의 순서를 따르지 않으며, 따라서 최적의 블록 크기로 연산을 수행한 후에 얻어진 해 x를 원래 행렬 분산법을 따라서 재배치하여야 한다. 본 연구는 Cray T3E 컴퓨터에서 구현하였으며 ScaLAPACK의 인수분해 루틴들과 그 성능을 비교.분석하였다.

  • PDF

Performance Improvements of SCAM Climate Model using LAPACK BLAS Library (SCAM 기상모델의 성능향상을 위한 LAPACK BLAS 라이브러리의 활용)

  • Dae-Yeong Shin;Ye-Rin Cho;Sung-Wook Chung
    • The Journal of Korea Institute of Information, Electronics, and Communication Technology
    • /
    • v.16 no.1
    • /
    • pp.33-40
    • /
    • 2023
  • With the development of supercomputing technology and hardware technology, numerical computation methods are also being advanced. Accordingly, improved weather prediction becomes possible. In this paper, we propose to apply the LAPACK(Linear Algebra PACKage) BLAS(Basic Linear Algebra Subprograms) library to the linear algebraic numerical computation part within the source code to improve the performance of the cumulative parametric code, Unicon(A Unified Convection Scheme), which is included in SCAM(Single-Columns Atmospheric Model, simplified version of CESM(Community Earth System Model)) and performs standby operations. In order to analyze this, an overall execution structure diagram of SCAM was presented and a test was conducted in the relevant execution environment. Compared to the existing source code, the SCOPY function achieved 0.4053% performance improvement, the DSCAL function 0.7812%, and the DDOT function 0.0469%, and all of them showed a 0.8537% performance improvement. This means that the LAPACK BLAS application method, a library for high-density linear algebra operations proposed in this paper, can improve performance without additional hardware intervention in the same CPU environment.

Design Considerations on Large-scale Parallel Finite Element Code in Shared Memory Architecture with Multi-Core CPU (멀티코어 CPU를 갖는 공유 메모리 구조의 대규모 병렬 유한요소 코드에 대한 설계 고려 사항)

  • Cho, Jeong-Rae;Cho, Keunhee
    • Journal of the Computational Structural Engineering Institute of Korea
    • /
    • v.30 no.2
    • /
    • pp.127-135
    • /
    • 2017
  • The computing environment has changed rapidly to enable large-scale finite element models to be analyzed at the PC or workstation level, such as multi-core CPU, optimal math kernel library implementing BLAS and LAPACK, and popularization of direct sparse solvers. In this paper, the design considerations on a parallel finite element code for shared memory based multi-core CPU system are proposed; (1) the use of optimized numerical libraries, (2) the use of latest direct sparse solvers, (3) parallelism using OpenMP for computing element stiffness matrices, and (4) assembly techniques using triplets, which is a type of sparse matrix storage. In addition, the parallelization effect is examined on the time-consuming works through a large scale finite element model.

Haptic Interface with Deformable Finite Element Model (유한요소 모델링을 통한 변형체의 햅틱 인터페이스)

  • Jun, Seong-Ki;Choi, Jin-Bok;Cho, Maeng-Hyo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.619-621
    • /
    • 2005
  • 햅틱 장치를 이용한 변형체의 실시간 시뮬레이션은 가상현실을 구축하기 위한 중요한 기술의 하나로서 최근에 크게 각광받고 있다. 본 연구에서는 햅틱 장비와 변형체의 정확한 인터페이스를 구축하기 위하여 변형체의 물리적 특성을 고려한 연속체적 모델인 유한요소법을 통한 선행해석을 수행한다. 변형체와 햅틱 장치의 상호작용 과정에서 발생하는 변형과 반력을 사용자에게 실시간으로 제공하기 위하여 선행해석 결과를 이용한 변형체의 정적 시뮬레이션을 구현한다. 이와 함께 햅틱 장치와 접촉이 이루어지는 부분의 변형을 보다 자연스럽게 표현하기 위하여 적응적 유한요소법인 s-adaptive 방법을 적용하였으며 햅틱 장치와 접촉이 끝난 후의 변형체가 평형 상태로 돌아가는 과정을 모사하기 위하여 Newmark scheme을 통한 동적 시뮬레이션을 구현한다. 또한 최적화 행렬 연산 함수인 BLAS와 LAPACK을 이용하여 행렬 연산을 빠르게 수행하고 효율적인 메모리 사용 추구한다.

  • PDF