• Title/Summary/Keyword: 병렬 계산효율

Search Result 273, Processing Time 0.052 seconds

대형구조물을 위한 병렬 구조해석 및 설계

  • 박효선
    • Computational Structural Engineering
    • /
    • v.9 no.3
    • /
    • pp.47-53
    • /
    • 1996
  • 공학 전반에 걸쳐 다양한 형식으로 개발되어 사용되고 있는 병렬계산법의 기본개념과 병렬계산기의 분류에 대하여 소개하였으며, 구조해석시 가장 많은 시간을 요하는 방정식해법을 preconditioned conjugate gradient를 이용하여 병렬화하는 과정과 병렬알고리즘을 소개하였다. 그리고 소개된 병렬방정식해법을 대형구조물의 해석 및 설계에 적용하여 병렬계산의 효율성을 speedup을 이용하여 도표화하였다.

  • PDF

Implementation of high performance parallel LU factorization program for multi-threads on GPGPUs (GPGPU의 멀티 쓰레드를 활용한 고성능 병렬 LU 분해 프로그램의 구현)

  • Shin, Bong-Hi;Kim, Young-Tae
    • Journal of Internet Computing and Services
    • /
    • v.12 no.3
    • /
    • pp.131-137
    • /
    • 2011
  • GPUs were originally designed for graphic processing, and GPGPUs are general-purpose GPUs for numerical computation with high performance and low electric power. In this paper, we implemented the parallel LU factorization program for GPGPUs. In CUDA, which is computational environment for Nvidia GPGPUs, domains are divided into blocks, and multi-threads compute each sub-blocks Simultaneously. In LU factorization program, computation order should be artificially decided due to the data dependence. To resolve the data dependancy, we suggested a parallel LU program for GPGPUs, and also explained parallel reduction algorithm for partial pivoting of LU factorization. We finally present performance analysis to show efficiency of the parallel LU factorization program based on multi-threads on GPGPUs.

Efficiency Analysis of Photovoltaic Configurations in Wearable Charging Applications (웨어러블 충전 어플리케이션의 태양전지 배열에 따른 효율 분석)

  • Lee, Hyunji;Kim, Katherine A.
    • Proceedings of the KIPE Conference
    • /
    • 2015.07a
    • /
    • pp.353-354
    • /
    • 2015
  • 요즘, 태양에너지를 이용하는 웨어러블 전자기기가 많이 개발되고 있다. 이런 기기들은 태양전지에 도달하는 태양빛이 달라질 때, 태양전지와 컨버터의 연결방법이 시스템 효율에 많은 영향을 끼친다. 그래서 이 연구에서 9개의 테스트 경우를 5개의 다른 태양전지와 컨버터 연결방법으로 가정하여 전체 시스템 효율을 계산하였다. 5개의 연결방법은 직렬, 병렬, cascaded 컨버터, differential power processing (DPP) 컨버터의 직렬, DPP 컨버터의 병렬연결이다. 9개의 테스트 경우에서, 태양전지에 태양빛이 균일하게 도달할 경우, 병렬연결과 DPP 컨버터의 병렬연결이 가장 높은 효율을 보여주었다. 하지만 태양빛이 불균일하게 도달할 경우, DPP 컨버터의 연결이 가장 높은 효율을 보여주었다. 컨버터의 효율을 85%로 가정하면 DPP 컨버터를 병렬로 연결했을 경우, 이상적 경우를 제외한 8개의 테스트 경우에서 전체 시스템의 평균 효율은 99.36%였다. (이 계산은 Maximum Power Point Tracking 손실을 포함하지 않았다.)

  • PDF

An Efficient Distributed Parallel Processing in Optimal Power Flow (최적조류계산의 효율적인 분산병렬처리)

  • Kim, Bal-Ho;Kim, Jin-Ho;Heo, Don
    • Proceedings of the KIEE Conference
    • /
    • 1999.11b
    • /
    • pp.434-437
    • /
    • 1999
  • 본 연구에서는 워크스테이션 상에서 최적조류계산의 효율적인 분산병렬처리 기법을 개발하였다. 본 연구의 결과를 실제로 2587개의 송전선을 포함하는 미국 ERCOT 계통에 대하여 사례 연구한 결과 성능이 뛰어남을 알 수 있었다. 본 연구는 최적 조류계산을 병렬 처리하는 일반적인 방식을 제시해 줄 수 있을 것이라 생각된다.

  • PDF

Iceberg Cube Parallel Computation using MapReduce (맵리듀스를 이용한 빙산 큐브 병렬 계산)

  • Lee, Su-An;Kim, Jin-Ho;Moon, Yang-Sae;Loh, Woong-Kee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06a
    • /
    • pp.25-26
    • /
    • 2010
  • 대용량 데이터의 효율적 분석을 위해 데이터 뷰브가 연구되었으며, 데이터 큐브 계산의 고비용 문제점을 해결하기 위하여 큐브의 일부 영역만을 계산하는 빙산 큐브가 등장하였다. 빙산 큐브는 저장 공간의 감소, 집중적인 분석 등의 장점이 있으나, 여전히 많은 계산과 저장 공간을 필요로 하는 단점이 있다. 본 논문에서는 이러한 문제점을 해결하는 실용적인 방법으로 대용량 문제를 분산하여 처리하는 분산 병렬 컴퓨팅 기술인 맵리듀스(MapReduce) 프레임워크를 사용하여 분산 병렬 빙산 큐브인 MR-Naive와 MR-BUC 알고리즘을 제안한다. 실험을 통해 맵리듀스 프레임워크를 통한 빙사 큐브 계산이 효율적으로 분산 병렬 처리 됨을 확인하였다.

  • PDF

Massive Parallel Processing Algorithm for Semiconductor Process Simulation (반도체 공정 시뮬레이션을 위한 초고속 병렬 연산 알고리즘)

  • 이제희;반용찬;원태영
    • Journal of the Korean Institute of Telematics and Electronics D
    • /
    • v.36D no.3
    • /
    • pp.48-58
    • /
    • 1999
  • In this paper, a new parallel computation method, which fully utilize the parallel processors both in mesh generation and FEM calculation for 2D/3D process simulation, is presented. High performance parallel FEM and parallel linear algebra solving technique was showed that excessive computational requirement of memory size and CPU time for the three-dimensional simulation could be treated successively. Our parallelized numerical solver successfully interpreted the transient enhanced diffusion (TED) phenomena of dopant diffusion and irregular shape of R-LOCOS within 15 minutes. Monte Carlo technique requires excessive computational requirement of CPU time. Therefore high performance parallel solving technique were employed to our cascade sputter simulation. The simulation results of Our sputter simulator allowed the calculation time of 520 sec and speedup of 25 using 30 processors. We found the optimized number of ion injection of our MC sputter simulation is 30,000.

  • PDF

A High-performance Parallel Algorithm for D-Class Computation based on Shared Memory (공유 메모리 기반의 고성능 D-클래스 계산 병렬 알고리즘)

  • Shin Chul-Gyu;Han Jae-Il
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07a
    • /
    • pp.10-12
    • /
    • 2005
  • [$n\timesn$] 불리언 행렬의 집합에서 동치관계를 이용하여 정의된 D-클래스는 개인키나 공개키 암호기술에 사용될 수 있는 가능성을 가지고 있다. 그러나 NP-완전 문제인 계산 복잡도로 인해 D-클래스의 효율적인 계산이 어려워 극히 제한된 크기의 행렬에 대한 D-클래스만이 알려져 있다. D-클래스를 효율적으로 계산하기 위해서는 수식변환, 병렬처리, 순환문 개선 등을 통해 알고리즘을 개선하여야 한다. 본 논문은 D-클래스의 효율적 계산을 위해 공유메모리 기반의 병렬 처리에 적합하도록 수식의 대수적 변환을 이용한 알고리즘의 설계라 실행 결과에 대해 논한다.

  • PDF

Nonlinear Shell Finite Element and Parallel Computing Algorithm for Aircraft Wing-box Structural Analysis (항공기 Wing-box 구조해석을 위한 비선형 쉘 유한요소 및 병렬계산 기법 개발)

  • Kim, Hyejin;Kim, Seonghwan;Hong, Jiwoo;Cho, Haeseong
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.48 no.8
    • /
    • pp.565-571
    • /
    • 2020
  • In this paper, precision and efficient nonlinear structural analysis for the aircraft wing-box model is developed. Herein, nonlinear shell element based on the co-rotational (CR) formulation is implemented. Then, parallel computing algorithm, the element-based partitioning technique is developed to accelerate the computational efficiency of the nonlinear structural analysis. Finally, computational performance, i.e., accuracy and efficiency, of the proposed analysis is evaluated by comparing with that of the existing commercial software.

Serial Algorithm for D-Class computation with an Improved Inner Loop on the Linux Platform (내부 순환문 개선을 통한 Linux 기반의 D-클래스 계산 고효율 순차 알고리즘)

  • Shin, Chul-Gyu;Han, Jae-Il
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2005.05a
    • /
    • pp.526-531
    • /
    • 2005
  • D-클래스는 보안에 응용될 수 있는 가능성을 가지고 있으나 D-클래스의 계산은 NP-완전문제로서 행렬크기 증가에 의한 연산 량 증가 문제 해결을 위해 병렬 컴퓨팅 환경에서의 병렬 알고리즘 설계 및 구현이 필요하다. 본 논문은 그리드 컴퓨팅 환경에서의 D-클래스 계산을 위해 Globus 가 설치된 클러스터를 구축하고. MPICH를 이용 효율적인 D-클래스 계산 알고리즘을 설계 및 구현, 실행 결과 그리고 연산 량을 줄일 수 있는 수식 연구와 연구한 수식에 기반한 순차 알고리즘을 논한다.

  • PDF

Improved Parallel Computation for Extended Edit Distances (개선된 확장편집거리 병렬계산)

  • Kim, Youngho;Sim, Jeong Seop
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.62-65
    • /
    • 2014
  • 근사문자열매칭 알고리즘은 검색엔진, 컴퓨터보안, 생물정보학 등 많은 분야에서 연구되고 있다. 근사문자열매칭에서는 거리함수를 이용하여 오차를 측정한다. 거리함수로는 해밍거리, 편집거리, 확장편집거리 등이 있다. 이때 확장편집거리는 mn) 시간과 공간에 계산할 수 있으며, 최근 m개의 쓰레드를 이용하여 O(m+n) 시간과 O(mn) 공간을 이용한 병렬알고리즘이 제시되었다. 본 논문에서는 기존의 확장편집거리를 계산하는 병렬알고리즘을 개선한 효율적인 병렬알고리즘을 제시한다. 기존의 병렬알고리즘을 최적화하고, 기존의 병렬알고리즘, 전역메모리만 사용한 최적화된 병렬알고리즘, 공유메모리를 활용한 최적화된 병렬알고리즘의 수행시간을 비교한다. 실험 결과, 개선된 병렬알고리즘이 기존의 병렬알고리즘보다 전처리단계에서 16 ~ 63배 이상, 모든 단계에 대해 19 ~ 24배 이상 빠른 수행시간을 보였다.