• 제목/요약/키워드: Parallel Computing

검색결과 807건 처리시간 0.032초

슈퍼컴퓨터(클러스터 컴퓨터)의 철도산업에서의 활용 - 병렬처리기법을 이용한 화재유동해석 - (Application of Supercomputers(Cluster computers) to Railway Industry - Fire-Driven flow Simulation using Parallel Computational Method -)

  • 김학범;장용준;이창현;정우성
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2009년도 춘계학술대회 논문집
    • /
    • pp.1040-1046
    • /
    • 2009
  • Thanks to the recent development of computing technology, the various forms of high-performance computers are available. Among them, the parallel-clustering CPU machines are realized for the high performance computing. These supercomputers (cluster computers) can be applied to various industries due to the advantages of lower price. Especially in the field of numerical flow simulation, use of supercomputers can produce results quickly, and various engineering problems can be reviewed effectively case by case. In this paper, an application of supercomputers (cluster computers) were examined for railroad industry of fire flow simulation by using parallel computational method. It make sure that the supercomputers are very useful tools for railroad engineering.

  • PDF

다분야통합해석에 기반한 설계문제의 병렬처리를 위한 부하분산알고리즘 (Load Balancing Algorithm for Parallel Computing of Design Problem involving Multi-Disciplinary Analysis)

  • 조재석;주민식;송용호;최동훈
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2007년도 정기 학술대회 논문집
    • /
    • pp.327-332
    • /
    • 2007
  • An engineering design problem involving Multi-Disciplinary Analysis(MDA) generally requires a large amounts of CPU time for the entire design process, and therefore Multiple Processing System (MPS) are essential to reduce the completion time. However, when applying conventional parallel processing techniques, all of the CAE S/W required for the MDA should be installed on all the servers making up NIPS because of characteristic of MDA and it would be a great expense in CAE S/W licenses. To solve this problem, we propose a Weight-based Multiqueue Load Balancing algorithm for a heterogeneous MPS where performance of servers and CAE S/W installed on each server are different of each other. To validate the performance, a computational experiments comparing the First Come First Serve algorithm and our proposed algorithm was accomplished.

  • PDF

액티브 엔터프라이즈 워크플로우 그리드 아키텍처 (An Active Enactment Architecture for Enterprise Workflow Grid)

  • 백수기
    • 한국IT서비스학회지
    • /
    • 제7권4호
    • /
    • pp.167-178
    • /
    • 2008
  • This paper addresses the issue of workflow on Grid and P2P, and proposes a layered workflow architecture and its related workflow models that are used for not only distributing workflows' information onto Grid or P2P resources but also scheduling the enactment of workflows. Especially, the most critical rationale of this paper is on the fact that the nature of Grid computing environment is fitted very well into building a platform for the maximally parallel and very large scale workflows that are frequently found in very large scale enterprises. The layered architecture proposed in this paper, which we call Enterprise Workflow Grid Architecture, is targeting on maximizing the usability of computing facilities in the enterprise as well as the scalability of its underlined workflow management system in coping with massively parallel and very large scale workflow applications.

실시간 영상 복원을 위한 분산 전기단층촬영 알고리즘 (A Distributed Electrical Impedance Tomography Algorithm for Real-Time Image Reconstruction)

  • Junghoon Lee;Gyunglin Park
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권1호
    • /
    • pp.25-36
    • /
    • 2004
  • 본 논문은 전기단층촬영의 실시간 영상 복원을 위한 마스터-슬레이브 구조를 갖는 분산 전기 단층촬영 알고리즘을 제안하고 그 성능을 평가한다. 영상복원은 그 수행시간이 미지수의 수에 3제곱에 비례하는 계산 위주의 응용으로서 영상의 정밀도를 위해 미지수를 증가시키면 그 수행시간이 급격히 증가한다. 마스터는 순차적인 루프에 진입하기 전에 각 컴퓨팅 노드에 독립적인 프레임 데이터를 분배하여 병렬로 기저노드를 추출하도록 하고 그 결과를 취합하여 그룹화함으로써 미지수의 수를 감소시킨다. 지역망으로 연결된 컴퓨팅 노드들은 MATLAB이 설치되어 기본적인 계산능력을 갖고 있으며 MATLAB 자료구조를 효율적으로 교환할 수 있는 명령이 동적 링크 라이브러리로 구현되어 있다. 또한 마스터에는 병렬 행렬 연산, 고속 자코비언 둥이 구현되어 순차적인 부분의 계산을 효율적으로 수행한다. 구현된 각 요소들의 성능을 측정한 결과 병렬 라이브러리는 전체 복원 시간을 50% 가까이 감소시킬 수 있으며 분산 알고리즘은 4개의 노드가 협력작업을 하는 경우 주어진 대상 물체에 대해 12배 빠른 속도로 영상을 복원할 수 있다.

GPGPU를 이용한 영상 품질 측정 프로그램의 가속화 연구 (Research of accelerating method of video quality measurement program using GPGPU)

  • 이성욱;변기범;김기수;홍지만
    • 스마트미디어저널
    • /
    • 제5권4호
    • /
    • pp.69-74
    • /
    • 2016
  • 최근 그래픽 처리 장치(GPU)의 발전과 개발자 친화적인 GPGPU(General-Purpose computing on Graphics Processing Units)기술의 발전으로 인해 그래픽 처리 장치를 활용한 병렬 컴퓨팅의 사용이 확대되고 있다. 이를 통해 과학, 의학, 공학 등 많은 분야에 걸쳐 기존 CPU 컴퓨팅 환경보다 더 빠른 처리속도로 결과 값을 얻어 낼 수 있게 되었다. 본 논문은 CPU 기반 컴퓨팅과 GPU 기반 컴퓨팅의 연산처리 속도의 차이의 비교를 위해 기존 CPU 기반으로 구현된 영상 품질 측정 프로그램을 NVIDIA사의 GPGPU기술을 사용할 수 있도록 프로그램을 포팅한다. 포팅한 프로그램을 바탕으로 GPGPU기술을 통한 프로그램의 가속화에 대하여 연구한다. 가속화된 프로그램은 CPU 기반의 프로그램보다 약 1.83배 정도의 실행 속도를 가진다. 또한 CPU 기반의 프로그램을 GPU 기반으로 수정할 때 생기는 제약과 문제점에 대해서도 기술한다.

셀룰러 오토마타 기반 WCA2D 모형을 이용한 부산 온천천 유역 고해상도 도시 침수 해석 (High-resolution Urban Flood Modeling using Cellular Automata-based WCA2D in the Oncheon-cheon Catchment in Busan, South Korea)

  • 최현진;이송희;우현아;노성진
    • 대한토목학회논문집
    • /
    • 제43권5호
    • /
    • pp.587-599
    • /
    • 2023
  • 기후변화로 인해 전 세계 주요 도시에서 홍수의 빈도와 위험성이 증가함에 따라, 도시 침수에 대비한 선제적 대응을 위해 넓은 공간 영역에서 고해상도 2차원 침수 정보를 신속하고 정확하게 해석할 수 있는 모의 기술의 중요성이 대두되고 있다. 기존의 천수 방정식(shallow water equations)에 기반한 물리적 해석 방법은 고해상도 침수 예측을 위해 많은 컴퓨터 자원과 계산 시간이 소요되는 한계가 있다. 본 연구는 전환 규칙과 가중치 기반 시스템을 사용하여 침수의 시공간 변화를 모의하는 셀룰러 오토마타(cellular automata) 기반 2차원 침수 해석 모형 Weighted Cellular Automata 2D (WCA2D)의 이론적 배경을 고찰하고, 부산 온천천 유역의 침수 사상 모의를 통해 재현하여 국내 도시 유역에 대한 적용성을 검토하였다. 또한, Open Computing Language (OpenCL)와 Open Multi-Processing (OpenMP)과 같은 병렬계산(parallel computing)기술을 적용한 버전을 순차계산(sequential computing)결과와 비교하여 연산성능을 평가 하였다. 연구결과, WCA2D 모형에 의한 최대 침수심 분포는 과거침수 피해지도와 유사하게 모의되어, 복잡한 지형특성을 가지는 도시유역 침수의 시공간적 변화를 해석하기에 적절함을 확인하였다. 또한,병렬 계산 적용시 순차 계산 버전에 비해 OpenCL과 OpenMP는 약8배~14배, 5배~6배 연산 효율이 향상되어 효율적인 도시 침수 모의가 가능하였다.

최대 연간 에너지 생산을 위한 영구자석형 풍력발전기의 최적설계 (Optimal Design of Permanent Magnet Wind Generator for Maximum Annual Energy Production)

  • 정호창;정상용;한성진;이철균
    • 전기학회논문지
    • /
    • 제56권12호
    • /
    • pp.2109-2115
    • /
    • 2007
  • The wind generators have been installed with high output power to increase the energy production and efficiency. Hence, Optimal design of the direct-driven PM wind generator, coupled with F.E.M(Finite Element Method) and Genetic Algorithm(GA), has been performed to maximize the Annual Energy Production(AEP) over the whole wind speed characterized by the statistical model of wind speed distribution. Particularly, the parallel computing via internet web service has been applied to loose excessive computing times for optimization. The results of the optimal design of Surface-Mounted Permanent Magnet Synchronous Generator(SPMSG) are compared with each other candidates to verify the usefulness of the maximizing AEP model.

A PRICING METHOD OF HYBRID DLS WITH GPGPU

  • YOON, YEOCHANG;KIM, YONSIK;BAE, HYEONG-OHK
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • 제20권4호
    • /
    • pp.277-293
    • /
    • 2016
  • We develop an efficient numerical method for pricing the Derivative Linked Securities (DLS). The payoff structure of the hybrid DLS consists with a standard 2-Star step-down type ELS and the range accrual product which depends on the number of days in the coupon period that the index stay within the pre-determined range. We assume that the 2-dimensional Geometric Brownian Motion (GBM) as the model of two equities and a no-arbitrage interest model (One-factor Hull and White interest rate model) as a model for the interest rate. In this study, we employ the Monte Carlo simulation method with the Compute Unified Device Architecture (CUDA) parallel computing as the General Purpose computing on Graphic Processing Unit (GPGPU) technology for fast and efficient numerical valuation of DLS. Comparing the Monte Carlo method with single CPU computation or MPI implementation, the result of Monte Carlo simulation with CUDA parallel computing produces higher performance.

Infrastructure of Grid-based Distributed Remotely Sensed Images Processing Environment and its Parallel Intelligence Algorithms

  • ZHENG, Jiang;LUO, Jian-Cheng;Hu, Cheng;CHEN, Qiu-Xiao
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.1284-1286
    • /
    • 2003
  • There is a growing demand on remotely sensed and GIS data services in modern society. However, conventional WEB applications based on client/server pattern can not meet the criteria in the future . Grid computing provides a promising resolution for establishing spatial information system toward future applications. Here, a new architecture of the distributed environment for remotely sensed data processing based on the middleware technology was proposed. In addition, in order to utilize the new environment, a problem had to be algorithmically expressed as comprising a set of concurrently executing sub-problems or tasks. Experiment of the algorithm was implemented, and the results show that the new environmental can achieve high speedups for applications compared with conventional implementation.

  • PDF

자바 스레드와 네트워크 자원을 이용한 병렬처리 (Thread-Level Parallelism using Java Thread and Network Resources)

  • 김태용
    • 한국항행학회논문지
    • /
    • 제14권6호
    • /
    • pp.984-989
    • /
    • 2010
  • 본 논문에서는 초소형 정밀 마이크로 흐름센서를 설계하기 위해 Java 멀티스레드를 이용한 병렬 프로그래밍 기법을 도입하여 센서 모듈의 성능 분석과 개선이 가능한 병렬처리형 설계 툴을 개발하였다. 연산에 따른 기본 성능을 측정하기 위하여 열운송 방정식에 지배되는 포텐셜 문제를 두 개의 실험모델로 나누어 실험을 수행하였다. 시뮬레이션 결과 네트워크 PC의 수를 증가시키면 이와 비례하는 속도향상 특성이 나타났다. 따라서 본 연구에서 제안하는 병렬화 방안은 대규모 연산모델에도 적용 가능함을 확인하였다.