• 제목/요약/키워드: message-passing

검색결과 296건 처리시간 0.028초

Particle-in-cell 기법을 이용한 전자기장내 플라즈마 입자의 거동 해석 (Numerical Analysis on Plasma Particles inside Electro-magnetic Field Using Particle-in-cell Method)

  • 한두희;조민경;신준수;성홍계;김수겸
    • 한국항공우주학회지
    • /
    • 제45권11호
    • /
    • pp.932-938
    • /
    • 2017
  • 플라자마의 거동을 오일러리안 격자와 라그랑지안 입자를 혼합하여 해석하는 Particle-in-cell 기법을 적용하여 간략화된 홀추력기를 해석하였다. 본 연구는 중성입자, 이온입자 뿐만 아니라 전자도 라그랑지안 기법으로 개별추적 계산하기 때문에 message passing interface 기법을 이용해 대용량 계산이 가능한 병렬클러스터링을 적용하였다. 계산에 앞서 일정한 벡터의 자기장에서 전자군의 나선형 거동을 해석하였고, 절대해와 일치함을 확인하여 코드를 검증하였다. 실린더 내부에 반경방향으로 일정한 자기장과 축방향으로 일정한 전기장을 고정시켜 플라즈마의 거동을 PIC 모델을 이용하여 해석하였다. 반응 실린더 내부에 전자가 로렌츠 힘에 의해 이중나선을 그리며 구속되는 현상이 잘 포착되었고, 고속 회전하는 전자와 주입된 중성입자가 충돌하여 이온화 되었고, 대전된 입자가 축방향의 전기장에 의해 급 가속하는 현상 또한 잘 모사되어 플라즈마의 플룸 거동을 모사하였다.

High Performance Fortran 병렬 프로그래밍 변환기의 구현 및 성능 평가 (Implementation and Performance Evaluation of Parallel Programming Translator for High Performance Fortran)

  • 김중권;홍만표;김동규
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.901-915
    • /
    • 1999
  • 분산 메모리 병렬 컴퓨터의 성능을 충분히 활용하고 프로그래밍의 난이도아 기종간 프로그램의 호환성을 해결하기 위하여 시스템 독립적이고 쉽게 프로그래밍 할 수 있는 데이터 병렬 언어에 대한 연구가 최근에 활발히 진행되고 있다. 대표적인 데이터 병렬 언어인 HPF 컴파일러는 사용자가 정의한 정보를 이용하여 데이터와 연산을 프로세서에 분할하여 할당하고, 메시지 패싱을 생성하는 기능을 제공함으로써 프로그램 작성자에게 전역 주소 공간을 이용하여 병렬 프로그램을 쉽게 개발 할 수 있는 기반을 제공한다. 본 논문에서는 데이터 종속성 분석, 데이터 및 연산 분할과 메시지 패싱 코드 생성의 4단계를 통하여, HPf 입력 프로그램을 MPI 메시지 패싱 코드가 삽입된 SPMD 프로그램으로 변환하는 HPF 병렬 프로그래밍 언어 변환기인 PPTran을 구현하고 그 성능을 검증한다.

  • PDF

CPU 클러스터 구축 및 3차원 공간분할 병렬 FDTD 알고리즘 구현 (Construction of a CPU Cluster and Implementation of a 3-D Domain Decomposition Parallel FDTD Algorithm)

  • 박성민;추광욱;주세훈;박윤미;김기백;정경영
    • 한국전자파학회논문지
    • /
    • 제25권3호
    • /
    • pp.357-364
    • /
    • 2014
  • 본 연구에서는 빠르게 전자파 해석을 수행할 수 있는 병렬 유한차분 시간영역(Finite-Difference Time-Domain: FDTD) 알고리즘을 구현하기 위하여 CPU 클러스터를 구축하였다. 병렬 FDTD 알고리즘은 단일 프로세서를 이용한 FDTD 알고리즘에 비해 해석 시간을 크게 줄일 수 있으며, 전기적으로 매우 큰 구조물에 대한 전자파 해석도 가능하다. 본 연구팀에서는 CPU 클러스터 기반의 병렬 FDTD 알고리즘에서 요구되는 프로세스 간의 통신을 위해 MPI(Message Passing Interface) 라이브러리를 이용하였으며, 3차원 공간분할을 적용하여 프로세스 간의 통신 시간을 최소화하였다. 단일 프로세서를 이용한 FDTD 알고리즘 대비 CPU 클러스터 기반의 병렬 FDTD 알고리즘의 계산속도 향상도를 기본 모드와 하이퍼 모드에서 분석하였으며, 전기적으로 매우 큰 콘크리트 구조물의 전자파 해석을 하였다.

실시간 제약 커널 환경하에서의 이중 실시간 스케쥴링 설계 (A Dual Real-Time Scheduling Design under Real-Time Constraints Kernel Environments)

  • 인치호
    • 전력전자학회논문지
    • /
    • 제6권4호
    • /
    • pp.369-375
    • /
    • 2001
  • 본 논문은 실시간 wpir 커널 환경 하에서의 이중 실시간 스케쥴링을 설계한다. 본 논문에서 제안한 이중 실시간 스케쥴링 설계는 실시간 제약 조건인 인터럽트 지연 시간, 스케줄링의 정확성, 메시지 전달시간을 만족하기 위하여 실시간 커널에서는 실시간 태스크 처리와 인터럽트 처리, 타이밍을 처리하도록 하였고 비 실시간 커널은 일반적인 태스크를 처리하도록 한다. 또한 태스크들의 충돌 시 혼합 우선 순위를 고려한 최적의 스케쥴링을 수행한다. 즉, 비 실시간 커널은 성적 우선 순위 스케쥴링을 수행하고, 실시간 커널은 동적 우선 순위 변형 스케쥴링인 최소 여유시간 우선 기반의 최소 선점을 갖는 스케쥴링 알고리즘을 수행한다. 그리고 기존의 실시간 커널인 RT-Linux 0.5a, QNX 4.23A와 제안한 실시간 커널이 인터럽트 지연, 스케줄링 정확성, 메시지 전달시간 등을 비교 qnstjrgkadmfhTJ 실시간 제약조건을 만족함을 보인다.

  • PDF

Development of Real time Air Quality Prediction System

  • Oh, Jai-Ho;Kim, Tae-Kook;Park, Hung-Mok;Kim, Young-Tae
    • 한국환경과학회:학술대회논문집
    • /
    • 한국환경과학회 2003년도 International Symposium on Clean Environment
    • /
    • pp.73-78
    • /
    • 2003
  • In this research, we implement Realtime Air Diffusion Prediction System which is a parallel Fortran model running on distributed-memory parallel computers. The system is designed for air diffusion simulations with four-dimensional data assimilation. For regional air quality forecasting a series of dynamic downscaling technique is adopted using the NCAR/Penn. State MM5 model which is an atmospheric model. The realtime initial data have been provided daily from the KMA (Korean Meteorological Administration) global spectral model output. It takes huge resources of computation to get 24 hour air quality forecast with this four step dynamic downscaling (27km, 9km, 3km, and lkm). Parallel implementation of the realtime system is imperative to achieve increased throughput since the realtime system have to be performed which correct timing behavior and the sequential code requires a large amount of CPU time for typical simulations. The parallel system uses MPI (Message Passing Interface), a standard library to support high-level routines for message passing. We validate the parallel model by comparing it with the sequential model. For realtime running, we implement a cluster computer which is a distributed-memory parallel computer that links high-performance PCs with high-speed interconnection networks. We use 32 2-CPU nodes and a Myrinet network for the cluster. Since cluster computers more cost effective than conventional distributed parallel computers, we can build a dedicated realtime computer. The system also includes web based Gill (Graphic User Interface) for convenient system management and performance monitoring so that end-users can restart the system easily when the system faults. Performance of the parallel model is analyzed by comparing its execution time with the sequential model, and by calculating communication overhead and load imbalance, which are common problems in parallel processing. Performance analysis is carried out on our cluster which has 32 2-CPU nodes.

  • PDF

MPI와 OpenMP기반 하이브리드 모델을 이용한 항공 레이저 스캐닝 자료의 병렬 처리 (Parallel Processing of Airborne Laser Scanning Data Using a Hybrid Model Based on MPI and OpenMP)

  • 한수희;박일석;허준
    • 한국측량학회지
    • /
    • 제30권2호
    • /
    • pp.135-142
    • /
    • 2012
  • 본 연구에서는 대용량 항공 레이저 스캐닝 자료로부터 DSM(Digital Surface Model) 및 DTM(Digital Terrain Model)을 효율적으로 생성하기 위하여 다중 코어 피씨클러스터(PC-Cluster)에 기반한 병렬처리방식을 제안하였다. 이를 위하여 MPI(message passing interface)만을 사용하는 기존 MPI 모델을 변형하여 MPI와 OpenMP를 병용한 하이브리드(hybrid) 모델을 제작하였으며 다중 코어 피씨클러스터에서 그 성능을 평가하였다. 결과적으로, 하이브리드 모델과 기존 모델을 비교하였을 때 DSM을 생성하기 위한 보간에서는 다소 불리하지만 MPI 호출을 줄임으로써 전반적인 성능을 향상시킬 수 있었다. 아울러, 불규칙한 항공 레이저 스캐닝 자료의 분포로부터 발생하는 코어간 부하 불일치를 OpenMP의scheduling 기능을 통해 조절함으로써 하이브리드 모델의 성능을 향상시킬 수 있었다.

표준 모드를 지원하는 5Q MPI 하드웨어 유닛 설계 (Design 5Q MPI Hardware Unit Supporting Standard Mode)

  • 박재원;정원영;이승우;이용석
    • 한국통신학회논문지
    • /
    • 제37권1B호
    • /
    • pp.59-66
    • /
    • 2012
  • 최근 모바일 장치의 사용의 증가와 복잡한 응용 프로그램의 사용이 증가하면서 MPSoC의 사용이 증가하고 있다. 이러한 MPSoC의 성능을 향상시키기 위해 프로세서의 수가 늘어나고 있는 추세이다. 다수의 프로세서 구조에서 장점이 있는 분산 메모리 구조의 효율적인 데이터 전달하기 위해서 표준 MPI를 이용한다. 표준 MPI는 소프트웨어로 제공되지만, 하드웨어로 구현하면 보다 높은 성능을 얻을 수 있다. 하드웨어로 구현된 MPI의 메시지 전송 방식으로 기존의 동기 방식(Synchronous Mode), 준비 방식(Ready Mode), 버퍼 방식(Buffered Mode)과 이 방식들을 혼합한 형태인 표준 방식(Standard Mode)가 있다. 본 논문에는 기존의 MPI 하드웨어 유닛에서 사용되던 구조에 작은 크기의 데이터를 선별하여 버퍼 방식으로 전송함으로써 전송율을 극대화 하였다. 기존의 구조에서 사용된 3개의 큐(Queue)는 그대로 같은 기능을 하고, 본 논문에서 추가된 2개의 큐(작은 준비 큐와 작은 요청 큐)을 추가하여 임계점보다 작은 크기의 데이터에 대한 처리와 저장을 담당하도록 하여 성능을 향상하였다. 제안된 구조에서 임계점을 32byte로 제한하였을 때 임계점 이하의 데이터에서 20%의 성능 개선 효과를 볼 수 있었다.

분산 환경에서 CFD 분석 프로그램 수행을 위한 그리드 시스템 META 설계 및 구현 (Design and Implementation of a Grid System META for Executing CFD Analysis Programs on Distributed Environment)

  • 강경우;우균
    • 정보처리학회논문지A
    • /
    • 제13A권6호
    • /
    • pp.533-540
    • /
    • 2006
  • 본 논문에서는 분산 환경 상에서 CFD(Computational Fluid Dynamics) 분석 프로그램을 편리하게 수행할 수 있도록 하는 그리드 시스템 META(Metacomputing Environment using Test-un of Application)의 설계 및 구현에 관하여 기술한다. 그리드 시스템 META는 CFD 프로그램 개발자들이 네트워크에 분산된 계산 자원들을 단일 시스템처럼 사용할 수 있도록 한다. 그리드 컴퓨팅과 관련하여 연구주제로는 고장허용, 자원 선택, 사용자 인터페이스 설계 등이 있다. 본 논문에서는 MPI(Message Passing Interface)로 작성된 SPMD(Single Program, Multiple Data) 구조의 병렬프로그램을 실행시키기 위한 자동 자원 선택방법을 활용하였다. 본 논문에서 제안한 자원 관리기법은 네트워크상의 전송지연 시간과 시험수행을 통해 얻어진 핵심루프의 경과시간을 이용한다. 전송지연시간은 병렬 프로그램이 복수의 시스템에 분산되어 수행될 때 수행 성능에 큰 영향을 주는 요인이다. CFD 프로그램들의 공통적인 특성 때문에 핵심루프 경과시간은 전체 수행시간을 예측할 수 있는 지표가 된다. 핵심루프는 CFD 프로그램의 전체 수행시간 중 90% 이상을 차지한다.

채널배선 문제에 대한 분산 평균장 유전자 알고리즘 (Distributed Mean Field Genetic Algorithm for Channel Routing)

  • 홍철의
    • 한국정보통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.287-295
    • /
    • 2010
  • 본 논문에서는 MPI(Message Passing Interface) 환경 하에서 채널배선 문제에 대한 분산 평균장 유전자 알고리즘(MGA, Mean field Genetic Algorithm)이라는 새로운 최적화 알고리즘을 제안한다. 분산 MGA는 평균장 어닐링(MFA, Mean Field Annealing)과 시뮬레이티드 어닐링 형태의 유전자 알고리즘(SGA, Simulated annealing-like Genetic Algorithm)을 결합한 경험적 알고리즘이다. 평균장 어닐링의 빠른 평형상태 도달과 유전자 알고리즘의 다양하고 강력한 연산자를 합성하여 최적화 문제를 효율적으로 해결하였다. 제안된 분산 MGA를 VLSI 설계에서 중요한 주제인 채널 배선문제에 적용하여 실험한 결과 기존의 GA를 단독으로 사용하였을 때보다 최적해에 빠르게 도달하였다. 또한 분산 알고리즘은 순차 알고리즘에서의 최적해 수렴 특성을 해치지 않으면서 문제의 크기에 대하여 선형적인 수행시간 단축을 나타냈다.

부분적 분산형 수동적 중복 알고리즘 (Partially Decentralized Passive Replication Algorithm)

  • 안진호
    • 정보처리학회논문지A
    • /
    • 제12A권6호
    • /
    • pp.507-514
    • /
    • 2005
  • 본 논문에서는 메시지 전달 분산시스템서 결정적 서버를 위한 부분적 분산형 수동적 중복 알고리즘을 제안한다. 이 알고리즘은 반드시 주 서버가 아니더라도 임의의 보조서버가 자신이 수신한 클라이언트 요구에 대해 서버로부터 그 요구의 전달일련번호를 얻은 후, 그 보조서버가 직접 해당 요구를 처리하고, 이에 대한 다른 중복 서버들과의 조정에 대한 책임자 역할을 수행할 수 있도록 한다. 이러한 바람직한 특성 때문에, 제안된 알고리즘이 기존의 부하균등 기법과 결합된다면, 주 서버에의 급격한 부하 발생을 효율적으로 피할 수 있다. 따라서, 이 알고리즘은 기존의 수동적 중복 알고리즘보다 결정적 중복 서버 시스템에 대한 높은 확장성을 제공할 수 있다. 본 논문에서 수행한 시뮬레이션에서 기존 알고리즘에 비해 제안한 알고리즘이 클라이언트 요구 당 평균응답시간을 $16.5\%{\~}52.3\%$까지 줄일 수 있다는 것을 보여준다.