• 제목/요약/키워드: Parallel Computing Environment

검색결과 184건 처리시간 0.221초

Heterogeneous 멀티 코어 환경의 Thick Client에서 VDI 성능 최적화를 위한 혼합 병렬 처리 기법 연구 (VDI Performance Optimization with Hybrid Parallel Processing in Thick Client System under Heterogeneous Multi-Core Environment)

  • 김명섭;허의남
    • 한국통신학회논문지
    • /
    • 제38B권3호
    • /
    • pp.163-171
    • /
    • 2013
  • 최근 HD급 동영상이나 3D 어플리케이션과 같은 이전보다 저사양, 모바일 단말에서는 구동하기 힘든 프로그램들에 대한 이용 요구가 확대되면서 처리해야 할 콘텐츠 데이터들이 고용량화 되고 있다. 클라우드 기반의 VDI(Virtual Desktop Infrastructure) 서비스는 이를 처리하기 위해 효율적인 데이터 처리 능력이 필요해졌으며 QoE(Quality of Experience) 보장을 위한 성능 개선 연구가 이슈가 되고 있다. 본 논문에서는 H/W 성능이 향상되어 CPU와 GPU를 탑재한 Thick Client기반의 3가지 Thick-Thin간 VDI 자원 공유 및 위임이 가능한 VDI 서비스에 대해 제안하며, VDI 서비스 성능의 개선을 위해 CPU와 GPU가 혼합된 Heterogeneous 멀티코어 환경에서 CPU와 GPU 병렬 처리 기법인 OpenMP와 CUDA를 활용하여 VDI 서비스 최적화 방안을 제안하고 기존의 VDI와 비교한 성능을 거론한다.

수중 위치측정을 위한 인공지능 컴퓨팅 플랫폼 설계 (Artificial Intelligence Computing Platform Design for Underwater Localization)

  • 문지윤;이영필
    • 한국전자통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.119-124
    • /
    • 2022
  • 성공적인 수중 위치측정을 위해서는 다양한 수중 로봇에 탑재 가능한 대규모 병렬 컴퓨팅 환경이 필요하다. 이에, 본 논문에서는 수중 위치측정을 위한 인공지능 컴퓨팅 플랫폼 설계 방법을 제안한다. 제안한 플랫폼은 총 4개의 하드웨어 모듈로 구성된다. Transponder 및 hydrophone 모듈은 음파를 송수신하며 FPGA 모듈은 송수신한 음파 신호를 빠르게 병렬로 전처리한다. Jetson 모듈은 인공지능 기반 알고리즘 처리한다. 해당 플랫폼은 실제 수중 환경에서 거리에 따라 수중 위치측정을 위한 음파 송수신 실험을 수행하였으며 이를 통해 설계한 플랫폼을 검증할 수 있었다.

A dynamic analysis algorithm for RC frames using parallel GPU strategies

  • Li, Hongyu;Li, Zuohua;Teng, Jun
    • Computers and Concrete
    • /
    • 제18권5호
    • /
    • pp.1019-1039
    • /
    • 2016
  • In this paper, a parallel algorithm of nonlinear dynamic analysis of three-dimensional (3D) reinforced concrete (RC) frame structures based on the platform of graphics processing unit (GPU) is proposed. Time integration is performed using Newmark method for nonlinear implicit dynamic analysis and parallelization strategies are presented. Correspondingly, a parallel Preconditioned Conjugate Gradients (PCG) solver on GPU is introduced for repeating solution of the equilibrium equations for each time step. The RC frames were simulated using fiber beam model to capture nonlinear behaviors of concrete and reinforcing bars. The parallel finite element program is developed utilizing Compute Unified Device Architecture (CUDA). The accuracy of the GPU-based parallel program including single precision and double precision was verified in comparison with ABAQUS. The numerical results demonstrated that the proposed algorithm can take full advantage of the parallel architecture of the GPU, and achieve the goal of speeding up the computation compared with CPU.

그래프 중간표현 형태를 기반으로 한 병렬 프로그래밍 환경 (A Parallel Programming Environment using Graph Type Intermediate Representation Form)

  • 이원용;박두순
    • 인터넷정보학회논문지
    • /
    • 제2권4호
    • /
    • pp.69-81
    • /
    • 2001
  • 본 논문에서는 사용자의 병렬 프로그램 작성을 도와주는 병렬 프로그래밍 환경을 제공한다. 병렬 프로그램은 다양한 하드웨어의 특성에 따라 또는 프로그램의 특성에 따라 사용자가 병렬 프로그램을 작성하여야 하기 때문에 프로그래머는 병렬프로그램을 작성하는 것이 매우 어렵다. 본 논문에서는 사용자가 쉽게 프로그램을 작성할 수 있도록 하기 위하여 많은 병렬 화 연구에서 제시되고 있는 그래프 중간 표현 형태를 그래프 사용자 인터페이스로 구현하였다. 이 병렬 환경에서는 프로그램 편집기능, 종속성 분석기능, 루프 변환기능, CFG, PDG, HTG 등 중간 코드를 그래프 중간 표현 형태를 통해 보여 줌으로 사용자에게 병렬화, 최적화 작업에 용이하도록 한다.

  • PDF

병렬컴퓨팅 환경에서의 대용량 퍼지 추론 (Fuzzy Inference of Large Volumes in Parallel Computing Environments)

  • 김진일;이상구
    • 한국지능시스템학회논문지
    • /
    • 제10권4호
    • /
    • pp.293-298
    • /
    • 2000
  • 대단히 많은 수의 퍼지 규칙을 갖거나 대용량의 퍼지 데이터를 갖는 퍼지 전문가 시스템 또는 퍼지 데이터베이스 시스템에서는 많은 추론 시간을 요구한다. 따라서 이러한 추론 시간을 줄이기 위해서는 고성능 병렬 퍼지 컴퓨팅 환경을 필요로 한다. 본 온문에서는 병렬 컴퓨팅 환경에서 병렬 퍼지 추론 기법을 제안한다. 여기에서 퍼지 규칙은 분산되어 있고 동시에 수행된다. ONE_TO_ALL 알고리즘은 모든 노드에 퍼지 입력 백터를 broadcasting하는데 사용한다. MIN/MAX 연산의 결과는 ALL_TO_ONE 알고리즘에 의해 출력 프로세서로 전송된다. 퍼지 규칙 또는 데이터의 병렬 처리로 인해, 병렬 추론 알고리즘은 효과적인 병렬성의 추출 및 속도 향상을 가져온다.

  • PDF

웹 환경에서의 병렬/분산 처리를 위한 동적 호스트 관리 기법의 개발 (Development of the Dynamic Host Management Scheme for Parallel/Distributed Processing on the Web)

  • 송은하;정영식
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권3호
    • /
    • pp.251-260
    • /
    • 2002
  • 웹에 존재하는 수많은 유휴상태 호스트들을 이용한 병렬/분산 처리는 대규모 응용문제에 대해 높은 가격 대 성능비를 가진다. 웹 환경에서 병렬/분산 처리를 위하여 호스트들의 이질성 및 가변성, 자율성, 지속적인 성능보장과 참여 호스트 수 변화 등 예측할 수 없는 상태에 대한 해결책을 제시하여야 한다. 본 논문은 지리적으로 떨어져 있는 참여 호스트들의 작업 처리를 성능에 기반하는 적응적 작업 재할당 전략을 제안한다. 또한, 대규모 응용문제의 병렬 처리 중에 호스트 수가 변하는 동적 환경에 대해 동적 호스트 관리 스킴을 제공한다. 본 논문에서는 PDSWeb (Parallel/Distributed Scheme on Web) 시스템을 구현하여, 많은 연산량을 지닌 랜더링 이미지 생성에 적용하여 평가한다. 그 결과 호스트의 가변성에 대해 적응적 작업 재할당은 최고 90%이상 향상하였으며. 호스트 추가와 삭제에 따른 성능 향상 정도를 보인다.

멀티 매니징 기법을 이용한 웹기반 분산 병렬 컴퓨팅 환경 (Web-based Distributed Parallel Computing Environment with Multi-Managing Method)

  • 맹혜선;한탁돈;김신덕
    • 한국정보처리학회논문지
    • /
    • 제6권7호
    • /
    • pp.1777-1788
    • /
    • 1999
  • 자바 언어를 이용하여 이질적인 컴퓨팅 자원으로 구성된 컴퓨팅 환경에서 효율적으로 분산 병렬 처리를 수행할 수 있도록 하는 웹컴퓨팅 방법이 제시되었다. 본 연구에서는 인트라넷상의 유휴 컴퓨팅 자원을 활용하는 '협력하는 웹컴퓨팅 환경(Cooperative Web Computing Environment : CWCE)'을 구축하였다. 이 환경은 특히 협력하는 병렬 프로그램을 효율적으로 수행할 수 있도록 한다. CWCE 컴퓨터들 사이의 통신 집중 감소를 위해 복수 개의 매니저 컴퓨터를 운용할 수 있는 방법을 제공한다. 또한 최적화 된 수행을 지원하기 위해 필요한 매니저 컴퓨터의 개수를 결정할 수 있는 '매니징 레벨 결정 함수'를 제공한다. 본 연구에서는 동기화 된 통신을 요구하는 응용 프로그램이 CWCE 환경에서 복수 개의 매니저 컴퓨터를 이용함으로써 보다 효율적으로 수행될 수 있음을 분석과 실험을 통해서 보이도록 하였다.

  • PDF

실시간 시뮬레이션을 위한 병렬적분 (Parallel Integration for Real-Time Simulation)

  • 이운성
    • 한국자동차공학회논문집
    • /
    • 제2권1호
    • /
    • pp.106-115
    • /
    • 1994
  • A parallel integration approach is proposed for real-time simulation of controlled mechanical systems. The proposed approach, which employs the dual-rate integration method in a parallel computing environment, is developed to deal with stiffness and high frequency characteristics of the controlled mechanical systems effectively. Numerical experiments are performed to demonstrate the effectiveness of the approach in shared memory multiprocessors, Alliant FX/8 and Alliant FX/80.

  • PDF

Parallel Computing on Intensity Offset Tracking Using Synthetic Aperture Radar for Retrieval of Glacier Velocity

  • Hong, Sang-Hoon
    • 대한원격탐사학회지
    • /
    • 제35권1호
    • /
    • pp.29-37
    • /
    • 2019
  • Synthetic Aperture Radar (SAR) observations are powerful tools to monitor surface's displacement very accurately, induced by earthquake, volcano, ground subsidence, glacier movement, etc. Especially, radar interferometry (InSAR) which utilizes phase information related to distance from sensor to target, can generate displacement map in line-of-sight direction with accuracy of a few cm or mm. Due to decorrelation effect, however, degradation of coherence in the InSAR application often prohibit from construction of differential interferogram. Offset tracking method is an alternative approach to make a two-dimensional displacement map using intensity information instead of the phase. However, there is limitation in that the offset tracking requires very intensive computation power and time. In this paper, efficiency of parallel computing has been investigated using high performance computer for estimation of glacier velocity. Two TanDEM-X SAR observations which were acquired on September 15, 2013 and September 26, 2013 over the Narsap Sermia in Southwestern Greenland were collected. Atotal of 56 of 2.4 GHz Intel Xeon processors(28 physical processors with hyperthreading) by operating with linux environment were utilized. The Gamma software was used for application of offset tracking by adjustment of the number of processors for the OpenMP parallel computing. The processing times of the offset tracking at the 256 by 256 pixels of window patch size at single and 56 cores are; 26,344 sec and 2,055 sec, respectively. It is impressive that the processing time could be reduced significantly about thirteen times (12.81) at the 56 cores usage. However, the parallel computing using all the processors prevent other background operations or functions. Except the offset tracking processing, optimum number of processors need to be evaluated for computing efficiency.