• Title/Summary/Keyword: 병렬처리 계산

Search Result 443, Processing Time 0.032 seconds

Characteristics of HPC(High-performance Computing)-based Parallel Processing on Electromagnetic Scattering Problems (전자파 산란 문제에서의 고성능 컴퓨팅(HPC) 기반 병렬 처리 특성)

  • Cho, Yong-Heui
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2017.05a
    • /
    • pp.37-38
    • /
    • 2017
  • 금속으로 이루어진 긴 선이나 구에 대한 전자파 산란 특성을 계산할 때, 산란 계산 속도를 개선하기 위해 사용하는 고성능 컴퓨팅(HPC) 기반 병렬 처리 특성을 제시한다. 산란 행렬 생성, 가우스 소거법, 산란파 계산 등으로 이루어진 전자파 산란 문제는 병렬 처리를 통해 계산 속도를 높일 수 있다. 산란 문제의 계산 절차를 분석하여 병렬화에 유리한 계산 작업을 분류한 후 OpenMP 기반 병렬화를 적용한다.

  • PDF

Parallel Algorithms for the Discrete Logarithm Problem dn SIMD Machines (SIMD상에서 이산대수 문제에 대한 병렬 알고리즘)

  • 김양희;정창성
    • Review of KIISC
    • /
    • v.4 no.2
    • /
    • pp.40-46
    • /
    • 1994
  • 고속 계산을 요구하는 분야에서는 여러개의 프로세싱 소자를 사용하여 속도를 증가시키는 병렬 처리의 필요성이 점점 증대되고 있다. 특히 암호처리에서 이산대수 문제나 factorization문제는 많은 시간이 걸리므로 고속계산을 위한 병렬처리가 매우 중요하다. 본 논문에서는 Pohlig-Hellman에 의한 이산대수 알고리즘을 SIMD구조의 병렬 컴퓨터상에서 고속으로 처리할 수 있는 두가지 병렬 이산대수 알고리즘을 제시하며, 이를16개의 트랜스퓨터로 구성된 병렬 컴퓨터인 KOPS(Korea Parallel System)상에서 구현한 성능평가를 제시한다.

  • PDF

Performance of Parallel Ray Tracing Algorithm on PC Cluster (PC Cluster 상에서의 병렬 광선 추적 알고리즘의 성능)

  • Im, Dong-Ick;Lee, Hyo-Jong;Lim, Bum-Hyun
    • Annual Conference of KIPS
    • /
    • 2002.04a
    • /
    • pp.389-392
    • /
    • 2002
  • 광선 추적 기법은 컴퓨터를 활용하여 사진과 같은 고해상도의 영상을 얻어내기 위한 렌더링 기법 중 하나이다. 그러나 이 기법은 이미지를 생성할 때 각 접마다 시뮬레이션을 하여 계산해 내므로 접의 수에 따른 계산량이 증가되고 그에 따른 계산 시간이 많이 소요된다는 단점이 있다. 이러한 많은 계산량을 처리하기 위해 병렬처리 기법을 활용할 수 있다. 본 논문에서는 MPI(Message Passing Interface)를 이용한 병렬 광선 추적 기법을 제시하고 그러한 기법을 여러대의 PC를 이용한 PC Clustering 기법에 적용시켜봄으로써 복잡한 계산에 소요되는 시간을 단축시키고자 하였다. 또한 작업의 크기의 변화에 따른 작업 시간과 노드 수의 증가에 따른 속도 향상률을 알아보았다. 이러한 실험을 위해 병렬 프로그래밍 도구로는 Windows NT 기반의 MPICH를 사용하였고 노드의 수는 3대에서 30대까지 증가시켰다. 노드의 수가 증가함에 따라 렌더링에 소요되는 시간이 선형적으로 감소함을 알 수 있었다.

  • PDF

Design of Parallel Algorithms for Conventional Matched-Field Processing over Array of DSP Processors (다중 DSP 프로세서 기반의 병렬 수중정합장처리 알고리즘 설계)

  • Kim, Keon-Wook
    • Journal of the Institute of Electronics Engineers of Korea SP
    • /
    • v.44 no.4 s.316
    • /
    • pp.101-108
    • /
    • 2007
  • Parallel processing algorithms, coupled with advanced networking and distributed computing architectures, improve the overall computational performance, dependability, and versatility of a digital signal processing system In this paper, novel parallel algorithms are introduced and investigated for advanced sonar algorithm, conventional matched-field processing (CMFP). Based on a specific domain, each parallel algorithm decomposes the sequential workload in order to obtain scalable parallel speedup. Depending on the processing requirement of the algorithm, the computational performance of the parallel algorithm reveals different characteristics. The high-complexity algorithm, CMFP shows scalable parallel performance on the array of DSP processors. The impact on parallel performance due to workload balancing, communication scheme, algorithm complexity, processor speed, network performance, and testbed configuration is explored.

Parallel Design and Implementation of Shot Boundary Detection Algorithm (샷 경계 탐지 알고리즘의 병렬 설계와 구현)

  • Lee, Joon-Goo;Kim, SeungHyun;You, Byoung-Moon;Hwang, DooSung
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.51 no.2
    • /
    • pp.76-84
    • /
    • 2014
  • As the number of high-density videos increase, parallel processing approaches are necessary to process a large-scale of video data. When a processing method of video data requires thousands of simple operations, GPU-based parallel processing is preferred to CPU-based parallel processing by way of reducing the time and space complexities of a given computation problem. This paper studies the parallel design and implementation of a shot-boundary detection algorithm. The proposed shot-boundary detection algorithm uses pixel brightness comparisons and global histogram data among the blocks of frames, and the computation of these data is characterized with the high parallelism for the related operations. In order to maximize these operations in parallel, the computations of the pixel brightness and histogram are designed in parallel and implemented in NVIDIA GPU. The GPU-based shot detection method is tested with 10 videos from the set of videos in National Archive of Korea. In experiments, the detection rate is similar but the computation time is about 10 time faster to that of the CPU-based algorithm.

Accelerated Numerical Computations of Antennas Using OpenMP, MPI, CUDA (OpenMP, MPI, CUDA를 이용한 안테나 수치 계산 가속화)

  • Cho, Yong-Heui
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2014.11a
    • /
    • pp.41-42
    • /
    • 2014
  • 대형 안테나 해석에서 큰 화두는 안테나 수치 계산 속도를 높이는 것이다. 현재 인기를 얻고 있는 병렬 처리 방식인 OpenMP, MPI, CUDA를 이용하여 안테나 수치 계산을 병렬화할 경우 발생하는 단점을 제시하고, 각 병렬 처리법의 장점도 소개한다.

  • PDF

A Study on comparison of calculation between CPU-intensive and GPU-intensive and finding proper model for specific program (GPU기반의 계산속도와 CPU기반의 계산속도 비교 및 특정 프로그램에 따른 적합한 모델 찾기에 대한 연구)

  • Shin, Hyun-Soo
    • Annual Conference of KIPS
    • /
    • 2019.05a
    • /
    • pp.48-51
    • /
    • 2019
  • 최근 기술이 발달함으로 인해 더 짧은시간에 더 많은 계산량이 필요해진 시대가 왔다. 본 연구에서는 CPU와 GPU의 구조를 파악하고 계산속도를 비교한다. 직렬 방식의 알고리즘에서의 병렬 방식의 알고리즘 및 현재 GPU 병렬처리 적용 사례 및 추후 적합한 모델 찾기에 대해 연구한다.

Performance Analysis on Parallel Processing of a Hybrid of a CPU and a GPU (CPU와 GPU의 혼합 병렬 계산에 대한 성능 분석)

  • Hwang, Keunchang;Kim, Youngtae
    • Annual Conference of KIPS
    • /
    • 2016.04a
    • /
    • pp.59-60
    • /
    • 2016
  • 본 논문에서는 고성능 병렬 계산 장치로 주목받고 있는 GPU를 CPU와 동시에 병렬로 사용한 계산 성능을 분석하였다. 성능 분석을 위하여 원주율(${\pi}$)을 적분으로 계산하는 CUDA 프로그램을 사용하였으며, 전체 계산을 GPU 대비 CPU 계산 부분으로 할당하여 성능을 분석하였다.

Improved Parallel Computation for Extended Edit Distances (개선된 확장편집거리 병렬계산)

  • Kim, Youngho;Sim, Jeong Seop
    • Annual Conference of KIPS
    • /
    • 2014.11a
    • /
    • pp.62-65
    • /
    • 2014
  • 근사문자열매칭 알고리즘은 검색엔진, 컴퓨터보안, 생물정보학 등 많은 분야에서 연구되고 있다. 근사문자열매칭에서는 거리함수를 이용하여 오차를 측정한다. 거리함수로는 해밍거리, 편집거리, 확장편집거리 등이 있다. 이때 확장편집거리는 mn) 시간과 공간에 계산할 수 있으며, 최근 m개의 쓰레드를 이용하여 O(m+n) 시간과 O(mn) 공간을 이용한 병렬알고리즘이 제시되었다. 본 논문에서는 기존의 확장편집거리를 계산하는 병렬알고리즘을 개선한 효율적인 병렬알고리즘을 제시한다. 기존의 병렬알고리즘을 최적화하고, 기존의 병렬알고리즘, 전역메모리만 사용한 최적화된 병렬알고리즘, 공유메모리를 활용한 최적화된 병렬알고리즘의 수행시간을 비교한다. 실험 결과, 개선된 병렬알고리즘이 기존의 병렬알고리즘보다 전처리단계에서 16 ~ 63배 이상, 모든 단계에 대해 19 ~ 24배 이상 빠른 수행시간을 보였다.

An Efficient Distributed Parallel Processing in Optimal Power Flow (최적조류계산의 효율적인 분산병렬처리)

  • Kim, Bal-Ho;Kim, Jin-Ho;Heo, Don
    • Proceedings of the KIEE Conference
    • /
    • 1999.11b
    • /
    • pp.434-437
    • /
    • 1999
  • 본 연구에서는 워크스테이션 상에서 최적조류계산의 효율적인 분산병렬처리 기법을 개발하였다. 본 연구의 결과를 실제로 2587개의 송전선을 포함하는 미국 ERCOT 계통에 대하여 사례 연구한 결과 성능이 뛰어남을 알 수 있었다. 본 연구는 최적 조류계산을 병렬 처리하는 일반적인 방식을 제시해 줄 수 있을 것이라 생각된다.

  • PDF