• Title/Summary/Keyword: 병렬처리 알고리즘

Search Result 697, Processing Time 0.03 seconds

스마트폰에서의 영상처리를 위한 GPU 활용

  • Park, In-Gyu;Choe, Ho-Yeol
    • Information and Communications Magazine
    • /
    • v.29 no.4
    • /
    • pp.46-51
    • /
    • 2012
  • 본 기고에서는 최근 스마트폰에서 요구되는 다양한 멀티미디어 어플리케이션을 embedded GPU(Graphics Processing Unit)를 이용하여 고속 병렬처리하기 위한 GPGPU (General-Purpose Computing on GPU) 기술 및 영상처리 분야의 응용 사례를 소개한다. 일반적인 데스크탑 컴퓨팅 환경과 달리 제약사항이 많은 embedded 환경에서의 GPGPU 응용 기술은 아직 초기단계이다. 그러나 급격히 발전하는 embedded GPU IP와 OpenCL과 같은 API의 등장으로 embedded GPU를 이용한 고속 병렬처리 환경이 수 년 이내에 일반화 될 것이다. 본 기고에서는 그 가능성을 점검하기 위하여 embedded GPU에서의 영상처리를 위한 최신 하드웨어와 소프트웨어 환경의 발전 동향을 소개한다. 더불어 최신 스마트폰에서의 GPGPU기술을 사용한 영상처리 사례와 영상처리 알고리즘의 GPGPU 알고리즘 구현시 고려해야 할 주요 사항을 정리한다.

Performance Enhancement of Parallel Prime Sieving with Hybrid Programming and Pipeline Scheduling (혼합형 병렬처리 및 파이프라이닝을 활용한 소수 연산 알고리즘)

  • Ryu, Seung-yo;Kim, Dongseung
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.4 no.10
    • /
    • pp.337-342
    • /
    • 2015
  • We develop a new parallelization method for Sieve of Eratosthenes algorithm, which enhances both computation speed and energy efficiency. A pipeline scheduling is included for better load balancing after proper workload partitioning. They run on multicore CPUs with hybrid parallel programming model which uses both message passing and multithreading computation. Experimental results performed on both small scale clusters and a PC with a mobile processor show significant improvement in execution time and energy consumptions.

Proposal and Performance Evaluation of A Scalable Scheduling Algorithm According to the Number of Parallel Processors (병렬 처리장치의 개수에 따른 스케줄링 알고리즘의 제안 및 성능평가)

  • Gyung-Leen Park;Sang Joon Lee;BongKyu Lee
    • Journal of Internet Computing and Services
    • /
    • v.1 no.2
    • /
    • pp.19-28
    • /
    • 2000
  • The scheduling problem in parallel processing systems has been a challenging research issue for decades. The problem is defined as finding an optimal schedule which minimizes the parallel execution time of an application on a target multiprocessor system. Duplication Based Scheduling (DBS) is a relatively new approach for solving the problem. The DBS algorithms are capable of reducing communication overhead by duplicating remote parent tasks on local processors. Most of DBS algorithms assume an availability of the unlimited number of processors in the system. Since the assumption may net hold in practice, the paper proposes a new scalable DBS algorithm for a target system with limited number of processors. It Is shown that the proposed algorithm with N available processors generates the same schedule as that obtained by the algorithm with unlimited number of processors, where N is the number of input tasks. Also, the performance evaluation reveals that the proposed algorithm shows a graceful performance degradation as the number of available processors in the system is decreased.

  • PDF

High-Perlormance VLSI Architecture of HEVC CABAC Decoder by Multi-Parallel Algorithm (병 렬 알고리즘에 의한 H.265/HEVC CABAC 디코더의 고성능 구조)

  • Kim, Gi-Yeong;Bae, Jong-Woo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.934-937
    • /
    • 2015
  • 본 논문은 비디오 디코더의 병목현장을 해결하고 대량의 데이터를 처리할 수 있는 다중병렬처리방식의 HEVC CABAC 디코더를 소개한다. CABAC 디코더를 병렬화한 하드웨어 VLSI구조를 설계하여 크기 대비 높은 처리량이 나오는지를 설계 및 분석결과를 통해 연구결과를 도출하는 게 본 논문의 목적이다. CABAC 디코더 내부 module(산술 디코더, 문맥 모델러, 역이진화기) 1개에서 4개까지의 병렬화를 분석한 결과 4개의 병렬화를 했을 때가 크기 대비 처리량이 가장 높다는 것을 알 수 있었다. 또한 내부 module 4개를 병렬화한 CABAC 디코더 4개를 병렬화하여 slice 단위로 나눠진 프레임 1개를 한 번에 처리하는 방식을 채택하였다. 본 논문에서는 각 CABAC 디코더의 내부 module 4개를 병렬화하고, 병렬화한 CABAC 디코더 4개를 다시 병렬화하는 하드웨어 구조를 사용한다.

Geoacoustic Parameters Inversion Using Parallel Multi-Population Genetic Algorithm (병렬 다중 개체군 유전 알고리즘을 이용한 지음향 파라미터 역산)

  • Oh Taekhwan;Na Jungyul;Lee Seongwook;Kim Seongil;Park Joung-Soo
    • The Journal of the Acoustical Society of Korea
    • /
    • v.24 no.6
    • /
    • pp.309-316
    • /
    • 2005
  • This paper Presents the geoacoustic inversion with Parallel Multi-Population Genetic Algorithm (PMPGA). This method is the modified form of simple genetic algorithm (SGA), which is devised for complementing the defects of simple genetic algorithm. The light bulb source and vertical line array (VLA) receiver are used for geoacoustic inversion. The results of this study show the geoacoustic Parameters can be estimated by PMPGA and the proposed algorithm is 1.7 times as fast as serial one on an average.

An Efficient Duplication Based Scheduling Algorithm for Parallel Processing Systmes (병렬 처리 시스템을 위한 효율적인 복제 중심 스케쥴링 알고리즘)

  • Park, Gyeong-Rin;Chu, Hyeon-Seung
    • The Transactions of the Korea Information Processing Society
    • /
    • v.6 no.8
    • /
    • pp.2050-2059
    • /
    • 1999
  • Multiprocessor scheduling problem has been an important research area for the past decades. The problem is defined as finding an optimal schedule which minimizes the parallel execution time of an application on a target multiprocessor system. Duplication Based Scheduling (DBS) is a relatively new approach for solving multiprocessor scheduling problems. This paper classifies DBS algorithms into two categories according to the task duplication method used. The paper then presents a new DBS algorithm that extracts the strong features of the two categories of DBS algorithms. The simulation study shows that the proposed algorithm achieves considerable performance improvement over existing DBS algorithms with similar time complexity.

  • PDF

A Modified Thinning Algorithm Using Parallel Processing Method (개선된 병렬적 처리 방식의 세선화 알고리즘)

  • Lee, Keon-Ik;Cha, Sung-Yoon;Kim, Sung-Nak
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.11a
    • /
    • pp.519-522
    • /
    • 2003
  • 이 논문에서는 특징점 정보를 이용하여 기존의 병렬 세선화 알고리즘을 개선하는 방법을 제안하였다. 자동 지문 인식 시스템에서 특징점을 정확히 검출하기 위해서 지문영상의 세선화는 매우 중요한 부분을 차지한다. 이 논문에서는 기존 병렬 세선화 알고리즘에 픽셀의 연결성을 이용한 알고리즘을 추가하여 세선화를 수행하였다. 제안 방법의 성능평가를 위하여 이진 지문 영상을 사용하여 기존 방법과 비교하였으며 실험결과 세선화 정도가 우수함을 알 수 있었다.

  • PDF

A Design of the Task Scheduling using a Extended Genetic Algorithm in Parallel Processing Systems (병렬 처리 시스템에서 확장된 유전자 알고리즘을 이용한 태스크 스케줄링 설계)

  • Park, Weol-Seon;Youn, Sung-Dae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.279-282
    • /
    • 2001
  • 병렬프로그램을 멀티프로세서로 스케줄링하는 문제의 해를 구하기 위하여 본 논문에서는 확장된 유전자 알고리즘을 적용한다. 확장된 유전자알고리즘인 MSEGA는 각 노드의 선행관계에 관한 휴리스틱한 정보와 간단한 일차원 배열구조가 통합된 염색체 코딩방법과 염색체 구성인자 중 우성 유전인자의 형질을 다음세대로 존속시키는 교배연산자와 프로세서 효율성이 고려된 평가 함수등으로 순서제약이 있는 병렬프로그램 스케줄링 문제 및 FFT(Fast Fourier Transform)형태의 데이터 흐름도상에서 관련 연구 중 Hou의 유전자 알고리즘과 BEA(binary-exchange algorithm)에 의한 스케줄링 결과보다 전체실행시간에 있어 HSEGA에 의한 스케줄링이 더 우수함을 보였다.

  • PDF

Efficient Parallel Logic Simulation on SIMD Computers (SIMD 컴퓨터상에서 효율적인 병렬처리 논리 시뮬레이션)

  • Chung, Yun-Mo
    • The Transactions of the Korea Information Processing Society
    • /
    • v.3 no.2
    • /
    • pp.315-326
    • /
    • 1996
  • As the complexity of VLSI circuits has increased, a lot of simulation time for verifying their correctness has been required. This paper presents efficient parallelel logic simulation protocols, data structures, algorithms to implement fast logic simulation on SIMD parallel processing computers. The performance results of the presented schemes on CM-2 are given and analyzed.

  • PDF

An Optimal Parallel Algorithm for Generating Computation Tree Form on Linear Array with Slotted Optical Buses (LASOB 상에서 계산 트리 형식을 생성하기 위한 최적 병렬 알고리즘)

  • Kim, Young-Hak
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.27 no.5
    • /
    • pp.475-484
    • /
    • 2000
  • Recently, processor arrays to enhance the banRecently, processor arrays to enhance the bandwidth of buses and to reduce the complexity of hardwares, using optical buses instead of electronic buses, have been proposed in manyliteratures. In this paper, we first propose a constant-time algorithm for parentheses matching problemon a linear array with slotted optical buses (LASOB).Then, given an algebraic expression of length n, we also propose a cost optimal parallel algorithmthat constructs computational tree form in the steps of constant time on LASOB with n processorsby using parentheses matching algorithm. A cost optimal parallel algorithm for this problem that runsin constant time has not yet been known on any parallel computation models.

  • PDF