통합 검색 | Korea Science

볼륨렌더링을 위한 병렬화 방법들의 성능평가 (Performance Evaluation of Parallelization Methods for Volume Rendering)

김진호;김남규;김지인;정갑주
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
- /
- pp.641-643
- /
- 1999
많은 처리시간을 요구하는 대규모 3차원 데이터의 영사화(대규모 볼륨렌더링)에서는 병렬처리가 반드시 요구된다. 대규모 볼륨렌더링의 처리시간은 크게 데이터입력 시간과 입력된 데이터의 영상화(연산) 시간으로 구성된다. 따라서 데이터 입력 과정과 연산 과정 모두를 병렬화할 필요가 있다. 입출력 병렬화 및 알고리즘 병렬화는 각각 독립적으로 적용가능하다. 본 논문에서는 (1)순차 볼륨렌더링, (2)병렬연산 기반 볼륨렌더링, (3)병렬입출력 기반 볼륨렌더링, (4) 병렬연산 및 병렬입출력 기반 볼륨렌더링 등 네 가지 경우를 각각 구현하여 성능을 비교하였다. 실험결과에서는 병렬연산 및 병렬 입출력이 동시에 적용되는 (4)가 가장 좋은 성능을 보이는 것으로 나타났다.
PDF

GPGPU 기반 조인 연산 병렬화 성능 비교 (Performance Comparison of Join Operations Parallelization by using GPGPU)

이종섭;이상백;이규철
- 데이타베이스연구회지:데이타베이스연구
- /
- 제34권3호
- /
- pp.28-44
- /
- 2018
데이터베이스 시스템 관계 연산자 중에서 연산 비용이 가장 비싼 연산은 조인 연산이다. 일반적으로 CPU 기반의 조인 연산의 경우에는 하나의 코어를 사용하거나 많게는 16개 정도의 코어를 사용하여 병렬 처리를 해서 병렬화에 따른 성능 향상이 크지 않다. 이에 반해, GPGPU(General-Purpose computing on Graphics Processing Units)는 수천 개의 프로세싱 유닛을 통한 병렬 처리가 가능해서 조인 연산 수행 시간을 크게 단축할 수 있다. 본 논문에서는 GPGPU 기반에서 조인 연산 병렬화를 구현하기 위해 NVIDIA의 CUDA SDK가 사용되며, CPU 기반과 GPGPU 기반에서의 조인 연산 성능을 측정한다. 사용되는 조인 연산은 NLJ (Nested Loop Join), SMJ (Merge Join), HJ (Hash Join)이며, GPGPU 장비는 TITAN Xp, GTX 1080 Ti 및 GTX 1080을 사용한다. CPU 기반과 GPGPU 기반의 성능을 비교하고, GPGPU 기반의 조인 연산과 이전 연구의 성능과의 성능을 비교한다. 마지막으로, 실험 결과는 GPGPU 기반의 성능이 CPU 기반의 성능보다 6~328 배 빠른 성능을 보였고 향후 연구의 방향성에 대하여 토의한다.

PC 클러스터를 이용한 래스터 GIS 연산의 병렬화 (Parallelization of Raster GIS Operations Using PC Clusters)

신윤호;박수홍
- Spatial Information Research
- /
- 제11권3호
- /
- pp.213-226
- /
- 2003
GIS를 이용한 대용량의 지리정보 처리가 요구되고 있으나 단일 프로세서만으로 복잡한 GIS 연산을 처리하는 데는 능력의 한계성이 대두되고 있다. 특히, GIS 데이터의 증가속도에 프로세서 발전 속도가 미치지 못하고, 증가되는 광범위한 데이터를 처리하는 작업 또한 많은 시간이 걸리는 문제점이 나타나고 있다. 이에 대한 대안으로 계산의 양이 많고 또한, 대용량의 입·출력이 빈번히 일어나는 GIS 연산 작업을 여러 프로세서에 분산시켜 동시에 수행하도록 하는 GIS 작업의 병렬화에 대한 연구가 최근 활발히 진행되고 있다. 본 연구에서는 고가의 병렬 컴퓨터로만 수행되던 병렬 처리를 일반적인 GIS 사용자들이 사용하는 PC 기반으로 MPI(Message Passing Interface)를 사용하여 기존의 단일 프로세서로만 진행되던 래스터 GIS 연산에 대해서 병렬화 과정을 적용하여 연산의 처리 능력을 향상시키고자 한다. 이를 위해, GIS 연산들에 대한 체계적인 분석과 분류를 제시한 Tomlin(1990)의 래스터 GIS 연산을 기준으로 각 연산에 대해 적합한 데이터 분할 기법을 통한 병렬화 과정을 연구하였다.
PDF

효율적인 멀티미디어데이터 처리를 위한 RISC Processor의 설계 (Design of a RISC Processor with an Efficient Processing Unit for Multimedia Data)

조태헌;남기훈;김명환;이광엽
- 대한전자공학회:학술대회논문집
- /
- 대한전자공학회 2003년도 하계종합학술대회 논문집 II
- /
- pp.867-870
- /
- 2003
본 논문은 멀티미디어 데이터 처리를 위한 효율적인 RISC 프로세서 유닛의 설계를 목표로 Vector 프로세서의 SIMD(Single Instruction Multiple Data) 개념을 바탕으로 고정된 연산기 데이터 비트 수에 비해 상대적으로 작은 비트수의 데이터 연산의 부분 병렬화를 통하여 멀티미디어 데이터 연산의 기본이 되는 곱셈누적(MAC : Multiply and Accumulate) 연산의 성능을 향상 시킨다. 또한 기존의 MMX나 VIS 등과 같은 범용 프로세서들의 부분 병렬화를 위해 전 처리 과정의 필요충분조건인 데이터의 연속성을 위해 서로 다른 길이의 데이터 흑은 비트 수가 작은 멀티미디어의 데이터를 하나의 데이터로 재처리 하는 재정렬 혹은 Packing/Unpacking 과정이 성능 전체적인 성능 저하에 작용하게 되므로 본 논문에서는 기존의 프로세서의 연산기 구조를 재이용하여 병렬 곱셈을 위한 연산기 구조를 구현하고 이를 위한 데이터 정렬 연산 구조를 제안한다.
PDF

MLP 기반의 문자 추출을 위한 하드웨어 구현 (Hardware Implementation for MLP Based Text Detection)

경동욱;정기철
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2006년도 학술대회 1부
- /
- pp.766-771
- /
- 2006
현재 많은 신경망의 하드웨어 구현은 부동 소수점 연산에 비해서 적은 면적과 빠른 수행시간을 가지는 고정소수점 연산을 많이 사용하지만, 소프트웨어에서는 일반적으로 높은 정확도를 가지는 부동소수점 연산을 사용한다. 신경망의 하드웨어 구현에서 많이 사용하는 고정소수점 연산은 부동소수점 연산에 비해서 빠른 처리속도와 적은 면적으로써 쉽게 하드웨어 구현에 용이하지만, 부동소수점 연산에 비해서 낮은 정확도와 기존의 부동소수점 연산을 사용하는 소프트웨어 신경망을 쉽게 적용할 수 없는 단점을 가진다. 본 논문에서는 부동소수점 연산을 사용하여 문자 추출 MLP의 데이터 변환 없이 적용할 수 있는 전체 파이프라이닝 설계 구조를 제안한다. 제안된 설계방법은 신경망의 전체 구조를 입력층과 은닉층을 링크 병렬화 방법과 은닉층과 출력층을 뉴런 병렬화 방법을 개선하여 쉽게 파이프라이닝 구조로 설계함으로써 신경망 처리는 은닉층 뉴런수와 동일한 주기로 처리되며, 기존의 문자추출 소프트웨어 신경망을 제안된 하드웨어 설계방법으로 구현하였을 때 11배의 빠른 성능을 나타낸다.
PDF

제내지 침수해석을 위한 병렬연산기법의 비교

박재홍
- 한국수자원학회:학술대회논문집
- /
- 한국수자원학회 2017년도 학술발표회
- /
- pp.296-296
- /
- 2017
본 연구에서는 대규모 유역에서 발생하는 침수 현상을 모의하기 위한 강력하고 정확하며 연산효율이 뛰어난 수치해석 모형을 개발하는 데 있다. 개발된 모형은 확산파 모형을 기본으로 하였고 다수의 코어를 동시적으로 해석하는 병렬연산 기법을 부가하였다. 홍수로 인한 대규모 유역에서의 침수해석은 오랜 시간의 연산 비용을 필요로 한다. 특히 수치화된 지형정보의 이용이나 고정밀 사진 측량 등의 방법을 이용하여 정밀하고 넓은 유역의 디지털 지형자료를 이용한 2 차원 침수해석은 연산 연산의 문제를 더욱 어렵게 할 수 있다. 그러므로 본 연구에서는 제내지나 하류 유역에 발생하는 홍수로 발생된 빠른 침수모의를 위해 병렬화된 침수 해석 모형을 이용하여 병렬 해석 모형의 적용성을 검토하고자 하였다. 연구를 위해 MPI 및 OpenMP 기법을 이용하여 2 차원 침수해석 프로그램의 원시코드를 개선하고 실제 제내지 및 실제 댐 하류유역에 적용하였다. 개발된 모형은 실제 제내지에 적용한 결과를 MPI, OpenMP 병렬해석 기법과 기존의 순차적 모형의 결과를 비교하였다. 모형들의 결과를 제내지의 침수양상, 침수 속도벡터의 방향 및 크기 등의 계산 결과 순차적 모형, MPI 및 OpenMP 모형과의 비교하여 연산 시간은 병렬 해석 모형이 우월함을 보였다.
PDF

안테나 특성 고속 계산을 위한 병렬화 행렬 연산 (Parallelized Matrix Operation for Fast Computations of Antenna Characteristics)

조용희
- 한국콘텐츠학회:학술대회논문집
- /
- 한국콘텐츠학회 2015년도 춘계 종합학술대회 논문집
- /
- pp.61-62
- /
- 2015
밀리미터파 대역에서 사용하는 대형 안테나 해석 속도를 개선하기 위한 병렬형 행렬 연산법을 제안한다. 기존의 가우스 소거법을 병렬화하기 위해 행렬 분해와 반복법을 이용한다. 또한, 반복법의 수렴성을 높이기 위해 이전 행렬해를 부분적으로 사용하여 분해 행렬을 구성하는 방식도 제시한다. 본 제안법은 OpenMP, MPI, CUDA 등의 병렬법과 함께 사용할 수 있다.
PDF

OpenCL을 이용한 지문개선 가속화 (Fingerprint enhancement acceleration using OpenCL)

고성학;이철;박능수
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2014년도 추계학술발표대회
- /
- pp.115-117
- /
- 2014
최근 OpenCL, CUDA와 같은 이종 병렬 컴퓨팅 프레임워크가 등장함에 따라, 많은 연산량을 요구하는 알고리즘에 대한 이종 병렬 처리 연구가 늘고 있다. 본 논문에서는 연산량이 많은 지문개선(fingerprint enhancement) 알고리즘을 OpenCL을 이용해 병렬화하고 최적화하여 연산 시간을 단축하고자 한다. 이를 위하여 2차원 FFT 및 필터링 알고리즘을 병렬화하고, Loop Unrolling 및 메모리 접근 최적화 등의 기법을 적용하였다. 실험을 통하여 CPU의 순차적 처리기법과 비교하여 개선된 가속화 기법을 이용한 지문개선 알고리즘이 최대 25배의 성능이 향상하였음을 확인하였다.
https://doi.org/10.3745/PKIPS.y2014m11a.115 인용 PDF

하이브리드 프로그래밍과 파이프라인 작업을 통한 병렬 소수 연산 성능 향상 (Performance Enhancement of Parallel Prime Sieving Computation with Hybrid Programming and Pipeline Scheduling)

유승요;김동승
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2015년도 춘계학술발표대회
- /
- pp.114-117
- /
- 2015
이 논문에서는 소수 추출 방법인 Sieve of Eratosthenes 알고리즘을 병렬화하되 실행시간과 에너지 소모 면에서 개선된 효과를 얻고자 한다. 멀티코어 프로세서의 공유 메모리를 효율적으로 활용하도록 하이브리드 병렬 프로그래밍 모델을 적용하고, 부하 균등화를 정교하게 조절하도록 파이프라인 작업 방식을 도입하였다. 실험결과 이전 방식보다 연산속도가 향상되었고, 에너지 사용량도 감소함을 확인하였다.
https://doi.org/10.3745/PKIPS.y2015m04a.114 인용 PDF

GPGPU 를 이용한 양 방향성 필터의 병렬 구현 및 성능 평가 (Efficient Parallel Bilateral Filter using GPGPU)

장기준;노원우
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2011년도 추계학술발표대회
- /
- pp.369-372
- /
- 2011
양 방향성 필터는 이미지표면 평탄화와 잡음제거에 좋은 성능을 보이지만 특유의 연산 복잡도로 인하여 연산 시간이 오래 걸린다는 단점이 존재한다. 따라서 본 논문에서는 고도의 병렬수행을 바탕으로 하는 그래픽연산장치(GPU)에 적합하도록 수정된 효율적인 양 방향성 필터를 NVIDIA 의 CUDA 를 사용하여 GTX 285 GPU 에서 구현하였다. 영상의 전 영역을 참조하는 대신 인접하고 연속된 영역으로의 근사화, 적은 메모리 사용량, 빠른 접근속도를 가지며 충돌이 최소화된 공유메모리 버퍼, Warp 를 고려한 병합된 메모리 접근방법을 바탕으로 병렬화 하였다. 그 결과, 같은 방식의 순차실행 알고리즘 대비 최소 약 34 배에서 최대 약 76 배의 속도 개선과 30dB 내외의 PSNR 을 갖는 양 방향성 필터를 구현할 수 있었다.
https://doi.org/10.3745/PKIPS.y2011m11a.369 인용 PDF

검색결과 252건 처리시간 0.032초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)