• 제목/요약/키워드: OpenCL

검색결과 281건 처리시간 0.028초

OpenCL을 이용한 GPGPU 기반 지문개선 알고리즘 가속화 (Accelerating Fingerprint Enhancement Algorithm on GPGPU using OpenCL)

  • 김대희;박능수
    • 전기학회논문지
    • /
    • 제65권4호
    • /
    • pp.666-672
    • /
    • 2016
  • Recently the fingerprint is widely used as one of biometrics to improve the security of financial mobile applications, because of its user convenience and high recognition rate. However, in order to apply fingerprint algorithms to finance and security applications, the recognition rate and processing speed of the fingerprint algorithms have to be improved further. In this paper, we propose the parallel fingerprint enhancement algorithm on general-purpose computing on graphics processing unit (GPGPU) using OpenCL. We discuss the analysis of the parallelism in the fingerprint algorithm as well as the exploration of optimization parameters of the parallel fingerprint algorithm to improve the performance. The experimental results showed that the execution of parallel fingerprint enhancement algorithm on GPGPUs was accelerated from 29.4 upto 69.2 times compared with the execution of the original one on the host CPUs.

OpenCL을 이용한 지문개선 가속화 (Fingerprint enhancement acceleration using OpenCL)

  • 고성학;이철;박능수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.115-117
    • /
    • 2014
  • 최근 OpenCL, CUDA와 같은 이종 병렬 컴퓨팅 프레임워크가 등장함에 따라, 많은 연산량을 요구하는 알고리즘에 대한 이종 병렬 처리 연구가 늘고 있다. 본 논문에서는 연산량이 많은 지문개선(fingerprint enhancement) 알고리즘을 OpenCL을 이용해 병렬화하고 최적화하여 연산 시간을 단축하고자 한다. 이를 위하여 2차원 FFT 및 필터링 알고리즘을 병렬화하고, Loop Unrolling 및 메모리 접근 최적화 등의 기법을 적용하였다. 실험을 통하여 CPU의 순차적 처리기법과 비교하여 개선된 가속화 기법을 이용한 지문개선 알고리즘이 최대 25배의 성능이 향상하였음을 확인하였다.

스마트 시설환경 실시간 시뮬레이션을 위한 하드웨어 가속 기술 분석 (A Benchmark of Hardware Acceleration Technology for Real-time Simulation in Smart Farm (CUDA vs OpenCL))

  • 민재기;이동훈
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.160-160
    • /
    • 2017
  • 자동화 기술을 통한 한국형 스마트팜의 발전이 비약적으로 이루어지고 있는 가운데 무인화를 위한 지능적인 스마트 시설환경 관찰 및 분석에 대한 요구가 점점 증가 하고 있다. 스마트 시설환경에서 취득 가능한 시계열 데이터는 온도, 습도, 조도, CO2, 토양 수분, 환기량 등 다양하다. 시스템의 경계가 명확함에도 해당 속성의 특성상 타임도메인과 공간도메인 상에서 정확한 추정 또는 예측이 난해하다. 시설 환경에 접목이 증가하고 있는 지능형 관리 기술 구현을 위해선 시계열 공간 데이터에 대한 신속하고 정확한 정량화 기술이 필수적이라 할 수 있다. 이러한 기술적인 요구사항을 해결하고자 시도되는 다양한 방법 중에서 공간 분해능 향상을 위한 다지점 계측 메트릭스를 실험적으로 구성하였다. $50m{\times}100m$의 단면적인 연동 딸기 온실을 대상으로 $3{\times}3{\times}3$의 3차원 환경 인자 계측 매트릭스를 설치하였다. 1 Hz의 주기로 4가지 환경인자(온도, 습도, 조도, CO2)를 계측하였으며, 계측 하는 시점과 동시에 병렬적으로 공간통계법을 이용하여 미지의 지점에 대한 환경 인자들을 실시간으로 추정하였다. 선행적으로 50 cm 공간 분해능에 대응하기 위하여 Kriging interpolation법을 횡단면에 대하여 분석한 후 다시 종단면에 대하여 분석하였다. 3 Ghz에 해당하는 연산 능력을 보유한 컴퓨터에서 1초 동안 획득한 데이터에 대한 분석을 마치는데 소요되는 시간이 15초 내외로 나타났다. 이는 해당 알고리즘의 매우 높은 시간 복잡도(Order of $O=O^3$)에 기인하는 것으로 다양한 시설 환경의 관리 방법론에 적절히 대응하기에 한계가 있다 할 수 있다. 실시간으로 시간 복잡도가 높은 연산을 수행하기 위한 기술적인 과제를 해결하고자, 근래에 관심이 증가하고 있는 NVIDIA 사에서 제공하는 CUDA 엔진과 Apple사의 제안을 시작으로 하여 공개 소프트웨어 개발 컨소시엄인 크로노스 그룹에서 제공하는 OpenCL 엔진을 비교 분석하였다. CUDA 엔진은 GPU(Graphics Processing Unit)에서 정보 분석 프로그램의 연산 집약적인 부분만을 담당하여 신속한 결과를 산출할 수 있는 라이브러리이며 해당 하드웨어를 구비하였을 때 사용이 가능하다. 반면, OpenCL은 CUDA 엔진이 특정 하드웨어에서 구동이 되는 한계를 극복하고자 하드웨어에 비의존적인 라이브러리를 제공하는 것이 다르며 클러스터링 기술과 연계를 통해 낮은 하드웨어 성능으로 인한 단점을 극복하고자 하였다. 본 연구에서는 CUDA 8.0(https://developer.nvidia.com/cuda-downloads)버전과 Pascal Titan X(NVIDIA, CA, USA)를 사용한 방법과 OpenCL 1.2(https://www.khronos.org/opencl/)버전과 Samsung Exynos5422 칩을 장착한 ODROID-XU4(Hardkernel, AnYang, Korea)를 사용한 방법을 비교 분석하였다. 50 cm의 공간 분해능에 대응하기 위한 4차원 행렬($100{\times}200{\times}5{\times}4$)에 대하여 정수 지수화를 위한 Quantization을 거쳐 CUDA 엔진과 OpenCL 엔진을 적용한 비교한 결과, CUDA 엔진은 1초 내외, OpenCL 엔진의 경우 5초 내외의 연산 속도를 보였다. CUDA 엔진의 경우 비용측면에서 약 10배, 전력 소모 측면에서 20배 이상 소요되었다. 따라서 우선적으로 OpenCL 엔진 기반 하드웨어 가속 기술 최적화 연구를 통해 스마트 시설환경 실시간 시뮬레이션 기술 도입을 위한 기술적 과제를 풀어갈 것이다.

  • PDF

OpenCL을 이용한 JPEG2000 4K 초고화질 영상처리의 병렬고속화 구현 (A Parallel Implementation of JPEG2000 4K Ultra High Definition Image using OpenCL)

  • 박대승;김정길
    • 한국위성정보통신학회논문지
    • /
    • 제10권1호
    • /
    • pp.1-5
    • /
    • 2015
  • 멀티미디어 기술의 급속한 발전과 사용자의 대형 화면에 대한 선호도가 높아지는 가운데 새로운 영상 압축 기술인 HEVC(High Efficiency Video Coding) 고화질 영상 압축 표준을 탄생시켰으며, 그 결과 기존의 HD급 영상보다 4배 이상, 16배까지 선명한 초고화질 UHD(Ultra High Definition) 영상 서비스가 새롭게 주목받고 있다. 또한 JPEG 2000 압축도 기존 처리되던 픽셀 이미지를 넘어 초고화질 해상도 이미지(4K : $3,840{\times}2,160$ 또는 8K : $7680{\times}4320$)를 처리 지원을 하고 있다. 따라서 초고화질 이미지의 획득 및 저장을 위해서는 고속의 처리 기술이 필요하다. 이에 본 논문은 초고화질 해상도 이미지의 고속 처리를 위한 병렬처리 기술에 대한 연구를 위하여, JPEG 2000의 처리 과정을 살펴보고 전처리 단계인 색공간 변환 알고리즘 적용을 위하여 GPU환경에서 병렬 컴퓨팅을 통해 처리속도를 향상시키는 방법을 제안한다. 병렬화한 알고리즘의 구현은 OpenCL(Open Computing Language)을 이용하였다. 실험 결과 사용자 정의 쓰레드 기반 고속 처리와 비교하여 초고화질 해상도 이미지(UHD 4K : $3,840{\times}2,160$)를 기준으로 최대 5배의 성능 향상의 결과를 보여주었다.

벤토나이트 첨가시 불량폐기물매립지의 침출수에 미치는 화학적 특성에 관한 연구 (A Study on the Chemical Characteristics for the Leachate of Open(Illegal) Dumping Waste Landfill Mixing with Bentonite)

  • 이재영;노회정
    • 한국토양환경학회지
    • /
    • 제4권1호
    • /
    • pp.75-83
    • /
    • 1999
  • 본 연구의 목적은 불량 매립된 쓰레기로부터 발생되는 침출수의 화학적 특성을 조사하는데 있다. 불법 투기된 쓰레기를 각각의 모형 매립조 속에 벤토나이트를 중량비로 0. 5. 10. 15%씩 혼합한 뒤 침출수의 CODcr, ${NO_3}^-$, ${SO_4}^{2-}$, $Cl^-$, 중금속을 모니터링 하였다. 그 결과, 모든 Lysimer에서 CODcr 농도 감소가 보여졌으며, 중금속은 거의 검출되지 않았다. 벤토나이트 혼합율의 증가에 따라 ${NO_3}^-$, ${SO_4}^{2-}$, $Cl^-$, 의 제거율이 증가하였다.

  • PDF

GCN 아키텍쳐 상에서의 OpenCL을 이용한 GPGPU 성능향상 기법 연구 (A Study on GPGPU Performance Improvement Technique on GCN Architecture Using OpenCL API)

  • 우동희;김윤호
    • 한국전자거래학회지
    • /
    • 제23권1호
    • /
    • pp.37-45
    • /
    • 2018
  • 현재 프로그램이 운용되는 시스템은 기존의 싱글코어 및 멀티코어 환경을 넘어서 매니코어, 부가 프로세스 및 이기종 환경까지 그 영역이 확장되고 있는 중이다. 하지만, 기존 연구의 경우 NVIDIA 벤더에서 나온 아키텍쳐 및 CUDA로의 병렬화가 주로 이루어졌고 AMD에서 나온 범용 GPU 아키텍쳐인 GCN 아키텍쳐에 대한 성능향상에 관한 연구는 제한적으로 이루어졌다. 이런 점을 고려해 본 논문에서는 GCN 아키텍쳐의 GPGPU 환경인 OpenCL 내에서의 성능향상 기법에 대해 연구하고 실질적인 성능향상을 보였다. 구체적으로, 행렬 곱셈과 컨볼루션을 적용한 GPGPU 프로그램을 본 논문에서 제시한 성능향상 기법을 통해 최대 30% 이상의 실행시간을 감소시켰으며, 커널 이용률 또한 40% 이상 높였다.

OpenCL 기반 근사곡면 렌즈어레이 시스템의 설계 및 구현 (Design and Implementation of an Approximate Surface Lens Array System based on OpenCL)

  • 김도형;송민호;정지성;권기철;김남;김경아;류관희
    • 한국콘텐츠학회논문지
    • /
    • 제14권10호
    • /
    • pp.1-9
    • /
    • 2014
  • 무안경식 3D 디스플레이를 위해 사용되는 집적영상은 일반적으로 평면 렌즈어레이로부터 생성되고 있으나, 좁은 시야각으로 인해 관찰자에게 넓은 시야영역을 제공하지 못한다. 이러한 단점을 보완하기 위해 곡면 렌즈어레이가 제안되었으며, 기술적, 비용적 한계로 인해 이상적인 곡면 렌즈어레이보다는 여러 개의 평면렌즈들을 곡면 유형으로 만든 근사곡면(Approximate Surface) 렌즈어레이가 사용된다. 본 논문에서는 반경 100mm의 구에 $20{\times}8$개의 사각형 평면 렌즈들을 배치하여 근사곡면 렌즈어레이를 구성하였으며, 그 결과 약 2배의 시야각을 넓힐 수 있었다. 특히, 기존연구에서는 집적영상을 수작업으로 만들어내고 있었으나, 본 논문에서는 집적영상을 실시간으로 생성하는 OpenCL GPU 병렬 처리 알고리즘을 제안한다. 그 결과, 다양한 3D 볼륨데이터에 대하여 $15{\times}15$ 크기의 근사곡면 렌즈어레이로부터 집적영상을 12-20 frame/sec 속도로 생성할 수 있었다.

OpenCL 기반의 그래디언트 라돈변환을 이용한 만화영상의 정규화 (Comic Image Normalization using the gradient Radon Transform based on OpenCL implementation)

  • 김동근;전혁준;황치정
    • 정보처리학회논문지B
    • /
    • 제18B권4호
    • /
    • pp.221-230
    • /
    • 2011
  • 디지털 만화영상은 인터넷에서 매우 인기 있는 컨텐츠이다. 일반적으로 디지털 만화영상은 디지털 스캐너에 의해 스캔되며, 후처리를 하지 않으면 서로 다른 크기와 기울어짐을 가질 수 있으며, 경계부분에 내용이외의 여백이 있을 수 있다. 기울어짐과 여백이 없이 영상의 내용의 크기를 정규화하는 것은 내용기반 만화영상 검색과 같은 응용에서 매우 중요한 단계이다. 본 논문에서는 그래디언트 라돈변환을 사용하여 검출한 선분을 이용하여 만화영상의 박스 프레임을 검출하는 방법을 제안한다. 만화영상에서 박스프레임은 여백이 없는 만화영상 내용으로 이루어진 최대 사각영역이다. 만화영상의 크기를 정규화하고, 기울어짐을 없애기 위하여 박스 프레임을 사용하고, 선분 검출 속도를 높이기 위하여 OpenCL로 구현하였다. 제안 방법이 만화영상에서 효과적으로 박스 프레임을 검출함을 실험으로 보였다.

비정상 ECG 진단의 에너지 효율적인 재구성 가능한 가속을 위한 OpenCL 기반 FPGA-GPU 혼합 계층 적응 처리 알고리즘 할당 (Adaptive Processing Algorithm Allocation on OpenCL-based FPGA-GPU Hybrid Layer for Energy-Efficient Reconfigurable Acceleration of Abnormal ECG Diagnosis)

  • 이동규;이승민;박대진
    • 한국정보통신학회논문지
    • /
    • 제25권10호
    • /
    • pp.1279-1286
    • /
    • 2021
  • Electrocardiogram (ECG) 신호는 심장의 이상을 조기에 진단하기 위한 좋은 지표이다. ECG 신호는 사람마다 기준이 되는 정상 신호의 형태가 다르고, 진단에 많은 데이터가 필요하다. 본 논문에서는 ECG 신호 진단을 효율적으로 가속하기 위한 OpenCL을 기반 FPGA-GPU 혼합 계층 적응형 플랫폼을 제안한다. 플랫폼에서 MIT-BIH 부정맥 신호데이터의 19870개 ECG 신호를 진단한 결과 FPGA 가속기는 진단 시간이 1.15s로 소프트웨어로 실행했을 때보다 89.94% 감소하였고, 전력 소모는 84.0% 감소하였다. GPU 가속기는 실행 시간이 소프트웨어 대비 83.56% 감소한 1.87s였으며, 전력 소모는 62.3% 감소하였다. 제안하는 FPGA-GPU 혼합 플랫폼은 FPGA 가속기보다 진단 속도가 느리지만 GPU를 이용하여 상황에 따라 유연한 알고리즘을 동작할 수 있다.

금속-공기전지의 Anode전극 반응에 관한 연구 (Study on the Anode Electrode Reaction in the Metal-Air Cell)

  • 김용혁
    • 한국전기전자재료학회논문지
    • /
    • 제23권12호
    • /
    • pp.1002-1006
    • /
    • 2010
  • In this study, magnesium (Mg), zinc (Zn) and aluminium (Al) as anode electrode and the solution of NaCl dissolved with 2~20 wt% as electrolytes were used for the metal-air cell. The open circuit voltage, short circuit current and I-V characteristics upon different kinds of anode electrode and electrolyte concentration were investigated. The open circuit voltage, initially about 1.45 V, rises to 1.6 V during the first 10 minutes indicating the necessity of an induction time to activate the catalyst on the air cathode. The short circuit current increases with an increased concentration of NaCl, causes an increase in the conductivity of the electrolyte solution, but the open circuit voltage did not under undergo influence of electrolyte. From NaCl 20 wt% electrolyte, the maximum output power of the magnesium electrode materials was measured with 177mW. It is found that the power characteristics of metal-air cell could be improved by using magnesium electrode materials in the NaCl electrolyte.