• 제목/요약/키워드: Graphics processing unit

검색결과 191건 처리시간 0.032초

HW 가속 기반 웹 고속화 기술동향 (Trends of Hardware Acceleration Technology in Wed Browser)

  • 이재호;조현우;김도형;이형석;윤석진;류철;조창식
    • 전자통신동향분석
    • /
    • 제31권4호
    • /
    • pp.65-76
    • /
    • 2016
  • 특정 제조사의 단말 또는 운영체제에 의존성이 없는 플랫폼 독립적인 웹은 높은 이식성, 소프트웨어의 재활용, 개발 생산성, 풍부한 개발자 존재, 유지 보수 면에서 장점을 가지나, 화려한 UI/UX를 제공하는 네이티브 응용에 비해 낮은 성능으로 웹 기반의 응용 개발 및 보급이 크게 활성화되지 못했다. 한편 데스크톱은 물론 모바일 단말의 멀티코어 기반 Graphic Processing Unit(GPU), CPU 탑재 등 HW 고사양화와 웹 응용에서도 HW 가속 기능을 활용할 수 있는 표준 제공으로 성능 제약을 극복할 수 있게 되었다. 본고에서는 GPU 발전동향을 살펴보고, 고속 렌더링 및 병렬 연산처리를 요구하는 웹 응용이 GPU기반 HW 가속 기능을 활용할 수 있는 크로노스 그룹의 그래픽 가속(Web Graphics Library: WebGL) 및 컴퓨팅(Web Computing Language: WebCL) 지원 표준 규격을 정리한다. 또한, 최근 차세대 GPU Application Programming Interface(API)로 발표된 Vulkan에 대해 알아보고, 웹 고속화 기술에 적용 가능성에 대해 전망한다.

  • PDF

GPGPU를 이용한 파데브-레브리어 알고리즘 구현 및 성능 분석 (Implementation and Performance Evaluation of the Faddev-Leverrier Algorithm using GPGPU)

  • 박용훈;김철홍;김종면
    • 대한임베디드공학회논문지
    • /
    • 제8권3호
    • /
    • pp.171-178
    • /
    • 2013
  • In this paper, we implement the Faddev-Leverier algorithm using GPGPU (General-Purpose Graphics Processing Unit) to accelerate singular value decomposition. In addition, we compare the performance of the algorithm using CPU and CPU plus GPGPU for eleven ${\times}n$ matrix sizes in order to decompose singular values, where =4, 8, 16, 32, 64, 128, 256, 512, 1,024, 2,048, and 4,096. Experimental results indicate that CPU achieves better performance than CPU plus GPGPU for $n{\leq}64$ because of a large number of read and write operations between CPU and GPGPU. However, CPU plus GPGPU outperforms CPU exponentially in the execution time for $n{\geq}64$.

Accelerating the Retinex Algorithm with CUDA

  • Seo, Hyo-Seok;Kwon, Oh-Young
    • Journal of information and communication convergence engineering
    • /
    • 제8권3호
    • /
    • pp.323-327
    • /
    • 2010
  • Recently, the television market trend is change to HD television and the need of the study on HD image enhancement is increased rapidly. To enhancement of image quality, the retinex algorithm is commonly used. That's why we studied how to accelerate the retinex algorithm with CUDA on GPGPU (general purpose graphics processing unit). Calculating average part in retinex algorithm is similar to pyramidal calculation. We parallelize this recursive pyramidal average calculating for all layers, map the average data into the 2D plane and reduce the calculating time dramatically. Sequential C code takes 8948ms to get the average values for all layers in $1024{\times}1024$ image, but proposed method takes only only about 0.9ms for the same image. We are going to study about the real-time HD video rendering and image enhancement.

스마트폰에서의 영상처리를 위한 GPU 활용

  • 박인규;최호열
    • 정보와 통신
    • /
    • 제29권4호
    • /
    • pp.46-51
    • /
    • 2012
  • 본 기고에서는 최근 스마트폰에서 요구되는 다양한 멀티미디어 어플리케이션을 embedded GPU(Graphics Processing Unit)를 이용하여 고속 병렬처리하기 위한 GPGPU (General-Purpose Computing on GPU) 기술 및 영상처리 분야의 응용 사례를 소개한다. 일반적인 데스크탑 컴퓨팅 환경과 달리 제약사항이 많은 embedded 환경에서의 GPGPU 응용 기술은 아직 초기단계이다. 그러나 급격히 발전하는 embedded GPU IP와 OpenCL과 같은 API의 등장으로 embedded GPU를 이용한 고속 병렬처리 환경이 수 년 이내에 일반화 될 것이다. 본 기고에서는 그 가능성을 점검하기 위하여 embedded GPU에서의 영상처리를 위한 최신 하드웨어와 소프트웨어 환경의 발전 동향을 소개한다. 더불어 최신 스마트폰에서의 GPGPU기술을 사용한 영상처리 사례와 영상처리 알고리즘의 GPGPU 알고리즘 구현시 고려해야 할 주요 사항을 정리한다.

Multidemia Communications System on the Ingernet

  • Kim, Hyun-Joon;Lee, Huen-Joo
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1998년도 Proceedings of International Workshop on Advanced Image Technology
    • /
    • pp.85-91
    • /
    • 1998
  • Many of the newest network suers are gaining their fist network experience as users of the Internet. Because of the universal nature of this exciting new experience, millions of new users are driving the demand for increasingly multimedia oriented applications, especially in communication area. Since the communication via the Internet can use various media forms including audio, video and graphics, it can e very efficient communication system on the Internet, which allows Internet users to communicate, collaborate, and associate with others. Webber provides various communication services, like ACS(Audio Conference System), VCS(Video Conference System) and Virtual Space, in an integrated environment. Webber consists of Service-PUBs(Processing Unit Plug-in), which process each service, and Framework, which manages these PUPs. PUP is so highly independent of each other that it's easy to add, maintain, delete services and also optimally configure the system to user's terminal performance or network status.

  • PDF

Accelerating Molecular Dynamics Simulation Using Graphics Processing Unit

  • Myung, Hun-Joo;Sakamaki, Ryuji;Oh, Kwang-Jin;Narumi, Tetsu;Yasuoka, Kenji;Lee, Sik
    • Bulletin of the Korean Chemical Society
    • /
    • 제31권12호
    • /
    • pp.3639-3643
    • /
    • 2010
  • We have developed CUDA-enabled version of a general purpose molecular dynamics simulation code for GPU. Implementation details including parallelization scheme and performance optimization are described. Here we have focused on the non-bonded force calculation because it is most time consuming part in molecular dynamics simulation. Timing results using CUDA-enabled and CPU versions were obtained and compared for a biomolecular system containing 23558 atoms. CUDA-enabled versions were found to be faster than CPU version. This suggests that GPU could be a useful hardware for molecular dynamics simulation.

적응적 타일크기를 이용한 모자이크 (Mosaics using Adaptive Tile Size)

  • 한명훈;윤경현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (B)
    • /
    • pp.167-171
    • /
    • 2007
  • 본 논문에서는 타일의 크기를 적응적으로 결정하는 모자이크 방법을 제안한다. 우리는 이미지에서 에지(Edge)를 추출한 뒤, 결과 영상이 이 에지 정보를 보존하고, 각 타일들이 이 에지를 따르도록 한다. 에지 정보를 보존 하기 위하여 무게중심 보로노이 다이어그램(CVD: Centroidal Voronoi Diagram)을 계산할때 에지 회피기법을 적용하며, 에지를 따르는 타일을 생성하기 위하여 에지를 따르는 방향과 맨해튼 거리(manhattan distance)가 적용된 무게중심 보로노이 다이어그램을 사용한다. 이때, 우리는 그래픽 처리 장치(GPU: Graphics Processing Unit)를 이용하여 방향맵이나 보로노이 다이어그램을 더욱 빠르게 구할 수 있다. 우리는 타일의 크기를 각 보로노이 영역의 넓이에 비례하게 정함으로써, 기존의 모자이크 방법들이 해결하고자 했던 타일의 겹침 문제와 타일간의 빈 공간 문제를 개선하였다.

  • PDF

듀얼 페이즈 구조의 멀티 코어 GP-GPU를 이용한 픽셀 셰이딩 (The Pixel Shading on Multi Core GP-GPU with Dual Phase Architecture)

  • 김준서;박태룡;이광엽
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 추계학술대회
    • /
    • pp.339-342
    • /
    • 2010
  • 최근 프로세서가 클럭 향상의 한계에 부딪힘에 따라, 프로세서의 성능을 향상시키기 위해 멀티 코어 기반의 병렬처리를 이용한 방법들이 제안 되고 있다. 본 논문은 여러개의 연산기를 한 명령어 사이클에 동시에 사용할 수 있는 MIMD(Multiple Instruction, Multiple Data) 구조를 가지며, Scratch Counter를 이용해 멀티 코어와 멀티 스레드의 작업을 할당하는 구조의 GP-GPU(General Purpose - Graphics Processing Unit)를 활용해 멀티 코어, 멀티 스레드 환경에서의 효율적인 픽셀 셰이딩 방법을 설계 하였다. 선형 안개 픽셀 셰이딩의 경우 싱글코어에서 18.3 FPS이며 4개의 멀티코어 GP-GPU에서는 4배가 증가한 73.2 FPS 결과를 얻었다.

  • PDF

GPU 기반의 최적화된 BVH와 R-Triangle을 이용한 옷감 시뮬레이션에서의 빠른 자기충돌 처리 (Fast Self-Collision Handling in Cloth Simulations Using GPU-based Optimized BVH and R-Triangle)

  • 문성혁;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.373-376
    • /
    • 2022
  • 본 논문에서는 삼각형 메쉬 기반에서 옷감 시뮬레이션(Cloth simulation)에서 계산양이 큰 자기충돌(Self-collision) 처리를 GPU기반으로 가속화시킬 수 있는 방법에 대해 소개한다. CUDA기반으로 병렬 최적화하기 위해 본 논문에서는 1)재귀적으로 계산하여 충돌판정을 하는 BVH(Bounding volume hierarchy) 트리를 GPU기반에서 효율적으로 빌드, 업데이트, 트리 순회하는 방법을 제안하고, 2)삼각형 메쉬 기반에서는 중복되는 프리미티브(Primitive) 충돌검사를 최소화하기 위해 R-Triangle기법을 GPU에서 최적화 시키는 방법을 소개한다. 결과적으로 본 논문에서 제안하는 기법은 GPU 환경에서 옷감 시뮬레이션의 자기충돌과 객체충돌 처리를 빠르고 효율적으로 처리할 수 있도록 하였고, 다양한 장면에서 실험한 결과 모든 결과에서 빠른 시뮬레이션 결과를 얻을 수 있었다.

  • PDF

GPU 최적화를 이용한 물리 기반 옷감과 액체의 상호작용 (Physics-Based Cloth and Liquid Interaction using GPU Optimization)

  • 문성혁;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.395-398
    • /
    • 2023
  • 본 논문에서는 물리 기반 옷감 시뮬레이션과 SPH(Smoothed particle hydrodynamics) 기반의 유체 시뮬레이션 간의 상호작용에서 표현되는 다양한 물리적 효과를 GPU 기반으로 빠르게 표현할 수 있는 프레임워크를 제안한다. 기존 기법과는 다르게 수치적 안정성을 개선하기 위해 CCD(Continuous collision detection)를 활용하였으며, 모든 연산이 GPU에서 동작하기 때문에 매우 빠르게 옷감과 유체의 상호작용 장면인 다공성 재질, 기공 흐름, 흡수, 방사, 확산을 모델링할 수 있다.

  • PDF