• 제목/요약/키워드: WebGPU

검색결과 19건 처리시간 0.028초

웹GPU와 웹어셈블리를 이용한 이미지 프로세싱 가속 (Image Processing Acceleration using WebGPU and WebAssembly)

  • 남현우;이명호;박능수
    • 정보처리학회 논문지
    • /
    • 제13권10호
    • /
    • pp.574-578
    • /
    • 2024
  • 웹 브라우저 기반 고성능 이미지 프로세싱을 위해 JavaScript 언어는 속도가 느리고 GPU를 직접 활용할 수 없어서, 웹 플러그인 기술이나 서버기반 처리 방식이 사용되었다. 하지만 최신 웹 브라우저에서 더 이상 플러그인 기술들이 지원되지 않고, 서버 처리 방식은 사용자가 늘어날수록 운영 비용이 증가하는 문제가 발생하였다. 따라서 본 논문에서는 플러그인이나 서버 기반이 아닌 최신 웹 표준 기술인 WASM과 WebGPU를 활용하여 클라이언트 환경에서 고성능 이미지 프로세싱 알고리즘을 구현하였다. 최종 실험 결과 기존 Javascript에 비해 CPU와 GPU를 동시 활용하는 WASM+ WebGPU 기반의 코드에서 최대 10배 이상 실행 성능이 개선되었다.

WebCL 기반 애플리케이션의 성능 평가를 위한 프로파일러 설계 및 구현 (Profiler Design for Evaluating Performance of WebCL Applications)

  • 김철원;조현중
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권8호
    • /
    • pp.239-244
    • /
    • 2015
  • 자바스크립트 상에서 높은 연산량을 처리하기 위해 제안된 WebCL은 불특정 클라이언트 환경에서 실행되므로 개별 클라이언트에서 애플리케이션의 성능 평가 작업이 중요하다. 현재 다양한 프로파일러들이 서비스 되고 있지만 WebCL을 위한 프로파일러는 아직 개발되어있지 않다. 본 논문에서는 웹 이기종 병렬컴퓨팅 언어인 WebCL 기반으로 구현된 애플리케이션의 성능 평가 및 GPU 상태 정보를 모니터링 하기 위한 프로파일러를 설계 및 구현하여 소개한다. 본 프로파일러를 통하여 사용자는 WebCL 기반 애플리케이션의 수행시간 및 메모리 읽기/쓰기 시간을 알 수 있고, GPU 디바이스의 소비 전력, 현재 온도, 클락 속도 등 현재 상태를 실시간 모니터링할 수 있다.

Performance Improvement of Web Service Based on GPGPU and Task Queue

  • Kim, Changsu;Kim, Kyunghwan;Jung, Hoekyung
    • Journal of information and communication convergence engineering
    • /
    • 제19권4호
    • /
    • pp.257-262
    • /
    • 2021
  • Providing web services to users has become expensive in recent times. For better web services, a web server is provided with high-performance technology. To achieve great web service experiences, tools such as general-purpose graphics processing units (GPGPUs), artificial intelligence, high-performance computing, and three-dimensional simulation are widely used. However, graphics processing units (GPUs) are used in high-speed operations and have limited general applications. In this study, we developed a task queue in a GPU to improve the performance of a web service using a multiprocessor and studied how to receive and process user requests in bulk. We propose the use of a GPGPU-based task queue to process user requests more than GPGPU based a central processing unit thread, and to process more GPU threads on task queue at about 136% to 233%, and proved that the proposed method is effective for web service.

HW 가속 기반 웹 고속화 기술동향 (Trends of Hardware Acceleration Technology in Wed Browser)

  • 이재호;조현우;김도형;이형석;윤석진;류철;조창식
    • 전자통신동향분석
    • /
    • 제31권4호
    • /
    • pp.65-76
    • /
    • 2016
  • 특정 제조사의 단말 또는 운영체제에 의존성이 없는 플랫폼 독립적인 웹은 높은 이식성, 소프트웨어의 재활용, 개발 생산성, 풍부한 개발자 존재, 유지 보수 면에서 장점을 가지나, 화려한 UI/UX를 제공하는 네이티브 응용에 비해 낮은 성능으로 웹 기반의 응용 개발 및 보급이 크게 활성화되지 못했다. 한편 데스크톱은 물론 모바일 단말의 멀티코어 기반 Graphic Processing Unit(GPU), CPU 탑재 등 HW 고사양화와 웹 응용에서도 HW 가속 기능을 활용할 수 있는 표준 제공으로 성능 제약을 극복할 수 있게 되었다. 본고에서는 GPU 발전동향을 살펴보고, 고속 렌더링 및 병렬 연산처리를 요구하는 웹 응용이 GPU기반 HW 가속 기능을 활용할 수 있는 크로노스 그룹의 그래픽 가속(Web Graphics Library: WebGL) 및 컴퓨팅(Web Computing Language: WebCL) 지원 표준 규격을 정리한다. 또한, 최근 차세대 GPU Application Programming Interface(API)로 발표된 Vulkan에 대해 알아보고, 웹 고속화 기술에 적용 가능성에 대해 전망한다.

  • PDF

WASM을 활용한 디바이스 및 엣지 클라우드 기반 Federated Learning의 최적화 방안 (Optimization Strategies for Federated Learning Using WASM on Device and Edge Cloud)

  • 최종석
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권4호
    • /
    • pp.213-220
    • /
    • 2024
  • 본 논문에서는 WebAssembly(WASM)를 활용하여 디바이스와 엣지 클라우드 간의 Federated Learning을 수행하는 최적화 전략을 제안한다. 제안된 전략은 일부 학습을 디바이스에서 수행하고, 나머지 학습을 엣지 클라우드에서 수행하여 효율성을 극대화하는 것을 목표로 한다. 특히, GPU 메모리 세그먼트 간 데이터 이동과 연산 작업의 중첩을 최적화하여 전체 학습 시간을 줄이고 GPU 사용률을 향상시키는 방법을 수학적으로 설명하고 평가한다. 다양한 실험 시나리오를 통해 비동기 데이터 전송과 연산 중첩이 학습 시간을 단축하고 GPU 사용률을 향상시키며, 모델 정확도를 증가시킴을 확인하였다. 모든 최적화 기법을 적용한 시나리오에서 학습 시간이 47% 단축되었고, GPU 사용률은 91.2%로 향상 되었으며, 모델 정확도는 89.5%로 증가함을 확인하여 비동기 데이터 전송과 연산 중첩이 데이터 전송을 기다리는 GPU 유휴 시간을 줄이고, 병목 현상을 완화할 수 있음을 확인하였다. 본 연구는 향후 Federated Learning 시스템의 성능 최적화에 기여할 수 있을 것으로 사료된다.

멀티 코어와 GPU가 차세대 웹 브라우저의 성능에 미치는 영향 분석 (Performance Analysis on Next-Generation Web Browser at Multicore CPU and GPU)

  • 홍경환;김대호;신동군
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.355-357
    • /
    • 2012
  • 차세대 웹 브라우저는 멀티 쓰레드(multi-thread) 구조로 되어 있으며 HTML5와 WebGL을 기반으로 화려한 그래픽을 구사하기 때문에, 멀티 코어(multi-core) CPU와 GPU의 성능이 웹 브라우저의 성능에 큰 영향을 미치고 있다. 본 논문은 오픈 소스 웹 브라우저인 크로미엄(Chromium) 상에서 프로세서의 성능 변화에 따라 웹 브라우저에서 실행되는 웹 어플리케이션의 성능이 어떤 양상으로 변화하는지와 이 변화에 웹 브라우저의 각 동작이 얼마나 기여하는지를 비교 분석하였다. 그 결과 CPU 코어의 수가 렌더링 성능에 큰 영향을 주며, GPU의 성능은 WebGL의 성능을 크게 좌우함을 알 수 있었다.

국방정보시스템 성능향상을 위한 효율적인 GPU적용방안 연구 (The study on the Efficient methodology to apply the GPU for military information system improvement)

  • 고장혁;이동호
    • 디지털산업정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.27-35
    • /
    • 2015
  • Increasing the number of GPU (Graphic Processor Unit) cores, the studies on High Performance Computing Platform using GPU have actively been made in recent. This trend has led to the development of GPGPU (General Purpose GPU) and CUDA (Compute Unified Device Architecture) Framework. In this paper, we explain the many benefits of the GPU based system, and propose the ICIDF(Identify Compute-Intensive Data set and Function) methodology to apply GPU technology to legacy military information system for performance improvement. To demonstrate the efficiency of this methodology, we applied this method to AES CPU based program obtained from the Internet web site. Simply changing the data structure made improved the performance of AES program. As a result, the performance of AES based GPU program is improved gradually up to 10 times. Depending on the developer's ability, additional performance improvement can be expected. The problem to be solved is heat issue, but this problem has been much improved by the development of the cooling technology.

CUDA 기반 GPU에서 효율적인 Power Method의 구현 (Implementation of Efficient Power Method on CUDA GPU)

  • 김정환;김진수
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.9-16
    • /
    • 2011
  • GPU는 저렴한 비용으로 쉽게 대규모 데이터 병렬성을 활용할 수 있는 장점을 갖고 있어 많은 고성능 컴퓨팅 응용 분야에서 사용되고 있는 추세다. 행렬의 고유벡터를 구하는 power method는 웹 페이지의 중요도를 계산하는 PageRank 알고리즘 등 여러 응용 분야에서 활용되고 있는 방법으로써, 본 연구에서는 power method를 GPU에서 병렬화하여 구현하였으며, 성능을 최적화하기 위한 개선 방법을 제시하였다. Power method는 행렬과 벡터의 곱셈 연산이 반복적으로 수행되며 GPU에서 쉽게 병렬화가 가능하다. 그러나, 고유벡터의 수렴 여부 판단을 위한 연산 등의 작업과 다음 곱셈을 위한 벡터 크기의 조정 등의 작업이 부가적으로 필요하며, 이러한 작업은 GPU 내의 커널 코드를 여러 차례 호출하고 불필요한 데이터 이동을 유발하는 문제점이 있다. 본 연구에서는 커널 호출 회수를 줄이고 스레드 배치를 최적함과 동시에 수렴 여부 판단을 위한 연산을 최적함으로써 power method의 성능을 향상시켰다.

High-Performance Korean Morphological Analyzer Using the MapReduce Framework on the GPU

  • Cho, Shi-Won;Lee, Dong-Wook
    • Journal of Electrical Engineering and Technology
    • /
    • 제6권4호
    • /
    • pp.573-579
    • /
    • 2011
  • To meet the scalability and performance requirements of data analyses, which often involve voluminous data, efficient parallel or concurrent algorithms and frameworks are essential. We present a high-performance Korean morphological analyzer which employs the MapReduce framework on the graphics processing unit (GPU). MapReduce is a programming framework introduced by Google to aid the development of web search applications on a large number of central processing units (CPUs). GPUs are designed as a special-purpose co-processor. Their programming interfaces are typically formulated for graphics applications. Compared to CPUs, GPUs have greater computation power and memory bandwidth; however, GPUs are more difficult to program because of the design of their architectures. The performance of the Korean morphological analyzer using the MapReduce framework on the GPU is evaluated in comparison with the CPU-based model. The proposed Korean Morphological analyzer shows promising scalable performance on distributed computing with the GPU.

다중 웹 고속화 기술 지원을 위한 실행파일 포맷 설계 (Executable file format design for multi-web high-speed technology support)

  • 남현우;박능수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.769-770
    • /
    • 2023
  • 최근 고성능 웹 애플리케이션 개발을 위한 asm.js. WebAssembly, WebGL, WebGPU와 같은 여러 웹 고속화 기술들이 발표되며 확장되고 있다. 하지만 각 기술들은 개별적으로만 적용 가능하다는 한계점이 있었다. 따라서 본 논문에서는 웹 브라우저 환경에서 최적화된 실행 성능을 기대할 수 있는 다중 웹 고속화 기술들을 통합 한 실행파일 포맷 및 패키징 방안에 대해 제안하고자 한다.