• 제목/요약/키워드: GPU distributed processing

검색결과 21건 처리시간 0.029초

성장 환경을 활용한 다수의 나무에 대한 사실적인 실시간 모델링 기법 (Realistic and Real-Time Modeling of Numerous Trees Using Growing Environment)

  • 김진모;조형제
    • 한국멀티미디어학회논문지
    • /
    • 제15권3호
    • /
    • pp.398-407
    • /
    • 2012
  • 본 연구에서는 넓은 지형에 분포하는 많은 수의 나무를 사실적이면서 효율적으로 표현하는 나무 모델 방법을 제안한다. 나무 가지의 재귀적 계층 구조와 싹으로부터 자기조직화를 통한 가지 생성 과정을 결합하여 단순화시킴으로써 보다 직관적이고 효율적으로 나무를 생성한다. 이러한 생성 과정은 사용자가 단계별 구조와 가지 길이, 분포, 방향과 같은 외형 조절을 인터랙티브하게 제어할 수 있도록 한다. 또한 많은 수의 나무를 동시에 제어하여 다양하게 성장시킬 수 있도록 하는 환경 적응형 모델을 설계하고 이를 효과적으로 처리하는 성장 환경 적용 방법을 제안한다. 여기에 넓은 지형위에 분포하는 복잡한 나무 모델의 실시간 시뮬레이션을 위해 GPU(Graphics Processing Unit)를 통한 렌더링 과정과 가지 표면의 연속적 세분화단계, 그리고 인스턴싱 기법을 도입한다. 제안한 나무 모델을 통해 넓은 지형에 다양한 나무를 사실적이고 효율적으로 표현할 수 있는지 여부를 시뮬레이션을 통해 확인한다.

고속 빅데이터 전송 기반의 오픈 분산 컴퓨팅 플랫폼 개발 및 연구 (Open Distributed Cloud Computing based on High-Speed Big Data Transfer)

  • 김기현;문정훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.38-41
    • /
    • 2021
  • 최근 빅데이터, 인공지능 키워드를 이용한 다양한 연구들이 진행되고 있으며, 인공지능 연구를 통해 자동화 자율화를 위한 연구들이 주를 이루고 있다. 인공지능 연구를 수행하기 위해서는 거대한 데이터를 빠르게 전송해야하며, 인공지능을 손쉽게 수행하기 위한 플랫폼이 필요하다. 하지만 많은 연구기관에서는 빅데이터 전송 속도의 한계가 존재하며, 인공지능 알고리즘 수행을 위한 플랫폼 또한 부족한 것이 현실이다. 이를 해결하기 위해 ScienceDMZ 기술을 활용하여 고속의 빅데이터 전송을 위한 인프라를 구축하고, 엣지 컴퓨팅 기반의 오픈 분산 컴퓨팅 플랫폼을 개발한다. 이 시스템을 통해 사용자들에게 빅데이터를 빠르게 전송하고 전송된 데이터를 이용하여 바로 인공지능 연구를 수행하여 결과를 도출할 수 있는 시스템을 구축하고자 한다. 이 시스템을 이용하여 GPU 분산 컴퓨팅을 수행하였을 때 성능과 GPU 병렬 컴퓨팅을 수행하였을 때의 결과를 비교하여 성능을 검증하고자 한다.

GPU를 활용한 분산 컴퓨팅 프레임워크 성능 개선 연구 (A Study on Performance Improvement of Distributed Computing Framework using GPU)

  • 송주영;공용준;심탁길;신의섭;성기진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.499-502
    • /
    • 2012
  • 빅 데이터 분석의 시대가 도래하면서 대용량 데이터의 특성과 계산 집약적 연산의 특성을 동시에 가지는 문제 해결에 대한 요구가 늘어나고 있다. 대용량 데이터 처리의 경우 각종 분산 파일 시스템과 분산/병렬 컴퓨팅 기술들이 이미 많이 사용되고 있으며, 계산 집약적 연산 처리의 경우에도 GPGPU 활용 기술의 발달로 보편화되는 추세에 있다. 하지만 대용량 데이터와 계산 집약적 연산 이 두 가지 특성을 모두 가지는 문제를 처리하기 위해서는 많은 제약 사항들을 해결해야 하는데, 본 논문에서는 이에 대한 대안으로 분산 컴퓨팅 프레임워크인 Hadoop MapReduce와 Nvidia의 GPU 병렬 컴퓨팅 아키텍처인 CUDA 흘 연동하는 방안을 제시하고, 이를 밀집행렬(dense matrix) 연산에 적용했을 때 얻을 수 있는 성능 개선 효과에 대해 소개하고자 한다.

Real-time multi-GPU-based 8KVR stitching and streaming on 5G MEC/Cloud environments

  • Lee, HeeKyung;Um, Gi-Mun;Lim, Seong Yong;Seo, Jeongil;Gwak, Moonsung
    • ETRI Journal
    • /
    • 제44권1호
    • /
    • pp.62-72
    • /
    • 2022
  • In this study, we propose a multi-GPU-based 8KVR stitching system that operates in real time on both local and cloud machine environments. The proposed system first obtains multiple 4 K video inputs, decodes them, and generates a stitched 8KVR video stream in real time. The generated 8KVR video stream can be downloaded and rendered omnidirectionally in player apps on smartphones, tablets, and head-mounted displays. To speed up processing, we adopt group-of-pictures-based distributed decoding/encoding and buffering with the NV12 format, along with multi-GPU-based parallel processing. Furthermore, we develop several algorithms such as equirectangular projection-based color correction, real-time CG overlay, and object motion-based seam estimation and correction, to improve the stitching quality. From experiments in both local and cloud machine environments, we confirm the feasibility of the proposed 8KVR stitching system with stitching speed of up to 83.7 fps for six-channel and 62.7 fps for eight-channel inputs. In addition, in an 8KVR live streaming test on the 5G MEC/cloud, the proposed system achieves stable performances with 8 K@30 fps in both indoor and outdoor environments, even during motion.

WebCL 기반 애플리케이션의 성능 평가를 위한 프로파일러 설계 및 구현 (Profiler Design for Evaluating Performance of WebCL Applications)

  • 김철원;조현중
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권8호
    • /
    • pp.239-244
    • /
    • 2015
  • 자바스크립트 상에서 높은 연산량을 처리하기 위해 제안된 WebCL은 불특정 클라이언트 환경에서 실행되므로 개별 클라이언트에서 애플리케이션의 성능 평가 작업이 중요하다. 현재 다양한 프로파일러들이 서비스 되고 있지만 WebCL을 위한 프로파일러는 아직 개발되어있지 않다. 본 논문에서는 웹 이기종 병렬컴퓨팅 언어인 WebCL 기반으로 구현된 애플리케이션의 성능 평가 및 GPU 상태 정보를 모니터링 하기 위한 프로파일러를 설계 및 구현하여 소개한다. 본 프로파일러를 통하여 사용자는 WebCL 기반 애플리케이션의 수행시간 및 메모리 읽기/쓰기 시간을 알 수 있고, GPU 디바이스의 소비 전력, 현재 온도, 클락 속도 등 현재 상태를 실시간 모니터링할 수 있다.

GPGPU 를 이용한 네트워크 트래픽에서의 HTTP 패킷 추출 성능 향상 (Performance Improvement in HTTP Packet Extraction from Network Traffic using GPGPU)

  • 한상운;김효곤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.718-721
    • /
    • 2011
  • 웹 서비스를 대상으로 하는 DDoS(Distributed Denial-of-Service) 공격 또는 유해 트래픽 유입을 탐지 또는 차단하기 위한 목적으로 HTTP(Hypertext Transfer Protocol) 트래픽을 실시간으로 분석하는 기능은 거의 모든 네트워크 트래픽 보안 솔루션들이 탑재하고 있는 필수적인 요소이다. 하지만, HTTP 트래픽의 실시간 데이터 측정 양이 시간이 지날수록 기하급수적으로 증가함에 따라, HTTP 트래픽을 실시간 패킷 단위로 분석한다는 것에 대한 성능 부담감은 날로 커지고 있는 실정이다. 이제는 응용 어플리케이션 차원에서는 성능에 대한 부담감을 해소할 수 없기 때문에 고비용의 소프트웨어 가속기나 하드웨어에 의존적인 전용 장비를 탑재하여 해결하려는 시도가 대부분이다. 본 논문에서는 현재 대부분의 PC 에 탑재되어 있는 그래픽 카드의 GPU(Graphics Processing Units)를 범용적으로 활용하고자 하는 GPGPU(General-Purpose computation on Graphics Processing Units)의 연구에 힘입어, NVIDIA사의 CUDA(Compute Unified Device Architecture)를 사용하여 네트워크 트래픽에서 HTTP 패킷 추출성능을 응용 어플리케이션 차원에서 향상시켜 보고자 하였다. HTTP 패킷 추출 연산만을 기준으로 GPU 의 연산속도는 CPU 에 비해 10 배 이상의 높은 성능을 얻을 수 있었다.

이더리움 채굴 및 활용 방안 (Ethereum Mining and a Plan of Practical Use)

  • 최효현;윤도진;이종윤
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제54차 하계학술대회논문집 24권2호
    • /
    • pp.211-212
    • /
    • 2016
  • 본 논문에서는 가상화폐이자 전자 거래의 신뢰성 있는 계약을 보장해 줄 수 있는 이더리움 (Ethereum)의 채굴 과정을 소개하고 향후 활용 방안을 제안한다. 이더리움의 거래 내역은 블록체인 (BlockChain)에 저장이 되며, 반영구적으로 삭제가 불가능하다. 이로써 전자상거래의 최대 단점인 사기 거래가 사전에 방지가 되고, 안전하고 깨끗한 거래가 성사될 수 있도록 하는 것이 목표이다. 이더리움 채굴을 위해서는 비디오카드의 GPU (Graphics Processing Unit)를 이용하였으며, 지갑 생성, 비디오카드 드라이버 설치, pool 서버 가입, 채굴 소프트웨어 설치 및 GPU 오버클럭킹 등의 과정을 수행하였다.

  • PDF

Scalable Prediction Models for Airbnb Listing in Spark Big Data Cluster using GPU-accelerated RAPIDS

  • Muralidharan, Samyuktha;Yadav, Savita;Huh, Jungwoo;Lee, Sanghoon;Woo, Jongwook
    • Journal of information and communication convergence engineering
    • /
    • 제20권2호
    • /
    • pp.96-102
    • /
    • 2022
  • We aim to build predictive models for Airbnb's prices using a GPU-accelerated RAPIDS in a big data cluster. The Airbnb Listings datasets are used for the predictive analysis. Several machine-learning algorithms have been adopted to build models that predict the price of Airbnb listings. We compare the results of traditional and big data approaches to machine learning for price prediction and discuss the performance of the models. We built big data models using Databricks Spark Cluster, a distributed parallel computing system. Furthermore, we implemented models using multiple GPUs using RAPIDS in the spark cluster. The model was developed using the XGBoost algorithm, whereas other models were developed using traditional central processing unit (CPU)-based algorithms. This study compared all models in terms of accuracy metrics and computing time. We observed that the XGBoost model with RAPIDS using GPUs had the highest accuracy and computing time.

인메모리 기반 딥러닝 기술을 위한 분산 프레임워크에 관한 연구 (A Study on In-memory based Distributed Frameworks for Deep Learning)

  • 조혜영;유정록
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.45-46
    • /
    • 2016
  • 최근 GPU를 비롯한 하드웨어의 성능이 급격이 증가하면서 인공지능, 딥러닝 기술에 대한 관심이 높아지고 있다. 또한 데이터가 더욱 방대해 지면서 대용량 데이터를 처리하고 위한 딥러닝 분산 프레임워크에 대한 필요성이 제기되고 있다. 이에 본 논문에서는 대규모의 분산 환경에서 딥러닝 고속 처리를 위한 분산 프레임워크를 비교 분석하였다. 특히 최근 주목받고 있는 인메모리 기반 분산 프레임워크인 Spark, SparkNet, HeteroSpark의 특징을 비교 분석하였다.

FPS레벨에디터를 이용한 1인칭 공간시뮬레이션에 관한 연구 (A Study on the Tree-dimensional Space Simukation using First Person Shooter leverl Editor)

  • 김종현;전한종;김석태
    • 한국실내디자인학회논문집
    • /
    • 제15권5호
    • /
    • pp.306-313
    • /
    • 2006
  • Digital simulation which was introduced to the architectural field due to the rapid growth of computer graphics, gave birth to a new type of contents called 'virtual reality', led by the interaction with the users and real time processing. The public attention is drawn to the virtual reality's potential as a next generational space simulation it, having the unique characteristics of 'simulation', 'interactivity', 'tole-presence', and 'immersion', is capable of taking a virtual tour of a space with a size equivalent to that of a real space, as well as proceeding with the design progress. Nonetheless, many problems impeding CPU's real time processing of an excessively loaded architectural model data have been pinpointed over the time. Yet such GPU based game engines as 'DirectX' and 'OpenGL', developed to deal with these impediments, have not been easily applied to the architectural simulation in the design process, due to the high license cost and the specific technical requirements for the system. The virtual reality has been developed and distributed centering around the gaming field, and game developers recently show a greater tendency to include level editors in the package for the expandability purpose. Thus, we plan to propose architecture simulation which utilizes level editors in this study. In addition, the compatibility of the game engine based level editors of Quake and Unreal which form the standards for the open source FPS games, based on VRML, the standard format for the virtual reality, was compared and analyzed. Taking the example of Villa Savoye of Le Corbusier, its application possibility as an architecture simulation was assessed, by measuring the extent to which the performance of such characteristic features of the virtual reality as interactivity, immersion, and tele-presence, was improved.