• 제목/요약/키워드: GPU model

검색결과 164건 처리시간 0.029초

All Phase Discrete Sine Biorthogonal Transform and Its Application in JPEG-like Image Coding Using GPU

  • Shan, Rongyang;Zhou, Xiao;Wang, Chengyou;Jiang, Baochen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권9호
    • /
    • pp.4467-4486
    • /
    • 2016
  • Discrete cosine transform (DCT) based JPEG standard significantly improves the coding efficiency of image compression, but it is unacceptable event in serious blocking artifacts at low bit rate and low efficiency of high-definition image. In the light of all phase digital filtering theory, this paper proposes a novel transform based on discrete sine transform (DST), which is called all phase discrete sine biorthogonal transform (APDSBT). Applying APDSBT to JPEG scheme, the blocking artifacts are reduced significantly. The reconstructed image of APDSBT-JPEG is better than that of DCT-JPEG in terms of objective quality and subjective effect. For improving the efficiency of JPEG coding, the structure of JPEG is analyzed. We analyze key factors in design and evaluation of JPEG compression on the massive parallel graphics processing units (GPUs) using the compute unified device architecture (CUDA) programming model. Experimental results show that the maximum speedup ratio of parallel algorithm of APDSBT-JPEG can reach more than 100 times with a very low version GPU. Some new parallel strategies are illustrated in this paper for improving the performance of parallel algorithm. With the optimal strategy, the efficiency can be improved over 10%.

Thickness and clearance visualization based on distance field of 3D objects

  • Inui, Masatomo;Umezun, Nobuyuki;Wakasaki, Kazuma;Sato, Shunsuke
    • Journal of Computational Design and Engineering
    • /
    • 제2권3호
    • /
    • pp.183-194
    • /
    • 2015
  • This paper proposes a novel method for visualizing the thickness and clearance of 3D objects in a polyhedral representation. The proposed method uses the distance field of the objects in the visualization. A parallel algorithm is developed for constructing the distance field of polyhedral objects using the GPU. The distance between a voxel and the surface polygons of the model is computed many times in the distance field construction. Similar sets of polygons are usually selected as close polygons for close voxels. By using this spatial coherence, a parallel algorithm is designed to compute the distances between a cluster of close voxels and the polygons selected by the culling operation so that the fast shared memory mechanism of the GPU can be fully utilized. The thickness/clearance of the objects is visualized by distributing points on the visible surfaces of the objects and painting them with a unique color corresponding to the thickness/clearance values at those points. A modified ray casting method is developed for computing the thickness/clearance using the distance field of the objects. A system based on these algorithms can compute the distance field of complex objects within a few minutes for most cases. After the distance field construction, thickness/clearance visualization at a near interactive rate is achieved.

등위면 볼륨렌더링을 위한 이미지 공간 폐색 쉐이딩 모델 (Image Space Occlusion Shading Model for Iso-surface Volume Rendering)

  • 김석연;유상봉;장윤
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제20권4호
    • /
    • pp.1-7
    • /
    • 2014
  • 볼륨렌더링은 주로 의학 및 과학 분야에서 사용되는 기법이었으나, 하드웨어의 발달과 더불어 다양한 응용프로그램에서의 적용이 가능해짐에 따라 볼륨렌더링에 대한 관심이 증가하고 있다. 볼륨렌더링의 시각화에 있어서 쉐이딩은 물체의 깊이 정보를 효율적으로 전달하여 시각적 인지에 큰 도움이 된다. 전역조명을 사용하면 시각적 인지를 향상시킬 수 있지만, 많은 GPU 메모리의 사용과 긴 연산시간으로 인해 프로그램과의 상호작용에 영향을 미친다. 본 논문에서는 렌더링 속도의 저하를 최소화하며 볼륨렌더링에 사실적인 쉐이딩을 적용하기 위하여 이미지 공간 폐색 쉐이딩 모델을 제안하고자 한다.

R-function을 이용한 형상의 음함수 모델링 및 해석 (Geometric Implicit Function Modeling and Analysis Using R-functions)

  • 신헌주;신동우;김태완
    • 한국CDE학회논문집
    • /
    • 제12권3호
    • /
    • pp.220-232
    • /
    • 2007
  • Current geometric modeling and analysis are commonly based on B-Rep modeling and a finite elements method respectively. Furthermore, it is difficult to represent an object whose material property is heterogeneous using the B-Rep method because the B-Rep is basically used for homogeneous models. In addition, meshes are required to analyze a property of a model when the finite elements method is applied. However, the process of generating meshes from B-Rep is cumbersome and sometimes difficult especially when the model is deformed as time goes by because the topology of deforming meshes are changed. To overcome those problems in modeling and analysis including homogeneous and heterogeneous materials, we suggest a unified modeling and analysis method based on implicit representation of the model using R-function which is suggested by Rvachev. For implicit modeling of an object a distance field is approximated and blended for a complex object. Using the implicit function mesh-free analysis is possible where meshes are not necessary. Generally mesh-free analysis requires heavy computational cost compared to a finite elements method. To improve the computing time of function evaluation, we utilize GPU programming. Finally, we give an example of a simple pipe design problem and show modeling and analysis process using our unified modeling and analysis method.

Algorithmic GPGPU Memory Optimization

  • Jang, Byunghyun;Choi, Minsu;Kim, Kyung Ki
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제14권4호
    • /
    • pp.391-406
    • /
    • 2014
  • The performance of General-Purpose computation on Graphics Processing Units (GPGPU) is heavily dependent on the memory access behavior. This sensitivity is due to a combination of the underlying Massively Parallel Processing (MPP) execution model present on GPUs and the lack of architectural support to handle irregular memory access patterns. Application performance can be significantly improved by applying memory-access-pattern-aware optimizations that can exploit knowledge of the characteristics of each access pattern. In this paper, we present an algorithmic methodology to semi-automatically find the best mapping of memory accesses present in serial loop nest to underlying data-parallel architectures based on a comprehensive static memory access pattern analysis. To that end we present a simple, yet powerful, mathematical model that captures all memory access pattern information present in serial data-parallel loop nests. We then show how this model is used in practice to select the most appropriate memory space for data and to search for an appropriate thread mapping and work group size from a large design space. To evaluate the effectiveness of our methodology, we report on execution speedup using selected benchmark kernels that cover a wide range of memory access patterns commonly found in GPGPU workloads. Our experimental results are reported using the industry standard heterogeneous programming language, OpenCL, targeting the NVIDIA GT200 architecture.

매니코어 프로세서를 이용한 SIFT 알고리즘 병렬구현 및 성능분석 (Parallel Implementation and Performance Evaluation of the SIFT Algorithm Using a Many-Core Processor)

  • 김재영;손동구;김종면;전희성
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.1-10
    • /
    • 2013
  • 본 논문에서는 대표적인 특징점 추출 알고리즘인 SIFT(Scale-Invariant Feature Transform)를 매니코어 프로세서를 이용하여 병렬 구현하고, 이를 실행 시간, 시스템 이용률, 에너지 효율 및 시스템 면적 효율 측면에서 분석하였다. 또한 기존의 고성능 CPU와 GPU(Graphics Processing Unit)와의 성능 비교를 통해 제안하는 매니코어의 잠재가능성을 입증하였다. 모의실험 결과, 매니코어를 이용한 SIFT 알고리즘 구현 결과는 기존의 OpenCV 구현 결과와 정확도면에서 동일하였고, 매니코어 구현은 고성능 CPU 및 GPU 구현보다 실행시간 측면에서 우수하였다. 또한 본 논문에서는 SIFT알고리즘의 옥타브 크기에 따른 에너지 효율 및 시스템 면적 효율을 분석하여 최적의 모델을 제시하였다.

Mega Irises: 프로젝터 기반의 영상 시스템상에서 이동하는 체험자를 위한 화소 단위의 스크린 투사 밝기 보정 (Mega Irises: Per-Pixel Projection Illumination Compensation for the moving participant in projector-based visual system)

  • 진종욱;원광연
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제17권4호
    • /
    • pp.31-40
    • /
    • 2011
  • 프로젝터 기반의 가시화 시스템은 가상현실 흑은 체험형 응용에서 널리 사용된다. 그러나 스크린 재질과 반사 성질에 따라 스크린 상의 투사 밝기의 불균일성이 때때로 체험자의 체험을 방해할 수 있다. 이러한 현상은 체험자의 위치를 추적하는 시스템인 CAVE 혹은 운동판 체험 시스템의 체험자가 시스템 안에서 계속적으로 움직일 경우에는 특별히 문제가 될 수 있다. 스크린 화상 상에 밝기의 불균일성을 만드는 이유 중에 하나는 참여자의 눈의 위치로의 프로젝터와 스크린의 스펙큘라 반사이며, 이에 대한 분석은 높은 계산 복잡도가 요구된다. 그래픽 프로세서의 프로그래머블 쉐이더를 이용하여 스펙큘라 라이팅 요소를 계산하는 것과 마찬가지로, 본 연구에서는 밝기의 불균일성을 줄이기 위하여 주어진 스크린 환경 3D 모델을 가지고 수행 시간에 모든 화소의 밝기를 조정하였다. 이러한 목적을 위하여 개개의 스크린 응용에 따른 각도 기반의 밝기 보정 함수를 고안하였으며, GPU 상에서 수행과 접근을 용이하도록 하였다. 두가지 기법이 구현되었는데, 각도 기반의 접근에서 프로덕트 기반의 접근으로 변환과 구간 선형 보간 근사 기법을 구현하였다.

GPU 기반 대량입자 거동 시뮬레이션과 실험비교 (Comparison of GPU-Based Numerous Particles Simulation and Experiment)

  • 박상욱;전철웅;손정현;이재욱
    • 대한기계학회논문집A
    • /
    • 제38권7호
    • /
    • pp.751-756
    • /
    • 2014
  • 우리 주변에는 수많은 알갱이들이 서로 상호작용하면서 운동하는 모습을 주로 볼 수 있다. 본 연구에서는 수많은 알갱이들의 접촉에 따른 동적 거동을 분석하였다. 접촉에 의한 각 요소의 거동을 해석하기 위해 이산 요소법(Discrete element method)을 사용하였다. 접촉 관계에 있어서 접촉 판별을 위해 Neighboring-Cell 알고리즘을 사용하였고, 접촉력 계산에 Hertzian contact model과 Tangential sliding friction contact 모델을 사용하였다. 수많은 알갱이의 접촉해석을 위해 GPU 기반의 병렬 프로그램을 구성하였다. 해석을 검증하기 위해서 댐 붕괴 실험을 수행하였다. 거동 종료시점에 입자들의 쌓인 형상을 시뮬레이션 결과와 비교하여 해석 프로그램의 신뢰성을 검증하였다.

성장 환경을 활용한 다수의 나무에 대한 사실적인 실시간 모델링 기법 (Realistic and Real-Time Modeling of Numerous Trees Using Growing Environment)

  • 김진모;조형제
    • 한국멀티미디어학회논문지
    • /
    • 제15권3호
    • /
    • pp.398-407
    • /
    • 2012
  • 본 연구에서는 넓은 지형에 분포하는 많은 수의 나무를 사실적이면서 효율적으로 표현하는 나무 모델 방법을 제안한다. 나무 가지의 재귀적 계층 구조와 싹으로부터 자기조직화를 통한 가지 생성 과정을 결합하여 단순화시킴으로써 보다 직관적이고 효율적으로 나무를 생성한다. 이러한 생성 과정은 사용자가 단계별 구조와 가지 길이, 분포, 방향과 같은 외형 조절을 인터랙티브하게 제어할 수 있도록 한다. 또한 많은 수의 나무를 동시에 제어하여 다양하게 성장시킬 수 있도록 하는 환경 적응형 모델을 설계하고 이를 효과적으로 처리하는 성장 환경 적용 방법을 제안한다. 여기에 넓은 지형위에 분포하는 복잡한 나무 모델의 실시간 시뮬레이션을 위해 GPU(Graphics Processing Unit)를 통한 렌더링 과정과 가지 표면의 연속적 세분화단계, 그리고 인스턴싱 기법을 도입한다. 제안한 나무 모델을 통해 넓은 지형에 다양한 나무를 사실적이고 효율적으로 표현할 수 있는지 여부를 시뮬레이션을 통해 확인한다.

웨이블릿 변환으로 압축된 지형 데이터의 효율적인 실시간 렌더링 기법 (An Efficient Real-time Rendering Method for Compressed Terrain Dataset with Wavelet Transform)

  • 김태권;이은석;신병석
    • 한국게임학회 논문지
    • /
    • 제14권4호
    • /
    • pp.45-52
    • /
    • 2014
  • 고해상도의 지형 데이터는 용량이 크기 때문에 GPU메모리에 데이터 전체를 적재할 수 없다. 따라서 out-of-core기반의 방법이 많이 사용된다. 그러나 보조기억장치의 대역폭 한계로 인하여 실시간으로 지형을 렌더링하기 어렵기 때문에 GPU로 웨이블릿 변환을 수행하여 압축된 DEM 데이터를 전송한 후 압축 해제하여 렌더링 하는 방법이 사용된다. 하지만 이 방법은 텍스처로부터 주기적으로 값을 읽어와 정점을 변환하고 메쉬를 생성해야하므로 비효율적이다. 이 논문에서는 웨이블릿 압축된 근사 계수 값을 정점의 속성으로 저장하고 기하 쉐이더에서 압축을 해제해 지형을 효율적으로 렌더링 하는 기법을 제안한다. 제안하는 방법은 근사 계수 값을 정점의 속성으로 주어 지형 텍스처의 전송량을 줄일 수 있다. 또한 지형 텍스처로부터 별도의 업로드 과정 없이 메쉬의 생성이 가능하므로 오버헤드가 발생하지 않아 효율적인 렌더링이 가능하다.