• 제목/요약/키워드: Rasterization algorithm

검색결과 9건 처리시간 0.023초

Multi-Thread 쉐이더 구조에 적합한 Vector 기반의 Rasterization 알고리즘의 구현 (Implementation of a 'Rasterization based on Vector Algorithm' suited for a Multi-thread Shader architecture)

  • 이주석;김우영;이보행;이광엽
    • 대한전자공학회논문지SD
    • /
    • 제46권10호
    • /
    • pp.46-52
    • /
    • 2009
  • 현재 개발되고 있는 Shader 프로세서는 처리 성능을 높이기 위하여 Multi-Core, Multi-Thread를 채택하고 있다. 또한 Shader 프로세서에서 각 수행 단계별 마다 IP를 따로 구현하지 않고 하나의 Core IP를 다양한 목적으로 사용할 수 있도록 설계하고 있다. 본 논문에서는 이러한 목적에 맞게 Shader-Core를 이용하여 연산이 가능하고, Multi-Core, Multi-Thread 기반에서 픽셀의 병렬처리가 가능하도록 고안된 Vector 기반의 Rasterization알고리즘을 제안한다. 이를 통하여 동일 조건의 기존 알고리즘에 비하여 약 2%의 연산량을 가지면서 각 픽셀이 독립적으로 연산이 가능하도록 하였다.

매니코어 프로세서를 이용한 벡터 기반 래스터화 알고리즘 구현 및 성능평가 (Implementation and Performance Evaluation of Vector based Rasterization Algorithm using a Many-Core Processor)

  • 손동구;김종면
    • 대한임베디드공학회논문지
    • /
    • 제8권2호
    • /
    • pp.87-93
    • /
    • 2013
  • In this paper, we implemented and evaluated the performance of a vector-based rasterization algorithm of 3D graphics using a SIMD-based many-core processor that consists of 4,096 processing elements. In addition, we compared the performance and efficiency of the rasterization algorithm using the many-core processor and commercial GPU (Graphics Processing Unit) system which consists of 7 GPUs and each of which have 512 cores. Experimental results showed that the SIMD-based many-core processor outperforms the commercial GPU system in terms of execution time (3.13x speedup), energy efficiency (17.5x better), and area efficiency (13.3x better). These results demonstrate that the SIMD-based many-core processor has potential as an embedded mobile processor.

Ambient Occlusion을 이용한 Global Illumination 대체기법 연구 (A Study on Replacing Method Global Illumination Using Ambient Occlusion)

  • 박재욱;김윤정
    • 만화애니메이션 연구
    • /
    • 통권36호
    • /
    • pp.493-510
    • /
    • 2014
  • 게임 콘솔에서부터 TV, 그리고 헐리우드 영화에 이르기까지 3D 렌더링 테크놀러지는 많은 분야에 쓰이고 있다. 컴퓨터로 이미지를 렌더링하는 방법은 90년대 후반까지는 Phong Shading을 위주로 하는 Rasterization 방식의 렌더링이 주를 이루었으며 이 방식은 최근에까지 영화나 극장용 애니메이션의 렌더링에 주력으로 쓰여 왔다. 21세기에 들어서는 레이 트레이싱(Ray Tracing)과 그 발전형인 글로벌 일루미네이션(Global Illumination)이 사실감과 퀄러티로 대두되면서 건축 렌더링부터 시장을 점유해갔으나, 글로벌 일루미네이션은 극장용 애니메이션이나 영화에 주력으로 사용되기에는 렌더링 시간이 비현실적으로 느린 경우가 많았다. 따라서 본 논문은 각 렌더링 방식의 개념적, 수학적 이해를 살펴본 후 앰비언트 어클루전(Ambient Occlusion)의 함수를 Rasterization방식에서 사용하는 Illumination Loop 식에 접목시켜서 글로벌 일루미네이션처럼 다양한 색의 조명을 반영하면서도 Rasterization처럼 빨리 렌더링 할 수 있는 알고리즘 수식과 이 수식을 사용한 RenderMan Shader 사용 예를 제시하였다. 이는 글로벌 일루미네이션이 나타낼 수 있는 사실적인 표현, 그리고 Rasterization방식의 빠른 속도, 이 두 가지 렌더링 방식의 장점만을 조합하여 짧은 렌더 타임을 유지하면서도 쉽게 좋은 퀄러티를 얻을 수 있는 새로운 개념으로써 이러한 방법은 이후 애니메이션이나 영화 VFX 제작에 있어서 제작비의 절감과 함께 좀 더 완성도 있는 결과물을 만들어 내는 역할을 할 수 있는 계기가 되길 바란다.

래스터화 알고리즘을 위한 최적의 매니코어 프로세서 구조 탐색 (Architecture Exploration of Optimal Many-Core Processors for a Vector-based Rasterization Algorithm)

  • 손동구;김철홍;김종면
    • 대한임베디드공학회논문지
    • /
    • 제9권1호
    • /
    • pp.17-24
    • /
    • 2014
  • In this paper, we implement and evaluate the performance of a vector-based rasterization algorithm for 3D graphics by using a SIMD (single instruction multiple data) many-core processor architecture. In addition, we evaluate the impact of a data-per-processing elements (DPE) ratio that is defined as the amount of data directly mapped to each processing element (PE) within many-core in terms of performance, energy efficiency, and area efficiency. For the experiment, we utilize seven different PE configurations by varying the DPE ratio (or the number PEs), which are implemented in the same 130 nm CMOS technology with a 500 MHz clock frequency. Experimental results indicate that the optimal PE configuration is achieved as the DPE ratio is in the range from 16,384 to 256 (or the number of PEs is in the range from 16 and 1,024), which meets the requirements of mobile devices in terms of the optimal performance and efficiency.

CUDA를 이용한 Rasterization 알고리즘의 코어 매핑에 따른 성능 및 에너지 효율 분석 (Analysis of Performance and Energy Efficiency of Core Mapping for Rasterization Algorithm using CUDA)

  • 박민호;김종면
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.140-143
    • /
    • 2013
  • 본 논문에서는 데이터 병렬성이 뛰어난 벡터 기반의 Rasterization 알고리즘을 CUDA를 이용하여 코어 매핑에 따른 성능 및 에너지 효율을 분석해 보았다. 블록 사이즈를 동일하게 맞춘 후 블록의 차원을 변경 하는 방법과 블록 사이즈를 변경하는 방법을 사용하여 실험하였다. 모의실험결과, 블록 사이즈가 동일할 때는 오차 범위 내로 동일한 성능과 에너지 효율을 보였다. 아키텍처마다 모든 자원을 사용할수 있는 이론적인 블록 및 스레드 구조가 존재하지만 메모리 접근에 대한 최적화를 이루어 내지 못한다면 Amdahl's law에 의해 성능 향상에 한계가 있다는 것을 확인하였다.

CAD 수단을 이용한 벡터형 공간자료의 위상 검출과 격자도면화를 위한 유틸리티 개발 (Development of a CAD-based Utility for Topological Identification and Rasterized Mapping from Polygonal Vector Data)

  • 조동범;임재현
    • 한국조경학회지
    • /
    • 제27권4호
    • /
    • pp.137-142
    • /
    • 1999
  • The purpose of this study is to develope a CAD-based tool for rasterization of polygonal vector map in AutoCAD. To identity the layer property of polygonal entity with user-defined coordinates as topology, algorithm in processing entity data of selection set that intersected with scan line was used, and the layers were extracted sequentially by sorted intersecting points in data-list. In addition to the functions for querying and modifying topology, two options for mapping were set up to construct plan projection type and to change meshes' properties in existing DTM data. In case of plan projection type, user-defined cell size of 3DFACE mesh is available for more detailed edge, and topological draping on landform can be executed in case of referring DTM data as an AutoCAD's drawing. The concept of algorithm was simple and clear, but some unexpectable errors were found in detecting intersected coordinates that were AutoCAD's error, not the utility's. Also, the routines to check these errors were included in algorithmic processing. Developed utility named MESHMAP was written in entity data control functions of AutoLISP language and dialog control language(DCL) for the purpose of user-oriented interactive usage. MESHMAP was proved to be more effective in data handling and time comparing with GRIDMAP module in LANDCADD which has similar function.

  • PDF

GPU 기반의 실시간 인터렉티브 광선추적법 구현 (Implementation of Real-time Interactive Ray Tracing on GPU)

  • 배성민;홍현기
    • 한국게임학회 논문지
    • /
    • 제7권3호
    • /
    • pp.59-66
    • /
    • 2007
  • 광선추적법(ray tracing)은 빛의 반사, 투과 등을 사실적으로 표현할 수 있는 대표적인 전역조명(global illumination) 기술이지만, 복잡한 계산과정으로 인해 실시간 활용에는 많은 제약이 존재한다. 이런 문제를 해결하기 위해 최근에는 GPU(Graphics Processing Unit) 기반의 광선추적법 알고리즘이 활발하게 개발되고 있으며, 본 논문에서는 J. Purcell 등이 제안한 광선추적법 기법을 구현하였다. 그리고 구현된 알고리즘을 인터렉티브 응용분야에 활용하기 위해 렌더링 성능을 개선하는 두가지 방법을 적용하였다. 먼저, 그래픽스 하드웨어에서 지원하는 래스터라이제이션(rasterization)을 적용해 초기 광선의 교차점을 효과적으로 구했다. 또한 대상 물체를 가속화(acceleration) 구조로 구성하여 광선과 물체간의 교차연산에 소요되는 계산시간을 단축하였다. GPU 기반의 광선추적법 렌더링에서 다양한 성능 개선 알고리즘을 적용하여 향상된 렌더링 결과를 구체적으로 분석한 기존 연구가 비교적 적었으며, 본 논문에서는 각 과정에 따른 개선 결과를 제시하였다. 구현된 렌더러와 GPU 기반의 환경 맵을 비교하였으며 이동형 개인 컴퓨터와 무선 센싱 장비를 이용한 무선 원격 렌더링 시스템을 구현하였다. 제안된 시스템은 실시간 합성, 증강현실(augmented reality), 가상현실 등의 다양한 분야에서 활용될 것으로 기대된다.

  • PDF

이동궤적 근사 다면체를 이용한 실시간 모션블러 기법 (Real-Time Motion Blur using Approximated Motion Trails)

  • 홍민푸;최진형;오경수
    • 한국게임학회 논문지
    • /
    • 제17권1호
    • /
    • pp.17-26
    • /
    • 2017
  • 최근 실시간으로 모션블러(motion blur)를 위한 연구들은 픽셀당 여러개의 시간 색상을 계산한 후 평균내는 방식으로 샘플의 수가 적을 경우 아티펙트(artifacts)나 노이즈(noise)가 발생하는 문제를 가지고 있다. 본 논문은 이러한 문제를 개선하기 위해서 이동궤적 근사 다면체(motion trail)를 이용한 실시간 모션블러 알고리즘을 제안한다. 본 논문의 알고리즘에서는 현재 프레임과 이전프레임의 삼각형으로 이동궤적 근사 다면체를 만들고 전후 관계(front-to-back) 정렬방법과 시공간차원의 비트연산(bitwise operation)을 적용하여 여러 물체가 겹치는 순간의 가시성 문제를 해결했다. 결과적으로 가려지지 않은 이동궤적 근사 다면체만을 그리기에 매끄러운 블러 효과를 얻는다.

타일링 속도를 개선한 계층 구조 타일 기반 Rasterizer 설계 (A Design of Hierarchical Tile-based Rasterizer Using The Improved Tiling Algorithm)

  • 김도현;경규택;곽재창;이광엽
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.309-311
    • /
    • 2014
  • 타일 기반 렌더링 기법은 화면의 영역을 특정한 사이즈의 타일로 분할하여 한 번에 하나의 타일씩 3D 그래픽 모델을 처리하는 방법으로 3D 그래픽 파이프라인에서 제한된 자원을 효율적으로 활용하기 위하여 사용된다. 본 논문에서는 계층 구조 타일 기반 렌더링 기법의 하위 계층 호출 빈도를 줄여 타일 기반 렌더링의 타일링 속도을 향상 시켰다. 제안하는 Rasterizer의 타일링 속도는 13.030ms로 멀티 소트 타일링의 29.614ms 보다 56%, 기존의 계층적 타일링 기법의 17.208ms 보다 24% 향상된 처리 속도를 가진다.

  • PDF