• 제목/요약/키워드: programmable shader

검색결과 16건 처리시간 0.025초

메모리 전송 효율을 개선한 programmable Fragment 쉐이더 설계 (A Design of Programmable Fragment Shader with Reduction of Memory Transfer Time)

  • 박태룡
    • 한국정보통신학회논문지
    • /
    • 제14권12호
    • /
    • pp.2675-2680
    • /
    • 2010
  • 3D 그래픽을 처리하는 연산 과정에는 고정적인 연산만을 수행하는 영역과 Shader 등과 같은 명령어에 의한 프로그래밍이 요구되는 영역이 구분되어 있다. 이러한 3D 파이프라인의 특성을 고려하여 fixed 구조로 설계한 graphics hardware와 명령어 기반의 programmable hardware를 혼합한 구조로 설계하면 효율적인 그래픽 처리가 가능하다. 본 논문에서는 이러한 혼합 구조에 적합한 OpenGL ES(Open Graphics Library Embedded System) 2.0을 지원하는 Fragment Shader를 설계하였다. fixed hardware와 Shader간 데이터 입출력으로 인해 발생할 수 있는 전체 파이프라인의 지연을 줄일 수 있도록 내부 인터페이스를 최적화하였으며 Shader 내부 레지스터 그룹을 interleaved 구조로 설계하여 레지스터 면적과 처리 속도를 개선하였다.

저전력 모바일 장치를 위한 완전 프로그램 가능형 쉐이더 프로세서 (A Fully Programmable Shader Processor for Low Power Mobile Devices)

  • 정형기;이주석;박태룡;이광엽
    • 전기전자학회논문지
    • /
    • 제13권2호
    • /
    • pp.253-259
    • /
    • 2009
  • 본 논문에서는 전용하드웨어를 사용하지 않는 새로운 구조의 범용 그래픽 쉐이더 프로세서를 제안한다. 최근 모바일 기기에서는 고성능을 유지하면서 저전력의 작은 크기를 가지는 그래픽 프로세서를 요구한다. 제안하는 쉐이더 프로세서는 OpenGL ES 2.0 그래픽 파이프라인 전체를 쉐이더 명령어로 실행할 수 있는 GP-GPU 구조를 갖는다. 프로그램을 구현하여 하나의 프로세서로 모든 그래픽 파이프라인 처리가 가능하기 때문에 Rasterization Unit과 같은 별도의 전용 하드웨어를 필요로 하지 않는다. 따라서 쉐이더 프로세서 하나로 Fully Programmable 3D Graphics Engine 구현이 가능하며 기존 쉐이더 프로세서에 비해 하드웨어 크기를 60% 줄였다.

  • PDF

3D 그래픽 쉐이더 프로세서를 위한 고효율 연산기 구조 (An Architecture of a high efficient ALU for 3D Graphics Shader Processor)

  • 김우영;이보행;이광엽;박태룡
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.229-232
    • /
    • 2009
  • 최근 모바일 기기에서도 고성능 그래픽 효과가 요구되면서 다양한 연산 처리를 하는 프로그래머블 쉐이더가 필요하게 되었다. 이러한 이유로 프로그래머블 쉐이더 프로세서의 ALU는 기존에 비해 상대적으로 커지게 되었다. 이 논문에서 제안하는 듀얼 페이지 구조는 프로그래머블 쉐이더에서 상대적으로 커진 ALU 하나를 이용하여 동시에 두 개의 연산 처리를 가능하게 하는 구조이다. 이러한 구조를 사용하여 기존 구조에 비해 평균 40%의 성능을 개선 하였다.

  • PDF

Programmable Vertex Shader를 내장한 3차원 그래픽 지오메트리 가속기 설계 (Design of a 3D Graphics Geometry Accelerator using the Programmable Vertex Shader)

  • 하진석;정형기;김상연;이광엽
    • 대한전자공학회논문지SD
    • /
    • 제43권9호
    • /
    • pp.53-58
    • /
    • 2006
  • 버텍스 쉐이더는 fixed function T&L(Transform and Lighting) 엔진의 유연성을 향상시키고, 이전보다 다양한 3D 그래픽 효과를 표현하기 위하여 설계되었다. 본 논문의 쉐이더는 DirectX 8.1 의 Vertex Shader 1.1 과 OpenGL ARB에 기초하여 설계하였다. 버텍스 쉐이더는 벡터 연산을 위하여 4개의 ALU로 구성된다. 작은 면적의 저전력 설계를 위하여 32비트 부동소수점 데이터 형식을 24비트 데이터 형식으로 대체하였다. 버텍스 쉐이더 코어의 동작 검증을 위하여 Xilinx Virtex2 300M gate 모듈을 사용하였다. 시납시스 합성결과 TSMC 0.13um 공정에서 115MHz의 주파수로 동작가능하고, 12.5M Polygons/sec 의 연산성능을 보였다. 버텍스 쉐이더 코어의 면적은 동일 공정에서 11만 게이트를 차지한다.

SIMD 프로그래머블 통합 셰이더를 위한 제어 유닛 설계 및 구현 (Control Unit Design and Implementation for SIMD Programmable Unified Shader)

  • 김경섭;이윤섭;유병철;정진하;최상방
    • 대한전자공학회논문지SD
    • /
    • 제48권7호
    • /
    • pp.37-47
    • /
    • 2011
  • 그래픽 프로세서의 발달로 실사 수준의 고품질 컴퓨터 그래픽은 여러 분야에 다양한 용도로 사용되고 있으며, 그래픽 프로세서의 핵심 중 하나인 셰이더 프로세서는 프로그램 가능한 통합 셰이더로 발전하였다. 그러나 현재의 상용 그래픽 프로세서들은 특정한 알고리즘에 최적화되어 있어 다양한 알고리즘의 개발을 위해서는 독립적인 셰이더 프로세서가 필요하다. 본 논문에서는 프로그래머블 통합 셰이더 프로세서에서 DirectX 셰이더 어셈블리 명령어를 수행할 수 있는 고성능 3차원 컴퓨터 그래픽 영상을 지원하기 위한 제어 유닛을 설계하고 구현하였다. 설계한 제어 유닛은 기능적 레벨에서 시뮬레이션을 통하여 그 성능을 검증 하였으며, FPGA Virtex-4에 구현하여 하드웨어 리소스 사용율을 확인하고 ASIC 라이브러리를 적용하여 동작속도를 확인 하였다. 또한 비슷한 기능을 하는 셰이더 프로세서에 비해 약 1.5배 정도 많은 수의 명령어를 지원하며, 사용하는 연산 유닛 수에 비해 전체적인 성능은 약 3.1GFLOPS 향상된 결과를 보였다.

가변길이 SIMD구조 쉐이더 명령어 및 컴파일러 설계 (Design of Compiler & Variable-Length Instructions for SIMD Structured Shader)

  • 곽재창;박태룡
    • 한국정보통신학회논문지
    • /
    • 제14권12호
    • /
    • pp.2691-2697
    • /
    • 2010
  • 본 논문에서는 3차원 그래픽 쉐이더 3.0 API를 지원하는 쉐이더 명령어 및 컴파일러를 설계하고 그 결과를 평가한다. 기존의 명령어와는 달리 가변길이의 명령어 구조를 제안하고 명령어의 길이를 줄여 SIMD(Single Instruction Multiple Data)구조의 그래픽 프로세서의 하드웨어 크기를 줄일 수 있다. 가변길이 및 2 페이즈 구조의 명령어를 지원하며 ESSL(ES Shading Language) 수준에서 쉐이더 프로그램이 가능한 쉐이더 컴파일러의 설계를 수행하였다. 명령어와 컴파일러 설계 결과를 검증하기 위하여 크로노스그룹에서 제안하는 Conformance Test를 수행하였다. 그 결과로 제공하는 기본 GL 쉐이더의 기능 16개를 비교하여 보았을 때 전체 평균 37%가 줄어드는 것을 알 수 있다.

GPU를 이용한 깊이 영상기반 렌더링의 가속 (Accelerating Depth Image-Based Rendering Using GPU)

  • 이만희;박인규
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권11호
    • /
    • pp.853-858
    • /
    • 2006
  • 본 논문에서는 깊이 영상기반의 3차원 그래픽 객체에 대하여 그래픽 처리 장치(Graphics Processing Unit, GPU)의 가속을 이용한 고속의 렌더링 기법을 제안한다. 제안하는 알고리즘은 최근의 그래픽 처리 장치의 새로운 특징과 프로그래밍이 가능한 쉐이더 기법을 이용하여, 속도가 느리거나 정적인 조명과 같은 기존의 일반적인 깊이 영상기반 렌더링 방법이 갖고 있는 단점을 극복할 수 있다. 깊이 영상기반 데이타의 3차원 변환 및 조명에 의한 효과 연산은 정점 쉐이더(vertex shader)에서 수행을 하고, 점 데이타의 적응적인 스플래팅(splatting)은 화소 쉐이더(fragment shader)에서 수행된다. 모의 실험결과, 소프트웨어 렌더링 또는 OpenGL 기반의 렌더링과 비교해서 괄목할 만한 렌더링 속도의 향상이 이루어졌다.

프로그래밍 가능한 GPU를 이용한 포토 모자이크 (Photomosaic using a programmable GPU)

  • 강동완;윤경현
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제14권1호
    • /
    • pp.17-25
    • /
    • 2008
  • 본 논문은 프로그래밍 가능한 GPU를 이용한 포토 모자이크 생성 방법을 제안한다. 그래픽스 파이프라인을 통해 포토 모자이크를 생성할 수 있도록 정점을 디자인하고, 타일로 사용할 영상 데이터베이스의 텍스처 표현을 제시한다. 정점 셰이더에서는 텍스처에 저장된 입력 영상과 타일 영상들을 이용해 최적 타일을 찾고, 프래그먼트 셰이더는 이것을 프레임 버퍼에 그림으로써 포토 모자이크를 생성한다. 본 논문에서 제안한 방법은 최적 타일을 찾는 기존의 포토 모자이크 알고리즘에 비해 월등히 빠른 결과를 보여준다.

  • PDF

SIMD 프로그래머블 셰이더를 위한 멀티포트 레지스터 파일 설계 및 구현 (Multi-Port Register File Design and Implementation for the SIMD Programmable Shader)

  • 윤완오;김경섭;정진하;최상방
    • 대한전자공학회논문지SD
    • /
    • 제45권9호
    • /
    • pp.85-95
    • /
    • 2008
  • 3D 그래픽 알고리즘은 특성상 방대한 양의 스트림 데이터에 대하여 복잡한 연산을 수행하여야 한다. 이러한 알고리즘을 하드웨어에서 신속하게 수행할 수 있는 버텍스 셰이더와 픽셀 세이더의 도입으로 그래픽 프로세서는 "소프트웨어 셰이더의 하드웨어화"라는 목표를 어느 정도 달성한 것처럼 보이지만, 여전히 Z-버퍼 기반이라는 특정 알고리즘의 틀에서 벗어나지 못하고 있다. 향후 그래픽 프로세서가 궁극적으로 추구하는 모델은 알고리즘에 독립적인 그리고 버텍스 셰이더와 픽셀 셰이더가 통합된 셰이더로 발전할 것이다. 본 논문에서는 프로그래머블 통합 셰이더 프로세서에서 고성능 3차원 컴퓨터 그래픽 영상을 지원하기 위한 멀티포트 레지스터 파일 모델을 설계하고 구현하였다. 설계한 멀티포트 레지스터 파일을 기능적 레벨에서 시뮬레이션을 하여 그 성능을 검증 하였으며, FPGA Virtex-4(xc4vlx200)에 직접 구현하여 하드웨어 리소스 사용율과 속도를 확인 하였다.

벡터화된 SIMD 프로그램어블 통합 셰이더를 위한 특수 함수 유닛 설계 (Design of Special Function Unit for Vectorized SIMD Programmable Unified Shader)

  • 정진하;김경섭;윤정희;서장원;최상방
    • 대한전자공학회논문지SD
    • /
    • 제47권5호
    • /
    • pp.56-70
    • /
    • 2010
  • 현실감 있는 3차원 그래픽 영상을 지원하기 위해서는 3차원의 그래픽 데이터를 기반으로 사실감을 부여하여 2차원 영상을 생성하는 렌더링 기술과 방대한 양의 데이터에 대해 복잡한 연산을 효율적으로 처리할 수 있는 고성능 그래픽 프로세서가 요구된다. 이로 인해 그래픽 하드웨어는 급속히 발전하였고 기존에 실시간 처리가 불가능했던 여러 고급 렌더링 효과들을 가능하게 하고 있다. 과거에 비해 셰이딩 기술이 발전하면서 사실적인 영상의 렌더링이 가능하게 되었으나 아직 많은 계산 시간을 필요로 하고 있다. 실사와 같은 영상을 빠르게 처리하기 위해서 그래픽 프로세서는 많은 데이터에 대해 복잡한 부동소수점 연산을 효율적으로 처리 할 수 있도록 다수의 연산유닛이 집적되는 방향으로 발전하고 있다. 본 논문에서는 프로그램어블 통합 셰이더 프로세서에서 고성능 3차원 컴퓨터 그래픽 영상을 지원하기 위해 특수 함수 유닛을 설계하고 구현하였다. 설계한 특수 함수 유닛에 대해 기능적 레벨의 시뮬레이션을 하여 동작을 검증 하였으며, FPGA Virtex-4(xc4vlx200)에 구현하여 하드웨어 리소스 사용율과 동작속도를 확인 하였다.