• 제목/요약/키워드: 3D Graphics Processing

검색결과 172건 처리시간 0.025초

Multi-Access Memory System을 이용한 3D 그래픽 프로세서 제안 (Proposal of 3D Graphic Processor Using Multi-Access Memory System)

  • 이스라엘;김재희;고경식;박종원
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.119-128
    • /
    • 2019
  • 3D 그래픽 프로세서의 시스템의 특성상 많은 수학적 계산이 요구되면서 고속처리를 위하여 GPU(Graphics Processing Unit)를 이용한 병렬처리 연구가 많이 진행되고 있다. 본 논문에서는 GPU에서 발생하는 문제점 중 캐시메모리 미스에 의하여 발생하는 대역폭 증가와 3D 셰이더 처리 속도가 일정하지 않은 문제점을 해결하기 위하여 캐시메모리를 사용하지 않는 병렬처리기인 MAMS를 이용한 3D 그래픽 프로세서를 제안한다. 본 논문에서 제안된 MAMS를 이용한 3D 그래픽 프로세서는 DirectX 명령 분석을 이용해 Vertex shader, Pixel shader와 Tiling 및 Rasterizing 구조를 설계 하였고, MAMS를 위한 FPGA(Xilinx Virtex6@100MHz) 보드를 구성하여, Verilog를 사용하여 설계된 구조를 개발하였다. 개발된 FPGA(100Mhz)와 nVidia GeForce GTX 660(980Mhz)의 처리시간을 확인한 결과 GTX 660를 이용한 처리 시간은 일정하지 않음을 확인하였고, MAMS를 이용한 처리 시간은 일정함을 확인하였다.

3D 얼굴 모델 자동 분할 기술 (Automatic 3D Face Segmentation)

  • 임성재;황본우;윤승욱;전혜령;박창준;최진성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1448-1450
    • /
    • 2015
  • 본 논문은 3D 스캐너 및 센서 등으로 캡처되어 3D로 복원된 얼굴 객체의 부위별 의미 있는 영역에 대한 분할을 자동으로 수행하는 기술을 제안한다. 3D 스캔된 얼굴 모델을 모델링, 애니메이션, 3D 프린팅 등의 다양한 응용분야에 활용하기 위해서는 스캔된 영역의 의미 있는 부위별 인식이 필수적이다. 본 논문에서는 부위별 의미 있는 영역 레이블링이 된 템플릿 모델을 입력된 3D 복원 모델로 전이하여 복원된 3D 모델의 부위별 의미 있는 영역을 자동으로 분할하고 분할된 영역의 일관성을 유지하는 알고리즘을 제안한다.

휴대 단말기용 3D Graphics Lighting Processor 설계 (A Design of 3D Graphics Lighting Processor for Mobile Applications)

  • 양준석;김기철
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.837-840
    • /
    • 2005
  • This paper presents 3D graphics lighting processor based on vector processing using pipeline chaining. The lighting process of 3D graphics rendering contains many arithmetic operations and its complexity is very high. For high throughput, proposed processor uses pipelined functional units. To implement fully pipelined architecture, we have to use many functional units. Hence, the number of functional units is restricted. However, with the restricted number of pipelined functional units, the utilization of the units is reduced and a resource reservation problem is caused. To resolve these problems, the proposed architecture uses vector processing using pipeline chaining. Due to its pipeline chaining based architecture, it can perform 4.09M vertices per 1 second with 100MHz frequency. The proposed 3D graphics lighting processor is compatible with OpenGL ES API and the design is implemented and verified on FPGA.

  • PDF

메모리 전송 효율을 개선한 programmable Fragment 쉐이더 설계 (A Design of Programmable Fragment Shader with Reduction of Memory Transfer Time)

  • 박태룡
    • 한국정보통신학회논문지
    • /
    • 제14권12호
    • /
    • pp.2675-2680
    • /
    • 2010
  • 3D 그래픽을 처리하는 연산 과정에는 고정적인 연산만을 수행하는 영역과 Shader 등과 같은 명령어에 의한 프로그래밍이 요구되는 영역이 구분되어 있다. 이러한 3D 파이프라인의 특성을 고려하여 fixed 구조로 설계한 graphics hardware와 명령어 기반의 programmable hardware를 혼합한 구조로 설계하면 효율적인 그래픽 처리가 가능하다. 본 논문에서는 이러한 혼합 구조에 적합한 OpenGL ES(Open Graphics Library Embedded System) 2.0을 지원하는 Fragment Shader를 설계하였다. fixed hardware와 Shader간 데이터 입출력으로 인해 발생할 수 있는 전체 파이프라인의 지연을 줄일 수 있도록 내부 인터페이스를 최적화하였으며 Shader 내부 레지스터 그룹을 interleaved 구조로 설계하여 레지스터 면적과 처리 속도를 개선하였다.

매니코어 프로세서를 이용한 벡터 기반 래스터화 알고리즘 구현 및 성능평가 (Implementation and Performance Evaluation of Vector based Rasterization Algorithm using a Many-Core Processor)

  • 손동구;김종면
    • 대한임베디드공학회논문지
    • /
    • 제8권2호
    • /
    • pp.87-93
    • /
    • 2013
  • In this paper, we implemented and evaluated the performance of a vector-based rasterization algorithm of 3D graphics using a SIMD-based many-core processor that consists of 4,096 processing elements. In addition, we compared the performance and efficiency of the rasterization algorithm using the many-core processor and commercial GPU (Graphics Processing Unit) system which consists of 7 GPUs and each of which have 512 cores. Experimental results showed that the SIMD-based many-core processor outperforms the commercial GPU system in terms of execution time (3.13x speedup), energy efficiency (17.5x better), and area efficiency (13.3x better). These results demonstrate that the SIMD-based many-core processor has potential as an embedded mobile processor.

GP-GPU 개발을 위한 3차원 그래픽 시뮬레이터 구현 (Implementation of a 3D Graphics Simulator for GP-GPU)

  • 여동영;김우영;정형기;이광엽
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 추계학술대회
    • /
    • pp.337-340
    • /
    • 2009
  • 3차원 그래픽 처리를 위한 가속기 하드웨어가 발표된 이후 GPU(Graphics Processing Unit)의 성능은 끊임없이 개선되어 왔다. 이는 복잡한 그래픽 어플리케이션의 연산을 효율적으로 처리하기 위한 추세이나 실제로 GPU의 리소스를 100% 활용하는 경우는 드물다. 최근 주목받고 있는 GP-GPU(General-Purpose GPU)는 GPU에서 담당하는 연산을 포함하고 CPU가 처리하는 일반적인 연산의 처리도 가능하여 프로세서 자원의 분배에 따라 효율적인 제어가 가능하다. 본 논문에서는 GP-GPU 기반 환경을 가상으로 구현하여 프로그램의 설계 및 디버깅이 가능한 시뮬레이터를 구현하였다. 이를 통해 동시 설계(Co-Design) 환경을 구성하여 동시적 개발 환경을 지원하고 3차원 그래픽 컨텐츠의 디스플레이가 가능한 인터페이스를 구축하여 빠르고 안정적인 검증이 가능하다.

  • PDF

3D 그래픽 콘텐츠의 적응적 서비스를 위한 미들웨어에서의 서비스 렌더링 연구 (Service Rendering Study for Adaptive Service of 3D Graphics Contents in Middleware)

  • 김학란;박화진;윤용익
    • 정보처리학회논문지A
    • /
    • 제14A권5호
    • /
    • pp.279-286
    • /
    • 2007
  • 3D 그래픽 콘텐츠를 다양한 플랫폼에서 제공하기 위한 유비쿼터스 환경에서의 콘텐츠 적응에 대한 요구는 점점 더 증가하고 있는 추세이다. 하지만 3D 그래픽은 방대한 양의 데이터와 고성능의 처리 능력이 요구되기 때문에 데스크탑이나 랩탑, PDA, 휴대폰 같은 다양한 단말기에서 변화된 환경에 서비스를 적응시키기 위해서는 좀 더 정교한 방법으로 그래픽 콘텐츠를 처리하여야 한다. 본 논문에서는 사용자 중심에 맞춘 그래픽 콘텐츠를 제공하기 위한 새로운 개념의 서비스 렌더링 알고리즘 기반의 적응적 서비스 미들웨어를 제안한다. 서비스 적응 미들웨어는 중요한 기능을 가지는 두 가지 모듈로 구성되는데, 사용자의 변화된 환경을 분석하기 위한 Service Adaptation(SA) 모듈과 사용자의 환경에 적합한 구성요소와 데이터를 처리하기 위한 Service Rendering(SR) 모듈이다. 서비스 적응 미들웨어를 통한 적응 서비스는 유비쿼터스 환경에서 사용자의 환경이 변화되었을 경우 동일한 그래픽 콘텐츠를 유연하고 다이나믹하게 제공할 수 있다.

그래픽 프로세서를 이용한 시간 영역 3차원 파동 전파 모델링과 메모리 관리 (Time-domain 3D Wave Propagation Modeling and Memory Management Using Graphics Processing Units)

  • 김아름;류동현;하완수
    • 지구물리와물리탐사
    • /
    • 제19권3호
    • /
    • pp.145-152
    • /
    • 2016
  • 효율적인 시간 영역 3차원 파동 전파 모델링을 위해 그래픽 프로세서를 사용하였다. 그래픽 프로세서는 대규모 병렬 연산을 위한 프로세서로, 그래픽 프로세서를 효율적으로 이용하기 위해서는 계산 과정과 메모리 복사 과정을 최적화할 필요가 있다. 본 연구에서는 메모리 관리에 초점을 맞추고 메모리 관리 방법에 따라 그래픽 프로세서를 이용한 프로그램의 성능이 어떻게 달라지는지 확인하였다. 또한 유한 차분법 차수와 속도 모델의 크기를 변화시켜가며 메모리 복사가 프로그램 성능에 미치는 영향을 시험하였다. 그 결과 3차원 파동장 전체를 복사하는 프로그램에서 메모리 관리가 유한 차분법 계산보다 큰 비중을 차지함을 알 수 있었다.

SIMT 구조 기반 GPGPU를 이용한 고속 Rasterizer 구현 (Implememtation of Fast Rasterizer processing using GPGPU based on SIMT structure)

  • 김치용
    • 전기전자학회논문지
    • /
    • 제21권3호
    • /
    • pp.276-279
    • /
    • 2017
  • 본 논문에서는 디스플레이 장치의 화면을 픽셀 단위로 구성하는 Rasterizer의 가속화를 위하여 SIMT구조의 GPGPU(General Purpose computing on Graphics Processing Units)를 사용하였다. GPU는 많은 수의 ALU를 가지고 있고, 병렬처리하기 때문에 연산처리가 매우 빠르다. 따라서 본 논문에서는 연산을 순차적으로 수행하는 CPU와 연산을 병렬적으로 수행하는 GPU를 이용하여 3D그래픽스 모델을 생성하는 rasterizer를 구현했다. 한 프레임 생성 시 Intel CPU를 이용한 rasterizer보다 본 논문에서 제안하는 rasterizer가 1.45배 좋은 성능을 확인하였다.

효율적인 클리핑 기능을 갖는 3차원 그래픽 파이프라인 구조 (A 3D graphic pipelines with an efficient clipping algorithm)

  • 이찬호
    • 대한전자공학회논문지SD
    • /
    • 제45권8호
    • /
    • pp.61-66
    • /
    • 2008
  • 최근 모바일 기기에 3차원 그래픽 디지털 콘텐츠들이 증가함에 따라 휴대용 기기에 적합한 3차원 그래픽 가속기의 연구와 설계는 점점 중요한 이슈가 되고 있다. 본 논문에서는 저전력 3차원 그래픽 파이프라인에 적합한 효율적인 클리핑 구조를 제안한다. 많은 연산 사이클과 연산기를 필요로 하는 클리핑 연산을 두 단계로 나누어서 기하변환 엔진에서는 컬링 정렬(cull and sort) 유닛으로 구현하고, 실질적인 클리핑은 스캔 변환(scan conversion)에서 구현한다. 즉, 스캔 변환 처리기를 구성하고 있는 변처리 (edge walk) 유닛에서 Y축 클리핑을 함께 수행하고 스팬처리 (span processing) 유닛에서 X축과 Z축 클리핑을 함께 수행한다. 제안하는 기하 변환 엔진의 컬링 정렬 유닛은 기존 클리핑 유닛에 비해 면적과 동작 사이클이 크게 줄었고 스캔 변환 처리기의 면적은 거의 증가하지 않아 전반적으로 동작 속도 및 동작 효율을 높였다. 제안하는 클리핑 구조를 적용한 3차원 그래픽 가속기는 Verilog-HDL을 이용하여 설계하고 FPGA를 이용하여 검증하였다.