• 제목/요약/키워드: Pixel cache

검색결과 16건 처리시간 0.019초

Multi-Access Memory System을 이용한 3D 그래픽 프로세서 제안 (Proposal of 3D Graphic Processor Using Multi-Access Memory System)

  • 이스라엘;김재희;고경식;박종원
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.119-128
    • /
    • 2019
  • 3D 그래픽 프로세서의 시스템의 특성상 많은 수학적 계산이 요구되면서 고속처리를 위하여 GPU(Graphics Processing Unit)를 이용한 병렬처리 연구가 많이 진행되고 있다. 본 논문에서는 GPU에서 발생하는 문제점 중 캐시메모리 미스에 의하여 발생하는 대역폭 증가와 3D 셰이더 처리 속도가 일정하지 않은 문제점을 해결하기 위하여 캐시메모리를 사용하지 않는 병렬처리기인 MAMS를 이용한 3D 그래픽 프로세서를 제안한다. 본 논문에서 제안된 MAMS를 이용한 3D 그래픽 프로세서는 DirectX 명령 분석을 이용해 Vertex shader, Pixel shader와 Tiling 및 Rasterizing 구조를 설계 하였고, MAMS를 위한 FPGA(Xilinx Virtex6@100MHz) 보드를 구성하여, Verilog를 사용하여 설계된 구조를 개발하였다. 개발된 FPGA(100Mhz)와 nVidia GeForce GTX 660(980Mhz)의 처리시간을 확인한 결과 GTX 660를 이용한 처리 시간은 일정하지 않음을 확인하였고, MAMS를 이용한 처리 시간은 일정함을 확인하였다.

영상 기반 실시간 재조명 렌더링 시스템 (Image-Based Relighting Rendering System)

  • 김순현;이주행;경민호
    • 한국HCI학회논문지
    • /
    • 제2권1호
    • /
    • pp.25-31
    • /
    • 2007
  • 재조명(relighting) 렌더링은 장면 내에 새로운 광원의 추가 또는 기존 광원 속성의 변경으로 인한 영상의 변화를 효율적으로 계산하는 과정을 말한다. 본 논문에서는 쉐이딩(shading) 계산에서 광원에 독립적인 파라메터를 미리 텍스쳐 이미지 형태로 캐시화하여 재조명 렌더링 과정에서의 계산량을 줄이는 방법을 사용하였다. 이러한 쉐이딩 파라메터들의 캐시 이미지들은 사용자가 카메라 시점을 바꾸고자 할 경우 새로 생성을 하여야 하는데, 이러한 캐시 이미지 생성에는 많은 시간이 소요된다. 본 논문에서는 새로운 시점에서의 캐시 이미지들을 영상 기반 렌더링 (image-based rendering) 기법을 이용하여 실시간에 구하는 방법을 제시한다. 이 방법은 먼저 여러 개의 지정된 카메라 시점에 대한 캐시 이미지들을 미리 생성해 둔다. 다음 원하는 시점의 캐시 이미지는 각 픽셀에 투영되는 3차원 표면점을 역시점변환(inverse viewing transform)을 통해 구하고, 이 점을 지정된 카메라 시점으로 다시 투영하여 캐시 이미지에서의 대응 픽셀을 찾는다. 대응 픽셀의 파라메터 값들을 평균하여 새 캐시 이미지에 써준다. 이 과정들은 하드웨어 그래픽 가속기의 단편 쉐이더(fragment shader)를 이용하여 실시간으로 수행된다.

  • PDF

향상된 가시성 검사를 수행하는 3차원 그래픽 가속기의 픽셀 파이프라인 구조 (A Pixel Pipeline Architecture with Effective Visibility Test for 3D Graphics Accelerators)

  • 김일산;박우찬;박진홍;한탁돈
    • 한국게임학회 논문지
    • /
    • 제7권3호
    • /
    • pp.31-38
    • /
    • 2007
  • 본 논문에서는 향상된 가시성 검사를 수행하여 기존의 중-텍스처링 구조에 비하여 데이터 전송량 및 깊이 캐쉬의 셀 면적을 감소시킨 픽셀 파이프라인 구조를 제시하였다. 제안하는 구조는 인접한 픽셀들 간의 가시성이 동일할 확률이 높다는 점을 이용하여 한 번의 가시성 검사만 수행하면서도 중-텍스처링 구조와 대등한 성능을 보이는 픽셀 파이프라인 구조이다. 실험결과, 제안하는 구조는 중-텍스처링 구조에 근접하는 성능을 보이면서도 깊이 캐쉬의 전송량은 평균 25%, 깊이 캐쉬의 면적은 약 40%가 감소하였다.

  • PDF

8K UHD(7680×4320) H.264/AVC 부호화기를 위한 4×4블럭단위 보간 필터 및 SAD트리 기반 부화소 움직임 추정 엔진 설계 (A Design of Fractional Motion Estimation Engine with 4×4 Block Unit of Interpolator & SAD Tree for 8K UHD H.264/AVC Encoder)

  • 이경호;공진흥
    • 전자공학회논문지
    • /
    • 제50권6호
    • /
    • pp.145-155
    • /
    • 2013
  • 본 연구에서는 8K UHD($7680{\times}4320$) 영상을 실시간 부호화하기 위한 $4{\times}4$ 블록 부화소 움직임추정기를 제안한다. 연산처리성능을 향상시키기 위해 보간 연산을 $4{\times}4$ 블록 단위로 병렬화시켰으며, 병렬 보간 연산에서 필요한 메모리 대역폭을 확장하기 위해 $10{\times}10$개의 메모리 어레이를 가진 2D 캐쉬 버퍼 구조를 설계하였다. 그리고 2D 캐쉬 버퍼는 검색영역 간 재사용 기법을 적용하여 참조화소의 중복저장을 최소화하였으며, $4{\times}4$ 블록 병렬 보간 필터는 3단(수평 수직 1/2부화소, 대각선 1/2부화소, 1/4부화소) 평면 보간 연산 파이프라인 구조로 설계하여 연산회로를 고속화시켰다. 0.13um 공정에서 시뮬레이션한 결과, 436.5K게이트의 $4{\times}4$ 블록 부화소 움직임추정기는 동작주파수 187MHz에서 8K UHD급 동영상을 초당 30프레임으로 실시간 처리하는 성능을 보였다.

4K UHD급 H.264/AVC 복호화기를 위한 4×4 블록 병렬 보간 움직임보상기 아키텍처 설계 (A Design of 4×4 Block Parallel Interpolation Motion Compensation Architecture for 4K UHD H.264/AVC Decoder)

  • 이경호;공진흥
    • 전자공학회논문지
    • /
    • 제50권5호
    • /
    • pp.102-111
    • /
    • 2013
  • 본 연구에서는 4K UHD($3840{\times}2160$) 영상을 실시간 복호화하기 위한 $4{\times}4$ 블록 병렬 보간 H.264/AVC 움직임보상기를 제안한다. 연산처리 성능을 향상시키기 위해 보간 연산을 $4{\times}4$ 블록 단위로 병렬화시켰으며, 병렬 보간 연산에서 필요한 메모리 대역폭을 확장하기 위해 $9{\times}9$개의 메모리 어레이를 가진 2D 캐쉬 버퍼 구조를 설계하였다. 그리고 2D 캐쉬 버퍼는 검색영역 간 재사용 기법을 적용하여 참조화소의 중복저장을 최소화하였으며, $4{\times}4$ 블록 병렬 보간 필터는 3단(수평 수직 1/2부화소, 대각선 1/2부화소, 1/4부화소) 평면 보간 연산 파이프라인 구조로 설계하여 연산회로를 고속화시켰다. 0.13um 공정에서 시뮬레이션한 결과, 161K게이트의 H.264/AVC 움직임보상기는 동작주파수 150MHz에서 4K UHD급 동영상을 초당 72프레임으로 실시간 처리하는 성능을 보였다.

효율적인 피사계 심도 생성을 위한 두 가지 기법 (Two Efficient Methods for Generating Depth-of-Field)

  • 서영선;임인성
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제14권3호
    • /
    • pp.31-46
    • /
    • 2008
  • 피사계 심도란 카메라에서 초점이 맞은 지점을 전후로 초점이 맞은 것과 유사한 선명도를 가지는 영역을 말한다. 이 영역을 벗어난 물체들은 아웃 포커싱 되어 흐릿하게 보이게 된다. 렌더링 한 이미지에 피사계 심도 효과를 내게 되면 그렇지 않은 이미지에 비해 훨씬 사실적인 영상을 얻을 수 있다. 렌더링에서 피사계 심도 효과를 내기 위한 기존 연구는 크게 두 가지로 나눌 수 있다. 먼저 분산 광선 추적법은 한 픽셀에 대해 주어진 렌즈 영역을 샘플링 하는 방법이다. 이 방법은 샘플링 횟수가 많아질수록 노이즈가 없는 정회한 영상을 얻게 되지만 그러기 위해서는 시간이 매우 많이 걸린다. 반면 후처리 방법은 광선 추적법 등을 이용하여 얻은 핀홀 카메라 이미지와 깊이 정보를 이용하여 피사계 심도 효과를 내는 것인데 분산 광선 추적법 만큼 정확하지는 않지만 훨씬 빠른 속도로 유사한 결과를 얻을 수 있어 많은 연구가 진행되어 왔다. 그러나 후처리 방법은 핀홀 카메라에서 생성된 이미지만을 이용하므로 실제 렌즈에서 보이는 모든 정보를 알 수 없다는 한계가 존재한다. 본 논문에서는 이러한 두 가지 형태의 방법을 각각 발전시켜 후처리 기반 피사계 심도 계산의 정확도를 높이는 방법과 분산 광선 추적법의 계산 속도를 향상시키는 방법을 제시한다.

  • PDF