DOI QR코드

DOI QR Code

모바일 3D 그래픽스를 위한 저전력 텍스쳐 맵핑 기법

A Low-Power Texture Mapping Technique for Mobile 3D Graphics

  • 김현희 (서울대학교 전기,컴퓨터공학부) ;
  • 김지홍 (서울대학교 전기,컴퓨터공학부)
  • 발행 : 2009.02.28

초록

3차원 그래픽스에서 영상의 현실감을 높이기 위해 자주 사용되는 텍스쳐 맵핑 기법은 많은 연산량과 메모리 접근의 요구로 성능과 전력상의 병목점이 되고 있으며, 이러한 텍스쳐 맵핑 단계에서의 메모리 접근시간을 줄이기 위해 텍스쳐 캐시가 이용되고 있다. 그러나 점차 소형화 되고 있는 휴대용 기기의 특성과 배터리로 동작하기에 갖는 전력상의 제약으로 인해 텍스쳐 캐시가 차지하는 면적과 에너지 소모를 줄이는 노력이 필요하다. 본 논문에서 제안하는 기법은 텍스쳐 캐시의 크기가 줄어듦에 따라 발생하는 미스율의 증가를 보완하기 위해 미리 읽기 기법을 사용한다. 또한 미리 읽기 버퍼에 텍스쳐 캐시에서 교체되는 블록을 임시로 저장해 둠으로써 충돌 미스를 줄이는 기법을 제안한다. 실험 결과, 1K bytes와 2K bytes의 캐시의 사용하면서 16K bytes 또는 8K bytes의 캐시를 사용했을 때와 비슷한 성능을 유지할 수 있음을 확인할 수 있었다. 또한 제안하는 기법의 사용으로 텍스쳐 캐시에서 소모되는 에너지 소모를 $23%{\sim}60%$까지 줄이고 70%정도의 면적을 감소 시킬 수 있음을 보여주었다.

ETexture mapping is a technique used for adding reality to an image in 3D graphics. However. this technique becomes the bottleneck of the 3D graphics pipeline because it requires large processing power and high memory bandwidth. For reducing memory latency in texture mapping, texture cache is used. As portable devices become smaller and they have power constraint, it is important to reduce the area and the power consumption of the texture cache. In this paper we propose using a small texture cache to reduce the area and the power consumption of the texture cache. Furthermore, we propose techniques to keep a performance comparable to large texture caches by using prefetch techniques and a victim cache. Simulation results show the proposed small texture cache can reduce the area and the power consumption up to 70% and 60%, respectively, by using $1{\sim}2K$ bytes texture cache compared to the conventional 16K bytes cache while keeping the performance.

키워드

참고문헌

  1. M. Mamidipaka and N. Dutt. "eCACTTI: An Enhanced Power Estimation Model for Onchip Caches," CECS Technical Report #04-28, 2004.
  2. Z. S. Hakura. and A. Gupta. "The Design and Analysis of a Cache Architecture for texture Mapping," Proc. of ISCA , pp. 108-120. 1997.
  3. H. Igehy. M. Eldridge. and K. Proudfoot, "Prefetching in an texture cache architesture," Proc. of Eurographics/SIGGRAPH Workshop on Graphics Hardware, pp. 133-142, 1998.
  4. M. Cox, N. Bhandari. and M. Shantz, "Multilevel texture caching for 3D graphics hardware," Proc. of ISCA , pp. 189-196, 1998.
  5. C. H. Kim and L. S. Kim. "Adaptive Selection of an Index in a Texture Cache," Proc. of ICCD, pp. 295-300, 2004.
  6. J. H. Woo, J. H. Sohn, H. J. Kim, J. C. Jeong, S. J. Lee, and H. J. Yoo, "A 195mw, 9.1MVertices/s fully programmable 3D graphics processor for low power mobile devices," Proc. of ASSCC, pp. 372-375, 2007.
  7. J. S. Yoon, D. H. Kim, C. H. Yu, and L. S. Kim, "A 3D graphics processor with fast 4D vector inner product units and power aware texture cache," Proc. of CICC, pp. 539-542, 2008.
  8. I. Antochi, B. H. H. Juurlink, A. G. M. Cilio, P. Liuham "Trading efficiency for energy in a texture cache architecture," Proc. of MPCS, pp. 189-196, 2002.
  9. N. P. Jouppi, "Improving direct-mapped cache performance by the addition of a small fully associative cache and prefetch buffers," Proc. of ISCA, pp. 364-373, 1990.
  10. J. H. Lee and S. D. Kim, and C. Wems, "Application-Adaptive Intelligent Cache Memory System," TECS, Vol. 1, No. 1, pp. 56-78, 2002.
  11. J. Edler, and M. D. Hill, "Dinero IV trace-driven uniprocessor cache simulator," available from Univ. of Wisconsin, 1997.
  12. The Khronos Group, "OpenGL ES," http://www.khronos.org/opengles/.
  13. 김영옥, 노영섭, 오삼권, "모바일 벡터 그래픽 가속기 설계를 위한 OpenVG API 구현," 한국컴퓨터정보학회 학술발표논문집, 251-255쪽, 2008년 6월.
  14. 박동규, "블록크기가 서로 다른 Direct-Mapped 캐시 메모리의 Trace-Driven 시뮬레이션 알고리즘," 한국컴퓨터정보학회 논문지, 제2권 제1호, 39-50쪽, 1997년 3월.