DOI QR코드

DOI QR Code

Task-to-Tile Binding Technique for NoC-based Manycore Platform with Multiple Memory Tiles

복수 메모리 타일을 가진 NoC 매니코어 플랫폼에서의 태스크-타일 바인딩 기술

  • 강진택 (서울대학교 컴퓨터공학부) ;
  • 김태영 (서울대학교 컴퓨터공학부) ;
  • 김성찬 (전북대학교 컴퓨터공학부) ;
  • 하순회 (서울대학교 컴퓨터공학부)
  • Received : 2015.07.23
  • Accepted : 2015.10.13
  • Published : 2016.02.15

Abstract

The contention overhead on the same channel in an NoC architecture can significantly increase a communication delay due to the simultaneous communication requests that occur. To reduce the overall overhead, we propose task-to-tile binding techniques for an NoC-based manycore platform, whereby it is assumed that the task mapping decision has already made. Since the NoC architecture may have multiple memory tiles as its size grows, memory clustering is used to balance the load of memory by making applications access different memory tiles. We assume that the information on the communication overhead of each application is known since it is specified in a dataflow task graph. Using this information, this paper proposes two heurisitics that perform binding of multiple tasks at once based on a proper memory clustering method. Experiments with an NoC simulator prove that the proposed heurisitic shows performance gains that are 25% greater than that of the previous binding heuristic.

NoC 아키텍쳐에서는 데이터의 통신이 한 채널에 집중되는 경우 경합이 일어나서 통신이 지연될 수 있다. 이러한 지연을 최소화시키는 것을 목표로 본 논문에서는 NoC 기반 매니코어 플랫폼에서 태스크 매핑이 완료된 이후, 매핑된 태스크들을 NoC 타일로 바인딩하기 위한 기법을 제안한다. 큰 규모의 플랫폼은 복수의 메모리 타일을 가질 수 있으므로 응용별로 사용하는 메모리를 다르게 하여 메모리별 부하를 분산시키기 위한 메모리 클러스터링 기법을 사용한다. 수행된 응용은 데이터플로우 기반으로 작성되어 있으므로 응용들의 통신 요구량에 대한 정보를 미리 알 수 있다고 가정한다. 이 정보를 바탕으로 본 논문에서는 여러 태스크를 동시에 바인딩하는 두개의 휴리스틱을 제안하였으며 각 휴리스틱은 적절한 메모리 클러스터링 기법을 활용한다. NoC 시뮬레이터를 이용한 실험을 통해 제안된 휴리스틱이 기존의 바인딩 휴리스틱에 비해 최대 25% 이상의 성능을 보이는 것을 확인하였다.

Keywords

Acknowledgement

Supported by : 정보통신기술진흥센터

References

  1. E. A. Lee and D. G. Messerschmitt, "Synchronous data flow," Proc. of the IEEE, Vol. 75, No. 9, pp. 1234-1245, 1987.
  2. E. Carvalho, N. Calazans, and F. Moraes, "Heuristics for dynamic task mapping in noc-based heterogeneous mpsocs," Proc. of the Rapid System Prototyping 2007, pp. 34-40, 2007.
  3. A. K. Singh, T. Srikanthan, A. Kumar, and W. Jigang, "Communication-aware heuristics for runtime task mapping on noc-based mpsoc platforms," Journal of Systems Architecture, Vol. 56, No. 7, pp. 242-255, 2010. https://doi.org/10.1016/j.sysarc.2010.04.007
  4. E. Carvalho, N. Ewerson, and F. Moraes, "Congestion-aware task mapping in heterogeneous MPSoCs," Proc. of the System-on-Chip 2008, pp. 1-4, 2008.
  5. A. K. Singh, W. Jigang, A. Prakash, and T. Srikanthan, "Mapping algorithms for noc-based heterogeneous mpsoc platforms," Proc. of the Digital System Design, Architectures, Methods and Tools, 2009, pp. 133-140, 2009.
  6. C. Lee, S. Kim, and S. Ha, "Efficient run-time resource management of a manycore accelerator for stream-based applications," Proc. of the Embedded Systems for Real-time Multimedia 2013, pp. 51-60, 2013.
  7. F. Fazzino, M. Palesi, and D. Patti, "Noxim: Network-on-chip simulator," [Online]. Available: http://sourceforge.net/projects/noxim
  8. S. Kim, C. Lee, T. Kim, and S. Ha, "Software platform for hybrid resource management of a many-core accelerator for multimedia applications," Proc of the Embedded Systems for Real-time Multimedia 2014, pp. 12-19, 2014.
  9. Kalray Turbocard. (2015) [Online] Available: http://www.kalrayinc.com/tag/turbocard/
  10. Tilera. (2015). TILE-Gx Processors. [Online] Available: http://www.tilera.com/products/?ezchip=585&spage=614