통합 검색 | Korea Science

AB9: A neural processor for inference acceleration

Cho, Yong Cheol Peter;Chung, Jaehoon;Yang, Jeongmin;Lyuh, Chun-Gi;Kim, HyunMi;Kim, Chan;Ham, Je-seok;Choi, Minseok;Shin, Kyoungseon;Han, Jinho;Kwon, Youngsu
- ETRI Journal
- /
- 제42권4호
- /
- pp.491-504
- /
- 2020
We present AB9, a neural processor for inference acceleration. AB9 consists of a systolic tensor core (STC) neural network accelerator designed to accelerate artificial intelligence applications by exploiting the data reuse and parallelism characteristics inherent in neural networks while providing fast access to large on-chip memory. Complementing the hardware is an intuitive and user-friendly development environment that includes a simulator and an implementation flow that provides a high degree of programmability with a short development time. Along with a 40-TFLOP STC that includes 32k arithmetic units and over 36 MB of on-chip SRAM, our baseline implementation of AB9 consists of a 1-GHz quad-core setup with other various industry-standard peripheral intellectual properties. The acceleration performance and power efficiency were evaluated using YOLOv2, and the results show that AB9 has superior performance and power efficiency to that of a general-purpose graphics processing unit implementation. AB9 has been taped out in the TSMC 28-nm process with a chip size of 17 × 23 ㎟. Delivery is expected later this year.
https://doi.org/10.4218/etrij.2020-0134 인용 PDF KSCI

인공지능프로세서 기술 동향 (Trends in AI Processor Technology)

이미영;정재훈;이주현;한진호;권영수
- 전자통신동향분석
- /
- 제35권3호
- /
- pp.66-75
- /
- 2020
As the increasing expectations of a practical AI (Artificial Intelligence) service makes AI algorithms more complicated, an efficient processor to process AI algorithms is required. To meet this requirement, processors optimized for parallel processing, such as GPUs (Graphics Processing Units), have been widely employed. However, the GPU has a generalized structure for various applications, so it is not optimized for the AI algorithm. Therefore, research on the development of AI processors optimized for AI algorithm processing has been actively conducted. This paper briefly introduces an AI processor especially for inference acceleration, developed by the Electronics and Telecommunications Research Institute, South Korea., and other global vendors for mobile and server platforms. However, the GPU has a generalized structure for various applications, so it is not optimized for the AI algorithm. Therefore, research on the development of AI processors optimized for AI algorithm processing has been actively conducted.
https://doi.org/10.22648/ETRI.2020.J.350307 인용 PDF

GPU를 이용한 2차원 영상 기반 유동 가시화 기법의 가속 (Acceleration of 2D Image Based Flow Visualization using GPU)

이중연
- 한국콘텐츠학회:학술대회논문집
- /
- 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
- /
- pp.543-546
- /
- 2007
유동 가시화란 가시화 기술의 한 영역으로, 벡터 데이터를 2차원 또는 3차원의 형태로 시각적으로 표출하는 것을 말한다. 즉, 일반적으로 벡터 데이터는 (x, y, z)의 형식으로 이루어져 있는 수열의 집합인데, 이를 사람이 그 특징을 쉽게 인지할 수 있도록 그림 또는 애니메이션으로 표시하는 것을 말한다. 유동 가시화 기법에는 여러 가지가 있지만 영상 기반 유동 가시화 기법(IBFV)은 현존하는 조밀한 인티그레이션 기법들 중 가장 빠른 기법 중 하나이다. 본 논문에서는 GPU를 이용해서 영상 기반 유동 가시화 기법을 가속하고 이를 구현했는데, 특히, 메쉬어드벡션 (mesh advection)을 꼭지점 프로그램을 이용해서 가속했다.
PDF

HW 가속 기반 웹 고속화 기술동향 (Trends of Hardware Acceleration Technology in Wed Browser)

이재호;조현우;김도형;이형석;윤석진;류철;조창식
- 전자통신동향분석
- /
- 제31권4호
- /
- pp.65-76
- /
- 2016
특정 제조사의 단말 또는 운영체제에 의존성이 없는 플랫폼 독립적인 웹은 높은 이식성, 소프트웨어의 재활용, 개발 생산성, 풍부한 개발자 존재, 유지 보수 면에서 장점을 가지나, 화려한 UI/UX를 제공하는 네이티브 응용에 비해 낮은 성능으로 웹 기반의 응용 개발 및 보급이 크게 활성화되지 못했다. 한편 데스크톱은 물론 모바일 단말의 멀티코어 기반 Graphic Processing Unit(GPU), CPU 탑재 등 HW 고사양화와 웹 응용에서도 HW 가속 기능을 활용할 수 있는 표준 제공으로 성능 제약을 극복할 수 있게 되었다. 본고에서는 GPU 발전동향을 살펴보고, 고속 렌더링 및 병렬 연산처리를 요구하는 웹 응용이 GPU기반 HW 가속 기능을 활용할 수 있는 크로노스 그룹의 그래픽 가속(Web Graphics Library: WebGL) 및 컴퓨팅(Web Computing Language: WebCL) 지원 표준 규격을 정리한다. 또한, 최근 차세대 GPU Application Programming Interface(API)로 발표된 Vulkan에 대해 알아보고, 웹 고속화 기술에 적용 가능성에 대해 전망한다.
PDF

3D 그래픽스 가속 하드웨어 기술 (Acceleration Hardware Technology of 3D Graphics)

조승현;박성모;엄낙웅
- 전자통신동향분석
- /
- 제22권5호
- /
- pp.69-77
- /
- 2007
3D 그래픽스 관련 산업의 눈부신 성장은 GPU 기술의 발전을 기반으로 이루어졌다. GPU는 기존의 고정된 기능의 파이프라인을 벗어나 프로그램 가능한 형태로 발전하였으며 GPU의 프로그램 능력과 성능의 꾸준한 향상이 이루어지고 있다. 최근에는 GPU 내부의 연산 집중도의 불균형을 해결하기 위한 연구와 GPU의 연산능력을 다른 응용분야에 이용하기 위한 연구가 진행중에 있다. GPU를 이용한 3D 그래픽스 응용프로그램 개발을 위해서 산업 표준의 API들이 존재하는데 데스크톱용 API에서 필수 기능만을 골라 간략화한 모바일 기기용 프로파일 또한 정의되고 있다. 모바일 기기에 사용되는 GPU도 프로그램 가능한 구조로 진화하고 있으며 대중화되기 위해서는 전력소모를 낮추기 위한 노력이 필요하다.
https://doi.org/10.22648/ETRI.2007.J.220507 인용 PDF

모바일 기기에서의 방사형 그라디언트 페인트 가속 (Acceleration of Radial Gradient Paint Processor for Mobile Device)

김진우;박진홍;한탁돈
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2011년도 춘계학술발표대회
- /
- pp.530-533
- /
- 2011
방사형 그라디언트 페인트(radial gradient paint)는 벡터 그래픽스(vector graphics)에서 적은 정보로 다양한 효과를 적용시킬 수 있는 방법이다. 기본적으로 이 방법은 곱하기, 나누기, 제곱근 등의 복잡한 연산이 필요하기 때문에 모바일 같은 저성능 환경에 적합하지 않았다. 하지만 최근 모바일 기기들은 SIMD 연산 지원 및 고성능의 GPU 탑재 등으로 성능이 향상됨에 따라 이러한 문제를 해결할 수 있게 되었다. 본 논문은 ARM의 SIMD연산인 NEON을 이용하여 최대 2.6배의 성능을 가속시켰으며 GPU의 쉐이더를 이용하여 4.9배의 성능을 가속하였다.
https://doi.org/10.3745/PKIPS.y2011m04a.530 인용 PDF

위치 기반 삼각화를 이용한 입자 기반 유체 시뮬레이션 가속화 기법 (Position Based Triangulation for High Performance Particle Based Fluid Simulation)

홍만기;임재호;김창헌;변혜원
- 한국컴퓨터그래픽스학회논문지
- /
- 제23권1호
- /
- pp.25-32
- /
- 2017
본 논문은 입자 기반 대규모 유체 시뮬레이션의 가속화 기법을 새롭게 제안한다. 전통적인 입자 기반 유체 시뮬레이션은 SPH(Smoothed Particle Hydrodynamics)기법[1]을 통해 인접 입자와 물리량을 상호작용하는 방식으로 이루어졌다. 이러한 방식은 잔잔한 표면이나 유체 내부와 같이 입자의 움직임이 적은 부분에서는 연산량에 비해 가시적인 변화를 보이지 않는다는 특성이 있다. 이러한 현상은 입자의 개수가 많아질수록 두드러지게 나타난다. 기존 연구에서는 유체의 각 부분을 적응적으로 나눔으로써 낭비되는 연산량을 줄이려는 시도를 했다. 본 논문은 대규모 시뮬레이션에 적합한 입자 기반 유체 시뮬레이션 기법을 제안한다. 시뮬레이션에서 사용되는 모든 입자를 유체 움직임의 기준이 되는 샘플링 입자와 샘플링 입자에 의해 움직임이 결정되는 보간 입자로 분류하고 샘플링 입자에 의해 생성되는 삼각형 맵과 무게중심 좌표계를 이용한 보간 방법을 통해 연산 시간을 단축하는 기법을 제안한다. 우리의 기법은 입자의 개수가 많을수록 더욱 효율적이며 유체 표면의 세밀한 움직임 또한 표현하는 것이 가능하다.
https://doi.org/10.15701/kcgs.2017.23.1.25 인용 PDF KSCI

광선추적법의 속도개선을 위한 ZF-버퍼 알고리즘 연구 (A study on the ZF-buffer algorithm for Ray-tracing Acceleration)

김세현;윤경현
- 한국컴퓨터그래픽스학회논문지
- /
- 제6권1호
- /
- pp.29-36
- /
- 2000
본 논문은 광선추적법의 교차판별을 가속화할 수 있는 ZF-버퍼 방법을 제안한다. ZF-버퍼 방법은 광선추적법의 전처리 단계에서 Z-버퍼 방법을 적용하는데, 화면을 렌더링 하는 대신 화면에 렌더링 될 다각형 자료구조의 포인터를 기록하여 교차판별에 이용하는 방법이다. 결과적으로 해당 화소에서 광선과 교차할 가장 가까운 다각형을 찾아낼 수 있게 된다. ZF-버퍼 방법과 vista-버퍼 방법은 유사하지만 ZF-버퍼방법이 바운딩 볼륨을 사용하지 않고 화면에 나타날 다각형의 자료구조를 결과로 산출한다는 점이 다르다. 본 논문은 실험결과로서 9216개의 다각형으로 구성된 유타 주전자 영상을 사용하였으며 vista-버퍼와 비교하여 평균 3배정도의 속도 개선 효과가 있음을 확인하였으며, 또한 반사/굴절체에도 이 방법의 적용 가능성을 모색하였다.
PDF

토러스 패치 기반의 정밀 근사를 이용한 자유곡면의 기하학적 처리 (Geometric Processing for Freeform Surfaces Based on High-Precision Torus Patch Approximation)

박영진;홍규연;김명수
- 한국컴퓨터그래픽스학회논문지
- /
- 제25권3호
- /
- pp.93-103
- /
- 2019
3차원상의 자유곡면에 대한 효율적인 기하 연산을 지원하기 위한 새로운 공간자료구조로서 토러스 패치 기반 정밀 근사를 이용한 자유곡면의 기하학적 처리 기법을 소개한다. 토러스는 곡률이 양이나 음인 경우뿐만 아니라, 0인 부분도 있으므로 자유곡면의 볼록, 오목 여부에 상관없이 곡면을 정밀하게 근사할 수 있다. 전통적인 기법과 달리 토러스 패치는 자유곡면의 법벡터 방향까지 쉽게 모델링할 수 있고, 토러스의 오프셋은 다시 토러스가 되므로 다양한 기하 연산의 가속화를 지원할 수 있다. 자유곡면과 이를 근사하는 토러스 패치 집합 사이의 양방향 하우스도르프 거 리의 상한을 계산하여 토러스 패치를 이용하여 자유곡면을 높은 정밀도로 근사할 수 있음을 보였다. 이 기법을 이용하여 두 자유곡면의 교차곡선 계산과 자유곡면의 오프셋 곡면 생성을 쉽게 처리할 수 있음을 보였다.
https://doi.org/10.15701/kcgs.2019.25.3.93 인용 PDF KSCI

CNN을 이용한 Quad Tree 기반 2D Smoke Super-resolution (Quad Tree Based 2D Smoke Super-resolution with CNN)

홍병선;박지혁;최명진;김창헌
- 한국컴퓨터그래픽스학회논문지
- /
- 제25권3호
- /
- pp.105-113
- /
- 2019
물리 기반 유체 시뮬레이션은 고해상도 연산을 위해 많은 시간이 필요하다. 이 문제를 해결하기 위해 저해상도 유체 시뮬레이션의 한계를 딥 러닝으로 보완하는 연구들이 있으며, 그중에서는 저해상도의 시뮬레이션 데이터를 고해상도로 변환해주는 Super-resolution 분야가 있다. 하지만 기존 기법들은 전체 데이터 공간에서 밀도 데이터가 없는 부분까지 연산하므로 전체 시뮬레이션 속도 면에서 효율성이 떨어지며, 입력 해상도가 큰 경우에는 GPU 메모리가 부족해 연산할 수 없는 경우가 발생할 수 있다. 본 연구에서는 공간 분할 법 중 하나인 쿼드 트리를 활용하여 시뮬레이션 공간을 분할 및 분류하여 Super-resolution 하는 기법을 제안한다. 본 기법은 필요 공간만 Super-resolution 하므로 전체 시뮬레이션 가속화가 가능하고, 입력 데이터를 분할 연산하므로 GPU 메모리 문제를 해결할 수 있게 된다.
https://doi.org/10.15701/kcgs.2019.25.3.105 인용 PDF KSCI

검색결과 47건 처리시간 0.029초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)