• 제목/요약/키워드: graphics hardware

검색결과 198건 처리시간 0.027초

합성곱 신경망 기반의 인공지능 FPGA 칩 구현 (A Realization of CNN-based FPGA Chip for AI (Artificial Intelligence) Applications)

  • 윤영
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2022년도 추계학술대회
    • /
    • pp.388-389
    • /
    • 2022
  • 최근 인공지능 분야는 자율주행, 로봇 및 스마트 통신등 다양한 분야에 응용되고 있다. 현재의 인공지능 응용분야는 파이썬을 기반으로 한 tensor flow를 이용하는 소프트웨어 방식을 이용하고 있으며, 프로세서로는 PC의 그래픽 카드 내부에 존재하는 GPU (Graphics Processing Unit)를 이용하고 있다. 그러나 GPU 기반의 소프트웨어 방식은 하드웨어를 변경할 수 없다는 문제점을 가지고 있다. 이러한 문제점으로 인해 높은 수준의 판단이나 작업을 요구하는 경우에는 이에 적합한 높은 사양의 GPU가 필요하며, 이러한 경우에는 인공지능 작업을 처리하는 그래픽 카드로 교체해야 한다. 이러한 문제점을 해결하기 위해 본 연구에서는 HDL (Hardware Description Language)을 이용하여 반도체 내부의 회로를 변경할 수 있는 FPGA (Field Programmable Gate Array)를 기반으로 한 신경망 회로를 이용하여 합성곱 신경망 기반의 인공지능 시스템을 구현하고자 한다.

  • PDF

그래픽 하드웨어 가속을 이용한 실시간 색상 인식 (Real-time Color Recognition Based on Graphic Hardware Acceleration)

  • 김구진;윤지영;최유주
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권1호
    • /
    • pp.1-12
    • /
    • 2008
  • 본 논문에서는 야외 및 실내에서 촬영된 차량 영상에 대해 실시간으로 차량 색상을 인식할 수 있는 GPU(Graphics Processing Unit) 기반의 알고리즘을 제시한다. 전처리 과정에서는 차량 색상의 표본 영상들로부터 특징벡터를 계산한 뒤, 이들을 색상 별로 조합하여 GPU에서 사용할 참조 텍스쳐(Reference texture)로 저장한다. 차량 영상이 입력되면, 특징벡터를 계산한 뒤 GPU로 전송하고, GPU에서는 참조 텍스쳐 내의 표본 특징리터들과 비교하여 색상 별 유사도를 측정한 뒤 CPU로 전송하여 해당 색상명을 인식한다. 분류의 대상이 되는 색상은 가장 흔히 발견되는 차량 색상들 중에서 선택한 7가지 색상이며, 검정색, 은색, 흰색과 같은 3가지의 무채색과 빨강색, 노랑색, 파랑색, 녹색과 같은 4가지의 유채색으로 구성된다. 차량 영상에 대한 특징벡터는 차량 영상에 대해 HSI(Hue-Saturation-Intensity) 색상모델을 적용하여 색조-채도 조합과 색조-명도 조합으로 색상 히스토램을 구성하고, 이 중의 채도 값에 가중치를 부여함으로써 구성한다. 본 논문에서 제시하는 알고리즘은 다양한 환경에서 촬영된 많은 수의 표본 특징벡터를 사용하고, 색상 별 특성을 뚜렷이 반영하는 특징벡터를 구성하였으며, 적합한 유사도 측정함수(likelihood function)를 적용함으로써, 94.67%에 이르는 색상 인식 성공률을 보였다. 또한, GPU를 이용함으로써 대량의 표본 특징벡터의 집합과 입력 영상에 대한 특징벡터 간의 유사도 측정 및 색상 인식과정을 병렬로 처리하였다. 실험에서는, 색상 별로 1,024장씩, 총 7,168장의 차량 표본 영상을 이용하여 GPU에서 사용하는 참조 텍스쳐를 구성하였다. 특징벡터의 구성에 소요되는 시간은 입력 영상의 크기에 따라 다르지만, 해상도 $150{\times}113$의 입력 영상에 대해 측정한 결과 평균 0.509ms가 소요된다. 계산된 특징벡터를 이용하여 색상 인식의 수행시간을 계산한 결과 평균 2.316ms의 시간이 소요되었고, 이는 같은 알고리즘을 CPU 상에서 수행한 결과에 비해 5.47배 빠른 속도이다. 본 연구에서는 차량만을 대상으로 하여 색상 인식을 실험하였으나, 일반적인 피사체의 색상 인식에 대해서도 제시된 알고리즘을 확장하여 적용할 수 있다.

스마트 시설환경 실시간 시뮬레이션을 위한 하드웨어 가속 기술 분석 (A Benchmark of Hardware Acceleration Technology for Real-time Simulation in Smart Farm (CUDA vs OpenCL))

  • 민재기;이동훈
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.160-160
    • /
    • 2017
  • 자동화 기술을 통한 한국형 스마트팜의 발전이 비약적으로 이루어지고 있는 가운데 무인화를 위한 지능적인 스마트 시설환경 관찰 및 분석에 대한 요구가 점점 증가 하고 있다. 스마트 시설환경에서 취득 가능한 시계열 데이터는 온도, 습도, 조도, CO2, 토양 수분, 환기량 등 다양하다. 시스템의 경계가 명확함에도 해당 속성의 특성상 타임도메인과 공간도메인 상에서 정확한 추정 또는 예측이 난해하다. 시설 환경에 접목이 증가하고 있는 지능형 관리 기술 구현을 위해선 시계열 공간 데이터에 대한 신속하고 정확한 정량화 기술이 필수적이라 할 수 있다. 이러한 기술적인 요구사항을 해결하고자 시도되는 다양한 방법 중에서 공간 분해능 향상을 위한 다지점 계측 메트릭스를 실험적으로 구성하였다. $50m{\times}100m$의 단면적인 연동 딸기 온실을 대상으로 $3{\times}3{\times}3$의 3차원 환경 인자 계측 매트릭스를 설치하였다. 1 Hz의 주기로 4가지 환경인자(온도, 습도, 조도, CO2)를 계측하였으며, 계측 하는 시점과 동시에 병렬적으로 공간통계법을 이용하여 미지의 지점에 대한 환경 인자들을 실시간으로 추정하였다. 선행적으로 50 cm 공간 분해능에 대응하기 위하여 Kriging interpolation법을 횡단면에 대하여 분석한 후 다시 종단면에 대하여 분석하였다. 3 Ghz에 해당하는 연산 능력을 보유한 컴퓨터에서 1초 동안 획득한 데이터에 대한 분석을 마치는데 소요되는 시간이 15초 내외로 나타났다. 이는 해당 알고리즘의 매우 높은 시간 복잡도(Order of $O=O^3$)에 기인하는 것으로 다양한 시설 환경의 관리 방법론에 적절히 대응하기에 한계가 있다 할 수 있다. 실시간으로 시간 복잡도가 높은 연산을 수행하기 위한 기술적인 과제를 해결하고자, 근래에 관심이 증가하고 있는 NVIDIA 사에서 제공하는 CUDA 엔진과 Apple사의 제안을 시작으로 하여 공개 소프트웨어 개발 컨소시엄인 크로노스 그룹에서 제공하는 OpenCL 엔진을 비교 분석하였다. CUDA 엔진은 GPU(Graphics Processing Unit)에서 정보 분석 프로그램의 연산 집약적인 부분만을 담당하여 신속한 결과를 산출할 수 있는 라이브러리이며 해당 하드웨어를 구비하였을 때 사용이 가능하다. 반면, OpenCL은 CUDA 엔진이 특정 하드웨어에서 구동이 되는 한계를 극복하고자 하드웨어에 비의존적인 라이브러리를 제공하는 것이 다르며 클러스터링 기술과 연계를 통해 낮은 하드웨어 성능으로 인한 단점을 극복하고자 하였다. 본 연구에서는 CUDA 8.0(https://developer.nvidia.com/cuda-downloads)버전과 Pascal Titan X(NVIDIA, CA, USA)를 사용한 방법과 OpenCL 1.2(https://www.khronos.org/opencl/)버전과 Samsung Exynos5422 칩을 장착한 ODROID-XU4(Hardkernel, AnYang, Korea)를 사용한 방법을 비교 분석하였다. 50 cm의 공간 분해능에 대응하기 위한 4차원 행렬($100{\times}200{\times}5{\times}4$)에 대하여 정수 지수화를 위한 Quantization을 거쳐 CUDA 엔진과 OpenCL 엔진을 적용한 비교한 결과, CUDA 엔진은 1초 내외, OpenCL 엔진의 경우 5초 내외의 연산 속도를 보였다. CUDA 엔진의 경우 비용측면에서 약 10배, 전력 소모 측면에서 20배 이상 소요되었다. 따라서 우선적으로 OpenCL 엔진 기반 하드웨어 가속 기술 최적화 연구를 통해 스마트 시설환경 실시간 시뮬레이션 기술 도입을 위한 기술적 과제를 풀어갈 것이다.

  • PDF

퐁 음영법을 위한 3차원 그래픽 가속기의 구현 (An Implementation of 3D Graphic Accelerator for Phong Shading)

  • 이형;박윤옥;박종원
    • 한국멀티미디어학회논문지
    • /
    • 제3권5호
    • /
    • pp.526-534
    • /
    • 2000
  • CAD/CAM, 3차원 모델링, 가상현실, 그리고 의학 영상의 처리 속도를 높이기 위한 3차원 가속기에 대한 많은 연구들이 진행 중이다. 본 논문에서는 3차원 그래픽 처리속도를 향상하기 위하여 SIMD처리기 구조의 3차원 가속기를 제안하며, 기존의 퐁 음영법을 제안된 구조에 맞게 병렬화하고 수행함으로써 직접적인 성능분석을 시도하였다. 3차원 SIMD 처리기 구조는 PCI 지역 버스 인터페이스, 16개의 처리기, 그리고 Park's 다중접근기억장치로 구성되며, 다중접근 기억장치는 17개의 외부 메모리 모듈을 갖는다. 기존의 직렬 퐁 음영법을 SIMD 처리기 구조에 수행될 수 있도록 하나의 다면체를 여러 개의 $4\times{4}$의 정방형 다면체로 나누어서 처리하는 병렬 퐁 음영 법으로 수정하였으며, 하나의 정방형 다면체는 다중접근기억장치가 간격이 1인 블록 접근이 가능하기 때문에 17개의 처리기가 동시에 처리할 수 있다. SIMD처리기 구조에서 수행되는 병렬화된 퐁 음영법을 하드웨어 모의실험 패키지인 CADENCE사의 Verilog-XL로 모의실험을 수행한 결과 5.14배의 속도향상을 보임을 확인하였다.

  • PDF

병렬 응용프로그램 실행 시 GPU 구조에 따른 성능 분석 (Performance Evaluation of the GPU Architecture Executing Parallel Applications)

  • 최홍준;김철홍
    • 한국콘텐츠학회논문지
    • /
    • 제12권5호
    • /
    • pp.10-21
    • /
    • 2012
  • 통합형셰이더 코어 구조 개발 이후 GPU는 그래픽스 전용 연산장치에서 범용 연산장치로 발달하고 있다. 특히, 병렬 응용 프로그램들은 병렬화된 하드웨어 구조를 효과적으로 활용할 수 있기 때문에, GPU를 활용하여 병렬 응용프로그램들을 실행시키는 기법이 주목을 받고 있다. 하지만, 현재의 GPU 구조는 비그래픽스 응용프로그램을 실행하는데 있어서 병렬성을 충분히 확보하지 못하다는 한계를 가지고 있기 때문에, 이를 해결하기 위해 GPU 구조는 빠르게 변화하고 있다. 본 논문에서는 GPU 구조의 개발 방향을 살펴보기 위해, 비그래픽스 병렬 응용프로그램들을 수행하는 경우에 코어 개수 및 동작 주파수 등의 하드웨어구조에 따른 GPU의 성능을 상세히 분석하고자 한다. 실험 결과, 코어 개수가 30에서 192로 늘어나고 동작주파수가 325MHz에서 450MHz로 증가함에 따라 GPU 성능은 28.9%에서 125.8%, 4.4%에서 16.2% 각각 향상되는 반면 성능 향상 효율성은 감소하는 것을 볼 수 있다. 성능 향상 효율성 감소의 주된 원인은 향상된 연산 능력에 맞추어 증가된 데이터 요구를 메모리가 적절하게 처리하지 못하기 때문이다. 결과적으로 GPU의 성능 향상 효율성을 더욱 높이기 위해서는 연산 능력 향상과 더불어 시스템 자원들 또한 GPU 구조에 맞게 변경되어야 함을 구체적인 실험을 통해 알 수 있다.

3D 애니메이션 제작을 위한 디자이너의 인지적 사고과정 분석 (Analysis on designer's cognitive thinking process in 3D animation design)

  • 김기수
    • 만화애니메이션 연구
    • /
    • 통권20호
    • /
    • pp.1-14
    • /
    • 2010
  • 영화 <아바타>의 영향으로 3D 입체 영상의 발전 전망에 대하여 사회적으로 많은 관심을 가지고 있으며 컴퓨터그래픽 기술을 지원하는 하드웨어 기술발전에도 지속적인 성장이 예측되고 있다. 또한 컴퓨터 인터넷 기반 3D네트워크 인프라의 저변 확대로 인터넷 상에서 3D 게임사업의 발전과 함께 2D 애니메이션의 기술적인 공유가 함께 이루어지고 있는 실정이다. 이러한 기술적인 발전으로 문화적인 디자인 제작 한계가 좁혀지고 애니메이션의 2D, 3D 저변확대가 빠르게 넓혀지고 있으나 디자이너가 작업하고자 하는 디지털 콘텐츠모양과 화면에서의 환경구조에 대한 문제해결방향을 분석하는데 있어 아직까진 한계를 보인다. 본 연구는 3D산업의 현황과 인지과학의 대표적인 연구방법인 절차 지향적인 분석을 통한 영상 애니메이션 디자이너의 작업 프로토콜을 분석하고 공통된 커뮤니케이션 및 작업도구를 사용하면서 표현 되는 행위를 관찰하여 그들의 작업 프로세스를 분석하고자 한다. 연구 결과를 도출하기 위하여 대표적인 선행연구를 고찰하고 여기서 나온 자료를 근거로 실증적인 심층 분석을 실시하였다. 분석방법으로 피험자가 3D 게임영상에 적용하기 위한 2D 아바타이미지를 스케치 하는 과정을 촬영하였으며 분석과정에서 발생되는 단계별 분석범주를 세분화하고 코드화 하여 디자이너가 문화적인 문제해결을 어떻게 극복하고 정리된 형태로 진행해 가는지를 살펴보았다.

  • PDF

블리킹을 이용한 대용량 초음파 볼륨 데이터 렌더링 (Large-Scale Ultrasound Volume Rendering using Bricking)

  • 김주환;권구주;신병석
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권7호
    • /
    • pp.117-126
    • /
    • 2008
  • 최근 높은 해상도의 볼륨 데이터를 획득할 수 있게 되면서 제한된 용량의 메모리를 가진 그래픽 하드웨어에서 대용량 볼륨 데이터를 렌더링 하는 방법이 필요하게 되었다. 대용량 볼륨 데이터의 렌더링 방법 중 데이터를 적절히 분할하여 순차적으로 처리하는 블리킹 (bricking) 방법이 많이 사용된다. 그러나 일반적인 블리킹 방법은 직교 좌표계를 사용하는 CT와 MR 데이터를 위해 고안된 것으로, 원환체 (torus) 좌표계를 사용하는 부채꼴 형태의 초음파 볼륨 데이터에 적용하면, 관측광선이 블릭 (brick)의 곡면경계로 진입한 후 다시 빠져 나갈 때 동일한 블릭이 GPU메모리에 두번 적재되는 경우가 발생한다. 본 논문에서는 초음파 볼륨을 랜더링 할 때 반복적인 텍스쳐 스위칭이 발생하지 않도록 블릭의 크기를 결정하는 방법을 제안한다. 블릭의 경계는 곡면으로 되어 있으므로 이들의 곡률을 계산하여, 관측광선이 동일한 블록을 두 번 참조하는 영역을 찾는다. 이 영역에 해당하는 복셀들을 인접한 두 블릭들이 공유하도록 크기를 정하면 둘 중의 한 블릭에서만 재샘플링하게 함으로써 블릭이 중복 적재되는 것을 피할 수 있다.

  • PDF

오큘러스 VR (Oculus VR)를 이용한 애니메이션 콘텐츠의 새로운 모색 - VR 플랫폼과 킬러콘텐츠를 중심으로 - (The new explore of the animated content using OculusVR - Focusing on the VR platform and killer content -)

  • 이종한
    • 만화애니메이션 연구
    • /
    • 통권45호
    • /
    • pp.197-214
    • /
    • 2016
  • 최근의 전 세계적으로 주목받고 있는 증감현실(增强現實, Augmented Reality, AR)과 가상현실(假想現實, virtual reality, VR), 그리고 이들을 섞은 혼합현실(mixed reality, MR)등은 과학의 테크놀로지 범주를 넘어 대중문화 전반에 큰 영향을 끼치고 있다. 구글, 애플, 삼성, 마이크로소프트, 소니, LG등 세계 굴지의 IT회사들은 대중을 위한 AR. VR 기술개발에 주력하고 있으며 크고 작은 관련 회사들도 해당 하드웨어, 소프트웨어, 콘텐츠 개발에 박차를 가하고 있다. 특정한 플랫폼이나 프로그램을 이용해 인간의 인지력을 인위적으로 조작 통해 특정한 장소나 상황을 경험하거나 보이지 않는 것을 보이게 해준다는 의미에서 AR, VR, MR은 모두 가상의 공간의 현실화라는 공통적인 기술을 포괄하고 있다. 특히, 기존의 평면적 구도의 한계성을 드러낸 입체영상에서 벗어나 180도, 360도 영상으로 객관적 시야와 감각과 같은 주관적 현상을 동시에 제공하고 참가자들이 이를 선택 할 수 있어 참가와 몰입을 크게 유도 할 수 있는 VR 기술은 업계뿐만 아니라 일반대중에게도 초유의 관심을 이끌어내고 있다. 2015년 선댄스 영화제의 뉴 프론티어 프로그램에서는 10개 이상의 관련 작품이 소개 되었고 열풍이 되어버린 게임인 '포켓몬 고(PoKetmon GO)'는 세계 게임시장을 석권하고 있으며 의료, 건축, 쇼핑, 영화, 애니메이션 등 관련 콘텐츠가 등장하고 있고 관련 모바일 어플리케이션도 이미 수천 개 이상 상용화 되어있다. 또한 시판되는 360도 카메라를 통해 개인이 VR 영상을 제작/공유 할 수 있어 유저간의 쌍방형 터널이 가능해 지고 있다. VR 기술의 적용범위 확대와 다양한 현실화로 앞으로 가능성도 희망적으로 여기고 있다. 이는 세계적인 추세며 우리나라 역시 후발주자로 그 추세를 따르고 있다. 그럼에도 불구하고 일부 학자들은 VR, 즉, 가상공간의 현실화가 주는 윤리적 퇴행과 가치관의 혼란이 내재 되어있음을 지적하고 있다. 4K혹은 HUD, 위치추적, 동작 센서, 연산능력, 그리고 뛰어난 3D그래픽, 촉감, 냄새 등의 4D기술, 3차원 오디오 기술 등이 그 어느 때 보다 발전해 리얼리티에 최대한 접근하고 있고 그에 따른다. 윤리적 퇴행, 정체성, 세대갈등, 현실도피 등이 우려되기 때문이다. 리얼리티를 추구하는 애니메이션 역시 이 범주 안에 든다. 미학적 이미지와 환영성의 특정한 구조를 살펴본다면 오히려 영상이라는 유사점을 가지고 있음에도 불구하고 순수한 애니메이션이 VR 콘텐츠 제작에 가장 뒤쳐져 있는 요인이 될 수도 있다. 하지만 VR기술과 플랫폼이 게임과 오락성에 치중 해 있지만 그 안에는 결국 시각적인 VR영상으로 구성 되어 있다는 점을 감안한다면 평면상에 머물고 있는 애니메이션에도 새로운 모색점을 맞이하게 될 것이 분명하다. 결국 어떻게 VR기술을 이용한 가상공간에서 만들어지는 리얼리티가 애니메이션에 적용 할 수 있을까? 그렇다면 방법과 수단이 무엇이 될 것인가 하는 문제에 대한 연구가 공통된 관심이 될 것이다. 그동안 평면적인 화면에 시간과 공간의 연속성에 제한을 받아온 애니메이션은 VR기술을 통해 제한에서 벗어나고자 하는 움직임이 일어나고 있다.