• 제목/요약/키워드: 엣지 디바이스

검색결과 45건 처리시간 0.028초

경량 CNN 가속기를 위한 Radix-2 Booth 기반 가변 정밀도 곱셈기 (Radix-2 Booth-based Variable Precision Multiplier for Lightweight CNN Accelerators)

  • 금덕현;전승진;최재영;김지혁;김선희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.494-496
    • /
    • 2022
  • 엣지 디바이스에서 딥러닝을 활용하기 위하여 CNN 경량화 연구들이 진행되고 있다. 경량 CNN 은 대부분 고정 소수점을 사용하며, 계층에 따라 정밀도는 달라진다. 본 논문에서는 경량 CNN 을 지원하기 위하여, 사용 계층에 따라 정밀도를 선택할 수 있는 가변 정밀도 곱셈기를 제안한다. 제안하는 가변 정밀도 곱셈기는 낮은 정밀도 곱셈기를 병합하는 구조로, 정밀도가 낮을 때는 병렬 처리를 통해 효율을 높인다. 제안하는 곱셈기를 Verilog HDL로 설계하고 ModelSim 에서 동작을 확인하였다. 설계된 곱셈기는 계층별로 정밀도가 다른 CNN 가속기에서 효율적으로 적용될 것으로 기대된다.

SystemC기반 CNN 시뮬레이터 구현 (SystemC-based CNN Simulator)

  • 김진영;이승수;김예준;임승호;조상영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.30-33
    • /
    • 2020
  • 최근 엣지 컴퓨팅과 같은 임베디드 디바이스에서 CNN과 같은 딥러닝 모듈을 수행하기 위해서 하드웨어 설계 및 구현이 많이 진행되고 있다. 이러한 임베디드 시스템에 필요한 CNN모듈을 위한 하드웨어 설계를 위해서 먼저 모델링을 통해서 시뮬레이션이 필요하다. 본 논문에서는 오픈 라이센스를 이용한 RISC-V로 딥러닝 시뮬레이터를 제작하였다. SystemC로 구현된 RISC-V를 Virtual Platform로 시뮬레이터의 제작을 하여 시뮬레이팅을 하였고, SystemC의 특징인 모듈화와 모듈간 통신에 유의하여 시스템을 구성하였다. CNN 알고리즘을 참조하여 Convolution, Activation, Pooling 연산의 기능을 하는 시스템을 구성하였다.

대조 학습 기반 초해상도 모델 경량화 기법 (Compression of Super-Resolution model Using Contrastive Learning)

  • 문현철;권용훈;정진우;김성제
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1322-1324
    • /
    • 2022
  • 최근 딥러닝의 발전에 따라 단일 이미지 초해상도 분야에 좋은 성과를 보여주고 있다. 그러나 보다 더 높은 성능을 획득하기 위해 네트워크의 깊이 및 파라미터의 수가 크게 증가하였고, 모바일 및 엣지 디바이스에 원활하게 적용되기 위하여 딥러닝 모델 경량화의 필요성이 대두되고 있다. 이에 본 논문에서는 초해상도 모델 중 하나인 EDSR(Enhanced Deep Residual Network)에 대조 학습 기반 지식 전이를 적용한 경량화 기법을 제안한다. 실험 결과 제안한 지식 전이 기법이 기존의 다른 지식 증류 기법보다 향상된 성능을 보임을 확인하였다.

  • PDF

IP 카메라와 클라우드 기반 스마트 해상물류 창고 관리 시스템 (Cloud-based smart maritime logistics warehouse management system with IP cameras)

  • 류강현;강대훈;김동민;김민호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1082-1083
    • /
    • 2023
  • 우리나라의 수출입 대부분은 해상을 통해 이루어지고 있으나 항만의 물류 창고는 데이터 네트워크를 통한 유기적인 화물의 출입과 현황관리가 부족한 실정이다. 이는 부족한 데이터 네트워크 인프라와 CCTV에 의한 아날로그 영상 데이터에 의존하는 기존 시스템의 한계로 인해 기인하는 바가 크다. 이에 IP 카메라와 엣지 디바이스의 영상분석에 의한 개별 화물 창고의 디지털 현황 분석 기반을 구축하고 분산된 개별 화물 창고의 데이터를 클라우드에 위치한 중앙 집중 데이터 분석 시스템을 구축하여 유연한 개별 화물 창고 관리와 지속적인 모니터링 기반을 제공한다. 사용자 인터페이스는 웹 기반으로 구축하여 항만 화물 관계자에게 편의성과 위치에 구애받지 않는 서비스를 제공한다. 이 과정에서 사설 IoT 네트워크를 통한 최소한의 시공비용으로 항만 내 인터넷 데이터 네트워크를 구축하여 향후 항만 내 다양한 데이터 서비스를 위한 초석을 제공한다.

MEC 시스템에서 태스크 파티셔닝 기법의 성능 비교 (Performance Comparison of Task Partitioning Methods in MEC System)

  • 문성원;임유진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권5호
    • /
    • pp.139-146
    • /
    • 2022
  • 최근 사물 인터넷의 발전과 함께 차량과 IT 기술의 융합되어 자율주행과 같은 고성능의 어플리케이션들이 등장하면서 멀티 액세스 엣지 컴퓨팅(MEC)이 차세대 기술로 부상하였다. 이런 계산 집약적인 태스크들을 낮은 지연시간 안에 제공하기 위해, 여러 MEC 서버(MECS)들이 협력하여 해당 태스크를 수행할 수 있도록 태스크를 파티셔닝하는 기법들이 많이 제안되고 있다. 태스크 파티셔닝과 관련된 연구들은 모바일 디바이스에서 태스크를 파티셔닝하여 여러 MECS들에게 오프로딩을 하는 기법과 디바이스에서 MECS로 오프로딩한 후 해당 MECS에서 파티셔닝하여 다른 MECS들에게 마이그레이션하는 기법으로 나누어볼 수 있다. 본 논문에서는 오프로딩과 마이그레이션을 이용한 파티셔닝 기법들을 파티셔닝 대상 선정 방법 및 파티셔닝 개수 변화에 따른 서비스 지연시간, 거절률 그리고 차량의 에너지 소비량 측면에서의 성능을 분석하였다. 파티셔닝 개수가 증가할수록 지연시간의 성능은 향상하나, 거절률과 에너지 소모량의 성능은 감소한다.

최적의 스마트 홈 제어 시스템 설계 및 구현 (Design and Implementation of Optimal Smart Home Control System)

  • 이형로;인치호
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.135-141
    • /
    • 2018
  • 본 논문에서는 최적의 스마트 홈 제어 시스템의 설계 및 구현 방법에 대해 설명한다. 최근 센서와 통신과 같은 기술들을 발전으로 사물인터넷은 전구, 콘센트, 옷과 같은 다양한 사물을 제어할 수 있게 되었으며, 다양한 기업에서는 사물간의 협업을 통해 사용자의 삶을 향상 시킬 수 있는 서비스들을 출시되고 있다. 하지만, 기존 사물인터넷 시스템에서는 엔드 투 엔드 디바이스인 경우 다양한 프로토콜을 통해 데이터를 전송하지만 서버 및 게이트웨이는 단일 프로토콜을 지원하는 경우가 빈번하다. 또한, 사물인터넷 시스템의 제조사에 따라서 전용 어플리케이션이 존재하며, 여러 사물인터넷 디바이스들을 등록하고 제어하는데 있어서 높은 복잡성을 가지고 있다. 증강현실 사물인터넷 시스템인 경우 사물들을 검출하기 위해 OpenCV 또는 OpenGL을 사용하여 특징점 및 엣지 추출 기술을 사용 하지만 사물의 인식률이 샘플링 데이터에 따라서 편차가 크게 존재하며, 비교적 낮은 문제점이 존재한다. 제안하는 최적의 스마트 홈 시스템에서는 기존의 문제점을 보완하기 위해 OneM2M을 기반으로 사물인터넷 게이트웨이를 구현하여 엔드 투 엔드 디바이스의 다양한 프로토콜들을 지원하고, 단일 어플리케이션을 통해 다양한 사물을 제어 등 사용자의 접근성을 향상시켰다. 또한, 인공지능 분야의 딥러닝을 사용하여 디바이스들을 학습시키고 추론 및 검출을 통해 기존 시스템의 사물 인식률 향상과 인식률의 편차를 낮추었다.

사출성형공정 모니터링용 엣지 디바이스 개발 및 평가 (Development and evaluation of edge devices for injection molding monitoring)

  • 김종선;이준한
    • Design & Manufacturing
    • /
    • 제14권4호
    • /
    • pp.25-39
    • /
    • 2020
  • In this study, an edge device that monitors the injection molding process by measuring the mold vibration(acceleration) signal and the mold surface temperature was developed and evaluated its performance. During injection molding, signals of the injection start, V/P switchover, and packing end sections were obtained through the measurement of the mold vibration and the injection time and packing time were calculated by using the difference between the times of the sections. Then, the mold closed and mold open signals were obtained using a magnetic hall sensor, and cycle time was calculated by using the time difference between the mold closed time each process. As a result of evaluating the performance by comparing the process data monitored by the edge device with the shot data recorded on the injection molding machine, the cycle time, injection time, and packing time showed very small error of 0.70±0.38%, 1.40±1.17%, and 0.69±0.82%, respectively, and the values close to the actual were monitored and the accuracy and reliability of the edge device were confirmed. In addition, it was confirmed that the mold surface temperature measured by the edge device was similar to the actual mold surface temperature.

TPMP : ARM TrustZone을 활용한 DNN 추론 과정의 기밀성 보장 기술 (TPMP: A Privacy-Preserving Technique for DNN Prediction Using ARM TrustZone)

  • 송수현;박성환;권동현
    • 정보보호학회논문지
    • /
    • 제32권3호
    • /
    • pp.487-499
    • /
    • 2022
  • 딥러닝과 같은 기계학습 기술은 최근에 광범위하게 활용되고 있다. 이러한 딥러닝은 최근 낮은 컴퓨팅 성능을 가지는 임베디드 기기 및 엣지 디바이스에서 보안성 향상을 위해 ARM TrustZone과 같은 신뢰 수행 환경에서 수행되는데, 이와 같은 실행 환경에서는 제한된 컴퓨팅 자원으로 인해 정상적인 수행에 방해를 받는다. 이를 극복하기 위해 DNN 모델 partitioning을 통해 TEE의 제한된 memory를 효율적으로 사용하며 DNN 모델을 보호하는 TPMP를 제안한다. TPMP는 최적화된 memory 스케줄링을 통해 기존의 memory 스케줄링 방법으로 수행할 수 없었던 모델들을 TEE 내에서 수행하여 시스템 자원 소모를 거의 증가시키지 않으면서 DNN의 높은 기밀성을 달성한다.

엣지 디바이스에서의 병렬 프로그래밍 모델 성능 비교 연구 (A Performance Comparison of Parallel Programming Models on Edge Devices)

  • 남덕윤
    • 대한임베디드공학회논문지
    • /
    • 제18권4호
    • /
    • pp.165-172
    • /
    • 2023
  • Heterogeneous computing is a technology that utilizes different types of processors to perform parallel processing. It maximizes task processing and energy efficiency by leveraging various computing resources such as CPUs, GPUs, and FPGAs. On the other hand, edge computing has developed with IoT and 5G technologies. It is a distributed computing that utilizes computing resources close to clients, thereby offloading the central server. It has evolved to intelligent edge computing combined with artificial intelligence. Intelligent edge computing enables total data processing, such as context awareness, prediction, control, and simple processing for the data collected on the edge. If heterogeneous computing can be successfully applied in the edge, it is expected to maximize job processing efficiency while minimizing dependence on the central server. In this paper, experiments were conducted to verify the feasibility of various parallel programming models on high-end and low-end edge devices by using benchmark applications. We analyzed the performance of five parallel programming models on the Raspberry Pi 4 and Jetson Orin Nano as low-end and high-end devices, respectively. In the experiment, OpenACC showed the best performance on the low-end edge device and OpenSYCL on the high-end device due to the stability and optimization of system libraries.

엣지 디바이스에서 객체 탐지를 위한 그룹별 어탠션 기반 경량 디코더 연구 (A group-wise attention based decoder for lightweight salient object detection on edge-devices)

  • 티엔투고;엠디 딜로와르 호씬;허의남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.30-33
    • /
    • 2023
  • The recent scholarly focus has been directed towards the expeditious and accurate detection of salient objects, a task that poses considerable challenges for resource-limited edge devices due to the high computational demands of existing models. To mitigate this issue, some contemporary research has favored inference speed at the expense of accuracy. In an effort to reconcile the intrinsic trade-off between accuracy and computational efficiency, we present novel model for salient object detection. Our model incorporate group-wise attentive module within the decoder of the encoder-decoder framework, with the aim of minimizing computational overhead while preserving detection accuracy. Additionally, the proposed architectural design employs attention mechanisms to generate boundary information and semantic features pertinent to the salient objects. Through various experimentation across five distinct datasets, we have empirically substantiated that our proposed models achieve performance metrics comparable to those of computationally intensive state-of-the-art models, yet with a marked reduction in computational complexity.