• 제목/요약/키워드: TensorRT

검색결과 11건 처리시간 0.03초

TensorRT와 SSD를 이용한 실시간 얼굴 검출방법 (Real Time Face detection Method Using TensorRT and SSD)

  • 유혜빈;박명숙;김상훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권10호
    • /
    • pp.323-328
    • /
    • 2020
  • 최근에는 딥러닝 기술을 이용하여 물체 검출 및 인식에서 성능이 크게 향상되는 새로운 접근방법들이 빠르게 제안되고 있다. 객체, 특히 얼굴객체 검출에 관한 여러 기법(Faster R-CNN, R-CNN, YOLO, SSD 등) 중 SSD는 다른 기법들보다 정확도와 속도에서 우수하다. 동시에 여러 객체 검출 네트워크들(object detection network)도 쉽게 이용할 수 있다. 본 논문에서는 객체 검출 네트워크 중 Mobilenet v2 network를 이용하고 SSD와 결합한 모델을 훈련하고, TensorRT engine을 이용하여 기존의 성능보다 4배 이상의 속도로 객체를 검출하는 방법에 대해 제안하고 실험을 통해 성능을 검증한다. 제안한 방법의 성능 검증을 위한 응용으로 얼굴객체 검출기(facial object detector)를 만들어 다양한 상황에서 동작과 성능을 실험하였다.

TensorRT 엔진과 SSD를 이용한 Face detection (Objedet detection using TensorRT engine and SSD)

  • 유혜빈;김상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.574-576
    • /
    • 2020
  • 최근에는 딥러닝 기술의 발달로 물체 인식 및 검출에 관한 기술들 또한 발탄하고 있다. 검출에 관한 여러 기법(Faster R-CNN, R-CNN, YOLO, SSD 등) 중 SSD는 다른 기법들과는 다르게 높은 정확도와 빠른 속도가 특징이다. 동시에 여러 detection network들도 쉽게 이용이 가능하다. 본 논문에서는 detection netowork중 Mobilenet V2 network를 이용하여 SSD와 결합해 모델을 훈련하고, TensorRT engine을 이용하여 더 빠른 속도로 검출할 수 있는 방법에 대해 논의한다. 이 방법을 통해 face detector를 만들어 여러 상황에서 쓰일 수 있도록 한다.

NVIDIA Jetson TX1 기반의 사람 표정 판별을 위한 YOLO 모델 FPS 향상 방법 (YOLO Model FPS Enhancement Method for Determining Human Facial Expression based on NVIDIA Jetson TX1)

  • 배승주;최현준;정구민
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.467-474
    • /
    • 2019
  • 본 이 논문에서는 NVIDIA Jetson TX1에서 YOLO v2 모델의 정확도를 유지하면서 FPS를 개선하는 방법을 제안한다. 일반적으로, 딥러닝 모델에서는 연산량을 줄여 처리 속도를 높이기 위해 파라미터들을 실수형에서 정수형으로 변환하여 정수 연산을 통해 속도를 높이거나 네트워크의 깊이를 감소시키는 방법을 사용한다. 그러나 이 방법들은 인식 정확도가 떨어질 수 있다. 이 논문에서는 YOLO v2 모델을 이용해 표정인식기를 개발하고 정확도 유지 시키기 위해 정수 연산이나 네트워크 깊이 감소를 사용하는 대신, 다음 세 가지 방법을 통해 연산량 및 메모리 소모를 줄인다. 첫 번째, $3{\times}3$ 필터를 $1{\times}1$ 필터로 교체하여 각 Layer 당 매개 변수 수를 9 분의 1로 줄인다. 두 번째, TensorRT의 추론 가속 기능 중 CBR (Convolution-Add Bias-Relu)을 통해 연산량을 줄이고, 마지막으로 TensorRT를 사용하여 반복되는 동일한 연산구조를 가진 레이어를 통합하여 메모리 소비를 줄인다. 시뮬레이션 결과, 기존 YOLO v2 모델에 비해 정확도는 1 % 감소했지만 FPS는 기존 3.9 FPS에서 11 FPS로 282%의 속도 향상을 보였다.

Jetson 임베디드 플랫폼에서의 YOLOv7 추론 속도 개선에 관한 연구 (A Study on the Improvement of YOLOv7 Inference Speed in Jetson Embedded Platform)

  • 강보찬;유동영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.154-155
    • /
    • 2023
  • 오픈 소스인 YOLO(You Only Look Once) 객체 탐지 알고리즘이 공개된 이후, 산업 현장에서는 고성능 컴퓨터에서 벗어나 효율과 특수한 환경에 사용하기 위해 임베디드 시스템에 도입하고 있다. 그러나, NVIDIA의 Jetson nano의 경우, Pytorch의 YOLOv7 딥러닝 모델에 대한 추론이 진행되지 않는다. 따라서 제한적인 전력과 메모리, 연산능력 최적화 과정은 필수적이다. 본 논문은 NVIDIA의 임베디드 플랫폼 Jetson 계열의 Xavier NX, Orin AGX, Nano에서 딥러닝 모델을 적용하기 위한 최적화 과정과 플랫폼에서 다양한 크기의 YOLOv7의 PyTorch 모델들을 Tensor RT로 변환하여 FPS(Frames Per Second)를 측정 및 비교한다. 측정 결과를 통해, 각 임베디드 플랫폼에서 YOLOv7 모델의 추론은 Tensor RT는 Pytorch에서 약 4.1배 적은 FPS 변동성과 약 2.25배 정도의 FPS 속도향상을 보였다.

Development of a Low-cost Industrial OCR System with an End-to-end Deep Learning Technology

  • Subedi, Bharat;Yunusov, Jahongir;Gaybulayev, Abdulaziz;Kim, Tae-Hyong
    • 대한임베디드공학회논문지
    • /
    • 제15권2호
    • /
    • pp.51-60
    • /
    • 2020
  • Optical character recognition (OCR) has been studied for decades because it is very useful in a variety of places. Nowadays, OCR's performance has improved significantly due to outstanding deep learning technology. Thus, there is an increasing demand for commercial-grade but affordable OCR systems. We have developed a low-cost, high-performance OCR system for the industry with the cheapest embedded developer kit that supports GPU acceleration. To achieve high accuracy for industrial use on limited computing resources, we chose a state-of-the-art text recognition algorithm that uses an end-to-end deep learning network as a baseline model. The model was then improved by replacing the feature extraction network with the best one suited to our conditions. Among the various candidate networks, EfficientNet-B3 has shown the best performance: excellent recognition accuracy with relatively low memory consumption. Besides, we have optimized the model written in TensorFlow's Python API using TensorFlow-TensorRT integration and TensorFlow's C++ API, respectively.

TRT Pose를 이용한 모바일 로봇의 사람 추종 기법 (Development of Human Following Method of Mobile Robot Using TRT Pose)

  • 최준현;주경진;윤상석;김종욱
    • 대한임베디드공학회논문지
    • /
    • 제15권6호
    • /
    • pp.281-287
    • /
    • 2020
  • In this paper, we propose a method for estimating a walking direction by which a mobile robots follows a person using TRT (Tensor RT) pose, which is motion recognition based on deep learning. Mobile robots can measure individual movements by recognizing key points on the person's pelvis and determine the direction in which the person tries to move. Using these information and the distance between robot and human, the mobile robot can follow the person stably keeping a safe distance from people. The TRT Pose only extracts key point information to prevent privacy issues while a camera in the mobile robot records video. To validate the proposed technology, experiment is carried out successfully where human walks away or toward the mobile robot in zigzag form and the robot continuously follows human with prescribed distance.

4족 보행 로봇 기반의 실시간 사람 검출 방법 (Real-time human detection method based on quadrupedal walking robot)

  • 한성민;유상중;이건;박명숙;김상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.468-470
    • /
    • 2022
  • 본 논문은 강화학습 POMDP(Partially Observable Markov Decision Process) 알고리즘을 사용하여 자갈밭과 같은 비평탄 지형을 극복하는 4족 보행 지능로봇을 설계하고 딥러닝 기법을 사용하여 사람을 검출한다. 로봇의 임베디드 환경에서 1단계 검출 알고리즘인 YOLO-v7과 SSD의 기본 모델, 경량 또는 네트워크 교체 모델의 성능을 비교하고 선정된 SSD MobileNet-v2의 검출 속도를 개선하기 위해 TensorRT를 사용하여 최적화를 진행하였다

드론 기반 실시간 객체 식별을 위한 추론 가속화 평가 (An Evaluation of Inference Acceleration for Drone-based Real-time Object Detection)

  • 권승상;문용혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.408-410
    • /
    • 2022
  • 최근 데이터 획득 위치에 가장 근접하고, 저 수준의 계산력을 제공하는 엣지 기기를 중심으로 직접 딥러닝 추론을 수행하고자 하는 요구가 증가하고 있다. 본 논문에서는 드론에서 촬영한 교통 영상 데이터를 기반으로, 다수의 차량 종류 및 보행자를 식별하는 모델을 Jetson Nano 에 탑재하여 기본 성능을 측정한다. 더불어, 자원제약형 기기 환경에서 TensorRT 와 Deepstream 을 활용하여 객체 식별 모델의 연산 경량화 및 추론 가속화 성능을 극대화하기 위한 구현 및 실험을 수행하여 Anchor-based 및 Anchor-free 객체 식별 모델의 정확도와 실시간 대응력을 평가하고 논의한다.

공공 다중CCTV 기반에서 재식별 기술을 활용한 특정대상 탐지 및 추적기법 구현 (Implementation of Specific Target Detection and Tracking Technique using Re-identification Technology based on public Multi-CCTV)

  • 황주성;뉴엔탄하이;강수경;김영규;김주용;정명석;이주연
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.49-57
    • /
    • 2022
  • 정부에서는 전국에 설치된 공공 CCTV를 이용하여 실종아동 등 범죄 예방을 위하여 많은 노력을 하고 있다. 하지만, 운용인력의 부족과 장시간 집중에 따른 집중력 약화 그리고 추적의 어려움 등이 나타나고 있다. 또한, 딥러닝 알고리즘을 통하여 실시간 객체 탐색 및 재인식 그리고 추적을 적용하는 것은 복잡한 신경망 분석의 사유로 파라미터가 증가하고 속도감소 메모리 부족이라는 현상을 나타냈다. 본 논문에서는 실시간 객체 인식이 가능한 Yolo의 적용과 Batch 및 TensorRT 기술 적용을 통하여 신경망을 경량화를 통하여 속도 개선 및 메모리 절약이 가능하도록 설계하였다. 이 논문에서는 이러한 발전된 알고리즘의 연구를 바탕으로 K-reciprocal nearest neighbor 알고리즘, Jaccard distance 비유사도 측정 알고리즘, 산출물 알고리즘 등을 개발하여 공공 CCTV 식별추적시스템 구축을 제시하였다. 그 결과, 비교분석을 통한 알고리즘 조합을 통해 공공 다중CCTV환경에서 실시간으로 객체를 인식하고 재식별하여 객체를 추적할 수 있는 한국형 공공 추적시스템을 제안하였다.

임베디드 기기를 위한 딥러닝 점자블록 인식 방법 (Deep Learning Braille Block Recognition Method for Embedded Devices)

  • 김희진;윤재혁;권순각
    • 한국산업정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.1-9
    • /
    • 2023
  • 본 논문은 딥러닝을 통해 실시간으로 임베디드 기기에서 점자 블록을 인식하는 방법을 제안한다. 먼저 고성능 컴퓨터에서 점자 블록 인식을 위한 딥러닝 모델을 학습시키고, 임베디드 기기에 적용하기 위하여 학습 모델을 경량화 도구에 적용한다. 점자 블록의 보행 정보를 인식하기 위해 영상에서 점자블록과의 거리를 이용하여 경로를 판별하는 알고리즘을 사용한다. 임베디드 기기를 통해 촬영한 영상에서 YOLOv8 모델을 통해 점자 블록, 볼라드, 횡단보도를 검출한 후 점자블록 경로 판별 알고리즘을 거쳐 보행정보를 인식한다. 실시간으로 점자 블록을 검출하기 위해 모델 경량화 도구를 YOLOv8에 적용한다. YOLOv8 모델 가중치의 정밀도를 기존 32비트에서 8비트로 낮추고, TensorRT 최적화 엔진을 적용하여 모델의 최적화를 진행한다. 제안된 방법을 통해 경량화 된 모델을 기존 모델과 비교한 결과, 경로 인식 정확도는 99.05%로 기존 모델과 거의 차이가 없지만, 인식 속도는 기존 모델 대비 59% 단축되어 1초에 약 15개의 프레임을 처리할 수 있다.