• 제목/요약/키워드: NVIDIA Jetson TX2

검색결과 8건 처리시간 0.023초

모듈형 NVIDIA Jetson TX2 임베디드 제품에서의 블록체인 적합성 (Block Chain Conformance in Modular NVIDIA Jetson TX 2 Embedded Products)

  • 최효현;이경영;손동원
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.297-298
    • /
    • 2018
  • 본 논문에서는 모듈형 NVIDIA Jetson TX2 임베디드 제품에서 채굴을 통해 블록체인의 적합성 여부를 보인다. 범용성과 적합성의 평가기준은 TPS (Transactions Per Second), 블록생성시간(Block Generation Time)과 확정시간(Confirmation Time)이다. 채굴 준비 시 TX2 임베디드 제품의 특성상 하드웨어 드라이버를 자립적으로 설치 할 수 없기 때문에 HOST PC와 함께 사용하였다. HOST PC는 TX2 제품과 호환성이 높은 OS인 Ubuntu 14.04를 사용했으며, 하드웨어 드라이버 설치를 위해 NVIDIA 공식 TX2 제품 소프트웨어 중 JetPack 3.1 Release Version 을 사용하였다. 코인은 이더리움(Ethereum), 라이트코인(Litecoin)과 제트캐쉬(Zcash) 총 3종 코인으로, 채굴 시 나온 결과물로 TX2 제품에서 블록체인의 적합성 여부를 보였다.

  • PDF

Development of People Counting Algorithm using Stereo Camera on NVIDIA Jetson TX2

  • Lee, Gyucheol;Yoo, Jisang;Kwon, Soonchul
    • International journal of advanced smart convergence
    • /
    • 제7권3호
    • /
    • pp.8-14
    • /
    • 2018
  • In the field of surveillance cameras, it is possible to increase the people detection accuracy by using depth information indicating the distance between the camera and the object. In general, depth information is obtained by calculating the parallax information of the stereo camera. However, this method is difficult to operate in real time in the embedded environment due to the large amount of computation. Jetson TX2, released by NVIDIA in March 2017, is a high-performance embedded board with a GPU that enables parallel processing using the GPU. In this paper, a stereo camera is installed in Jetson TX2 to acquire depth information in real time, and we proposed a people counting method using acquired depth information. Experimental results show that the proposed method had a counting accuracy of 98.6% and operating in real time.

NVIDIA Jetson TX2에서 스테레오 매칭 알고리즘들에 대한 성능에 관한 연구 (A Study on the Performance of Stereo Matching Algorithms in NVIDIA Jetson TX2)

  • 이규철;유지상
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.164-165
    • /
    • 2018
  • 2017년 3월에 NVIDIA에서 출시한 Jetson TX2는 GPU를 탑재한 고성능의 임베디드 보드이다. 이 제품은 GPU를 이용한 병렬 처리를 통해 임베디드 시스템 상에서 연산량이 많은 알고리즘을 동작시킬 수 있다. 스테레오 매칭 기법은 스테레오 카메라를 이용하여 깊이 정보를 획득할 수 있으며, 획득한 깊이 정보는 다양한 어플리케이션의 메타 데이터로써 활용될 수 있다. 하지만 알고리즘의 연산량이 매우 많아 GPU를 탑재한 데스크톱에서만 동작하는 것이 일반적이었다. 이에 본 논문은 임베디드 보드인 Jetson TX2에서 기존에 개발되었던 스테레오 매칭 알고리즘들을 동작시키고 성능 분석을 통해 실시간 동작 여부에 대한 연구를 진행하였다.

  • PDF

실내 환경에서의 자율주행을 위한 중첩 이미지 학습 신경망 (Overlapped Image Learning Neural Network for Autonomous Driving in the Indoor Environment)

  • 조정원;이창우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.349-350
    • /
    • 2019
  • 기존 실내복도 환경에서 실험한 자율주행 드론[1]은 드론의 연산성능 한계로 인해 노트북이 신경망 연산을 해서 드론에게 조향명령을 내리는 방식이였다. 본 논문에서는 이러한 한계를 극복하기 위해 NVIDIA사의 Jetson TX2 보드를 활용하여 실내복도 환경에서의 자율주행을 연구하였다.

  • PDF

NVIDIA Jetson TX1 기반의 사람 표정 판별을 위한 YOLO 모델 FPS 향상 방법 (YOLO Model FPS Enhancement Method for Determining Human Facial Expression based on NVIDIA Jetson TX1)

  • 배승주;최현준;정구민
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.467-474
    • /
    • 2019
  • 본 이 논문에서는 NVIDIA Jetson TX1에서 YOLO v2 모델의 정확도를 유지하면서 FPS를 개선하는 방법을 제안한다. 일반적으로, 딥러닝 모델에서는 연산량을 줄여 처리 속도를 높이기 위해 파라미터들을 실수형에서 정수형으로 변환하여 정수 연산을 통해 속도를 높이거나 네트워크의 깊이를 감소시키는 방법을 사용한다. 그러나 이 방법들은 인식 정확도가 떨어질 수 있다. 이 논문에서는 YOLO v2 모델을 이용해 표정인식기를 개발하고 정확도 유지 시키기 위해 정수 연산이나 네트워크 깊이 감소를 사용하는 대신, 다음 세 가지 방법을 통해 연산량 및 메모리 소모를 줄인다. 첫 번째, $3{\times}3$ 필터를 $1{\times}1$ 필터로 교체하여 각 Layer 당 매개 변수 수를 9 분의 1로 줄인다. 두 번째, TensorRT의 추론 가속 기능 중 CBR (Convolution-Add Bias-Relu)을 통해 연산량을 줄이고, 마지막으로 TensorRT를 사용하여 반복되는 동일한 연산구조를 가진 레이어를 통합하여 메모리 소비를 줄인다. 시뮬레이션 결과, 기존 YOLO v2 모델에 비해 정확도는 1 % 감소했지만 FPS는 기존 3.9 FPS에서 11 FPS로 282%의 속도 향상을 보였다.

Real-time Multiple Pedestrians Tracking for Embedded Smart Visual Systems

  • Nguyen, Van Ngoc Nghia;Nguyen, Thanh Binh;Chung, Sun-Tae
    • 한국멀티미디어학회논문지
    • /
    • 제22권2호
    • /
    • pp.167-177
    • /
    • 2019
  • Even though so much progresses have been achieved in Multiple Object Tracking (MOT), most of reported MOT methods are not still satisfactory for commercial embedded products like Pan-Tilt-Zoom (PTZ) camera. In this paper, we propose a real-time multiple pedestrians tracking method for embedded environments. First, we design a new light weight convolutional neural network(CNN)-based pedestrian detector, which is constructed to detect even small size pedestrians, as well. For further saving of processing time, the designed detector is applied for every other frame, and Kalman filter is employed to predict pedestrians' positions in frames where the designed CNN-based detector is not applied. The pose orientation information is incorporated to enhance object association for tracking pedestrians without further computational cost. Through experiments on Nvidia's embedded computing board, Jetson TX2, it is verified that the designed pedestrian detector detects even small size pedestrians fast and well, compared to many state-of-the-art detectors, and that the proposed tracking method can track pedestrians in real-time and show accuracy performance comparably to performances of many state-of-the-art tracking methods, which do not target for operation in embedded systems.

GPU-Based ECC Decode Unit for Efficient Massive Data Reception Acceleration

  • Kwon, Jisu;Seok, Moon Gi;Park, Daejin
    • Journal of Information Processing Systems
    • /
    • 제16권6호
    • /
    • pp.1359-1371
    • /
    • 2020
  • In transmitting and receiving such a large amount of data, reliable data communication is crucial for normal operation of a device and to prevent abnormal operations caused by errors. Therefore, in this paper, it is assumed that an error correction code (ECC) that can detect and correct errors by itself is used in an environment where massive data is sequentially received. Because an embedded system has limited resources, such as a low-performance processor or a small memory, it requires efficient operation of applications. In this paper, we propose using an accelerated ECC-decoding technique with a graphics processing unit (GPU) built into the embedded system when receiving a large amount of data. In the matrix-vector multiplication that forms the Hamming code used as a function of the ECC operation, the matrix is expressed in compressed sparse row (CSR) format, and a sparse matrix-vector product is used. The multiplication operation is performed in the kernel of the GPU, and we also accelerate the Hamming code computation so that the ECC operation can be performed in parallel. The proposed technique is implemented with CUDA on a GPU-embedded target board, NVIDIA Jetson TX2, and compared with execution time of the CPU.

횡단보도 상황 인식 디바이스 개발 (Development of Crosswalk Situation Recognition Device)

  • 윤태진;노무호;여정훈;김재윤;이영훈;황승혁;김현수;김형준;박승렬;배창희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.143-144
    • /
    • 2020
  • 4차 산업 시대가 도래하여 빅데이터와 딥러닝 기술은 다양한 분야에서 아주 중요한 기술로 자리 잡고 있으며, 현재 세계 여러 분야에서 이 기술들을 이용하여 일상, 산업 분야에 적용을 시키고자 한다. 국내에서는 스마트 팩토리, 스마트 시티와 같은 분야에 적용하고 있다. 본 논문에서는 스마트 시티에 적용할 수 있는 횡단보도 상황을 인지하여 교통제어에 활용할 수 있는 빅데이터를 생산하거나 효율적인 교통제어에 활용할 수 있도록 Nvidia Jetson TX2와 실시간 객체 감지 기술인 YOLO v3를 이용하여 횡단보도용 상황 인식을 위한 영상인식 장치를 개발하였다. 제안하는 기술들을 이용하여 스마트시티 구축에 활용할 수 있고, 실시간으로 추가적으로 필요한 객체를 감지하여 확장이 용이한 장점이 있다. 또한 구현에서 효율성을 높이기 위하여 에지 컴퓨팅, 스페이스 디텍션과 같은 기술들을 활용하였다.

  • PDF