• 제목/요약/키워드: Xavier

검색결과 119건 처리시간 0.032초

임베디드 시스템에서의 객체 분류를 위한 TVM기반의 성능 최적화 연구 (TVM-based Performance Optimization for Image Classification in Embedded Systems)

  • 허청환;예민해;신익희;이대우
    • 대한임베디드공학회논문지
    • /
    • 제18권3호
    • /
    • pp.101-108
    • /
    • 2023
  • Optimizing the performance of deep neural networks on embedded systems is a challenging task that requires efficient compilers and runtime systems. We propose a TVM-based approach that consists of three steps: quantization, auto-scheduling, and ahead-of-time compilation. Our approach reduces the computational complexity of models without significant loss of accuracy, and generates optimized code for various hardware platforms. We evaluate our approach on three representative CNNs using ImageNet Dataset on the NVIDIA Jetson AGX Xavier board and show that it outperforms baseline methods in terms of processing speed.

Jetson 임베디드 플랫폼에서의 YOLOv7 추론 속도 개선에 관한 연구 (A Study on the Improvement of YOLOv7 Inference Speed in Jetson Embedded Platform)

  • 강보찬;유동영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.154-155
    • /
    • 2023
  • 오픈 소스인 YOLO(You Only Look Once) 객체 탐지 알고리즘이 공개된 이후, 산업 현장에서는 고성능 컴퓨터에서 벗어나 효율과 특수한 환경에 사용하기 위해 임베디드 시스템에 도입하고 있다. 그러나, NVIDIA의 Jetson nano의 경우, Pytorch의 YOLOv7 딥러닝 모델에 대한 추론이 진행되지 않는다. 따라서 제한적인 전력과 메모리, 연산능력 최적화 과정은 필수적이다. 본 논문은 NVIDIA의 임베디드 플랫폼 Jetson 계열의 Xavier NX, Orin AGX, Nano에서 딥러닝 모델을 적용하기 위한 최적화 과정과 플랫폼에서 다양한 크기의 YOLOv7의 PyTorch 모델들을 Tensor RT로 변환하여 FPS(Frames Per Second)를 측정 및 비교한다. 측정 결과를 통해, 각 임베디드 플랫폼에서 YOLOv7 모델의 추론은 Tensor RT는 Pytorch에서 약 4.1배 적은 FPS 변동성과 약 2.25배 정도의 FPS 속도향상을 보였다.

An implicit damage-plastic model for concrete

  • Gustavo Luz Xavier da Costa
    • Computers and Concrete
    • /
    • 제33권3호
    • /
    • pp.301-308
    • /
    • 2024
  • This paper proposes a numerically-based methodology to implicitly model irreversible deformations in concrete through a damage model. Plasticity theory is not explicitly employed, although resemblances are still present. A scalar isotropic damage model is adopted and the damage variable is split in two: one contributing for stiffness degradation (cracking) and other contributing for irreversible deformations (plasticity). The proposed methodology is thermodynamically consistent as it consists in a damage model rewritten in different terms. Its Finite Element coding is presented, indicating that minor changes are necessary. It is also demonstrated that nonlinear algorithms are unnecessary to model concrete cracking and plasticity. Experimental data from direct tension and four-point bending tests under cyclic loading are compared to the proposed methodology. A numerical case study of a low-cycle fatigue is also presented. It can be concluded that the model is simple, feasible and capable to capture the essentials concerning cracking and plasticity.

절단된 분포를 이용한 인공신경망에서의 초기값 설정방법 (Initialization by using truncated distributions in artificial neural network)

  • 김민종;조성철;정혜린;이영섭;임창원
    • 응용통계연구
    • /
    • 제32권5호
    • /
    • pp.693-702
    • /
    • 2019
  • 딥러닝은 대용량의 데이터의 분류 및 예측하는 방법으로 각광받고 있다. 데이터의 양이 많아지면서 신경망의 구조는 더 깊어 지고 있다. 이때 초기값이 지나치게 클 경우 층이 깊어 질수록 활성화 함수의 기울기가 매우 작아지는 포화(Saturation)현상이 발생한다. 이러한 포화현상은 가중치의 학습능력을 저하시키는 현상을 발생시키기 때문에 초기값의 중요성이 커지고 있다.이런 포화현상 문제를 해결하기 위해 Glorot과 Bengio (2010)과 He 등 (2015) 층과 층 사이에 데이터가 다양하게 흘러야 효율적인 신경망학습이 가능하고 주장했다. 데이터가 다양하게 흐르기 위해서는 각 층의 출력에 대한 분산과 입력에 대한 분산이 동일해야 한다고 제안했다. Glorot과 Bengio (2010)과 He 등 (2015)는 각 층별 활성화 값의 분산이 같다고 가정해 초기값을 설정하였다. 본 논문에서는 절단된 코쉬 분포와 절단된 정규분포를 활용하여 초기값을 설정하는 방안을 제안한다. 출력에 대한 분산과 입력에 대한 분산의 값을 동일하게 맞춰주고 그 값이 절단된 확률분포의 분산과 같게 적용함으로써 큰 초기값이 나오는 걸 제한하고 0에 가까운 값이 나오도록 분포를 조정하였다. 제안된 방법은 MNIST 데이터와 CIFAR-10 데이터를 DNN과 CNN 모델에 각각 적용하여 실험함으로써 기존의 초기값 설정방법보다 모델의 성능을 좋게 한다는 것을 보였다.

자비에 돌란의 <단지 세상의 끝>에 그려진 가족관계 연구 (A Study on Family Relations Drawn at of Xavier Dolan)

  • 김태형
    • 한국산학기술학회논문지
    • /
    • 제20권12호
    • /
    • pp.622-628
    • /
    • 2019
  • <단지 세상의 끝 Juste la fin du monde>은 죽음을 눈앞에 둔 한 인간의 죽음에 대한 인식, 태도 그리고 성찰을 심도 있게 표현한 작품이다. 에이즈에 걸려 시한부 인생을 선고 받은 주인공이 12년 만에 고향으로 가족을 찾아간다는 단순한 스토리로 구성되어있는 이 작품은 이 과정에서 가족이란 무엇인지 우리에게 끊임없이 질문한다. 자신의 상태를 알리고 가족과의 소원했던 관계를 회복하고 영원하지만 아름다운 이별을 목적으로 한 이 방문은 오히려 그동안 숨겨왔던 혹은 애써 태연한척 받아들였던 가족 간의 원망, 증오, 비난의 감정을 여과 없이 드러낸다. 그렇다면 가족이라는 관계는 언제나 서로 이해가 되는 관계이며 서로 무조건 용서하고 보듬어 주어야만 하는 관계인가? 자비에 돌란 감독은 우리가 감추고자했던 가족 구성원 사이의 아픈 진실을 보여준다. 그리고 이 아픈 진실이 현실의 모습임을 자각토록 한다. 주인공 루이의 소극적인 자세, 그리고 그를 기다리고 있던 가족들의 불평과 불만 등은 멀어진 간극을 좁히는데 절대적으로 부족한 시간이었다. 저마다 상처를 간직한 채 서로를 진정으로 이해하지 못하고 있는 이 가족은 비록 '가족'이라는 공동체로 묶여 있긴 하지만 약한 결속력으로 인해 오히려 서로에 대한 감정의 골이 심화되는 모습을 보여줄 뿐이다.

선레이저 기반 이동체용 3차원 노면 모니터링 시스템 구현 (Implementation of 3D Road Surface Monitoring System for Vehicle based on Line Laser)

  • 최승호;김서연;김태식;민홍;정영훈;정진만
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.101-107
    • /
    • 2020
  • 노면측정은 노면 관리에서 노면의 평탄화된 정도 및 변위를 정량화하는 필수적인 과정이다. 보다 안전한 노면 관리 및 신속한 유지보수를 위해 이동체에서의 정밀한 노면 측정은 매우 중요하다. 본 논문에서는 이동체에서 측정가능한 정밀 노면측정 시스템을 제안한다. 제안 노면측정 시스템은 고성능의 선레이저 센서를 사용하여 노면 표면의 정밀한 측정을 지원한다. 또한 RTK로 부터 획득한 위치 데이터를 정합하여 종/횡방향 프로파일 측정이 가능하고 속도기반 적응적인 갱신 알고리즘을 통해 실시간적인 모니터링이 가능하다. 제안 시스템을 평가하기 위하여 Gocator 선레이저 센서, MRP 모듈, 및 NVIDIA Xavier 프로세서를 시험용 이동체에 탑재하여 노면에서 시험하였다. 시험 결과 MSE(mean square error) 기준 정확한 프로파일 측정이 가능함을 보인다. 제안 시스템은 도로의 상태 평가뿐 만 아니라 인접 지반의 영향도 평가에 활용될 수 있다.

통합메모리 장치에서 CPU-GPU 데이터 전송성능 연구 (A Performance Study on CPU-GPU Data Transfers of Unified Memory Device)

  • 권오경;구기범
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권5호
    • /
    • pp.133-138
    • /
    • 2022
  • 최근 고성능컴퓨팅, 인공지능 분야에서 GPU 장치 사용이 일반화되고 있지만, GPU 프로그래밍은 여전히 어렵게 여겨진다. 특히 호스트(host) 메모리와 GPU 메모리를 별도로 관리하기 때문에 성능과 편의성 방면에서 연구가 활발히 진행되고 있다. 이에 따라 여려가지 CPU-GPU 메모리 전송 방법들이 연구되고 있다. 한편 CPU와 GPU 및 통합메모리(Unified memory) 등 하나의 실리콘 패키지로 묶는 SoC(System on a Chip) 제품들이 최근에 많이 출시되고 있다. 본 연구는 이러한 통합메모리 장치에서 CPU, GPU 장치간 데이터를 사용하고 전송시 성능관련 비교를 하고자 한다. 기존 CPU내 호스트 메모리와 GPU 메모리가 분리된 환경과는 다른 특징을 보여준다. 여기서는 통합메모리 장치인 NVIDIA SoC칩들과 NVIDIA SMX 기반 V100 GPU 카드에서 CPU-GPU 간 데이터 전송 프로그래밍 기법별로 성능비교를 한다. 성능비교를 위해 워크로드는 HPC 분야의 수치계산에서 자주 사용하는 2차원 행렬 전치 커널이다. 실험을 통해 CPU-GPU 메모리 전송 프로그래밍 방법별 GPU 커널 성능차이, 페이지 잠긴 메모리와 페이지 가능 메모리를 사용했을 경우 전송 성능차이, 전체(Overall) 성능비교, 마지막으로 워크로드 크기별 성능비교를 하였다. 이를 통해 통합메모리칩인 NVIDIA Xavier에서 I/O 캐시일관성 지원을 통해 SoC 칩내 통합메모리에 대한 이점을 극대화 할 수 있음을 확인할 수 있었다.

Computational Materials Engineering: Recent Applications of VASP in the MedeA® Software Environment

  • Wimmer, Erich;Christensen, Mikael;Eyert, Volker;Wolf, Walter;Reith, David;Rozanska, Xavier;Freeman, Clive;Saxe, Paul
    • 한국세라믹학회지
    • /
    • 제53권3호
    • /
    • pp.263-272
    • /
    • 2016
  • Electronic structure calculations have become a powerful foundation for computational materials engineering. Four major factors have enabled this unprecedented evolution, namely (i) the development of density functional theory (DFT), (ii) the creation of highly efficient computer programs to solve the Kohn-Sham equations, (iii) the integration of these programs into productivity-oriented computational environments, and (iv) the phenomenal increase of computing power. In this context, we describe recent applications of the Vienna Ab-initio Simulation Package (VASP) within the MedeA$^{(R)}$ computational environment, which provides interoperability with a comprehensive range of modeling and simulation tools. The focus is on technological applications including microelectronic materials, Li-ion batteries, high-performance ceramics, silicon carbide, and Zr alloys for nuclear power generation. A discussion of current trends including high-throughput calculations concludes this article.

Should Male Circumcision be Advocated for Genital Cancer Prevention?

  • Morris, Brian J.;Mindel, Adrian;Tobian, Aaron A.R.;Hankins, Catherine A.;Gray, Ronald H.;Bailey, Robert C.;Bosch, Xavier;Wodak, Alex D.
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제13권9호
    • /
    • pp.4839-4842
    • /
    • 2012
  • The recent policy statement by the Cancer Council of Australia on infant circumcision and cancer prevention and the announcement that the quadrivalent human papillomavirus (HPV) vaccine will be made available for boys in Australia prompted us to provide an assessment of genital cancer prevention. While HPV vaccination of boys should help reduce anal cancer in homosexual men and cervical cancer in women, it will have little or no impact on penile or prostate cancer. Male circumcision can reduce cervical, penile and possibly prostate cancer. Promotion of both HPV vaccination and male circumcision will synergistically maximize genital cancer prevention.

Numerical analysis of the Influence of the presence of disbond region in adhesive layer on the stress intensity factors (SIF) and crack opening displacement (COD) in plates repaired with a composite patch

  • Benchiha, Aicha;Madani, Kouider;Touzain, Sebastien;Feaugas, Xavier;Ratwani, Mohan
    • Steel and Composite Structures
    • /
    • 제20권4호
    • /
    • pp.951-962
    • /
    • 2016
  • The determination of the stress intensity factor at the crack tip is one of the most widely used methods to predict the fatigue life of aircraft structures. This prediction is more complicated for repaired cracks with bonded composite patch. This study is used to compute the stress intensity factor (SIF) and crack opening displacement (COD) for cracks repaired with single and double-sided composite patches. The effect of the presence of disbond region in adhesive at the crack was taken into consideration. The results show that there is a considerable reduction in the asymptotic value of the stress-intensity factors and the crack opening displacement at the crack tip. The use of a double-sided patch suppresses the bending effect due to the eccentricity of the patch on one side only.