• Title/Summary/Keyword: 가속성능 최적화

Search Result 55, Processing Time 0.027 seconds

램 가속기 성능 향상을 위한 예 혼합기 조성비 최적화에 관한 연구

  • 전용희;이재우;변영환
    • Proceedings of the Korean Society of Propulsion Engineers Conference
    • /
    • 1999.10a
    • /
    • pp.15-15
    • /
    • 1999
  • 램 가속기에 대한 연구는 램 가속기의 작동 조건이 고온, 고압, 초고속이라는 점과 가속기 내부에서 급격한 화학반응이 수반된다는 특성으로 인하여 실험과 해석상의 상당한 어려움이 존재한다. 램 가속기는 작동 모드에 따라 탄체 후방의 열적 질식 조건을 이용한 열적 질식 모드(Thermally Choked Mode)와 탄체 표면에 형성되는 데토네이션파를 이용한 초폭굉모드(Superdetonative Mode)로 나뉘어진다. 본 연구는 초폭굉 모드로 작동하는 램 가속기의 작동 성능 향상을 위한 방법으로 수치 최적화 기법을 이용한 램 가속기 내부 예 혼합기의 조성비 최적화를 수행하였다. 설계 변수로는 수소와 질소의 조성비를 선정하였으며, 최적 설계 목표는 일정한 질량과 형상을 갖는 탄체를 초기속도 2500m/s에서 3000m/s로 가속시키기 위하여 필요한 최소 램 가속관의 길이로 정하였다. 본 연구에서는 구베법에 기반한 Simplex 방법 및 SLP(Sequential Linear Programming)등의 수치 최적화 기법을 적용하였고, 가속기 내부의 유동장은 해석의 효율성을 고려하여 이차원 비점성 유동으로 가정하였고, 비평형 화학반응 해석을 수행하였다.

  • PDF

Premixture Composition Optimization for the Ram Accelerator Performance Enhancement (램 가속기 성능 향상을 위한 예 혼합기 조성비 최적화에 관한 연구)

  • 전용희;이재우;변영환
    • Journal of the Korean Society of Propulsion Engineers
    • /
    • v.4 no.2
    • /
    • pp.21-30
    • /
    • 2000
  • Numerical design optimization techniques are implemented for the improvement of the ram accelerator performance. The design object is to find the minimum ram tube length required to accelerate projectile from initial velocity $V_o$ to target velocity $V_e$. The premixture is composed of $H_2$, $O_2$, $N_2$ and the mole numbers of these species are selected as design variables. The objective function and the constraints are linearized during the optimization process and gradient-based Simplex method and SLP(Sequential Linear Programming) have been employed. With the assumption of two dimensional inviscid flow for internal flow field, the analyses of the nonequilibrium chemical reactions for 8 steps 7 species have been performed. To determined the tube length, ram tube internal flow field is assumed to be in a quasi-steady state and the flow velocity is divided into several subregions with equal interval. Hence the thrust coefficients and accelerations for corresponding subregions are obtained and integrated for the whole velocity region. With the proposed design optimization techniques, the total ram tube length had been reduced 19% within 7 design iterations. This optimization procedure can be directly applied to the multi-stage, multi-premixture ram accelerator design optimization problems.

  • PDF

FPGA-based Artificial Neural Network Accelerator Optimization Using Approximate Computing (Approximate computing 기법을 이용한 FPGA 기반 인공 신경망 가속기 최적화)

  • Park, Sangwoo;Kim, Hanyee;Suh, Taeweon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.479-481
    • /
    • 2019
  • 본 연구에서는 이미지를 분류하는 인공 신경망 가속기를 최적화했고, 이를 구현하여 기존 인공 신경망 가속기와 성능을 비교 분석했다. FPGA(Field Programmable Fate Array) 보드를 이용하여 가속기를 구현했으며, 해당 보드의 내부 메모리인 BRAM 을 FIFO(First In First Out)구조로 설계하여 메모리 시스템을 구현했다. Approximate computing 기법을 효율적으로 적용하기 위해 FWL(Fractional Word Length)최적점을 분석했고, 이를 기반으로 인공 신경망 가속기의 부동 소수점 연산을 고정 소수점 연산으로 변환했다. 구현된 인공 신경망 가속기는 기존의 인공 신경망에 비해, 약 7.4%더 효율적인 전력소모량을 보였다.

Accelerating Ability Optimization for Dual Mode Hybrid Vehicle Using Complex Planetary Gears (복합 유성기어를 이용한 듀얼모드 하이브리드 자동차의 가속성능 최적화)

  • Yang, Si-U;Kim, Nam-Wook;Yang, Ho-Rim;Park, Yoeng-Il;Cha, Suk-Won
    • 한국신재생에너지학회:학술대회논문집
    • /
    • 2006.11a
    • /
    • pp.97-100
    • /
    • 2006
  • Accelerating ability is one of the most important performance of the vehicle. Unlike conventional internal combustion vehicles and power-assist hybrid vehicles, the maximized acceleration of dual mode hybrid vehicles is not simply. achieved by maximizing engine or motor torque Because of the dynamic stability of planetary gear, speeds and torques control of engine, motor 1 and motor 2 is essential and according to control value, acceleration performance is changed There are two control values which are velocity and torque for each component totalling six. These six values can be variables for an objective function. However, because three velocity variables can be regarded as only one variable speed ratio and the remaining three torque variables can be solved analytically, without complicated numerical algorithm the solution for the objective function can be obtained. This optimized solution shows the best performance possible to the specified dual mode system.

  • PDF

CNN Model Compression and On-Device Inference Acceleration (CNN 모델의 경량화 및 On-Device 추론 가속)

  • An Jae Jun;Lee Min Seo;Hong Seok In
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.7-8
    • /
    • 2024
  • 본 연구에서는 CNN 모델의 경량화 및 on-device 추론 가속을 목표로 한다. 경량화 기법으로는 QAT 기법을 사용하며 여러 환경에서의 성능을 비교한다. 이어서 on-device 추론 가속을 위해 Jetson Nano Board 에서 TensorRT 변환을 통해 모델을 최적화한다.

AI Accelerator Design for Edge Devices (엣지 디바이스를 위한 AI 가속기 설계 방법)

  • Whoi Ree, Ha;Hyunjun Kim;Yunheung Paek
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2024.05a
    • /
    • pp.723-726
    • /
    • 2024
  • 단일 dataflow 를 지원하는 DNN 가속기는 자원 효율적인 성능을 보이지만, 여러 DNN 모델에 대해서 가속 효과가 제한적입니다. 반면에 모든 dataflow 를 지원하여 매 레이어마다 최적의 dataflow를 사용하여 가속하는 reconfigurable dataflow accelerator (RDA)는 굉장한 가속 효과를 보이지만 여러 dataflow 를 지원하는 과정에서 필요한 추가 하드웨어로 인하여 효율적이지 못합니다. 따라서 본 연구는 제한된 dataflow 만을 지원하여 추가 하드웨어 요구사항을 감소시키고, 중복되는 하드웨어의 재사용을 통해 최적화하는 새로운 가속기 설계를 제안합니다. 이 방식은 자원적 한계가 뚜렷한 엣지 디바이스에 RDA 방식을 적용하는데 필수적이며, 기존 RDA 의 단점을 최소화하여 성능과 자원 효율성의 최적점을 달성합니다. 실험 결과, 제안된 가속기는 기존 RDA 대비 32% 더 높은 에너지 효율을 보이며, latency 는 불과 1%의 차이를 보였습니다.

CUDA Optimization of Super-Resolution Algorithm using ELBP Classifier (ELBP 분류기를 이용한 초해상도 기법의 CUDA 최적화)

  • Choi, Ji Hoon;Song, Byung Cheol
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.06a
    • /
    • pp.92-94
    • /
    • 2016
  • 저해상도 영상을 고해상도 영상으로 복원하기 위한 다양한 방법의 초해상도 기법이 존재한다. 다양한 기법들 중에서도 ELBP 분류기를 이용한 초해상도 기법[1]은 단일 영상 기반의 초해상도 기법으로 사전에 학습된 필터를 이용하여 고해상도 영상을 획득하는 기법이다. 그러나 해당 알고리즘을 일반적인 CPU 환경에서 수행할 경우 실시간으로 영상을 획득하는데 어려움이 존재한다. 본 논문에서는 지역메모리를 이용한 GPU 환경에서의 최적화를 수행하여 ELBP 분류기를 이용한 초해상도 기법의 가속성을 보인다. 먼저, 알고리즘에 대하여 간단히 설명하고 CUDA 가속화 기법[2]을 차례로 적용했을 때 얻을 수 있는 가속 성능을 확인한다. 최종적으로 본 논문은 CPU 환경과 비교했을 때 5 배의 가속 효과를 얻을 수 있다.

  • PDF

GPU Accelating of Pease FFT (Pease FFT의 GPU 가속)

  • Kwon, Oh-Young;Oh, Se-Chang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.131-134
    • /
    • 2013
  • 영상처리, 음성처리, 물리학, 천문학, 응용 수학등 다양한 분야에 FFT가 널리 사용되고 있다. FFT의 중요성 때문에 많은 연구가 이루어졌고, 최근 고속처리를 위하여 GPU를 활용한 FFT 알고리즘들이 개발되고 있다. 본 논문은 FFT알고리즘의 변형중 하나인 Pease FFT알고리즘을 GPGPU의 하드웨어 구성을 반영하여 최적화시킨 FFT 가속알고리즘을 제안한다. 실험결과 제안된 알고리즘은 CUFFT에 비하여 3% ~ 43%까지 우수한 성능을 보였다.

The Formation of Detonation Wave and Acceleration Characteristics with the Ram Accelerator Projectile Shapes (램 가속기 탄체 형상에 따른 데토네이션파와 가속 특성에 관한 연구)

  • 전용희;이재우
    • Journal of the Korean Society of Propulsion Engineers
    • /
    • v.3 no.2
    • /
    • pp.82-91
    • /
    • 1999
  • Projectile shapes of the superdetonative ram accelerator have great effects on shock structures, detonation wave formation, and ram acceleration characteristics. In this study, cone-cylinder-cone, a baseline projectile configuration of the superdetonative combustion mode, double-cone configurations and power-law shape, have been numerically investigated to analyze the effect of the front/rear configuration changes, on the flow field around the projectile, detonation wave formation process, and projectile acceleration characteristics. Hence, a ram projectile configuration with conspicuously improved acceleration characteristics has been proposed by adjusting the double cone angle and height. The results provide useful information for the ram accelerator design optimization study.

  • PDF

The Intelligent Shift Algorithm for Automatic Transmissions and The Development of Simulators for Its Optimization and Analysis (지능형 자동변속 알고리즘 개발 및 성능 분석과 최적화를 위한 시뮬레이터 개발)

  • Kang, Hyo-Seok;Hyun, Chang-Ho;Park, Mignon
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.20 no.5
    • /
    • pp.694-700
    • /
    • 2010
  • This paper proposes the intelligent shift algorithm for automatic transmissions and develops the simulator for the its optimization and analysis. It provides the comfortable ride to drivers and improves the driving force efficiency without any loss of the performance. In addition, the developed simulator not only cuts the commercialization cost but provides diverse test conditions. The analysis and optimization of the proposed scheme are verified by the developed simulator. As a simple example, the developed simulator verifies the proposed algorithm and shows the comparative result with the existed automatic transmission shift algorithm.