• 제목/요약/키워드: matrix multiplication

검색결과 170건 처리시간 0.022초

OpenCL을 이용한 랜더링 노이즈 제거를 위한 뉴럴 네트워크 가속기 구현 (Implementation of Neural Network Accelerator for Rendering Noise Reduction on OpenCL)

  • 남기훈
    • 문화기술의 융합
    • /
    • 제4권4호
    • /
    • pp.373-377
    • /
    • 2018
  • 본 논문에서는 OpenCL을 이용한 랜더링 노이즈 제거를 위한 가속기 구현을 제안한다. 렌더링 알고리즘 중에 고품질 그래픽스를 보장하는 레이트레이싱을 선택하였다. 레이 트레이싱은 레이를 사용하여 렌더링하는데 레이를 적게 사용하면 노이즈가 발생한다. 레이를 많이 사용하게 되면 고화질의 이미지를 생성할 수 있으나 연산 시간이 상대적으로 길어지게 된다. 레이를 적게 사용하면서 연산시간을 줄이기 위해 뉴럴 네트워크를 이용한 LBF(Learning Based Filtering) 알고리즘을 적용하였다. 뉴럴 네트워크를 사용한다고 해서 항상 최적의 결과가 나오지는 않는다. 본 논문에서는 성능향상을 위해 일반적인 행렬 곱셈을 기반으로 하는 새로운 기법의 행렬 곱셈 접근법을 제시하였다. 개발환경으로는 고속병렬 처리가 특화된 OpneCL을 사용하였다. 제안하는 구조는 Kintex UltraScale XKU690T-2FDFG1157C FPGA 보드에서 검증하였다. 하나의 픽셀에 사용되는 파라미터를 계산 시간은 Verilog-HDL 구조보다 약 1.12배 빠른 것으로 확인했다.

Resolving Memory Bottlenecks in Hardware Accelerators with Data Prefetch

  • Hyein Lee;Jinoo Joung
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.1-12
    • /
    • 2024
  • 최근 다양한 분야에서 딥러닝이 사용되면서, 더 빠르고 정확한 결과를 내는 딥러닝이 더욱 중요해졌다. 이를 위해서는 많은 양의 저장 공간이 필요하고, 대용량 연산을 진행해야 한다. 이에 따라 여러 연구는 빠르고 정확하게 연산 처리가 가능한 하드웨어 가속기를 이용한다. 하지만 하드웨어 가속기는 CPU와 하드웨어 사이를 이동하면서 병목현상이 발생하게 된다. 따라서 본 논문에서는 하드웨어 가속기의 병목현상을 효율적으로 줄일 수 있는 데이터 프리패치 전략을 제안한다. 데이터 프리패치 전략의 핵심 아이디어는 Matrix Multiplication Unit(MMU)가 연산을 진행하는 동안 다음 연산에 필요한 데이터를 예측하여 로컬 메모리로 올려 병목현상을 줄인다. 또한, 이 전략은 듀얼 버퍼를 이용하여 읽고 쓰는 두 가지 동작을 동시에 진행하여 처리율을 높인다. 이를 통해 데이터 전송의 지연시간 및 실행 시간을 감소시킨다. 시뮬레이션을 통해 듀얼 버퍼를 이용한 병렬 프로세싱과 데이터 프리패치를 이용한 메모리 간 병목현상을 최대한 감소시켜 하드웨어 가속기의 성능이 24% 향상함을 알 수 있다.

대안적인 분류기준: 오분류율곱 (Alternative Optimal Threshold Criteria: MFR)

  • 홍종선;김효민;김동규
    • 응용통계연구
    • /
    • 제27권5호
    • /
    • pp.773-786
    • /
    • 2014
  • 본 연구는 ROC 곡선에서 형성되는 면적 형태로 나타나는 분류정확도기준인 오분류율곱(multiplication of false rates; MFR)를 제안한다. MFR 기준과 다른 기준로부터 구한 최적분류점의 분류성과에 대하여 비교 분석한다. 다양한 분포함수에 대하여 최적분류점을 구하고 이에 대응하는 FNR과 FPR을 비교하면서 MFR의 특징과 장점을 유도한다. 일반적인 비용함수를 바탕으로 분류점에 대한 비용비율을 다양한 분류기준을 이용하여 구한다. 비용곡선에 대한 비용비율의 관계를 정리하여 MFR 기준의 장점을 탐색한다. MFR 기준의 정의를 다차원 ROC 분석으로 확장하고 다차원의 다른 분류기준과의 관계를 설명하면서 토론한다.

필터 뱅크를 사용한 효율적인 short-length running convolution 알고리즘 (Efficient short-length running convolution algorithm using filter banks)

  • 장영범;오세만;이원상
    • 대한전자공학회논문지SP
    • /
    • 제42권6호
    • /
    • pp.187-194
    • /
    • 2005
  • 이 논문에서는 FIR 필터의 연산의 양을 줄이는 효율적인 직접방식의 고속 알고리즘을 제안하였다. 제안된 알고리즘은 임의의 다운샘플링 크기로 병렬화가 가능하며, 다운샘플링의 크기가 결정되면 쉽게 구조를 유도할 수 있다. 특히 제안된 알고리즘은 이론적인 샘플당 곱셈연산의 수를 감소시킴과 동시에 실제 구현에 있어서도 효과가 있음을 실험을 통하여 입증하였다. 이론적으로 연산의 양이 감소함을 보이기 위하여 부필터의 수와 샘플당 곱셈연산의 수를 기존의 고속 알고리즘과 비교하였으며, 실제적으로 구현의 효과를 입증하기 위하여 하드웨어 구현소자의 수와 MAC 프로세서를 사용한 소프트웨어 구현으로 역시 기존의 방식들과 비교하여 제안된 구조가 효과적임을 보였다.

Geometry Optimization of Dispersed U-Mo Fuel for Light Water Reactors

  • Ondrej Novak;Pavel Suk;Dusan Kobylka;Martin Sevecek
    • Nuclear Engineering and Technology
    • /
    • 제55권9호
    • /
    • pp.3464-3471
    • /
    • 2023
  • The Uranium/Molybdenum metallic fuel has been proposed as promising advanced fuel concept especially in the dispersed fuel geometry. The fuel is manufactured in the form of small fuel droplets (particles) placed in a fuel pin covered by a matrix. In addition to fuel particles, the pin contains voids necessary to compensate material swelling and release of fission gases from the fuel particles. When investigating this advanced fuel design, two important questions were raised. Can the dispersed fuel performance be analyzed using homogenization without significant inaccuracy and what size of fuel drops should be used for the fuel design to achieve optimal utilization? To answer, 2D burnup calculations of fuel assemblies with different fuel particle sizes were performed. The analysis was supported by an additional 3D fuel pin calculation with the dispersed fuel particle size variations. The results show a significant difference in the multiplication factor between the homogenized calculation and the detailed calculation with precise fuel particle geometry. The recommended fuel particle size depends on the final burnup to be achieved. As shown in the results, for lower burnup levels, larger fuel drops offer better multiplication factor. However, when higher burnup levels are required, then smaller fuel drops perform better.

변형 비적 적응 필터의 수렴 특성 개선에 관한 연구 (A Study on the Convergence Characteristics Improvement of the Modified-Multiplication Free Adaptive Filer)

  • 김건호;윤달환;임제탁
    • 한국통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.815-823
    • /
    • 1993
  • 본 논문에서는 곱셈연산이 필요치 안은 변형 비적 적응필터(MMADF : Modified Multiplication-free adaptive Filter) 알고리즘을 제안하고 수렴특성을 해석하였다. 제안한 구조는 DPCM(Differential Pulse Code Modulation)과 Sign 알고리듬을 이용한 MADF 구조에서 1차 필터를 첨가한 구조이다. 해석방법은 계수 비정렬벡터와 그 자기상관행렬의 수렴을 유도하였다. 수렴특성을 평가하기 위하여 분할등기(FSE : Fractionally Spaced Equallizer)에 적용하였으며, Sign 알고리듬, MADF 알고리듬, MMADF 알고리듬을 사용하여 정상상태오차와 수렴속도로 특성을 비교평가 하였다. MMADF 알고리듬을 FSE에 적용한 결과 안정된 수렴특성을 나타내었으며, 동일한 정상상태오차를 갖는 조건에서 시뮬레이션한 결과 기존의 Sign 및 MADF 알고리듬에 비해 신호특성 및 수렴속도가 개선 되었다.

  • PDF

유한체위에서 정규기저의 고속생성과 저비용 연산 알고리즘의 구현에 관한 연구 (On Implementations of Algorithms for Fast Generation of Normal Bases and Low Cost Arithmetics over Finite Fields)

  • 김용태
    • 한국전자통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.621-628
    • /
    • 2017
  • 유한체위에서 사칙연산의 H/W 구현의 효율성은 사용하는 유한체의 기저 선택에 의해서 크게 좌우된다. 그러한 H/W 구현의 효율성의 관점에서 보면, 정규기저가 가장 적절한 이유는, 표수가 2인 유한체 $GF(2^n)$의 원소를 GF(2)위에서 정규기저로 표현하면, 원소의 제곱은 단순하게 좌표의 순환이동이 되기 때문이다. 본 논문에서는, 모든 유한체에서 관용기저로 부터 정규기저로 고속으로 변환하는 알고리즘을 소개하였으며 그 알고리즘을 이용한 H/W 구현결과와 우리의 방법으로 구현한 정규기저를 이용하여, 유한체 $GF(2^n)$위에서 두 원소의 곱셈과 역원을 구하는 효율적인 알고리즘에 따른 프로그램과 H/W 구현결과를 제시하였다.

LQ 제어와 근의 이동범위를 이용한 중근의 극배치 방법 (Pole Placement Method of a Double Poles Using LQ Control and Pole's Moving-Range)

  • 박민호
    • 한국산학기술학회논문지
    • /
    • 제21권1호
    • /
    • pp.20-27
    • /
    • 2020
  • 일반적으로 비선형 시스템은 1차와 2차 시스템의 곱의 형태로 선형화되며, 시스템은 실근, 중근, 서로 다른 두 실근, 복소근의 4종류의 근을 가진다. 이 논문은 시스템이 가지는 4가지 근 중에서 조단블록을 갖는 중근을 복소근으로 이동시키는 LQ 제어의 가중행렬과 제어법칙을 설계하는 방법에 관한 것이다. 상태가중행렬을 제한 조건으로 하고 성능지수함수를 최소화하는 LQ 제어는 시스템의 안정성을 보장하고 시스템의 근을 이동시키는 극배치 기능을 가지고 있다. 그렇지만 이 방법은 시행착오 방법으로 설계 변수인 가중행렬을 설정하고, 이동되는 근의 위치를 정확히 지정할 수 없는 문제가 있다. 이 문제를 해결하기 위해 해밀토니안 시스템의 특성방정식을 대각행렬의 제어가중행렬과 삼각함수로 표현된 상태가중행렬을 이용하여 기술한다. 이동할 복소근이 이 특성방정식의 근이라는 조건에서 중근과 상태가중행렬의 관계식(𝜌, 𝜃)을 유도하고 상태가중행렬이 양의 반한정행렬이라는 조건에서 중근의 이동범위를 구하고, 좌표평면에 도시한다. 그려진 중근의 이동범위에서 복소근을 선택하여 관계식에 대입하여 상태가중행렬을 계산하고, 이것에서 제어법칙이 구한다. 예제에서 3차 시스템의 중근을 이동시키는 제어법칙의 설계과정을 통해 제안한 방법의 타당성을 확인하였다.

전송선로행열에 대한 유사변환을 이용한 PCB기판 임피던스 해석 (PCB Board Impedance Analysis Using Similarity Transform for Transmission Matrix)

  • 서영석
    • 한국정보통신학회논문지
    • /
    • 제13권10호
    • /
    • pp.2052-2058
    • /
    • 2009
  • 디지털 시스템의 동작주파수가 증가하고 전압스윙폭이 감소함에 따라 PCB보드의 정확하고 빠른 해석이 중요하게 되었다. 단위 기둥 행열의 다중곱을 이용하는 전송선로 행열을 이용한 방법은 PCB보드 해석에 있어서 가장 빠른 방법이다. 본 논문에서 PCB보드 임피던스를 계산하는 새로운 방법이 제안되었다. 우선, 이 방법에서 PCB의 단위기둥에 대한 전송선로행열의 고유치와 고유벡터가 계산되고, 단위기둥에 대한 전송선로 행열은 행열요소의 곱셈횟수를 줄이기 위해 행열유사변환을 통해 변환된다. 이러한 유사변환을 방법은 기존방법에 비해 계산시간을 대폭 줄여 줄 수 있다. 제안된 방법은 가로 1.3인치 세로 1.9인치의 PCB기판에 적용되었고, 10배 정도의 계산시간저감 효과를 보였다. 제안된 방법은 보드임피던스의 반복적인 계산을 필요로 하는 PCB설계에 응용될 수 있다.

삼중 행렬 곱셈의 효율적 연산 (An Efficient Computation of Matrix Triple Products)

  • 임은진
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.141-149
    • /
    • 2006
  • 본 논문에서는 회로 설계 소프트웨어에서 사용되는 primal-dual 최적화 문제의 해를 구하기 위해 필요한 삼중 행렬 곱셈 연산 ($P=AHA^{t}$)의 성능 개선에 관하여 연구하였다. 이를 위하여 삼중 행렬 곱셈 연산의 속도를 개선하기 위하여 기존의 2단계 연산 방법을 대신하여 1단계 연산 방법을 제안하고 성능을 분석하였다. 제안된 방법은 희소 행렬 H의 블록 대각 구조의 특성을 이용하여 부동 소숫점 연산량을 감소시킴으로써 성능 개선을 이루었으며 더불어 메모리 사용량도 기존 방법에 비하여 50% 이하로 감소하였다. 그 결과 Intel Itanium II 플랫폼에서 기존 2단계 연산 방법과 비교하여 속도 면에서 주어진 실험 데이터 집합에 대하여 평균 2.04 의 speedup을 얻었다. 또한 본 논문에서는 플랫폼의 메모리 지연량과 예측된 캐쉬 미스율을 이용한 성능 모델링을 통하여 이와 같은 성능 개선 수치의 가능 범위를 보이고 실측된 성능개선을 평가하였다. 이와 같은 연구는 희소 행렬의 성능 개선 연구를 기본 연산이 아닌 복합 연산에 적용하는 연구로써 큰 의미가 있다.

  • PDF