• 제목/요약/키워드: Matrix Multiplication

검색결과 167건 처리시간 0.026초

STRONG COMMUTATIVITY PRESERVING MAPS OF UPPER TRIANGULAR MATRIX LIE ALGEBRAS OVER A COMMUTATIVE RING

  • Chen, Zhengxin;Zhao, Yu'e
    • 대한수학회보
    • /
    • 제58권4호
    • /
    • pp.973-981
    • /
    • 2021
  • Let R be a commutative ring with identity 1, n ≥ 3, and let 𝒯n(R) be the linear Lie algebra of all upper triangular n × n matrices over R. A linear map 𝜑 on 𝒯n(R) is called to be strong commutativity preserving if [𝜑(x), 𝜑(y)] = [x, y] for any x, y ∈ 𝒯n(R). We show that an invertible linear map 𝜑 preserves strong commutativity on 𝒯n(R) if and only if it is a composition of an idempotent scalar multiplication, an extremal inner automorphism and a linear map induced by a linear function on 𝒯n(R).

매트릭스를 이용한 혼합교환도의 배치 알고리즘 (The Placement Algorithm of the Shuffle-Exchange Graph Using Matrix)

  • 하기종;최영규;황호정
    • 대한전자공학회논문지
    • /
    • 제24권2호
    • /
    • pp.355-361
    • /
    • 1987
  • The shuffle-exchange graph is known as a structure to perform the parallel algorithms like Discrete Fourier Transform(DFT), matrix multiplication and sorting. In this paper, the layout for the shuffle-exchange graph is described and this layout places emphasis on the placement of nodes that has the capability to have as small area as possible, have as a small number of crossings as possible, and have as short wires as possible. The algorithm corrdsponding these conditions is proposed and each evaluation factor and the placement of the N-node shuffle-exchange graph is performed with FORTRAN and BASIC program, and these results are calcualted.

  • PDF

희소 행렬 곱셈을 효율적으로 수행하기 위한 유동적 시스톨릭 어레이 구조 설계 (Design of the Adaptive Systolic Array Architecture for Efficient Sparse Matrix Multiplication)

  • 서주원;공준호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.24-26
    • /
    • 2022
  • 시스톨릭 어레이는 DNN training 등 인공지능 연산의 대부분을 차지하는 행렬 곱셈을 수행하기 위한 하드웨어 구조로 많이 사용되지만, sparsity 가 높은 행렬을 연산할 때 불필요한 동작으로 인해 효율성이 크게 떨어진다. 본 논문에서 제안된 유동적 시스톨릭 어레이는 matrix condensing, weight switching, 그리고 direct output path 의 방법과 구조를 통해 sparsity 가 높은 행렬 곱셈의 수행 사이클을 줄일 수 있다. 시뮬레이션을 통해 기존 시스톨릭 어레이와 유동적 시스톨릭 어레이의 성능을 비교하였으며 8×8, 16×16, 32×32 의 크기를 가진 행렬을 동일 크기의 시스톨릭 어레이로 연산하였을 때 필요 사이클 수를 최대 12 사이클 절감할 수 있는 것을 확인하였다.

다중 사용자 MIMO 방송 채널을 위한 $S^{2}MMSE$ 프리코딩 ($S^{2}MMSE$ Precoding for Multiuser MIMO Broadcast Channels)

  • 이민;오성근
    • 한국통신학회논문지
    • /
    • 제33권12A호
    • /
    • pp.1185-1190
    • /
    • 2008
  • 이 논문에서는 IST (information society technologies)-WINNER (wireless world initiative new radio) 프로젝트에서 MU-MIMO (multiuser multiple-input multiple-output) 프리코딩 방식으로 채택된 SMMSE (successive minimum mean square error) 프리코딩 방법의 프리코딩 행렬 생성을 단순화하기 위한 $S^{2}MMSE$ (simplified SMMSE) 알고리즘을 제안한다. 기존의 알고리즘이 모든 사용자들의 모든 수신 안테나들을 대상으로 개별 MMSE nulling을 필요로 하는 프리코멍 벡터들을 생성하는 것과 대조적으로, 제안되는 알고리즘은 먼저 사용자 별 MMSE nulling 과정을 수행하고, 해당 사용자 내에서는 이 결과를 공통으로 이용하여 개별 수신 안테나에서 추가적인 MMSE nulling 과정 없이 단순한 행렬-벡터 곱으로 프리코딩 벡터를 계산한다. 따라서, 이 알고리즘을 사용하면 SMMSE 프리코딩을 위한 프리코멍 행렬 생성을 크게 단순화시킬 수 있다.

MODELING OF INTERACTION LAYER GROWTH BETWEEN U-Mo PARTICLES AND AN Al MATRIX

  • Kim, Yeon Soo;Hofman, G.L.;Ryu, Ho Jin;Park, Jong Man;Robinson, A.B.;Wachs, D.M.
    • Nuclear Engineering and Technology
    • /
    • 제45권7호
    • /
    • pp.827-838
    • /
    • 2013
  • Interaction layer growth between U-Mo alloy fuel particles and Al in a dispersion fuel is a concern due to the volume expansion and other unfavorable irradiation behavior of the interaction product. To reduce interaction layer (IL) growth, a small amount of Si is added to the Al. As a result, IL growth is affected by the Si content in the Al matrix. In order to predict IL growth during fabrication and irradiation, empirical models were developed. For IL growth prediction during fabrication and any follow-on heating process before irradiation, out-of-pile heating test data were used to develop kinetic correlations. Two out-of-pile correlations, one for the pure Al matrix and the other for the Al matrix with Si addition, respectively, were developed, which are Arrhenius equations that include temperature and time. For IL growth predictions during irradiation, the out-of-pile correlations were modified to include a fission-rate term to consider fission enhanced diffusion, and multiplication factors to incorporate the Si addition effect and the effect of the Mo content. The in-pile correlation is applicable for a pure Al matrix and an Al matrix with the Si content up to 8 wt%, for fuel temperatures up to $200^{\circ}C$, and for Mo content in the range of 6 - 10wt%. In order to cover these ranges, in-pile data were included in modeling from various tests, such as the US RERTR-4, -5, -6, -7 and -9 tests and Korea's KOMO-4 test, that were designed to systematically examine the effects of the fission rate, temperature, Si content in Al matrix, and Mo content in U-Mo particles. A model converting the IL thickness to the IL volume fraction in the meat was also developed.

병렬신호처리시스템을 위한 성능 모니터의 구현 및 검증 (An Implementation and Verification of Performance Monitor for Parallel Signal Processing System)

  • 이원주;김효남
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.313-322
    • /
    • 2005
  • 본 논문에서는 TMS302C6711을 기본 프로세서로 사용하는 DSP Starter Kit(DSK)를 이용하여 병렬신호처리시스템의 성능을 측정하는 성능 모니터를 구현하고 검증한다. 이 성능 모니터의 특징은 DSP/BIOS의 기능 및 실시간 데이터 전송을 위한 RTDX(Real Time Data Exchange)를 사용하여 DSP 작업부하, 메모리 이용률, 그리고 브릿지 트래픽 등과 같은 병렬신호처리시스템의 성능 평가 척도를 측정할 수 있다는 것이다. 시뮬레이션에서는 DSP 알고리즘에서 널리 사용하는 FFT, 2D FFT, Matrix Multiplication, Fir Filter를 사용한다. 하나의 웨이브 파일에서 각각 다른 주기와 데이터 크기, 버퍼크기에 따른 결과를 성능 모니터와 TI(Texas Instrument)사의 코드 컴포저 스투디오로 측정한다. 그리고 그 결과를 비교함으로써 본 논문에서 구현한 성능 모니터의 정확성을 검증한다.

  • PDF

이진 영상을 위한 효율적인 이진 웨이블렛 복원 (Efficient Binary Wavelet Reconstruction for Binary Images)

  • 강의성
    • 컴퓨터교육학회논문지
    • /
    • 제5권4호
    • /
    • pp.43-52
    • /
    • 2002
  • 최근 들어 이진 영상에 대해서 적용될 수 있는 이진 웨이블렛이 제안되었다. 이진 영상에 대한 이진 웨이블렛 변환은 영상 압축, 에지 검출, 인식 등의 응용에서 이진 영상에 대한 실수 웨이블렛 변환 방법을 대치하여 사용될 수 있다. 그러나 이진 웨이블렛 복원 과정에서 행렬 연산에 의한 곱셈을 통하여 이루어져서 많은 계산량을 요구하기 때문에 실제의 응용에 적합하지 않다. 본 논문에서는 행렬 곱셈에 의한 이진 웨이블렛 복원 방법 대신에 필터링 연산에 의한 복원 방법을 제안한다. $N{\times}N$ 영상을 복원할 때, 기존의 방법이 $2N^3$ 개의 곱셈과 $2N(N-1)^2$ 개의 덧셈이 필요한 반면, 제안한 방법은 필터의 길이가 M일 때, $2MN^2$ 개의 곱셈과 $2(M-1)N^2$ 개의 덧셈을 요구한다. 일반적으로 필터의 길이 M은 영상의 크기 N에 비해서 매우 작으므로, 제안한 방법은 이진 웨이블렛 복원시, 기존의 행렬 곱셈을 이용한 방법에 비해서 계산량을 크게 줄일 수 있다.

  • PDF

GPU 가속기를 통한 비트 연산 최적화 및 DNN 응용 (Bit Operation Optimization and DNN Application using GPU Acceleration)

  • 김상혁;이재흥
    • 전기전자학회논문지
    • /
    • 제23권4호
    • /
    • pp.1314-1320
    • /
    • 2019
  • 본 논문에서는 소프트웨어 환경에서 비트연산을 최적화 하고 DNN으로 응용하는 방법을 제안한다. 이를 위해 비트연산 최적화를 위한 패킹 함수와 DNN으로 응용을 위한 마스킹 행렬 곱 연산을 제안한다. 패킹 함수의 경우는 32bit의 실제 가중치값을 2bit로 변환하는 연산을 수행한다. 연산을 수행할 땐, 임계값 비교 연산을 통해 2bit 값으로 변환한다. 이 연산을 수행하면 4개의 32bit값이 1개의 8bit 메모리에 들어가게 된다. 마스킹 행렬 곱 연산의 경우 패킹된 가중치 값과 일반 입력 값을 곱하기 위한 특수한 연산으로 이루어져 있다. 그리고 각각의 연산은 GPU 가속기를 이용해 병렬로 처리되게 하였다. 그 결과 HandWritten 데이터 셋에 환경에서 32bit DNN 모델에 비해 약 16배의 메모리 절약을 볼 수 있었다. 그럼에도 정확도는 32bit 모델과 비슷한 1% 이내의 차이를 보였다.

양자난수발생기 Quantis의 후처리 과정에 관한 암호학적 분석 (Cryptographic Analysis of the Post-Processing Procedure in the Quantum Random Number Generator Quantis)

  • 배민영;강주성;염용진
    • 정보보호학회논문지
    • /
    • 제27권3호
    • /
    • pp.449-457
    • /
    • 2017
  • 본 논문에서는 양자난수발생기 Quantis의 후처리 과정에 대하여 암호학의 관점에서 실험을 통하여 안전성과 성능을 분석하였다. Quantis의 후처리 과정은 수학적 이론에 근거한 이진행렬-벡터 곱 연산을 통해 풀엔트로피(full-entropy)를 출력하도록 설계되었고, NIST SP 800-90B의 최소엔트로피(min-entropy) 추정 테스트를 이용하여 이를 검증하였다. 이진행렬-벡터 곱 연산에 최적화 기법을 사용함으로써 난수 생성 속도에 미치는 영향을 최소화하였음을 확인하고, NIST SP 800-90B에서 제시한 검증된 Conditioning과의 난수 출력 성능을 비교하였다. 또한, 미국 NIST와 독일 BSI의 난수발생기 표준 모델과 Quantis의 부합되는 요소와 아닌 요소를 구분하였다. Quantis를 암호학의 용도로 사용하고자할 경우, CMVP 기준에 적합하게 이용하기 위해 Quantis의 출력 데이터를 승인된 의사 난수발생기의 씨드로 사용하여 출력한 난수를 사용하는 것이 적절하다고 판단된다.

OpenCL을 이용한 랜더링 노이즈 제거를 위한 뉴럴 네트워크 가속기 구현 (Implementation of Neural Network Accelerator for Rendering Noise Reduction on OpenCL)

  • 남기훈
    • 문화기술의 융합
    • /
    • 제4권4호
    • /
    • pp.373-377
    • /
    • 2018
  • 본 논문에서는 OpenCL을 이용한 랜더링 노이즈 제거를 위한 가속기 구현을 제안한다. 렌더링 알고리즘 중에 고품질 그래픽스를 보장하는 레이트레이싱을 선택하였다. 레이 트레이싱은 레이를 사용하여 렌더링하는데 레이를 적게 사용하면 노이즈가 발생한다. 레이를 많이 사용하게 되면 고화질의 이미지를 생성할 수 있으나 연산 시간이 상대적으로 길어지게 된다. 레이를 적게 사용하면서 연산시간을 줄이기 위해 뉴럴 네트워크를 이용한 LBF(Learning Based Filtering) 알고리즘을 적용하였다. 뉴럴 네트워크를 사용한다고 해서 항상 최적의 결과가 나오지는 않는다. 본 논문에서는 성능향상을 위해 일반적인 행렬 곱셈을 기반으로 하는 새로운 기법의 행렬 곱셈 접근법을 제시하였다. 개발환경으로는 고속병렬 처리가 특화된 OpneCL을 사용하였다. 제안하는 구조는 Kintex UltraScale XKU690T-2FDFG1157C FPGA 보드에서 검증하였다. 하나의 픽셀에 사용되는 파라미터를 계산 시간은 Verilog-HDL 구조보다 약 1.12배 빠른 것으로 확인했다.