• 제목/요약/키워드: Matrix Multiplication

검색결과 167건 처리시간 0.022초

Reed-Muller 전개식에 의한 다치 논리회로의 구성에 관한 연구 (Study on Construction of Multiple-Valued Logic Circuits Based on Reed-Muller Expansions)

  • 성현경
    • 정보처리학회논문지A
    • /
    • 제14A권2호
    • /
    • pp.107-116
    • /
    • 2007
  • 본 논문에서는 Reed-Muller 전개식에 의한 다치 논리 회로의 구성에 관한 한 가지 방법을 제시하였다. 먼저, Perfect Shuffle 기법과 Kronecker 곱에 의한 다치 논리함수의 입출력 상호연결에 대하여 논하였고, GF(4)의 가산회로와 승산회로를 이용하여 다치 Reed-Muller 전개식의 변환행렬과 역변환행렬을 실행하는 기본 셀을 설계하였다. 이 기본 셀들과 Perfect Shuffle과 Kronecker 곱에 의한 입출력 상호연결 방법을 이용하여 다치 Reed-Muller 전개식에 의한 다치 논리 회로를 구현하였다. 제시된 다치 Reed-Muller 전개식의 설계방법은 모듈구조를 기반으로 하여 행렬변환을 이용하므로 동일한 함수에 대하여 타 방법과 비교하여 간단하고 회로의 가산회로와 증산회로를 줄이는데 매우 효과적이다. 제안된 다치 논리회로의 설계방법은 회선경로 선택의 규칙성, 간단성, 배열의 모듈성과 병렬동작의 특징을 가진다.

Perfect Shuffle에 의한 5치 논리회로의 구성에 관한 연구 (Study on Construction of Quinternary Logic Circuits Using Perfect Shuffle)

  • 성현경
    • 한국정보통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.613-623
    • /
    • 2011
  • 본 논문에서는 Perfect Shuffle에 의한 5치 논리 회로의 구성에 관한 한 가지 방법을 제시하였다. 먼저, Perfect Shuffle 기법과 Kronecker 곱에 의한 5치 논리함수의 입출력 상호연결에 대하여 논하였고, GF(5)의 가산회로와 승산회로를 이용하여 5치 Reed-Muller 전개식의 변환행렬과 역변환행렬을 실행하는 기본 셀을 설계하였다. 이 기본 셀들과 Perfect Shuffle과 Kronecker 곱에 의한 입출력 상호연결 방법을 이용하여 5치 Reed-Muller 전개식에 의한 5치 논리 회로를 구현하였다. 제시된 5치 Reed-Muller 전개식의 설계방법은 모듈구조를 기반으로 하여 행렬변환을 이용하므로 동일한 함수에 대하여 타 방법과 비교하여 간단하고 회로의 가산회로와 승산회로를 줄이는데 매우 효과적이다. 제안된 5치 논리회로의 설계방법은 회선경로 선택의 규칙성, 간단성, 배열의 모듈성과 병렬동작의 특징을 가진다.

GPU 기반 임베디드 시스템에서 대용량 데이터의 안정적 수신을 위한 ECC 연산의 가속화 (Acceleration of ECC Computation for Robust Massive Data Reception under GPU-based Embedded Systems)

  • 권지수;박대진
    • 한국정보통신학회논문지
    • /
    • 제24권7호
    • /
    • pp.956-962
    • /
    • 2020
  • 최근 임베디드 시스템에서 사용되는 데이터의 크기가 증가함에 따라, 대용량의 데이터를 안전하게 수신하기 위한 ECC (Error Correction Code) 복호화 연산의 필요성이 강조되고 있다. 본 논문에서는 GPU가 내장된 임베디드 시스템에서 해밍 코드를 사용하여 ECC 복호화를 할 때, 신드롬 벡터를 계산하는 연산의 수행을 가속할 방법을 제안한다. 제안하는 가속화 방법은, 복호화 연산의 행렬-벡터 곱셈이 희소 행렬을 나타내는 자료 구조 중 하나인 CSR (Compressed Sparse Row) 형식을 사용하고, GPU의 CUDA 커널에서 병렬적으로 수행되도록 한다. 본 논문에서는 GPU가 내장된 실제 임베디드 보드를 사용하여 제안하는 방법을 검증하였고, 결과는 GPU 기반으로 가속된 ECC 복호화 연산이 CPU만을 사용한 경우에 비하여 수행 시간이 감소하는 것을 보여준다.

트랜스포머 알고리즘의 멀티 헤드 어텐션과 피드포워드 네트워크에서 활용 가능한 효율적인 행렬 곱셈기 (An Efficient Matrix Multiplier Available in Multi-Head Attention and Feed-Forward Network of Transformer Algorithms)

  • 장석우;김동순
    • 전기전자학회논문지
    • /
    • 제28권1호
    • /
    • pp.53-64
    • /
    • 2024
  • 자연어 처리 모델이 발전함에 따라 챗 GPT와 같은 대화형 언어 생성 AI 모델이 널리 사용되고 있다. 따라서 자연어 처리 최신 모델의 기반이 되는 트랜스포머 알고리즘을 하드웨어로 구현하여 연산 속도와 전력 소비량을 개선하는 것은 중요하다고 할 수 있다. 특히, 행렬 곱셈을 통해 문장에서 서로 다른 단어 간의 관계를 분석하는 멀티 헤드 어텐션과 피드 포워드 네트워크는 트랜스포머에서 연산량이 가장 큰 핵심적인 알고리즘이다. 본 논문에서는 기존의 시스톨릭 어레이를 변형하여 행렬 곱 연산 속도를 개선하고, 입력 단어 개수 변동에 따라 지연시간도 변동되는 유동적인 구조를 제안한다. 또한, 트랜스포머 알고리즘의 정확도를 유지하는 형태로 양자화를 하여 메모리 효율성과 연산 속도를 높였다. 본 논문은 평가를 위해 멀티헤드어텐션과 피드포워드 네트워크에서 소요되는 클럭사이클을 검증하고 다른 곱셈기와 성능을 비교하였다.

공개키 암호시스템의 처리속도향상을 위한 모듈러 승산기 설계에 관한 연구 (A Study of the Modulus Multiplier Design for Speed up Throughput in the Public-key Cryptosystem)

  • 이선근;김환용
    • 대한전자공학회논문지SD
    • /
    • 제40권4호
    • /
    • pp.51-57
    • /
    • 2003
  • 통신망 및 그 이외의 네트워크 환경의 발전은 사회적으로 중요한 문제를 발생시켰다. 이러한 문제점 중 가장 중요한 것이 네트워크 보안 문제이다. 보안과 관련된 문제점들은 해킹, 크랙킹과 같은 방법으로 반 보안 분야를 확장시키며 발전되었다. 새로운 암호 알고리즘의 발달 없이 해커나 크래커로부터 데이터를 보호하기 위해서는 기존과 같이 키의 길이를 증대하거나 처리 데이터의 양을 증대시키는 방법 밖에는 없다. 본 논문에서는 공개키 암호 알고리즘의 몽고메리 승산부에서 처리속도를 감소시키기 위한 M3 알고리즘을 제안하였다. 매트릭스 함수 M(·)과 룩업테이블을 사용하는 제안된 M3 알고리즘은 몽고메리 승산부의 반복 연산부를 선택적으로 수행하게 된다. 이러한 결과로 변형된 반복 변환 부분은 기존 몽고메리 승산기에 비하여 30%의 처리율 향상을 가져왔다. 제안된 몽고메리 승산 M3 알고리즘은 캐리 생성부의 어레이 배열과 가변 길이 오퍼랜드 감소로 인한 병목 현상을 줄일 수 있다. 그러므로 본 논문에서는 제안된 M3 알고리즘을 공개키 암호시스템의 대표적인 시스템인 RSA에 적용하여 M3-RSA를 설계하였으며 설계 및 모의실험은 Synopsys ver 1999.10을 사용하였다. M3 알고리즘은 기존 승산알고리즘에 비하여 30%의 처리속도 증가를 보임으로서 크랙 및 처리율 향상에 영향이 많은 공개키 암호시스템에 적합하리라 사료된다.

나노 준결정상으로 강화된 Ti계 벌크 비정질기지 복합재의 제조 및 기계적 특성 고찰 (Fabrication and Mechanical Properties of Nanoquasicrystalline Phase Reinforced Ti-based Bulk Metallic Glass Matrix Composites)

  • 박진만;임가람;김태응;손성우;김도향
    • 한국주조공학회지
    • /
    • 제28권6호
    • /
    • pp.261-267
    • /
    • 2008
  • In-situ quasicrystalline icosahedral (I) phase reinforced Ti-based bulk metallic glass (BMG) matrix composites have been successfully fabricated by using two distinct thermal histories for BMG forming alloy. The BMG composite containing micron-scale Iphase has been introduced by controlling cooling rate during solidification, whereas nano-scale I-phase reinforced BMG composite has been produced by partial crystallization of BMG. For mechanical properties, micron-scale I-phase distributed BMG composite exhibited lower strength and plasticity compared to the monolithic BMG. On the other hand, nano-scale icosahedral phase embedded BMG composite showed enhanced strength and plasticity. These improved mechanical properties were attributed to the multiplication of shear bands and blocking of the shear band propagation in terms of isolation and homogeneous distribution of nanosize icosahdral phases in the glassy matrix, followed by stabilizing the mechanical and deformation instabilities.

Effect of Mirror Misalignments on Optical Ray Path In a Ring Resonator

  • Lee, Dong-Chan;Lee, Jae-Cheul;Son, Seong-Hyun;Cho, Hyun-Ju
    • Journal of the Optical Society of Korea
    • /
    • 제6권3호
    • /
    • pp.121-127
    • /
    • 2002
  • The operating principal of a ring laser gyroscope depends on the phase difference for the counter-propagating waves within a closed path. The reflecting mirrors mounted on the monoblock form the traveling waves. The manufacturing accuracy of the monoblock influences the traveling path of ray, the sensitivity of laser resonator for misalignments, and diffraction losses. A 3 $\times$ 3 ray transfer matrix was derived for optical components with centering and squaring errors in a ring resonator. The matrix can be utilized to predict the optical ray paths on the basis of the manufacturing errors of the monoblock as well as the misalignment of mirrors. Then the distance and orientation (o. slope) at the arbitrary plane inside the resonator along the ideal optical path can be calculated from the chain multiplication of the ray transfer matrix for each optical component in one round trip. We also show that the counter-propagating rays In a ring resonator with errors does not coincide in each round trip, which results in gain difference between two beams, and how these errors can be adjusted through the alignment procedure. Finally this 3 $\times$ 3 ray matrix formalism can be used to calculate the beam size and its displacement from the optical axis and the deviation at the diaphragm.

Mashhad University, Department of Mathematics;

  • Yassi, M.
    • 대한수학회보
    • /
    • 제38권4호
    • /
    • pp.727-733
    • /
    • 2001
  • Let A be a commutative ring with nonzero identity and let M be an A-module. In this note we show that if $x = x_1, ..., x_n\; and\; y = y_1, ..., y_n$ both M-cosequence such that $Hx^T = y^T\; for\; some\; n\times n$ lower triangular matrix H over A, then the map $\beta_H : \;Ann_M(y_1,..., y_n)\;\rightarrow Ann_M(x_1,..., x_n)$ induced by multiplication by |H| is surjective.

  • PDF

기하학적 연쇄에 의한 공작물 형상의 장착오차해석에 관한 연구

  • 신동수;정성종
    • 한국정밀공학회:학술대회논문집
    • /
    • 한국정밀공학회 1992년도 추계학술대회 논문집
    • /
    • pp.223-227
    • /
    • 1992
  • 산업의 발전으로 정밀가공기술 및 측정기술 및 측정기술의 개발에 대한 요구가 급증하고 있으며, 특히 가공전 공작물의 장착정도, 팔레트 교환 위치정도와 가공후 가공정도 및 공작기계 자체의 정도 판별은 생산품의 정밀도와 직접 관계되는 중요한 요인이기 때문에 정확히 규명할 필요가 있다. 본 연구에서는 공작물의 장착오차와 기계오차가 존재하는 경우 Denavit-Hartenberg 접근법에 의하여 레퍼런스에 대한 공간상 linkage의 기하학적 표현을 Matrix Multiplication을 사용하여 Cutting Tool 과 Workpiece에 대한 공간상의 관계를 규명하였으며, 가공에 미치는 체적오차를 규명하고자 한다.

위상 공액경을 이용한 광 디지틀 병렬 연산기에 관한 연구 (A Study on the Optical Digital paralle Processor using Phase Conjugate Mirror)

  • 은재정;최평석
    • 전자공학회논문지A
    • /
    • 제32A권9호
    • /
    • pp.135-141
    • /
    • 1995
  • An optical digital parallel processor using Self-Pumped Phase Conjugate Mirror and liquid crystal spatial light modulator is presented and experimentally implemented. To use self-pumped PCM as memory, the mechanism for phase conjugation in two coupled interaction regions with the photorefractive crystal BaTiO$_{3}$ is investigated, especially the temporal behavior and effects of incident beam position. The optical design and implementation of matrix-vector multiplication using LCSLM and PCM memory is presented.

  • PDF