• 제목/요약/키워드: 행렬의 연산

검색결과 348건 처리시간 0.027초

회로 최적화를 위한 효율적인 희소 행렬 간 곱셈 연산에 관한 연구 (Efficient Sparse Matrix-Matrix Multiplication for circuit optimization)

  • 임은진;김경훈
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(하)
    • /
    • pp.994-997
    • /
    • 2003
  • 행렬 연산은 계산 과학을 사용하는 공학 물리, 화학, 생명 과학, 경제학 등에서 다양하게 사용되고 있으며 이 행렬은 크기가 크고 대부분의 원소가 0 값을 갖는 희소 행렬일 경우가 많다. 본 논문에서는 희소 행렬의 연산 중, 회로 설계 시 최적화 과정에 사용되는 연산에서 문제가 되는 희소 행렬 A 와 블록 대각 행렬 H에 대하여 AH$A^{T}$ 의 연산을 효율적으로 행하는 방법들을 검토하고 메모리 접근 횟수를 모델링하여 수행 속도와 메모리 사용량 면에서 비교한다.

  • PDF

희소 행렬 연산의 성능 최적화에 관한 연구 (Performance Optimization of Sparse Matrix Operation)

  • 김경훈;김병수;임은진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.130-132
    • /
    • 2003
  • 계산 과학을 사용하는 응용 분야는 공학, 물리, 화학, 생명 과학에서 경제학까지 다양하다. 계산 과학에 사용되는 많은 알고리즘들은 행렬 연산을 포함하고 있으며 이 행렬은 크기가 크고 대부분의 원소가 0값을 갖는 희소 행렬일 경우가 많다. 본 논문에서는 희소 행렬의 연산 중, 희소 행렬 A와 밀집 벡터 x, y에 대하여 ylongleftarrowy+Ax와 ylongleftarrowy+$A^{T}$ Ax 의 두 가지 연산에 대한 계산 속도 개선 방법으로서 레지스터 재사용을 높이는 레지스터 블록화와 캐쉬 미스를 줄이기 위한 캐쉬 최적화 방법을 제안하며 또한 희소 행렬의 특성과 target 컴퓨터의 구조에 따라 정해지는 레지스터 블록 크기를 결정하는 방법을 설명한다. Preliminary결과로 이 방법을 Pentium III system상에서 실험한 결과를 보이는데 ylongleftarrowy+Ax 의 연산에 대하여는 2.5 배, ylongleftarrowy+$A^{T}$ Ax 의 연산에 대하여는 3.5 배까지의 성능 개선을 이룰 수 있다.

  • PDF

Neon 을 사용한 $4{\times}4$ 행렬의 역행렬 연산 (Calculating an inverse of a $4{\times}4$ matrix using Neon)

  • 오유연;이창건
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.344-346
    • /
    • 2012
  • 스마트폰에서의 3D 게임/애플리케이션에 대한 사용자의 요구는 나날이 증가하고 있다. 3D 게임/애플리케이션은 내부적으로 $4{\times}4$ 행렬을 가지고 여러 가지 좌표 변환을 수행하기 때문에, 보다 빠른 3D 그래픽스 처리를 위해서는 $4{\times}4$ 행렬 연산의 최적화가 필수적이다. $4{\times}4$ 행렬 연산중에 역행렬 연산에 대해 살펴보고, ARM 프로세서에서 지원하는 Neon 연산자를 이용해서 $4{\times}4$ 행렬의 역행렬 연산을 개선할 수 있다.

삼중 행렬 곱셈의 효율적 연산 (An Efficient Computation of Matrix Triple Products)

  • 임은진
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.141-149
    • /
    • 2006
  • 본 논문에서는 회로 설계 소프트웨어에서 사용되는 primal-dual 최적화 문제의 해를 구하기 위해 필요한 삼중 행렬 곱셈 연산 ($P=AHA^{t}$)의 성능 개선에 관하여 연구하였다. 이를 위하여 삼중 행렬 곱셈 연산의 속도를 개선하기 위하여 기존의 2단계 연산 방법을 대신하여 1단계 연산 방법을 제안하고 성능을 분석하였다. 제안된 방법은 희소 행렬 H의 블록 대각 구조의 특성을 이용하여 부동 소숫점 연산량을 감소시킴으로써 성능 개선을 이루었으며 더불어 메모리 사용량도 기존 방법에 비하여 50% 이하로 감소하였다. 그 결과 Intel Itanium II 플랫폼에서 기존 2단계 연산 방법과 비교하여 속도 면에서 주어진 실험 데이터 집합에 대하여 평균 2.04 의 speedup을 얻었다. 또한 본 논문에서는 플랫폼의 메모리 지연량과 예측된 캐쉬 미스율을 이용한 성능 모델링을 통하여 이와 같은 성능 개선 수치의 가능 범위를 보이고 실측된 성능개선을 평가하였다. 이와 같은 연구는 희소 행렬의 성능 개선 연구를 기본 연산이 아닌 복합 연산에 적용하는 연구로써 큰 의미가 있다.

  • PDF

PoLAPACK : 알고리즘적인 블록 기법을 이용한 병렬 인수분해 루틴 패키지 (PoLAPACK : Parallel Factorization Routines with Algorithmic Blocking)

  • 최재영
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권5호
    • /
    • pp.228-235
    • /
    • 2001
  • 본 논문에서는 분산메모리를 가진 병렬 컴퓨터에서 밀집 행렬 연산을 위한 PoLAPACK 패키지를 소개한다. PoLAPACK은 새로운 연산 기법을 적용한 LU, QR, Cholesky 인수분해 알고리즘들을 포함하고 있다. 블록순환분산법으로 분산되어 있는 행렬에 알고리즘적인 블록 기법(algorithimic blocking)을 적용하여, 실제 행렬의 분산에 사용된 블록의 크기와 다른, 최대의 성능을 보일 수 있는 최적의 블록 크기로 연산을 수행할 수 있다. 이러한 연산 방식은 분산되어 있는 원래의 행렬 A의 순서를 따르지 않으며, 따라서 최적의 블록 크기로 연산을 수행한 후에 얻어진 해 x를 원래 행렬 분산법을 따라서 재배치하여야 한다. 본 연구는 Cray T3E 컴퓨터에서 구현하였으며 ScaLAPACK의 인수분해 루틴들과 그 성능을 비교.분석하였다.

  • PDF

행렬의 연산을 통해 본 일대일 대응의 의미에 관한 고찰 (A Study on Meaning of One-to-One Correspondence through the Operation of Matrix)

  • 정영우;김부윤;황종철;김소영
    • 대한수학교육학회지:학교수학
    • /
    • 제13권3호
    • /
    • pp.405-422
    • /
    • 2011
  • 본 연구는 행렬 연산지도의 실태를 분석하여 행렬 연산에 관한 이해의 필요성을 제시한 후, 행렬의 연산이 정의되는 이론적 배경의 탐구를 통하여 일대일 대응의 의의에 대해 고찰한다. 대수적 관점에서의 일대일 대응의 의의는 '이미 구조를 알고 있는 집합에서 일대일 대응을 통하여 새로운 집합에 대수적 체계를 도입할 수 있게 하는 수단'이라는 것이다. 즉, 동형구조를 만드는데 있어 핵심 아이디어라는 것이다. 행렬의 연산을 예로 한 일대일 대응에 관한 이러한 고찰과정은 수학적 사실의 필연성 및 개연성을 경험하게 하여, 그러한 수학적 아이디어들이 단순히 주어지는 것이 아니라, 특정의 목적성 있는 활동의 결과물임을 인식하게 한다. 또한 일대일 대응의 본질적 이해는 행렬에 대한 논의에 그치지 않고 지수법칙, 대칭차집합, 순열 등 다양한 수학적 지식을 전개하기 위한 기저가 된다. 이러한 연구의 목적은 교사와 학생들에게 수학적 개념의 의미 충실한 이해를 돕는데 있으며, 나아가 교사의 가르칠 지식에의 전문성을 높이는데 있다.

  • PDF

이중 CPU PC에서 병렬 계산을 위한 Matlab 행렬 연산 라이브러리의 구현 및 성능 측정 (An implementation and performance measurement of Matlab matrix operation library for parallel computing on dual CPU PC)

  • 김철민;이정훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.871-873
    • /
    • 2001
  • 본 논문에서는 전기 단층 촬영 기법과 같이 많은 양의 데이터에 대해 산술 계산을 수행하는 응용의 수행속도를 개선하기 위하여 이중 CPU PC 상에서 Matlab의 기본연산, 즉 행렬 곱하기, 역행렬 계산, 의사 역행렬 계산 등을 병렬로 수행하는 라이브러리 프로그램을 구현하고 그 성능을 측정한다. 구현된 라이브러리는 행렬의 곱하기, 역행렬 계산, 의사 역행렬 계산 등 기본적인 행렬 연산에 대해 각 CPU에서 수행될 쓰레드를 생성하고 이 쓰레드에 분할 행렬을 인자로 넘겨줌으로써 병렬 계산을 실행하도록 하고 부분 결과를 합성하여 최종적인 결과를 산출하게 된다. 구현된 코드를 수행시켜 속도를 측정한 결과 행렬의 곱하기는 최대 69%, 역행렬은 34.8 %, 의사 역행렬은 52 % 까지 수행시간을 단축시켰다. 이에 의해 전기 단층 촬영 프로그램은 한번의 전류 주입에 대해 영상 복원에 소요되는 시간을 48 %로 감소시켰다.

  • PDF

CUDA 기반 숄레스키 분해 성능 최적화 환경 탐색 (Exploration of Optimization Environment for CUDA-based Cholesky Decomposition)

  • 강준범;이명호;박능수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.15-17
    • /
    • 2024
  • 최근 다양한 연구 분야에서는 CUDA 프레임워크를 이용하여 병렬 처리를 통해 연산 시간을 단축하는데 성공하고 있다. 이 중 숄레스키 분해는 양의 정부호 행렬을 하삼각행렬로 분해하는 과정에서 많은 행렬 곱셈이 요구되어 GPU 의 구조적 특징을 활용하면 상당한 가속화가 가능하다. 따라서 이 논문에서는 CUDA 코어에 연산을 할당할 때, 핵심 요소인 블록의 개수와 블록 당 쓰레드 개수를 조절할 수 있는 병렬 숄레스키 분해 연산 프로그램을 구현하였다. 서로 다른 세 종류의 행렬 크기에 대해 다양한 블록 수-쓰레드 수 환경을 설정하여 가속화 정도를 측정한 결과, 각 행렬 별 최적 환경에서 동일 그룹 내 최장 시간 대비, 1000x1000 행렬에서는 약 1.80 배, 2000x2000 행렬에서는 약 2.94 배의 추가적인 가속화를 달성하였다.

리터럴 스위치에 의한 다중제어 유니터리 게이트의 새로운 함수 임베딩 방법 (A New Function Embedding Method for the Multiple-Controlled Unitary Gate based on Literal Switch)

  • 박동영
    • 한국전자통신학회논문지
    • /
    • 제12권1호
    • /
    • pp.101-108
    • /
    • 2017
  • 양자게이트 행렬은 치수가 r, 제어상태벡터 수가 n 및 표적상태벡터 수가 1인 경우에 $r^{n+1}{\times}r^{n+1}$ 차원 행렬이므로 n 증가에 따른 행렬 크기는 지수 함수적 증가 특성을 갖는다. 만약 제어상태벡터의 경우 수가 $2^n$이라면 $2^n-1$ 경우는 입력이 출력에 보전되는 단위행렬의 항등연산이고, 오직 한 개의 제어상태벡터 연산만이 표적상태벡터에 대한 유니터리 연산이다. 본 논문은 행렬차원 증가에 결정적 기여를 하는 $2^n-1$개의 단위행렬 연산을 한 동작의 산술멱승 연산으로 대체할 수 있는 새로운 함수 임베딩 방법을 제안한다. 제안한 함수 임베딩 방법은 다치 임계값을 갖는 2진 리터럴 스위치를 사용하므로 범용 하이브리드 MCU 게이트를 $r{\times}r$ 유니터리 행렬로 실현할 수 있다.

개선된 블럭펄스 적분연산행렬을 이용한 LTI 시스템 모델축소 (Model Reduction of LTI systems via Improved BPF integral operation matrix)

  • 조영호;심재선
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년 학술대회 논문집 정보 및 제어부문
    • /
    • pp.279-281
    • /
    • 2006
  • 적분연산행렬은 구간연속 직교함수들이 시스템 동정, 해석, 제어기 설계 등의 분야에 널리 이용될 수 있는 계기를 제공하였다. 특히 블럭펄스 함수는 연산이 간단하기 때문에 선형 시변계와 비선형계 등의 제어문제 둥에 널리 이용되어 오고 있다. 본 논문은 기존의 블럭펄스 함수 적분 연산행렬과 비교했을 때 적분오차를 줄이는 적분연산행렬을 소개하였으며, 이를 이용하여 고차 시스템의 응답에 가장 최적한 응답을 갖는 저차 시스템의 응답을 갖도록 최적응답 방법에 적용하여 대수적인 방법으로 저차 시스템의 파라메터를 구하는 알고리즘을 제시함으로서 유용성을 확인하였다.

  • PDF