• 제목/요약/키워드: 삼중대각행렬

검색결과 8건 처리시간 0.021초

삼중대각행렬 시스템 풀이의 빠른 GPU 구현 (Fast GPU Implementation for the Solution of Tridiagonal Matrix Systems)

  • 김영희;이성기
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권11_12호
    • /
    • pp.692-704
    • /
    • 2005
  • 컴퓨터 하드웨어의 급속한 발전으로 그래픽 프로세서 유닛(Graphics Processor Units : GPUs)은 굉장한 메모리 대역폭과 산술 능역을 보유하게 되어 범용 계산에 많이 활용되고 있으며, 특히 계산 집약적인 물리 기반 시뮬레이션(physics based simulation)의 GPU 구현이 활발하게 연구되고 있다. 물리 기반 시뮬레이션의 기본이 되는 미분방정식 풀이 과정에서 삼중대각행렬(tridiagonal matrix) 시스템은 유한차분(finite-difference) 근사에 의해서 자주 나타나는 선형시스템으로 물리 기반 시뮬레이션 관점에서 삼중대각행렬 시스템의 빠른 풀이는 중요한 연구 분야이다. 본 논문에서는 GPU에서 삼중대각행렬 시스템 풀이를 빠르게 구현할 수 있는 방법을 제안한다. 벡터 프로세서(vector processor) 계산에서 삼중대각행렬 시스템 풀이 방법으로 널리 사용되는 cyclic reduction 또는 odd-even reduction 알고리즘을 GPU에서 구현하였다. 본 논문에서 제안한 방법을 삼중대각행렬 시스템 풀이 방법으로 잘 알려져 있는 Thomas 방법과 GPU를 이용한 선형시스템 풀이에서 좋은 성과를 보이고 있는 conjugate gradient 방법과 비교할 때 상당한 성능 향상을 얻을 수 있었다. 또한, 열전도(heat conduction) 방정식, 이류 확산(advection-diffusion) 방정식, 얕은 물(shallow water) 방정식에 의한 물리 기반 시뮬레이션의 GPU 구현에 본 논문에서 제안한 방법을 사용하여 1024x1024 격자의 계산 영역에서 초당 35프레임 이상의 놀라운 성능을 보여주었다.

삼중대각행렬 선형방정식의 해를 구하기 위한 내용-주소법 씨스톨릭 어레이 (Content-Addressable Systolic Array for Solving Tridiagonal Linear Equation Systems)

  • 이병홍;김정선;채수환
    • 한국통신학회논문지
    • /
    • 제16권6호
    • /
    • pp.556-565
    • /
    • 1991
  • A가 nxn 삼중대각행렬인 선형방정식 Ax=b를 WZ분해 알고리즘을 이용하여 해석하고 이 알고리즘을 CAM Systolic Array 로 구현했다. 그리고 이 어레이를 평가하기위하여 LU분해 알고리즘을 제시하고 이를 W, D, Z분해 알고리즘과 비교 고찰한 결과 LU분해 알고리즘 보다 WZ분해 알고리즘이 1/4정도 가까운 시간으로 실행시간이 단축될 수 있었다. CAM Systolic Array에서 실행되는 각 단계를 1 time stpe으로 가정하면 2n+1 times이 필요하고 CAM의 데이타 워드는 메트릭스 원소의 값과 행번호, 연산의 형태 및 상태에 관한 정보를 포함하고 pipeline식으로 각 프로세서를 systolic processing하므로서 중앙제어가 필요없고, data brodcasting도 피할 수 있다.

  • PDF

삼중 행렬 곱셈의 효율적 연산 (An Efficient Computation of Matrix Triple Products)

  • 임은진
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.141-149
    • /
    • 2006
  • 본 논문에서는 회로 설계 소프트웨어에서 사용되는 primal-dual 최적화 문제의 해를 구하기 위해 필요한 삼중 행렬 곱셈 연산 ($P=AHA^{t}$)의 성능 개선에 관하여 연구하였다. 이를 위하여 삼중 행렬 곱셈 연산의 속도를 개선하기 위하여 기존의 2단계 연산 방법을 대신하여 1단계 연산 방법을 제안하고 성능을 분석하였다. 제안된 방법은 희소 행렬 H의 블록 대각 구조의 특성을 이용하여 부동 소숫점 연산량을 감소시킴으로써 성능 개선을 이루었으며 더불어 메모리 사용량도 기존 방법에 비하여 50% 이하로 감소하였다. 그 결과 Intel Itanium II 플랫폼에서 기존 2단계 연산 방법과 비교하여 속도 면에서 주어진 실험 데이터 집합에 대하여 평균 2.04 의 speedup을 얻었다. 또한 본 논문에서는 플랫폼의 메모리 지연량과 예측된 캐쉬 미스율을 이용한 성능 모델링을 통하여 이와 같은 성능 개선 수치의 가능 범위를 보이고 실측된 성능개선을 평가하였다. 이와 같은 연구는 희소 행렬의 성능 개선 연구를 기본 연산이 아닌 복합 연산에 적용하는 연구로써 큰 의미가 있다.

  • PDF

A study on modified biorthogonalization method for decreasing a breakdown condition

  • Kim, Sung-Kyung
    • 한국산업정보학회논문지
    • /
    • 제7권5호
    • /
    • pp.59-66
    • /
    • 2002
  • 대규모 비대칭 행렬의 특정 고유치들이 많은 중요한 과학, 공학 문제들에서 요구된다. 그 문제를 해결할 수 있는 방법 중의 하나인 biorthogonal 란초스 알고리즘은 심각한 문제점이 있는데, 어떤 특이한 상황에서 알고리즘을 계속할 수 없는 경우가 발생할 수 있다는 것이다. 본 논문에서는 기본적인 biorhogonal 알고리즘이 만드는 축소된 삼중 대각 행렬에 대하여 동일한 고유치를 발견할 수 있는 향상된 biorhogonal 란초스 알고리즘을 소개한다. 이 새로운 알고리즘은 대규모 비대칭 행렬의 특정 고유치들을 구할 수 있으며 기본적인 biorthogonal 란초스 알고리즘에 비해서 안정적인 방법이라는 것을 Cray 컴퓨터를 이용한 실험을 통해서 보여준다.

  • PDF

대기질 예보의 성능 향상을 위한 커널 삼중대각 희소행렬을 이용한 고속 자료동화 (Fast Data Assimilation using Kernel Tridiagonal Sparse Matrix for Performance Improvement of Air Quality Forecasting)

  • 배효식;유숙현;권희용
    • 한국멀티미디어학회논문지
    • /
    • 제20권2호
    • /
    • pp.363-370
    • /
    • 2017
  • Data assimilation is an initializing method for air quality forecasting such as PM10. It is very important to enhance the forecasting accuracy. Optimal interpolation is one of the data assimilation techniques. It is very effective and widely used in air quality forecasting fields. The technique, however, requires too much memory space and long execution time. It makes the PM10 air quality forecasting difficult in real time. We propose a fast optimal interpolation data assimilation method for PM10 air quality forecasting using a new kernel tridiagonal sparse matrix and CUDA massively parallel processing architecture. Experimental results show the proposed method is 5~56 times faster than conventional ones.

불균일 단면을 갖는 저장력 예인케이블의 동적해석을 위한 수치해석적 연구 (A Study on Numerical Simulation for Dynamic Analysis of Towed Low-Tension Cable with Nonuniform Characteristics)

  • 정동호
    • 한국전산구조공학회논문집
    • /
    • 제16권1호
    • /
    • pp.69-76
    • /
    • 2003
  • 최근 들어 심해역에 대한 개발과 합섬섬유 재질 케이블의 발달로 인하여 저장력 케이블의 사용이 증가되었다. 저장력 케이블은 장력에 의한 복원력이 작기 때문에 대변위가 발생하게 되며, 따라서 기하학적 비선형이 강하게 나타나게 된다. 또한 해양환경에서는 유체 비선형도 작용하게 된다. 본 연구에서는 수치해석적 방법을 통하여 불균일하게 구성된 예인되는 저장력 케이블의 3차원 동적거동 해석을 수행한다. 수치해석에서는 유체 및 기하학적 비선형과 굽힘강성이 고려되며, 유한차분법(음해법)을 적용하여 풀이된다. 비선형 해를 구하기 위해서 뉴톤-랍슨 방법을 사용한다. 대형 행렬을 풀이하기 위하여 불록삼중대각행렬 풀이법이 적용되는데, 이 방법은 일반적인 행렬 풀이법인 가우스-조르단 방법에 비하여 계산시간을 상당히 줄일 수 있었다. 선배열 음탐 케이블에 대한 다양한 예제해석을 수행하였으며, 해석결과는 미국 우즈홀 해양연구소에서 개발된 프로그램 결과와 잘 일치하였다.

인수분해 된 분모를 갖는 두 변수 유리함수 근사에 기반한 3차원 음향 포물선 방정식 제곱근 연산자의 분할기법 제안 (Suggestion for a splitting technique of the square-root operator of three dimensional acoustic parabolic equation based on two variable rational approximant with a factored denominator)

  • 이근화
    • 한국음향학회지
    • /
    • 제36권1호
    • /
    • pp.1-11
    • /
    • 2017
  • 본 연구에서는 두 변수 유리함수 근사법에 기반한 3차원 음향 포물선 방정식의 제곱근 연산자의 새로운 근사식을 제안한다. 이 근사식은 기존의 제곱근 연산자에 대한 근사 연구와 비교해서 두 가지의 장점을 가진다. 첫 번째는 광대역 각도 능력이다. 제안된 식은 방위각 $45^{\circ}$에서 3차원 음향 포물선 방정식의 거리 축으로부터 $62^{\circ}$까지 넓은 각도에 대해 정확도를 가지는데, 이 값은 기존에 연구된 3차원 음향 포물선 방정식 알고리즘의 각도 한계의 약 세 배이다. 두 번째로는 본 근사식의 분모는 수심과 횡 거리에 대한 연산자의 곱으로 표현된다는 점이다. 이러한 분할 형태는 3차원 포물선 방정식을 손쉽게 삼중대각행렬 방정식으로 변환할 수 있다는 점에서 수치해석에서 선호된다. 제안된 식의 성능을 검증하기 위해 위상 오차분석을 통해 타 근사법과의 비교 연구가 수행되었고, 제안된 방법은 가장 우수한 성능을 보였다.

유한차분법을 이용한 저장력 예인케이블의 비선형 동적해석 (Nonlinear Dynamic Analysis on Low-Tension Towed Cable by Finite Difference Method)

  • 박한일;정동호
    • 대한조선학회논문집
    • /
    • 제39권1호
    • /
    • pp.28-37
    • /
    • 2002
  • 본 연구에서는 저장력 예인케이블의 비선형 동적거동을 수치적으로 해석하였다. 고장력 케이블해석에서는 흔히 무시되는 굽힘강성의 효과가 저장력 케이블에서는 중요한 역할을 하므로 본 연구에서는 이를 고려하였다. 또한 저장력 케이블에서는 대변위가 발생하기 쉬우므로 기하학적인 비선형 및 유체 비선형 효과가 크므로 이를 고려하였다. 저장력 예인케이블에 대한 3차원 비선형 운동방정식을 수립하고 유한차분법을 적용하여 이산화 시켰다. 시간적분에 있어서 안정적인 해를 얻을 수 있는 음해법(implicit method)을 적용하였으며 비선형 해를 구하기 위하여 Newton-Raphson 반복법을 사용하였다. 케이블과 같이 양단경계조건을 갖고 대각선 주변 성분만 있는 행렬식을 계산하는 경우에는 Gauss-Jordan 방법 등과 같이 일반적인 방법 보다 블록삼중대각행렬 풀이법이 계산시간을 상당히 줄일 수 있음을 알 수 있었다. 몇 가지 예제해석을 수행하였으며 실해역 실험결과에 의해 이미 검증되어 있는 케이블 해석프로그램인 WHOI Cable 프로그램의 해석결과와 비교 검토한 결과 서로 잘 일치함을 알 수 있었다.