• 제목/요약/키워드: sparse matrix

검색결과 253건 처리시간 0.023초

유한요소법에서 희소행렬의 효율적인 저장을 위한 2차원 가변길이 벡터 저장구조 (Two dimensional variable-length vector storage format for efficient storage of sparse matrix in the finite element method)

  • 부희형;김승호
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권9호
    • /
    • pp.9-16
    • /
    • 2012
  • 본 논문에서는 유한요소법에서 희소행렬의 효율적인 저장을 위한 2차원 가변길이 벡터 저장구조를 제안한다. 제안한 저장구조는 유한요소 전체 방정식의 거대희소행렬 $N{\times}N$ 대신, 전체 행의 개수 N의 상삼각행렬에서 0이 아닌 실제 필요한 값들만 2차원 가변길이 벡터를 이용하여 저장하는 방법이다. 이 방법을 이용하면, 해석대상의 2차원 격자구조에서는 각 절점당 최소 1개에서 최대 5개까지의 저장 공간이 필요하게 되고, 3차원 격자구조에서는 각 절점당 최소 1개에서 최대 14개까지의 저장 공간이 필요하게 된다. 인덱스를 포함해도 2배 이상을 넘지 않는다. 본 논문의 실험 결과에 의해, 제안한 저장구조는 총 절점 개수가 많아질수록 기존의 최대칼럼 높이를 저장하는 스카이 라인 저장구조보다 메모리 공간을 효과적으로 줄일 수 있는 구조임을 알 수 있었다.

GPU-Based ECC Decode Unit for Efficient Massive Data Reception Acceleration

  • Kwon, Jisu;Seok, Moon Gi;Park, Daejin
    • Journal of Information Processing Systems
    • /
    • 제16권6호
    • /
    • pp.1359-1371
    • /
    • 2020
  • In transmitting and receiving such a large amount of data, reliable data communication is crucial for normal operation of a device and to prevent abnormal operations caused by errors. Therefore, in this paper, it is assumed that an error correction code (ECC) that can detect and correct errors by itself is used in an environment where massive data is sequentially received. Because an embedded system has limited resources, such as a low-performance processor or a small memory, it requires efficient operation of applications. In this paper, we propose using an accelerated ECC-decoding technique with a graphics processing unit (GPU) built into the embedded system when receiving a large amount of data. In the matrix-vector multiplication that forms the Hamming code used as a function of the ECC operation, the matrix is expressed in compressed sparse row (CSR) format, and a sparse matrix-vector product is used. The multiplication operation is performed in the kernel of the GPU, and we also accelerate the Hamming code computation so that the ECC operation can be performed in parallel. The proposed technique is implemented with CUDA on a GPU-embedded target board, NVIDIA Jetson TX2, and compared with execution time of the CPU.

A CLASS OF MULTILEVEL RECURSIVE INCOMPLETE LU PRECONDITIONING TECHNIQUES

  • Zhang, Jun
    • Journal of applied mathematics & informatics
    • /
    • 제8권2호
    • /
    • pp.305-326
    • /
    • 2001
  • We introduce a class of multilevel recursive incomplete LU preconditioning techniques (RILUM) for solving general sparse matrices. This techniques is based on a recursive two by two block incomplete LU factorization on the coefficient martix. The coarse level system is constructed as an (approximate) Schur complement. A dynamic preconditioner is obtained by solving the Schur complement matrix approximately. The novelty of the proposed techniques is to solve the Schur complement matrix by a preconditioned Krylov subspace method. Such a reduction process is repeated to yield a multilevel recursive preconditioner.

전류패턴을 이용한 스파스 매트릭스 컨버터의 개방사고 진단 (Open-Fault Detection of a Sparse Matrix Converter using Current Patterns)

  • 이은실;이교범
    • 전력전자학회:학술대회논문집
    • /
    • 전력전자학회 2011년도 전력전자학술대회
    • /
    • pp.419-420
    • /
    • 2011
  • 본 논문은 스파스 매트릭스 컨버터(Sparse matrix converter)의 단일 스위치 또는 두 개의 스위치의 개방 사고에 대한 진단 방법을 제안한다. 스파스 매트릭스 컨버터는 단방향 전력용 스위치의 개수를 줄이면서 기존의 매트릭스 컨버터와 동일한 성능을 갖는 새로운 토폴로지이다. 제안된 기법은 입력과 출력의 전류를 이용하여 만든 패턴을 비교하여 고장 진단뿐 아니라 고장 난 스위치의 위치까지 식별할 수 있다. 시뮬레이션 결과를 통해 제안한 기법의 타당성을 검증한다.

  • PDF

CONSTRUCTIONS FOR THE SPARSEST ORTHOGONAL MATRICES

  • Cheon, Gi-Sang;Shader, Bryan L.
    • 대한수학회보
    • /
    • 제36권1호
    • /
    • pp.119-129
    • /
    • 1999
  • In [1], it was shown that for $n\geq 2$ the least number of nonzero entries in an $n\times n$ orthogonal matrix is not direct summable is 4n-4, and zero patterns of the $n\times n$ orthogonal matrices with exactly 4n-4 nonzero entries were determined. In this paper, we construct $n\times n$ orthogonal matrices with exactly 4n-r nonzero entries. furthermore, we determine m${\times}$n sparse row-orthogonal matrices.

  • PDF

유한요소법(有限要素法)에 있어서의 비대칭(非對稱) 소행렬방정식(疎行列方程式)의 조합(組合)과 해법(解法) (Assembling and Analyzing Method of Non-symmetric Sparse Matrix Equation in FEM)

  • 신흥교;김상길
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 하계학술대회 논문집 B
    • /
    • pp.862-864
    • /
    • 2001
  • In this paper, we developed the algorithm for assembling and iterative numerical analyzing of non-symmetric sparse matrix equation in finite element method. Developed program in this study is applicable and very useful to analyze the electromagnetic characteristics of the electric machinery considered with the movement of the secondary.

  • PDF

객체지향기법을 이용한 전력조류계산 및 스파시티 연구 (Load flow analysis and sparsity study using object-oriented programming technique)

  • 김정년;백영식
    • 대한전기학회논문지
    • /
    • 제45권3호
    • /
    • pp.329-334
    • /
    • 1996
  • Power system is becoming more and more complex and large Existing procedural programming technique can't cope with software flexibility and maintenance problems. So, Object-Oriented Programming (OOP) is increasingly used to solve these problems. OOP in power system analysis field has been greatly developed. This paper applies OOP in power flow analysis, and presents new algorithm which uses only a Jacobian to solve mismatch equations, and introduces a new sparse matrix storage method which is different from existing method. (author). 11 refs., 12 figs., 3 tabs.

  • PDF

엘레멘트 인버스 재킷 변환과 유사한 DFT의 새로운 희소 행렬 분해 (A New Sparse Matrix Analysis of DFT Similar to Element Inverse Jacket Transform)

  • 이광재;박대철;이문호;최승제
    • 한국통신학회논문지
    • /
    • 제32권4C호
    • /
    • pp.440-446
    • /
    • 2007
  • 본 논문은 엘레멘트 인버스 처리에 근거한 재킷 변환을 통한 DFT 행렬의 새로운 표현을 다룬다. DFT 행렬의 역을 단지 재킷 변환의 소행렬 분해에 따라 표현하며 이러한 결과는 DFT 행렬의 역이 단지 이의 희소 행렬과 치환 행렬에만 관련됨을 보여준다. 재킷 행렬을 통한 DFT 행렬의 분해는 블록 변조 특성을 나타내는 강한 기하 구조를 갖는다. 이는 재킷 행렬을 통해 분해된 DFT 행렬은 블록 변조 과정으로 해석할 수 있음을 의미한다.

Parallel Algorithm of Conjugate Gradient Solver using OpenGL Compute Shader

  • Va, Hongly;Lee, Do-keyong;Hong, Min
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.1-9
    • /
    • 2021
  • OpenGL compute shader는 다른 shader 단계와 다르게 동작하며, 병렬로 모든 데이터를 계산하는데 사용할 수 있다. 본 논문은 OpenGL compute shader에서 반복 켤레 기울기 방법을 통해 희소선형 시스템을 계산하기 위한 GPU 기반의 병렬 알고리즘 제안하였다. 제안된 희소 선형 해결 방법은 대칭인 양의 정부호 행렬과 같은 대형 선형 시스템을 해결하기 위해 사용된다. 본 논문은 이 알고리즘을 사용하여 매트릭스 형식이 다른 8가지 예제들에 대해서 CPU와 GPU를 기반으로한 성능 비교 결과를 제공한다. 본 논문은 4가지 잘 알려져 있는 매트릭스 형식(Dense, COO, ELL and CSR)을 매트릭스 저장소를 사용하였다. 8개의 희소 매트릭스를 사용한 성능 비교 실험에서 GPU 기반 선형 해결 시스템이 CPU 기반 선형 해결 시스템보다 훨씬 빠르며, GPU 기반에서 0.64ms, CPU 기반에서 15.37ms의 평균 컴퓨팅 시간을 제공한다.

Sparse Logistic Regression 기반 비음수 행렬 분석을 통한 성별 인식 (Gender Classification using Non-Negative Matrix Analysis with Sparse Logistic Regression)

  • 허동철;;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.373-376
    • /
    • 2011
  • 얼굴 영상에서 구성요소(눈썹, 눈, 코, 입 등)의 존재에 따라 보는 사람의 얼굴 인식 정확도는 큰 영향을 받는다. 이는 인간의 뇌에서 얼굴 정보를 처리하는 과정은 얼굴 전체 영역 뿐만 아니라, 부분적인 얼굴 구성요소의 특징들도 고려함을 말한다. 비음수 행렬 분해(NMF: Non-negative Matrix Factorization)는 이러한 얼굴 영역에서 부분적인 특징들을 잘 표현하는 기저영상들을 찾아내는데 효과적임을 보여주었으나, 각 기저영상들의 중요도는 알 수 없었다. 본 논문에서는 NMF로 찾아진 기저영상들에 대응되는 인코딩 정보를 SLR(Sparse Logistic Regression)을 이용하여 성별 인식에 중요한 부분 영역들을 찾고자 한다. 실험에서는 주성분분석(PCA)과 비교를 통해 NMF를 이용한 기저영상 및 특징 벡터 추출이 좋은 성능을 보여주고, 대표적 이진 분류 알고리즘인 SVM(Support Vector Machine)과 비교를 통해 SLR을 이용한 특징 벡터 선택이 나은 성능을 보여줌을 확인하였다. 또한 SLR로 확인된 각 기저영상에 대한 가중치를 통하여 인식 과정에서 중요한 얼굴 영역들을 확인할 수 있다.