• 제목/요약/키워드: sparse matrices

검색결과 69건 처리시간 0.024초

Parallel Algorithm of Conjugate Gradient Solver using OpenGL Compute Shader

  • Va, Hongly;Lee, Do-keyong;Hong, Min
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.1-9
    • /
    • 2021
  • OpenGL compute shader는 다른 shader 단계와 다르게 동작하며, 병렬로 모든 데이터를 계산하는데 사용할 수 있다. 본 논문은 OpenGL compute shader에서 반복 켤레 기울기 방법을 통해 희소선형 시스템을 계산하기 위한 GPU 기반의 병렬 알고리즘 제안하였다. 제안된 희소 선형 해결 방법은 대칭인 양의 정부호 행렬과 같은 대형 선형 시스템을 해결하기 위해 사용된다. 본 논문은 이 알고리즘을 사용하여 매트릭스 형식이 다른 8가지 예제들에 대해서 CPU와 GPU를 기반으로한 성능 비교 결과를 제공한다. 본 논문은 4가지 잘 알려져 있는 매트릭스 형식(Dense, COO, ELL and CSR)을 매트릭스 저장소를 사용하였다. 8개의 희소 매트릭스를 사용한 성능 비교 실험에서 GPU 기반 선형 해결 시스템이 CPU 기반 선형 해결 시스템보다 훨씬 빠르며, GPU 기반에서 0.64ms, CPU 기반에서 15.37ms의 평균 컴퓨팅 시간을 제공한다.

벡터화 기술을 이용한 대규모 MIMO 시스템의 간단한 Toeplitz 채널 행렬 분해 (A Simple Toeplitz Channel Matrix Decomposition with Vectorization Technique for Large scaled MIMO System)

  • 박주용;모하마드 아부 하니프;김정수;송상섭;이문호
    • 전자공학회논문지
    • /
    • 제51권9호
    • /
    • pp.21-29
    • /
    • 2014
  • 오늘날 수많은 사용자와 제한된 메모리 공간 때문에 빅 데이터(big data)를 위한 메모리 공간 문제가 중요한 이슈로 부상하고 있다. 대규모 MIMO 시스템에서 Toeplitz 채널은 전력효율 문제뿐아니라 성능 개선에 커다란 역할을 할 수 있다. 본 논문에서는 행렬 벡터화(vectorization)에 기반한 Toeplitz 채널 분해를 제안하고, 이때 대규모 MIMO 시스템을 위한 채널에 Toeplitz 행렬을 사용하며, 또 Toeplitz Jackrt행렬이 푸리에 고속 변환(FFT)처럼 Cooley-Tukey sparse 행렬로 분해됨을 보인다.

고속 대각 하중 행렬을 이용한 MIMO LTE 프리코딩 코드북 (A MIMO LTE Precoding Codebook Based on Fast Diagonal Weighted Matrices)

  • 박주용;펭부쉬;이문호
    • 대한전자공학회논문지TC
    • /
    • 제49권3호
    • /
    • pp.14-26
    • /
    • 2012
  • 본 논문에서는 직교 구조를 갖는 고속 대각 하중 재킷 행렬(DWJM:diagonal-weighted Jacket matrices)을 제안 한다. 고속 알리즘을 이용해 높은 차수의 DWJM을 낮은 차수의 희소 행렬로 분해를 통해 연속적인 DWJM의 계산 수를 줄인다. 원소연산 역행렬 특성을 가진 대각 하중 프레임워크(framework)의 결과로, 제안되는 DWJM은 프리코딩(precoding) MIMO(Multiple Input and Multiple Output) 무선통신에 적용된다. DWJM의 성질에 기반하여, DWJM은 대체 오픈 루프 순환 지연 다이버시티 (CDD : Cyclic Delay Diversity) 프리코딩으로 사용될 수 있으며, 이는 셀룰러(cellular) 통신 시스템에 이용될 수 있다. 이와 같은, DWJM에 기반한 프리코딩 시스템의 성능에 대해 OSTBC (Orthogonal Space-Time Block Code) MIMO LTE 시스템과 비교 한다.

CRAY-2에서의 대형희귀행렬 연립방정식의 해법을 위한 벡터준비행렬의 재배열 방법 (A reordering scheme for the vectorizable preconditioner for the large sparse linear systems on the CRAY-2)

  • 마상백
    • 한국정보처리학회논문지
    • /
    • 제2권6호
    • /
    • pp.960-968
    • /
    • 1995
  • 이 논문에서 우리는 CRAY-2에서 편미분방정식에서 발생하는 대형희귀 연립방정 식의 효과적인 벡터준비행렬을 만들기 위한 재배열방법을 제시한다. 이 재배열방법은 종래의 빨강/검정 배열의 선형 형태로써, ILU 준비행렬의 변형에 사용될 경우 필인 (fill-in)을 크게 하면 종래의 빨강/검정 재배열의 약점이던 수렴율의 감소를 극복할 수 있다. 우리는 CRAY-2에서 여러 가지 실험을 통해 우리의 주장을 입증한다. 또, 에러 행렬의 후로베니우스 놈을 계산한 결과도 우리의 주장과 일치한다.

  • PDF

A PRECONDITIONER FOR THE LSQR ALGORITHM

  • Karimi, Saeed;Salkuyeh, Davod Khojasteh;Toutounian, Faezeh
    • Journal of applied mathematics & informatics
    • /
    • 제26권1_2호
    • /
    • pp.213-222
    • /
    • 2008
  • Iterative methods are often suitable for solving least squares problems min$||Ax-b||_2$, where A $\epsilon\;\mathbb{R}^{m{\times}n}$ is large and sparse. The well known LSQR algorithm is among the iterative methods for solving these problems. A good preconditioner is often needed to speedup the LSQR convergence. In this paper we present the numerical experiments of applying a well known preconditioner for the LSQR algorithm. The preconditioner is based on the $A^T$ A-orthogonalization process which furnishes an incomplete upper-lower factorization of the inverse of the normal matrix $A^T$ A. The main advantage of this preconditioner is that we apply only one of the factors as a right preconditioner for the LSQR algorithm applied to the least squares problem min$||Ax-b||_2$. The preconditioner needs only the sparse matrix-vector product operations and significantly reduces the solution time compared to the unpreconditioned iteration. Finally, some numerical experiments on test matrices from Harwell-Boeing collection are presented to show the robustness and efficiency of this preconditioner.

  • PDF

A fast precise integration method for structural dynamics problems

  • Gao, Q.;Wu, F.;Zhang, H.W.;Zhong, W.X.;Howson, W.P.;Williams, F.W.
    • Structural Engineering and Mechanics
    • /
    • 제43권1호
    • /
    • pp.1-13
    • /
    • 2012
  • A fast precise integration method (FPIM) is proposed for solving structural dynamics problems. It is based on the original precise integration method (PIM) that utilizes the sparse nature of the system matrices and especially the physical features found in structural dynamics problems. A physical interpretation of the matrix exponential is given, which leads to an efficient algorithm for both its evaluation and subsequently the solution of large-scale structural dynamics problems. The proposed algorithm is accurate, efficient and requires less computer storage than previous techniques.

비음수 행렬 분해와 K-means를 이용한 주제기반의 다중문서요약 (Topic-based Multi-document Summarization Using Non-negative Matrix Factorization and K-means)

  • 박선;이주홍
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권4호
    • /
    • pp.255-264
    • /
    • 2008
  • 본 논문은 K-means과 비음수 행렬 분해(NMF)를 이용하여 주제기반의 다중문서를 요약하는 새로운 방법을 제안하였다. 제안방법은 비음수 행렬 분해를 이용하여 가중치가 부여된 용어-문장 행렬을 희소(Sparse)한 비음수 의미특징 행렬과 비음수 변수 행렬로 분해함으로써 직관적으로 이해할 수 있는 형태의 의미적 특징을 추출할 수 있고, 주제와 의미특징간의 유사도에 가중치를 부여하여 유사도는 높으나 실제 의미 없는 문장이 추출되는 것을 막는다. 또한 K-means 군집을 이용하여 문장에 포함된 노이즈를 제거함으로써 문서의 의미가 요약에 편향되게 반영하는 것을 피할 수 있고, 추출된 문장에 부여된 순위순서대로 정렬하여 보여 줌으로써 응집성을 높인다. 실험 결과 제안방법이 다른 방법에 비하여 좋은 성능을 보인다.

Why Gabor Frames? Two Fundamental Measures of Coherence and Their Role in Model Selection

  • Bajwa, Waheed U.;Calderbank, Robert;Jafarpour, Sina
    • Journal of Communications and Networks
    • /
    • 제12권4호
    • /
    • pp.289-307
    • /
    • 2010
  • The problem of model selection arises in a number of contexts, such as subset selection in linear regression, estimation of structures in graphical models, and signal denoising. This paper studies non-asymptotic model selection for the general case of arbitrary (random or deterministic) design matrices and arbitrary nonzero entries of the signal. In this regard, it generalizes the notion of incoherence in the existing literature on model selection and introduces two fundamental measures of coherence-termed as the worst-case coherence and the average coherence-among the columns of a design matrix. It utilizes these two measures of coherence to provide an in-depth analysis of a simple, model-order agnostic one-step thresholding (OST) algorithm for model selection and proves that OST is feasible for exact as well as partial model selection as long as the design matrix obeys an easily verifiable property, which is termed as the coherence property. One of the key insights offered by the ensuing analysis in this regard is that OST can successfully carry out model selection even when methods based on convex optimization such as the lasso fail due to the rank deficiency of the submatrices of the design matrix. In addition, the paper establishes that if the design matrix has reasonably small worst-case and average coherence then OST performs near-optimally when either (i) the energy of any nonzero entry of the signal is close to the average signal energy per nonzero entry or (ii) the signal-to-noise ratio in the measurement system is not too high. Finally, two other key contributions of the paper are that (i) it provides bounds on the average coherence of Gaussian matrices and Gabor frames, and (ii) it extends the results on model selection using OST to low-complexity, model-order agnostic recovery of sparse signals with arbitrary nonzero entries. In particular, this part of the analysis in the paper implies that an Alltop Gabor frame together with OST can successfully carry out model selection and recovery of sparse signals irrespective of the phases of the nonzero entries even if the number of nonzero entries scales almost linearly with the number of rows of the Alltop Gabor frame.

A study on modified biorthogonalization method for decreasing a breakdown condition

  • Kim, Sung-Kyung
    • 한국산업정보학회논문지
    • /
    • 제7권5호
    • /
    • pp.59-66
    • /
    • 2002
  • 대규모 비대칭 행렬의 특정 고유치들이 많은 중요한 과학, 공학 문제들에서 요구된다. 그 문제를 해결할 수 있는 방법 중의 하나인 biorthogonal 란초스 알고리즘은 심각한 문제점이 있는데, 어떤 특이한 상황에서 알고리즘을 계속할 수 없는 경우가 발생할 수 있다는 것이다. 본 논문에서는 기본적인 biorhogonal 알고리즘이 만드는 축소된 삼중 대각 행렬에 대하여 동일한 고유치를 발견할 수 있는 향상된 biorhogonal 란초스 알고리즘을 소개한다. 이 새로운 알고리즘은 대규모 비대칭 행렬의 특정 고유치들을 구할 수 있으며 기본적인 biorthogonal 란초스 알고리즘에 비해서 안정적인 방법이라는 것을 Cray 컴퓨터를 이용한 실험을 통해서 보여준다.

  • PDF

아파치 스파크에서의 PARAFAC 분해 기반 텐서 재구성을 이용한 추천 시스템 (PARAFAC Tensor Reconstruction for Recommender System based on Apache Spark)

  • 임어진;용환승
    • 한국멀티미디어학회논문지
    • /
    • 제22권4호
    • /
    • pp.443-454
    • /
    • 2019
  • In recent years, there has been active research on a recommender system that considers three or more inputs in addition to users and goods, making it a multi-dimensional array, also known as a tensor. The main issue with using tensor is that there are a lot of missing values, making it sparse. In order to solve this, the tensor can be shrunk using the tensor decomposition algorithm into a lower dimensional array called a factor matrix. Then, the tensor is reconstructed by calculating factor matrices to fill original empty cells with predicted values. This is called tensor reconstruction. In this paper, we propose a user-based Top-K recommender system by normalized PARAFAC tensor reconstruction. This method involves factorization of a tensor into factor matrices and reconstructs the tensor again. Before decomposition, the original tensor is normalized based on each dimension to reduce overfitting. Using the real world dataset, this paper shows the processing of a large amount of data and implements a recommender system based on Apache Spark. In addition, this study has confirmed that the recommender performance is improved through normalization of the tensor.