• 제목/요약/키워드: BLAS

검색결과 12건 처리시간 0.024초

SCAM 기상모델의 성능향상을 위한 LAPACK BLAS 라이브러리의 활용 (Performance Improvements of SCAM Climate Model using LAPACK BLAS Library)

  • 신대영;조예린;정성욱
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권1호
    • /
    • pp.33-40
    • /
    • 2023
  • 슈퍼 컴퓨팅 기술 및 하드웨어 기술의 발달로 수치 연산 방식 또한 고도화되고 있다. 그에 따라 이전 대비 향상된 기상 예측 또한 가능해진다. 본 논문에서는 SCAM(Single-Columns Atmospheric Model, CESM(Community Earth System Model)을 간소화 한 버전)에 포함되어 있으며 대기 연산을 수행하는 적운 모수화 코드, Unicon(A Unified Convection Scheme)의 성능을 향상하기 위하여 소스 코드 내의 선형대수 수치적 연산 부분에 고밀도 선형대수 연산을 위한 라이브러리인 LAPACK(Linear Algebra PACKage) BLAS(Basic Linear Algebra Subprograms)의 level1 함수를 적용할 것을 제안한다. 이를 분석하기 위하여 SCAM의 전체적인 실행 구조도를 제시하고 해당 실행환경에서 테스트를 진행하였다. 기존 소스 코드 대비 SCOPY 함수는 0.4053%, DSCAL 함수는 0.7812%, DDOT 함수는 0.0469%의 성능 향상을 이끌어 내었으며 이를 모두 적용한 결과 기존 소스 코드 대비 0.8537%의 성능 향상을 보였다. 이는 본 논문에서 제안한 고밀도 선형대수 연산을 위한 라이브러리인 LAPACK BLAS 적용 방법이 동일한 CPU 환경에서 추가적인 하드웨어의 개입 없이 성능을 향상시킬 수 있음을 의미한다.

멀티코어 CPU를 갖는 공유 메모리 구조의 대규모 병렬 유한요소 코드에 대한 설계 고려 사항 (Design Considerations on Large-scale Parallel Finite Element Code in Shared Memory Architecture with Multi-Core CPU)

  • 조정래;조근희
    • 한국전산구조공학회논문집
    • /
    • 제30권2호
    • /
    • pp.127-135
    • /
    • 2017
  • 멀티코어 CPU와 BLAS, LAPACK을 구현한 최적 수치라이브러리, 직접 희소 솔버의 대중화 등 PC나 워크스테이션 수준에서도 대규모 유한요소 모델을 해석할 수 있도록 컴퓨팅 환경이 급속도로 변화되었다. 이 논문에서는 멀티코어 CPU를 갖는 공유 메모리 구조에 대한 병렬 유한요소 프로그램 설계시 고려사항으로 (1) 최적화된 수치라이브러리의 사용, (2) 최신 직접 희소 솔버의 사용, (3) OpenMP를 이용한 병렬 요소 강성 행렬의 계산, (4) 희소행렬 저장방식의 일종인 triplet을 이용한 어셈블 기법 등을 제시하였다. 또한 대규모 수치모델을 통해 많은 시간이 소요되는 작업을 기준으로 병렬화 효과를 검토하였다.

Novel Low-Power High-dB Range CMOS Pseudo-Exponential Cells

  • De La Cruz Blas, Carlos A.;Lopez-Martin, Antonio
    • ETRI Journal
    • /
    • 제28권6호
    • /
    • pp.732-738
    • /
    • 2006
  • In this paper, novel CMOS pseudo-exponential circuits operating in a class-AB mode are presented. The pseudo-exponential approximation employed is based on second order equations. Such terms are derived in a straightforward way from the inherent nonlinear currents of class-AB transconductors. The cells are appropriate to be integrated in portable equipment due to their compactness and very low power consumption. Measurement results from a fabricated prototype in a 0.5 ${\mu}m$ technology reveal a range of 45 dB with errors lower than ${\pm}0.5$ dB, a power consumption of 100 ${\mu}W$, and an area of 0.01 $mm^2$.

  • PDF

Direct Methods for Linear System on Distributed Memory Parallel Computers

  • Nishimura, S.;Shigehara, T.;Mizoguchi, H.;Mishima, T.;Kobayashi, H.
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -1
    • /
    • pp.333-336
    • /
    • 2000
  • We discuss the direct methods (Gauss-Jordan and Gaussian eliminations) to solve linear systems on distributed memory parallel computers. It will be shown that the so-called row-cyclic storage gives rise to the best performance among the standard three (row-cyclic, column-cyclic and cyclic-cyclic) data storages. We also show that Gauss-Jordan elimination, rather than Gaussian elimination, is highly efficient for the direct solution of linear systems in parallel processing, though Gauss-Jordan elimination requires a larger number of arithmetic operations than Gaussian elimination. Numerical experiment is performed on HITACHI SR12201 with the standard libraries MPI and BLAS.

  • PDF

Phylogenetic study of penicillium chrysogenum based on the amino acid sequence analysis of chitin synthase

  • Park, Bum-Chan;Lee, Dong-Hun;Sook, Bae-Kyung;Park, Hee-Moon
    • Journal of Microbiology
    • /
    • 제35권3호
    • /
    • pp.159-164
    • /
    • 1997
  • The phylogenetic study of Penicilium chrysogenum was performed based on amino acid sequence comparison of chitin synthase. Phylogenetic trees were constructed with the deduced amino acid sequences of the highly conserved region of chitin synthease gene fragments amplified by PCR. The BlasP similarity searcch and the bootstrap analysis of the deduced amino acid sequences of chitin synthase from P. chrysogenum with those form other fungi showed a close evolutionary relationship of Penicillium to ascomycetous fungi, especially to genus Aspergilus. The result from bootstrap analysis of the deduced amino acid sequences of the Class II chitin synthase from ascomyceteous fungi supported the usefulness of the Class II chitin synthease for phylogenetic study of filamentous fungi.

  • PDF

자연배란된 처녀우와 경산으로부터 비외과적으로 회수한 수정란의 발육단계에 관한 연구 (A Study on the Stage of Embryos Non-Surgically Recovered from Heifers and Cows in Natural Heat)

  • 정구민;김종국;임경순
    • 한국수정란이식학회지
    • /
    • 제4권1호
    • /
    • pp.41-45
    • /
    • 1989
  • Total thirty of flushing were attempted on day 4 to 15 of estrus cycle with S heifers and 9 cows by nonsurgical method. The flushed or recovered rate among flushings was 86.7% (26/30) or 88.5% (23/26), respectively. There was no difference in the recovered rate between heifers (85.7%,6/7) and cows (89.5%, 17119). The embryo was recovered on day 4 to 15 of estrus cycle from the donors in natural heat without any technical difficulties.The I2FG Foley catheter used for pubertal heifers had sometimes plug in it with uterine mucus during flushing of uterine horn. But the problem could be overcomed by pumping the catherter with fluthing solution or by changing the catheter. Three normal embryos were recovered from 3 pubertal (10-11 month old) heifers. The rate of normal and abnormal eggs was 60.9% (14123) and 39.1% (9/23), respectively. The abnormal eggs were on degenerating except one unfertilized egg and were mostly recovered from heifers or cows flushed consecutively during the estrus cycle. The developmental states of normal embryos were l6-cells on day 5, 32-cells on day 6, compacted-morula on day 7, early-to expanded-blastocyst on day 8-to 9, and hatching-to hatched-blastocyst on day 10 to 11 of estrus cycle. The stage of embryos on day 8 to 10 showed varities among donors. On day 8 to 9 of estrus cycle hatching-blas tocyst was recovered from some donors.

  • PDF

Coherent motion of microwave-induced fluxons in intrinsic Josephson junctions of HgI$_2$-intercalated Bi$_2$Sr$_2$C aCu$_2$O$_{8+x}$ single crystals

  • Kim, Jin-Hee;Doh, Yong-Joo;Chang, Sung-Ho;Lee, Hu-Jong;Chang, Hyun-Sik;Kim, Kyu-Tae;Jang, Eue-Soon;Choy, Jin-Ho
    • 한국초전도학회:학술대회논문집
    • /
    • 한국초전도학회 2000년도 High Temperature Superconductivity Vol.X
    • /
    • pp.65-65
    • /
    • 2000
  • Microwave response of intrinsic Josephson junctions in mesa structure formed on HgI2-intercalated Bi2Sr2CaCu2O8+x single crystals was studied in a wide range of microwave frequency. With irradiation of 73${\sim}$76 GHz microwave, the supercurrent branch becomes resistive above a certain onset microwave power. At low current bias, the current-voltage characteristics show linear behavior, while at high current bias, the resistive branch splits into multiple sub-branches. The voltage spacing between neighboring sub-branches increase with the microwave power and the total number of sub-branches is almost identical to the number of intrinsic Josephson junctions in the mesa. All the experimental results suggest that each sub-branch represents a specific mode of collective motion of Josephson vortices generated by the microwave irradiation. With irradiation of microwave of microwave of frequency lower than 20 GHz, on the other hand, no branch splitting was observed and the current-voltage characteristics exhibited complex behavior at hlgh blas currents. This result can be explained in terms of incoherent motion of Josephson vortices generated by non-uniform microwave irradiation.

  • PDF

쌍턴넬다이오드회로를 이용한 펄스폭변조 (Pulse Width Modulation by Tunnel Diode Pair Circuit)

  • 오현위
    • 대한전자공학회논문지
    • /
    • 제9권3호
    • /
    • pp.1-8
    • /
    • 1972
  • 부성저항영역에서 동작하도록 바이어스전압을 걸어 준 쌍턴넬다이오드회로의 차특성은 역시 전압제어형의 부저항영역을 갖고, 이 회로를 발진기로 동작시킬 때의 쌍회로의 중점의 전위는 구형파의 이완진동을 일으킨다. 본논고에서는 이 중점에서의 구형파에서의 주기 및 정 또는 부의 펄스의 폭을 바이어스 전압에 의하여 제어할 수 있다는 점을 감안하여 주기 T 및 정펄스시간 T1 또는 부펄스시간 T2를 착특성곡선으로부터 해석적으로 구하고 또한 실측하였다. 또한 T 및 T1 또는 T2와 회로제정수와의 관계를 검토하여, T가 일정하고 T1-T2가 바이어스전압의 변화량에 비례하여 조건을 만족시키는 회로정수를 정하고, 바이어스전원과 직렬로 신호전압을 압입하는 방법을 고려하여 구성할 펄스폭변조회로의 특성을 구하였다.

  • PDF