• Title/Summary/Keyword: parallel library

검색결과 189건 처리시간 0.026초

A PARALLEL PRECONDITIONER FOR GENERALIZED EIGENVALUE PROBLEMS BY CG-TYPE METHOD

  • MA, SANGBACK;JANG, HO-JONG
    • Journal of the Korean Society for Industrial and Applied Mathematics
    • /
    • 제5권2호
    • /
    • pp.63-69
    • /
    • 2001
  • In this study, we shall be concerned with computing in parallel a few of the smallest eigenvalues and their corresponding eigenvectors of the eigenvalue problem, $Ax={\lambda}Bx$, where A is symmetric, and B is symmetric positive definite. Both A and B are large and sparse. Recently iterative algorithms based on the optimization of the Rayleigh quotient have been developed, and CG scheme for the optimization of the Rayleigh quotient has been proven a very attractive and promising technique for large sparse eigenproblems for small extreme eigenvalues. As in the case of a system of linear equations, successful application of the CG scheme to eigenproblems depends also upon the preconditioning techniques. A proper choice of the preconditioner significantly improves the convergence of the CG scheme. The idea underlying the present work is a parallel computation of the Multi-Color Block SSOR preconditioning for the CG optimization of the Rayleigh quotient together with deflation techniques. Multi-Coloring is a simple technique to obatin the parallelism of order n, where n is the dimension of the matrix. Block SSOR is a symmetric preconditioner which is expected to minimize the interprocessor communication due to the blocking. We implemented the results on the CRAY-T3E with 128 nodes. The MPI(Message Passing Interface) library was adopted for the interprocessor communications. The test problems were drawn from the discretizations of partial differential equations by finite difference methods.

  • PDF

북한 PUST 디지털도서관 모델 개발 연구 (A Study on the Development of Digital Library Model for PUST in North Korea)

  • 이종문
    • 정보관리학회지
    • /
    • 제25권3호
    • /
    • pp.143-158
    • /
    • 2008
  • 본 연구는 남북합작으로 건립하는 PUST에 설치될 도서관과 디지털도서관 모델 제시를 위해 수행되었다. 우선 이론적 연구를 통해 디지털도서관의 문제와 PUST 디지털도서관의 이슈를 파악하였다. 그 결과, 저작권법하의 공정사용 미흡 등으로 현 단계에서 디지털도서관만 운영하는 것은 문제가 있는 것으로 파악되었다. 또 남북의 언어와 지적기반의 차이 등으로 홈페이지 접근 데이터베이스 구축 자료 의 검색 등에 문제가 있는 것으로 파악되었다. 이에 연구자는 디지털도서관과 하이브리드 도서관을 병행 운영할 것과, 디지털도서관 관련 하여 유니코드를 통한 홈페이지의 이중화 NCHAR 데이터타입 설정을 통한 다국어 저장, 전거 데이터베이스 구축 등을 제안하였다.

Pediatric phantom library constructed from ICRP mesh-type reference computational phantoms (MRCPs)

  • Suhyeon Kim;Bangho Shin;Chansoo Choi;Hyeonil Kim;Sangseok Ha;Beom Sun Chung;Haegin Han;Sungho Moon;Gahee Son;Jaehyo Kim;Ji Won Choi;Chan Hyeong Kim;Yeon Soo Yeom
    • Nuclear Engineering and Technology
    • /
    • 제56권8호
    • /
    • pp.3210-3223
    • /
    • 2024
  • International Commission on Radiological Protection (ICRP) recently developed the adult and pediatric meshtype reference computational phantoms (MRCPs) in high-quality/fidelity mesh format, featuring high deformability into various body sizes and poses. Utilizing this feature, the adult MRCPs-based body-size-dependent phantom library was developed for individualized dosimetry. To complete the full phantom library set, the present study produced the pediatric-MRCPs-based body-size-dependent pediatric phantom library. The library comprises a total of 637 phantoms (356 males and 281 females) with varying standing heights and body weights, covering a wide range of body sizes (i.e., including from 1st to 99th percentile height and weight values) for infants, children, and adolescents, offering a realistic representation of body shapes by reflecting ten secondary anthropometric parameters. The phantoms were automatically constructed utilizing automatic deformation program. The dosimetric impact of the library was investigated by calculating organ doses for external exposures to broad parallel photon beams in anterior-posterior direction. Compared with the values of the pediatric MRCPs, significant differences were observed at energies <0.05 MeV, showing larger values for underweight phantom and smaller values for obese phantom. The results highlight the importance of using the pediatric phantom library for accurate dose estimates of individual children with various body sizes.

CPU 클러스터 구축 및 3차원 공간분할 병렬 FDTD 알고리즘 구현 (Construction of a CPU Cluster and Implementation of a 3-D Domain Decomposition Parallel FDTD Algorithm)

  • 박성민;추광욱;주세훈;박윤미;김기백;정경영
    • 한국전자파학회논문지
    • /
    • 제25권3호
    • /
    • pp.357-364
    • /
    • 2014
  • 본 연구에서는 빠르게 전자파 해석을 수행할 수 있는 병렬 유한차분 시간영역(Finite-Difference Time-Domain: FDTD) 알고리즘을 구현하기 위하여 CPU 클러스터를 구축하였다. 병렬 FDTD 알고리즘은 단일 프로세서를 이용한 FDTD 알고리즘에 비해 해석 시간을 크게 줄일 수 있으며, 전기적으로 매우 큰 구조물에 대한 전자파 해석도 가능하다. 본 연구팀에서는 CPU 클러스터 기반의 병렬 FDTD 알고리즘에서 요구되는 프로세스 간의 통신을 위해 MPI(Message Passing Interface) 라이브러리를 이용하였으며, 3차원 공간분할을 적용하여 프로세스 간의 통신 시간을 최소화하였다. 단일 프로세서를 이용한 FDTD 알고리즘 대비 CPU 클러스터 기반의 병렬 FDTD 알고리즘의 계산속도 향상도를 기본 모드와 하이퍼 모드에서 분석하였으며, 전기적으로 매우 큰 콘크리트 구조물의 전자파 해석을 하였다.

H.264/AVC를 위한 블록현상 제거필터의 병렬 하드웨어 구조 (A Parallel Hardware Architecture for H.264/AVC Deblocking Filter)

  • 정용진;김현집
    • 대한전자공학회논문지SD
    • /
    • 제43권10호
    • /
    • pp.45-53
    • /
    • 2006
  • 본 논문에서는, H.264/AVC의 블록현상 제거필터의 병렬 하드웨어 구조를 제안한다. 블록현상 제거필터는 H.264/AVC에 있어서 고화질을 보장해주고 있지만, 높은 연산량을 필요로 하기 때문에 임베디드 환경에서는 하드웨어 구현이 필수적이다. 본 논문에서는 실시간 영상 처리를 위해 2개의 1-D 필터를 적용하고, Dual-port SRAM을 사용한 병렬 하드웨어 구조를 적용하였다. 구현된 하드웨어 구조는 Verilog-HDL로 나타내고 Synopsys Design Compiler와 Hynix 0.25um CMOS Cell Library를 이용하여 합성하였다. 구현된 크기는 27.3k의 하드웨어 로직 리소스를 사용하고(내부 SRAM 제외) 최대 동작 주파수는 약 100Mhz가 되었다. 제안한 병렬 구조는 하나의 매크로블록을 처리하는데 258클록이 소요되며, 이는 HD 1080P(1920화소${\times}$1080화소) 의 영상을 초당 47.8프레임으로 처리가 가능함을 말한다. 이는 하드웨어 기반의 H.264/AVC 실시간 부/복호화 시스템에 적합한 구조임을 보여준다.

병렬 프로그램 성능가시화를 위한 확장성 있는 프레임워크 설계 및 구현 (Design and Implementation of a Scalable Framework for Parallel Program Performance Visualization)

  • 문상수;문영식;김정선
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권2호
    • /
    • pp.109-120
    • /
    • 2001
  • 본 논문에서는 최적의 성능을 갖는 병렬프로그램 개발을 위한 도구로 이식성, 확장성, 효율성을 고려한 성능가시화 프레임워크의 설계 및 구현을 제시한다. 본 프레임워크는 독립적으로 개발 가능한 인스트루멘테이션 층, 인터페이스 층 그리고 가시화 층으로 이루어진 계층구조를 갖도록 설계되었다. 인스트루멘테이션 층은 사건(event) 포획을 위한 라이브러리인 ECL(Event Capture Library)로 구성되며, 인터페이스 층은 인스트루멘테이션 층과 가시화 층 간에 문제중심의 인터페이스를 제공하기 위해 개발된 EDL/JPAL(Event Description Language/Jave Problem-oriented trace Access Library)로 구성되었다. 또한 가시화 층은 뷰와 필터의 추가, 수정 및 custom 뷰 그룹의 구성이 용이하도록 plug and play 스타일로 설계되었다. 이렇게 구현된 성능 가시화 프레임워크는 독립된 도구로서 뿐만 아니라 프로그래밍, 디버깅 그리고 성능분석이 통합된 병렬프로그램 개발환경의 핵심도구로 사용될 수 있다.

  • PDF

과학기술분야 전문정보센터의 효율적인 정보서비스 방안 (A Study on the Effective Information Service of Specialized Information Center in Scientific & Technological Fields)

  • 이응봉
    • 한국문헌정보학회지
    • /
    • 제38권2호
    • /
    • pp.49-74
    • /
    • 2004
  • 본 연구에서는 한국과학기술정보연구원(KISTI)에서 지정하여 지원하고 있는 우리나라 과학기술분야 전문정보센터를 대상으로 정보서비스 체계 전반에 대한 현황 및 문제점을 분석$\cdot$파악하고 이를 토대로 최신의 정보기술을 반영$\cdot$적용한 우리나라 과학기술분야 전문정보센터의 효율적인 정보서비스 방안을 제시하였다. 이를 위하여 본 연구에서는 선행연구 분석, 설문조사, 해당기관 직접방문을 통한 관련자 면담, 해당기관 홈페이지의 관련 사이트 분석, 그리고 관련 전문가로 구성된 상시협의체의 회의를 통한 Brainstorming 방범 등을 병행하여 실시하였다.

제한된 범위의 Signed-Digit Number 인코딩을 이용한 병렬 십진 곱셈기 설계 (Design of Parallel Decimal Multiplier using Limited Range of Signed-Digit Number Encoding)

  • 황인국;김강희;윤완오;최상방
    • 전자공학회논문지
    • /
    • 제50권3호
    • /
    • pp.50-58
    • /
    • 2013
  • 본 논문에서는 제한된 범위의 Signed-Digit number 인코딩과 축약 단계를 이용한 고정소수점 병렬 십진 곱셈기를 제안한다. 제안한 병렬 십진 곱셈기는 승수와 피승수를 제한된 범위의 SD number로 인코딩하여 캐리 전달 지연 없이 빠르게 부분곱을 생성한다. 인코딩에 사용하는 숫자의 범위를 줄임으로써 SD number 다중 피연산자 덧셈의 한번에 연산 가능한 피연산자의 개수가 늘어나게 되고, 이에 따라 부분곱 축약 단계의 연산을 빠르게 수행 할 수 있다. 제안한 병렬 십진 곱셈기의 성능 평가를 위해 Design Compiler에서 SMIC사의 180nm CMOS 공정 라이브러리를 이용하여 합성한 결과 기존의 Signed-Digit number를 이용한 병렬 십진 곱셈기보다 전체 지연시간은 4.3%, 전체 면적은 5.3% 감소함을 확인 하였다. 전체 지연시간 및 면적에서 부분곱 축약 단계가 차지하는 비중이 가장 크므로 부분곱 생성 단계에서 약간의 지연시간 및 면적 증가가 있음에도 불구하고 전체 지연시간과 면적이 감소하는 결과를 얻을 수 있다.

그래프 분할 및 다중 프론탈 기법에 의거한 3차원 전자기장의 병렬 해석 (Parallel Computation on the Three-dimensional Electromagnetic Field by the Graph Partitioning and Multi-frontal Method)

  • 강승훈;송동현;최재원;신상준
    • 한국항공우주학회지
    • /
    • 제50권12호
    • /
    • pp.889-898
    • /
    • 2022
  • 본 논문에서는 3차원 전자기장의 병렬 해석 기법을 제안하였다. 시간 조화 벡터 파동 방정식 및 유한요소 기법에 기반한 전자기장 산란 해석이 수행되었으며, 모서리 기반 요소 및 2차 흡수 경계 조건이 도입되었다. 개발한 알고리즘은 유한요소망을 분할한 뒤 각 프로세서에 할당함으로써 요소별 수치적분 및 행렬 조립 과정의 병렬화를 달성하였다. 이때 부영역 생성을 위해 그래프 분할 라이브러리인 METIS가 도입되었다. 대형 희박행렬 방정식의 계산은 다중 프론탈 기법 기반 병렬 연산 라이브러리인 MUMPS를 통해 수행되었다. 개발된 프로그램의 정확도는 Mie 이론해 및 ANSYS HFSS 결과와의 비교를 통해 검증되었다. 또한 사용된 프로세서 수에 따른 가속 지표를 측정하여 확장성을 확인하였다. 완전 전기 도체 구, 등·이방성 유전체 구 및 유도탄 예제 형상에 대한 전자기장 산란 해석이 수행되었다. 개발된 프로그램의 알고리즘은 추후 유한요소 분할 및 합성법에 활용될 예정이며, 더욱 확장된 병렬 연산 성능을 목표하고자 한다.

멀티코어 시스템에서 최적화된 소프트웨어 개발을 위한 병렬처리 프로그래밍 기법 조사 (The Survey of Parallel Programming Techniques for Developing Optimized Software in Multi-core System)

  • 이기홍;김지홍;엄영익
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.36-38
    • /
    • 2012
  • 이제 멀티코어 CPU가 보편화 되었지만 대다수의 프로그래밍 언어가 단일 코어를 대상으로 발전되었기 때문에 병렬화에 어려움이 있다. 이를 해결하고자 병렬처리 기법들이 연구되고 있지만 오히려 개발자는 여러 기법들 사이에서 혼란스러울 수 있다. 본 논문에서는 개발자들이 처한 상황에서 적절한 기법을 선택하는데 도움이 되고자 주요 병렬처리 기법인 OpenMP, Threading Building Blocks, Cilk Plus, Parallel Patterns Library를 비교 및 평가하였다. 각 기법마다 지원 기능, 지원 방식, 스케줄링 기법 등 개발자가 프로그램을 개발함에 있어 고려해야 할 특징들이 서로 다르고 각기 장단점이 존재한다. 따라서 병렬처리 기법을 선택하고 구현함에 있어 특정한 하나의 기법에 의존하는 것보다는 여러 기법들의 특성을 파악하여 상황에 맞는 기법을 선택한다면 보다 효율적이면서도 쉽게 병렬처리를 구현할 수 있다.