• 제목/요약/키워드: 병렬 라이브러리

검색결과 172건 처리시간 0.027초

메모리 중심 컴퓨터 구조에서 MPI 병렬 프로그램의 효율적인 수행 (Efficient Executions of MPI Parallel Programs in Memory-Centric Computer Architecture)

  • 이제만;이승철;신동하
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.257-258
    • /
    • 2019
  • 본 논문에서는 "프로세서 중심 컴퓨터 구조"에서 개발된 MPI 병렬 프로그램을 수정하지 않고 "메모리 중심 컴퓨터 구조"에서 더 효율적으로 수행시키는 기술을 제안한다. 본 연구에서 제안하는 기술은 메모리 중심 컴퓨터 구조가 가지는 "빠른 대용량 공유 메모리" 특징을 이용하여 MPI 표준 라이브러리가 수행하는 네트워크 통신을 통한 느린 데이터 전달을 공유 메모리를 통한 빠른 데이터 전달로 대체하여 효율성을 얻는다. 본 연구에서 제안한 기술은 도커 가상화 기술을 사용한 분산 시스템 환경에서 MC-MPI-LIB 라이브러리 및 MC-MPI-SIM 시뮬레이터로 구현되었으며 다수의 MPI 병렬 프로그램으로 시험 수행하여 효율성이 있음을 보였다.

  • PDF

이기종 시스템으로 구성된 클러스터 시스템을 위한 MPI Work Packet Manager (MPI Work Packet Manager: Exploiting Heterogeneity in Cluster Computing)

  • 이규호;김준성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.1091-1094
    • /
    • 2005
  • 저가의 개인용 컴퓨터를 고속 네트워크 장비와 시스템 독립적인 통신 라이브러리를 이용하여 연결함으로서 병렬처리 프로그램을 수행할 수 있는 클러스터 시스템을 구축할 수 있다. 클러스터 시스템은 이를 쉽게 구성하는 개별 시스템의 교체 및 추가로 인해서 이기종화 된다. 본 논문에서는 이기종 시스템으로 구성된 클러스터 시스템의 성능 향상을 위해서 MPI Work Packet Manager (WPM) 라이브러리를 제안한다. 실험 결과에 의하면 이기종 시스템으로 구성된 클러스터 시스템에서 WPM 라이브러리를 적용한 병렬처리 프로그램이 이기종 클러스터 시스템의 성능을 적절히 활용하고 있음을 알 수 있다.

  • PDF

인텔 MKL 라이브러리를 이용한 Xeon Phi Coprocessor 벤치마크 (Benchmarking the Intel Xeon Phi Coprocessor with Intel MKL library)

  • 박영수;박구락;김진묵
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.1-4
    • /
    • 2014
  • 인텔 Many Integrated Core (MIC) 아키텍쳐는 61개의 코어가 하나의 칩에 결합되어 있다. Xeon Phi 로 명명된 인텔 MIC는 인텔 E5 Xeon CPU 보다 2배의 single precision GFLOPs 성능을 제공한다. 인텔 MIC 는 수치연산에 최적화 되어 있는 아키텍쳐이다. 우리는 Xeon Phi 7120P를 가지고 벤치마킹을 하였고 클락스피드 1.238GHz, 61Core 이고 한 개의 코어당 4쓰레드를 사용하며 이론상 최고 성능은 Peak Double Precision(GFLOP)는 약 2-TFlops 이다. 이에 우리는 인텔 X86 아키텍쳐에서 openMP 와 인텔 MKL(Math kernel library) 라이브러리를 이용한 병렬프로그램을 작성하여 쓰레드 수를 증가 시키면서 인텔 Xeon Phi 와 E5 Xeon CPU에서 single precision 성능을 벤치마킹 하여, Xeon Phi 와 Xeon E5 의 이론적인 성능을 비교해 보고자 한다. 또한 openMP와 인텔 MKL라이브러리를 사용한 병렬환경에서 CPU의 성능 지표인 클락스피드와 코어수 외에 Vector unit size 의 크기가 성능에 어떤 영향을 미치는지 살펴보았다.

  • PDF

병렬 프로그램을 위한 PnP 스타일의 성능 가시화기 (Plug and Play Style Performance Visualizer for Parallel Programs)

  • 문상수;김정선;문영식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.756-758
    • /
    • 1999
  • 본 논문에서는 최적의 성능을 갖는 병렬 프로그램을 개발하는데 필수 도구인 성능가시화기를 이식성, 확장성 그리고 효율성을 고려해 설계 및 구현한 PnP 스타일의 성능 가시화기에 대하여 기술한다. 본 가시화기는 기존 가시화기의 문제점인 수정 및 변용에의 어려움을 해결하기 위하여 독립된 계층구조인 인스트루멘테이션층, 인터페이스층, 가시화층으로 구성함으로써 확장성 및 이식성을 갖도록 하였다. 인스트루멘테이션층은 사건(event)을 포획하기 위해 개발된 라이브러리인 ECL(Event Capture Library)로 구성되며, 인터페이스층은 인스트루멘테이션층과 가시화층간에 확장성 있는 문제중심 인터페이스를 제공하기 위해 개발된 사건 기술 언어 및 Java 문제중심 엑세스 라이브러리로 구성되었다. 그리고 PnP 스타일의 성능 가시화기를 설계함으로써 뷰와 필터의 추가 및 수정이 용이하도록 가시화층을 구현하였다. 이렇게 구현된 성능가시화기는 독립된 도구로 사용될 수 있을 뿐 아니라 병렬 프로그래밍, 디버깅, 그리고 성능 분석이 통합된 프로그램 개발환경 구축의 핵심도구로서 활용될 수 있을 것이다.

  • PDF

실시간 영상 복원을 위한 분산 전기단층촬영 알고리즘 (A Distributed Electrical Impedance Tomography Algorithm for Real-Time Image Reconstruction)

  • Junghoon Lee;Gyunglin Park
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권1호
    • /
    • pp.25-36
    • /
    • 2004
  • 본 논문은 전기단층촬영의 실시간 영상 복원을 위한 마스터-슬레이브 구조를 갖는 분산 전기 단층촬영 알고리즘을 제안하고 그 성능을 평가한다. 영상복원은 그 수행시간이 미지수의 수에 3제곱에 비례하는 계산 위주의 응용으로서 영상의 정밀도를 위해 미지수를 증가시키면 그 수행시간이 급격히 증가한다. 마스터는 순차적인 루프에 진입하기 전에 각 컴퓨팅 노드에 독립적인 프레임 데이터를 분배하여 병렬로 기저노드를 추출하도록 하고 그 결과를 취합하여 그룹화함으로써 미지수의 수를 감소시킨다. 지역망으로 연결된 컴퓨팅 노드들은 MATLAB이 설치되어 기본적인 계산능력을 갖고 있으며 MATLAB 자료구조를 효율적으로 교환할 수 있는 명령이 동적 링크 라이브러리로 구현되어 있다. 또한 마스터에는 병렬 행렬 연산, 고속 자코비언 둥이 구현되어 순차적인 부분의 계산을 효율적으로 수행한다. 구현된 각 요소들의 성능을 측정한 결과 병렬 라이브러리는 전체 복원 시간을 50% 가까이 감소시킬 수 있으며 분산 알고리즘은 4개의 노드가 협력작업을 하는 경우 주어진 대상 물체에 대해 12배 빠른 속도로 영상을 복원할 수 있다.

루프 변환에 의한 프로그램 병렬성 개선 방안 (Improvement of Program Parallelism by Using Loop Transformation)

  • 김진미;지동해;윤석한
    • 전자통신동향분석
    • /
    • 제14권2호통권56호
    • /
    • pp.1-13
    • /
    • 1999
  • 본 연구는 병렬성 및 지역성 증진을 위한 컴파일러 최적화에 관한 연구로서, 순차 언어로 작성된 프로그램을 병렬성을 명시하는 프로그램으로 변환하는 자동 병렬화 기술을 연구하고, 병렬화를 위한 코드 변환을 수행한 후 쓰레드를 이용한 최적화된 코드 생성을 통하여 프로그램의 효율성을 높이는 것을 목적으로 한다. 이는 병렬 컴퓨터에서의 프로그램 개발 생산성을 높일 수 있고, 컴파일러의 관련 기술 발전에 도움을 줄 수 있다. 본 고에서는 순차 언어인 FORTRAN 및 C 프로그램을 입력으로 받아 병렬성 및 지역성 분석을 수행하고, 분석을 통해 기본 컴파일러로 선정한 SUIF 컴파일러에서 사용되는 루프 변환을 포함하여 루프 분산 및 병합의 프로그램 변환을 수행한 후, 쓰레드 실행시간 라이브러리로 병렬성을 명시한 C 프로그램을 출력하는 병렬화 번역기에 대한 연구 내용을 기술하였다.

OpenCV 작업 환경에서 ARToolkit 라이브러리 및 OpenVRML 연동 시스템 (Linkage System of ARToolkit Library and OpenVRML in OpenCV Working Environment)

  • 김대영;이칠우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.356-358
    • /
    • 2012
  • 본 논문에서는 OpenCV를 이용한 영상처리 작업환경에서 영상처리 결과에 따라 마커를 기반으로 한 복잡한 형태의 3D 애니메이션 객체를 띄우기 위해 사용되는 증강현실 라이브러리(ARToolkit, OpenVRML)를 함께 사용하는 시스템을 제시하였다. OpenCV 라이브러리와 증강현실 라이브러리는 카메라로부터 이미지를 얻어오기 위한 함수 및 가져온 이미지 타입이 다르고 각각의 라이브러리에 맞게 이미지를 처리하기 위한 설정 및 최종적으로 디스플레이 하기 위한 일련의 과정에 있어서 호출되는 모듈들이 상이하였다. 또한 ARToolkit내에서도 보다 복잡한 3D객체의 렌더링을 수월하게 하기 위한 OpenVRML 기반 렌더링과 개발자가 원하는 렌더링을 손쉽게 수행할 수 있는 OpenGL 기반 렌더링과의 병렬적인 연동에 있어서 두 라이브러리를 사용하는 프로젝트의 카메라 및 렌더링 설정과 렌더링 처리 절차에 차이가 있어 두 프로젝트의 기능별 모듈을 하나로 통합하였다. 그리고 영상처리 라이브러리의 이미지 처리에 대한 모듈을 전체 시스템의 처리 순서에 맞게 알맞은 함수들로 배정하여 이 함수 내에서 추후 개발자가 개발한 시스템에 맞게 직접 편집하여 활용할 수 있도록 하였다.

ET 영상복원에서 클러스터 컴퓨팅에 의한 자코비안 계산의 속도 향상 기법 (A performance enhancement scheme for Jacobian matrix via cluster computing on ET image reconstruction procedure)

  • 이정훈;손수방
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (1)
    • /
    • pp.343-345
    • /
    • 2002
  • 본 논문은 차원이 큰 행렬 연산 때문에 많은 계산 시간을 필요로 하는 ET 영상 복원 응용의 속도를 개선하기 위하여 3 대의 PC로 구성된 클러스터를 구축하고 복원 과정 중 가장 많은 시간을 차지하는 자코비언 행렬 계산에 대해 병렬 계산 기법을 제시한다. 각 노드는 리눅스 운영체제, MPI, 산술 계산 라이브러리 등을 탑재하여 C 언어로 옹용이 작성될 수 있으며 자코비언 행렬은 각 계산 루프의 데이터 독립성이 강하므로 병렬 계산의 장점을 최대화 할 수 있다. 구현된 클러스터 자코비언 프로그램은 주어진 인자를 분석하여 MPI 프리미티브에 의해 각각의 노드에 분배시키고 각 노드들로 하여금 자신의 계산 라이브러리를 이용하여 계산하게 한 다음 이 부분 결과를 모아 최종적인 자코비언 행렬을 생성한다. 이 프로그램을 클러스터에서 수행시키고 그 수행시간을 측정한 결과 기존의 자코비언 프로그램에 비해 최대 40% 까지 수행시간을 단축시킬 수 있었으며 추후 행렬의 차원이 증가할 경우 클러스터 컴퓨팅에 의한 성능 개선을 기할 수 있다.

  • PDF

Windows 운영체제 기반의 병렬 계산 환경 (Parallel Computing Environment based on Windows Operating System)

  • 최정열;신재렬;김명호
    • 한국항공우주학회지
    • /
    • 제31권4호
    • /
    • pp.16-25
    • /
    • 2003
  • Windows 운영체제 기반의 병렬처리 환경을 구축하였으며, 리눅스 운영체제 기반의 시스템과 비교하여 병렬처리 성능을 살펴보았다. Windows 클러스터는 Fast-Ethernet으로 연결된 서버와 클라이언트로 구성되어 있으며, 두 개의 클러스터가 동시에 또는 개별적으로 운용될 수 있도록 구성하였다. 계산 도구로서 Compaq Visual Fortran 컴파일러와 두 개의 MPI 라이브러리, MPICH.NT.1.2.2 와 MP-MPICHNT.1.2 를 설치하였다. 병렬 처리 성능 시험은 이차원 예조건화 Navier-Stokes 코드를 이용하여 수행하였으며, 리눅스 클러스터의 결과와 비교하여, 프로세서의 수, 문제의 크기 그리고 MPI 라이브러리에 따른 의존성을 살펴보았다. 이 결과는 사용자에게 친숙한 Windows 운영체제 기반의 클러스터가 병렬 계산 환경에서도 유용하며, 이전의 리눅스 클러스터에 버금가는 우수한 성능을 보여주었다.