• 제목/요약/키워드: Parallel Computing

검색결과 807건 처리시간 0.028초

An Efficient Multidimensional Index Structure for Parallel Environments

  • Bok Koung-Soo;Song Seok-Il;Yoo Jae-Soo
    • International Journal of Contents
    • /
    • 제1권1호
    • /
    • pp.50-58
    • /
    • 2005
  • Generally, multidimensional data such as image and spatial data require large amount of storage space. There is a limit to store and manage those large amounts of data in single workstation. If we manage the data on parallel computing environment which is being actively researched these days, we can get highly improved performance. In this paper, we propose a parallel multidimensional index structure that exploits the parallelism of the parallel computing environment. The proposed index structure is nP(processor)-nxmD(disk) architecture which is the hybrid type of nP-nD and 1P-nD. Its node structure in-creases fan-out and reduces the height of an index. Also, a range search algorithm that maximizes I/O parallelism is devised, and it is applied to k-nearest neighbor queries. Through various experiments, it is shown that the proposed method outperforms other parallel index structures.

  • PDF

AN ASYNCHRONOUS PARALLEL SOLVER FOR SOME MATRIX PROBLEMS

  • Park, Pil-Seong
    • Journal of applied mathematics & informatics
    • /
    • 제7권3호
    • /
    • pp.1045-1058
    • /
    • 2000
  • In usual synchronous parallel computing, workload balance is a crucial factor to reduce idle times of some processors that have finished their jobs earlier than others. However, it is difficult to achieve on a heterogeneous workstation clusters where the available computing power of each processor is unpredictable. As a way to overcome such a problem, the idea of asynchronous methods has grown out and is being increasingly used and studied, but there is none for eigenvalue problems yet. In this paper, we suggest a new asynchronous method to solve some singular matrix problems, that can also be used for finding a certain eigenvector of some matrices.

Design and optimization of steel trusses using genetic algorithms, parallel computing, and human-computer interaction

  • Agarwal, Pranab;Raich, Anne M.
    • Structural Engineering and Mechanics
    • /
    • 제23권4호
    • /
    • pp.325-337
    • /
    • 2006
  • A hybrid structural design and optimization methodology that combines the strengths of genetic algorithms, local search techniques, and parallel computing is developed to evolve optimal truss systems in this research effort. The primary objective that is met in evolving near-optimal or optimal structural systems using this approach is the capability of satisfying user-defined design criteria while minimizing the computational time required. The application of genetic algorithms to the design and optimization of truss systems supports conceptual design by facilitating the exploration of new design alternatives. In addition, final shape optimization of the evolved designs is supported through the refinement of member sizes using local search techniques for further improvement. The use of the hybrid approach, therefore, enhances the overall process of structural design. Parallel computing is implemented to reduce the total computation time required to obtain near-optimal designs. The support of human-computer interaction during layout optimization and local optimization is also discussed since it assists in evolving optimal truss systems that better satisfy a user's design requirements and design preferences.

FPGA 상에서 OpenCL을 이용한 병렬 문자열 매칭 구현과 최적화 방향 (Parallel String Matching and Optimization Using OpenCL on FPGA)

  • 윤진명;최강일;김현진
    • 전기학회논문지
    • /
    • 제66권1호
    • /
    • pp.100-106
    • /
    • 2017
  • In this paper, we propose a parallel optimization method of Aho-Corasick (AC) algorithm and Parallel Failureless Aho-Corasick (PFAC) algorithm using Open Computing Language (OpenCL) on Field Programmable Gate Array (FPGA). The low throughput of string matching engine causes the performance degradation of network process. Recently, many researchers have studied the string matching engine using parallel computing. FPGA's vendors offer a parallel computing platform using OpenCL. In this paper, we apply the AC and PFAC algorithm on DE1-SoC board with Cyclone V FPGA, where the optimization that considers FPGA architecture is performed. Experiments are performed considering global id, local id, local memory, and loop unrolling optimizations using PFAC algorithm. The performance improvement using loop unrolling is 129 times greater than AC algorithm that not adopt loop unrolling. The performance improvements using loop unrolling are 1.1, 0.2, and 1.5 times greater than those using global id, local id, and local memory optimizations mentioned above.

OpenMP와 MPI 코드의 상대적, 혼합적 성능 고찰 (Comparative and Combined Performance Studies of OpenMP and MPI Codes)

  • 이명호
    • 정보처리학회논문지A
    • /
    • 제13A권2호
    • /
    • pp.157-162
    • /
    • 2006
  • 최근의 고성능 컴퓨팅 플랫폼들은 공유 메모리 다중 프로세서(SMP: Shared Memory Multiprocessor) 시스템, 대규모 병렬 프로세서 (Massively Parallel Processor) 시스템, 여러 개의 컴퓨팅 노드들을 연결한 클러스터(Cluster) 시스템 등으로 분류된다. 이러한 고성능 컴퓨팅 시스템들은 높은 수준의 컴퓨팅 성능을 요구하는 과학 기술용 응용 프로그램들을 위하여 사용된다. 이러한 응용 프로그램들의 실행시 최적의 성능을 얻기 위해서는 적절한 컴퓨팅 플랫폼과 프로그래밍 방식의 선택이 중요하다. 본 연구 논문에서는 여러 방식의 병렬 프로그래밍 모델을 사용하여 개발된 SPEC HPC2002 벤치마크 suite을 위한 최적의 컴퓨팅 플랫폼과 프로그래밍 모델을 그들의 성능 분석 및 평가 작업을 통하여 찾아간다.

병렬처리를 위한 고성능 라이브러리의 구현과 성능 평가 (Implementation and Performance Analysis of High Performance Computing Library for Parallel Processing)

  • 김영태;이용권
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권7호
    • /
    • pp.379-386
    • /
    • 2004
  • 본 연구에서는 병렬프로그램을 효율적으로 개발할 수 있고 병렬처리 프로그램의 성능을 향상시키는 이식성을 갖는 고성능 병렬 라이브러리인 HPCL(High Performance Computing Library)을 구현하였다. HPCL은 C 언어와 Fortran 언어로 구현되었으며, Fortran 프로그램에서 메시지 전송 인터페이스인 MPI(Message Passing Interface)를 효율적으로 사용할 수 있도록 하였다. 성능 분석은 PC 클러스터와 상업용 슈퍼컴퓨터인 IBM SP4를 이용하여 병렬프로그램의 성능 향상 및 통신 오버헤드 등에 대하여 다양하게 이루어졌다.

빅데이터 분석을 위한 슈퍼컴퓨터 환경에서 R의 병렬처리 (Parallel Computing Environment for R with on Supercomputer Systems)

  • 이상열;원중호
    • 한국경영과학회지
    • /
    • 제39권4호
    • /
    • pp.19-31
    • /
    • 2014
  • We study parallel processing techniques for the R programming language of high performance computing technology. In this study, we used massively parallel computing system which has 25,408 cpu cores. We conducted a performance evaluation of a distributed memory system using MPI and of a the shared memory system using OpenMP. Our findings are summarized as follows. First, For some particular algorithms, parallel processing is about 150 times faster than serial processing in R. Second, the distributed memory system gets faster as the number of nodes increases while shared memory system is limited in the improvement of performance, due to the limit of the number of cpus in a single system.

그리드 환경하에서 고성능 컴퓨팅을 이용한 열유동 해석 기법에 관한 기초연구 (A Fundamental Study of Thermal-Fluid Flow Analysis using High Performance Computing under the GRID)

  • 홍승도;이대성;이재룡;하만영;이상산
    • 대한기계학회:학술대회논문집
    • /
    • 대한기계학회 2003년도 추계학술대회
    • /
    • pp.928-933
    • /
    • 2003
  • For simulation of three-dimensional turbulent flow with LES and DNS takes much time and expense with current available computing resources. It is nearly impossible to simulate turbulent flow with high Reynolds number. So, the emerging alternative is the Grid computing for needed computation power and working environment. In this study, the CFD code was parallelized to adapt it for the parallel computing under the Grid environment. In the first place, the Grid environment was built to connect the PC-Cluster facilities belong to the different institutions using communication network system. And CFD applications were calculated to check the performance of the parallel code developed for the Grid environment. Although it is a fundamental study, it brings about a important meaning as first step in research of the Grid.

  • PDF

평행사변형 분류 알고리즘의 성능에 대한 연구 (A Study on the Performance of Parallelepiped Classification Algorithm)

  • 용환기
    • 한국지리정보학회지
    • /
    • 제4권4호
    • /
    • pp.1-7
    • /
    • 2001
  • 위성영상은 GIS 정보획득을 위한 가장 중요한 초기자료로서, 이로부터 주제도와 같은 유용한 정보를 추출하기 위해서는 위성영상 즉 다중스펙트럼 영상을 목적에 적합하게 분류하는 처리과정이 필요하다. 위성영상의 분류기법은 크게 감독기법과 무감독기법으로 나뉘는데, 본 논문에서는 감독분류기법 중의 하나인 평행사변형 알고리즘에서 군집의 초기값 설정이 알고리즘의 성능에 미치는 영향을 분석한다. 본 연구에서는 우선 직렬컴퓨터에서 평행사변형 알고리즘의 성능과 초기값 변화와의 관계를 살펴보고, 이를 확장하여 MIMD 병렬구조 컴퓨터 모델을 사용한 경우에 초기값의 변화가 평행사변형 알고리즘의 성능에 미치는 영향을 분석한다. 평행사변형 알고리즘의 성능은 초기값의 설정에 따라 직렬구조의 컴퓨터를 사용하는 경우에는 최고 2.4배, 그리고 MIMD 병렬구조 모델을 사용한 경우에는 최고 2.5배의 성능 향상을 보였다. 전산모의실험을 통해 위성영상의 감독분류기법에서 초기값이 평행사변형 분류알고리즘의 성능에 상당한 영향을 미치며, 직렬컴퓨터와 MIMD 병렬컴퓨터에서 초기값의 적절한 설정을 통해 분류기법의 성능이 향상됨을 확인하였다.

  • PDF

Windows 운영체제 기반의 병렬 계산 환경 (Parallel Computing Environment based on Windows Operating System)

  • 최정열;신재렬;김명호
    • 한국항공우주학회지
    • /
    • 제31권4호
    • /
    • pp.16-25
    • /
    • 2003
  • Windows 운영체제 기반의 병렬처리 환경을 구축하였으며, 리눅스 운영체제 기반의 시스템과 비교하여 병렬처리 성능을 살펴보았다. Windows 클러스터는 Fast-Ethernet으로 연결된 서버와 클라이언트로 구성되어 있으며, 두 개의 클러스터가 동시에 또는 개별적으로 운용될 수 있도록 구성하였다. 계산 도구로서 Compaq Visual Fortran 컴파일러와 두 개의 MPI 라이브러리, MPICH.NT.1.2.2 와 MP-MPICHNT.1.2 를 설치하였다. 병렬 처리 성능 시험은 이차원 예조건화 Navier-Stokes 코드를 이용하여 수행하였으며, 리눅스 클러스터의 결과와 비교하여, 프로세서의 수, 문제의 크기 그리고 MPI 라이브러리에 따른 의존성을 살펴보았다. 이 결과는 사용자에게 친숙한 Windows 운영체제 기반의 클러스터가 병렬 계산 환경에서도 유용하며, 이전의 리눅스 클러스터에 버금가는 우수한 성능을 보여주었다.