• 제목/요약/키워드: parallel computers

검색결과 141건 처리시간 0.024초

트리구조의 계산을 위한 효율적인 동적 부하분산 전략 (An Efficient Dynamic Load balancing Strategy for Tree-structured Computations)

  • 황인재;홍동권
    • 정보처리학회논문지A
    • /
    • 제8A권4호
    • /
    • pp.455-460
    • /
    • 2001
  • 어떤 응용프로그램에서는 계산구조가 프로그램의 수행도중 동적으로 변한다. 이런 경우 정적으로 태스크를 분할하고 할당하는 것은 병렬컴퓨터에서 높은 성능을 얻는데 충분하지 못하다. 이 논문에서는 동적으로 변하는 트리구조를 가진 계산을 프로세서들에 효율적으로 분배하는 부하분산 알고리즘을 소개한다. 이 알고리즘의 메쉬구조상에서의 구현기법이 소개되고 복잡도가 분석된다. 실험을 통하여 이 알고리즘이 좋은 성능을 나타내는 것을 보인다.

  • PDF

MPI를 이용한 판재성형해석 프로그램의 병렬화 (Parallelization of sheet forming analysis program using MPI)

  • 김의중;서영성
    • 대한기계학회논문집A
    • /
    • 제22권1호
    • /
    • pp.132-141
    • /
    • 1998
  • A parallel version of sheet forming analysis program was developed. This version is compatible with any parallel computers which support MPI that is one of the most recent and popular message passing libraries. For this purpose, SERI-SFA, a vector version which runs on Cray Y-MP C90, a sequential vector computer, was used as a source code. For the sake of the effectiveness of the work, the parallelization was focused on the selected part after checking the rank of CPU consumed from the exemplary calculation on Cray Y-MP C90. The subroutines associated with contact algorithm was selected as targe parts. For this work, MPI was used as a message passing library. For the performance verification, an oil pan and an S-rail forming simulation were carried out. The performance check was carried out by the kernel and total CPU time along with theoretical performance using Amdahl's Law. The results showed some performance improvement within the limit of the selective paralellization.

웹 환경에서 유연성 있는 작업 할당을 위한 가상 병렬 처리 시스템 개발 (Development of Virtual Parallel Processing System for Flexible Task Allocation on the Web)

  • 정권호;송은하;정영식
    • 한국멀티미디어학회논문지
    • /
    • 제3권3호
    • /
    • pp.320-332
    • /
    • 2000
  • 웹은 네트워크로 연결된 모든 컴퓨터를 하나로 묶는 거대한 가상 시스템을 구성한다. 인터넷에 존재하는 수많은 유휴 상태 시스템을 이용하여 병렬 처리함으로써 비용 대 성능비가 매우 높으며 강력한 컴퓨팅 파워를 요구하는 거대한 문제를 해결할 수 있다. 하지만, 로컬 네트워크가 아닌 인터 넷 전체를 대상으로 하는 글로벌 환경에서 병렬 수행하는데 호스트들간의 이질성, 접근의 용이성, 작업에 대한 신뢰성을 고려해야 한다. 본 논문은 가상 병렬 처리 시스템인 WebImg를 설계 및 구현하여 웹 컴퓨팅 이 가능하며 동일한 작업을 여러 호스트에게 분배하기 위한 유연성 있는 작업 할당 전략을 제시하고 그 성능을 평가한다. 작업에 참여한 이 기종 호스트들이 가변적인 환경에서 작업 수행 도중 시스템의 성능변화에 대처하여 재할당 연산을 이용한 유연성 있는 작업 할당 기법을 제시한다. 더욱이 제안한 작업 할당 전략은 참여 호스트의 상태를 수시로 제어하여 결함내성을 제공한다.

  • PDF

이기종 클러스터를 위한 수정된 GSS 부하 분할 알고리즘 (Adapted GSS Load Sharing Algorithm for Heterogeneous Cluster)

  • 구본근
    • 정보처리학회논문지A
    • /
    • 제10A권4호
    • /
    • pp.331-338
    • /
    • 2003
  • 클러스터는 컴퓨터 네트워크로 연결되어 있는 컴퓨터들로 구성된 비용대비 효과적인 병렬 처리 환경이다. 클러스터의 특징으로는 노드의 이기종성, 부하의 다양성, 네트워크 부하의 다양성 등이다. 이러한 특징들은 병렬 프로그램의 수행 성능에 영향을 주기 때문에 클러스터를 위한 부하 분할은 병렬 프로그램의 성능에 많은 영향을 준다. 본 논문에서는 부하 분할 알고리즘인 GSS를 수정한 αGSS 알고리즘을 제안한다. 본 논문에서 제안하는 αGSS 알고리즘에서는 각 노드가 처리할 태스크의 크기를 결정할 때 각 노드의 BogoMIPS를 이용한다. 실험 결과에 의하면 제안된 αGSS 알고리즘이 이기종으로 구성된 클러스터에서 효과적으로 부하를 분할하며, 따라서 병렬 프로그램의 수행 시간을 감소시킬 수 있다.

PARALLEL CFD SIMULATIONS OF PROJECTILE FLOW FIELDS WITH MICROJETS

  • Sahu Jubaraj;Heavey Karen R.
    • 한국전산유체공학회:학술대회논문집
    • /
    • 한국전산유체공학회 2006년도 PARALLEL CFD 2006
    • /
    • pp.94-99
    • /
    • 2006
  • As part of a Department of Defense Grand Challenge Project, advanced high performance computing (HPC) time-accurate computational fluid dynamics (CFD) techniques have been developed and applied to a new area of aerodynamic research on microjets for control of small and medium caliber projectiles. This paper describes a computational study undertaken to determine the aerodynamic effect of flow control in the afterbody regions of spin-stabilyzed projectiles at subsonic and low transonic speeds using an advanced scalable unstructured flow solver in various parallel computers such as the IBM SP4 and Linux Cluster. High efficiency is achieved for both steady and time-accurate unsteady flow field simulations using advanced scalable Navier-Stokes computational techniques. Results relating to the code's portability and its performance on the Linux clusters are also addressed. Numerical simulations with the unsteady microjets show the jets to substantially alter the flow field both near the jet and the base region of the projectile that in turn affects the forces and moments even at zero degree angle of attack. The results have shown the potential of HPC CFD simulations on parallel machines to provide to provide insight into the jet interaction flow fields leading to improve designs.

  • PDF

이기종 클러스터 시스템에서 Cilk와 MPI 특성 비교 (Comparing Cilk and MPI on a heterogeneous cluster system)

  • 이규호;김준성
    • 전자공학회논문지CI
    • /
    • 제44권4호통권316호
    • /
    • pp.21-27
    • /
    • 2007
  • 최근 수년간의 급속한 기술의 발전과 대량생산 체제의 영향으로 개인용 컴퓨터와 간단한 네트워크 장비를 이용한 클러스터 시스템 구현이 용이해졌으나 개인용 컴퓨터의 교체 주기가 짧아짐에 따라 시스템 구성을 자유롭게 할 수 있는 클러스터 시스템의 이기종화를 초래하였다. 이기종 클러스터 시스템을 이용하여 구축된 병렬처리 시스템의 경우 그 성능을 효율적으로 사용하기 위해서는 각 노드의 성능을 고려한 작업 관리가 필요하다. 본 연구에서는 이기종 클러스터 시스템에서 MPI와 Cilk 병렬처리 시스템의 특성을 성능측면에서의 speedup과 활용도측면에서의 프로그램 코드의 복잡도를 정량적으로 살펴보았다. 실험에 따르면 작은 데이터를 이용하는 경우 Cilk가, 큰 데이터를 이용하거나 정규화된 데이터 교환 형태를 갖는 경우 MPI가 더 좋은 성능을 보였으며 코드 복잡도의 경우 Cilk가 간결한 프로그래밍 스타일을 제공함을 보였다.

이기종 클러스터를 위한 수정된 GSS 알고리즘 (Modified GSS Algorithm for Heterogeneous Cluster)

  • 구본근
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.405-408
    • /
    • 2002
  • 클러스터는 컴퓨터 네트워크로 연결되어 있는 컴퓨터들로 구성된 비용대비 효과적인 병렬 처리 환경이다. 클러스터의 특징으로는 노드의 이기종성, 로드의 다양성, 네트워크 로프의 다양성 등이다. 이러한 특징들은 병렬 프로그램의 수행 성능에 영향을 주기 때문에 클러스터를 위한 부하 분할은 병렬 프로그램의 성능에 많은 영향을 준다. 본 논문에서는 부하 분할 알고리즘인 GSS를 수정한 aGSS 알고리즘을 제안한다. 본 논문에서 제안하는 aGSS 알고리즘에서는 각 노드가 처리할 태스크의 크기를 결정할 때 각 노드의 BogoMIPS를 이용한다. 실험 결과에 의하면 제안된 aGSS 알고리즘이 이기종으로 구성된 클러스터에서 효과적으로 부하를 분할하며, 따라서 병렬 프로그램의 수행 시간을 감소시킬 수 있다.

  • PDF

병력구조 전산기를 이용한 최단 경로 계산 (Shortest Path Calculation Using Parallel Processor System)

  • 서창진;이장규
    • 대한전기학회논문지
    • /
    • 제34권6호
    • /
    • pp.230-237
    • /
    • 1985
  • Shortest path calculations for a large-scale network have to be performed using a decomposition techniqre, since the calculations require large memory size which increases by the square of the number of vertices in the network. Also, the calculation time increases by the cube of the number of vertices in the network. In the decomposition technique,the network is broken into a number of smaller size subnetworks for each of which shortest paths are computed. A union of the solutions provides the solution of the original network. In all of the decomposition algirithms developed up to now, boundary vertices which divide all the subnetworks have to be included in computing shortest paths for each subnetwork. In this paper, an improved algorithm is developed to reduce the number of boundary vertices to be engaged. In the algorithm, only those boundary vertices that are directly connected to the subnetwork are engaged. The algorithm is suitable for an application to real time computation using a parallel processor system which consists of a number of micro-computers or prcessors. The algorithm has been applied to a 39- vertex network and a 232-vertex network. The results show that it is efficient and has better performance than any other algorithms. A parallel processor system has been built employing an MZ-80 micro-computer and two Z-80 microprocessor kits. The former is used as a master processor and the latter as slave processors. The algorithm is embedded into the system and proven effective for real-time shortest path computations.

  • PDF

Numerical procedures for extreme impulsive loading on high strength concrete structures

  • Danielson, Kent T.;Adley, Mark D.;O'Daniel, James L.
    • Computers and Concrete
    • /
    • 제7권2호
    • /
    • pp.159-167
    • /
    • 2010
  • This paper demonstrates numerical techniques for complex large-scale modeling with microplane constitutive theories for reinforced high strength concrete, which for these applications, is defined to be around the 7000 psi (48 MPa) strength as frequently found in protective structural design. Applications involve highly impulsive loads, such as an explosive detonation or impact-penetration event. These capabilities were implemented into the authors' finite element code, ParaAble and the PRONTO 3D code from Sandia National Laboratories. All materials are explicitly modeled with eight-noded hexahedral elements. The concrete is modeled with a microplane constitutive theory, the reinforcing steel is modeled with the Johnson-Cook model, and the high explosive material is modeled with a JWL equation of state and a programmed burn model. Damage evolution, which can be used for erosion of elements and/or for post-analysis examination of damage, is extracted from the microplane predictions and computed by a modified Holmquist-Johnson-Cook approach that relates damage to levels of inelastic strain increment and pressure. Computation is performed with MPI on parallel processors. Several practical analyses demonstrate that large-scale analyses of this type can be reasonably run on large parallel computing systems.

고속 인터넷 통신망을 위한 스위치 설계에 관한 연구 (A Study on the Design of Switch for High Speed Internet Communication Network)

  • 조삼호
    • 인터넷정보학회논문지
    • /
    • 제3권3호
    • /
    • pp.87-93
    • /
    • 2002
  • 복잡한 통신망과 병렬컴퓨터에서는 효율적인 상호 연결을 위해 스위치가 중요한 영향을 미친다. 이 스위치는 라우팅 정보에 따라서 입력포트와 출력포트 사이에 연결을 해주는 역할을 하게 된다. 따라서 스위치에 성능을 향상시키는 것은 중요한 일이다. 본 논문에서 제안한 스위치는 컴퓨터 시뮬레이션 결과 입력버퍼형 보다 최대처리율이 11%이상 향상되었고, 다른 반얀형 스위치들에 비하여 성능과 하드웨어 양을 비교하여 볼 때 좋은 결과를 얻었다. 따라서 이 스위치는 VLSI 칩으로 구현될 경우 초고속 ATM-LAN 과 병렬컴퓨터를 개발하는데 유용하게 활용될 수 있을 것이다. 제안된 반얀형 스위치는 MAX$+^+$PLUSII, VHDL을 이용하여 설계 및 검증을 하고 시뮬레이션을 하였다

  • PDF