• 제목/요약/키워드: graph parallel algorithm

검색결과 74건 처리시간 0.021초

그래프 분할 및 다중 프론탈 기법에 의거한 3차원 전자기장의 병렬 해석 (Parallel Computation on the Three-dimensional Electromagnetic Field by the Graph Partitioning and Multi-frontal Method)

  • 강승훈;송동현;최재원;신상준
    • 한국항공우주학회지
    • /
    • 제50권12호
    • /
    • pp.889-898
    • /
    • 2022
  • 본 논문에서는 3차원 전자기장의 병렬 해석 기법을 제안하였다. 시간 조화 벡터 파동 방정식 및 유한요소 기법에 기반한 전자기장 산란 해석이 수행되었으며, 모서리 기반 요소 및 2차 흡수 경계 조건이 도입되었다. 개발한 알고리즘은 유한요소망을 분할한 뒤 각 프로세서에 할당함으로써 요소별 수치적분 및 행렬 조립 과정의 병렬화를 달성하였다. 이때 부영역 생성을 위해 그래프 분할 라이브러리인 METIS가 도입되었다. 대형 희박행렬 방정식의 계산은 다중 프론탈 기법 기반 병렬 연산 라이브러리인 MUMPS를 통해 수행되었다. 개발된 프로그램의 정확도는 Mie 이론해 및 ANSYS HFSS 결과와의 비교를 통해 검증되었다. 또한 사용된 프로세서 수에 따른 가속 지표를 측정하여 확장성을 확인하였다. 완전 전기 도체 구, 등·이방성 유전체 구 및 유도탄 예제 형상에 대한 전자기장 산란 해석이 수행되었다. 개발된 프로그램의 알고리즘은 추후 유한요소 분할 및 합성법에 활용될 예정이며, 더욱 확장된 병렬 연산 성능을 목표하고자 한다.

Coordinated Cognitive Tethering in Dense Wireless Areas

  • Tabrizi, Haleh;Farhadi, Golnaz;Cioffi, John Matthew;Aldabbagh, Ghadah
    • ETRI Journal
    • /
    • 제38권2호
    • /
    • pp.314-325
    • /
    • 2016
  • This paper examines the resource gain that can be obtained from the creation of clusters of nodes in densely populated areas. A single node within each such cluster is designated as a "hotspot"; all other nodes then communicate with a destination node, such as a base station, through such hotspots. We propose a semi-distributed algorithm, referred to as coordinated cognitive tethering (CCT), which clusters all nodes and coordinates hotspots to tether over locally available white spaces. CCT performs the following these steps: (a) groups nodes based on a modified k-means clustering algorithm; (b) assigns white-space spectrum to each cluster based on a distributed graph-coloring approach to maximize spectrum reuse, and (c) allocates physical-layer resources to individual users based on local channel information. Unlike small cells (for example, femtocells and WiFi), this approach does not require any additions to existing infrastructure. In addition to providing parallel service to more users than conventional direct communication in cellular networks, simulation results show that CCT can increase the average battery life of devices by 30%, on average.

하이퍼큐브에서의 익스팬드 네트워크 분석 (Analysis of Expander Network on the Hypercube)

  • 이종극
    • 한국멀티미디어학회논문지
    • /
    • 제3권6호
    • /
    • pp.674-684
    • /
    • 2000
  • 병렬처리 과정 중에서 고려되어야할 가장 중요한 점은 프로세서사이에 통신을 어떻게 효율적으로 처리하는가 하는 것이다. 그 중 하나의 접근방법이 익스팬드 그래프를 이용하여 최적의 지연시간을 달성하는 방법이다. 익스팬드 그래프를 기초로 하여 효율적인 네트워크 구성과 수행시간이 빠른 병렬 알고리즘을 개발하기 위한 시도가 이루어져왔다. 병렬알고리즘 수행에서의 중요한 결과인 O(logN)시간의 AKS정렬 알고리즘은 익스팬드를 기초로 한다. 익스팬드 그래프는 다시 집중기(concentrator)와 초집중기(superconcentrator)에 적용될 수 있으며 Margulis가 선형 익스팬드 그래프의 구성하는 방법을 구체적으로 제시한 후 몇 개의 익스팬드가 제시되었다. 그러나 익스팬드 그래프를 이용한 구체적인 구조는 제시하지 않았다. 본 논문에서 hypercube 구조에서의 익스팬드 네트워크 구조를 조사하고 그리고 각 단에서의 확장성을 분석하고 다단으로 확장한다. 본 논문은 hypercube에서의 익스팬드 네크워크의 이론적 분석을 제시한다.

  • PDF

Proposition and Evaluation of Parallelism-Independent Scheduling Algorithms for DAGs of Tasks with Non-Uniform Execution Time

  • Kirilka Nikolova;Atusi Maeda;Sowa, Masa-Hiro
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 ITC-CSCC -1
    • /
    • pp.289-293
    • /
    • 2000
  • We propose two new algorithms for parallelism-independent scheduling. The machine code generated from the compiler using these algorithms in its scheduling phase is parallelism-independent code, executable in minimum time regardless of the number of the processors in the parallel computer. Our new algorithms have the following phases: finding the minimum number of processors on which the program can be executed in minimal time, scheduling by an heuristic algorithm for this predefined number of processors, and serialization of the parallel schedule according to the earliest start time of the tasks. At run time tasks are taken from the serialized schedule and assigned to the processor which allows the earliest start time of the task. The order of the tasks decided at compile time is not changed at run time regardless of the number of the available processors which means there is no out-of-order issue and execution. The scheduling is done predominantly at compile time and dynamic scheduling is minimized and diminished to allocation of the tasks to the processors. We evaluate the proposed algorithms by comparing them in terms of schedule length to the CP/MISF algorithm. For performance evaluation we use both randomly generated DAGs (directed acyclic graphs) and DACs representing real applications. From practical point of view, the algorithms we propose can be successfully used for scheduling programs for in-order superscalar processors and shared memory multiprocessor systems. Superscalar processors with any number of functional units can execute the parallelism-independent code in minimum time without necessity for dynamic scheduling and out-of-order issue hardware. This means that the use of our algorithms will lead to reducing the complexity of the hardware of the processors and the run-time overhead related to the dynamic scheduling.

  • PDF

One-to-All Broadcasting in Petersen-Torus Networks for SLA and MLA Models

  • Seo, Jung-Hyun;Lee, Hyeong-Ok
    • ETRI Journal
    • /
    • 제31권3호
    • /
    • pp.327-329
    • /
    • 2009
  • In a network, broadcasting is the dissemination of a message from a source node holding a message to all the remaining nodes through a call. This letter proposes a one-to-all broadcasting algorithm in the Petersen-torus network PT(n, n) for the single-link-available and multiple-link-available models. A PT(n, n) is a regular network whose degree is 4 and number of nodes is $10n^2$, where the Petersen graph is set as a basic module, and the basic module is connected in the form of a torus. A broadcasting algorithm is developed using a divide-and-conquer technique, and the time complexity of the proposed algorithm approximates n+4, the diameter of PT(n, n), which is the lower bound of the time complexity of broadcasting.

  • PDF

$L_\infty(L_1)$디루니 삼각분할의 병렬처리 알고리즘 (A Parallel Algorithm for Constructing the Delaunay Triangulation in the$L_\infty(L_1)$ Metric)

  • 위영철
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권3호
    • /
    • pp.155-160
    • /
    • 2001
  • 본 논문은 영역별 근접 그래프 (geographic nearest neighbor graph)와 레인지 트리 (range tree)를 이용하여 평면 위의 n 개의 점에 대한 L$_{\infty}$ (L$_1$) 거리 (metric) 상의 디루니 삼각분할 (Delaunay triangulation)을 구축하는 방법을 소개한다. 이 방법은 L$_{\infty}$ (L$_1$) 거리 상에서 디루니 삼각분할에 있는 각 삼각형의 최소한 한 선분이 영역별 근접 그래프에 포함됨을 이용하여 레인지 트리 방법으로 디루니 삼각분할을 구축한다. 본 방법은 0(nlogn)의 순차계산 시간에 L$_{\infty}$ (L$_1$) 디루니 삼각분할을 구축하며, CREW-PRAM (Concurrent Read Exclusive Write Parallel Random Access Machine)에서 0(n)의 프로세서로 0(logn)의 병렬처리 시간에 L$_{\infty}$ (L$_1$) 디루니 삼각분할을 구축한다. 또한, 이 방법은 직선간의 교차점 계산 대신 거리비교를 하기 때문에 수치오차가 적고 구현이 용이하다.

  • PDF

분산 이기종 컴퓨팅 시스템에서 효율적인 리스트 스케줄링 알고리즘 (An Efficient List Scheduling Algorithm in Distributed Heterogeneous Computing System)

  • 윤완오;윤정희;이창호;김효기;최상방
    • 전자공학회논문지CI
    • /
    • 제46권3호
    • /
    • pp.86-95
    • /
    • 2009
  • 이기종 컴퓨팅 환경에서 방향성 비순환 그래프(directed acyclic graph DAG)의 효율적인 스케줄링은 시스템의 성능을 높게 만드는데 매우 중요한 역할을 한다. 이기종의 컴퓨팅 환경에서 DAG로 표현되는 프로그램의 최적 스케줄링 방법을 찾는 것은 잘 알려진 '정해진 시간 내에 해결하기 어려운 문제(NP-complete)' 이다. 본 논문은 분산 이기종 컴퓨팅 시스템에서 병렬로 실행 가능한 프로그램을 위한 새로운 리스트 스케줄링 알고리즘인 HRPS(Heterogeneous Rank-Path Scheduling)를 제안하였다. HRPS의 가장 궁극적인 목적은 프로그램의 실행시간을 최소화하는 것이다. 알고리즘의 성능을 위해 DAG 입력 그래프를 이용하여 기존에 제안되어진 CPOP, HCPT, FLB 알고리즘과 스케줄의 길이를 비교한 결과 성능 향상의 결과를 얻을 수 있었다.

분산 이기종 컴퓨팅 시스템을 위한 새로운 고성능 리스트 스케줄링 알고리즘 (A Novel High Performance List Scheduling Algorithm for Distributed Heterogeneous Computing Systems)

  • 윤완오;윤준철;윤정희;최상방
    • 전자공학회논문지CI
    • /
    • 제47권1호
    • /
    • pp.135-145
    • /
    • 2010
  • 분산 이기종 컴퓨팅 시스템(Distributed Heterogeneous Computing System, DHCS)에서 방향성 비순환 그래프(Directed Acyclic Graph, DAG)의 효율적인 스케줄링은 시스템의 높은 성능을 만드는데 매우 중요한 역할을 한다. 본 논문은 DHCS에서 고성능의 새로운 스케줄링 알고리즘인 LCFT(Levelized Critical First Task)을 제안한다. LCFT 알고리즘은 DHCS에서 스케줄링을 위해 효율적인 태스크 선택 방법을 이용하는 리스트 스케줄링 기반의 알고리즘이다. LCFT 알고리즘의 복잡도는 $O(\upsilon+e)(p+log\;\upsilon)$을 갖는다. LCFT의 성능 비교를 위해 다양한 DAG 그래프를 이용하여 기존의 알고리즘인 PETS, HPS, HCPT, GCA와 스케줄링의 길이와 속도를 실험하였으며 실험 결과 LCFT 알고리즘이 다른 알고리즘 보다 성능 향상이 있는 것을 확인할 수 있었다.

재귀원형군에서 병렬 경로 알고리즘의 설계 (The Design of Parallel Routing Algorithm on a Recursive Circulant Network)

  • 배용근;박병권;정일용
    • 한국정보처리학회논문지
    • /
    • 제4권11호
    • /
    • pp.2701-2710
    • /
    • 1997
  • 재귀원형군은 마이크로 프로세스의 모델로서 활발하게 연구되고 있으며 특히 슈퍼컴퓨팅 분야에서 많은 관심을 불러 일으키고 있다. 본 논문에서는 재귀원형군에서 메시지의 경로 설정을 연구하는데 이는 네트워크의 성능 평가에 중요한 기준이 된다. 재귀원형군에서 출발 노드에서 목적 노드까지 m개의 패킷을 m개의 경로를 따라서 동시에 전송하고자 한다. 이 때 i번째의 패킷은 i번째의 경로를 따라서 전송된다. $(o{\leq}i{\leq}m-1)$. 모든 패킷들이 목적 노드에 신속하고 안전하게 도달하기 위해서 i번째의 경로는 disjoint해야 한다. 이들 경로들을 설계하기 위해서 Hamiltonian Circuit Latin Square(HCLS)를 재귀원형군에 적용시켜서 $O(n^2)$ 병렬 경로 알고리즘을 제안한다.

  • PDF

맵리듀스 기반 상향식 최대 밀도 부분그래프 탐색 알고리즘 (A Bottom-up Algorithm to Find the Densest Subgraphs Based on MapReduce)

  • 이웅희;김영훈
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.78-83
    • /
    • 2017
  • 최대 밀도 부분 그래프는 소셜 네트워크에서 사용자들이 속한 특정 커뮤니티나 사용자들의 공통 관심사를 나타내기에, 최대 밀도 부분 그래프를 찾는 연구가 다수 있었다. 그러나 기존의 연구들은 단일한 최고 밀도 부분 그래프를 찾는다는 문제점이 있었다. 이 연구에서는 주어진 노드에서 시작하여, 인접하는 노드 중에 연결수(degree)가 가장 높은 노드를 추가하는 방식을 사용한 최고 밀도 부분 그래프를 찾는 상향식 휴리스틱 알고리즘을 제안한다. 이에 따라, 병렬 처리에 용이하게 하였고, 이를 맵리듀스 프레임 워크 상에서 병렬 알고리즘으로 구현하였다. 다양한 그래프 데이터로 실험결과 이전 연구와 비교하여 조기에 최고 밀도 부분 그래프를 찾아냄을 보였다. 또한 다양한 다수의 노드가 주어졌을 때에도 효과적으로 동작함을 보였다.