• 제목/요약/키워드: parallel communication

검색결과 1,114건 처리시간 0.032초

GPU의 공유메모리를 활용한 확장편집거리 병렬계산 (Parallel Computation for Extended Edit Distances Using the Shared Memory on GPU)

  • 김영호;나중채;심정섭
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권7호
    • /
    • pp.213-218
    • /
    • 2015
  • 알파벳 ${\Sigma}$로 구성된 길이가 각각 m, n인 두 문자열 X, Y가 주어졌을 때, X, Y의 확장편집거리는 동적프로그래밍을 이용하여 O(mn) 시간과 공간을 계산할 수 있다. 최근 m개의 쓰레드를 이용하여 O(m+n) 시간과 O(mn) 공간을 사용하여 X, Y의 확장편집거리를 계산하는 병렬알고리즘이 제시되었다. 본 논문에서는 GPU의 공유메모리를 활용하여 수행시간을 개선한 병렬알고리즘을 제시한다. 실험 결과, 개선된 병렬알고리즘이 기존의 병렬알고리즘보다 약 19~25배 이상 빠른 수행시간을 보였다.

병렬 유전알고리즘과 병렬 타부탐색법을 이용한 발전기 기동정지계획 (Unit Commitment Using Parallel Genetic Algorithms and Parallel Tabu Search)

  • 조덕환;강현태;권정욱;김형수;황기현;박준호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 하계학술대회 논문집 A
    • /
    • pp.327-329
    • /
    • 2001
  • This paper presents the application of Parallel genetic algorithm and parallel tabu search to search an optimal solution of a unit commitment problem. The proposed method previously searches the solution globally using the parallel genetic algorithm, and then searches the solution locally using tabu search which has the good local search characteristic to reduce the computation time. This method combines the benefit of both method, and thus improves the performance. To show the usefulness of the proposed method, we simulated for 10 units system. Numerical results show the improvements of cost and computation time compared to previous obtained results.

  • PDF

간헐적 동기화를 통한 예측기반 병렬 로직 시뮬레이션에서의 체크포인트/재실행 오버헤드 최소화 (Checkpoint/Resimulation Overhead Minimization with Sporadic Synchronization in Prediction-Based Parallel Logic Simulation)

  • 곽두환;양세양
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권5호
    • /
    • pp.147-152
    • /
    • 2015
  • 일반적으로 병렬 이벤트구동 시뮬레이션의 대표적 동기화 방법으로는 비관적 동기화 방식과 낙관적 동기화 방식이 있는데, 본 논문에서는 예측기반 병렬 이벤트구동 로직 시뮬레이션에서 이 두 가지 동기화 방식들을 혼용한 간헐적 동기화를 통한 시뮬레이션 성능 향상 기법을 제시한다. 제안되는 간헐적 동기화 방식은 예측기반 병렬 이벤트구동 로직 시뮬레이션에서 자주 일어나는 틀린 예측과 연관된 체크포인트 오버헤드 및 재실행 오버헤드를 최소화할 수 있어 시뮬레이션 성능 향상에 매우 효과적인데, 이를 다양한 실제 디자인들에 적용한 실험을 통하여 확인할 수 있었다.

A Study on Distributed System Construction and Numerical Calculation Using Raspberry Pi

  • Ko, Young-ho;Heo, Gyu-Seong;Lee, Sang-Hyun
    • International journal of advanced smart convergence
    • /
    • 제8권4호
    • /
    • pp.194-199
    • /
    • 2019
  • As the performance of the system increases, more parallelized data is being processed than single processing of data. Today's cpu structure has been developed to leverage multicore, and hence data processing methods are being developed to enable parallel processing. In recent years desktop cpu has increased multicore, data is growing exponentially, and there is also a growing need for data processing as artificial intelligence develops. This neural network of artificial intelligence consists of a matrix, making it advantageous for parallel processing. This paper aims to speed up the processing of the system by using raspberrypi to implement the cluster building and parallel processing system against the backdrop of the foregoing discussion. Raspberrypi is a credit card-sized single computer made by the raspberrypi Foundation in England, developed for education in schools and developing countries. It is cheap and easy to get the information you need because many people use it. Distributed processing systems should be supported by programs that connected multiple computers in parallel and operate on a built-in system. RaspberryPi is connected to switchhub, each connected raspberrypi communicates using the internal network, and internally implements parallel processing using the Message Passing Interface (MPI). Parallel processing programs can be programmed in python and can also use C or Fortran. The system was tested for parallel processing as a result of multiplying the two-dimensional arrangement of 10000 size by 0.1. Tests have shown a reduction in computational time and that parallelism can be reduced to the maximum number of cores in the system. The systems in this paper are manufactured on a Linux-based single computer and are thought to require testing on systems in different environments.

통신부담을 감소시킨 영상처리를 위한 병렬처리 방식 ASIC구조 설계 (Design of an Image Processing ASIC Architecture using Parallel Approach with Zero or Little)

  • 안병덕;정지원;선우명훈
    • 한국통신학회논문지
    • /
    • 제19권10호
    • /
    • pp.2043-2052
    • /
    • 1994
  • 본 논문에서는 근접한 Processing Element(PE)들간의 통신 부담을 경감시켜 영상신호를 실시간 처리할 수 있는 새로운 병렬처리 방식 ASIC 구조를 설계한다. 하나의 Sliding Memory Plane (SliM) Image Processor chip을 병렬처리 방식을 사용 $3\times3$ PE를 격자 형태로 연결한다. 제안하는 Image Processor를 구현할 수 있다. Sliding 개념은 별도의 보조 프로세서나 DMA를 사용치 않고 또한 PE들을 interupt 걸지 않고 모든 화소가 이웃 PE로 이동됨을 의미한다. 따라서 근접 통신과 계산이 동시에 일어나 기존의 격자 연결 병렬 컴퓨터의 결정적 단점인 근접 통신 부담을 경감시킬 수 있다. 또한 하나의 PE에 두 개의 입출력용 레지스터 plane을 사용, buffer를 제공하여 입출력 부담을 감소시킨다. SliM Image Processor에서는 단지 4개의 통신 link만으로 8가지 방향의 통신경로를 제공하는 by-passing path에 의해 통신 부담없이 대각선 통신을 수행할 수 있다. 제안하는 유일한 특성들로 인해 영상 신호 처리시 성능을 향상시킬 수 있다. 영상신호 처리를 위한 알고리즘들을 효율적으로 수행키 위한 PE, Image Processor 구조 및 명령어를 설계한다.

  • PDF

CAN통신을 이용한 모듈전원의 병렬운전에 관한 연구 (A Study of Parallel Operation of Module Power using CAN Communication)

  • 박성미;이상혁;박성준;이배호
    • 한국산학기술학회논문지
    • /
    • 제12권8호
    • /
    • pp.3603-3609
    • /
    • 2011
  • 본 논문에서는 CAN(Controller Area Network) 통신을 이용한 균등한 전류 분배를 위한 새로운 부하분담(Load-sharing) 알고리즘(Algorithm)을 제안한다. 기존 아날로그 방식과는 달리 디지털 통신을 이용한 강인한 부하분담특성을 가지며, 모듈마다 독립된 제어기(전압제어기, 전류제어기)가 구성되어 있으며, 마스터(Master)의 지령치 모듈의 지령치에 따라 슬레이브(slave)모듈이 부하분담을 수행한다. 또한 각 모듈 상태를 파악하기 위해 별도의 제어선을 사용하여 모듈의 고장 상태 및 고장난 모듈의 위치를 정확히 파악함으로써, 효율적이고 고속의 부하분담을 구현하였다. 제작된 병렬 시스템은 각 모듈마다 독립된 제어기가 구성되어 있으며, 본 논문에서는 PSIM을 통한 시뮬레이션과 시작품 제작을 통해 제안된 알고리즘의 타당성을 검증하였다.

5 GHz 대역 무선통신용 SHP 혼합기 설계 및 제작 (Design and Fabrication of the SHP Mixer for the 5 GHz Band Wireless Communication System)

  • 김갑기;안영섭
    • 한국항해항만학회지
    • /
    • 제28권10호
    • /
    • pp.875-879
    • /
    • 2004
  • 본 논문은 APDP(Anti-Parallel Diode Pair)를 이용한 5 GHz 대역 무선통신용 서브 하모닉 혼합기를 설계하였다. 기존의 혼합기는 LO와 RF를 혼합하여 투 주파수의 차로서 IF 신호를 얻는다. 그래서 주파수가 높아질수록, 안정되고, 높은 출력을 갖고, 우수한 위상잡음 특성을 갖는 LO 발진기가 필요하다. 그러나 APDP를 이용한 서브 하모닉 혼합기는 LO 신호의 제 2 고조파를 이용하여 혼합 작용을 한다. 따라서 기존의 혼합기에서 필요한 LO 주파수가 1/2로 줄어드는 장점이 있다. 제작된 서브 하모닉 혼합기의 변환손실은 LO 신호전력이 3dBm일 때, 12.83 dB이다. LO/IF, 2LO/IF, RF/IF, LO/RF의 분리도 특성은 39.17 dB, 58 dB, 34 dB, 67.9 dB이다. 그리고 입력 IP3는 8 dBm이다.

네트워크 기반 클러스터 시스템을 위한 적응형 동적 부하균등 방법 (Adaptive Dynamic Load Balancing Strategies for Network-based Cluster Systems)

  • 정훈진;정진하;최상방
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권11호
    • /
    • pp.549-560
    • /
    • 2001
  • 클러스터 시스템을 계산능력과 메모리 크기에 있어서 바람직한 확장성을 제공한다. 또한 고속의 컴퓨터 네트워크 기술의 발달로 인해 클러스터 시스템은 값비싼 MPPs (Massively Parallel Processors)와 비교하여 경쟁력을 얻고 있다. 부적당한 작업 스케줄링은 시스템의 기능을 충분히 이용할수 없고, 병렬처리 프로그램에서 프로그램 실행 전에 각 태스크의 부하를 예측하기 어려우며, 태스크들은 다양한 형태로 서로 의존적이다. 동적 부하균등 알고리즘에서는 실행시간에 각 프로세서의 부하를 평가한 후, 각 태스크를 적절한 크기로 분할하고 그것들을 각 프로세서의 수행능력에 비례하여 클러스터 시스템에 할당한다. 그러나, 프로세싱 노드간의 통신비용이 높으면, 모든 노드들이 부하분산에 참여하는 것은 효율적이지 못하다. 본 논문에서는 부하분산에 참여하는 프로세서를 통신비용과 평균 부하로부터의 편차를 고려하여 제한하였다. 기존의 부하균등 방식과 제안된 동적 알고리즘을 비교하기 위하여, 통신비용, 노드 수, 그리고 부하의 범위와 같은 파라메터를 사용하여 다양한 모델의 클러스터 시스템에 관한 시뮬레이션을 수행하였다.

  • PDF

Control and Design of a Arc Power Supply for KSTAR's the Neutral Beam Injection

  • Ryu, Dong-Kyun;Lee, Hee-Jun;Lee, Jung-Hyo;Won, Chung-Yuen
    • Journal of Electrical Engineering and Technology
    • /
    • 제10권1호
    • /
    • pp.216-226
    • /
    • 2015
  • The neutral beam injection generate ultra-high temperature energy in the tokamak of nuclear fusion. The neutral beam injection make up arc power supply, filament power supply and acceleration & deceleration power supply. The arc power supply has characteristics of low voltage and high current. Arc power supply generate arc through constant output of voltage and current. So this paper proposed suitable buck converter for low voltage and high current. The proposed buck converter used parallel switch because it can be increased capacity and decrease conduction loss. When an arc generated, the neutral beam injection chamber occur high voltage. And it will break output capacitor of buck converter. Therefore the output capacitor was removed in the proposed converter. Thus the proposed converter should be designed for the characteristics of low voltage and high current. Also, the arc power supply should be guaranteed for system stability. The proposed parallel buck converter enables the system stability of the divided low output voltage and high current. The proposed converter with constant output be the most important design of the output inductor. In this paper, designed arc power supply verified operation of system and stability through simulation and prototype. After it is applied to the 288[kW] arc power supply for neutral beam injection.