• 제목/요약/키워드: Parallel Efficiency

검색결과 1,046건 처리시간 0.025초

Parallel Implementation Strategy for Content Based Video Copy Detection Using a Multi-core Processor

  • Liao, Kaiyang;Zhao, Fan;Zhang, Mingzhu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권10호
    • /
    • pp.3520-3537
    • /
    • 2014
  • Video copy detection methods have emerged in recent years for a variety of applications. However, the lack of efficiency in the usual retrieval systems restricts their use. In this paper, we propose a parallel implementation strategy for content based video copy detection (CBCD) by using a multi-core processor. This strategy can support video copy detection effectively, and the processing time tends to decrease linearly as the number of processors increases. Experiments have shown that our approach is successful in speeding up computation and as well as in keeping the performance.

Model-Based Tabu Search Algorithm for Free-Space Optical Communication with a Novel Parallel Wavefront Correction System

  • Li, Zhaokun;Zhao, Xiaohui;Cao, Jingtai;Liu, Wei
    • Journal of the Optical Society of Korea
    • /
    • 제19권1호
    • /
    • pp.45-54
    • /
    • 2015
  • In this study, a novel parallel wavefront correction system architecture is proposed, and a model-based tabu search (MBTS) algorithm is introduced for this new system to compensate wavefront aberration caused by atmospheric turbulence in a free-space optical (FSO) communication system. The algorithm flowchart is presented, and a simple hypothetical design for the parallel correction system with multiple adaptive optical (AO) subsystems is given. The simulated performance of MBTS for an AO-FSO system is analyzed. The results indicate that the proposed algorithm offers better performance in wavefront aberration compensation, coupling efficiency, and convergence speed than a stochastic parallel gradient descent (SPGD) algorithm.

PARALLEL IMPLEMENTATION OF HYBRID ITERATIVE METHODS FOR NONSYMMETRIC LINEAR SYSTEMS

  • Yun, Jae-Heon;Kim, Sang-Wook
    • Journal of applied mathematics & informatics
    • /
    • 제4권1호
    • /
    • pp.1-16
    • /
    • 1997
  • In this paper we study efficient parallel implementation for hybrid iterative methods BICGSTAB and BICGSTAB $(\ell)$ with ${Well}=2$ on the CRAY C90 and the efficiency of their parallel performance is evaluated. numerical experiments suggest that on the CRAY C90 a parallel inner product algorithm called PDOTB be used for the par-allelization of hybrid iterative methods containing sensitive values of inner products. Lastly it is shown that the number of iterations in which parallel hybrid iterative methods satisfy a certain convergence criterion depends on the number of processors to be used.

Model Predictive Control of Circulating Current Suppression in Parallel-Connected Inverter-fed Motor Drive Systems

  • Kang, Shin-Won;Soh, Jae-Hwan;Kim, Rae-Young
    • Journal of Electrical Engineering and Technology
    • /
    • 제13권3호
    • /
    • pp.1241-1250
    • /
    • 2018
  • Parallel three-phase voltage source inverters in a direct connection configuration are widely used to increase system power ratings. A zero-sequence circulating current can be generated according to the switching method; however, the zero-sequence circulating current not only distorts current, but also reduces the system reliability and efficiency. In this paper, a model predictive control scheme is proposed for parallel inverters to drive an interior permanent magnet synchronous motor with zero-sequence circulating current suppression. The voltage vector of the parallel inverters is derived to predict and control the torque and stator flux components. In addition, the zero-sequence circulating current is suppressed by designing the cost function without an additional current sensor and high-impedance inductor. Simulation and experimental results are presented to verify the proposed control scheme.

프로세서 farm 모델을 이용한 광추적 알고리듬 (A Ray-Tracing Algorithm Based On Processor Farm Model)

  • 이효종
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제2권1호
    • /
    • pp.24-30
    • /
    • 1996
  • 광추적표현(ray tracing rendering) 기법은 컴퓨터를 이용하여 현실감 있는 영상을 얻기 위한 음영처리 방법의 하나로 오랜 컴퓨터 처리시간을 필요로 한다. 병렬처리 기법을 적용함으로서 컴퓨터 처리시간을 효과적으로 줄일 수 있어, 본 논문에서는 광추적 기법을 위한 병렬 알고리듬을 구현하고 트랜스퓨터시스템 상에서 실험하였다. 또한 알고리듬의 확장성과 부하균형을 위하여 프로세서 farm 모델을 응용하였다. 전체의 영상을 균일한 크기로 분할하고 각각의 프로세서 farm에 분배하는 방식을 사용하였기 때문에 제안된 알고리듬에서는 병렬시스템의 확장성과 부하의 균형문제를 자연스럽게 해결하였다. 구현된 병렬 알고리듬은 가변의 일꾼을 가지는 트랜스퓨터에서 실행하였으며 효율은 9개의 프로세서를 사용하였을 때 65% 이상으로 나타났다. 가장 우수한 성능을 가지는 경우는 작업의 분할 크기가 256~1024개의 화소를 가질 때인 것으로 측정되었다. 이와 같은 높은 효율과 우수한 확장성 이외에도 트랜스퓨터시스템이 지니고 있는 가격 대 성능비의 우수성으로 인하여, 트랜스퓨터는 확장성 있는 병렬시스템으로 적합한 것을 알 수 있다.

  • PDF

Efficiency of Marine Hydropower Farms Consisting of MultipleVertical Axis Cross-Flow Turbines

  • Georgescu, Andrei-Mugur;Georgescu, Sanda-Carmen;Cosoiu, Costin Ioan;Alboiu, Nicolae
    • International Journal of Fluid Machinery and Systems
    • /
    • 제4권1호
    • /
    • pp.150-160
    • /
    • 2011
  • This study focuses on the Achard turbine, a vertical axis, cross-flow, marine current turbine module. Similar modules can be superposed to form towers. A marine or river hydropower farm consists of a cluster of barges, each gathering several parallel rows of towers, running in stabilized current. Two-dimensional numerical modelling is performed in a horizontal cross-section of all towers, using FLUENT and COMSOL Multiphysics. Numerical models validation with experimental results is performed through the velocity distribution, depicted by Acoustic Doppler Velocimetry, in the wake of the middle turbine within a farm model. As long as the numerical flow in the wake fits the experiments, the numerical results for the power coefficient (turbine efficiency) are trustworthy. The overall farm efficiency, with respect to the spatial arrangement of the towers, was depicted by 2D modelling of the unsteady flow inside the farm, using COMSOL Multiphysics. Rows of overlapping parallel towers ensure the increase of global efficiency of the farm.

웹서비스 기반의 분산 시뮬레이션 프로토타입 개발 (Development of Web Service-based Parallel and Distributed Simulation)

  • 조인호;주정민;박양선;조현보
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회/대한산업공학회 2005년도 춘계공동학술대회 발표논문
    • /
    • pp.1033-1039
    • /
    • 2005
  • Parallel and distributed simulation is concerned with the efficient execution of large-scale discrete event simulation models on multiprocessors and distributed platforms. After the development of WWW, many efforts in the parallel and distributed simulation have been made for modeling, particularly building simulation languages and creating model libraries that can be assembled and executed over WWW. However, web-based parallel and distributed simulation is restricted by heterogeneous computing environments. Recently, the advent of XML and web services technology has made these efforts enter upon a new phase. Especially, the web services as a distributed information technology have demonstrated powerful capabilities for scalable interoperation of heterogeneous systems. This paper aims to develop and evaluate the parallel and distributed simulation using the web services technology. In particular, a prototype multi-pass simulation framework is implemented using Java-based web services technology. It focuses on the efficiency of multi-pass simulation used for optimization through the distribution of simulation replication to several simulation service providers. The development of parallel and distributed simulation using web services will help solve efficiently large-scale problems and also guarantee interoperability among heterogeneous networked systems.

  • PDF

병렬 컴퓨터를 이용한 형상 압연공정 유한요소 해석의 분산병렬처리에 관한 연구 (Finite Element Analysis of Shape Rolling Process using Destributive Parallel Algorithms on Cray T3E)

  • 권기찬;윤성기
    • 대한기계학회논문집A
    • /
    • 제24권5호
    • /
    • pp.1215-1230
    • /
    • 2000
  • Parallel Approaches using Cray T3E which is NIPP (Massively Parallel Processors) machine are presented for the efficient computation of the finite element analysis of 3-D shape rolling processes. D omain decomposition method coupled with parallel linear equation solver is used. Domain decomposition is applied for obtaining element tangent stifffiess matrices and residual vectors. Direct and iterative parallel algorithms are used for solving the linear equations. Direct algorithm is_parallel version of direct banded matrix solver. For iterative algorithms, the well-known preconditioned conjugate gradient solver with Jacobi preconditioner is also employed. Moreover a new effective iterative scheme with block inverse matrix preconditioner, which is named by present authors, is presented and its results are compared with the one using Jacobi preconditioner. PVM and MPI are used for message passing and synchronization between processors. The performance and efficiency of each algorithm is discussed and comparisons are made among different algorithms.

임베디드 병렬 프로세서를 위한 픽셀 서브워드 병렬처리 명령어 구현 (Implementation of Pixel Subword Parallel Processing Instructions for Embedded Parallel Processors)

  • 정용범;김종면
    • 정보처리학회논문지A
    • /
    • 제18A권3호
    • /
    • pp.99-108
    • /
    • 2011
  • 프로세서 기술은 공정비용의 증가와 전력 소모 때문에 단순 동작 주파수를 높이는 방법이 아닌 다수의 프로세서를 집적하는 병렬 프로세싱 기술 발전이 이루어지고 있다. 본 논문에서는 멀티미디어에 내재한 무수한 데이터를 효과적으로 처리할 수 있는 SIMD(Single Instruction Multiple Data) 기반 병렬 프로세서를 소개하고, 또한 이러한 SIMD 기반 병렬 프로세서 아키텍처에서 이미지/비디오 픽셀을 효율적으로 처리 가능한 픽셀 서브워드 병렬처리 명령어를 제안한다. 제안하는 픽셀 서브워드 병렬처리 명령어는 48비트 데이터패스 아키텍처에서 4개의 12비트로 분할된 레지스터에 4개의 8비트 픽셀을 저장하고 동시에 처리함으로써 기존의 멀티미디어 전용 명령어에서 발생하는 오버플로우 및 이를 해결하기 위해 사용되는 패킹/언팽킹 수행의 상당한 오버헤드를 줄일 수 있다. 동일한 SIMD 기반 병렬 프로세서 아키텍처에서 모의 실험한 결과, 제안한 픽셀 서브워드 병렬처리 명령어는 baseline 프로그램보다 2.3배의 성능 향상을 보인 반면, 인텔사의 대표적인 멀티미디어 전용 명령어인 MMX 타입 명령어는 baseline 프로그램보다 단지 1.4배의 성능 향상을 보였다. 또한, 제안한 명령어는 baseline 프로그램보다 2.5배의 에너지 효율 향상을 보인 반면, MMX 타입 명령어는 baseline 프로그램보다 단지 1.8배의 에너지 효율 향상을 보였다.

히트펌프 직렬운전에 의한 성능 향상 가능성에 관한 연구 (Potential Performance Enhancement of Dual Heat Pump Systems through Series Operation)

  • 백영진;김민성;장기창;이영수;김현주
    • 대한기계학회논문집B
    • /
    • 제36권8호
    • /
    • pp.797-802
    • /
    • 2012
  • 본 연구에서는 두 대의 히트펌프를 이용하여 $60^{\circ}C$의 난방 공급을 하는 경우에 대하여, 병렬운전을 할 경우의 성능과 직렬운전을 할 경우의 성능을 서로 비교함으로써, 직렬운전에 의한 성능 향상 가능성을 연구하였다. 두 경우의 성능을 공정하게 비교하기 위하여, 히트펌프를 구성하는 열교환기의 전열면적을 고정하였으며, 부하측 및 열원측의 입구 유량 및 온도 조건을 고정하였다. 또한, 보다 현실적인 결과를 위하여 열교환기 내 열전달 및 압력강하 특성을 고려하였다. 시뮬레이션 결과, 직렬운전 시스템의 난방성능계수가 병렬운전 시스템의 난방성능계수에 비해 본 연구의 시뮬레이션 조건 하에서 약 5% 향상 될 수 있음을 관찰하였다.