• Title/Summary/Keyword: 병렬 계산효율

Search Result 273, Processing Time 0.037 seconds

Improved Triangle Keypoints matching system for efficient generation (효율적인 계산을 위한 개선된 삼각형 닮음 조건 기반 영상 간 유사 공간 계산 알고리즘)

  • Lee, Inhong;Kang, Jeonho;Nam, Kwijung;Kim, KyuHeon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.236-238
    • /
    • 2020
  • 기존에 개발한 삼각형 닮음 조건 기반 영상 간 유사 공간 계산 알고리즘은 근접 거리에 과도하게 많은 특징점이 추출되면 정확도가 낮아지는 점, 계산 과정에서의 Threshold를 주관적으로 설정해 주어야 해 정확한 Threshold를 찾기 위하여 전체 알고리즘을 여러번 반복하여 실행시켜야 하는 점에서 비효율적인 측면이 있다. 이를 해결하기 위하여 본 논문에서는 기존의 삼각형 닮음 조건 기반 영상 간 유사 공간 계산 알고리즘에 근접 거리 내의 특징점을 제거하는 알고리즘과 서로 다른 Threshold를 가진 유사 공간 계산 알고리즘들을 병렬적으로 계산해 한 번의 알고리즘 실행만으로 자동적으로 적절한 Threshold를 찾을 수 있도록 하는 모듈을 추가하여 기존의 알고리즘과 비교하여 더 효율적으로 영상 간 유사 공간을 계산해낼 수 있도록 개선된 삼각형 닮음 조건 기반 영상 간 유사 공간 계산 알고리즘을 제안한다.

  • PDF

Considering Barrier Overhead in Parallelizing AES-CCM (동기화 오버헤드를 고려한 AES-CCM의 병렬 처리)

  • Chung, Yong-Wha;Kim, Sang-Choon
    • Journal of the Korea Institute of Information Security & Cryptology
    • /
    • v.21 no.3
    • /
    • pp.3-9
    • /
    • 2011
  • In this paper, we propose workload partitioning methods in parallelizing AES-CCM which is proposed as the wireless encryption and message integrity standard IEEE 802.11i. In parallelizing AES-CCM having data dependency, synchronizations among processors are required, and multi-core processors have a very large range of synchronization performance. We propose and compare the performance of various workload partitioning methods by considering both the computational characteristics of AES-CCM and the synchronization overhead.

An Iterative Algorithm for the Bottom Up Computation of the Data Cube using MapReduce (맵리듀스를 이용한 데이터 큐브의 상향식 계산을 위한 반복적 알고리즘)

  • Lee, Suan;Jo, Sunhwa;Kim, Jinho
    • Journal of Information Technology and Architecture
    • /
    • v.9 no.4
    • /
    • pp.455-464
    • /
    • 2012
  • Due to the recent data explosion, methods which can meet the requirement of large data analysis has been studying. This paper proposes MRIterativeBUC algorithm which enables efficient computation of large data cube by distributed parallel processing with MapReduce framework. MRIterativeBUC algorithm is developed for efficient iterative operation of the BUC method with MapReduce, and overcomes the limitations about the storage size and processing ability caused by large data cube computation. It employs the idea from the iceberg cube which computes only the interesting aspect of analysts and the distributed parallel process of cube computation by partitioning and sorting. Thus, it reduces data emission so that it can reduce network overload, processing amount on each node, and eventually the cube computation cost. The bottom-up cube computation and iterative algorithm using MapReduce, proposed in this paper, can be expanded in various way, and will make full use of many applications.

Development of a Parallel Cell-Based DSMC Method Using Unstructured Meshes (비정렬격자에서 병렬화된 격자중심 직접모사 기법 개발)

  • Kim, Hyeong-Sun;Kim, Min-Gyu;Gwon, O-Jun
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.30 no.2
    • /
    • pp.1-11
    • /
    • 2002
  • In the present study, a parallel DSCM technique based on a cell-based data structure is developed for the efficient simulation of rarefied gas flows especially od PC clusters. Dynamic load balancing is archieved by decomposing the computational domain into several sub-domains and accounting for the number of particles and the number cells of each domain. Mesh adaptation algorithm is also applied to improve the resolution of the solution and to reduce the grid dependency. It was demonstrated that accurate solutions can be obtained after several levels of mesh adapation starting from a coars initial grid. The method was applied to a two-dimensioanal supersonic leading-edge flow and the axi-symmetric Rothe nozzle flow to validate the efficiency of the present method. It was found that the present method is a very effective tool for the efficient simulation of rarefied gas flow on PC-based parallel machines.

Parallelization of Multifrontal Solution Method for Shared Memory Architecture (다중프론트 해법의 공유메모리 병렬화)

  • Kim, Min Ki;Kim, Jeong Ho;Park, Chan Yik;Kim, Seung Jo
    • Journal of the Korean Society for Aeronautical & Space Sciences
    • /
    • v.40 no.11
    • /
    • pp.972-978
    • /
    • 2012
  • This paper discusses the parallelization of multifrontal solution method, widely used for finite element structural analyses, for a shared memory architecture. Multifrontal method is easier than other linear solution methods because the solution procedure implies that unknowns can be eliminated simultaneously. Two innovative ideas are introduced to achieve optimal solver performance on a shared memory computer. Those are pairing two frontal matrices and splitting the frontal matrix in order to reduce the temporal memory space required by independent computing tasks. Performance comparisons between original algorithm and proposed one prove that proposed method is more computationally efficient on current multicore machines.

A Massively Parallel Algorithm for Fuzzy Vector Quantization (퍼지 벡터 양자화를 위한 대규모 병렬 알고리즘)

  • Huynh, Luong Van;Kim, Cheol-Hong;Kim, Jong-Myon
    • The KIPS Transactions:PartA
    • /
    • v.16A no.6
    • /
    • pp.411-418
    • /
    • 2009
  • Vector quantization algorithm based on fuzzy clustering has been widely used in the field of data compression since the use of fuzzy clustering analysis in the early stages of a vector quantization process can make this process less sensitive to its initialization. However, the process of fuzzy clustering is computationally very intensive because of its complex framework for the quantitative formulation of the uncertainty involved in the training vector space. To overcome the computational burden of the process, this paper introduces an array architecture for the implementation of fuzzy vector quantization (FVQ). The arrayarchitecture, which consists of 4,096 processing elements (PEs), provides a computationally efficient solution by employing an effective vector assignment strategy during the clustering process. Experimental results indicatethat the proposed parallel implementation providessignificantly greater performance and efficiency than appropriately scaled alternative array systems. In addition, the proposed parallel implementation provides 1000x greater performance and 100x higher energy efficiency than other implementations using today's ARMand TI DSP processors in the same 130nm technology. These results demonstrate that the proposed parallel implementation shows the potential for improved performance and energy efficiency.

Implementation and Performance Evaluation of Parallel Multi-way Spatial Join (병렬 다중 공간 조인 알고리즘의 구현 및 성능평가)

  • 류우석;김진덕;홍봉희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.123-125
    • /
    • 1998
  • 지리 정보 시스템이서 다중 공간 조인과 같은 많은 기하 계산을 필요로 하는 질의를 처리하기 위해서는 질의에 대한 병렬화 작업을 통해 실행 시간을 최소화 하는 것이 필수적이다. 다중 공간 조인은 정제에서 많은 시간을 소비하므로 여과와 정제를 분리하여 각각을 수행하는 것이 정제 시간을 단축하게 되고 따라서 좋은 성능을 나타낼 수 있다. 그러므로 다중 공간 조인을 병렬화 하기 위해서는 다중 공간 여과와 정제 각각에 대해 병렬 실행 계획을 세우는 것이 중요하다. 이 논문에서는 우선적으로 병렬 공간 여과를 수행하기 위한 두가지 알고리즘, 즉 blush tree을 사용한 다중 공간 여과와 pipelining을 사용한 다중 공간 여과의 병렬화를 비교한다. 그리고, 다중 공간 여과의 결과로서 생성되는 중간 결과 테이블에서 데이터의 중복에 따라 정제 성능의 저하가 발생되는데, 이를 효율적으로 제거하기 위한 두가지 그래프 생성 알고리즘을 제안하고 이를 비교한다. 그리고, 생성된 그래프에서 병렬 정제를 수행하기 위한 여러 가지 분할 알고리즘을 제안하고 이를 비교 평가한다. 이런 일련의 작업을 통해 우수한 성능의 병렬 다중 공간 조인 방법을 제안하고 성능 평가를 통해 최적의 병렬 수행 방법을 도출한다.

Multi-Scale Contact Analysis Between Net and Numerous Particles (그물망과 대량입자의 멀티 스케일 접촉해석)

  • Jun, Chul Woong;Sohn, Jeong Hyun
    • Transactions of the Korean Society of Mechanical Engineers A
    • /
    • v.38 no.1
    • /
    • pp.17-23
    • /
    • 2014
  • Graphics processing units (GPUs) are ideal for solving problems involving parallel data computations. In this study, the GPU is used for effectively carrying out a multi-body dynamic simulation with particle dynamics. The Hilber-Hushes-Taylor (HHT) implicit integration algorithm is used to solve the integral equations. For detecting collisions among particles, the spatial subdivision algorithm and discrete-element methods (DEM) are employed. The developed program is verified by comparing its results with those of ADAMS. The numerical efficiencies of the serial program using the CPU and the parallel program using the GPU are compared in terms of the number of particles, and it is observed that when the number of particles is greater, more computing time is saved by using the GPU. In the present example, when the number of particles is 1,300, the computational speed of the parallel analysis program is about 5 times faster than that of the serial analysis program.

An Analysis for the Distinguished Points in the Parallel Computing of ECDLP (ECDLP 병렬 계산에서 특정점 비율에 대한 분석)

  • Byung-Gwan Kim;Chang-Woo Lee;Ju-Sung Kang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.1409-1412
    • /
    • 2008
  • 특정점 개념을 적용한 ECDLP 병렬 계산 방법은 현재까지 가장 효율적인 것으로 알려져 있다. 이론상으로는 특정점에 대한 비율이 증가할수록 충돌쌍을 발견할 때까지의 계산량 및 수행시간은 점진적으로 감소한다. 하지만 우리의 실험적 결과는 특정점 비율이 일정 수준 이상 증가할 경우 오히려 계산량 및 수행시간도 증가함을 보여준다. 클러스터 환경 실험에서 얻은 이러한 결과를 바탕으로 본 논문에서는 통신부하를 고려한 실질적 수행시간을 이론적으로 분석함으로써 실험적 결과가 합리적임을 밝힌다. 더욱이 계산 환경에 맞는 특정점 비율을 축소 모델링을 통하여 결정할 수 있는 메커니즘을 제안한다.

PDSWeb: Performance Evaluation of Distributed Parallel Processing Scheme on the Intranet (PDSWeb: Intranet에서 분산 병렬 처리 스킴의 성능평가)

  • 송은하;정영식
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.378-383
    • /
    • 2001
  • Intranet 환경에 다수의 유휴 호스트를 이용하여 많은 계산량을 지닌 응용 문제를 분산시켜 병렬 수행함으로써 효율성의 향상이 기대된다. 하지만 유휴 호스트를 이용하는데 있어서 이질성과 가변성 및 자율성으로 인해 요청에 대한 신뢰성을 예측하기가 어렵다. 본 논문에서는 태스크 할당 및 호스트 관리에 있어서 부하 균등을 위한 동적 분산 병렬 스킴인 적응적 태스크 재할당 기법을 제시한다. 또한, 이미지 랜더링 생성과 프랙탈 이미지 처리와 같은 많은 연산량을 지닌 응용 문제를 PDSWeb 시스템에 적용하여 제안 알고리즘의 성능을 분석하고 평가한다.

  • PDF