• Title/Summary/Keyword: 고성능컴퓨팅

Search Result 163, Processing Time 0.027 seconds

Comparing Energy Efficiency of MPI and MapReduce on ARM based Cluster (ARM 클러스터에서 에너지 효율 향상을 위한 MPI와 MapReduce 모델 비교)

  • Maqbool, Jahanzeb;Rizki, Permata Nur;Oh, Sangyoon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2014.01a
    • /
    • pp.9-13
    • /
    • 2014
  • The performance of large scale software applications has been automatically increasing for last few decades under the influence of Moore's law - the number of transistors on a microprocessor roughly doubled every eighteen months. However, on-chip transistors limitations and heating issues led to the emergence of multicore processors. The energy efficient ARM based System-on-Chip (SoC) processors are being considered for future high performance computing systems. In this paper, we present a case study of two widely used parallel programming models i.e. MPI and MapReduce on distributed memory cluster of ARM SoC development boards. The case study application, Black-Scholes option pricing equation, was parallelized and evaluated in terms of power consumption and throughput. The results show that the Hadoop implementation has low instantaneous power consumption that of MPI, but MPI outperforms Hadoop implementation by a factor of 1.46 in terms of total power consumption to execution time ratio.

  • PDF

Real -Time Face Recognition System using PDA (PDA를 이용한 실시간 얼굴인식 시스템 구현)

  • Kwon Man-Jun;Yang Dong-Hwa;Go Hyoun-Jo;Chun Myung-Geun
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2005.04a
    • /
    • pp.251-254
    • /
    • 2005
  • 본 논문은 유비쿼터스 컴퓨팅 환경 기반에서의 온라인 얼굴인식 시스템 구현을 기술한다. 구현된 시스템은 CMOS 카메라를 장착한 PDA를 이용하여 얼굴영상을 획득하고 이 영상을 무선랜을 이용하여 인증 서버로 전송하여 서버로부터 인증된 결과를 받도록 하였다. 먼저 클라이언트 측인 PDA에서는 등록과 인증을 확인할 수 있도록 임베디드 비주얼 프로그램으로 사용자 인터페이스를 구축하였다. 다음으로 서버 영역에서는 얼굴인식에서 탁월한 성능을 보이는 PCA와 LDA 알고리즘을 사용하여 PDA로부터 전송 받은 얼굴 데이터를 학습하고 인식한 결과를 재전송하는 부분이 구현되었다. 시스템 구현에서 실시간성을 확보하기 위해 PDA에서는 영상을 압축률 효과가 좋은 JPG 형식의 데이터로 서버에 전송하였다. 본 논문에서 구현한 시스템은 학습과정에서 미리 구한 고유값을 이용하여 테스트 얼굴영상을 같은 공간에 투영시켜 서로간의 유사도를 비교하도록 하여 얼굴인식 속도 및 성능을 개선하였다.

  • PDF

Flow Analysis of Multi-stage Rocket using Heterogeneous Resources based on Grid Environment (그리드 환경에서 분산된 자원을 이용한 다단 로켓의 유동해석)

  • Ko Soon-Heum;Jung Myungwoo;Kim Chongam;Rho Oh-Hyun;Lee Sangsan
    • 한국전산유체공학회:학술대회논문집
    • /
    • 2002.10a
    • /
    • pp.78-93
    • /
    • 2002
  • 통신 기술의 비약적 발전에 힘입어 기존의 Parallel Computing만으로는 해석할 수 없었던 거대 규모의 문제를 원격지에 있는 고성능의 자원간 연동을 통해 해석하고자 하는 연구가 활발히 진행중이며, 이와 같은 개념을 Grid Computing이라 한다. 본 연구에서는 Grid 환경을 이용한 CFD 해석 방안에 초점을 맞추고 있으며, 이를 위하여 분산된 컴퓨팅 자원을 다양하게 조합하여 Grid 환경에서의 Load Balancing을 위한 병렬 효율에 대한 연구를 수행하였다. 그리고, 다양한 성능 테스트의 결과를 기반으로 Grid 환경에서 두 개의 보조 부스터를 가지는 병렬형 다단 로켓에 대한 유동 해석을 수행하였다.

  • PDF

General-purpose Clustering System Using Standard CORBA Load Balancing Service (CORBA 로드밸런싱 서비스를 사용한 범용 클러스터링 시스템)

  • 차현철;최정호;김정선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.451-453
    • /
    • 2003
  • 인터넷과 개인컴퓨터가 대중화되어 사용자층이 넓어지고, 컴퓨터 기술이 다양화됨에 따라 점차 고가용성 서버에 대한 관심이 높아지면서 낮은 비용에 높은 성능을 만족시켜줄 수 있는 클러스터링 시스템이 인기를 끌고 있다. 하지만 기존의 클러스터링 시스템은 높은 성능에 비해 특정 플랫폼에 종속적이거나 특정 어플리케이션을 위한 구성이기 때문에 하나의 클러스터링 시스템을 여러 가지 플랫폼에서 다양한 목적으로 사용하기에는 부적절하다. 특정 장치 및 프로토콜 혹은 플랫폼에 의존적인 시스템은 유지보수 및 확장성의 제약을 받게 되기 때문에 이질적 컴포넌트들을 유기적으로 결합할 수 있는 방법이 요구되며 이러한 시스템을 효과적으로 구현하기 위해서는 표준 기반의 COTS (commercial-off-the-shelf) 미들웨어의 적용이 반드시 필요하다. 본 논문에서는 미들웨어로서 분산객체컴퓨팅의 표준인 CORBA 로드 밸런싱 서비스를 이용하여 유지보수 및 확장성이 용이하고 다양한 플랫폼에서 사용이 가능하며 여러 종류의 어플리케이션의 수행을 위한 클러스터 노드의 동적 추가/삭제가 가능한 범용 클러스터링 시스템을 설계하고 구현한다.

  • PDF

Rapid Auto-scaling Mechanism using GPU for Resource High Availability based on DSV (DSV 기반 자원 고가용성을 위해 GPU를 이용한 신속한 자동 확장 기법)

  • Park, Boo-Kwang;Kim, Hyun-Woo;Byun, HwiRim;Heo, Yoon-A;Song, Eun-Ha;Jeong, Young-Sik
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.197-198
    • /
    • 2015
  • IT 기술의 진보적 발전에 따라 클라우드 컴퓨팅 분야 연구들이 활발히 진행되고 있다. 클라우드 컴퓨팅은 가상화 기술을 이용하여 크게 인프라, 플랫폼, 소프트웨어 관점으로 나뉘어 사용자에게 다양한 서비스를 제공한다. 가상화 기술 중에 Desktop Storage Virtualization (DSV)은 분산된 레거시 데스크탑으로 구성되어 있기 때문에 비가용 상태 시간별 클러스터링 및 사용자 요청에 따른 자동 확장이 매우 중요시된다. 본 논문에서는 GPU의 many-core를 이용하여 분산된 데스크탑의 성능 상태 분석 및 자동 확장을 위해 스레드별로 호스트를 매핑하고 병렬적으로 처리하는 Rapid Auto Scaling Mechanism (RASM)을 제안한다.

Enhancing the Performance of Multiple Parallel Applications using Heterogeneous Memory on the Intel's Next-Generation Many-core Processor (인텔 차세대 매니코어 프로세서에서의 다중 병렬 프로그램 성능 향상기법 연구)

  • Rho, Seungwoo;Kim, Seoyoung;Nam, Dukyun;Park, Geunchul;Kim, Jik-Soo
    • Journal of KIISE
    • /
    • v.44 no.9
    • /
    • pp.878-886
    • /
    • 2017
  • This paper discusses performance bottlenecks that may occur when executing high-performance computing MPI applications in the Intel's next generation many-core processor called Knights Landing(KNL), as well as effective resource allocation techniques to solve this problem. KNL is composed of a host processor to enable self-booting in addition to an existing accelerator consisting of a many-core processor, and it was released with a new type of on-package memory with improved bandwidth on top of existing DDR4 based memory. We empirically verified an improvement of the execution performance of multiple MPI applications and the overall system utilization ratio by studying a resource allocation method optimized for such new many-core processor architectures.

Comparison of Parallel Computation Performances for 3D Wave Propagation Modeling using a Xeon Phi x200 Processor (제온 파이 x200 프로세서를 이용한 3차원 음향 파동 전파 모델링 병렬 연산 성능 비교)

  • Lee, Jongwoo;Ha, Wansoo
    • Geophysics and Geophysical Exploration
    • /
    • v.21 no.4
    • /
    • pp.213-219
    • /
    • 2018
  • In this study, we simulated 3D wave propagation modeling using a Xeon Phi x200 processor and compared the parallel computation performance with that using a Xeon CPU. Unlike the 1st generation Xeon Phi coprocessor codenamed Knights Corner, the 2nd generation x200 Xeon Phi processor requires no additional communication between the internal memory and the main memory since it can run an operating system directly. The Xeon Phi x200 processor can run large-scale computation independently, with the large main memory and the high-bandwidth memory. For comparison of parallel computation, we performed the modeling using the MPI (Message Passing Interface) and OpenMP (Open Multi-Processing) libraries. Numerical examples using the SEG/EAGE salt model demonstrated that we can achieve 2.69 to 3.24 times faster modeling performance using the Xeon Phi with a large number of computational cores and high-bandwidth memory compared to that using the 12-core CPU.

A Distributed Real-time Self-Diagnosis System for Processing Large Amounts of Log Data (대용량 로그 데이터 처리를 위한 분산 실시간 자가 진단 시스템)

  • Son, Siwoon;Kim, Dasol;Moon, Yang-Sae;Choi, Hyung-Jin
    • Database Research
    • /
    • v.34 no.3
    • /
    • pp.58-68
    • /
    • 2018
  • Distributed computing helps to efficiently store and process large data on a cluster of multiple machines. The performance of distributed computing is greatly influenced depending on the state of the servers constituting the distributed system. In this paper, we propose a self-diagnosis system that collects log data in a distributed system, detects anomalies and visualizes the results in real time. First, we divide the self-diagnosis process into five stages: collecting, delivering, analyzing, storing, and visualizing stages. Next, we design a real-time self-diagnosis system that meets the goals of real-time, scalability, and high availability. The proposed system is based on Apache Flume, Apache Kafka, and Apache Storm, which are representative real-time distributed techniques. In addition, we use simple but effective moving average and 3-sigma based anomaly detection technique to minimize the delay of log data processing during the self-diagnosis process. Through the results of this paper, we can construct a distributed real-time self-diagnosis solution that can diagnose server status in real time in a complicated distributed system.

An Efficient Hand Gesture Recognition Method using Two-Stream 3D Convolutional Neural Network Structure (이중흐름 3차원 합성곱 신경망 구조를 이용한 효율적인 손 제스처 인식 방법)

  • Choi, Hyeon-Jong;Noh, Dae-Cheol;Kim, Tae-Young
    • The Journal of Korean Institute of Next Generation Computing
    • /
    • v.14 no.6
    • /
    • pp.66-74
    • /
    • 2018
  • Recently, there has been active studies on hand gesture recognition to increase immersion and provide user-friendly interaction in a virtual reality environment. However, most studies require specialized sensors or equipment, or show low recognition rates. This paper proposes a hand gesture recognition method using Deep Learning technology without separate sensors or equipment other than camera to recognize static and dynamic hand gestures. First, a series of hand gesture input images are converted into high-frequency images, then each of the hand gestures RGB images and their high-frequency images is learned through the DenseNet three-dimensional Convolutional Neural Network. Experimental results on 6 static hand gestures and 9 dynamic hand gestures showed an average of 92.6% recognition rate and increased 4.6% compared to previous DenseNet. The 3D defense game was implemented to verify the results of our study, and an average speed of 30 ms of gesture recognition was found to be available as a real-time user interface for virtual reality applications.

Study on The Throughput Unfairness of High-power transmission in The Transmission Power Controlled Wireless Networks Considering Green Computing (그린 컴퓨팅을 위한 무선 네트워크 전송 파워 조절에서 고출력 전송의 성능 불공평성에 대한 연구)

  • Lee, Hee-Jin;Kim, Jong-Kwon
    • Journal of the Institute of Electronics Engineers of Korea TC
    • /
    • v.47 no.10
    • /
    • pp.27-35
    • /
    • 2010
  • In wireless packet networks, energy and wireless resource efficiency is critical issue to addressed for wide deployment. To achieve the both goals of saving the mobile station's energy and increasing the wireless capacity, transmission power control is introduced to wireless packet networks. In the transmission power controled networks, it is not deeply studied on unfairness among transmissions with different power levels that reaches starvation. Through the performance analysis, this paper explains the throughput unfairness of high power transmission with the unfair media access probability owing to the contending node number difference and proposes a simple PHY-MAC cross layer approach.