• 제목/요약/키워드: In-Memory Computing

검색결과 755건 처리시간 0.032초

Auto Regulated Data Provisioning Scheme with Adaptive Buffer Resilience Control on Federated Clouds

  • Kim, Byungsang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권11호
    • /
    • pp.5271-5289
    • /
    • 2016
  • On large-scale data analysis platforms deployed on cloud infrastructures over the Internet, the instability of the data transfer time and the dynamics of the processing rate require a more sophisticated data distribution scheme which maximizes parallel efficiency by achieving the balanced load among participated computing elements and by eliminating the idle time of each computing element. In particular, under the constraints that have the real-time and limited data buffer (in-memory storage) are given, it needs more controllable mechanism to prevent both the overflow and the underflow of the finite buffer. In this paper, we propose an auto regulated data provisioning model based on receiver-driven data pull model. On this model, we provide a synchronized data replenishment mechanism that implicitly avoids the data buffer overflow as well as explicitly regulates the data buffer underflow by adequately adjusting the buffer resilience. To estimate the optimal size of buffer resilience, we exploits an adaptive buffer resilience control scheme that minimizes both data buffer space and idle time of the processing elements based on directly measured sample path analysis. The simulation results show that the proposed scheme provides allowable approximation compared to the numerical results. Also, it is suitably efficient to apply for such a dynamic environment that cannot postulate the stochastic characteristic for the data transfer time, the data processing rate, or even an environment where the fluctuation of the both is presented.

New execution model for CAPE using multiple threads on multicore clusters

  • Do, Xuan Huyen;Ha, Viet Hai;Tran, Van Long;Renault, Eric
    • ETRI Journal
    • /
    • 제43권5호
    • /
    • pp.825-834
    • /
    • 2021
  • Based on its simplicity and user-friendly characteristics, OpenMP has become the standard model for programming on shared-memory architectures. Checkpointing-aided parallel execution (CAPE) is an approach that utilizes the discontinuous incremental checkpointing technique (DICKPT) to translate and execute OpenMP programs on distributed-memory architectures automatically. Currently, CAPE implements the OpenMP execution model by utilizing the DICKPT to distribute parallel jobs and their data to slave machines, and then collects the results after executing these distributed jobs. Although this model has been proven to be effective in terms of performance and compatibility with OpenMP on distributed-memory systems, it cannot fully exploit the capabilities of multicore processors. This paper presents a novel execution model for CAPE that utilizes two levels of parallelism. In the proposed model, we add another level of parallelism in the form of multithreaded processes on slave machines with the goal of better exploiting their multicore CPUs. Initial experimental results presented near the end of this paper demonstrate that this model provides significantly enhanced CAPE performance.

MPI 노드 내 통신 성능 향상을 위한 매니코어 프로세서의 온-패키지 메모리 활용 (Using the On-Package Memory of Manycore Processor for Improving Performance of MPI Intra-Node Communication)

  • 조중연;진현욱;남덕윤
    • 정보과학회 논문지
    • /
    • 제44권2호
    • /
    • pp.124-131
    • /
    • 2017
  • 고성능 컴퓨팅 환경을 위해서 최근 등장한 차세대 매니코어 프로세서는 전통적인 구조의 메모리와 함께 고대역 온-패키지 메모리를 장착하고 있다. Intel Xeon Phi Knights Landing(KNL) 프로세서의 온-패키지 메모리인 Multi-Channel DRAM(MCDRAM)은 기존의 DDR4 메모리보다 이론적으로 네 배 높은 대역폭을 제공한다. 본 논문에서는 MCDRAM을 이용하여 MPI 노드 내 통신 성능을 향상시키기 위한 방안을 제안한다. 실험 결과, 제안된 기법을 사용할 경우 DDR4를 사용하는 경우와 비교해서 MPI 노드 내 통신 성능을 최대 272% 향상시킬 수 있음을 보인다. 또한 MCDRAM 활용 방법에 따른 성능 영향뿐만 아니라 프로세스의 코어 친화도에 따른 성능 영향을 보인다.

차세대 모바일 메모리 기술의 정량적 비교 및 분석 (Quantitative comparison and analysis of next generation mobile memory technologies)

  • 윤창호;문병인;공준호
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권4호
    • /
    • pp.40-51
    • /
    • 2017
  • 최근 모바일 디바이스에서 수행되는 응용 프로그램이 데이터-집약적으로 변화함에 따라, 모바일 메모리에 요구되는 대역폭 및 소모되는 에너지가 증가하고 있으며 이를 개선하기 위한 여러 연구 및 기술 개발이 진행되고 있다. 그러나, 최신 모바일 메모리 기술 (LPDDR 혹은 Wide I/O) 시스템 측면 연구는 많이 이루어지지 않은 실정이다. 특히, 컴퓨터 시스템적인 측면에서 이러한 기술들의 정량적인 평가는 모바일 메모리 기술 개선에 매우 중요한 척도가 될 수 있다. 본 논문에서는 현재 모바일 디바이스에서 사용되는 모바일 DRAM (Wide I/O and LPDDR3)을 채용한 컴퓨터 시스템을 시뮬레이션하고 이를 통해 얻은 결과를 바탕으로 차세대 모바일 DRAM의 에너지 효율 및 성능에 직접적인 영향을 주는 세부적인 요소를 정량적으로 분석하고 어느 부분이 개선점이 될 수 있는지를 보여준다.

최적화된 CUDA 소프트웨어 제작을 위한 프로그래밍 기법 분석 (Analysis of Programming Techniques for Creating Optimized CUDA Software)

  • 김성수;김동헌;우상규;임인성
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권7호
    • /
    • pp.775-787
    • /
    • 2010
  • GPU(Graphics Processing Unit)는 범용 CPU와는 달리 다수코어 스트리밍 프로세서(manycore streaming processor) 형태로 특화되어 발전되어 왔으며, 최근 뛰어난 병렬 처리 연산 능력으로 인하여 점차 많은 영역에서 CPU의 역할을 대체하고 있다. 이러한 추세에 따라 최근 NVIDIA 사에서는 GPGPU(General Purpose GPU) 아키텍처인 CUDA(Compute Unified Device Architecture)를 발표하여 보다 유연한 GPU 프로그래밍 환경을 제공하고 있다. 일반적으로 CUDA API를 사용한 프로그래밍 작업시 GPU의 계산구조에 관한 여러 가지 요소들에 대한 특성을 정확히 파악해야 효율적인 병렬 소프트웨어를 개발할 수 있다. 본 논문에서는 다양한 실험과 시행착오를 통하여 획득한 CUDA 프로그래밍에 관한 최적화 기법에 대하여 설명하고, 그러한 방법들이 프로그램 수행의 효율에 어떠한 영향을 미치는지 알아본다. 특히 특정 예제 문제에 대하여 효과적인 계층 구조 메모리의 접근과 코어 활성화 비율(occupancy), 지연 감춤(latency hiding) 등과 같이 성능에 영향을 미치는 몇 가지 규칙을 실험을 통해 분석해봄으로써, 향후 CUDA를 기반으로 하는 효과적인 병렬 프로그래밍에 유용하게 활용할 수 있는 구체적인 방안을 제시한다.

효율적 패턴 인식을 위한 순차적 GHT (The Sequential GHT for the Efficient Pattern Recognition)

  • 김수환;임승민;이규태;이태원
    • 전자공학회논문지B
    • /
    • 제28B권5호
    • /
    • pp.327-334
    • /
    • 1991
  • This paper proposes an efficient method of implementing the generalized Hough transform (GHT), which has been hindered by an excessive computing load and a large memory requirement. The conventional algorithm requires a parameter space of 4 dimensions in detection a rotated, scaled, and translated object in an input image. Prior to the application of GHT to the input image, the proposed method determines the angle of rotation and the scaling factor of the test image using the proportion of the edge components between the reference image and test image. With the rotation angle and the scaling factor already determined, the parameter spaceis to be reduced to a simple array of 2 dimensions by applying the unit GHT only one time. The experiments with the image of airplanes reveal that both of the computing time and the requires memory size are reduced by 95 percent, without any degradatationof accuracy, compared with the conventional GHT algorithm.

  • PDF

클라우드 컴퓨팅 기반 가상 자원 관리를 위한 모니터링 시스템 설계 및 구현 (Development and Implementation of Monitoring System for Management of Virtual Resource Based on Cloud Computing)

  • 조대균;박석천
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.41-47
    • /
    • 2013
  • 본 논문에서는 개방 시스템 기반 가상 자원 모니터링 시스템을 CPU, 메모리, 디스크, 네트워크 부분으로 세분화 하고 각각 모듈화하여 설계 및 구현하였다. 설계한 시스템을 구현하기 위해 Windows, Linux, Xen 운영체제를 이용하였고, 구현 언어로는 C++를 사용하였다. 그리고 시스템의 구조는 기능 업그레이드 및 추가 등의 확장성을 고려하여 가능한 기능별로 모듈화 하여 클라우드 컴퓨팅 환경에서 적용 가능한 클라우드 컴퓨팅 가상 자원 모니터링 시스템을 구현하였다. 본 논문에서 설계 및 구현한 클라우드 컴퓨팅 가상 자원 모니터링 시스템의 동작성 검사를 위해 테스트베드를 구축하여 Xen, ESX 하이퍼바이저 운영체제에서 테스트 한 결과 실시간으로 CPU, 메모리, 디스크, 네트워크 정보를 정상적으로 모니터링 함을 확인 하였다.

메모리가 제한된 장치를 위한 효율적인 유한체 연산 알고리즘 (Efficient Algorithms for Finite Field Operations on Memory-Constrained Devices)

  • 한태윤;이문규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권4호
    • /
    • pp.270-274
    • /
    • 2009
  • 본 논문에서는 초소형 장치 상에서 적은 메모리만으로 효율적으로 연산 가능한 GF($2^m$) 상의 연산방법을 제안한다. 기존 구현들은 속도의 향상을 위한 곱셈연산 방법만을 제시하였으나, 본 논문에서는 곱셈 연산시 덧셈의 순서를 바꿈으로써 연산시 사용하는 메모리의 양을 줄이는 방법을 제시한다. 실험에 따르면, 본 논문에서 제안한 방법은 GF($2^{271}$)의 곱셈연산에서 이전에 제안된 방법들과 비교해 비슷한 수행 시간을 사용하면서 약 20% 적은 메모리 사용량을 보였다.

Forecasting Chemical Tanker Freight Rate with ANN

  • Lim, Sangseop;Kim, Seokhun
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.113-118
    • /
    • 2021
  • 본 논문은 케미컬 탱커시장의 운임예측에 관하여 인공신경망을 적용하였으며 전통적인 시계열 모델인 ARIMA모형과 비교하였다. 케미컬 시장의 경우 상대적으로 소규모이나 범용성이 높은 선박을 이용한 시장으로 수급모델을 활용하여 운임시장을 분석하기 어려우며, 운임의 변동성이 크기 때문에 선형모형을 활용하는데는 한계가 있다. 본 연구는 케미컬 시장의 특성을 고려하여 비선형 모델인 인공신경망을 이용하여 ARIMA와 비교한 결과 RMSE와 Correlation 측면에서 예측성능이 우수함을 보였으며, 케미컬 탱커의 운임예측에 더 적합함을 보였다. 본 연구는 운임거래에 있어 과학적 모델을 제시함으로써 의사결정의 질을 제고하는데 기여할 뿐만 아니라 학문적으로 소외되어온 케미컬 시장 연구에 도움이 될 것으로 기대된다.