• 제목/요약/키워드: In-Memory Computing

검색결과 764건 처리시간 0.03초

쿠버네티스에서 ML 워크로드를 위한 분산 인-메모리 캐싱 방법 (Distributed In-Memory Caching Method for ML Workload in Kubernetes)

  • 윤동현;송석일
    • Journal of Platform Technology
    • /
    • 제11권4호
    • /
    • pp.71-79
    • /
    • 2023
  • 이 논문에서는 기계학습 워크로드의 특징을 분석하고 이를 기반으로 기계학습 워크로드의 성능 향상을 위한 분산 인-메모리 캐싱 기법을 제안한다. 기계학습 워크로드의 핵심은 모델 학습이며 모델 학습은 컴퓨팅 집약적 (Computation Intensive)인 작업이다. 쿠버네티스 기반 클라우드 환경에서 컴퓨팅 프레임워크와 스토리지를 분리한 구조에서 기계학습 워크로드를 수행하는 것은 자원을 효과적으로 할당할 수 있지만, 네트워크 통신을 통해 IO가 수행되야 하므로 지연이 발생할 수 있다. 이 논문에서는 이런 환경에서 수행되는 머신러닝 워크로드의 성능을 향상하기 위한 분산 인-메모리 캐싱 기법을 제안한다. 특히, 제안하는 방법은 쿠버네티스 기반의 머신러닝 파이프라인 관리 도구인 쿠브플로우를 고려하여 머신러닝 워크로드에 필요한 데이터를 분산 인-메모리 캐시에 미리 로드하는 새로운 방법을 제안한다.

  • PDF

연결기반 명령어 실행을 이용한 재구성 가능한 IoT를 위한 온칩 플래쉬 메모리의 클라우드화 (Cloudification of On-Chip Flash Memory for Reconfigurable IoTs using Connected-Instruction Execution)

  • 이동규;조정훈;박대진
    • 대한임베디드공학회논문지
    • /
    • 제14권2호
    • /
    • pp.103-111
    • /
    • 2019
  • The IoT-driven large-scaled systems consist of connected things with on-chip executable embedded software. These light-weighted embedded things have limited hardware space, especially small size of on-chip flash memory. In addition, on-chip embedded software in flash memory is not easy to update in runtime to equip with latest services in IoT-driven applications. It is becoming important to develop light-weighted IoT devices with various software in the limited on-chip flash memory. The remote instruction execution in cloud via IoT connectivity enables to provide high performance software execution with unlimited software instruction in cloud and low-power streaming of instruction execution in IoT edge devices. In this paper, we propose a Cloud-IoT asymmetric structure for providing high performance instruction execution in cloud, still low power code executable thing in light-weighted IoT edge environment using remote instruction execution. We propose a simulated approach to determine efficient partitioning of software runtime in cloud and IoT edge. We evaluated the instruction cloudification using remote instruction by determining the execution time by the proposed structure. The cloud-connected instruction set simulator is newly introduced to emulate the behavior of the processor. Experimental results of the cloud-IoT connected software execution using remote instruction showed the feasibility of cloudification of on-chip code flash memory. The simulation environment for cloud-connected code execution successfully emulates architectural operations of on-chip flash memory in cloud so that the various software services in IoT can be accelerated and performed in low-power by cloudification of remote instruction execution. The execution time of the program is reduced by 50% and the memory space is reduced by 24% when the cloud-connected code execution is used.

페이지 삭제정보를 활용하는 플래시 저장장치의 구조 (The Architecture of the Flash Memory Storage System using Page Delete Information)

  • 정호영;박성민;강수용;차재혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.958-962
    • /
    • 2009
  • 최근 저장장치로 하드 디스크를 대치하고 있는 플래시 메모리 저장장치는 물리적 특성이 하드디스크와 다르다. 이러한 플래시 메모리 저장장치의 성능을 향상시키기 위해 운영체제 및 파일시스템의 여러 계층에 걸쳐 다양한 연구가 진행되고 있다. 본 연구에서는 파일 삭제시 무효화되는 페이지 정보를 상위 계층에서 전달받아 이를 저장하고 활용하는 플래시 메모리 저장장치의 구조를 제안하고 해당 시스템의 성능 및 영향에 대해 연구하였다. 제안하는 시스템은 페이지 무효 정보를 블록 병합, 웨어 레벨링 등에 활용하고 이에 따라 시스템의 성능을 효과적으로 향상시키는 것으로 나타났다.

소프트웨어 분산공유메모리시스템을 위한 적응적 선인출 기법 (An Adaptive Prefetching Technique for Software Distributed Shared Memory Systems)

  • 이상권;윤희철;이준원;맹승렬
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권9호
    • /
    • pp.461-468
    • /
    • 2001
  • 공유가상메모리 시스템은 적은 비용으로 고성능 계산 능력을 제공하지만, 메모리 접근 지연 시간이 길다는 문제점이 있다. 일반적으로 이 지연시간은 공유데이터에 대한 반복적인 무효화 작업에 의해 일어난다. 고유 데이터들은 동기화를 통해서 접근되고 쓰레드를 반복적 패턴에 의해 동기화 되기 때문에, 반복성에 기반한 선인출 기법은 메모리 지연시간을 효과적으로 줄일수 있다. 본 논문에서는 동기화 변수별로 접근 기록을 분석해서 미래의 메모리 접근을 예측하는 선인출 기법을 제안한다. 제안하는 기법은 8노드 클러스터상에서 SPLASH-2 응용들을 실행시켜 성능을 측정하였다. 그 결과, 제안하는 기법이 34%~45%정도의 메모리 접근 지연시간을 감소할수 있었다.

  • PDF

NAND형 플래시메모리를 위한 플래시 압축 계층의 설계 및 성능평가 (Design and Performance Evaluation of a Flash Compression Layer for NAND-type Flash Memory Systems)

  • 임근수;반효경;고건
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권4호
    • /
    • pp.177-185
    • /
    • 2005
  • 최근 휴대용 정보기기의 사용이 급증함에 따라 NAND형 플래시메모리를 시스템의 보조기억장치로 사용하는 사례가 급증하고 있다. 하지만, 전통적인 보조기억장치인 하드디스크에 비해 NAND형 플래시메모리는 단위 공간당 비용이 수십배 가량 높아 저장 공간의 효율적인 관리가 필요하다 저장 공간을 효율적으로 사용하게 하는 대표적인 방법으로 데이타 압축 기법이 있다. 하지만, NAND형 플래시메모리에서는 압축 기법의 적용이 쉽지 않다. 이는 NAND형 플래시메모리가 페이지 단위 입출력만을 지원하여 압축 데이타가 플래시 페이지보다 작은 경우 내부 단편화 현상을 발생시켜 압축의 이득을 심각하게 감쇄시키기 때문이다. 이러한 문제를 해결하기 위해 본 논문에서는 작은 크기의 압축 데이타를 쓰기 버퍼를 통해 그룹화한 후 하나의 플래시 페이지에 저장하는 플래시 압축 계충을 설계하고 성능을 평가한다. 성능평가 결과 제안하는 플래시 압축 계층은 플래시메모리의 저장 공간을 $40\%$ 이상 확장하며 쓰기 대역폭을 크게 개선함을 확인할 수 있었다.

모바일 클라이언트를 위한 상품정보 객체계층구조 구성 (Construction of Product Information Hierarchy for Mobile Clients)

  • 하상호
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권2호
    • /
    • pp.157-164
    • /
    • 2005
  • 무선 인터넷 기술과 모바일 컴퓨팅 기술의 발달로, M-Commerce가 PDA나 모바일 폰 등과같은 다양한 무선 장치상에서 실현되고 있다. 현재 M-Commerce를 위한 상품 컨텐츠는 목표 무선 장치의 특징을 충족할 수 있도록 새롭게 작성되고 있다. 이것은 자원의 중복이며, 자원 관리에 엄청난 노력이 요구된다. 따라서 현재 I-Commerce를 위해서 제공되고 있는 인터넷 상품 정보를 효과적으로 이용하는 것이 필요하다. 그러나 이러한 이용에는 적은 메모리 용량, 작은 디스플레이 화면, 낮은 수행속도 등의 모바일 장치의 많은 제약성이 고려되어야 한다. 본 논문에서는 모바일 폰 상에 인터넷 XML 상품 문서를 효과적으로 이용하기 위해 클라이언트에서 문서에 대한 객체계층구조를 구성하는 4가지 방법을 제안하고, 실험을 통해서 사용자 응답시간과 메모리 사용량 관점에서 비교, 분석한다.

내장형 리눅스 커널에서 멀티미디어 서비스를 위한 메모리 복사 감소 기법의 구현 (Implementation of Memory Copy Reduction Scheme for Multimedia Service in Embedded Linux Kernel)

  • 김정원
    • 한국멀티미디어학회논문지
    • /
    • 제7권8호
    • /
    • pp.1058-1065
    • /
    • 2004
  • 단순 모니터에서 CPU, 메모리, 그리고 하드디스크를 갖춘 셋탑박스에 이르기까지 내장형 시스템은 다양한 응용에 사용되고 있다. 특히 휴대용 또는 소형기기에 멀티미디어를 서비스하는 경우가 증가하고 있고 이들 시스템에는 내장형 운영체제가 탑재되고 있다. 본 논문에서는 멀티미디어 서비스를 위한 내장형 리눅스가 탑재된 임베디드 시스템에서 응용 프로그램과 운영체제 커널사이의 메모리 복사 요구를 감소시키는 Null copy기법을 제안한다. 저성능의 컴퓨팅 파워 및 저용량의 메모리를 가진 내장형 시스템에서 연속 미디어를 네트워크를 통해 실시간으로 전송하고자 할 때 Null copy 기법은 시스템의 QoS를 만족시킬 수 있다. 웹 카메라를 내장형 리눅스 개발 보드에 장착하여 영상 전송 환경을 구축한 결과 Null copy 기법은 CPU 이용률 및 마감시간 실패측면에서 기존 커널에 비해 우수한 성능을 나타내었다.

  • PDF

메인 메모리상에 가상 데스크탑 이미지를 운용하는 고속 가상 데스크탑 시스템 설계 및 구현 (Design and Implementation of High Performance Virtual Desktop System Managing Virtual Desktop Image in Main Memory)

  • 오수철;김성운
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권8호
    • /
    • pp.363-368
    • /
    • 2016
  • 기존의 스토리지 기반 가상 데스크탑 시스템은 디스크에 입출력이 집중될 경우 성능이 저하되는 문제가 발생하였다. 따라서, 부트 스톰과 같이 여러 대의 가상 데스크탑이 동시에 부팅할 경우, 시스템의 성능이 급격히 저하되었다. 본 논문에서는 가상 데스크탑 시스템의 성능을 향상시킬 수 있는 메인 메모리 기반 가상 데스크탑 시스템을 제안한다. 본 시스템에서는 가상 데스크탑 이미지를 메인 메모리에 저장함으로써 전체 시스템의 성능을 향상시키고, 중복 제거 기술을 적용하여 용량이 많은 가상 데스크탑 이미지를 한정된 크기의 메인 메모리에 저장하였다. 본 시스템의 구현 및 실험을 통하여 가상 데스크탑을 동시 부팅할 때, 스토리지 기반 가상 데스크탑 보다 부팅 속도가 4배 빠름을 확인하였다.

상이한 메모리 크기를 가지는 분산 환경에서 부하 분산을 위한 캐시 관리 기법 (An Efficient Cache Management Scheme for Load Balancing in Distributed Environments with Different Memory Sizes)

  • 최기태;윤상원;박재열;임종태;이석희;복경수;유재수
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권8호
    • /
    • pp.543-548
    • /
    • 2015
  • 최근 소셜 미디어의 성장과 디지털 기기의 활용이 증가함에 따라 기하급수적으로 데이터가 급증하고 있다. 기존 디스크 기반 분산 파일 시스템은 I/O 처리 비용 및 병목 현상으로 인해 데이터 처리나 데이터 접근 성능에 한계가 발생한다. 이러한 문제점을 해결하기 위해 메모리에 데이터를 관리하는 캐시 기법이 활용되고 있다. 본 논문에서는 분산 메모리 환경에서 부하 분산을 처리하기 위한 캐시 관리 기법을 제안한다. 제안하는 기법은 노드의 메모리의 크기가 서로 상이한 환경에서 메모리 크기에 따라 데이터를 분배하고 노드의 부하가 발생할 경우 핫 데이터를 재분배한다. 또한, 캐시 항목의 재사용 가능성, 사용 빈도수, 접근 시간을 고려한 캐시 교체 기법을 제안한다. 성능 평가를 통해 제안하는 분산 캐시 기법이 기존에 캐시 관리 기법에 비해 우수함을 입증한다.

이동 기기를 위한 플래시 메모리 파일 시스템 (Flash Memory File System for Mobile Devices)

  • 배영현;최종무;이동희;노삼혁;민상렬
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제11권4호
    • /
    • pp.368-380
    • /
    • 2005
  • 휴대 전화와 같은 소형 이동 기기에서 데이터 저장 장치로 널리 사용되는 플래시 메모리를 위한 파일 시스템은 고속의 데이터 쓰기 및 읽기 성능뿐만 아니라 소형 이동 기기의 사용 환경에 적합하도록 메모리 사용량이 적고 전원 오류 등의 상황에서도 데이터의 무결성을 보장하여야 한다 본 논문에서는 파일 시스템 수준에서 플래시 메모리의 물리적 동자 특성과 데이터 저장 상태를 고려하여 데이터 쓰기 요청을 제어함으로써 성능을 최적화한 플래시 메모리 파일 시스템을 구현한다. 구현된 파일 시스템은 모든 작업을 트랜잭션 개념으로 처리하여 오류 상황에서도 저장 장치의 신뢰성을 좌장하며 단순한 구조의 주소 사상 기법을 적용하여 메모리 사용량을 최소화한다. 그리고 실제 하드웨어 환경에서 제안된 기술을 구현하고 기존 플래시 메모리 파일 시스템과의 비교 측정을 통해 성능의 우수성을 보인다.