• 제목/요약/키워드: Memory Sharing

검색결과 172건 처리시간 0.028초

RPC 기반 GPU 가상화 환경에서 가상머신의 GPGPU 작업 성능 향상을 위한 GPU 메모리 관리 기법 (GPU Memory Management Technique to Improve the Performance of GPGPU Task of Virtual Machines in RPC-Based GPU Virtualization Environments)

  • 강지훈
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제10권5호
    • /
    • pp.123-136
    • /
    • 2021
  • RPC(Remote Procedure Call) 기반 GPU(Graphics Processing Unit) 가상화 기술은 다수의 사용자 가상머신에게 GPU를 공유하기 위한 기술 중 하나이다. 하지만 클라우드 환경에서 일반적인 GPU는 CPU나 메모리와는 다르게 가상머신의 자원 사용량을 제한할 수 있는 자원 격리(Isolation) 기술을 제공하지 않는다. 특히 RPC 기반 가상화 환경에서는 각 가상머신에서 실행되는 GPU 작업은 멀티 프로세스 형태로 수행되기 때문에 자원격리 기술의 부재는 자원 경쟁으로 인한 성능 저하 문제를 발생시킨다. 그리고 GPU 메모리 경쟁은 가상머신들의 자원 요구량이 많을수록 성능저하를 가속화하고 가상머신 사이의 균등한 성능을 보장하지 못하기 때문에 공평성이 저하되는 문제를 발생시킨다. 본 논문에서는 RPC 기반 GPU 가상화 환경에서 사용자 가상머신들의 GPU 메모리 요구량이 가용 GPU 메모리 용량을 초과했을 때 발생하는 자원 경쟁으로 인한 성능 저하 문제 분석하고 이를 해결하기 위한 GPU 메모리 관리 기법을 제안한다. 또한, 실험을 통해 본 논문에서 제안한 GPU 메모리 관리 기법이 GPGPU 작업의 성능을 향상시킬 수 있다는 것을 보여준다.

임베디드 시스템에서의 공유 메모리 컨트롤러 디바이스 드라이버 설계 (Design of Shared Memory Controller Device Driver in Embedded System)

  • 문지훈;오재철
    • 한국전자통신학회논문지
    • /
    • 제9권6호
    • /
    • pp.703-709
    • /
    • 2014
  • 단일 시스템에 코어별 운영체제를 사용하는 AMP(Asymmetric Multiprocessing) 기반 듀얼 코어에서 프로세서간 데이터를 전달하기 위해서 공유 메모리 기법을 사용한다. 서로 다른 운영체제에서 공유 메모리를 사용하기 위해서는 두 운영체제 사이의 메시지 통신 및 동기화 문제를 해결해 주어야 하는 문제점이 발생한다. 본 논문에서는 듀얼 코어 환경에서 서로 다른 프로세서 코어 사이에서 데이터 공유를 위해서 별도의 메모리 컨트롤러를 이용하였다. 이 컨트롤러는 두 프로세서에서 동시에 접근이 가능 하도록 두 개의 슬레이브 포트를 지정할 수 있으며, 두 프로세서에 의해서 동시에 데이터 처리를 수행할 경우 메모리 중재자에 의해서 슬레이브 포트의 우선 순위를 결정하게 된다. A에서 B 프로세서로 데이터를 전달 시, SRAM 영역을 논리적으로 8개의 페이지로 분리하였다. 여러 프로세스에서 메모리 영역을 사용 하도록 하였으며 페이지당 4KByte의 크기를 갖도록 하였으며, 현재 페이지가 사용 가능한지 아닌지를 판별하기 위해서 4바이트 크기의 컨트롤 레지스터를 이용하였다.

THE INFLUENCE OF THE TIME SLICING OF A PROCESSOR SHARING COMMUNICATION MODEL

  • LIM JONG SEUL;PARK CHIN HONG;AHN SEONG JOON
    • Journal of applied mathematics & informatics
    • /
    • 제17권1_2_3호
    • /
    • pp.737-746
    • /
    • 2005
  • Average memory occupancy and congestion in computer system or communication system may be reduced further if new jobs are admitted only when the number of jobs queued at CPU is below a certain threshold, run queue cutoff (RQ). In our previous paper we showed that response time of a job is invariant with respect to RQ if jobs do not communicate each other. In this paper, we prove that the invariance property by considering the evolution of the queue lengths as point processes. We also present an approximate method for the delay due to context switching under time slicing.

대량 트래픽 전송자의 실시간 탐지를 위한 플로우 라벨링 방법 (Flow Labeling Method for Realtime Detection of Heavy Traffic Sources)

  • 이경희;양대헌
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제2권10호
    • /
    • pp.421-426
    • /
    • 2013
  • 인터넷을 통해 전송되는 트래픽의 양이 점점 더 많아지고 있고, 이에 따라 트래픽의 양을 알아내는 것이 중요해지고 있다. 트래픽을 측정하는 기법에 대한 많은 연구가 있었으며, 주로 적은 양의 메모리를 사용해서 측정의 정확도를 높이는 방향으로 연구가 진행되고 있다. 이 논문에서는 기존 기법들에서는 제공하지 않는 플로우 라벨링 기법을 제안한다. 이 기법을 통해서 관리자는 특정 값 이상의 트래픽을 생성한 플로우의 라벨을 실시간으로 알아낼 수 있으며, 기존의 기법이 가지는 카운팅의 상한선을 확장시킬 수 있다. 가장 최근에 발표된 CSM (Counter Sharing Method)에 이 기법을 적용하고, CAIDA 데이터셋을 이용해서 성능을 분석해 본다.

초고속 포인터 스위칭 패브릭의 설계 (Design of High-speed Pointer Switching Fabric)

  • 류경숙;최병석
    • 인터넷정보학회논문지
    • /
    • 제8권5호
    • /
    • pp.161-170
    • /
    • 2007
  • 본 논문은 데이터 메모리 평면과 스위칭 평면을 분리하여 패킷 데이터의 저장과 메모리 주소 포인터의 스위칭이 병렬적으로 처리 가능하며 IP 패킷의 가변 길이 스위칭이 가능한 새로운 스위치 구조를 제안한다. 제안한 구조는 기존 VOQ방식의 복잡한 중재 알고리즘이 필요 없으며 출력 큐 방식의 스위치에서만 적용되고 있는 QoS를 입력 큐에서 고려한다. 성능분석 결과 제안한 구조는 기존의 공유 메모리 기반의 구조들에 비해 상대적으로 낮은 평균 지연 시간을 가지며 스위치의 크기가 증가하더라도 일정한 지연 시간을 보장함을 확인하였다.

  • PDF

공유 데이터베이스 환경에서 고성능 트랜잭션 처리를 위한 버퍼 무효화 기법 (Buffer Invalidation Schemes for High Performance Transaction Processing in Shared Database Environment)

  • 김신희;배정미;강병욱
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제6권1호
    • /
    • pp.159-180
    • /
    • 1997
  • Database sharing system(DBSS) refers to a system for high performance transaction processing. In DBSS, the processing nodes are locally coupled via a high speed network and share a common database at the disk level. Each node has a local memory, a separate copy of operating system, and a DBMS. To reduce the number of disk accesses, the node caches database pages in its local memory buffer. However, since multiple nodes may be simultaneously cached a page, cache consistency must be ensured so that every node can always access the latest version of pages. In this paper, we propose efficient buffer invalidation schemes in DBSS, where the database is logically partitioned using primary copy authority to reduce locking overhead. The proposed schemes can improve performance by reducing the disk access overhead and the message overhead due to maintaining cache consistency. Furthermore, they can show good performance when database workloads are varied dynamically.

  • PDF

전역적 메모리에서의 블록 룩업과 재배치에 관한 연구 (A Study on the Block Lookup and Replacement in Global Memory)

  • 이영섭;김은경;정병수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(3)
    • /
    • pp.51-54
    • /
    • 2000
  • Due to the emerging of high-speed network, lots of interests of access to remote data have increased. Those interests motivate using of Cooperative Caching that uses remote cache like local cache by sharing other clients' cache. The conventional algorithm like GMS(Global Memory Service) has some disadvantages that occurred bottleneck and decreasing performance because of exchanges of many messages to server or manager. On the other hand, Hint-based algorithm resolves a GMS's server bottleneck as each client has hint information of all blocks. But Hint-based algorithm also causes some problems such as inaccurate information in it, if it has too old hint information. In this paper, we offer the policy that supplement bottleneck and inaccuracy; by using file identifier that can search for the lookup table and by exchanging oldest block information between each client periodically.

  • PDF

동시 다중 주사 방식의 초음파 합성구경 빔포머 구조 (Ultrasound Synthetic Aperture Beamformer Architecture Based on the Simultaneous Multi-scanning Approach)

  • 이유화;김승수;안영복;송태경
    • 대한의용생체공학회:의공학회지
    • /
    • 제28권6호
    • /
    • pp.803-810
    • /
    • 2007
  • Although synthetic aperture focusing techniques can improve the spatial resolution of ultrasound imaging, they have not been employed in a commercial product because they require a real-time N-channel beamformer with a tremendously increased hardware complexity for simultaneous beamforming along M multiple lines. In this paper, a hardware-efficient beamformer architecture for synthetic aperture focusing is presented. In contrast to the straightforward design using NM delay calculators, the proposed method utilizes only M delay calculators by sharing the same values among the focusing delays which should be calculated at the same time between the N channels for all imaging points along the M scan lines. In general, synthetic aperture beamforming requires M 2-port memories. In the proposed beamformer, the input data for each channel is first upsampled with a 4-fold interpolator and each polyphase component of the interpolator output is stored into a 2-port memory separately, requiring 4M 2-port memories for each channel. By properly limiting the area formed with the synthetic aperture focusing, the input memory buffer can be implemented with only 4 2-port memories and one short multi-port memory.

MCU를 위한 경량화된 RTOS 설계 (Design of Lightweight RTOS for MCU)

  • 박창규
    • 한국정보통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.1301-1306
    • /
    • 2011
  • RTOS는 임베디드 시스템 환경에서 멀티태스킹 동작을 설계하는데 강력한 도구이다. 그러나 협소한 메모리를 가진 MCU에서는 응용프로그램에 비해 기존의 RTOS가 차지하는 비율이 크기 때문에 적용하기 어려웠다. 본 논문에서는 기존의 RTOS에서 사용빈도가 적은 기능을 제거하고, 스케줄링과 자원 관리의 기능만 가지고 최소한의 코드로 동작하는 경량화된 RTOS를 설계하였다. 공유 스택을 사용하여 사용자 메모리를 확보하며, 태스크의 문맥 전환시에 발생하는 오버헤드를 감소시키고, TCB등의 사이즈를 축소하는 기법을 사용하였다. 설계 및 검증 결과, 커널의 사이즈를 1KB이하로 축소할 수 있었고, 커널과 응용 프로그램의 비율을 고려해 볼 때, 본 논문에서 설계한 RTOS는 4KB이상의 프로그램 메모리를 가진 MCU에서 사용할 수 있다.

Design and Fabrication of Low Power Sensor Network Platform for Ubiquitous Health Care

  • Lee, Young-Dong;Jeong, Do-Un;Chung, Wan-Young
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.1826-1829
    • /
    • 2005
  • Recent advancement in wireless communications and electronics has enabled the development of low power sensor network. Wireless sensor network are often used in remote monitoring control applications, health care, security and environmental monitoring. Wireless sensor networks are an emerging technology consisting of small, low-power, and low-cost devices that integrate limited computation, sensing, and radio communication capabilities. Sensor network platform for health care has been designed, fabricated and tested. This system consists of an embedded micro-controller, Radio Frequency (RF) transceiver, power management, I/O expansion, and serial communication (RS-232). The hardware platform uses Atmel ATmega128L 8-bit ultra low power RISC processor with 128KB flash memory as the program memory and 4KB SRAM as the data memory. The radio transceiver (Chipcon CC1000) operates in the ISM band at 433MHz or 916MHz with a maximum data rate of 76.8kbps. Also, the indoor radio range is approximately 20-30m. When many sensors have to communicate with the controller, standard communication interfaces such as Serial Peripheral Interface (SPI) or Integrated Circuit ($I^{2}C$) allow sharing a single communication bus. With its low power, the smallest and low cost design, the wireless sensor network system and wireless sensing electronics to collect health-related information of human vitality and main physiological parameters (ECG, Temperature, Perspiration, Blood Pressure and some more vitality parameters, etc.)

  • PDF