• 제목/요약/키워드: I/O Stack

검색결과 48건 처리시간 0.028초

고속 저장 장치를 위한 입출력 스택 최적화 (Optimizing I/O Stack for Fast Storage Devices)

  • 한혁
    • 한국콘텐츠학회논문지
    • /
    • 제16권5호
    • /
    • pp.251-258
    • /
    • 2016
  • 최근 클라우드 컴퓨팅, 사회 관계망 서비스 등의 분야에서 고속 저장 장치에 대한 수요가 크게 증가하고 있다. 성능이 우수한 고속 저장 장치가 개발되고 있지만 현재 리눅스 운영체제의 입출력 스택은 하드 디스크 드라이브를 고려해서 설계되었기 때문에 고속 저장 장치를 충분히 활용하고 있지 못하다. 이 논문에서는 고속 저장 장치의 입출력 대역폭과 입출력 지연시간을 최대로 활용할 수 있는 최적화된 입출력 스택을 제안한다. 이를 위해 기존 리눅스의 블록 입출력 계층을 새로운 인터페이스를 가지는 입출력 계층으로 대체하고 최적화한다. 제안된 입출력 계층은 기존의 하드 디스크 드라이브를 고려한 블록 계층을 우회하고 디바이스 드라이버를 최적화하여 고속 저장 장치의 성능을 최대한 이용할 수 있게 해준다. 또한, 리눅스의 ext2/ext4 파일 시스템을 제안된 입출력 계층 위에서 동작할 수 있도록 최적화하였고, 벤치마크 실험 결과를 통해서 제안하는 입출력 스택은 기존 리눅스 입출력 스택과 비교하여 1.7배 정도의 성능 향상이 있음을 확인할 수 있었다.

Implementation of Light-weight I/O Stack for NVMe-over-Fabrics

  • Ahn, Sungyong
    • International journal of advanced smart convergence
    • /
    • 제9권3호
    • /
    • pp.253-259
    • /
    • 2020
  • Most of today's large-scale cloud systems and enterprise data centers are distributing resources to improve scalability and resource utilization. NVMe-over-Fabric protocol allows submitting NVMe commands to a remote NVMe SSD through RDMA (Remote Direct Memory Access) network. It is attracting attention recently because it is possible to construct a disaggregation storage system with low latency through the protocol. However, the current I/O stack of NVMe-over-Fabric has an inefficient structure for maintaining compatibility with the traditional I/O stack. Therefore, in this paper, we propose a new mechanism to reduce I/O latency and CPU overhead by modifying I/O path of NVMe-over-Fabric to pass through legacy block layer. According to the performance evaluation results, the proposed mechanism is able to reduce the I/O latency and CPU overhead by up to 22% and 24% compared to the existing NVMe-over-Fabrics protocol, respectively.

가상화 환경에서 NVMe SSD 성능 분석 및 직접 접근 엔진 개발 (Performance Analysis of NVMe SSDs and Design of Direct Access Engine on Virtualized Environment)

  • 김세욱;최종무
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제24권3호
    • /
    • pp.129-137
    • /
    • 2018
  • 낸드 플래시 메모리 기반의 NVMe(Non-Volatile Memory express) SSD(Solid State Drive)는 멀티 I/O 큐 환경을 제공하는 PCIe 인터페이스 기반에 NVMe 프로토콜을 사용하는 저장장치이다. NVMe SSD는 Multi-core 시스템에서 병렬 I/O 처리가 가능하고 SATA SSD에 비해 대역폭이 크며 대용량의 저장 공간을 제공하기 때문에 데이터 센터, 클라우드 컴퓨팅 등에 사용될 차세대 저장장치로 주목받고 있다. 하지만 가상화 시스템에서는 소프트웨어 I/O 스택의 병목으로 인하여 NVMe SSD의 성능을 충분히 활용하지 못하고 있다. 특히, Xen과 KVM과 같이 호스트 시스템의 I/O 스택을 사용하는 경우에는, 호스트 시스템과 가상머신의 중복된 I/O 스택을 통해서 입출력이 처리되기 때문에 성능 저하가 크게 발생한다. 본 논문에서는 NVMe SSD에 직접 접근하는 기술을 KVM 가상화 시스템에 적용함으로써 가상 머신 I/O의 성능을 향상시키는 Direct-AIO (Direct-Asynchronous I/O)엔진을 제안한다. 그리고 QEMU 에뮬레이터에 제안한 엔진을 개발하고 기존의 I/O 엔진과의 성능 차이를 비교 및 분석한다.

SSD 수명 관점에서 리눅스 I/O 스택에 대한 실험적 분석 (An Empirical Study on Linux I/O stack for the Lifetime of SSD Perspective)

  • 정남기;한태희
    • 전자공학회논문지
    • /
    • 제52권9호
    • /
    • pp.54-62
    • /
    • 2015
  • 낸드 플래시 기반의 SSD (Solid-State Drive)는 HDD (Hard Disk Drive) 대비 월등한 성능에도 불구하고 쓰기 회수 제한이라는 태생적 단점을 가지고 있다. 이로 인해 SSD의 수명은 워크로드에 의해 결정되어 SSD의 기술 변화 추세인 SLC (Single Level Cell) 에서 MLC (Multi Level Cell) 로의 전환, MLC에서 TLC (Triple Level Cell) 로의 전환에 있어 큰 도전이 될 수 있다. 기존 연구들은 주로 wear-leveling 또는 하드웨어 아키텍처 측면에서 SSD의 수명 개선을 다루었으나, 본 논문에서는 호스트가 요청한 쓰기에 대해 SSD가 낸드플래시 메모리를 통해 처리하는 수명관점의 효율성을 대변하는 WAF (Write Amplification Factor) 관점에서 Host I/O 스택 중 파일 시스템, I/O 스케줄러, 링크 전력에 대해 JEDEC 엔터프라이즈 워크로드를 이용해 I/O 스택 최적 구성에 대해 실험적 분석을 수행하였다. WAF는 SSD의 FTL의 효율성을 측정하는 지표로 수명관점에서 가장 객관적으로 사용한다. I/O 스택에 대한 수명 관점의 최적 구성은 MinPower-Dead-XFS로 최대 성능 조합인 MaxPower-Cfq-Ext4에 비해 성능은 13% 감소하였지만 수명은 2.6 배 연장됨을 확인하였다. 이는 I/O 스택의 최적화 구성에 있어, SSD 성능 관점뿐만 아니라 수명 관점의 고려에 대한 유의미를 입증한다.

Numerical Simulation on Self-heating for Interlayer Tunneling Spectroscopy in $Bi_2Sr_2CaCu_2O_{8+x}$

  • Park, Jae-Hyun;Lee, Hu-Jong
    • Progress in Superconductivity
    • /
    • 제9권1호
    • /
    • pp.18-22
    • /
    • 2007
  • For interlayer tunneling spectroscopy using a small stack of $Bi_2Sr_2CaCu_2O_{8+x}$ (Bi-2212) intrinsic junctions in a high-bias range, large self-heating takes place due to the poor thermal conductivity of Bi-2212. In this study, we numerically estimate the self-heating around a Bi-2212 sample stack for I-V or dI/dV-V measurements. Our results show that the temperature discrepancy between the Bi-2212 sample stack and top Au electrodes due to bias-induced self-heating is small enough along the c-axis direction of Bi-2212. On the other hand, the lateral temperature discrepancy between the sample stack and the Bi-2212 on-chip thermometer stack can be as large as ${\sim}20\;K$ for the highest bias required to observe the pseudogap hump structure. We thus suggest a new in-situ ac thermometry, employing the Au current-bias electrode itself deposited on top of the sample stack as the resistive thermometer layer, which is supposed to allow safe temperature measurements for the interlayer tunneling spectroscopy.

  • PDF

배열을 이용한 이산대수의 사이클 검출 (Cycle Detection of Discrete Logarithm using an Array)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권5호
    • /
    • pp.15-20
    • /
    • 2023
  • 지금까지는 Pollard의 Rho 알고리즘이 대칭키의 암호를 해독하는 이산대수 문제에 대해 가장 효율적인 방법으로 알려져 있다. 그러나 이 알고리즘은 거인걸음 보폭 m=⌈${\sqrt{p}}$⌉개의 데이터를 저장해야 하는 단점과 더불어 O(${\sqrt{p}}$) 수행 복잡도를 보다 감소시킬 수 있는 방법에 대한 연구가 진행되고 있다. 본 논문은 이산대수의 사이클 검출을 위한 Nivasch의 스택 법의 데이터 갱신 횟수를 73% 이상 감소시키는 배열법을 제안하였다. 제안된 방법은 배열을 적용하였으며, (xi<0.5xi-1)∩(xi<0.5(p-1))인 경우에 한해 배열 값을 갱신하는 방법을 적용하였다. 제안된 방법은 스택법과 동일한 모듈러 연산횟수를 보였지만 스택 법에 비해 이진탐색 법을 적용하여 배열 갱신 횟수와 탐색 시간을 획기적으로 감소시켰다.

히트파이프 및 스택핀을 이용한 50W급 옥외용 LED 모듈개발 (Development of Outdoor 50W-LED Module using Heat-pipe and Stack-fin)

  • 홍석기;정희석;염정덕
    • 조명전기설비학회논문지
    • /
    • 제29권12호
    • /
    • pp.15-21
    • /
    • 2015
  • We proposed 50W-LED modules of using Heat-pipe and Stack-fin and produced LED modules was evaluated heat dissipation characteristics with comparison of the conventional die-casting type. It verified the application of products by applying it to 150W-LED road luminaires through simulation. The LED module was measures aimed design temperature of the Stack-fin and showed 26% upward heat dissipation effect than a conventional die-casting type. The luminous efficacy of 150W-LED road luminaires using this LED module reached over 112lm/W, and the simulation results showed average of horizontal luminance, overall luminance uniformity($U_O$) and lane luminance uniformity($U_I$) that is suitable for five-lane road with the KS standards.

Embedded linux kernel을 이용한 효율적인 모바일 단말 구현에 관한 연구 (The research on embody in mobile system efficiently using Embedded linux kernel)

  • 이용훈;윤원동;김영근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1601-1604
    • /
    • 2003
  • 본 논문에서는 PDA. Hand PC(HPC)등과 같은 모바일 단말에 운영체제로써 Embedded Linux를 채택하였을 경우 고려해야 할 Hardware 사양, I/O interrupt latency에 따른 성능. 스케줄링 정책에 따른 성능에 대하여 논한다. 대상 타겟으로 사용한 HPC 의 하드웨어 사양에 설명하고, Embedded Linux와의 연동에 있어서 문제점을 살펴본다. 또한 각종 I/O device들의 Interrupt latency에 따른 성능저하와 스케줄링 정책에 의한 성능저하에 대하여 분석하고. 해결 방안에 대하여 논한다. 마지막으로 실제 예로서 Mobile IPv6 S/W Stack을 이용한 실제 검증을 수행하고 성능 향상 방안을 제시한다.

  • PDF

초저지연 저장장치를 위한 적응형 폴링 선택 기법 (An Adaptive Polling Selection Technique for Ultra-Low Latency Storage Systems)

  • 천명준;김윤아;김지홍
    • 대한임베디드공학회논문지
    • /
    • 제14권2호
    • /
    • pp.63-69
    • /
    • 2019
  • Recently, ultra-low latency flash storage devices such as Z-SSD and Optane SSD were introduced with the significant technological improvement in the storage devices which provide much faster response time than today's other NVMe SSDs. With such ultra-low latency, $10{\mu}s$, storage devices the cost of context switch could be an overhead during interrupt-driven I/O completion process. As an interrupt-driven I/O completion process could bring an interrupt handling overhead, polling or hybrid-polling for the I/O completion is known to perform better. In this paper, we analyze tail latency problem in a polling process caused by process scheduling in data center environment where multiple applications run simultaneously under one system and we introduce our adaptive polling selection technique which dynamically selects efficient processing method between two techniques according to the system's conditions.