• 제목/요약/키워드: I/O 성능

검색결과 677건 처리시간 0.025초

가상화 환경에서 NVMe SSD 성능 분석 및 직접 접근 엔진 개발 (Performance Analysis of NVMe SSDs and Design of Direct Access Engine on Virtualized Environment)

  • 김세욱;최종무
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제24권3호
    • /
    • pp.129-137
    • /
    • 2018
  • 낸드 플래시 메모리 기반의 NVMe(Non-Volatile Memory express) SSD(Solid State Drive)는 멀티 I/O 큐 환경을 제공하는 PCIe 인터페이스 기반에 NVMe 프로토콜을 사용하는 저장장치이다. NVMe SSD는 Multi-core 시스템에서 병렬 I/O 처리가 가능하고 SATA SSD에 비해 대역폭이 크며 대용량의 저장 공간을 제공하기 때문에 데이터 센터, 클라우드 컴퓨팅 등에 사용될 차세대 저장장치로 주목받고 있다. 하지만 가상화 시스템에서는 소프트웨어 I/O 스택의 병목으로 인하여 NVMe SSD의 성능을 충분히 활용하지 못하고 있다. 특히, Xen과 KVM과 같이 호스트 시스템의 I/O 스택을 사용하는 경우에는, 호스트 시스템과 가상머신의 중복된 I/O 스택을 통해서 입출력이 처리되기 때문에 성능 저하가 크게 발생한다. 본 논문에서는 NVMe SSD에 직접 접근하는 기술을 KVM 가상화 시스템에 적용함으로써 가상 머신 I/O의 성능을 향상시키는 Direct-AIO (Direct-Asynchronous I/O)엔진을 제안한다. 그리고 QEMU 에뮬레이터에 제안한 엔진을 개발하고 기존의 I/O 엔진과의 성능 차이를 비교 및 분석한다.

MPI-IO의 CrownFS 지원 방안 (Supporitng for CrownFS in MPI-IO)

  • 조미옥;강봉직;최경희;정기현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.636-638
    • /
    • 2000
  • 가장 느린 서비스시템인 I/O의 성능이 전체적인 컴퓨터 시스템의 성능을 결정짓게 된다. 따라서 전반적인 시스템의 성능 향상을 위해서는 I/O의 성능이 높아져야 한다. 분산병렬환경에서 I/O의 성능을 높이기 위해서 parallel I/O를 사용한다. 하위레벨에서 최적화된 병렬 파일시스템을 사용하고, 어플리케이션 레벨에서 병렬 에플리케이션의 개발을 쉽게 해줄 수 있는 인터페이스를 사용하면 더 효과적인 parallel I/O를 구현할 수 있다. 본 논문에서는 MPI에서 병렬 파일시스템인 CrownFS를 지원하도록 하기 위해서 MPI-IO에 CrownFS를 추가하여 병렬환경에서 높은 성능을 나타낼수 있는 parallel I/O 환경을 구현한다.

  • PDF

리눅스 I/O 스케줄러에 대한 SSD 성능 분석 (A performance analysis of Solid State Disk for Linux I/O scheduler)

  • 박현찬;유혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.460-464
    • /
    • 2010
  • SSD는 뛰어난 성능으로 인해 서버 시장에서 HDD를 빠르게 대체하며 각광받고 있다. 우리는 기존 SSD의 성능 분석이 단일한 I/O 패턴에 대해서만 이루어진 점을 주목하여, 다양한 패턴의 I/O가 동시에 수행 될 경우, 성능에 어떠한 영향이 있는지 평가해보고자 한다. 이를 위해 4KB부터 64MB까지 다양한 블록크기로 순차적/임의적 읽기/쓰기 연산을 수행함과 동시에 4KB 단위의 읽기/쓰기 I/O를 수행시켜 성능에 미치는 영향을 알아보았다. 이러한 평가를 네 가지 리눅스 I/O 스케줄러에 대해 각각 수행함으로써 스케줄러에 의한 영향 또한 평가하였다. 그 결과로 우리는 새로운 SSD의 성능 특성을 발견할 수 있었으며, 이는 새로운 I/O 스케줄러 및 SSD의 FTL 개발의 기반이 되리라 예상된다.

  • PDF

병렬파일 시스템에서 I/O 대역폭 개선을 위한 이단 선반입 기법 (Two-level Prefetching method for I/O bandwidth enhancement in Parallel File System)

  • 황보준형;조종현;이윤영;서대화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.657-660
    • /
    • 2000
  • 병렬 파일 시스템은 늦은 디스크 I/O로 인한 성능 저하를 개선하기 위해 병렬 I/O를 제공한다. 이때 계산과 디스크 I/O를 중첩시키는 선반입 기법으로 디스크 I/O로 인한 성능 저하를 더욱 개선할 수 있다. 하지만 I/O 위주의 프로그램에서는 선반입으로 인하여 시스템에서 제공하는 I/O 대역폭을 넘어 최악의 경우 기존의 선반입 기법은 성능개선을 위한 최선이 될 수 없을 뿐 아니라 선반입 기법 자체가 과부하가 될 수 있다. 본 논문에서는 이런 상황을 고려하여 I/O 대역폭 개선을 위한 이단 선반입 기법을 제시하여 성능개선을 제공한다.

  • PDF

집합 I/O와 부분군 기법의 성능 분석 (An Analysis of the Performance of Collective I/Os and the Subgroup Method)

  • 차광호;조혜영;김성호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.513-516
    • /
    • 2007
  • 많은 과학 분야 응용 어플리케이션들이 대규모 데이터 처리를 수행하면서, 병렬 I/O의 중요성이 급속도로 부각되고 있다. 특히 집합 I/O는 병렬 I/O의 중요한 개념 중 하나이며, 응용 프로그래머들이 쉽게 대용량 데이터를 취급할 수 있도록 해주고 있다. 본 연구에서는 원래의 집합 I/O들과 집합 I/O를 효과적으로 쓰기 위한 방법 중 하나인 부분군 기법의 성능을 측정하고 분석하였다. 실험 결과를 통하여 두 종류의 부분군 기법이 서로 다른 성능을 보임을 확인하였다. 집합 쓰기의 경우 부분군 기법은 성능저하를 나타냈으나 집합 읽기의 경우 적은 데이터를 사용하는 경우 우수한 성능을 보여 주고 있음을 확인하였다.

  • PDF

지능형 I/O구조를 갖는 RAID 시스템의 성능 향상을 위한 연구 (A Study for High Performance of Intelligent I/O Architecture of RAID System)

  • 최귀열;박계원
    • 한국정보통신학회논문지
    • /
    • 제10권11호
    • /
    • pp.1989-1995
    • /
    • 2006
  • RAID는 디스크 배열 상에 데이터를 이중으로 저장하거나 패리티를 사용하는 기법으로 디스크에 장애가 일어났을 경우 이를 복구하는 구조로 되어 있다. 본 논문에서는 지능형 I/O 구조를 갖는 고성능 I/O 서브시스템에서 CPU로부터 대부분 I/O 작업 부하를 줄이고 동시 에 I/O 성능을 향상시키는 방안에 대하여 연구한다. 지능형 I/O 장치의 디스크 스케줄링 디자인에 관한 초당 MB 처리율, 최대 I/O 응답시간 등의 실험 통하여 새로운 스케줄링 기법 에 의해 성능을 개선한다.

Prefetch R-tree: 디스크와 CPU 캐시에 최적화된 다차원 색인 구조 (Prefetch R-tree: A Disk and Cache Optimized Multidimensional Index Structure)

  • 박명선
    • 정보처리학회논문지D
    • /
    • 제13D권4호
    • /
    • pp.463-476
    • /
    • 2006
  • R-tree는 일반적으로 트리 노드의 크기를 디스크 페이지의 크기와 같게 함으로써 I/O 성능이 최적화 되도록 구현한다. 최근에는 주메모리 환경에서 CPU 캐시 성능을 최적화하는 R-tree의 변형이 개발되었다. 이는 노드의 크기를 캐시 라인 크기의 수 배로 하고 MBR에 저장되는 키를 압축하여 노드 하나에 더 많은 엔트리를 저장함으로써 성능을 높였다. 그러나, 디스크 최적 R-tree와 캐시 최적 R-tree의 노드 크기 사이에는 수십-수백 바이트와 수-수십 킬로바이트라는 큰 차이가 있으므로, I/O 최적 R-tree는 캐시 성능이 나쁘고 캐시 최적 R-tree는 디스크 I/O 성능이 나쁜 문제점을 가지고 있다. 이 논문에서는 CPU 캐시와 디스크 I/O에 모두 최적인 R-tree, PR-tree를 제안한다. 캐시 성능을 위해 PR-tree 노드의 크기를 캐시 라인 크기보다 크게 만든 다음 CPU의 선반입(prefetch) 명령어를 이용하여 캐시 실패 횟수를 줄이고, 트리 노드를 디스크 페이지에 낭비가 적도록 배치함으로써 디스크 I/O 성능도 향상시킨다. 또한, 이 논문에서는 PR-tree에서 검색 연산을 수행하는데 드는 캐시 실패 비용을 계산하는 분석 방법을 제시하고, 최적의 캐시와 I/O 성능을 보이는 PR-tree를 구성하기 위해, 가능한 크기의 내부 단말 노드, 중간 노드를 갖는 PR-tree 생성하여 성능을 비교하였다. PR-tree는 디스크 최적 R-tree보다 삽입 연산은 3.5에서 15.1배, 삭제 연산은 6.5에서 15.1배, 범위 질의는 1.3에서 1.9배, k-최근접 질의는 2.7에서 9.7배의 캐시 성능 향상이 있었다. 모든 실험에서 매우 작은 I/O 성능 저하만을 보였다.

가상화 환경의 고성능 I/O를 위한 반가상화 라이브러리 (Para-virtualized Library for Bare-metal Network Performance in Virtualized Environment)

  • 이동우;조영중;엄영익
    • 정보과학회 논문지
    • /
    • 제41권9호
    • /
    • pp.605-610
    • /
    • 2014
  • 현재 가상화 기술은 많은 연구를 통해 다양한 분야에서 널리 쓰이고 있다. 그러나 여전히 I/O 워크로드는 가상화로 인한 성능 저하로 인하여 가상화 분야에 적용되지 못하고 있다. 이전의 많은 연구에서 가상화 I/O 과정의 모드전환과 중복된 I/O 스택을 이러한 성능 저하의 원인으로 파악하고, 이를 해결하기 위한 기법을 제안하였으나 여전히 가상화 되지 않은 환경의 물리장치에 비해 낮은 성능을 보여주었다. 본 논문에서는 가상화 라이브러리를 사용하는 새로운 I/O 가상화 기법을 제안한다. 본 제안기법은 가상화 I/O 과정에서 발생하는 모드 전환을 완전히 제거하고 게스트 운영체제의 I/O 스택을 우회함으로써 /O 성능을 향상 시킨다. 네트워크 환경을 위한 프로토타입 구현을 통해 본 제안기법은 네트워크 처리량을 169% 향상시키며 네트워크 지연을 38% 감소시킴을 확인하였다.

클라우드 환경에서 고성능 저장장치를 위한 동적 대역폭 분배 기법 (Dynamic Bandwidth Distribution Method for High Performance Non-volatile Memory in Cloud Computing Environment)

  • 권필진;안성용
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권3호
    • /
    • pp.97-103
    • /
    • 2020
  • 리눅스 Cgroups은 컨테이너 기반 클라우드 서비스 구축에서 각 컨테이너 별 시스템 자원을 할당하기 위한 핵심적인 역할을 담당하고 있다. 특히 입출력 자원의 경우 리눅스 Cgroups은 컨테이너의 가중치에 따라 입출력 대역폭을 분배하는 기법을 지원하고 있다. 그러나 성능 분석 결과에 따르면 현재 리눅스 Cgroups의 입출력 대역폭 분배 기법은 NVMe SSD와 같은 고성능 저장장치를 사용할 경우 입출력 성능이 크게 저하된다는 한계점을 가지고 있다. 따라서 본 논문에서는 리눅스 Cgroups을 위한 새로운 피드백 기반의 동적 대역폭 분배 기법을 제안하고자 한다. 제안하는 기법은 가중치에 따라 입출력 크레딧을 분배하며 고성능 저장장치의 성능 변화를 동적으로 반영해 입출력 크레딧을 계산함으로써 저장장치의 성능 저하를 최소화한다. 제안된 기법은 리눅스 커널 5.3에 구현되었으며 성능 평가 결과 정확한 입출력 대역폭 분배를 수행할 뿐만 아니라 기존 기법에 비해 최대 2배 높은 입출력 성능을 보여주었다.

Filter Driver 와 NAND FLASH Memory를 이용한 HDD 장치의 성능 개선에 관한 연구 (A Study of HDD Performance Improvement through Filter Driver & NAND FLASH Memory)

  • 김우길;김영길
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 추계학술대회
    • /
    • pp.58-61
    • /
    • 2010
  • 본 논문에서는 I/O Filter Driver 와 NAND FLASH Memory의 적용을 통한 HDD 저장장치의 느린 I/O 성능을 개선하기 위한 방법에 대해 연구했다. 반도체 부품으로서 빠른 I/O 성능을 보이는 NANDFLASH Memory의 적용과 이를 구동시키기 위한 Filter Driver (Device Driver)를 적용했으며, 이를 통해 HDD 저장장치의 향상된 I/O성능을 분석하고 개선하는 방법을 제안한다.

  • PDF