DOI QR코드

DOI QR Code

마이크로서버의 내부 연결망 성능평가

Performance Evaluation of Interconnection Network in Microservers

  • 오명훈 (호남대학교 컴퓨터공학과)
  • 투고 : 2021.10.28
  • 심사 : 2021.12.10
  • 발행 : 2021.12.10

초록

마이크로서버는 컴퓨팅 서버의 일종으로 2개 이상의 CPU 소켓을 별도의 컴퓨팅 보드에 구현하고, 다수 개의 컴퓨팅 보드를 메인 보드에 집적하는 형태를 지닌다. 클러스터 시스템을 구축하는데 있어서, 마이크로서버를 사용하면 기존의 서버를 여러 대 랙에 장착하는 방법에 비해, 에너지 효율, 상면, 관리 용이성 측면에서 이점이 있다. 또한, 마이크로서버는 컴퓨팅 보드내 CPU 소켓들, 혹은 컴퓨팅 보드끼리 별도의 내부 연결망을 사용할 수 있어서 성능 측면에서도 이점이 존재한다. 본 논문에서 제안된 마이크로서버는 4개의 CPU 소켓을 지닌 컴퓨팅 보드를 메인보드에 총 16개 장착할 수 있는 서버로 Serial-RapidIO (SRIO)를 내부 연결망으로 사용한다. 마이크로서버의 핵심 성능 이슈인 내부 연결망 측면에서의 성능 비교 분석을 위해, 상용 마이크로서버와 내부 연결망 성능을 비교하고 정량화한다. 시험 결과, 내부 연결망을 활용한 데이터 전송 시 대역폭 측면에서 최대 7배 높은 성능을 보였다. 아울러, 실제 클라우드 컴퓨팅에 사용되는 벤치마크 프로그램 적용 시험에서도 유사 CPU 성능 마이크로서버 대비 60%의 수행시간 감소 효과를 얻었다.

A microserver is a type of a computing server, in which two or more CPU nodes are implemented on a separate computing board, and a plurality of computing boards are integrated on a main board. In building a cluster system, the microserver has advantages in several points such as energy efficiency, area occupied, and ease of management compared to the existing method of mounting legacy servers in multiple racks. In addition, since the microserver uses a fast interconnection network between CPU nodes, performance improvement for data transfers is expected. The proposed microserver can mount a total of 16 computing boards with 4 CPU nodes on the main board, and uses Serial-RapidIO (SRIO) as an interconnection network. In order to analyze the performance of the proposed microserver in terms of the interconnection network which is a core performance issue of the microserver, we compare and quantify the performance of commercial microservers. As a result of the test, it showed up to about 7 times higher bandwidth improvement when transmitting data using the interconnection network. In addition, with CloudSuite benchmark programs used in actual cloud computing, maximum 60% reduction in execution time was obtained compared to commercial microservers with similar CPU performance specification.

키워드

Ⅰ. 서론

클라우드 컴퓨팅 기술은 2000년대 중반 등장하여, 멀티 코어 x86 서버의 발전과 더불어 국가 및 기업의 경쟁력 강화에 필수적인 ICT의 핵심 분야로 자리매김하고 있다. 특히 서버용 프로세서의 고성능화에 따른 프로세서 자체의 발열 및 전력 소모 증가는 프로세서 구조부터, 서버 및 클라우드 데이터 센터 설계까지 성능 및 서비스 질 향상의 걸림돌로 작용하고 있다.

클라우드 컴퓨팅 기술 기반의 데이터 센터의 효과적인 구축을 위하여 데이터 센터 내의 서버 측면에서는 다음과 같은 사항을 고려하여야 한다. 클라우드 서비스를 위한 서버를 고집적 시키는 위해서는 단위 면적에 많은 서버를 구축해야 하며, 멀티 코어 기반의 서버를 이용하거나 단위 면적당 프로세서의 수를 고집적해야 한다. 아울러, 프로세서의 고집적에 따른 전력 소비 및 발열 문제의 해결을 위하여 저전력 프로세서를 이용해야 한다.

즉, 클라우드 컴퓨팅 기반 데이터 센터의 구축을 위해서는, 고도로 집적된 초소형 서버, 단위 프로세서당 전력 소모가 낮고 효율이 높은 저전력 멀티 코어 프로세서 기반의 서버 개발이 필수적이다.

국외 유수의 프로세서 및 서버 제조업체는 이와 같은 클라우드 데이터 센터 내의 서버 요구사항을 만족시키기 위한 여러 연구를 진행해 왔다. 그 중에서 고집적, 저발열, 저전력 특성의 프로세서 기반 차세대 클라우드 컴퓨팅용 마이크로서버를 개발하고 있다. 마이크로서버는 1개 이상의 서버용 프로세서를 한 보드에 장착한 컴퓨팅 보드를 서버 메인 보드에 다수 개 설치하여 집적도와 전력 효율을 높인 서버 형태이다[1]. 전원장치, 스토리지 등의 자원들을 한 서버 내에서 공유할 수 있고, 메인 보드 수준의 연결망 속도를 기대할 수 있으므로 한 서버 내에서 여러 블레이드 서버를 운영할 수 있는 효과를 나타낼 수 있다. 특히, 최근에는 모바일 및 임베디드 시장에서 사용되던 ARM 아키텍처 기반 프로세서를 활용한 서버의 등장으로, 고집적 및 저전력 소모에 특화된 마이크로서버 제품의 다양화와 그에 따른 제품 개발이 진행되고 있다.

그러나, 프로세서의 주류인 x86, ARM 아키텍처 기반 서버의 경우, 국내의 서버 제작 벤더들은 관련 제품을 전량 수입하거나, 완성 부품들을 들여와 조립하는 기술에 의존하고 있다. 관련 기술 확보 또한 미진하여 국내 시장의 대다수를 외산 서버가 점유하고 있다.

KOSMOS (Korea Supreme Micro Server)는 국내에서 개발된 마이크로서버로, 4개의 CPU 소켓을 지닌 컴퓨팅 보드를 메인보드에 총 16 개 장착할 수 있는 형태로 제작되었다[2, 3]. 2채널 8 코어 CPU와 8G DRAM을 장착하는 경우, 512개의 다중 코어와 1 TByte 메모리 자원을 단 1대의 서버에서 활용할 수 있다. x86 뿐만 아니라 ARM 아키텍처 기반의 프로세서를 서로 호환 가능하게 사용할 수 있으며, 멀티 코어 기반 수천 개의 가상 자원 및 대규모 메모리 통합을 지원하는 시스템 소프트웨어를 제공하여 성능 최적화 및 자원 활용을 높일 수 있다.

아울러, 마이크로서버 내 컴퓨팅 보드 및 CPU 간의 데이터 전송을 위해 별도의 프로토콜 내부 연결망을 제공한다. 즉, 컴퓨팅 노드간 데이터 전송에 일반적으로 사용되는 이더넷 프로토콜 기반 연결망뿐만 아니라, Serial-RapidIO(SRIO) 프로토콜[4,5] 기반 연결망도 지원한다. 따라서, 고집적된 컴퓨팅 보드 사이에서의 원활하고 유연한 시스템 자원 활용이 가능해진다.

클라우드 컴퓨팅 기반 서비스[6]를 사용자에게 제공하기 위해서는 다수 사용자들의 요청에 따라, on-demand 방식으로 가상머신, 컨테이너 등의 자원들을 동시에 할당해야 하며, 자원의 활용률을 높이기 위해서는 물리적으로 다른 CPU의 자원들을 공유하여 서비스할 수 있어야 한다. 또한, 단순 SaaS[7,8] 형태가 아닌 빅데이터 분석, 그래프 분석, 추천 시스템 등의 다양한 데이터 처리 서비스를 제공하기 위해서는 서로 다른 CPU의 자원들을 클러스터 형태로 제공해야 한다.

따라서, 다수의 CPU가 1개의 섀시에 집적된 형태의 마이크로서버를 기반으로 클라우드 서비스를 제공할 때, 동일 CPU, 동일 소프트웨어 플랫폼을 사용한다는 가정에서는 CPU 간 데이터 전송 성능이 마이크로서버, 나아가, 전체 클라우드 컴퓨팅 시스템의 성능을 좌우할 수 있다.

본 논문에서는 마이크로서버의 핵심 성능 이슈인 내부연결망 측면에서의 KOSMOS의 성능 비교 분석을 위해, 유사 성능 스펙을 지닌 상용 마이크로서버와 내부 CPU 사이에서의 데이터 전송 성능을 측정하여 정량화하고 비교한다. 기본적으로 데이터 크기에 따른 대역폭 성능을 측정하였고, 실제 클라우드 컴퓨팅 서비스에서 사용되고 있는 응용 프로그램을 반영한 벤치마크툴을 적용한다.

Ⅱ. KOSMOS 구조

KOSMOS 하드웨어는 19인치 표준 랙 서버 폼팩터의섀시를 기반으로 마이크로서버 내부에 다양한 하드웨어 모듈로 구성된다. 그림 1은 KOSMOS 하드웨어의 구성요소를 나타낸다.

OTNBBE_2021_v21n6_91_f0001.png 이미지

그림 1. KOSMOS 하드에어 구성 요소

Fig. 1. Hardware configuration of KOSMOS

컴퓨팅 보드는 마이크로서버의 연산작업을 위한 컴퓨팅 노드 기능을 제공하며, 주로 I/O 기반의 인터페이스 (예, PCI Express)를 통해 마이크로서버의 메인보드인 베이스 백플레인에 장착된다. 1 개의 마이크로서버 내에 복수 개의 컴퓨팅 보드가 설치될 수 있으며, KOSMOS 에는 최대 16 개의 컴퓨팅 보드를 장착 가능하다. 아울러, 1 개의 컴퓨팅 보드에는 4 개의 CPU를 설치할 수 있다.

저장 장치는 마이크로서버의 데이터 및 OS를 포함한 소프트웨어를 저장하는 하드 디스크 혹은 SSD 기반 스토리지로, 컴퓨팅 보드의 각 CPU 별도 1 개씩 할당되어, KOSMOS에는 최대 64 개의 개별 저장장치가 제공된다.

스토리지 백플레인(Storage Backplane)은 저장 장치를 물리적으로 장착할 수 있으며, 컴퓨팅 보드에서 저장장치로의 연결을 제공한다. 베이스 백플레인(Base Backplane)은 마이크로서버의 컴퓨팅 보드, 연결망 모듈, 스위치 모듈, 관리 모듈, 냉각 장치가 장착되며 각 구성 요소의 데이터 및 제어 신호를 연결한다.

스위치 모듈과 연결망 모듈은 KOSMOS 내 컴퓨팅 보드 간, 그리고, 컴퓨팅 보드 내 CPU 간 연결망을 제공한다. 그중, 스위치 모듈은 마이크로서버 내에 일반적인 서버에서 흔히 사용되는 이더넷 프로토콜 (파란색 화살표 참고) 기반의 네트워크를 구성하고, 마이크로서버와 외부 인터넷 연결을 제공한다. 연결망 모듈은 다수의 컴퓨팅 보드와 CPU를 SRIO (빨간색 화살표) 기반으로 상호연결하여 고속/고성능 데이터 전송을 가능하게 한다.

관리 모듈은 마이크로서버 내 모든 모듈 및 장치들의 동작에 필요한 제어 신호를 발생시킨다. 또한, 마이크로서버 외부의 관리 서버에서 마이크로서버 내 모든 모듈들을 관리할 수 있도록 관리모듈은 IPMI와 같은 네트워크 통로를 제공한다.

전원 장치는 마이크로서버의 각 구성 요소에 파워 백 플레인(Power Backplane)을 통해 전원을 분산 공급하며, 냉각 장치는 마이크로서버 하드웨어의 냉각을 위해 팬(Fan) 장치가 장착된다.

마지막으로, 패널 모듈은 마이크로서버의 각종 상태를 손쉽게 모니터링하기 위한 소형 조작 패널로 스토리지백플레인의 통로를 이용하여, 마이크로서버 전면에 부착된다.

그림 2는 마이크로서버의 섀시를 걷어 낸 KOSMOS 의 측면 이미지를 나타낸다. 중앙에 컴퓨팅 보드가 위치하고 KOSMOS 전면에는 스토리지 백플레인과 저장 장치, 패널 모듈이 위치한다. KOSMOS 후면에는 연결망 모듈, 스위치 모듈, 관리 모듈이 위치하고, 이들은 베이스 백플레인을 통해 서로 연결되어 통신한다. 전원 장치와 냉각장치는 후면에 위치해 있으며, 파워 백플레인에는 전원 분배를 위해 KOSMOS 내 모든 장치, 모듈들이 연결되어 있다.

OTNBBE_2021_v21n6_91_f0002.png 이미지

그림 2. KOSMOS 측면 이미지[9]

Fig. 2. KOSMOS side view[9]

그림 3은 제작된 KOSMOS의 상면 뷰를 나타내고 있다. 크게 저장장치와 컴퓨팅 보드, 연결망, 스위치, 관리 모듈 공간으로 구분되어 있으며, 베이스 백플레인, 파워 백 플레인, 전원 장치는 아래에 위치한다.

OTNBBE_2021_v21n6_91_f0003.png 이미지

그림 3. KOSMOS 상면 이미지[9]

Fig. 3. KOSMOS top view[9]

Ⅲ. 비교 대상 및 실험 방법

KOSMOS는 내부에 이더넷 기반 네트워크와 SRIO 기반의 네트워크를 지원하며, 이더넷은 1G, 2.5G를 모두 지원한다. 따라서, 이더넷 1G, 2.5G와 SRIO의 3가지 측정 카테고리를 기반으로 성능을 측정한다. 아울러, 비교 대상은 마이크로서버 형태의 실제 제품군인 HP 사의 MoonShot[10]과 Supermicro사의 MicroBlade[11]이며, 이들 제품군이 내부 CPU로 ATOM[12]을 사용하고있으므로, 성능 시험 대상으로 KOSMOS의 ATOM 버전을 사용한다.

표 1에서는 본 논문에서 시험하는 대상군들의 스펙을 정리한다. MicroBlade와 KOSMOS는 사용된 ATOM 프로세서가 유사하여 다른 스펙 또한 유사하다. MoonShot의 경우 다른 2 개의 비교군 보다 코어 수와 캐시 크기 측면에서 절반 수준이며, 이는 HP MoonShot 그리고, MicroBlade와 KOSMOS에 사용되는 CPU의 종류가 상이하기 때문이다. 특이한 점은 KOSMOS의 경우, 다른 마이크로서버에 비해 SRIO 기반 전용 내부망이 이더ㄷ넷 외에 별도로 존재한다는 점이다.

표 1. 비교 마이크로서버 기본 스펙

OTNBBE_2021_v21n6_91_t0001.png 이미지

Table 1. Basic Specification for microservers

실험으로는 기본적으로 CPU와 CPU 사이에서의 데이터 전송 시 대역폭을 측정하며, 측정툴로는 iPerf[13]와 NetPerf[14]를 사용한다.

또한, 마이크로서버의 주요 응용 분야인 클라우드 컴퓨팅 벤치마크 프로그램인 CloudSuite[15]를 사용한다. CloudSuite는 다양한 클라우드 서비스를 도커기반으로예제 형태의 이미지를 배포하여 실행할 수 있으며, 크게 2 가지의 응용 프로그램으로 구성된다.

Offline 벤치마크 프로그램은 대규모의 데이터 셋으로 기계학습 알고리즘을 수행하며, 실시간 제약사항이 없고 주어진 입력 데이터에 따라 결과를 출력하는 데까지의 수행 시간을 측정한다. Online 벤치마크 프로그램은 대규모의 데이터 셋으로 클라이언트에서 서버 쪽으로 서비스를 요청하여 특정 서비스가 수행될 때의 실시간 대역폭을 측정한다.

따라서, CloudSuite 내 Offline 벤치마크 프로그램은 멀티 노드(혹은 CPU) 환경기반으로 한 개의 마스터 노드와 다수의 슬레이브 노드를 구성하여 슬레이브 노드들에게 오퍼레이션을 분산시켜 실행 후 마스터 노드에서 결과 값을 취합하는 형태로 동작한다. Online 벤치마크 프로그램은 멀티 노드 환경에서는 서버 쪽에 다수의 멀티노드를 할당하여 서버의 load를 분산시킬 수 있다.

마이크로서버는 다수의 컴퓨팅 자원을 지원하며, 물리적인 노드들을 애플리케이션에 따라 동적으로 구성하여 수행할 수 있다. 따라서, 본 논문에서도 실제 사용 환경을 반영하여 CloudSuite의 개별 벤치마크 프로그램의 특성에 따라, 단일 마스터 노드, 다수 슬레이브 노드 형태로 구성하여 실행한다. 즉, KOSMOS와 비교 대상 (Moonshot, MicroBlade) 간의 슬레이브 노드 수에 따라 성능 비교가 가능하다.

본 논문에서는 CloudSuite의 Offline 계열의 Data Analytics, Graph Analytics, In-Memory Analytics 를 적용하여 실험하였으며, 마스터 노드 및 다수의 슬레이브 노드 구성 시 도커 swarm 모드[16]를 사용하였다.

Ⅳ. 실험 및 결과

그림 4는 각 마이크로서버의 CPU간 데이터 전송 시데이터의 크기에 따른 대역폭을 나타낸다. KOSMOS의경우 데이터 전송 시 내부 연결망으로 Ethernet (KOSMOS_ETH)과 SRIO(KOSMOS_SRIO)프로토콜을선택하여 사용할 수 있으므로 이 두 가지의 경우와 대조군인 Moonshot, MicroBlade를 각각 비교한다.

OTNBBE_2021_v21n6_91_f0004.png 이미지

그림 4. 대역폭 측정 결과 비교 그래프

Fig. 4. Measurement results for bandwidth

전송 데이터의 크기가 4 Kbyte 이상에서는 모든 케이스가 변화가 없었으며, 4 Kbyte의 결과치에 모두 수렴하였다.

전송되는 데이터의 크기가 128 byte 이하에서는 KOSMOS 두 케이스 모두 MicroBlade 보다 다소 성능이 떨어지며, 128 byte의 경우 KOSMOS가 MicroBlade 에 비해 16. 7% 성능이 떨어진다. 그러나, 512 byte 부터는 KOSMOS_SRIO 케이스가 MicroBlade에 비해 최소 111.3 %(512 byte)에서 최대 214.6 %(4Kbyte)까지우수한 성능을 나타내었다. 이 구간에서는 KOSMOS_ETH 케이스와 MicroBlade는 유사한 성능을 보이는 것으로 측정되었다. KOSMOS와 Moonshot 을 비교해 보면, 전 영역에서 KOSMOS가 우수하며, 4 Kbyte 데이터에서 676.4 %의 성능이득이 있음을 알 수 있다.

512 byte 이상에서 MicroBlade와 KOSMOS_ETH 는 유사한 성능이 측정된 이유는 기본적으로 KOSMOS_ETH 케이스와 MicroBlade가 2.5G 이더넷을 사용하여, 둘다 동일한 내부 연결망의 스펙을 가지고 있기 때문이다. 유사한 이유로 Moonshot이 1G 이더넷을 채용하고 있으므로, 나머지 세 케이스보다 낮은 성능을 보인다.

또한, 512 byte 이상에서 KOSMOS가 MicroBlade, Moonshot에 비해 각각 대략 3배, 7배의 성능 이득을 나타내는 이유는 기본적으로 KOSMOS가 내부 연결망으로 SRIO를 사용하여, 포트당 5Gbps급의 PCI Express 를 통해 고속 전송이 가능하기 때문이다.

그림 5는 단일 컴퓨팅 보드 내에서 한 개의 마스터 노드, 한 개의 슬레이브 노드, 즉, 마스터-슬레이브를 1 대 1로 구성하였을 때, CloudSuite 벤치마크 프로그램을 수행시키고 KOSMOS의 수행시간을 1로 했을 때의 각 비교군의 상대 수행 시간을 나타내고 있다.

OTNBBE_2021_v21n6_91_f0005.png 이미지

그림 5. 단일 컴퓨팅 보드에서의 1대 1 구성 기반 CloudSuite 상대 수행 시간

Fig. 5. Relative completion time for CloudSuite in 1-to-1 configuration in a single computing board

Moonshot의 경우 CPU 자체의 성능 스펙이 낮고 그림 4에서와 같이 이더넷 기반 연결망의 성능이 낮아 상대적으로 KOSMOS 대비 최대 3.5배 더 느리게 측정되었다. KOSMOS와 유사한 CPU 성능 스펙을 갖는 MicroBloade의 경우, Data Analytics의 경우는 거의 유사한 수행 시간을 보였으나, Graph Analytics, In-Memory Analytics의 경우 각각 1.2배 1.6배 더 느린 수행시간이 측정되었다. 이는 단일 컴퓨팅 보드 내에서도 내부 연결망으로 노드끼리 데이터 전송이 이루어지며, 여기에서 KOSMOS의 SRIO가 성능 이득에 기여하기 때문이다.

단일 컴퓨팅 보드 이외에, 다수의 컴퓨팅 보드 간의 노드들 사이에서 마스터-슬레이브의 1-to-다수 구조를 구성하되, 슬레이브의 수를 1, 2, 4, 6으로 변경하여 실험하였다. 표 2는 Data Analytics을 수행하였을 때, 다수 컴퓨팅 보드 간 노드들 구성에 따른 수행 시간을 나타낸다.

표 2. 다수 컴퓨팅 보드 환경에서의 Data Analytics 수행시간

OTNBBE_2021_v21n6_91_t0002.png 이미지

Table 2. Completion time for Data Analytics benchmark program at multi-computing board

Data Analytics는 기본적으로 Wikipedia의 정보를 가지고 기계 학습 타스크 분석에 필요한 맵리듀스 프레임워크를 가정하여, 특정 분류에 속하는 단어 수를 추출하는 벤치마크 프로그램이다. 슬레이브 노드에 기계 학습 타스크 분석에 필요한 작업을 분산시켰다. Moonshot의 경우 슬레이브의 수가 증가함에 따라 수행 시간 감소 경향이 있었으나, MicroBlade나 KOSMOS의 경우는 증감 현상이 없었다. 이는 실제 슬레이브의 개별 기계 학습 타스크 분석 보다 하둡에서의 슬레이브 타스크 분류 들의 작업량이 훨씬 크기 때문이다. 아울러, MicroBlade와 KOSMOS는 1 대 6 구조에서 각각 311만초, 282만 초로 측정되어, MicroBlade가 KOSMOS보다 10.4 % 더 늦게 수행된다.

표 3은 트위터 데이터 세트를 사용하여 페이지랭킹의 수행 시간을 측정하는 Graph Analytics의 수행 결과이다. 그래프 내 노드에서의 가중치 계산을 위한 슬레이브를 증가시킬수록 수행 시간이 감소됨을 알 수 있었다. KOSMOS 대비 Moonshot은 수행 시간이 최대 261.3% 더 많았으며, MicroBlade도 43.6% 더 오래 걸렸다. 즉, 마스터-슬레이브 구조에서 마스터와 슬레이브 간의 데이터 전송이 Data Analytics 보다는 더 많이 이루어지며, 연결망의 성능이 우수한 KOSMOS에서 그만큼 이득을 얻고 있음을 알 수 있다.

표 3. 다수 컴퓨팅 보드 환경에서의 Graph Analytics 수행시간

OTNBBE_2021_v21n6_91_t0003.png 이미지

Table 3. Completion time for Graph Analytics benchmark program at multi-computing board

표 4는 9066개의 영화와 671명의 사용자로부터의 100004 개 rating 정보를 사용한 영화 추천 알고리즘을 수행하는 In-Memory Analytics 벤치마크 프로그램을 수행한 결과이다.

표 4. 다수 컴퓨팅 보드 환경에서의 In-Memory Analytics 수행 시간

OTNBBE_2021_v21n6_91_t0004.png 이미지

Table 4. Completion time for In-Memory Analytics benchmark program at multi-computing board

표 2, 표 3과는 다르게, 모든 비교군에서 전반적으로 슬레이브가 증가함에 따라 수행 시간이 증가한다. 이는 추천 시스템에서 마스터가 각 슬레이브에 분배해야 하는 데이터(rating 행렬, 사용자/아이템 벡터 등) 추출의 오버헤드가 슬레이브에서 수행하는 행렬 factorization보다 큰 것으로 분석된다. 그러나, 마스터, 슬레이브 노드 간의 데이터 전송 측면에서는 KOSMOS가 우수함을 알 수 있었다. 즉, KOSMOS 대비 Moonshot의 수행 시간의 증가폭은 최대 225.5 % 였으며, 내부 연결망을 제외한 성능 스펙이 유사한 MicroBlade와 비교했을때도 MicroBlade가 KOSMOS보다 최대 59.5 %로 더 긴 수행 시간을 나타내었다.

Ⅴ. 결론

클라우드 컴퓨팅 기반 데이터 센터에 설치되는 개별서버를 대체할 수 있는 마이크로서버로서 KOSMOS는내부 연결망으로 기존의 이더넷 이외에 SRIO를 별도로 구현하였다. 본 논문에서는 KOSMOS의 내부 연결 망의 성능 기여 요소를 입증하기 위해 타 마이크로서버들의 내부 연결망 측면에서의 성능을 비교 평가하였다. 상용제품인 Moonshot과 MicroBlade를 대상으로 가변 데이터 전송 시 대역폭과 실제 클라우드 서비스에 사용되는 CloudSuite 벤치마크 프로그램을 적용하여 실험하였다. 512 byte 이상에서 KOSMOS는 MicroBlade에 비해 최대 214.6 %의 대역폭 성능 개선 효과를 나타내었다. CloudSuite 적용 실험에서도 유사 CPU 성능 스펙을 지닌 MicroBlade가 KOSMOS에 비해, 하둡-멥리듀스, 그래프 분석, 추천 시스템 응용에 대해 각각 10.4%, 43.6%, 59.5% 더 큰 수행시간을 나타내었고, 이는 KOSMOS의 SRIO 기반의 내부 연결망이 실제 클라우드응용에서도 마이크로서버 전체 성능 개선에 기여하고 있음을 반증한다.

참고문헌

  1. S. S.-D. Xu and T.-C. Chang, "A Feasible Architecture for ARM-Based Microserver Systems Considering Energy Efficiency," IEEE Access, Vol. 5, pp. 4611-4620, Jan. 2017. DOI: https://doi.org/10.1109/ACCESS.2017.2657658
  2. ETRI develops microserver with 10-fold greater density and extremely low power consumption, https://www.mk.co.kr/news/english/view/2017/08/551867/
  3. W. Kwon and H. Kim, "Low power and high density Microserver," Proc. of IEEK Fall Conference, pp. 69-72, Nov. 2017.
  4. Z. Jingchao, Q. Liyan, and C. Liqun, "Development of serial RapidIO high-speed data transmission based on VPX bus," Proc. of 14th IEEE International Conference on Electronic Measurement & Instruments (ICEMI) DOI: https://doi.org/10.1109/ICEMI46757.2019.9101789
  5. RapidIO Specifications, https://rapidio.org/rapidio-specifications/
  6. K.-S. Jang, S.-J. Shin, and J. Jung, "A Study on Recognization for Quality Importance of Cloud Services," The Journal of The Institute of Internet, Broadcasting and Communication, Vol. 15, No. 2, pp. 39-44, Apr. 2015. DOI: http://doi.org/10.7236/JIIBC.2015.15.2.39
  7. D.-H. Lim et al., "Secure System for SaaS Implementation Without Data Trusting," The Journal of Korean Institute of Information Technology, Vol. 14, No. 9, pp. 71-81, Sep. 2016. DOI: http://doi.org/10.14801/jkiit.2016.14.9.71
  8. G.-S. Lee, J. Choi, S.-J. Kang, S. Park, and J.-J. Lee, "Development of SaaS cloud infrastructure to monitor conditions of wind turbine gearbox," Journal of the Korea Academia-Industrial cooperation Society, Vol. 19, No. 9, pp. 316-325, 2018. DOI: https://doi.org/10.5762/KAIS.2018.19.9.316
  9. H. Kwon, W. Kwon, M.-H. Oh, and H. Kim, "Signal integrity analysis of system interconnection module of high-density server supporting serial RapidIO," ETRI Journal Wiley Online Library, Apr. 2019. DOI: https://doi.org/10.4218/etrij.2018-0021
  10. HP Mootshot, https://www.hpe.com/us/en/servers/moonshot.html
  11. Supermicro MicroBlade, https://www.supermicro.com/en/products/microblade/
  12. Intel Atom Processor Family, https://www.intel.com/content/www/us/en/products/details/processors/atom.html
  13. iPerf - The ultimate speed test tool for TCP, UDP and SCTP, https://iperf.fr
  14. Netperf Homepage, https://https://hewlettpackard.github.io/netperf/
  15. A Benchmark Suite for Cloud Services, http://cloudsuite.ch/
  16. Swarm mode overview, https://docs.docker.com/engine/swarm/