• 제목/요약/키워드: NUMA

검색결과 50건 처리시간 0.031초

CC-NUMA 시스템을 위한 다중 스레드 프로세스의 노드 스케줄링 설계 및 구현 (The Node Scheduling of Multi-Threaded Process for CC-NUMA System)

  • 김정녀;김해진;이철훈
    • 한국정보처리학회논문지
    • /
    • 제7권2호
    • /
    • pp.488-496
    • /
    • 2000
  • 본 논문에서는 여러 개의 노드가 상호연결망으로 연결되어 각각의 메모리를 공유하는 CC-MUMA 시스템인 고성능 멀티미디어 서버(MX-Server)상에서 다중 스레드 프로세스의 노드 스케줄링 설계 및 구현 내용을 소개한다. 고성능 멀티미디어 서버의 컴퓨팅 서버용 운영체제인 COSMIX(cache COherent Shared Memory unIX)에서는 서버의 플랫폼에 알맞은 하드웨어 및 시스템 관련하여 CC-NUMA 시스템에 적합한 운영체제 기능을 설계하였다. 고성능 멀티미디어 서버는 최대 8개까지의 노드로 구성된 CC-NUMA 시스템으로 각 노드들은 SCI ring으로 연결된다. 이러한 CC-NUMA 구조의 시스템에서 데이터의 지역성을 고려한 노드 스케줄링 방식으로 Oracle8i와 같은 DBMS의 성능을 높이고자 한다. 고성능 멀티미디어 서버에서는 데이터의 저역성을 고려하여 한 노드에 프로세스를 바인드 하는 기능이 있으나, 그중 다중 스레드로 구성된 프로세스의 바인드 기능은 없다. Oracle 8i와 간츤 DBMS에서는 다중 스레드로 구성된 하나의 프로세스가 일정한 디스크를 점유하여 사용할 수 있으므로 이와 같은 다중 스레드의 프로세스를 해당 디스크가 있는 하나의 노드 즉 cg에 마인드 하는 기능을 구현하였다. 현재는 가용한 플랫폼이 없어서 MX Server 대신 PC 테스트베드를 이용한 CC-NUMA 시스템의 시뮬레이션 환경을 구축하여 다중 스페드의 CG 바인드 기능을 개발하고 그 시험을 완료하였다.

  • PDF

NUMA 시스템 가상화 환경에서 메모리 접근 지연을 줄이기 위한 VCPU 스케줄링 기법 (A NUMA-aware VCPU Scheduling for Reducing Memory Access Latency in Virtualized Environments)

  • 김정훈;김지홍;엄영익
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.265-267
    • /
    • 2012
  • 최근 들어, 하드웨어 플랫폼은 다수의 코어 아키텍처의 메모리 대역폭을 유지하기 위해 NUMA 구조로 설계되고 있다. 이러한 NUMA 시스템 구조에서 다른 노드의 메모리에 접근할 경우, 더 많은 시간과 비용이 소모된다. 따라서 이를 고려한 스케줄링 기법들이 가상화 혹은 가상화되지 않은 시스템 환경에서 연구되고 있다. 하지만, 아직까지 NUMA 시스템 가상화 환경에서 리모트 접근을 제거함과 동시에 이에 따른 오버헤드를 최소화하는 연구는 없었다. 따라서 본 논문에서는 이러한 환경에서 메모리 접근 지연을 줄이기 위한 VCPU 스케줄링 기법을 제안한다. 본 기법은 노드별 페이지 테이블 관리, LRU 기반 게스트 스케줄러, 캐시 오염 태스크 전용 버퍼 관리 기술을 이용한다. 다른 기법들과의 비교 및 분석 결과에서 알 수 있듯이, 본 기법을 적용할 경우 NUMA 시스템 노드 간 리모트 접근을 없애고, 이에 따른 오버헤드를 최소화하며, 주어진 하드웨어 캐시를 효율적으로 사용할 수 있다.

NUMA affinity를 고려한 Workload Consolidation 연구 (A study of workload consolidation considering NUMA affinity)

  • 서동유;김신규;최찬호;엄현상;염헌영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.204-206
    • /
    • 2012
  • SMP(Symmetric Multi-Processing)는 Shared memory bus 를 사용함으로써 scalability 가 제한적이었다. 이런 SMP의 scalability 제한을 극복하기 위해 제안 된 것이 NUMA(Non Uniform Memory Access)이다. NUMA는 memory bus 를 CPU 별 local 하게 가지고 있어 자신이 가지는 memory 영역에 대해서는 다른 영역을 접근하는 것 보다 더 빠른 latency 를 가지는 구조이다. Local 한 memory 영역의 존재는 scalability를 높여 주었지만 서버 가상화 환경에서 VM을 동적으로 scheduling 을 하였을 때 VM의 page 가 실행되는 core 의 local 한 메모리 영역에 존재하지 않게 되면 remote access로 인해 local access보다 성능이 떨어진다. 이 논문에서는 서버 가상화 환경에서 최신 architecture인 AMD bulldozer에서 NUMA affinity가 위반되었을 때 발생하는 성능 저하와 어떤 상황에서 이런 NUMA affinity가 위반되어도 성능저하가 없는지 연구하였다.

다중 프로그램 환경에 적합한 이중 연결 CC-NUMA 시스템 (A dual-link CC-NUMA System Tolerant to the Multiprogramming Environment)

  • 서효중
    • 정보처리학회논문지A
    • /
    • 제11A권3호
    • /
    • pp.199-206
    • /
    • 2004
  • 다중 프로세서 시스템에서 여러 개의 프로그램이 동시에 수행될 경우의 프로그램 수행 성능은 각 프로세스를 어떠한 물리적 위치의 프로세서에 할당하여 수행하는가에 따라 다르게 나타난다. 일반적으로 시공간적으로 인접한 프로세서에 동일 프로그램의 프로세서를 할당할 경우 프로세스간 통신비용이 절감되므로 가장 효율적인 결과를 얻을 수 있다. 그러나 프로세스를 할당하는 운영체제는 이와 같은 친화성을 고려하기 위하여 부가적인 처리를 필요로 하며, 실제 수행시 각 프로그램은 독립적으로 수행되므로, 여러 프로그램으로부터 발생한 프로세스를 할당하는 방법은 많은 계산을 필요로 한다. 이중 링 구조의 CC-NUMA 시스템의 경우 특히 다수의 공유 메모리 접근에 의한 많은 트랜잭션이 발생하며, 연결망 부하의 불균등에 따른 병목 현상을 나타내므로, 프로세스의 할당 정책에 따라서 큰 성능 차이를 나타내게 된다. 본 논문은 규일한 연결망 부하특성을 나타내며, 프로세스 할당 정책을 필요로 하지 않는 CC-NUMA 시스템을 제시한다. 논문에서 제시하는 구조는 이중 링 구조와 동일한 연결망 비용을 나타내며, 건너뜀 연결을 이용한 균등한 부하 분배를 수행함으로써 프로세스 할당 정책의 유무와 무관한 성능을 보이다. 프로그램 구동 시뮬레이션을 통한 검증 결과 시스템은 이중 링 구조의 CC-NUMA 시스템에 비하여 1.5배의 성능 개선을 나타냈다.

코달링 구조의 CC-NUMA 시스템을 위한 원격 캐쉬 교체 정책 (A Remote Cache Replacement Policy for the Chordal Ring Based CC-NUMA System)

  • 김수한;김인석;김봉준;장성태
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권11호
    • /
    • pp.643-657
    • /
    • 2004
  • Chordal Ring 구조의 CC-NUMA 시스템은 그 구조적 특징 때문에 지역 노드와 원격 노드사이의 트랜잭션 전송을 위해 지나가는 링크의 수가 많게 된다. 그러나, 이러한 트랜잭션이 코달 링보다 링 링크로 몰리는 경향은 링 링크의 트래픽 증가와 응답 지연 시간의 증가를 유발하게 되면서 Chordal Ring 구조의 CC-NUMA 시스템의 성능을 하락시킨다. 이러한 문제론 극복하기 위해서 본 논문에서는 원격 캐쉬를 교체할 경우에 지역 노드와 원격 노드사이에 데이타 전송을 위하여 지나가는 총 링크 수와 링 링크의 수를 고려한 새로운 원격 캐쉬 교체 정책을 제안한다. 본 논문에서 제안하는 원격 캐쉬 교체 정책은 Chordal Ring 구조의 CC-NUMA 시스템의 특징을 반영하였기 때문에 링크간의 데이타를 적절히 분산시킬 수 있는 정책이라 사료된다.

단일 공유 메모리를 가지는 다중 프로세서 시스템의 원격 캐시 일관성 유지 프로토콜 (A Remote Cache Coherence Protocol for Single Shared Memory in Multiprocessor System)

  • 김성운;김보관
    • 전자공학회논문지CI
    • /
    • 제42권6호
    • /
    • pp.19-28
    • /
    • 2005
  • 다중 프로세서 구조는 컴퓨터 성능을 향상시키기 위한 좋은 방법이다. 물리적으로 분산된 메모리를 단일 공유 메모리 공간으로 제공하는 CC-NUMA(Cache Coherent Non-Uniform Memory Access) 시스템은 다중 프로세서 컴퓨터 시스템으로 널리 사용된다. CC-NUMA는 공유 메모리 지원을 위해 풀맵 디렉토리를 가지며, 빠른 원격 메모리 접근을 위해 원격 캐시 메모리를 사용한다. 본 논문은 CC-NUMA 시스템을 구성할 수 있는 프로세싱 노드 구조와 이러한 구조에 적합한 캐시 일관성 유지 프로토콜을 제안하여, 대량의 프로세서를 이용한 다중 프로세서 시스템의 구성을 용이하게 한다. 끝으로 제안된 프로토콜에 따른 시스템 구현 결과도 제시한다.

다중 컴퓨터 CC-NUMA 시스템의 진단 프레임웍 설계 (The Design of Diagnostic Framewok for Multi-Computer CC-NUMA Systems)

  • 김주만;정낙주;정태일
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.84-86
    • /
    • 1999
  • 본 논문은 CC-NUMA 시스템과 같은 다중 컴퓨터 시스템에서 분산된 자원에 대한 효율적인 관리 및 진단을 위한 프레임웍의 설계에 대해 기술한다. CC-NUMA 시스템이란 고성능 상호 연결 망에 결합되어 하드웨어 방식으로 메모리 일관성을 제공하는 다중 컴퓨터이다. 이러한 시스템은 주로 엔터프라이즈 서버용으로 사용되기 때문에 TCO(Total Cost of Ownership)에 근거한 관리 및 지난 기능이 필수적으로 요구된다. 본 연구는 고성능 멀티미디어 서버(MX-Server)의 진단 및 관리 기능으로 제공되는 SDC(Server Diagnositc Card)의 하드웨어 및 소프트웨어 구조 설계 시 고려사항에 대하여 논하였다.

  • PDF

리피터 노드를 이용한 Scalable CC-NUMA 시스템 (Scalable CC-NUMA System using Repeater Node)

  • 경진미;장성태
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권9호
    • /
    • pp.503-513
    • /
    • 2002
  • CC-NUMA구조에서는 원격 메모리에 대한 접근이 불가피한 구조적인 특성 때문에 상호 연결망이 성능을 좌우하는 큰 변수로 작용한다. 기존에 사용되는 버스는 대역폭의 한계와 물리적 확장성 때문에 대규모의 시스템에는 적합하지 않다. 이를 대체하는 고속의 지점간 링크를 도입한 이중 링 구조는 이러한 버스의 한계를 극복하고는 있지만 많은 노드를 거쳐야 하는 문제로 인해 응답 지연 시간이 증가하는 단점을 안고 있다. 본 논문에서는 요청과 응답 패킷의 지연 시간을 줄이는 방안으로 리피터 노드를 이용한 다중 링을 제안한다. 제안된 시스템은 링과 링 사이의 구조가 대칭형을 이루고 있어 요청을 내보내는 링을 제외한 다른 링의 hop수는 똑같은 수치를 갖고 있으며, 이중 링에 비해 최대의 hop수와 최소의 hop수의 차가 적고 평균 hop수 또한 적어 좋은 성능을 보인다. 본 논문에서는 또한 이러한 구조를 유지하기 위한 리피터 노드의 구조를 제안하며 리피터 노드의 구조와 노드의 확장에 따른 다양한 성능을 확률 구동 시뮬레이터를 사용하여 평가를 수행한다.

CC-NUMA 시스템에서의 프로세싱 노드간 네트워크 부하 분석 (Analysis of Network Communication Overhead Among Processing Nodes in CC-NUMA System)

  • 김태균
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
    • /
    • pp.609-611
    • /
    • 2000
  • CC-NUMA 시스템은 SMP 시스템의 장점인 프로그래밍의 편리함, 작업 환경의 유연함 및 관리의 용이함 등을 유지하는 한편, SMP의 단점이었던 확장성까지 제공한다. 더욱이 메모리 장벽 즉 급격히 빨라지는 프로세서의 처리 속도에 비해 메모리의 속도는 거의 변화가 없음으로 인하여 야기되는 문제를 극복할 수 있는 구조적인 대안으로 각광받고 있다. 이러한 CC-NUMA 시스템은 노드간의 논리적인 거리가 길기 때문에 프로세싱 노드간의 통신이 시스템의 성능에 영향을 미치는 가장 핵심 요소가 된다. 따라서 노드간의 통신을 최소화 해주기 위한 노력으로 각 노드에 장착되어지는 원격 캐쉬의 중요성이 강조된다. 본 논문에서는 CC-NUMA 시스템에서는 노드간 데이터 통신의 유형을 파악하고, 원격 캐쉬의 블록 사이즈에 따른 이들의 발생횟수의 변화를 분석하였다. 인스트럭션 시뮬레이터인 CacheMire와 II 벤치마크 중 하나인 FFT를 이용하여 실행-구동 시뮬레이션을 통해 원격캐쉬 블록의 크기가 증가할수록 노드간 통신의 횟수는 물론 전송되는 데이터의 절대적인 양이 감소한다는 사실을 알 수 있었다.

  • PDF

NUMA 환경에서 메모리 친화력을 고려한 부하 균등 모델 (Memory Affinity based Load Balancing Model for NUMA System)

  • 윤대석;박희권;최종무
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.346-350
    • /
    • 2008
  • AMD에서 사용한 HyperTransport 기술 기반 다중 처리기가 좋은 성능을 보이면서 최근 NUMA(Non Uniform Memory Access) 환경에 대한 관심이 증가하고 있다. 본 논문에서는 NUMA 시스템을 위한 부하균등 모델을 제안한다. 다중 처리기 시스템에서 운영체제는 특정 처리기에 부하가 많아지는 것을 부하가적은 처리기로 나누어 주기 위해 부하 균등 기법들을 가지고 있다. 이런 부하 균등 기법은 처리기가 가지고 있는 태스크 개수에 의존적인 연구가 많다. 본 연구에서는 NUMA 시스템의 메모리 접근 비용이 위치에 따라 다른 것을 반영한 부하 균등 기법의 모델을 제시한다. 이를 위해 모의 실험 환경을 구축하고 특정 상황들에 대한 실험을 통해 증명한다.

  • PDF