• 제목/요약/키워드: 멀티코어

검색결과 413건 처리시간 0.024초

멀티큐 SSD를 위해 멀티코어 확장성을 제공하는 공정한 입출력 스케줄링 (Multi-core Scalable Fair I/O Scheduling for Multi-queue SSDs)

  • 조민정;강형석;김강희
    • 정보과학회 논문지
    • /
    • 제44권5호
    • /
    • pp.469-475
    • /
    • 2017
  • 최근에 제안된 NVMe 기반의 멀티큐 SSD는 여러 개의 코어들이 전담 큐들을 통해 병렬적으로 입출력을 수행함으로써 높은 SSD 대역폭을 제공한다. 이러한 멀티큐 SSD에 대해서 입출력 응용마다 대역폭 지분을 제공하기 위해서는 각 코어에게 대역폭 지분을 제공하는 것이 요구되며, 이를 위한 공정지분 스케줄링이 필요하다. 본 논문은 멀티큐 SSD를 위해 멀티코어 확장성을 제공하는 공정 큐잉 알고리즘을 제안한다. 제안하는 알고리즘은 무작위 선택 기법을 이용하여 코어간 동기화 오버헤드를 최소화하고 각 코어가 가중치에 비례하는 대역폭을 수신하도록 한다. 실험 결과, 제안하는 알고리즘은 block-mq를 사용하는 커널에서 정확한 대역폭 분할 효과를 보여주며, 코어 개수에 상관 없이 기존 FlashFQ 스케줄러보다 우수한 성능을 보여준다.

멀티코어 SoC의 테스트 시간 감축을 위한 테스트 Wrapper 설계 (A Test Wrapper Design to Reduce Test Time for Multi-Core SoC)

  • 강우진;황선영
    • 한국통신학회논문지
    • /
    • 제39B권1호
    • /
    • pp.1-7
    • /
    • 2014
  • 본 논문은 멀티 코어 SoC의 전체 테스트 시간 감축을 위한 효율적인 테스트 wrapper 설계 방법을 제안한다. 제안된 알고리즘은 잘 알려진 Combine 알고리즘을 사용하여 멀티코어 SoC의 각 코어에 대해 초기 local wrapper해 집합을 구성하고 가장 긴 테스트 시간을 소모하는 코어를 dominant 코어로 선택한다. Dominant 코어의 테스트 시간을 기준으로 다른 코어들에 대해 wrapper 특성인 TAM 와이어 수와 테스트 시간을 조정한다. Design space exploration을 위해 일부 코어들의 TAM 와이어 수를 줄이고 테스트 시간을 증가시킨다. 변경된 wrapper 특성을 기존 local wrapper 해 집합에 추가한다. 코어들의 기존 local wrapper 해 집합이 global wrapper 해 집합으로 확장되어 스케줄러에 의한 멀티코어 SoC의 전체 테스트 시간이 감소한다. 제안된 wrapper의 효과는 ITC'02 벤치마크 회로에 대해 $B^*$-트리 기반의 테스트 스케줄러를 사용하여 검증된다. 실험 결과 기존의 wrapper를 사용하는 경우에 비해 테스트 시간이 평균 4.7% 감소한다.

멀티 코어 프로세서를 위한 저전력 필터 캐쉬 설계 기법 (Low-power Filter Cache Design Technique for Multicore Processors)

  • 박영진;김종면;김철홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권12호
    • /
    • pp.9-16
    • /
    • 2009
  • 최신의 멀티코어 프로세서를 설계할 때에는 성능과 함께 전력 효율성이 반드시 고려되어야 한다. 본 논문에서는 싱글 코어 프로세서의 명령어 캐쉬에서 소비되는 전력을 줄이기 위해 사용되는 대표적 기법중 하나인 필터 캐쉬 구조를 멀티 코어 프로세서에 적용하기 위한 새로운 방안을 제시하고자 한다. 명령어 캐쉬는 프로세서 전체에서 소비되는 전력의 상당 부분을 차지하고 있기 때문에, 변형 필터 캐쉬 구조를 이용한 저전력 명령어 캐쉬 설계는 멀티 코어 프로세서의 전력 소비를 줄이는데 있어서 중요한 역할을 담당할 수 있다. 제안하는 변형 필터 캐쉬 구조는 멀티코어 프로세서에서 필터 캐쉬에 대한 희생 캐쉬를 추가함으로써 1차 명령어 캐쉬에 대한 접근 횟수를 감소시키는 방법을 이용하여 명령어 캐쉬에서 소비되는 총전력을 줄일 수 있다. 제안하는 명령어 캐쉬 구조의 효율성을 분석하기 위한 모의 실험 도구로 SimpleScalar시뮬레이터와 CACTI를 사용한다. 모의실험 결과, 제안하는 기술은 멀티코어 프로세서의 명령어 캐쉬에서 소비되는 전력을 기존의 필터 캐쉬 구조와 비교하여 최대 3.4% 감소시킬 수 있음을 확인할 수 있다. 더욱이 제안하는 구조는 기존의 필터 캐쉬 구조에 비해 보다 우수한 성능을 보여준다.

공유기반 트리 멀티캐스트 라우팅 프로토콜을 위한 후보 코어 선택 방법 (A Method of Selecting Candidate Core for Shared-Based Tree Multicast Routing Protocol)

  • 황순환;윤성대
    • 한국멀티미디어학회논문지
    • /
    • 제7권10호
    • /
    • pp.1436-1442
    • /
    • 2004
  • 코어 기반 트리 멀티캐스트 라우팅 프로토콜, PIM-SM, 코어 관리자 기반 멀티캐스트 라우팅 등에 의해 확립된 공유 기반 트리는 코어 또는 랑데뷰 포인트라는 센터 노드를 루트로 하는 구조이다. 공유 기반 트리에서 코어(또는 랑데뷰 포인트)로부터 멀티캐스트 그룹의 모든 구성원들에 대한 전송 경로는 가장 짧은 거리를 사용한다. 트리의 구성 비용은 코어에 의해 결정되고, 패킷들의 지연은 코어의 위치에 의해 좌우된다. 따라서 코어의 위치 선정은 비용과 성능 측면에 많은 영향을 끼친다. 본 논문에서는 후보 코어 그룹 선택을 위한 세 가지 방법을 제안하고자 한다. 제안한 최소 평균 비용 선택, 최대 차수 선택, 최대 가중치 선택 방법은 각각 임의 선택 방법과 트리 비용, 평균 패킷 지연, 최대 패킷 지연의 세 가지 성능 평가 요소를 통해 비교하였다. 모의실험 결과 후보 코어 그룹 선택에 있어서 제안한 세 가지 방법이 임의 선택방법보다 성능 평가요소인 트리 비용, 평균 패킷 지연, 최대 패킷 지연 측면에서 더 낮은 결과를 보임으로써, 우수함을 입증하였다.

  • PDF

주파수 공유형 멀티코어 프로세서를 위한 부하균등화에 기반한 실시간 병렬 작업들의 최소 전력 스케줄링 (Minimum-Power Scheduling of Real-Time Parallel Tasks based on Load Balancing for Frequency-Sharing Multicore Processors)

  • 이완연
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제4권6호
    • /
    • pp.177-184
    • /
    • 2015
  • 본 논문에서는 DVFS 기반의 멀티코어 프로세서상에서 실시간 병렬 작업들의 마감시한을 만족하면서 전력 소모량을 최소화시키는 스케줄링 기법을 제안하였다. 제안된 기법에서는 먼저 모든 프로세싱 코어들의 계산부하가 동일해지도록 각 작업에게 할당될 프로세싱 코어들의 실수 개수를 찾는다. 그리고 프로세싱 코어들의 계산부하가 동일하도록 유지하면서 찾은 실수 개수의 프로세싱 코어들을 자연수 개수의 프로세싱 코어들로 변환시켜 각 작업들의 실행에 할당한다. 제안된 방법은 단일 시점에 동일한 속도로 동작하는 주파수 공유형 멀티코어 프로세서의 전력 소모량을 최소화하도록 설계되었다. 성능 평가 실험에서 제안된 기법이 기존 방법의 전력 소모량을 최대 38%까지 감소시킴을 확인하였다.

공유 트리 기반 멀티캐스트 라우팅을 위한 코어 선택 방법 (A Method of Selecting Core for the Shared-Tree based Multicast Routing)

  • 황순환;윤성대
    • 정보처리학회논문지C
    • /
    • 제10C권7호
    • /
    • pp.885-890
    • /
    • 2003
  • 코어 기반 트리(CBT:Core Based Tree) 멀티캐스트 라우팅은 인터넷을 위한 멀티캐스트 라우팅 프로토콜이다. CBT는 멀티캐스트 연결을 위해 하나의 공유 트리를 구성하고, 이 공유 트리는 코어라는 센터 노드를 루트로 한다. 코어 기반 트리 멀티캐스트 라우팅에서 코어의 위치 선정은 비용과 성능 측면에 많은 영향을 끼치고, 코어의 배치 방법은 네트워크 토폴로지에 따라 달라진다. 본 논문에서는 간단하고 효율적인 코어 선택 방법을 제안하고자 한다. 제안한 방법은 거리 벡터 정보를 필요로 하며, 추가적으로 표본 상관 계수 결과를 이용하여, 멀티캐스트 그룹에 속해있는 멤버들의 배치상태에 따라 적합한 라우팅 알고리즘으로 최소평균비용을 갖는 노드를 코어로 선정하는 방법, 또는 PIM-SM 방법을 선택하는 것이다. 제안한 방법의 성능은 평균지연, 최대 지연, 총 비용과 같은 세부적인 실험을 통해 기존연구와 비교하였으며, 실험 결과 제안한 코어 선택 방법이 매우 효율적임을 알 수 있었다.

JPEG을 Animated GIF로 변환하는 과정에서 스레딩에 따른 멀티코어 모바일 디바이스의 성능 평가 (Performance evaluation of mobile multicore devices on threading in converting JPEG to animated GIF)

  • 우호성;김강석;김재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.328-331
    • /
    • 2013
  • 본 논문에서는 멀티코어 모바일 디바이스에서 최적의 스레드 구성을 측정하기 위해 이미지 코덱을 사용하여 다양한 환경에서 스레드 개수에 따른 인코딩 수행시간을 분석하였다. 인코딩은 Quantization을 사용하여 JPEG 파일들을 하나의 GIF 파일로 변환하는 기능을 수행하며, 듀얼코어와 쿼드코어 안에서 각각의 스레드 개수를 늘려가며 측정하였다. 듀얼코어에서는 스레드 4개였을 경우가 성능이 효율적이였으며, 쿼드 코어에서는 스레드 3개였을 경우가 성능이 효율적이였다. 분석 후 결론은 스레드 개수와 성능은 비례하는 것이 아니며 성능에 크게 영향을 미치지 않는 것으로 확인되었다. 코어와 I/O입출력의 성능 및 데이터 크기에 따라 적당한 스레드 개수를 정하여 사용하는 것이 효율적이다.

멀티코어 CPU에서의 비대칭 부하 분산 (Asymmetric Load Balancing on Multi-Core CPUs)

  • 김희곤;이성주;정용화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.4-6
    • /
    • 2012
  • 최근 멀티코어 CPU가 장착된 시스템들이 출시되면서 많은 병렬처리 기법들이 제안되고 있다. 본 논문에서는 데이터 종속성이 없는 모듈과 종속성이 있는 모듈이 순차적으로 구성된 응용에서 각 코어에 부하를 효과적으로 분산시키는 방법을 제안한다. 즉, 데이터 종속성이 없는 모듈을 각 코어에 대칭적으로 분산시키는 통상적인 방법 대신, 비대칭적으로 부하를 분산시킴으로써 암달의 법칙에서 계산된 성능 상한치를 뛰어넘는 성능 개선을 얻을 수 있음을 보인다.

멀티코어 프로세서의 쓰레드-수준 병렬성을 활용한 AES-CCM 계산-통신 중첩화 (Computation-Communication Overlapping in AES-CCM Using Thread-Level Parallelism on a Multi-Core Processor)

  • 이은지;이성주;정용화;이명호;민병기
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권8호
    • /
    • pp.863-867
    • /
    • 2010
  • 최근 멀티코어 프로세서들이 범용 PC 뿐만 아니라 임베디드 시스템에서도 탑재될 만큼 그 사용이 보편화되고 있는 상황에서, 많은 멀티미디어 응용 프로그램이 이들을 활용하여 병렬화 되고 있다. 그러나 멀티미디어 데이터의 암호화와 같이 응용 프로그램에 데이터 종속성이 내재한 경우에는 멀티코어를 이용한 효과적인 병렬처리가 어렵다는 문제가 있다. 본 논문에서는 이러한 한계를 극복하기 위하여 유휴 코어를 이용하여 계산과 통신을 중첩시키는 병렬처리 기법을 제안한다. 특히, 주어진 멀티미디어 데이터를 처리하고 전송하는 문제를 응용 프로그램 수준의 파이프라인 설계 문제로 해석하여 최적의 파이프라인 단계수를 도출하는 방법을 제안한다.

락의 실제 : 멀티코어 상의 데이터베이스 성능 분석 (Locking in Practice : Performance of a Database System on a Multicore Machine)

  • 한혁
    • 한국콘텐츠학회논문지
    • /
    • 제14권8호
    • /
    • pp.22-29
    • /
    • 2014
  • 락은 멀티프로세서 환경에서 공유 데이터에 대한 접근을 안전하게 하는 잘 알려진 일반적인 방법이다. 1960년대에 상호 배제가 소개된 후에 많은 스핀락 알고리즘이 제안되었고 운영체제나 데이터베이스 시스템에 사용되어 왔다. 이 연구에서 고성능 멀티코어 시스템 상에서 락 알고리즘이 데이터베이스 시스템에 미치는 영향을 측정하였다. 평가를 위해 그 동안 멀티코어 상에서 성능 개선을 위해 재구조화된 최신 MySQL 5.6 및 MySQL에 탑재된 InnoDB 엔진을 사용하였다. InnoDB의 스핀락 함수를 수정하여 다양한 락 알고리즘들을 구현하였고 구현된 락 알고리즘들을 멀티코어 환경에서 평가하였다.