• 제목/요약/키워드: Multi-core scheduling

검색결과 42건 처리시간 0.04초

이산적 DVFS 멀티코어 프로세서 상에서 실시간 병렬 작업을 위한 확률적 저전력 스케쥴링 (Probabilistic Power-saving Scheduling of a Real-time Parallel Task on Discrete DVFS-enabled Multi-core Processors)

  • 이완연
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.31-39
    • /
    • 2013
  • 본 논문에서는 멀티코어 프로세서에서 단일 실시간 병렬 작업의 데드라인을 만족하면서 전력 소모량의 확률적 기대 값을 최소화하는 스케쥴링 기법을 제안하였다. 제안된 기법에서는 단일 작업을 여러 개의 코어들 상에서 동시에 수행하는 병렬 처리 기법을 적용하였고, 전체 코어들 중에서 일부의 코어들만을 사용하고 나머지 코어들의 전원을 소등하여 전력 소모량을 줄였다. 또한 한정된 개수의 이산적 클락 주파수 값들을 가지는 DVFS 기반 멀티코어 프로세서에 대해서, 확률적 계산량 모델을 가진 실시간 병렬 작업의 데드라인을 만족하면서 전력 소모량의 확률적 기대 값을 최소화함을 수학적으로 증명하였다. 성능평가 실험에서, 제안된 기법이 기존 방법의 전력소모량을 최대 81%까지 감소시킴을 확인하였다.

실시간 운영체제를 이용한 내장형 웹서버 시스템 개발 (Development of Embedded Web Server System Using a Real-Time OS)

  • 정명용;문승빈;송상훈
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2000년도 제15차 학술회의논문집
    • /
    • pp.223-223
    • /
    • 2000
  • Embedded system area has brought an innovation and has been spread rapidly by the growth of the Internet, wireless telephony and multimedia recently. Many embedded systems are required to be real-time systems in that it needs multi-tasking and priority based scheduling. This paper introduces a real-time system that was developed with web server ability for control and monitoring system employing a real-time operating system. It discusses the design model, structure, and applications of web server system. We used SNDS100 board which has a 32-bit RISC microcontroller of ARM7TDMI core as a hardware platform. MicroC/OS kernel was used as Real-time operating system that supports a preemptive and multitasking functions. We developed a hierarhchical control and monitoring system that not only reduced system and management costs, but also enhanced reusability and portability.

  • PDF

NUMA affinity를 고려한 Workload Consolidation 연구 (A study of workload consolidation considering NUMA affinity)

  • 서동유;김신규;최찬호;엄현상;염헌영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.204-206
    • /
    • 2012
  • SMP(Symmetric Multi-Processing)는 Shared memory bus 를 사용함으로써 scalability 가 제한적이었다. 이런 SMP의 scalability 제한을 극복하기 위해 제안 된 것이 NUMA(Non Uniform Memory Access)이다. NUMA는 memory bus 를 CPU 별 local 하게 가지고 있어 자신이 가지는 memory 영역에 대해서는 다른 영역을 접근하는 것 보다 더 빠른 latency 를 가지는 구조이다. Local 한 memory 영역의 존재는 scalability를 높여 주었지만 서버 가상화 환경에서 VM을 동적으로 scheduling 을 하였을 때 VM의 page 가 실행되는 core 의 local 한 메모리 영역에 존재하지 않게 되면 remote access로 인해 local access보다 성능이 떨어진다. 이 논문에서는 서버 가상화 환경에서 최신 architecture인 AMD bulldozer에서 NUMA affinity가 위반되었을 때 발생하는 성능 저하와 어떤 상황에서 이런 NUMA affinity가 위반되어도 성능저하가 없는지 연구하였다.

이종 멀티코어 프로세서 작업 스케줄링에 관한 연구 동향 분석 (Trends on Task Scheduling in Heterogeneous Multi-core Processors)

  • 김성일;김종국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.119-122
    • /
    • 2012
  • 이종 멀티코어 프로세서는 각기 상이한 마이크로아키텍처, 캐시 사이즈, 클록 주파수를 갖는 다수의 코어 또는 프로세싱 유닛으로 이루어진 마이크로프로세서이다. 저에너지 소비가 산업계의 키워드로 부상하고 있는 이 시기에 이종 멀티코어는 동종 멀티코어보다 더 낮은 전력을 소비하고 성능면에서도 더 나은 프로세서로 주목받고 있다. 하지만, 동종 멀티코어에서의 동작을 가정하는 현재의 운영체제의 작업 스케줄러로는 이종 멀티코어의 이종적인 특성을 잘 활용할 수 없다. 본 논문에서는 이종 멀티코어 프로세서 작업 스케줄링에 관한 연구를 다면적으로 분석하여 각 방법의 장점과 단점을 개략적으로 정리하고 관련된 이슈들을 살펴보고자 한다.

멀티 코어 시스템에서 통신 프로세스의 스케줄링에 따른 성능 분석 (Impact of Process Scheduling on Network Performance over Multi-Core Systems)

  • 장혜천;진현욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.827-829
    • /
    • 2009
  • 현재 멀티 코어 프로세서는 많은 서버에 적용되어 사용되고 있으며, 향후에는 하나의 프로세서 패키지에 포함될 코어의 개수는 계속해서 증가할 것이다. 그러나 현재 운영체제들은 멀티 코어 시스템을 멀티 프로세서 환경과 거의 동일하게 다루고 있으며 아직 멀티 코어 특성을 고려한 성능 최적화 시도는 미흡한 상태이다. 본 논문은 SMP와 NUMA 구조의 멀티 코어 프로세서 환경에서 통신 프로세스와 네트워크 인터럽트의 프로세서 친화도를 변화시키며 네트워크 처리율과 코어의 유휴 자원 양을 정량적으로 분석한다. 측정 결과 프로세서 친화도에 따라 통신 처리율은 크게 변하지 않지만 프로세서 자원의 요구량에는 크게 영향을 주는 것을 보인다. 또한 이러한 프로세서 자원의 영향은 멀티 코어 프로세서의 캐쉬 공유 구조 및 메모리 분산 구조와 밀접한 관계를 갖고 있음을 밝힌다.

MPI와 OpenMP기반 하이브리드 모델을 이용한 항공 레이저 스캐닝 자료의 병렬 처리 (Parallel Processing of Airborne Laser Scanning Data Using a Hybrid Model Based on MPI and OpenMP)

  • 한수희;박일석;허준
    • 한국측량학회지
    • /
    • 제30권2호
    • /
    • pp.135-142
    • /
    • 2012
  • 본 연구에서는 대용량 항공 레이저 스캐닝 자료로부터 DSM(Digital Surface Model) 및 DTM(Digital Terrain Model)을 효율적으로 생성하기 위하여 다중 코어 피씨클러스터(PC-Cluster)에 기반한 병렬처리방식을 제안하였다. 이를 위하여 MPI(message passing interface)만을 사용하는 기존 MPI 모델을 변형하여 MPI와 OpenMP를 병용한 하이브리드(hybrid) 모델을 제작하였으며 다중 코어 피씨클러스터에서 그 성능을 평가하였다. 결과적으로, 하이브리드 모델과 기존 모델을 비교하였을 때 DSM을 생성하기 위한 보간에서는 다소 불리하지만 MPI 호출을 줄임으로써 전반적인 성능을 향상시킬 수 있었다. 아울러, 불규칙한 항공 레이저 스캐닝 자료의 분포로부터 발생하는 코어간 부하 불일치를 OpenMP의scheduling 기능을 통해 조절함으로써 하이브리드 모델의 성능을 향상시킬 수 있었다.

고해상도 SAR 영상처리 고속화를 위한 병렬 성능 최적화 기법 연구 (A Study on Parallel Performance Optimization Method for Acceleration of High Resolution SAR Image Processing)

  • 이규범;김규빈;안솔보름;조진연;임병균;김동현;김정호
    • 한국항공우주학회지
    • /
    • 제46권6호
    • /
    • pp.503-512
    • /
    • 2018
  • SAR(Synthetic Aperture Radar)는 레이더를 이용하여 얻은 신호를 처리해 영상을 획득하는 기술로서, SAR 영상의 활용도와 고해상도 영상에 대한 요구가 증가하고 있는 상황이다. 따라서 본 연구에서는 고해상도 영상 데이터의 고속 처리를 위해 SAR 영상처리 알고리즘을 다중코어 기반의 컴퓨터 구조에서 최적의 성능을 낼 수 있도록 구현하기 위한 연구를 수행했다. 고해상도 영상에 따른 방대한 양의 입출력에 의한 성능 저하를 개선시키기 위해 메모리를 최대한 활용하는 성능 최적화 기법을 적용하고 OpenMP의 동적 스케쥴링 기법과 중첩 병렬성(nested parallelism)을 사용해 코드의 병렬화 비율을 높였다. 그 결과 전체 계산시간을 줄일 뿐만 아니라 병렬 성능의 최대 한계치를 크게 높일 수 있었으며, 제안된 기법을 10개 코어를 가진 다중코어 시스템에 적용한 결과 기존 대비 8배 이상의 성능 향상이 있었다. 본 연구 결과는 대용량 메모리를 가진 다중코어 시스템을 대상으로 하는 고해상도 SAR 영상처리 소프트웨어 개발에 효과적으로 활용될 수 있을 것으로 기대된다.

중소건설업체의 다중현장관리를 위한 공사관리업무의 효율화 방안 - 공정관리업무를 중심으로 - (An Elective Multi-Project Management for the Small and Medium-sized Construction Companies - Focused on the Planning and Scheduling -)

  • 최광희;한주연;김경래;신동우
    • 한국건설관리학회:학술대회논문집
    • /
    • 한국건설관리학회 2002년도 학술대회지
    • /
    • pp.504-510
    • /
    • 2002
  • 건축공사 규모의 대형화 복잡화, 다양화가 되면서 다수의 현장에서 공사수행에 따른 많은 공사정보가 현장에서 발생하여 본사로 보고되고 있다. 이러한 많은 정보들 중에서 개별현장 및 다수의 현장을 동시에 관리하기 위해 중요한 핵심정보만을 추출하여 경영진이 현장을 지원하기 위한 적절한 의사결정을 내린 수 있도록 하기 위한 필요성이 증가하고 있다. 또한 건설산업의 정보화가 추진됨에 따라 현장에서 발생한 정보를 효율적으로 취합하여 의사결정을 내리고 공사관리를 행하는 것이 기업의 경쟁력을 확보하는 요소로써 그 중요성이 증가하고 있다. 따라서 중소건설업체에서 다수의 현장을 동시에 관리하기 위해 본사차원에서 요구되는 기본적인 정보요소와 핵심적인 정보요소를 규정하고 그에 대한 활용방안을 제안하였다.

  • PDF

다중 사용자 및 다중 안테나 하향링크 네트워크에서 적응적 사용자 선택 기법 (Adaptive User Selection in Downlink Multi-User MIMO Networks)

  • 반태원;정방철
    • 한국정보통신학회논문지
    • /
    • 제17권7호
    • /
    • pp.1597-1601
    • /
    • 2013
  • 향후 폭발적인 증가가 예상되는 모바일 데이터 트래픽을 효과적으로 수용하기 위해서 다중 안테나 기술이 차세대 이동통신 시스템의 핵심 기술로 주목을 받고 있다. 특히, 기지국에 수십 개의 안테나를 탑재하여 동시에 복수의 단말에게 데이터를 동시에 전송하는 다중 사용자 기반 다중 안테나 기술에 대한 연구가 활발히 진행되고 있다. 본 논문에서는, 이러한 다중 사용자 기반 다중 안테나 통신 시스템에서 시스템의 성능을 향상시키기 위해서 채널 상태에 따라서 적응적으로 데이터를 전송할 단말 조합을 선택할 수 있는 알고리즘을 제안한다. Monte-Carlo 기반 시뮬레이션을 통한 성능 분석 결과 제안 방식은 단말 선택 기법을 적용하지 않는 기존 방식 대비 우수한 성능을 나타내며 Exhaustive Search 기반 최적 방식에 근접하는 성능을 보여준다. 반면에, 시스템 내 단말의 수를 K라고 할 때 제안 방식은 최적 방식 대비 계산양을 $K/(2^K-1)$로 줄일 수 있다.

OpenCL을 활용한 CPU와 GPU 에서의 CMMB LDPC 복호기 병렬화 (Parallel LDPC Decoder for CMMB on CPU and GPU Using OpenCL)

  • 박주열;홍정현;정기석
    • 대한임베디드공학회논문지
    • /
    • 제11권6호
    • /
    • pp.325-334
    • /
    • 2016
  • Recently, Open Computing Language (OpenCL) has been proposed to provide a framework that supports heterogeneous computing platforms. By using an OpenCL framework, digital communication systems can support various protocols in a unified computing environment to achieve both high portability and high performance. This article introduces a parallel software decoder of Low Density Parity Check (LDPC) codes for China Multimedia Mobile Broadcasting (CMMB) on a heterogeneous platform. Each step of LDPC decoding has different parallelization characteristics. In this paper, steps suitable for task-level parallelization are executed on the CPU, and steps suitable for data-level parallelization are processed by the GPU. To improve the performance of the proposed OpenCL kernels for LDPC decoding operations, explicit thread scheduling, loop-unrolling, and effective data transfer techniques are applied. The proposed LDPC decoder achieves high performance by using heterogeneous multi-core processors on a unified computing framework.