• 제목/요약/키워드: scheduler

검색결과 595건 처리시간 0.03초

머신러닝 컴파일러와 모듈로 스케쥴러에 관한 연구 (A Study on Machine Learning Compiler and Modulo Scheduler)

  • 조두산
    • 한국산업융합학회 논문집
    • /
    • 제27권1호
    • /
    • pp.87-95
    • /
    • 2024
  • This study is on modulo scheduling algorithms for multicore processor in machine learning applications. Machine learning algorithms are designed to perform a large amount of operations such as vectors and matrices in order to quickly process large amounts of data stream. To support such large amounts of computations, processor architectures to support applications such as artificial intelligence, neural networks, and machine learning are designed in the form of parallel processing such as multicore. To effectively utilize these multi-core hardware resources, various compiler techniques are being used and studied. In this study, among these compiler techniques, we analyzed the modular scheduler, which is especially important in one core's computation pipeline. This paper looked at and compared the iterative modular scheduler and the swing modular scheduler, which are the most widely used and studied. As a result, both schedulers provided similar performance results, and when measuring register pressure as an indicator, it was confirmed that the swing modulo scheduler provided slightly better performance. In this study, a technique that divides recurrence edge is proposed to improve the minimum initiation interval of the modulo schedulers.

무선통신 시스템에서의 비례지연서비스를 위한 플로우 기반 WTP 스케쥴러 (Flow-Based WTP Scheduler for Proportional Differentiated Services in Wireless Communication Systems)

  • 박효순;권은현;김태현;이재용
    • 한국통신학회논문지
    • /
    • 제30권7B호
    • /
    • pp.433-439
    • /
    • 2005
  • 본 논문에서는 무선 통신시스템에서 클래스간 비례지연 서비스를 위한 Flow Based Waiting Time Priority (FB-WTP) 스케쥴러를 제안한다. 기존의 스케쥴러는 클래스 단위로 동작하는 유선망의 구조를 그대로 사용하나, 제안된 FB-WTP 스제쥴러는 이와 달리 플로우 단위로 동작을 하며, 네트웍크 운영자가 입력한 클래스간 목표 큐잉 지연 비율은 기존 알고리즘과 같이 거의 동일하게 만족 시키면서도 클래스별 평균 큐잉 지연 성능은 월등히 향상 되었다. 이것은 각 플로우의 채널 환경이 동적으로 변화는 무선 환경에서 FB-WTP는 다중 플로우 다이버시티 효과를 최대한 이용 하기 때문이다. 또한 기존 알고리즘들에서 발생 할 수 있는 HOL 패킷 블록킹 문제가 발생하지 않는다. 성능평가를 위한 모의 실험에서 다중 채널 상태를 고려한 Look-ahead Waiting Time Priority (LWTP) 스케줄링 알고리즘과의 비교 분석으로 제안한 FB-WTP가 클래스간 목표 큐잉 지연 비율을 만족 시킬뿐만 아니라 LWTP에 비해 클래스별 평균 큐잉 지연 특성이 향상됨을 보였다.

Bufferbloat 환경에서 MPTCP 성능 개선을 위한 대역폭 측정 기반 스케줄러 설계 (Design of Bandwidth Measurement based Scheduler for Improving MPTCP Performance in Bufferbloat Environment)

  • 김민섭;한기문;이재용;김병철
    • 한국정보통신학회논문지
    • /
    • 제21권8호
    • /
    • pp.1508-1516
    • /
    • 2017
  • Multipath TCP (MPTCP)는 다중 경로를 지원하는 전송계층 프로토콜이다. MPTCP가 가진 다중 경로 중에서 한 경로에 지연시간이 급격히 증가하는 "bufferbloat"가 발생하게 된다면 경로 간의 패킷 도착시간 차이로 수신버퍼에서 HoL blocking이 발생하여 bufferbloat가 발생된 경로뿐만 아닌 다른 경로의 성능도 저하되는 문제가 있다. 본 논문에서는 이와 같은 문제를 해결하기 위해 대역폭 측정 기반의 스케줄러를 제안한다. 대역폭 측정 기반 스케줄러는 각 서브플로우의 대역폭을 측정하여 이를 기반으로 패킷 스케줄링을 하도록 설계하였다. 제안한 스케줄러 검증을 위해 리눅스커널에 제안한 스케줄러를 구현하고 bufferbloat가 발생하는 테스트베드를 구성하여 기존 MPTCP와 비교분석 하였다. 실험결과 제안한 스케줄러가 bufferbloat 환경에서 기존 MPTCP보다 성능이 크게 개선됨을 보였다.

Windows NT상에서의 OPRoS 컴포넌트 스케줄러의 실시간성 분석 및 개선 (Real-Time Characteristics Analysis and Improvement for OPRoS Component Scheduler on Windows NT Operating System)

  • 이동수;안희준
    • 제어로봇시스템학회논문지
    • /
    • 제17권1호
    • /
    • pp.38-46
    • /
    • 2011
  • The OPRoS (Open Platform for Robotic Service) framework provides uniform operating environment for service robots. As an OPRoS-based service robot has to support real-time as well as non-real-time applications, application of Windows NT kernel based operating system can be restrictive. On the other hand, various benefits such as rich library and device support and abundant developer pool can be enjoyed when service robots are built on Windows NT. The paper presents a user-mode component scheduler of OPRoS, which can provide near real-time scheduling service on Windows NT based on the restricted real-time features of Windows NT kernel. The component scheduler thread with the highest real-time priority in Windows NT system acquires CPU control. And then the component scheduler suspends and resumes each periodic component executors based on its priority and precedence dependency so that the component executors are scheduled in the preemptive manner. We show experiment analysis on the performance limitations of the proposed scheduling technique. The analysis and experimental results show that the proposed scheduler guarantees highly reliable timing down to the resolution of 10ms.

멀티미디어 태스크 지원을 위한 다단계 스케줄러 (Multi-level Scheduler for Supporting Multimedia Task)

  • 고영웅
    • 정보처리학회논문지A
    • /
    • 제12A권5호
    • /
    • pp.375-384
    • /
    • 2005
  • 연성 실시간 특성을 가진 멀티미디어 응용 프로그램이 일정한 서비스 품질을 유지하고 수행되기 위해서는 커널 수준과 사용자 수준에서 실시간 처리를 요구한다. 본 연구에서는 널리 사용되는 범용 운영체제 환경에서 멀티미디어를 지원하는데 있어서 문제가 되는 부분을 살펴보고 이를 개선할 수 있는 다단계 스케줄러를 제안한다. 다단계 스케줄러는 사용자 피드백을 기반으로 스케줄링 정보를 생성하는 상위 스케줄러와 커널에 구현된 하위 스케줄러로 구성된다. 제안한 다단계 스케줄러를 리눅스에서 구현하고 성능 분석을 수행하였으며, 실험 결과, 제안한 방식이 시스템에 성능 저하를 발생시키지 않으면서 멀티미디어의 서비스 품질을 일정하게 보장하는 것을 확인하였다.

슈퍼스칼라 구조를 갖지 않는 고성능 Stream Processor 설계 (A Design of a High Performance Stream Processor without Superscalar Architecture)

  • 이관호;김치용
    • 전기전자학회논문지
    • /
    • 제21권1호
    • /
    • pp.77-80
    • /
    • 2017
  • 본 논문에서는 기존의 superscalar GP-GPU 구조와 달리 superscalar issue를 제거하여 GP-GPU성능을 향상하는 방법을 제안한다. superscalar issue를 제거하기 위해 stream processor의 구조를 단순화했다. stream processor의 구조가 단순화 됨에 따라 하드웨어의 크기를 크게 늘리지 않고 thread 개 수가 늘려 성능을 개선하였다. thread 개수가 늘어남에 따라 thread의 묶음인 warp을 관리하는 warp scheduler 구조를 새롭게 제안하였다. 제안하는 warp scheduler는 superscalar issue가 제거 되어 있기 때문에 warp 활성화 정보를 통해 라운드 로빈 스케쥴링을 통해 활성화 된 warp에게 명령어를 전달한다. 성능 비교는 가우시안 필터링 연산을 사용하였으며 기존의 GP-GPU의 비해 7.89배의 성능향상을 보였다.

가상 컴퓨팅 랩 환경에서 노드 전원관리 스케줄러 설계 및 구현 (Design and Implementation of a Node Power Scheduler in Virtual Computing Lab Environment)

  • 서경석;이봉환
    • 한국정보통신학회논문지
    • /
    • 제17권8호
    • /
    • pp.1827-1834
    • /
    • 2013
  • 기존의 PC 기반의 데스크탑 환경은 보안, 이동성, 업그레이드 비용 감소 등의 장점으로 인하여 서버 기반의 가상데스크탑 환경으로 바뀌고 있다. 본 논문에서는 오픈소스 기반의 클라우드 컴퓨팅 플랫폼과 하이퍼바이저를 이용하여 컴퓨터 실습실에 적용 가능한 가상 컴퓨팅 랩 서비스 시스템을 설계하고 구현하였다. 또한, 서버 팜에 있는 노드들의 전력 소모를 줄이기 위한 전원 스케줄러를 제안하였으며, 이 스케줄러 탑재 시 기존시스템에 비하여 전력 소모량을 대폭 줄일 수 있는 실험 결과를 제시하였다.

멀티미디어 태스크를 위한 비율조정 비계지분 스케줄러 (A Rate Regulating Proportational-Share Scheduler for Multimedia Tasks)

  • 공기석;김만희;조시훈;김철기;이준원
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제26권7호
    • /
    • pp.788-812
    • /
    • 1999
  • 본 논문에서는 범용 워크스테이션 환경하에서 수행되는 멀티미디어 응용프로그램(application)을 지원하기 위한 비례지분 방식의 CPU 스케줄러를 제시한다. 이러한 목적을 위하여 일반적 태스크의 지원을 위해 설계된 스트라이드 스케줄러를 확장한다. 멀티미디어 응용프로그램의 시간 요구사항을 명시하기 위하여 새로운 스케줄링 파라미터들을 도입한다. 비율조정기를 도입한 결과 스케줄링의 정확도의 오차는 O(1)로 감소하였다. 별도의 태스크 그룹을 설정하여 상대적 지분과 절대적 지분을 부여했다. 모의실험을 사용하여 스케줄러의 성능을 평가하였다. 그 결과, 제안된 스케줄러는 증가된 정확도와 적응성 및 유연성을 가짐을 알 수 있었다. Abstract This paper presents a proportional-share CPU scheduler which can support multimedia applications in a general-purpose workstation environment. For this purpose, we have extended the stride scheduler which is designed originally for conventional tasks. New scheduling parameters are introduced to specify timing requirements of multimedia applications. Through the use of the rate regulator, the accuracy error of the scheduling is reduced to O(1). Separate task groups are proposed to represent both relative shares and absolute shares. The proposed scheduler is evaluated using a simulation study. The results show that the proposed scheduler achieves improved accuracy and adaptability as well as flexibility.

계층간 최적화를 위해 비디오 트레이스에 기반한 무선 MAC 스케줄러 (A Wireless MAC Scheduler Based on Video Traces for Cross-Layer Optimization)

  • 조성익;편기현
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제55권5호
    • /
    • pp.236-239
    • /
    • 2006
  • A wireless MAC scheduler that provides a high level of quality-of-service (QoS) for video-on-demand (VOD) applications while achieving a reasonable level of system throughput is proposed. The proposed scheduler considers both channel qualities of mobiles and the urgency of real-time packets coming from VOD applications in a cross-layer approach between application and MAC layers.

Adaptive Wireless Schedulers based on IEEE 802.11e HCCA

  • 정진우;김종호
    • 한국통신학회논문지
    • /
    • 제33권9B호
    • /
    • pp.775-785
    • /
    • 2008
  • We identify the problem of the current IEEE 802. lie HCCA (Hybrid Coordination Function Controlled Channel Access) scheduler and its numerous variations, that the queue information cannot be notified to the Hybrid Coordinator (HC) timely, therefore the uplink delay lengthens unnecessarily. We suggests a simple solution and a couple of implementation practices, namely the Adaptive Scheduler with RTS/CTS (ASR) and Adaptive Scheduler with Data/Ack (ASD). They are both further elaborated to emulate the Deficit Round Robin (DRB) scheduler. They are finally compared with existing exemplary schedulers through simulations, and shown to perform well.