• 제목/요약/키워드: context switching overhead

검색결과 13건 처리시간 0.018초

실시간 시스템에서 빠른 문맥 전환을 위한 다중 레지스터 파일 (Multiple Register Files for Fast Context Switching in Real-Time Systems)

  • 김종웅;조정훈
    • 대한임베디드공학회논문지
    • /
    • 제5권3호
    • /
    • pp.128-135
    • /
    • 2010
  • Recently complexity of embedded software cause to be used real-time operating system (RTOS) to implement various functions in the embedded system. And also, according to requirement of complex functions in embedded systems, the number as well as complexity of tasks get increased continuously. In case that many tasks collaborated in a microprocessor, context switching time between tasks is a overhead waisting a CPU resource. Therefore the time of task context switching is an important factor that affects performance of RTOS. In this paper, we concentrate on the improvement of task context switch for reducing overhead and achieving fast response time in RTOS. To achieve these goal, we suggest multiple register files and task context switching algorithm. By reducing the context switch overhead, we try to ease scheduling and assure fast response times in multitasking environment. As a result, the context switch overhead decreased by 8~16% depend on the number of register files, and some task set which are not schedulable with single register file are schedulable due to that decrease with multiple register files.

비동기 시리얼 통신의 성능 향상을 위한 인터럽트 통합 기법 (An Interrupt Coalescence Method for Improving Performance of Asynchronous Serial Communication)

  • 박근덕;오삼권;김병국
    • 한국산학기술학회논문지
    • /
    • 제12권3호
    • /
    • pp.1380-1386
    • /
    • 2011
  • 인터럽트의 발생은 태스크의 문맥전환(context switching)을 수반한다. 이러한 문맥전환 오버헤드는, 인터럽트가 빈번하게 발생하는 경우, 임베디드 시스템의 성능을 심각하게 저하시킬 수 있다. 본 논문은 비동기 시리얼 통신에서의 빈번한 송수신 인터럽트 발생으로 인한 처리 오버헤드를 줄이기 위해, 일정한 수의 인터럽트를 누적시켜 한 번에 처리하는 인터럽트 통합(IC, interrupt coalescence) 기법을 적용한 확장 비동기 시리얼 통신 기법을 소개한다. 이 기법에 대한 성능 평가를 위해 한 바이트 단위로 송수신 인터럽트가 발생하는 기존 비동기 시리얼 통신 방식을 LN2440SBC 임베디드 보드와 uC/OS-II 상에서 구현 하여, 인터럽트 처리 소요 시간을 비교 평가한다. 평가 결과, 제안한 방식의 송수신 인터럽트 처리 소요 시간은 기존 방식에 비해, 저속(9,600 bps)의 경우, 송신은 평균 25.18% 수신은 평균 41.47%의 감소를 보이며, 고속(115,200 bps)의 경우, 송신은 평균 16.67%, 수신은 평균 25.61%의 감소를 보임으로써, 송수신 인터럽트 처리 오버헤드의 감소를 보인다.

다중프로세서 시스템을 위한 여유시간 기반의 온라인 실시간 스케줄링 알고리즘 (A Laxity Based On-line Real-Time Scheduling Algorithm for Multiprocessor Systems)

  • 조규억;김용석
    • 정보처리학회논문지A
    • /
    • 제16A권6호
    • /
    • pp.437-442
    • /
    • 2009
  • 마감시간을 기준으로 스케줄링하는 EDF (Earliest Deadline Fisrt) 알고리즘이나 여유시간을 기준으로 스케줄링 하는 LLF (Least Laxity First) 알고리즘과 같은 기존의 방식들은 다중프로세서 시스템에서는 스케줄링 성공률이 급격히 낮아지거나 문맥교환 획수가 지나치게 높아 현 실적인 적용에 무리가 있다. 이 둘을 적절히 조합하여 성능을 개선한 것으로서 EDZL (Earliest Deadline Zero Laxity)은 EDF를 기본으로 하고 여유시간이 0에 도달한 태스크에 대해서는 우선적으로 실행하도록 하는 방식이다. 본 논문에서는 LLF와 같이 최소 여유시간의 태스크를 우선 적으로 실행하되 문맥교환은 여유시간이 0에 도달한 태스크가 발생할 경우에만 이루어지도록 한 LLZL (Least Laxity Zero Laxity) 알고리즘을 제안한다. 시뮬레이션 평가결과 LLZL은 준최적으로 알려져 있는 LLF에 근접한 높은 스케줄링 성공률을 보이면서도 문맥교환 오버헤드는 EDF 와 비슷한 낮은 수준을 유지하였다. EDZL과의 비교에 있어서도 스케줄링 성공률, 문맥교환 횟수 두 가지 측면 모두 나은 성능을 보인다.

다중처리기 시스템에서 데드라인과 여유시간을 통합한 실시간 스케줄링 기법 (Integrating Deadline with Laxity for Real-time Scheduling in Multiprocessor Systems)

  • 조성제
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제29권11호
    • /
    • pp.611-621
    • /
    • 2002
  • 실시간 시스템에서 많은 요청을 처리하기 위해 다중처리기 구조가 필수적이 되었다. EDF나 LLA와 같은 기존의 실시간 온라인 스케줄링 알고리즘들은 다중처리기 시스템에서 실시간 태스크들을 스케줄링하는 데 적합하지 않다. EDF의 경우 문맥교환 오버헤드가 낮지만 다중처리기 이상현상을 보이며, LLA의 경우 준최적이지만 문맥교환 오버헤드가 높다. EDZL은 두 알고리즘의 문제점을 일부 해결하였으나 세 개 이상의 처리기에서는 준최적이 아니다. EDA2는 과부하 단계에서 좋은 성능을 보이지만 준최적이 아니다. 본 논문에서는 새로운 두개의 온라인 스케줄링 알고리즘 ED/LL과 ED2/LL을 제안한다. ED/LL은 다중처리기에서 준최적이며, 정상부하 단계에서 낮은 문맥교환 오버헤드와 높은 성공률을 보인다. 그러나, 시스템이 과부하 상태가 되면 ED/LL은 비효율적이다. 이를 해결하기 위해, ED2/LL은 정상 부하 단계에서는 ED/LL 또는 EDZL을 사용하고 과부하 단계에서는 EDA2를 사용한다. 실험을 통해 ED2/LL이 정상부하 단계에서는 물론 과부하 단계에서도 좋은 성능을 보임을 확인할 수 있었다.

A Study on Sorting in A Computer Using The Binary Multi-level Multi-access Protocol

  • Jung Chang-Duk
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.303-310
    • /
    • 2006
  • The sorting algorithms have been developed to take advantage of distributed computers. But the speedup of parallel sorting algorithms decrease rapidly with increased number of processors due to parallel processing overhead such as context switching time and inter-processor communication cost. In this paper, we propose a parallel sorting method which provides linear speedup of an optimal serial algorithm for a system with a large number of processors. This algorithm may even provide superlinear speedup for a practical system. The algorithm takes advantage of an interconnection network properties and its protocol.

  • PDF

커널 스레드 웹 가속기의 분석 (Analysis of Kernel-Thread Web Accelerator)

  • 황준;남의석;민병조;김학배
    • 한국컴퓨터산업교육학회:학술대회논문집
    • /
    • 한국컴퓨터산업교육학회 2003년도 제4회 종합학술대회 논문집
    • /
    • pp.17-22
    • /
    • 2003
  • The surge of Internet traffic makes the bottleneck nowadays. This problem can be reduced by substituting the media of network, routers and switches with more high-performance goods. However, we focused radically the server performance of processing the service requests. We prepose the method improving performance of server in the Linux kernel stack. This accelerator accepts the requests from many clients, and processes them using not user threads but kernel thread. To do so, we can reduce the overhead caused by frequent calling of system calls and the overhead of context switching between threads. Furthermore, we implement CPN(Coloured Petri Net) model. By using the CPN model criteria, we can analyze the characteristics of operation times in addition to the reachability of system. Benchmark of the system proves the model is valid.

  • PDF

웹 애플리케이션 개발에서의 개인 프로세스 데이터 수집 및 분석을 위한 도구 (Collecting and Analyzing Personal Software Process Data in Web Application Development)

  • 신현일;최호진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.539-542
    • /
    • 2006
  • Personal Software Process (PSP)에서 개인 개발자들이 수행해야 되는 측정 및 분석 활동이 제시된다. 측정 및 분석 활동의 일관되고 지속적인 수행으로 개발자들은 소프트웨어 품질 향상, 보다 정확한 예측, 개인 역량의 객관적인 평가, 개인 프로세스의 정량적 관리 등의 이득을 얻을 수 있다. 측정 및 분석 활동에서 신뢰성 있는 데이터의 수집이 무엇보다 중요하다. 하지만, 데이터 수집의 높은 오버헤드(overhead)와 컨텍스트 스위칭(context switching)의 문제로 인하여 신뢰성 있는 데이터의 수집에 많은 어려움이 존재한다. 이러한 어려움을 감소시키기 위해 자동 데이터 수집 및 분석 기법이 연구되어 왔다. 본 논문에서는 기존의 자동 데이터 수집 및 분석 기법을 확장하여 웹 애플리케이션 개발에서의 개인 프로세스 데이터를 자동 수집 및 분석 하는 도구를 설명한다.

  • PDF

다중 프로세서 시스템에서 문맥교환을 줄이기 위한 변형된 LLF 스케줄링 알고리즘 (A Modified Least-Laxity First Scheduling Algorithm for Reducing Context Switches on Multiprocessor Systems)

  • 오성흔;길아라;양승민
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권2호
    • /
    • pp.68-77
    • /
    • 2003
  • 최소 여유시간 우선(Least-Laxity First, LLF) 스케줄링 알고리즘은 작은 여유시간을 가진 태스크가 높은 우선순위를 갖는 스케줄링 알고리즘으로써 단일 프로세서 시스템에서 최적이고 다중 프로세서 시스템에서 준최적으로 증명되었다. 그러나 이 스케줄링 알고리즘은 여유시간 충돌이 발생하였을 때 태스크 간에 빈번한 문맥교환이 발생하게 되는 문제점이 있어 실용적이지 못하다. 본 논문에서는 과도한 문맥교환을 일으키는 LLF의 문제점을 해결하기 위해 다중 프로세서 시스템을 위한 MLLF/MP(Modified Least-Laxity First on Multiprocessor) 스케줄링 알고리즘을 제안한다. MLLF/MP는 태스크의 여유시간 역전이 발생하더라도 마감시간을 놓치지 않는 범위에서 태스크를 연속적으로 수행시킴으로써 빈번한 문맥교환이 발생하는 것을 방지한다. MLLF/MP 또한 다중 프로세서 시스템에서 준최적임을 증명한다. 모의 실험 결과를 통하여 MLLF/MP는 LLF보다 적은 스케줄링 오버헤드를 가짐을 보인다.

안드로이드 IPC 가속화를 위한 커널 바인더 캐쉬의 설계 및 구현 (Design and Implementation of Kernel Binder Cache for Accelerating Android IPC)

  • 연제성;고건;이은지
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.33-38
    • /
    • 2016
  • 현재 안드로이드는 유저 레벨의 데몬들을 통하여 시스템에 필요한 기능을 서비스 함수로 지원하고 IPC를 사용해 호출되도록 한다. 그런데 서비스 함수를 관리하는 작업이 빈번하게 사용되는 Critical Path 임에도 불구하고, 유저 레벨 프로세스가 수행하도록 되어 있다. 이러한 분리된 구조는 모듈성과 유연성의 관점에서 효율적이지만 복잡한 소프트웨어 스택 및 컨텍스트 스위치 오버헤드 등으로 서비스 응답 시간이 상당히 저하된다. 본 논문에서는 안드로이드 IPC 매커니즘의 병목점이 되는 부분을 분석하고 개선함으로써 이러한 문제를 해결한다. 우리는 IPC 지연 시간 중 55%가 커널과 컨텍스트 매니저 사이의 커뮤니케이션 오버헤드인 것을 발견하고, 서비스 함수 중 자주 접근되는 것들에 대한 정보는 커널 내에 캐쉬 형태로 유지하는 기법을 제안한다. 제안된 IPC 캐쉬는 안드로이드 5.0에 구현되었으며, 다양한 모바일 벤치마크를 통해 성능평가를 수행한 결과 52.9%의 성능이 향상되었다.

다중스레드 모델에서 최단 프레임 우선 스레드 스케줄링 알고리즘 (Shortest-Frame-First Scheduling Algorithm of Threads On Multithreaded Models)

  • 심우호;유원희;양창모
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권5호
    • /
    • pp.575-582
    • /
    • 2000
  • 기존 다중스레드 모델에서의 주로 사용되는 선입선출 스케줄링 알고리즘은 실행의 지역성을 고려하지 않았기 때문에 높은 문맥전환 비용과 상대적으로 수행 시간이 짧은 프레임의 지연이 야기되어 일부 환경에서는 실행의 효율성을 떨어뜨리는 요인이 된다. 선입선출 스케줄링 알고리즘의 문제를 개선한 TAM의 퀀텀 단위 스케줄링 방법은 퀀텀 단위의 우선권을 너무 강조하므로 프로그램 실행의 병렬성을 제한시켜 프로세서의 활용도가 저하될 수 있고, 프레임 내에 있는 스레드들 간의 동기화로 인한 지연이 발생될 경우 대기 시간이 길어질 수 있다는 문제점을 가지고 있다. 위의 문제점들을 해결하기 위해 본 논문에서는 컴파일러에 의해 생성된 스레드의 크기와 동기화 정보를 이용하여 상대적으로 가장 짧은 프레임의 실행 시간을 예상하여 이를 우선적으로 처리하는 최단 프레임 우선(shortest-frame-first) 스케줄링 알고리즘을 제안한다. 다중스레드 모델은 실행의 일부분 특히 동기화 처리를 컴파일러에 의존하는 방식을 취함으로써 작업 시간에 대한 정확한 예상과 일관성을 쉽게 이용할 수 있다. 제안한 최단 프레임 우선 스케줄링 알고리즘을 선입선출 스케줄링 알고리즘과 비교한 실험 결과, 실행시간의 평가에서는 평균 15% 정도 실행 시간을 단축시켰고 프로세서 활용도의 평가에서는 5% 정도의 성능 향상을 얻었다. 그리고 대기 시간의 평가에서는 평균 24% 정도의 대기 시간을 줄였다.

  • PDF