• 제목/요약/키워드: CPU Time

검색결과 939건 처리시간 0.028초

고정우선순위 버스 프로토콜 환경에서 DMA I/O 요구의 최악 응답시간 분석 (Analysis of Worst Case DMA Response Time in Fixed-Priority Bus Arbitration Protocol)

  • 한주선;하란;민상렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.21-23
    • /
    • 1999
  • CPU에게 최상위 우선순위가 할당된 고정 우선순위 버스 프로토콜에서는 CPU와 DMA 컨트롤러의 버스 요구가 충돌할 경우 DMA 전송이 지연된다. 본 논문에서는 CPU와 다수의 DMA 컨트롤러가 시스템 버스를 공유하는 환경에서 DAM I/O 요구의 최악 응답시간을 분석하는 기법을 제안한다. 제안하는 최악 응답시간 분석 기법은 다음의 세단계로 구성되어 있다. 첫 번째 단계에서는 CPU 상에서 수행중인 각 CPU 태스크별로 최악 버스 요구 패턴을 구한다. 두 번째 단계에서는 이들 CPU 태스크의 최악 버스 요구 패턴을 모두 통합해 CPU 전체의 최악 버스 요구 패턴을 구한다. 최종 세 번째 단계에서는 CPU의 최악 버스 요구 패턴으로부터 DMA 컨트롤러의 버스 가용량을 구하고 DMA I/O 요구의 최악 응답시간을 산출한다. 모의 실험을 통해 제안하는 분석 기법일 일반적인 DMA전송량에 대해 20% 오차 범위 이내에서 안전한 응답시간을 산출함을 보였다.

  • PDF

CPU 클러스터 구축 및 3차원 공간분할 병렬 FDTD 알고리즘 구현 (Construction of a CPU Cluster and Implementation of a 3-D Domain Decomposition Parallel FDTD Algorithm)

  • 박성민;추광욱;주세훈;박윤미;김기백;정경영
    • 한국전자파학회논문지
    • /
    • 제25권3호
    • /
    • pp.357-364
    • /
    • 2014
  • 본 연구에서는 빠르게 전자파 해석을 수행할 수 있는 병렬 유한차분 시간영역(Finite-Difference Time-Domain: FDTD) 알고리즘을 구현하기 위하여 CPU 클러스터를 구축하였다. 병렬 FDTD 알고리즘은 단일 프로세서를 이용한 FDTD 알고리즘에 비해 해석 시간을 크게 줄일 수 있으며, 전기적으로 매우 큰 구조물에 대한 전자파 해석도 가능하다. 본 연구팀에서는 CPU 클러스터 기반의 병렬 FDTD 알고리즘에서 요구되는 프로세스 간의 통신을 위해 MPI(Message Passing Interface) 라이브러리를 이용하였으며, 3차원 공간분할을 적용하여 프로세스 간의 통신 시간을 최소화하였다. 단일 프로세서를 이용한 FDTD 알고리즘 대비 CPU 클러스터 기반의 병렬 FDTD 알고리즘의 계산속도 향상도를 기본 모드와 하이퍼 모드에서 분석하였으며, 전기적으로 매우 큰 콘크리트 구조물의 전자파 해석을 하였다.

CPU 기반의 딥러닝 컨볼루션 신경망을 이용한 이륜 차량 번호판 인식 알고리즘 (Twowheeled Motor Vehicle License Plate Recognition Algorithm using CPU based Deep Learning Convolutional Neural Network)

  • 김진호
    • 디지털산업정보학회논문지
    • /
    • 제19권4호
    • /
    • pp.127-136
    • /
    • 2023
  • Many research results on the traffic enforcement of illegal driving of twowheeled motor vehicles using license plate recognition are introduced. Deep learning convolutional neural networks can be used for character and word recognition of license plates because of better generalization capability compared to traditional Backpropagation neural networks. In the plates of twowheeled motor vehicles, the interdependent government and city words are included. If we implement the mutually independent word recognizers using error correction rules for two word recognition results, efficient license plate recognition results can be derived. The CPU based convolutional neural network without library under real time processing has an advantage of low cost real application compared to GPU based convolutional neural network with library. In this paper twowheeled motor vehicle license plate recognition algorithm is introduced using CPU based deep-learning convolutional neural network. The experimental results show that the proposed plate recognizer has 96.2% success rate for outdoor twowheeled motor vehicle images in real time.

VIT: 게스트 운영체제의 실시간성 지원을 위한 타이머 하이퍼콜 (VTF: A Timer Hypercall to Support Real-time of Guest Operating Systems)

  • 박미리;홍철호;유시환;유혁
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제37권1호
    • /
    • pp.35-42
    • /
    • 2010
  • 가상화 환경에서는 여러 개의 게스트 운영체제가 자원을 공유하고 있는데 특히 CPU는 시간 분할 방식에 의해 분배 된다. 따라서 각 가상 머신은 모든 물리 시간을 점유하지 못하고, 이는 CPU를 점유하지 못한 시간에 동작해야 하는 태스크 실행이 보장되지 못하는 결과를 야기시킨다. 이와 같은 응답성의 저하는 기존의 서버 가상화에서 치명적인 문제가 되지 않으나 임베디드 시스템에서 동작하는 실시간 태스크 측면에서는 중요하게 다루어 져야 하는 요구사항이 된다. 본 논문에서 우리는 실시간성과 관련된 타이머를 가상 머신 모니터에 등록할 수 있는 하이퍼콜을 제안한다. 이 하이퍼콜을 통하여 등록된 타이머는 만료된 시점에 해당 가상 머신이 실행되게 한다. 따라서 실시간성을 요하는 태스크들이 의도된 시간에 실행 가능하게 하며 다른 가상 머신의 기아 현상을 완화시켜 준다. 이어지는 실험에서는 Xen-Arm에 이를 구현하여 게스트 운영체제인 리눅스에서의 실시간성을 평가한다. 특히 테스트 응용과 Mplayer의 응답성 및 초당 프레임 수를 측정하여 한 개의 게스트 운영체제만이 동작하는 환경에서와 비슷한 실시간성이 지원될 수 있음을 보인다.

복수의 CPU로 제어되는 매니퓰레이터의 병렬계산 알고리즘 (Algorithm or Parallel Computation for a multi-CPU controlled Robot Manipulator)

  • 우광방;김현기;최규석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1987년도 전기.전자공학 학술대회 논문집(I)
    • /
    • pp.288-292
    • /
    • 1987
  • The purpose of this paper is to develope the parallel computation algorithm that enables it to minimize the completion tine of computation execution of the entire subtasks, under the constraints of the series-parallel precedence relation in each subtask. The developed algorithm was applied to the control of a robot manipulator functioned by multi-CPU's and to obtain the minimum time schedule so that real time control may be achieved. The completion time of computation execution was minimized by applying "Variable" Branch and Bound algorithm which was developed In this paper in determining the optimum ordered schedule for each CPU.

  • PDF

GPGPU를 이용한 파데브-레브리어 알고리즘 구현 및 성능 분석 (Implementation and Performance Evaluation of the Faddev-Leverrier Algorithm using GPGPU)

  • 박용훈;김철홍;김종면
    • 대한임베디드공학회논문지
    • /
    • 제8권3호
    • /
    • pp.171-178
    • /
    • 2013
  • In this paper, we implement the Faddev-Leverier algorithm using GPGPU (General-Purpose Graphics Processing Unit) to accelerate singular value decomposition. In addition, we compare the performance of the algorithm using CPU and CPU plus GPGPU for eleven ${\times}n$ matrix sizes in order to decompose singular values, where =4, 8, 16, 32, 64, 128, 256, 512, 1,024, 2,048, and 4,096. Experimental results indicate that CPU achieves better performance than CPU plus GPGPU for $n{\leq}64$ because of a large number of read and write operations between CPU and GPGPU. However, CPU plus GPGPU outperforms CPU exponentially in the execution time for $n{\geq}64$.

CUDA 기반의 병렬 프로그래밍을 통한 H.264/AVC 부호화 속도 향상 및 CPU 부하 경감 (Enhancement of H.264/AVC Encoding Speed and Reduction of CPU Load through Parallel Programming Based on CUDA)

  • 장은빈;하윤수
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제34권6호
    • /
    • pp.858-863
    • /
    • 2010
  • H.264/AVC를 이용한 동영상의 부호화에서 그 속도를 높이기 위해서는 움직임 예측시간을 줄이는 것이 매우 중요하다. 본 논문에서는 H.264/AVC 부호기의 오픈 소스인 x.264를 대상으로 움직임 예측 알고리즘을 CUDA 기반에서 구현함으로서 기존의 압축 기술 이상의 속도 향상 및 CPU의 점유율을 경감 시킬 수 있음을 검증한다.

32비트(MC 68020) CPU를 사용한 직접구동방식 로보트의 제어기 설계 (A controller design for direct drive arm robot using 32-Bit (MC 68020) CPU)

  • 이주장;윤형우;곽윤근
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1988년도 한국자동제어학술회의논문집(국내학술편); 한국전력공사연수원, 서울; 21-22 Oct. 1988
    • /
    • pp.82-85
    • /
    • 1988
  • This paper are the manufacture of controller of direct drive arm robot using 32 bit CPU(MC 69020). The work would draw on KIT of Robotics Laboratory whose extensive experience in 16 bit CPU Controller(MC 68008) in addition to the WHILE languages. We found that this controller is good for the direct drive arm robot controller for the use of self-tuning algorithms and real time control.

  • PDF

CPU Temperature on Traffic Processing between Two Servers

  • Lee, Sang-Bock;Kim, Hyun-Soo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.871-877
    • /
    • 2005
  • The purpose of this paper is to identify the CPU temperatures on traffic processing between two servers system. To test this model, this research applies multi-generator and resource reservation protocol that produce various types of traffics. The empirical results indicate that $56^{\circ}C\mp9^{\circ}C$ of CPU temperature is suitable when 250-300 traffics with 10-15kb per a packet are supplied. And also, no jitter delay time is showed in these cases.

  • PDF

동적 그래프에서 GPU 기반의 점진적 연결 요소 처리 (GPU Based Incremental Connected Component Processing in Dynamic Graphs)

  • 김남영;최도진;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제22권6호
    • /
    • pp.56-68
    • /
    • 2022
  • 최근 실시간 처리의 요구가 증가하면서 시간에 따라서 변화하는 동적 그래프에 관한 연구가 활발하게 진행되고 있다. 동적 그래프를 분석하기 위한 알고리즘의 하나로 연결 요소가 있다. GPU는 높은 메모리 대역폭, 연산 성능으로 대규모의 그래프 계산에 적합하다. 그러나 동적 그래프의 연결 요소를 GPU를 이용하여 처리할 때, GPU의 제한된 메모리로 인해 실제 그래프 처리 시 CPU와 GPU 간에 잦은 데이터 교환이 발생한다. 본 논문에서는 동적 그래프에서 GPU 기반의 효율적인 점진적 연결 요소 처리 기법을 제안한다. 제안하는 기법은 Weighted-Quick-Union 알고리즘을 기반으로 연결 요소 레이블에 구성 요소의 개수를 이용하여 연결 요소를 빠르게 계산한다. 또한, 재계산할 부분을 판별하여 GPU로 전송할 데이터를 최소화하여 대규모 그래프에 대하여 CPU와 GPU 간의 데이터 교환 횟수를 감소시킨다. 뿐만 아니라 GPU와 CPU 간에 데이터 전송 시간 낭비를 줄이기 위해 GPU와 CPU가 비동기로 실행하는 처리 구조를 제안한다. 실제 데이터 집합을 사용한 성능 평가를 통해 제안하는 기법의 우수성을 입증한다.