• 제목/요약/키워드: CPU 시간

검색결과 518건 처리시간 0.031초

Assessing the ED-H Scheduler in Batteryless Energy Harvesting End Devices: A Simulation-Based Approach for LoRaWAN Class-A Networks

  • Sangsoo Park
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.1-9
    • /
    • 2024
  • 본 논문에서는 LoRaEnergySim에 최적의 실시간 스케줄링 알고리즘으로 알려진 ED-H 스케줄링 알고리즘을 연동하여 LoRaWAN 클래스-A 단말기에 슈퍼 커패시터 기반의 에너지 하베스팅 시스템을 전원 공급 장치를 적용하였을 때 시간 제약성을 갖는 LoRaWAN 컨트롤러의 태스크와 응용 태스크의 실시간 스케줄링 알고리즘 간의 상호 시뮬레이션이 가능하도록 한다. 이를 위해 LoRaWAN의 상태와 상태 전환에 따른 시간과 에너지 특성을 로그 형태로 추출하고 타임 슬롯 기반의 ED-H 스케줄링 알고리즘에 적합하도록 태스크 모델을 수립하고 태스크가 CPU에 의해서 수행되는 특성에 따라 알고리즘이 시간 제약성을 만족하며 태스크를 수행할 수 있도록 확장하였다. 본 논문에서 제안한 기법의 평가를 위해 LoRaEnergySim 시뮬레이션 결과가 제시된 동일 환경에서 패킷 송수신이 수행되는 것과 동시에 10%에서 90%의 CPU 점유율을 갖는 다양한 시간과 에너지 특성을 갖는 태스크 집합에 대해 ED-H 스케줄링 알고리즘을 수행하였으며, 실험 결과로 스케줄링 알고리즘에 따라 시간 제약성의 만족을 위해 슈퍼 커패시터의 에너지가 고갈되지 않는 한 태스크의 시급성을 우선하여 사용하는 것을 확인하여 상호 시뮬레이션의 적용 가능성을 확인하였다.

Mobile 임베디드 시스템의 CPU 소모전력 관리 기법 (The CPU power management technique in the Mobile Embedded System)

  • 김화영;김영길
    • 한국정보통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.170-176
    • /
    • 2009
  • 배터리를 전원으로 사용하는 이동 통신 기기에서 전력관리의 효율성은 전통적으로 중요한 요구조건 중의 하나이다. 특히 고성능과 고기능을 제공하면서도 더 긴 동작시간이 요구되는 최근의 이동 통신 기기들에서는 이러한 효율적인 전력 관리의 중요성이 더욱 크다. 본 논문은 전력 소모량과 시스템의 크기에서의 장점으로 인해 이동 통신기기에 폭 넓게 적용되고 있는 임베디드 system에서의 효율적인 전력 관리를 위한 CPU 소모 전력 관리 기법으로 적응적 동적 전력 관리 기법을 제안한다.

계층적 비디오 코딩의 품질확장성을 활용한 전력 관리 기법 (Exploiting Quality Scalability in Scalable Video Coding (SVC) for Effective Power Management in Video Playback)

  • 정현미;송민석
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권11호
    • /
    • pp.604-609
    • /
    • 2014
  • 미디어 플레이어에서의 디코딩 과정은 많은 연산을 필요로 하며, CPU로부터 높은 소비전력을 초래한다. 디코딩 연산을 줄이는 것은 CPU 소비 전력을 감소시킬 수 있지만 사용자로부터 비디오 품질을 저하시키게 된다. 본 논문에서는 H.264의 품질 확장성을 이용하여 새로운 CPU 전력 관리 기법을 제안한다. 첫째, VQM(Video Quality Metric)을 사용하여 계층적 비디오 코딩의 서로 다른 양자화 인자를 고려한 새로운 비디오 품질 모델을 제안한다. 그리고 이전 디코딩 시간과 프레임 크기를 선택적으로 융합한 디코딩 시간 예측기법에 기반한 새로운 동적 전압 기법을 제안한다. 최신 스마트폰에서 구현하였고, 사용자 테스트를 수행하였다. 제안한 기법을 실제 측정에 적용하였을 때 리눅스 동적 전압 및 주파수 조절(DVFS) 거버너에 비해 34%의 에너지 감소를 보였고 사용자 테스트를 통해 실험 영상의 품질 하락을 사용자는 인지하지 못하거나 용인될 수 있음을 확인하였다.

다중사용자용 실시간 게임 서버를 위한 우선순위 기반 그룹 태스크 스케쥴링 정책 (Priority-based Group Task Scheduling Policy for a Multiplayer Real-time Game Server)

  • 김진환
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권4호
    • /
    • pp.57-64
    • /
    • 2012
  • 게임 서버는 명시된 시간 내에 많은 클라이언트들의 요청을 처리해야 하기 때문에 다중 사용자용 실시간 게임들은 일종의 연성 실시간 시스템이다. 클라이언트 이벤트들은 게임 세계의 본질에 따라 상이한 시간 요건과 일관성 요건을 가지고 있다. 이러한 요건들은 CPU 처리시 상이한 우선순위를 유발하게 되며 이벤트들은 일관성과 우선순위 정도에 따라 여러 그룹으로 분류될 수 있다. 우선순위가 상이한 이벤트들의 시간적 요건을 충족하기 위하여 본 논문에서는 우선순위 기반 그룹 태스크 스케쥴링 정책이 제시된다. 클라이언트의 수나 클라이언트가 발생시키는 이벤트들의 수는 일시적으로 증가할 수 있다. 일시적인 과부하가 발생한 경우에 게임 서버는 우선순위가 높은 이벤트들을 우선적으로 처리하기 위하여 더 많은 CPU 대역폭을 할당할 필요가 있다. 제시된 스케쥴링 정책은 우선순위가 높은 이벤트일수록 종료시한내에 성공적으로 종료되는 수를 최대화함으로써 전체 시스템의 실시간적 성능을 향상시킬 수 있다. 이 정책의 성능은 다양한 실험을 통하여 평가되었다.

DVB-T 수신기를 위한 대규모 병렬처리 GPU 기반의 비터비 복호기 구현 (Implementation of Viterbi Decoder on Massively Parallel GPU for DVB-T Receiver)

  • 이규형;이호경;허서원
    • 전자공학회논문지
    • /
    • 제50권9호
    • /
    • pp.3-11
    • /
    • 2013
  • 최근 GPU의 대규모 병렬 연산 능력을 이용하여 통신 시스템을 구현하려는 연구가 활발히 진행되고 있다. 본 논문에서는 DVB-T에 적용된 비터비 복호기를 슬라이딩 블록 방법과 함께 GPU에 적용시켜 소프트웨어 모의실험 처리시간을 줄였다. 본 논문에서는 먼저 DTV 표준 방식의 일종인 DVB-T 시스템을 CPU로 구현하여 모의실험을 통해 한 개의 OFDM 심볼을 처리하는데 소요되는 시간을 추정한다. 그리고 슬라이딩 블록 방법을 적용한 DVB-T의 비터비 복호기를 NVIDIA사의 대용량 GPU 프로세서를 이용하여 소프트웨어로 구현한다. 본 논문은 GPU 소프트웨어의 최적화를 위해 CPU와 GPU 간의 데이터 전송에 소요되는 오버헤드를 줄이는 스트림 처리 기법, 전역 메모리 전송 시간을 단축하기 위한 결합 전송 기법 (coalescing), 공유 메모리 접근의 효율성을 높이기 위한 변수 설계 기법 등을 통해서 연산처리 속도를 대폭 향상시켰다. 그 결과 제안된 방식은 CPU 기반의 비터비 복호기보다 2K 모드에서 약 11배, 8K 모드에서 약 60배 정도 빠른 처리 능력을 보인다.

실시간 SAR 영상 생성을 위한 Range Doppler Algorithm의 GPU 가속 (GPU Acceleration of Range Doppler Algorithm for Real-Time SAR Image Generation)

  • 정동민;이우경;이명진;정윤호
    • 전기전자학회논문지
    • /
    • 제27권3호
    • /
    • pp.265-272
    • /
    • 2023
  • 본 논문에서는 FMCW(Frequency Modulated Continuous Wave) SAR(Synthetic Aperture Radar) 기반 실시간 영상 형성을 위해 RDA(Range Doppler Algorithm)의 GPU 가속 커널을 개발하였다. Host와 GPU device 사이의 데이터 전송 시간을 최소화하기 위해 pinned 메모리를 사용하였고, 데이터의 전송 횟수를 최소화하기 위해 모든 RDA 연산을 GPU에서 수행하도록 커널을 구성하였다. FMCW 드론 SAR 실험을 통해 데이터셋를 획득하였고, intel i7-9700K CPU, 32GB RAM과 Nvidia RTX 3090 GPU 환경에서 GPU의 가속 효과를 측정하였다. Host-device간 데이터 전송 시간을 포함했을 경우 CPU 대비 최대 3.41배 가속된 것으로 측정되었고, 데이터 전송 시간을 포함하지 않고 연산의 가속 효과만을 측정했을 때, 최대 156배 가속 가능함을 확인할 수 있었다.

GPU 가속 운동파 강우유출모형의 적용 연구 (A study on application of GPU-accelerated kinematic wave rainfall-runoff model)

  • 김보람;윤관선;김형준;윤광석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.323-323
    • /
    • 2020
  • 그래픽 처리 장치(Graphic Processing Unit: GPU)는 그래픽 처리 작업에 특화된 다수의 산술논리 장치(Arithmetic Logic Unit: ALU)로 구성되어 있어서 중앙 처리 장치(Central Processing Unit: CPU)보다 한 번에 더 많은 연산 수행이 가능하다. 본 연구는 GPU 가속 운동파모형을 실제 유역에 적용하여, GPU 가속 운동파 강우유출모형 결과에 대한 정확성과 연산 소요 시간에 대한 효율성을 확인하였다. GPU 가속 운동파모형은 분포형 강우유출모형의 수치모의 연산시간을 단축시키기 위해 CUDA 포트란을 이용하여 개발되었다. 분포형모형의 지배방정식은 운동파모형과 Green-Ampt모형으로 구성되었고, 운동파모형은 유한체적법을 이용하여 이산화 하였다. GPU 가속 운동파모형을 이용하여 금강의 미호천 유역에서 발생하는 강우유출현상을 모의 하였고, 동일한 유한체적법을 이용한 CPU(Central Processing Unit) 기반의 강우유출모형과 비교하였다. 그 결과 GPU 가속모형의 결과는 미호천 유역 하류단에서 관측한 결과와 유사한 결과를 나타냈다. 또한, 연산소요시간은 CPU 기반의 강우유출모형의 연산소요시간보다 단축되었으며, 본 연구에 사용된 장비를 기준으로 최대 100배 정도 단축되었다.

  • PDF

방출단층촬영 시스템을 위한 GPU 기반 반복적 기댓값 최대화 재구성 알고리즘 연구 (A Study on GPU-based Iterative ML-EM Reconstruction Algorithm for Emission Computed Tomographic Imaging Systems)

  • 하우석;김수미;박민재;이동수;이재성
    • Nuclear Medicine and Molecular Imaging
    • /
    • 제43권5호
    • /
    • pp.459-467
    • /
    • 2009
  • 목적: ML-EM (The maximum likelihood-expectation maximization) 기법은 방출과 검출 과정에 대한 통계학적 모델에 기반한 재구성 알고리즘이다. ML-EM은 결과 영상의 정확성과 유용성에 있어 많은 이점이 있는 반면 반복적인 계산과 방대한 작업량 때문에 CPU(central processing unit)로 처리할 때 상당한 연산시간이 소요되었다. 본 연구에서는 GPU(graphic processing unit)의 병렬 처리 기술을 ML-EM 알고리즘에 적용하여 영상을 재구성하였다. 대상 및 방법: 엔비디아사(社)의 CUDA 기술을 이용하여 ML-EM 알고리즘의 투사 및 역투사 과정을 병렬화 전략을 구상하였으며 Geforce 9800 GTX+ 그래픽 카드를 이용하여 병렬화 연산을 수행하여 기존의 단일 CPU기반 연산법과 비교하였다. 각 반복횟수마다 투사 및 역투사 과정에 걸리는 총 지연 시간과 퍼센트 오차(percent error)를 측정하였다. 총 지연 시간에는 RAM과 GPU 메모리 간의 데이터 전송 지연 시간도 포함하였다. 결과: 모든 반복횟수에 대해 CPU 기반 ML-EM 알고리즘보다 GPU 기반 알고리즘이 더 빠른 성능을 나타내는 것을 확인하였다. 단일 CPU 및 GPU 기반 ML-EM의 32번 반복연산에 있어 각각 3.83초와 0.26초가 걸렸으며 GPU의 병렬연산의 경우 15배 정도의 개선된 성능을 보였다. 반복횟수가 1024까지 증가하였을 경우, CPU와 GPU 기반 알고리즘은 각각 18분과 8초의 연산시간이 걸렸다. GPU 기반 알고리즘이 약 135배 빠른 처리속도를 보였는데 이는 단일 CPU 계산이 특정 반복횟수 이후 나타나는 시간 지연에 따른 것이다. 결과적으로, GPU 기반 계산이 더 작은 편차와 빠른 속도를 보였다. 결론: ML-EM 알고리즘에 기초한 GPU기반 병렬 계산이 처리 속도와 안정성을 더 증진시킴을 확인하였으며 이를 활용해 다른 영상 재구성 알고리즘에도 적용시킬 수 있을 것으로 기대한다.

렌더링 가속화 기술 동향 (The Recent Trends of Rendering Acceleration Technologies)

  • 남승우;김해동;김성수;최진성
    • 전자통신동향분석
    • /
    • 제22권4호통권106호
    • /
    • pp.12-23
    • /
    • 2007
  • 컴퓨터 그래픽스를 이용한 디지털 콘텐츠를 제작 및 생산함에 있어서 마지막 단계에서 렌더링 과정을 꼭 거쳐야 하기 때문에 렌더링 부분은 아주 중요하다. 렌더링해야 할 디지털 콘텐츠에는 게임과 같이 실시간성이 아주 중요한 콘텐츠가 있으며, 영화와 같이 영상의 높은 품질을 요구하는 콘텐츠가 있다. 본 고에서는 영화와 같이 고품질을 요구하는 콘텐츠에 대한 렌더링 기술에 대하여 다루고자 한다. 영화의 한 장면과 같이 복잡하며 높은 해상도를 갖는 영상을 기존 단일 CPU 및 소프트웨어 렌더러를 이용하여 렌더링하는 데 아주 많은 시간이 걸린다. 본 고에서는 렌더링 시간을 줄이며 높은 품질의 렌더링 결과를 얻는 기술을 3가지 부분에서 소개하고자 한다. 첫번째 방법에는 수십 개에서 수천 개의 CPU를 이용하거나 PC를 클러스터링하는 방법이고, 두번째는 기존 GPU의 기술이 아주 빨리 발전하여 CPU 보다 빠른 성능을 갖기 때문에 GPU를 활용하여 가속화하는 방법이 있으며, 세번째는 전용 하드웨어를 제작하여 렌더링을 가속하는 방법이 있다. 위의 방법들에 대한 기술 동향에 대하여 살펴보도록 한다.

Kubeflow 환경에서 CPU 집약적인 작업을 위한 컨테이너 수에 따른 연산 시간 비교 및 분석 (Comparative Analysis of Computation Times Based on the Number of Containers for CPU-Intensive Tasks in the Kubeflow Environment)

  • 정현승;강태신;유헌창;강지훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.93-96
    • /
    • 2023
  • 머신 러닝의 수요가 증가함에 따라, 머신 러닝 워크플로우의 배포 수요도 증가했다. Kubeflow를 통해 머신 러닝 배포를 편리하게 할 수 있으며, Kubeflow Pipelines에서는 하나의 작업을 여러 컨테이너로 분산시켜서 연산하는 것이 가능하다. 하지만 컨테이너 수를 많이 늘릴수록 반드시 성능이 향상되는 것은 아니다. 따라서, 본 연구에서는 성능 향상의 한계를 제공하는 원인을 분석하기 위해서, Kubeflow에서 CPU 집약적인 작업을 여러 컨테이너로 분산시켜서 연산을 수행하였다. 컨테이너 수에 따른 연산 완료 시간을 비교 및 분석한 결과, 컨테이너 수가 증가할수록 연산 속도 향상이 빨라지나, 어느 시점을 지나면 속도가 다시 완만하게 줄어드는 현상을 확인하였다. 이는 리소스 제한으로 인해 모든 컨테이너가 동시에 스케줄링 되지 못한 것이 가장 큰 원인으로 분석하였다.