• 제목/요약/키워드: multi-core CPU

검색결과 76건 처리시간 0.038초

멀티코어 기반의 임베디드 시스템에서 안드로이드 부팅 속도 향상 방법 (An Improving Method of Android Boot Speed in Multi-core based Embedded System)

  • 최진용;이재흥
    • 전기전자학회논문지
    • /
    • 제17권4호
    • /
    • pp.564-569
    • /
    • 2013
  • 현재 임베디드 기기는 멀티코어로 급성장하고 있으며 빠른 부팅 속도를 요구하고 있다. 하지만 기존의 부팅 기술은 하나의 코어만을 사용하고 있다. 따라서 본 논문에서는 분석 도구를 통해 안드로이드 부트 프로세스를 분석후, CPU연산이 많은 곳에 병렬 기법을 적용하는 방법과 멀티 코어의 성능을 최대로 끌어내기 위해 CPU주파수 정책을 변경함으로써 멀티코어 기반에서 안드로이드 부팅 속도 향상 방법에 대해 제안한다. 본 논문의 제안 방법을 듀얼 코어 S5PV310과 쿼드 코어 Exynos4412에 각각 적용시킨 뒤 부팅 완료 시간을 측정하였으며 기존의 방법과 제안 방법의 시간을 비교한 결과 듀얼코어와 쿼드코어에서 각각 약 20.71%, 약 31.34%의 속도 성능향상을 가져왔다.

멀티코어 CPU를 갖는 공유 메모리 구조의 대규모 병렬 유한요소 코드에 대한 설계 고려 사항 (Design Considerations on Large-scale Parallel Finite Element Code in Shared Memory Architecture with Multi-Core CPU)

  • 조정래;조근희
    • 한국전산구조공학회논문집
    • /
    • 제30권2호
    • /
    • pp.127-135
    • /
    • 2017
  • 멀티코어 CPU와 BLAS, LAPACK을 구현한 최적 수치라이브러리, 직접 희소 솔버의 대중화 등 PC나 워크스테이션 수준에서도 대규모 유한요소 모델을 해석할 수 있도록 컴퓨팅 환경이 급속도로 변화되었다. 이 논문에서는 멀티코어 CPU를 갖는 공유 메모리 구조에 대한 병렬 유한요소 프로그램 설계시 고려사항으로 (1) 최적화된 수치라이브러리의 사용, (2) 최신 직접 희소 솔버의 사용, (3) OpenMP를 이용한 병렬 요소 강성 행렬의 계산, (4) 희소행렬 저장방식의 일종인 triplet을 이용한 어셈블 기법 등을 제시하였다. 또한 대규모 수치모델을 통해 많은 시간이 소요되는 작업을 기준으로 병렬화 효과를 검토하였다.

멀티코어와 매니코어 환경에서의 2 차원 DCT 가속 (Accelerating 2D DCT in Multi-core and Many-core Environments)

  • 홍진건;정성욱;김정길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.250-253
    • /
    • 2011
  • Chip manufacture nowadays turned their attention from accelerating uniprocessors to integrating multiple cores on a chip. Moreover desktop graphic hardware is now starting to support general purpose computation. Desktop users are able to use multi-core CPU and GPU as a high performance computing resources these days. However exploiting parallel computing resources are still challenging because of lack of higher programming abstraction for parallel programming. The 2-dimensional discrete cosine transform (2D-DCT) algorithms are most computational intensive part of JPEG encoding. There are many fast 2D-DCT algorithms already studied. We implemented several algorithms and estimated its runtime on multi-core CPU and GPU environments. Experiments show that data parallelism can be fully exploited on CPU and GPU architecture. We expect parallelized DCT bring performance benefit towards its applications such as JPEG and MPEG.

멀티코어 기반 어플리케이션 운용을 위한 데스크탑 가상화 구성 및 성능 분석 (VDI deployment and performance analysys for multi-core-based applications)

  • 박준용
    • 한국정보통신학회논문지
    • /
    • 제26권10호
    • /
    • pp.1432-1440
    • /
    • 2022
  • 최근 VDI(Virtual Desktop Infrastructure)가 오피스 업무 환경뿐만 아니라 고사양의 멀티코어 기반 어플리케이션을 사용하는 워크로드에도 많이 사용되면서 VDI에 대한 실시간성과 안정성에 대한 요구 사항이 증대되고 있다. 그에 따라 VDI에서 원격접속에 사용되는 디스플레이 프로토콜과 가상머신의 성능 최적화 또한 중요성이 높아졌다. 본 논문에서는 멀티코어 기반 어플리케이션 운용을 위한 데스크탑 가상화 구성을 위해 두 가지를 제안한다. 첫 번째는 멀티 프로세싱으로 인한 고부하 상황에서 최적의 성능을 가진 디스플레이 프로토콜의 코덱 구성을 제안한다. 두 번째는 가상머신 간 CPU 경합 시 스케쥴링 지연을 줄이기 위한 가상 CPU 스케쥴링 최적화 방안을 제안한다. 시험 결과 Blast Extreme의 H.264 코덱이 가장 좋고 안정적인 프레임을 보여줬으며 스케쥴링 최적화를 통해 가상 CPU의 스케쥴링 성능이 개선됨을 확인하였다.

도시철도역사에서 화재유동에 대한 병렬계산방법연구 (The development of parallel computation method for the fire-driven-flow in the subway station)

  • 장용준;이창현;김학범;박원희
    • 한국철도학회:학술대회논문집
    • /
    • 한국철도학회 2008년도 춘계학술대회 논문집
    • /
    • pp.1809-1815
    • /
    • 2008
  • 본 연구는 병렬처리기법을 이용하여 지하역사 화재유동을 시뮬레이션 하였다. 화재해석 프로그램으로는 LES(Large Eddy Simulation)화재해석 프로그램 중 하나인 FDS(Fire Dynamics Simulation)를 사용하여 연구를 진행하였으며, 각 Node당 3.0Ghz_2set이 탑재된 6-node parallel Cluster장비를 사용하여 병렬계산을 수행하였다. 시뮬레이션 모델은 광주 금난로 4가 지하역사를 대상으로 하였으며, 총 시뮬레이션 시간은 600s로 하였다. 먼저 Single-CPU와 Multi-CPU를 이용한 병렬계산과의 결과 비교를 위하여 전체역사를 1-Mesh와 8-Mesh로 나누어 각각 Single-CPU계산과 Multi-CPU를 이용하여 계산결과를 비교분석 하였으며, Single-CPU에서 처리가 불가능한 격자수($15{\times}10^6$)를 가지고 승강장 중앙에서의 화재와 객차 내에서의 화재유동분석 하였다. 연구결과 Single-CPU 해석과 Multi-CPU를 이용한 병렬계산에 있어서, 해석결과의 차이는 거의 없는 것으로 나타났다. 또한 계산시간의 비교에서도 14개의 Mesh를 가지고 약 300만개의 격자를 사용한 경우에 있어서 2CPU(4core)와 7CPU(14core)의 계산시간은 1CPU에 비하여 각각, 2배, 5배의 차이를 보였다. 병렬처리기법의 도입으로 Single-CPU의 한계를 극복하여 보다 빠르고 정확한 결과값을 얻을 수 있을 것으로 기대된다. 향후 병렬처리기법연구에 있어서 계산효율성 증대를 위한 연구가 계속적으로 진행되어야 할 것이다.

  • PDF

웨어러블 디바이스를 위한 다중 센서/통신용 모듈형 플랫폼 기술 (Modular platform techniques for multi-sensor/communication of wearable devices)

  • 박성훈;김주언;윤동현;백광현
    • 전기전자학회논문지
    • /
    • 제21권3호
    • /
    • pp.185-194
    • /
    • 2017
  • 본 논문에서는 다양한 분야와 환경에서 필요에 따라 기능을 쉽게 교환하고 조립이 가능한 모듈형 웨어러블 플랫폼을 제안한다. 제안된 플랫폼은 국내 CPU 코어 기반의 모듈형 플랫폼과 다양한 환경에 빠르게 대응하여 자유롭게 연결 가능한 plug & play 플랫폼으로 구성된다. 설계된 SoC는 32-bit RISC CPU, 32-bit symmetric multi-core processor, 그리고 16-bit DSP (CDSP)로 구성되고 여기에 필요에 따라 센서 모듈과 통신 모듈이 체인 형태로 연결된다. SoC 칩은 130nm 공정으로 개발되었고 온도와 습도 센서를 이용하여 제안된 모듈형 웨어러블 플랫폼의 기능의 동작을 검증하였다.

모바일 멀티 코어 GP-GPU를 이용한 H.264/AVC 디코더 구현 (Implementation of IQ/IDCT in H.264/AVC Decoder Using Mobile Multi-Core GPGPU)

  • 김동한;이광엽;정준모
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 추계학술대회
    • /
    • pp.321-324
    • /
    • 2010
  • 최근 멀티코어 프로세서의 이용이 증가함에 따라, 멀티코어를 이용한 다양한 병렬화 기법들이 제안되고 있다. 모바일 환경에서도 멀티코어 구조를 적용한 프로세서들이 등장하면서 병렬화 기법들이 연구되고 있다. 하지만, 아직까지 모바일 환경에서의 CPU의 성능은 한계가 있다. 이를 병렬처리와 실수 연산이 뛰어난 GPGPU(General-Purpose computing in Graphics Processing Units)를 멀티코어 구조로 설계함으로써 다른 전용 하드웨어의 추가 없이 성능을 향상 시킬 수 있다. 본 논문에서는 모바일 환경에 적합하게 설계된 멀티코어 GPGPU를 이용하여 H.264 디코더의 Inverse Quantization, Inverse DCT, Color Space Conversion 모듈을 구현하였다. 멀티코어 GPGPU를 이용한 H.264 전체 시스템 동작 시 50%의 성능 향상이 있었다.

  • PDF

CUDA와 OPenMP를 이용한 빠르고 효율적인 신경망 구현 (Fast and Efficient Implementation of Neural Networks using CUDA and OpenMP)

  • 박안진;장홍훈;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권4호
    • /
    • pp.253-260
    • /
    • 2009
  • 컴퓨터 비전이나 패턴 인식 분야에서 이용되고 있는 많은 알고리즘들이 최근 빠른 수행시간을 위해 GPU에서 구현되고 있지만, GPU를 이용하여 알고리즘을 구현할 경우 크게 두 가지 문제점을 고려해야 한다. 첫째, 컴퓨터 그래픽스 분야의 지식이 필요한 쉐이딩(shading) 언어를 알아야 한다. 둘째, GPU를 효율적으로 활용하기 위해 CPU와 GPU간의 데이터 교환을 최소화해야 한다. 이를 위해 CPU는 GPU에서 처리할 수 있는 최대 용량의 데이터를 생성하여 GPU에 전송해야 하기 때문에 CPU에서 많은 처리시간을 소모하며, 이로 인해 CPU와 GPU 사이에 많은 오버헤드가 발생한다. 본 논문에서는 그래픽 하드웨어와 멀티코어(multi-core) CPU를 이용한 빠르고 효율적인 신경망 구현 방법을 제안한다. 기존 GPU의 첫 번째 문제점을 해결하기 위해 제안된 방법은 복잡한 쉐이팅 언어 대신 그래픽스적인 기본지식 없이도 GPU를 이용하여 응용프로그램 개발이 가능한 CUDA를 이용하였다. 두 번째 문제점을 해결하기 위해 멀티코어 CPU에서 공유 메모리 환경의 병렬화를 수행할 수 있는 OpenMP를 이용하였으며, 이의 처리시간을 줄여 CPU와 GPU 환경에서 오버 헤드를 최소화할 수 있다. 실험에서 제안된 CUDA와 OpenMP기반의 구현 방법을 신경망을 이용한 문자영역 검출 알고리즘에 적용하였으며, CPU에서의 수행시간과 비교하여 약 15배, GPU만을 이용한 수행시간과 비교하여 약 4배정도 빠른 수행시간을 보였다.

멀티 코어 환경에서 실시간 트래픽 분석 시스템 처리속도 향상 (Performance Improvement of a Real-time Traffic Identification System on a Multi-core CPU Environment)

  • 윤성호;박준상;김명섭
    • 한국통신학회논문지
    • /
    • 제37권5B호
    • /
    • pp.348-356
    • /
    • 2012
  • 오늘날 네트워크 환경은 응용 프로그램 및 서비스의 변화가 많아 응용탐지에 있어 기존의 단일 분석 알고리즘으로는 모든 트래픽의 응용을 정확하게 탐지하기 어렵다. 최근 이러한 단점을 보완하기 위해 여러 개별 알고리즘을 통합한 멀티 레벨의 트래픽 탐지 알고리즘에 대한 연구가 진행되고 있다. 이러한 멀티 레벨 탐지 알고리즘은 단일 알고리즘 구조에 비해 계산 복잡도가 높은 단점이 있다. 또한, 고속 네트워크에서 실시간으로 트래픽을 분류하기 위해서는 멀티코어 CPU의 장점인 병렬처리를 이용하여 높은 계산 복잡도를 해결해야 할 필요가 있다. 본 논문에서는 요즘 일반화된 멀티 코어 CPU환경에 적합한 실시간 응용 트래픽 탐지 시스템 구조를 제안한다. 먼저 멀티 레벨 트래픽 탐지 알고리즘이 멀티 코어 환경에서 실시간으로 동작하기 위한 고려 사항들을 살펴보고, 이를 통해 시스템을 설계하고 구현한 내용을 기술한다. 본 논문에서 구축한 시스템은 캠퍼스 네트워크와 기숙사 네트워크를 대상으로 구축하여 그 실효성을 검증하였다.

멀티코아 프로세서의 온도변화 분석 (Analyzing Thermal Variations on a Multi-core Processor)

  • 이상정
    • 전자공학회논문지CI
    • /
    • 제47권6호
    • /
    • pp.57-67
    • /
    • 2010
  • 본 논문에서는 멀티코아 프로세서 상에서 프로세서와 메모리를 집중적으로 사용하는 다양한 워크로드들에 대한 온도특성을 연구한다. 일반적으로 프로세서의 온도관리를 위한 측정 지표로 평균온도와 온도범위 보다는 온도변화의 정도가 더 중요하다. 따라서 본 논문에서는 프로그램 실행 중에 온도변화를 분석하고, 워크로드의 온도변화의 정도를 정량화하는 측정 지표를 제안한다. 제안된 온도변화 측정 지표를 사용하여 인텔 Core 2 Duo 프로세서 상의 SPEC CPU2006 벤치마크들에 대해 쿨링 조건 및 클럭 주파수를 변경해 가며 온도변화를 분석한다. 분석 결과, 각 벤치마크 프로그램에 따라 서로 다른 유형의 온도 변화를 보였다. 이러한 온도변화는 쿨링 조건과 동작 클럭 주파수 및 멀티프로그래밍 워크로드에 영향을 받았다. 또한 코아들 사이의 공간적 위치에 따라서도 다른 온도 변화 특성을 보였다. 본 논문에서 제안된 온도변화 측정 지표와 연구 분석된 결과들은 향후 멀티코아 온도관리를 위한 연구에 활용하면 효과적인 온도관리가 기대된다.