• 제목/요약/키워드: heterogeneous multi core

검색결과 34건 처리시간 0.025초

스마트 모바일 장치의 에너지 보존성을 높이기 위한 비대칭 멀티 코어 기반 실시간 태스크 스케쥴링 (Real-time Scheduling on Heterogeneous Multi-core Architecture for Energy Conservation of Smart Mobile Devices)

  • 임성화
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권6호
    • /
    • pp.1219-1224
    • /
    • 2018
  • 사물인터넷 (Internet of Things)은 우리의 실생활에서 그 범위가 급격히 커지면서, 스마트 모바일 장치들에 대용량 실시간 데이터를 모바일 환경에서 고속으로 처리 및 전송하기에 적합한 처리능력이 요구되고 있다. 배터리 파워가 중요한 모바일 기기에서 성능과 에너지 보존성을 높이기 위해 big.LITTLE 멀티코어 구조와 같은 비대칭 멀티코어 구조가 널리 사용되고 있다. 에너지 보존성을 높이기 위해서는 에너지 효율이 높은 LITTLE 코어의 활용도를 높여하며, 이룰 위해 본 논문에서는 실시간 태스크를 대상으로 하여 마감 시간을 보장하는 범위 내에서 LITTLE 코어에 우선적으로 할당하는 코어 선택 알고리즘을 제안하다. 또한, 시뮬레이션을 통하여 기존 기법에 비해 마감시간을 보장하면서 에너지 소비량을 줄 있 수 있음을 보였다.

이기종 멀티 셀 유연생산환경에서의 실시간 통합운용을 위한 공정관리 체계 (Process Management Systems for Integrated Real-Time Shop Operations in Heterogeneous Multi-Cell Based Flexible Manufacturing Environment)

  • 윤주성;남성호;백재용;권기억;이동호;이석우
    • 한국생산제조학회지
    • /
    • 제22권2호
    • /
    • pp.281-286
    • /
    • 2013
  • As the product lifecycle is getting shorter and various models should be released to respond to the needs of customers and markets, automation-based flexible production line has been recognized as the core competitiveness. According to these trends, system vendors supply cell-level systems such as FMC(Flexible Manufacturing Cell) that is integration of core functions of FMS(Flexible Manufacturing System) and RMC(Reconfigurable Manufacturing Cell) that can easily extend components of FMC. In the cell-based environment, flexible management for shop floor composed of existing job shop, FMCs and RMCs from various system vendors has emerged as an important issue. However, there could be some problems on integrated operation between heterogeneous cells to use vendor-specific cell controllers and on seamless information flow with high level systems such as ERP(Enterprise Resource Planning). In this context, this paper proposes process management systems supporting integrated shop operation of heterogeneous multi-cell based flexible manufacturing environment: First of all, (1) Integrated Shop Operation System to apply the process management system is introduced, and (2) Multi-Layer BOP(Bill-Of-Process) model, a backbone of the process management system, is derived with its data structure. Finally, application of the proposed model is illustrated through system implementation results.

차세대 이동통신 시스템의 RF Calibration 기법에 관한연구 (A Study on RF Calibration Method of Next Generation Mobile Communication System)

  • 김완태;조성준
    • 한국항행학회논문지
    • /
    • 제14권6호
    • /
    • pp.859-864
    • /
    • 2010
  • 차세대 이동통신은 하나의 시스템으로 다양한 서비스망에서의 운용을 위해 Multi-Core 시스템 구현에 대한 연구가 활발히 진행 중이다. 따라서 하나의 시스템으로 WiBro(Wireless Broadband), CDMA(Code Division Multiplexing Access), WCDMA(Wideband CDMA)등을 지원할 수 있는 모바일 시스템들이 출현할 것으로 예상된다. 하나의 시스템을 이용하여 다양한 서비스를 지원하기 위한 시스템은 광대역 주파수를 수용하여 다양한 FA(Frequency Assignment)를 지원해야 하며, 다양한 서비스 망으로의 핸드오버를 지원해야 한다. 특히, 셀 단위로 구성된 이동통신 시스템은 이동국이 사용하는 불안정한 송신 전력이 인접 시스템에 간섭으로 작용하여 시스템 채널 용량 및 셀 크기에 영향을 미치게 된다. 본 논문에서는 이동통신 시스템에서 발생되는 불안정한 시스템 동작에 의한 불규칙한 송신전력을 개선하고, 다양한 서비스 지원을 위한 이종망간 핸드오버 시 발생하는 불규칙한 전력 변화에도 안정적으로 전력을 사용할 수 있는 RF(Radio Frequency) Calibration 기법을 제안하였으며, 제안한 기법을 이용하여 이종망간 핸드오버 시 시스템의 전력사용에 대하여 분석하였다.

WebKit 모바일 웹 브라우저의 성능 향상을 위한 기법 연구 (A Study of High Performance WebKit Mobile Web Browser)

  • 김정길
    • 한국위성정보통신학회논문지
    • /
    • 제7권1호
    • /
    • pp.48-52
    • /
    • 2012
  • 스마트폰의 급속한 보급 확산에 따라 모바일 기기에서 웹 브라우저는 주요한 기능으로 자리 잡고 있으며 사용자는 모바일 기기에서 PC 수준의 고속화된 성능을 기대하는 현실이다. 웹키트(WebKit)는 구글의 안드로이드(Android) 플랫폼에 사용되고 있는 웹 브라우저를 만드는 데 기반을 제공하는 오픈 소스 응용 프로그램 프레임워크이다. 본 논문에서는 WebKit 라이브러리의 연산의 병렬처리를 통한 성능 향상 기법을 제안하였다. 제안된 병렬처리 기법은 JPEG 라이브러리에 적용되었으며, 성능 검증은 PC 기반의 실험을 통하여 이기종 컴퓨팅 기반의 모바일 임베디드 시스템 환경에서의 예측 방법을 사용하였다. 실험 결과는 제안된 병렬화 기법이 이기종 컴퓨팅 환경의 모바일 임베디드 기기로의 적용을 통한 성능 향상 가능성을 보여주었다.

헤테로지니어스 멀티코어 성능 최적화를 위한 하이브리드 병렬 프로그래밍 (Hybrid parallel programming for Heterogeneous Multi-core performance optimization)

  • 임주호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(A)
    • /
    • pp.7-9
    • /
    • 2012
  • CPU는 싱글 코어 구조에서 클록 속도를 높여 성능을 향상 시키려는 노력을 해왔으나 한계에 도달하자 하나의 칩에 코어를 여러 개 둔 멀티코어 형태로 발전하였다. CPU의 성능 향상을 위해 이제는 3D그래픽을 연산처리하기 위해 만들어진 GPU와 결합하기에 이르렀다. CPU와 GPU의 결합은 CPU간의 결합보다 훨씬 더 좋은 성능을 보였고 전력의 사용량도 더 적었으며 비용면에서도 경제적이라는 장점을 가지고 있다. 본 논문에서는 CPU와 GPU의 Heterogeneous multicore상에서 성능을 최적화하기 위해 기존의 병렬화 모델을 조합하고 최적화를 시도하였다. CPU상에서는 성능 향상을 위해 기존의 병렬 프로그램 모델인 SIMD와 공유메모리 병렬 프로그래밍 모델 그리고 메시지 패싱 병렬 프로그래밍 모델을 조합하는 실험을 했다. GPU에서는 CUDA를 최적화 하였다. 이렇게 CPU와 GPU를 최적화하고 조합하여 고성능 연산을 요구하는 어플리케이션을 위한 Heterogeneous multicore 성능 최적화 방법을 제안한다.

Heterogeneous 멀티 코어 환경의 Thick Client에서 VDI 성능 최적화를 위한 혼합 병렬 처리 기법 연구 (VDI Performance Optimization with Hybrid Parallel Processing in Thick Client System under Heterogeneous Multi-Core Environment)

  • 김명섭;허의남
    • 한국통신학회논문지
    • /
    • 제38B권3호
    • /
    • pp.163-171
    • /
    • 2013
  • 최근 HD급 동영상이나 3D 어플리케이션과 같은 이전보다 저사양, 모바일 단말에서는 구동하기 힘든 프로그램들에 대한 이용 요구가 확대되면서 처리해야 할 콘텐츠 데이터들이 고용량화 되고 있다. 클라우드 기반의 VDI(Virtual Desktop Infrastructure) 서비스는 이를 처리하기 위해 효율적인 데이터 처리 능력이 필요해졌으며 QoE(Quality of Experience) 보장을 위한 성능 개선 연구가 이슈가 되고 있다. 본 논문에서는 H/W 성능이 향상되어 CPU와 GPU를 탑재한 Thick Client기반의 3가지 Thick-Thin간 VDI 자원 공유 및 위임이 가능한 VDI 서비스에 대해 제안하며, VDI 서비스 성능의 개선을 위해 CPU와 GPU가 혼합된 Heterogeneous 멀티코어 환경에서 CPU와 GPU 병렬 처리 기법인 OpenMP와 CUDA를 활용하여 VDI 서비스 최적화 방안을 제안하고 기존의 VDI와 비교한 성능을 거론한다.

OpenCL을 활용한 CPU와 GPU 에서의 CMMB LDPC 복호기 병렬화 (Parallel LDPC Decoder for CMMB on CPU and GPU Using OpenCL)

  • 박주열;홍정현;정기석
    • 대한임베디드공학회논문지
    • /
    • 제11권6호
    • /
    • pp.325-334
    • /
    • 2016
  • Recently, Open Computing Language (OpenCL) has been proposed to provide a framework that supports heterogeneous computing platforms. By using an OpenCL framework, digital communication systems can support various protocols in a unified computing environment to achieve both high portability and high performance. This article introduces a parallel software decoder of Low Density Parity Check (LDPC) codes for China Multimedia Mobile Broadcasting (CMMB) on a heterogeneous platform. Each step of LDPC decoding has different parallelization characteristics. In this paper, steps suitable for task-level parallelization are executed on the CPU, and steps suitable for data-level parallelization are processed by the GPU. To improve the performance of the proposed OpenCL kernels for LDPC decoding operations, explicit thread scheduling, loop-unrolling, and effective data transfer techniques are applied. The proposed LDPC decoder achieves high performance by using heterogeneous multi-core processors on a unified computing framework.

CELL 프로세서를 이용한 SEED 블록 암호화 알고리즘의 효율적인 병렬화 기법 (An Efficient Parallelized Algorithm of SEED Block Cipher on Cell BE)

  • 김덕호;이재영;노원우
    • 정보처리학회논문지A
    • /
    • 제17A권6호
    • /
    • pp.275-280
    • /
    • 2010
  • 본 논문에서는 Cell BE 프로세서를 사용한 효율적인 병렬 블록 암호화 알고리즘을 제시한다. 제안하는 알고리즘은, 이종 프로세서인 Cell BE의 특성을 효율적으로 활용하기 위하여 PPE와 SPE에 서로 다른 부호화/복호화 방식을 적용하여 그 성능을 개선하였다. 본 논문에 제시된 구현 방식을 바탕으로 검증된 결과에 따르면, 제안하는 알고리즘은 고성능 네트워크 시스템을 지원할 수 있는 2.59Gbps의 성능을 보여준다. 이는, 다른 다중 코어 프로세서의 병렬 구현 방식과 비교할 때, 1.34배 증가된 성능의 부호화/복호화 속도를 제공한다.

FUNDAMENTALS AND RECENT DEVELOPMENTS OF REACTOR PHYSICS METHODS

  • CHO NAM ZIN
    • Nuclear Engineering and Technology
    • /
    • 제37권1호
    • /
    • pp.25-78
    • /
    • 2005
  • As a key and core knowledge for the design of various types of nuclear reactors, the discipline of reactor physics has been advanced continually in the past six decades and has led to a very sophisticated fabric of analysis methods and computer codes in use today. Notwithstanding, the discipline faces interesting challenges from next-generation nuclear reactors and innovative new fuel designs in the coming. After presenting a brief overview of important tasks and steps involved in the nuclear design and analysis of a reactor, this article focuses on the currently-used design and analysis methods, issues and limitations, and current activities to resolve them as follows: (1) Derivation of the multi group transport equations and the multi group diffusion equations, with representative solution methods thereof. (2) Elements of modem (now almost three decades old) diffusion nodal methods. (3) Limitations of nodal methods such as transverse integration, flux reconstruction, and analysis of UO2-MOX mixed cores. Homogenization and related issues. (4) Description of the analytic function expansion nodal (AFEN) method. (5) Ongoing efforts for three-dimensional whole-core heterogeneous transport calculations and acceleration methods. (6) Elements of spatial kinetics calculation methods and coupled neutronics and thermal-hydraulics transient analysis. (7) Identification of future research and development areas in advanced reactors and Generation-IV reactors, in particular, in very high temperature gas reactor (VHTR) cores.

GCN 아키텍쳐 상에서의 OpenCL을 이용한 GPGPU 성능향상 기법 연구 (A Study on GPGPU Performance Improvement Technique on GCN Architecture Using OpenCL API)

  • 우동희;김윤호
    • 한국전자거래학회지
    • /
    • 제23권1호
    • /
    • pp.37-45
    • /
    • 2018
  • 현재 프로그램이 운용되는 시스템은 기존의 싱글코어 및 멀티코어 환경을 넘어서 매니코어, 부가 프로세스 및 이기종 환경까지 그 영역이 확장되고 있는 중이다. 하지만, 기존 연구의 경우 NVIDIA 벤더에서 나온 아키텍쳐 및 CUDA로의 병렬화가 주로 이루어졌고 AMD에서 나온 범용 GPU 아키텍쳐인 GCN 아키텍쳐에 대한 성능향상에 관한 연구는 제한적으로 이루어졌다. 이런 점을 고려해 본 논문에서는 GCN 아키텍쳐의 GPGPU 환경인 OpenCL 내에서의 성능향상 기법에 대해 연구하고 실질적인 성능향상을 보였다. 구체적으로, 행렬 곱셈과 컨볼루션을 적용한 GPGPU 프로그램을 본 논문에서 제시한 성능향상 기법을 통해 최대 30% 이상의 실행시간을 감소시켰으며, 커널 이용률 또한 40% 이상 높였다.