• 제목/요약/키워드: Embedded Processors

검색결과 162건 처리시간 0.029초

내장형 프로세서에서의 미디어 처리를 위한 Shadow Register 기법 (Shadow Register Scheme for Media Processing in Embedded Processors)

  • 안성수;김현규;이성재;오형철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.547-549
    • /
    • 2004
  • 비교적 적은 수의 레지스터를 사용하는 내장형 프로세서에서 미디어 데이터를 처리할 때, 레지스터 부족으로 인하여 프로세서의 성능이 현저히 감소하는 경우가 있다. 본 논문에서는 이를 Shadow 레지스터 기법을 사용하여 해결하는 방안을 제안한다. 프로토타입 프로세서를 사용한 비교 실험에서, 제안된 기법은 약 16.7%의 하드웨어 추가로 구현될 수 있으며, 실행기간을 약 16-28%, 감소시키고 실행 프로그램의 크기를 약 3.3-5% 감소시킬 수 있음을 보였다. 본 논문의 실험 결과는 이상적인 메모리 모델 하에서 얻어진 것으로서 실제적인 환경에서는 더욱 큰 이득이 예상된다.

  • PDF

OpenCL을 이용한 임베디드 GPGPU환경에서의 AES 암호화 성능 개선과 평가 (Performance Enhancement and Evaluation of AES Cryptography using OpenCL on Embedded GPGPU)

  • 이민학;강우철
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권7호
    • /
    • pp.303-309
    • /
    • 2016
  • 최근, ARM Mali와 같은 여러 임베디드 프로세서들이 OpenCL과 같은 GPGPU 프레임워크를 지원함에 따라 기존 PC 환경에서 활용되던 GPGPU 기술이 임베디드 시스템 영역으로 확대 되고 있다. 그러나 임베디드 시스템은 PC와는 상이한 구조를 갖으며, 저전력이나 실시간성과 같은 성능이 더욱 중요하다. 본 논문에서는 임베디드 GPGPU환경에서 AES 암호화 알고리즘을 개방형 범용 병렬 컴퓨팅 프레임워크인 OpenCL을 사용하여 구현하고 이를 CPU만을 이용한 구현과 비교한다. 실험결과, 1000KByte의 데이터 사이즈의 128비트 AES 암호화 시에 OpenCL을 사용하여 GPU로 병렬 처리하는 것이 OpenMP를 사용하여 CPU상에서 병렬 처리한 방식보다 응답 시간은 최대 1/150, 에너지 소비량은 최대 1/290로 감소함을 확인하였다. 또한 호스트와 GPU 디바이스 간에 메모리를 공유하는 임베디드 구조의 특성에 최적화하여 메모리 복제를 하지 않는 기법을 적용하는 경우 응답시간과 에너지 소비량에서 최대 100% 이상의 추가적인 성능개선을 이룰 수 있었으며, 연구에서 사용한 데이터의 크기에 비례하여 더 높은 성능의 개선이 나타나는 것을 확인하였다.

이종 임베디드 시스템의 멀티태스킹을 위한 MDA(Model Driven Architecture) 기반의 설계 (MDA(Model Driven Architecture) based Design for Multitasking of Heterogeneous Embedded System)

  • 손현승;김우열;김영철
    • 정보처리학회논문지D
    • /
    • 제15D권3호
    • /
    • pp.355-360
    • /
    • 2008
  • 복잡한 임베디드 시스템의 멀티태스킹 지원은 실시간 운영체제가 요구된다. 이종의 임베디드 시스템 개발 환경에서 각각의 시스템에 최적화 된 운영체제와 프로세서를 사용한다. 본 논문에서는 이종 임베디드 시스템 개발 시 기존의 크로스 컴파일러 대신, 운영체제의 API 정보 및 프로세서 레지스터 구성 정보의 UML 프로파일화 방식을 제안한다. 이는 각각의 임베디드 시스템에 적합한 프로파일을 이용해 이종의 시스템 개발 환경을 선택하여 자동 코드 발생을 통해 개발 기간 및 비용을 단축할 수 있다. 적용사례로서 이종 시스템 프로파일 정보를 이용해 이종의 실시간 운영체제 (brickOS와 uC/OS-II) 및 프로세서(Hitachi H8과 Intel PXA255)에 맞는 모델 및 코드를 생성하여 포팅 하였다.

An Efficient Adaptive Polarimetric Processor with an Embedded CFAR

  • Park, Hyung-Rae;Kwag, Young-Kil;Wang, Hong
    • ETRI Journal
    • /
    • 제25권3호
    • /
    • pp.171-178
    • /
    • 2003
  • To improve the detection performance of surveillance radars with polarization diversity, we developed an adaptive polarimetric processor and compared it with other polarimetric processors. We derived our adaptive polarimetric processor, called the polarization discontinuity detector (PDD), from the generalized likelihood ratio (GLR) test principle for the unspecified target component. We derived closed-form expressions of its probabilities of detection and false alarm, and compared its performance to that of the adaptive polarization canceller (APC) and Kelly's GLR processor. The PDD had a performance similar to Kelly's GLR in Gaussian clutter, and both the PDD and Kelly's GLR, which have embedded constant false alarm rates (CFARs), outperformed the APC, especially when the target polarization state was close to the clutter's polarization state. The important difference is that the PDD is much simpler than Kelly's GLR for hardware/software implementation, because the PDD does not require a costly two-parameter filter bank to cover the unknown target polarization state as Kelly's GLR does.

  • PDF

감마 및 다중 포인터 니를 이용한 스마트폰 카메라의 광 다이나믹 영역 확장 (Illuminance Dynamic Range Expansion using Gamma & Multi-Point Knee for Smart Phone Camera)

  • 최덕규;한찬호
    • 대한임베디드공학회논문지
    • /
    • 제8권1호
    • /
    • pp.43-50
    • /
    • 2013
  • The narrow dynamic range of most smart phone cameras is severely limited. It usually is narrower than the dynamic range of most scenes. So we proposes a illuminance dynamic range expansion using multi-point knee for smart phone camera. Such as logarithmic functions the proposed method compress the image sensor output signal. Additionally, the proposed method was merged into the gamma that is essential circuit for any cameras. To justifying multi-point knee effectiveness, we configure the control and quality evaluation system for smart phone camera module. Experimental results show that the lost information by cut off and saturated affectively reconstructed in darker and in brighter areas. Finally this methods have advantage to implement without any changing hardware for conventional smart phones.

멀티미디어 전용 명령어를 내장한 멀티코어 프로세서 구현 및 검증 (Implementation and Verification of a Multi-Core Processor including Multimedia Specific Instructions)

  • 서준상;김종면
    • 대한임베디드공학회논문지
    • /
    • 제8권1호
    • /
    • pp.17-24
    • /
    • 2013
  • In this paper, we present a multi-core processor including multimedia specific instructions to process multimedia data efficiently in the mobile environment. Multimedia specific instructions exploit subword level parallelism (SLP), while the multi-core processor exploits data level parallelism (DLP). These combined parallelisms improve the performance of multimedia processing applications. The proposed multi-core processor including multimedia specific instructions is implemented and tested using a Xilinx ISE 10.1 tool and SoCMaster3 testbed system including Vertex 4 FPGA. Experimental results using a fire detection algorithm show that multimedia specific instructions outperform baseline instructions in the same multi-core architecture in terms of performance (1.2x better), energy efficiency (1.37x better), and area efficiency (1.23x better).

PXA270 프로세서를 사용한 저전력 멀티미디어 임베디드 시스템의 구현 (Implementation of Energy-Efficient Multimedia Embedded System using PXA270 processor)

  • 김상덕;이후성;박성수
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.945-948
    • /
    • 2005
  • In wireless and handheld platforms area, performance, power and cost are key metrics for product success. This is driving increasing levels of on-chip integration in state-of-the-art application processors. The purpose of this project is to optimize and design the energy-efficient embedded system that properly displays video and audio in real time. The requirements are for the media player to be capable of decoding real-time streaming video and audio with the least possible energy consumption for a variety of different clips at different resolutions. We implemented this Linux based multimedia player on Intel's PXA27x platform.

  • PDF

가변 전압 프로세서를 사용하는 실시간 시스템에서 소비 전력감소를 위한 전압조절 (Voltage Scaling for Reduced Energy Consumption in Real-Time Systems Using Variable Voltage Processor)

  • 이용준;김용석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.438-440
    • /
    • 2004
  • Energy consumption has become an increasingly important consideration in designing real-time embedded systems. In this paper, we propose a voltage scaling method to reduce energy consumption in fixed priority real-time systems using variable voltage processors. The Hyperperiod of tasks is divided into dimains. The most suitable voltage of each domain is determined off-line and stored in a table. During task execution, the voltage of processor is adjusted according to the information of the table. A simulation result shows that the proposed method can reduce 80% of power consumption in comparison to no power management. The difference to the optimal EDF based method is only 5%.

  • PDF

매니코어 프로세서 상에서 이산 웨이블릿 변환을 위한 성능 평가 및 분석 (Performance Evaluation and Analysis for Discrete Wavelet Transform on Many-Core Processors)

  • 박용훈;김종면
    • 대한임베디드공학회논문지
    • /
    • 제7권5호
    • /
    • pp.277-284
    • /
    • 2012
  • To meet the usage of discrete wavelet transform (DWT) on potable devices, this paper implements 2-level DWT using a reference many-core processor architecture and determine the optimal many-core processor. To explore the optimal many-core processor, we evaluate the impacts of a data-per-processing element ratio that is defined as the amount of data mapped directly to each processing element (PE) on system performance, energy efficiency, and area efficiency, respectively. This paper utilized five PE configurations (PEs=16, 64, 256, 1,024, and 4,096) that were implemented in 130nm CMOS technology with a 720MHz clock frequency. Experimental results indicated that maximum energy and area efficiencies were achieved at PEs=1,024. However, the system area must be limited 140mm2 and the power should not exceed 3 watts in order to implement 2-level DWT on portable devices. When we consider these restrictions, the most reasonable energy and area efficiencies were achieved at PEs=256.

IEEE 802.11n WLAN을 위한 FFT 프로세서의 하드웨어 복잡도 최적화에 대한 연구 (A Study on Optimization of Hardware Complexity of a FFT Processor for IEEE 802.11n WLAN)

  • 최락훈;박정준;임태민;이진용;김영록
    • 대한임베디드공학회논문지
    • /
    • 제6권4호
    • /
    • pp.243-248
    • /
    • 2011
  • A FFT/IFFT processor is the key component for orthogonal frequency division multiplexing (OFDM) systems based IEEE 802.11n wireless local area network (WLAN). There exists many radix algorithms according to the structure of butterfly as FFT sub-module, each has the pros and cons on hardware complexity. Here, mixed radix algorithms for 64 and 128 FFT/IFFT processors are proposed, which reduce hardware complexity by using mixture of radix-23 and radix-4 algorithms. The proposed algorithm finish calculation within 3.2${\mu}s$ in order to meet IEEE 802.11n standard requirements and it has less hardware complexity compared with conventional algorithms.