• 제목/요약/키워드: ARM Cortex-A8

검색결과 15건 처리시간 0.018초

하이퍼바이저의 사용 유무에 따른 RTOS의 성능 비교 (Performance Comparison of RTOS with Hypervisor usage)

  • 심철;최민
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.7-8
    • /
    • 2017
  • 최근 ARM 프로세서의 가상화 확장 기술을 이용하는 임베디드 시스템에서 다종의 OS 작동을 지원하는 하이퍼바이저가 많이 개발되었다. 가상화 기술은 하드웨어 자원을 효과적으로 사용한다는 이점이 있지만, RTOS를 작동시킬 경우 하이퍼바이저의 오버헤드에 의해 RTOS의 성능이 저하될 수 있는 문제가 발생한다. 본 논문에서는 가상화 기술을 지원하는 ARMv7 Cortex-A15 프로세서를 탑재한 NVidia Jetson TK-1 임베디드 보드에서 RTOS가 단독으로 작동했을 때의 성능과 QPlus Hypervisor를 통해 Linux OS와 함께 RTOS가 작동했을 때의 성능을 측정하고 비교 분석 하였다.

안드로이드 플랫폼 기반 멀티 터치/상황인지형 융복합 디지털 사이니지 시스템 개발 (Development of Multi-Touch/Context-Aware Convergence Digital Signage System based on Android OS Platform)

  • 남의석
    • 디지털융복합연구
    • /
    • 제13권8호
    • /
    • pp.245-251
    • /
    • 2015
  • 디지털 사이니지 시스템이 윈도우 OS에 장착 된 PC에서 작동 될 경우, 구현 가격이 매우 높다. 이러한 문제점을 해소하고자, 최신 스마트폰에 활용되는 ARM Coretex계열의 멀티코어 프로세서가 탑재된 안드로이드 OS 플랫폼 기반의 저전력 저가격의 디지털 사이니지 시스템과, 원격제어기술을 응용하여 어디서나 광고단말기를 원격제어하고 원격콘텐츠를 관리할 수 있는 융복합형 웹서버 기반의 원격 콘텐츠 관리용 서버프로그램을 개발하였다. 구현된 시스템은 디스플레이를 포함한 일체화된 디지털 사이니지 시스템으로, 저전력 모바일 플랫폼을 최적화한 하드웨어 인터페이스로 설계 구현되었고, 상황정보센서를 이용하여 조도, 온도, 날씨, GPS등의 주변상황 정보를 습득한 서비스 융합형 모델을 구현하는 구조로 설계 구현되었다. 또한 콘텐츠 자동생성 모듈은 컨텐츠 사용자에게 전용 저작 도구와 SMIL 기반의 자동으로 가동되도록 프레임 워크에 의해 규정된 컨텐츠를 제공하고, 사용자 정보 데이터베이스에 저장된 사용자 정보를 참조하여 사용자별 맞춤형 SMIL 컨텐츠를 생성해주는 융복합형 기능이 구현되었다. 개발된 디지털 사이니지 시스템은 기존 윈도우 OS 환경 대비 50% 이상의 소비전력 저감과 16포인트 멀티터치 기능을 구현하였고 상용화를 위한 기본 환경시험성능을 모두 만족하였다.

실시간 얼굴 검출을 위한 Cascade CNN의 CPU-FPGA 구조 연구 (Cascade CNN with CPU-FPGA Architecture for Real-time Face Detection)

  • 남광민;정용진
    • 전기전자학회논문지
    • /
    • 제21권4호
    • /
    • pp.388-396
    • /
    • 2017
  • 얼굴 검출에는 다양한 포즈, 빛의 세기, 얼굴이 가려지는 현상 등의 많은 변수가 존재하므로, 높은 성능의 검출 시스템이 요구된다. 이에 영상 분류에 뛰어난 Convolutional Neural Network (CNN)이 적절하나, CNN의 많은 연산은 고성능 하드웨어 자원을 필요로한다. 그러나 얼굴 검출을 위한 소형, 모바일 시스템의 개발에는 저가의 저전력 환경이 필수적이고, 이를 위해 본 논문에서는 소형의 FPGA를 타겟으로, 얼굴 검출에 적절한 3-Stage Cascade CNN 구조를 기반으로하는 CPU-FPGA 통합 시스템을 설계 구현한다. 가속을 위해 알고리즘 단계에서 Adaptive Region of Interest (ROI)를 적용했으며, Adaptive ROI는 이전 프레임에 검출된 얼굴 영역 정보를 활용하여 CNN이 동작해야 할 횟수를 줄인다. CNN 연산 자체를 가속하기 위해서는 FPGA Accelerator를 이용한다. 가속기는 Bottleneck에 해당하는 Convolution 연산의 가속을 위해 FPGA 상에 다수의 FeatureMap을 한번에 읽어오고, Multiply-Accumulate (MAC) 연산을 병렬로 수행한다. 본 시스템은 Terasic사의 DE1-SoC 보드에서 ARM Cortex A-9와 Cyclone V FPGA를 이용하여 구현되었으며, HD ($1280{\times}720$)급 입력영상에 대해 30FPS로 실시간 동작하였다. CPU-FPGA 통합 시스템은 CPU만을 이용한 시스템 대비 8.5배의 전력 효율성을 보였다.

파이프라인 구조의 얼굴 검출 하드웨어 설계 및 검증 (Design and Verification of Pipelined Face Detection Hardware)

  • 김신호;정용진
    • 한국멀티미디어학회논문지
    • /
    • 제15권10호
    • /
    • pp.1247-1256
    • /
    • 2012
  • 필터를 기반으로 하는 영상 처리 알고리즘은 많은 연산과 메모리 접근으로 인해 임베디드 환경에서의 실시간 동작이 어렵다. 본 논문에서는 필터 기반의 얼굴 검출 하드웨어 엔진을 임베디드 환경에서 실시간으로 동작시키기 위해 파이프라인 구조로 설계하고 검증하였다. 얼굴 검출 알고리즘은 입력으로 들어온 영상에서 학습된 얼굴의 특징 데이터를 이용하여 얼굴의 위치를 찾는 연산을 수행한다. 이를 하드웨어로 구현하기 위해 알고리즘의 연산을 파악하여 중복되는 연산을 병렬 처리하고 라인 메모리를 이용하여 메모리 접근을 최소화하여, 이것을 기반으로 파이프라인 구조의 하드웨어를 설계하였다. 하드웨어 구조는 Resize, ICT(Improved Census Transform), Find Candidate 등의 3 단계로 나뉘어져 있으며, 총 507KByte의 내부 SRAM을 사용하였다. ARM Cortex A8 프로세서와 Xilinx사의 Virtex5LX330을 이용하여 검증한 결과 9,039 LUTs를 사용하였고 최대 동작 클록은 165MHz로, VGA($640{\times}480$) 해상도에서 108 frame/sec의 동작속도로 최대 20명까지 검출이 가능한 것을 확인하였다.

모돈 섭식 분석을 위한 ADC 샘플링 시분할 방법 연구 (A Study about Time-sharing Method in ADC Sampling for Analysis of Breeding Pig's Feeding)

  • 조진호;오종우;조용진;이동훈
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.164-164
    • /
    • 2017
  • 스마트 돈사 환경의 복지 및 생산성 향상을 위하여 정량 분석법을 기반으로 한 모돈 관리의 중요성이 증가하고 있다. 모돈은 교배, 임신, 분만, 포유, 이유를 순환적 반복하여 이루어지는데 모돈의 관리는 돈사 농장의 생산성 및 경제성과 직결된다. 모돈 관리에 필요한 환경 및 계측정보를 획득하고 이 정보로부터 모돈의 개체관리를 극대화시키고 최적의 방안을 찾고자 지속적으로 계측이 가능한 모돈의 돈사 모니터링 시스템이 필요하다. 모돈의 행동특성 계측이 가능한 시스템이 필요한 이유는 모돈의 행동 특성(섭식 및 지제불량 등)에 상응하는 대사 불량, 질병 및 발정 징후 등을 조기에 발견할 수 있기 때문이다. 돈사 내에서 정지 상태로 판별이 되는 모돈의 지제상태(기립상태, 누운 상태, 앉은 상태)와 다르게 연속적인 움직임으로부터 판별되는 모돈의 섭식상태를 분석하기 위해서는 계측 시스템과 이를 분석해주는 시스템간의 시간적 차이를 최소화 할 수 있는 실시간 신호 처리 기술이 필수적이다. 모돈의 섭식을 정량적으로 지수화하기 위한 센서의 최소 SPS(sample per second)는 600 Hz($100Hz{\times}6$개)로서 최소 6개 ADC 채널과 최소 1,200 Hz 이상으로 샘플링 할 수 있는 마이크로 컨트롤러가 필요하다. 또한 16 비트의 분해능으로 1분 동안 연속 계측을 수행할 경우 필요한 정보량은 153,600 KByte ($1,200sample/s{\times}16bit/sample{\times}8Byte/bit$)으로 실시간 처리를 수행하기에 매우 큰 정보량이라 판단할 수 있다. 수행하고자 하는 정보처리 기법에 따라 다소 상이할 수 있으나, 1분을 주기로 모돈의 섭식 분석을 수행하고자 할 경우 최도 150 MByte의 정보량을 처리하기 위한 최소의 클럭수는 단순 대입의 경우 2.5 Mhz (clock/second) ($=1clock/Byte{\times}150MByte/60seconds$) 이며 덧셈(4 clock)의 경우 10 Mhz, 곱셈(16 clock)의 경우 40 Mhz의 클럭이 필요하다. 또한 정보의 저장 및 도시를 위해 필요한 부가적인 회로(LCD, SD메모리) 구동을 위해 필요한 클럭을 고려할 경우 추가적인 클럭이 필요하다. 이를 종합적으로 고려하여 120 Mhz ($= 40Mhz{\times}3$) 이상의 클럭이 필요하다고 판단할 수 있다. 또한 센서 계측 주기의 시간 분해능을 균등하게 유지하기 위해선 계측->도시->저장의 과정을 교차적으로 수행해야 한다. 이러한 과정을 거처 최종적으로 선정한 마이크로 프로세서는 ARM Cortex-M4이며 168 MHz로 연산 수행이 가능하여 목표하고자 하는 신호처리를 수행 할 수 있다. 현장 예비 실험을 통해 기대 성능을 만족하였으며, 시간 복잡도가 높은 연산을 대비하여 최적 시분할 스케쥴링 기법에 대한 보완이 필요하다고 판단되었다.

  • PDF