• 제목/요약/키워드: ARM/NEON

검색결과 12건 처리시간 0.025초

High Performance Implementation of SGCM on High-End IoT Devices

  • Seo, Hwajeong
    • Journal of information and communication convergence engineering
    • /
    • 제15권4호
    • /
    • pp.212-216
    • /
    • 2017
  • In this paper, we introduce novel techniques to improve the high performance of AE functions on modern high-end IoT platforms (ARM-NEON), which support SIMD and cryptography instruction sets. For the Sophie Germain Counter Mode of operation (SGCM), counter modes of encryption and prime field multiplication are required. We chose the Montgomery multiplication for modular multiplication. We perform Montgomery multiplication in a parallel way by exploiting both the ARM and NEON instruction sets. Specifically, the NEON instruction performed 128-bit integer multiplication and the ARM instruction performed Montgomery reduction, simultaneously. This approach hides the latency for ARM in the NEON instruction set. For a high-speed counter mode of encryptions for both AE functions, we introduced two-level computations. When the tasks were large volume, we switched to the NEON instruction to execute the encryption operations. Otherwise, we performed the encryptions on the ARM module.

ARM/NEON 프로세서를 활용한 NIST PQC SABER에서 Toom-Cook 알고리즘 최적화 구현 연구 (Optimization Study of Toom-Cook Algorithm in NIST PQC SABER Utilizing ARM/NEON Processor)

  • 송진교;김영범;서석충
    • 정보보호학회논문지
    • /
    • 제31권3호
    • /
    • pp.463-471
    • /
    • 2021
  • NIST(National Institute of Standards and Technology)에서는 2016년부터 양자컴퓨팅 환경을 대비하여 양자내성암호 표준화 사업을 진행하고 있다. 현재 3라운드가 진행 중이며, 대부분 후보자(5/7)는 격자기반 암호이다. 격자기반 암호는 효율적인 연산 처리와 적절한 키 길이를 제공하여 다른 기반의 양자내성 암호보다 리소스가 제한적인 임베디드 환경에서도 적용이 가능하다는 평가를 받고 있다. 그중 SABER KEM은 효율적인 모듈러스와 연산 부하가 큰 다항식 곱셈을 처리하기 위해 Toom-Cook 알고리즘을 제공한다. 본 논문에서는 ARMv8-A 환경에서 ARM/NEON을 활용하여 SABER의 Toom-Cook 알고리즘에서 평가와 보간 과정에 대한 최적화 구현 방법을 소개한다. 평가과정에서는 ARM/NEON의 효율적인 인터리빙 방법을 제안하며, 보간 과정에 서는 다양한 임베디드 환경에서 적용 가능한 최적화된 구현 방법론을 소개한다. 결과적으로 제안하는 구현은 이전 레퍼런스 구현보다 평가과정에서는 약 3.5배 보간과정에서는 약 5배 빠른 성능을 달성하였다.

안드로이드 기반 공개키 암호를 위한 곱셈기 구현 및 분석 (Implementation and Analysis of Multi-Precision Multiplication for Public Key Cryptography Based on Android Platform)

  • 서화정;김호원
    • 한국통신학회논문지
    • /
    • 제37C권10호
    • /
    • pp.940-948
    • /
    • 2012
  • 안드로이드 프로그램은 JAVA SDK로 제작되어 가상머신(virtual machine) 기반으로 동작한다. 따라서 기존의 C 언어에 비해 프로그램 작성은 편리해 졌지만 동작 속도는 떨어지는 단점이 있다. 이러한 단점을 보완하기 위해 안드로이드 상에서 C언어, 어셈블리 언어의 사용이 가능한 안드로이드 NDK가 제안되어 보다 효율적인 프로그램 작성이 가능하게 되었다. 이와 더불어 ARM에서 제공하는 NEON기능을 사용하면 벡터연산을 통해 성능을 향상 시킬 수 있다. 본 논문에서는 NDK의 효용성에 대해 알아보며 NEON기능을 이용한 향상된 곱셈구조를 제안한다.

Advanced SIMD를 이용한 화면 간 예측 고속화방법 (Acceleration Method of Inter Prediction using Advanced SIMD)

  • 김완수;이재흥
    • 전기전자학회논문지
    • /
    • 제16권4호
    • /
    • pp.382-388
    • /
    • 2012
  • 본 논문에서는 ARM Cortex-A9 듀얼코어 플랫폼에서 지원하는 병렬처리 기법 중 하나인 Advanced SIMD기반의 NEON을 적용한 H.264/AVC 고속화 움직임추정 방법론을 연구하였다. 다양한 움직임추정 방법 중 하나인 전역탐색기법에 NEON을 적용하여 각 매크로블록의 SAD 연산횟수를 1/4 감소시켰다. 해당 매크로블록의 픽셀 값들을 8개의 16bit NEON 레지스터에 할당하였고, NEON에서 지원하는 Intrinsic 함수를 사용하여 동시에 128bit 연산을 수행하였다. 이러한 방법으로 계산된 SAD 값들 중 최소 SAD 값을 가지고 정확한 모션벡터를 선정했다. 그 결과 영상의 크기 및 매크로블록의 크기에 따라 성능이 평균 30% 이상 향상되는 효과를 검증하였다.

Advanced SIMD 아키텍처에서의 HOG 보행자 검출기 고속화 방법 (A Speed-up Method of HOG Pedestrian Detector in Advanced SIMD Architecture)

  • 권기표;이재흥
    • 전기전자학회논문지
    • /
    • 제18권1호
    • /
    • pp.106-113
    • /
    • 2014
  • 보행자 검출기는 보안이 필요한 곳에서 모니터링을 하거나 특정 장소를 드나드는 사람의 수를 셀 때, 운전 중 차도에 뛰어드는 사람을 감지할 때 등 상황에 따라 여러 목적으로 응용될 수 있다. 이와 관련한 연구는 많이 진행되어 왔지만, 임베디드 시스템에서는 제한된 컴퓨팅 능력으로 인해 검출 속도가 느리다는 문제가 있다. 본 논문에서는 입력 영상에서 배경 부분을 빠르게 제거하여 검출 속도를 향상하는 방법과 ARM SIMD 아키텍처에서 NEON 병렬화 기법을 이용하여 검출 속도를 향상하는 방법을 제시한다. 제시한 방법으로 구현한 검출기는 INRIA Person Dataset을 이용하여 테스트한 결과 기존에 비해 3.01배의 향상된 속도를 나타냈다.

Neon 을 사용한 $4{\times}4$ 행렬의 역행렬 연산 (Calculating an inverse of a $4{\times}4$ matrix using Neon)

  • 오유연;이창건
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.344-346
    • /
    • 2012
  • 스마트폰에서의 3D 게임/애플리케이션에 대한 사용자의 요구는 나날이 증가하고 있다. 3D 게임/애플리케이션은 내부적으로 $4{\times}4$ 행렬을 가지고 여러 가지 좌표 변환을 수행하기 때문에, 보다 빠른 3D 그래픽스 처리를 위해서는 $4{\times}4$ 행렬 연산의 최적화가 필수적이다. $4{\times}4$ 행렬 연산중에 역행렬 연산에 대해 살펴보고, ARM 프로세서에서 지원하는 Neon 연산자를 이용해서 $4{\times}4$ 행렬의 역행렬 연산을 개선할 수 있다.

HOG를 이용한 ARM 아키텍처에서의 고속 보행자 검출기 (Fast pedestrian detector using HOG in ARM architecture)

  • 권기표;이재흥;강병익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.161-164
    • /
    • 2013
  • 보행자 검출기는 보안이 필요한 곳에서 모니터링을 하거나 특정 장소를 드나드는 사람의 수를 셀 때, 운전 중 차도에 뛰어드는 사람을 감지할 때 등 상황에 따라 여러 목적으로 응용될 수 있다. 이에 따른 연구는 많이 진행되어 왔지만, 임베디드 시스템에서는 제한된 컴퓨팅 능력으로 인해 검출 속도가 느리다는 문제가 있다. 본 논문에서는 입력 영상에서 배경 부분을 빠르게 제거하여 검출 속도를 향상하는 방법과 ARM 아키텍처에서 NEON 병렬화 기법을 이용하여 검출 속도를 향상하는 방법을 제시한다. 제시한 방법으로 구현한 검출기는 기존보다 201.1% 향상된 속도를 나타냈다.

다중 코어 및 single instruction multiple data 기술을 이용한 심층 신경망 속도 향상 (Improving the speed of deep neural networks using the multi-core and single instruction multiple data technology)

  • 정익주;김승희
    • 한국음향학회지
    • /
    • 제36권6호
    • /
    • pp.425-435
    • /
    • 2017
  • 본 논문에서는 다중 코어 ARM 프로세서의 NEON SIMD(Single Instruction Multiple Data) 병렬 명령어 및 다중 코어 병렬화를 통하여 심층 신경망의 피드포워드 네트워크 연산을 최적화하는 방안을 제시하였다. SIMD 병렬 명령어를 이용한 최적화의 경우에는 단계 별 최적화 과정에서의 속도 향상과 정밀도를 제시 하였다. 단일 코어 상에서 SIMD 병렬 명령어를 이용하여 구현된 결과는 C 컴파일러를 이용한 구현보다 2.6배의 속도 향상을 얻을 수 있었다. 또한 단일 코어 상에서 최적화된 코드를 다중 코어로 병렬화함으로써 5.7배~7.7배의 속도 향상을 얻을 수 있었다. 이상의 결과를 통하여 이동형 단말기에서도 연산량이 많은 심층 신경망 기술을 활용할 수 있는 가능성을 확인하였다.

조미훈연 오징어의 가공중 품질변화 (Changes in Quality of Seasoned and Smoked Squid During Processing)

  • 류흥수;문숙임;이강호
    • 한국수산과학회지
    • /
    • 제25권5호
    • /
    • pp.406-412
    • /
    • 1992
  • 조미훈연 오징어(Neon flying squid, Qmmastrephes bartrannii)의 적절한 가공조건을 찾기 위하여 일반성분변화 및 단백질 품질변화를 측정하였다. 수분, 조단백질함량은 매우 감소하였으나(p<0.05) 지방, 회분함량은 그다지 증가하지 않았다. 조미, 훈연은 TBA가의 증가를 초래하였다. 여러 가지 가공단계들은 TI함량을 크게 증가시키지는 않았다. 오징어 가공전단계를 통해 측정된 TI함량은 같은 가공단계에서의 TBA가와 서로 관련이 없었다. Steak용으로 가공한 것을 제외한 모든 가공품들의 경우, 소화율과 C-PER, DC-PER이 증가하였다. 생시료의 경우, 북태평양산 빨강오징어(몸통, 다리 양쪽 모두)의 효소 소화율은 다른 오징어종에 비해 상당히 낮았다.

  • PDF

모바일 기기에서의 방사형 그라디언트 페인트 가속 (Acceleration of Radial Gradient Paint Processor for Mobile Device)

  • 김진우;박진홍;한탁돈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.530-533
    • /
    • 2011
  • 방사형 그라디언트 페인트(radial gradient paint)는 벡터 그래픽스(vector graphics)에서 적은 정보로 다양한 효과를 적용시킬 수 있는 방법이다. 기본적으로 이 방법은 곱하기, 나누기, 제곱근 등의 복잡한 연산이 필요하기 때문에 모바일 같은 저성능 환경에 적합하지 않았다. 하지만 최근 모바일 기기들은 SIMD 연산 지원 및 고성능의 GPU 탑재 등으로 성능이 향상됨에 따라 이러한 문제를 해결할 수 있게 되었다. 본 논문은 ARM의 SIMD연산인 NEON을 이용하여 최대 2.6배의 성능을 가속시켰으며 GPU의 쉐이더를 이용하여 4.9배의 성능을 가속하였다.