• 제목/요약/키워드: number theoretic transform

검색결과 5건 처리시간 0.017초

동형 암호 시스템을 위한 정수 푸리에 변환의 메모리 절약 구조 (Memory saving architecture of number theoretic transform for lattice cryptography)

  • 문상국
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 춘계학술대회
    • /
    • pp.762-763
    • /
    • 2016
  • 동형 암호화 시스템을 구현하는 데 있어, encrypt, decrypt, recrypt 연산은 큰 골격을 이루는 연산이다. 각각에 있어 공통된 가장 중요한 연산은 백만 비트가 넘는 큰 정수에 대한 법 곱셈이며, 이것은 푸리에 변환을 반복적으로 수행하여 얻을 수 있는 매우 큰 정수에 대한 곱셈 연산과 곱셈 결과에 대한 법 간소화를 요구한다. 본 논문에서는 Schonhage-Strassen이 제안한 큰 정수에 대한 법 곱셈을 수행하는 알고리즘을 응용하여, 이를 다시 메모리를 절약할 수 있는 효율적인 알고리즘을 제안하고 구현한다. 제안한 정수 푸리에 변환 구조는 FPGA에 구현하여 성능을 비교하였다.

  • PDF

High Performance Integer Multiplier on FPGA with Radix-4 Number Theoretic Transform

  • Chang, Boon-Chiao;Lee, Wai-Kong;Goi, Bok-Min;Hwang, Seong Oun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권8호
    • /
    • pp.2816-2830
    • /
    • 2022
  • Number Theoretic Transform (NTT) is a method to design efficient multiplier for large integer multiplication, which is widely used in cryptography and scientific computation. On top of that, it has also received wide attention from the research community to design efficient hardware architecture for large size RSA, fully homomorphic encryption, and lattice-based cryptography. Existing NTT hardware architecture reported in the literature are mainly designed based on radix-2 NTT, due to its small area consumption. However, NTT with larger radix (e.g., radix-4) may achieve faster speed performance in the expense of larger hardware resources. In this paper, we present the performance evaluation on NTT architecture in terms of hardware resource consumption and the latency, based on the proposed radix-2 and radix-4 technique. Our experimental results show that the 16-point radix-4 architecture is 2× faster than radix-2 architecture in expense of approximately 4× additional hardware. The proposed architecture can be extended to support the large integer multiplication in cryptography applications (e.g., RSA). The experimental results show that the proposed 3072-bit multiplier outperformed the best 3k-multiplier from Chen et al. [16] by 3.06%, but it also costs about 40% more LUTs and 77.8% more DSPs resources.

NTT 기반의 효율적인 다항식 곱셈기 설계 (Design of Efficient NTT-based Polynomial Multiplier)

  • 이승호;이동찬;김영민
    • 전기전자학회논문지
    • /
    • 제25권1호
    • /
    • pp.88-94
    • /
    • 2021
  • 현재 사용되고 있는 RSA, ECC와 같은 공개키 암호화 기법은 소인수분해와 같은 현재의 컴퓨터로 계산이 오래 걸리는 수학적 문제를 암호화에 사용했다. 그러나 양자컴퓨터가 상용화된다면 Shor Algorithm에 의해 기존의 암호화 시스템은 쉽게 깨질 수 있다. 그로 인해 Quantum-resistant 한 암호화 알고리즘의 도입이 필요해졌고, 그중 하나로 Lattice-based Cryptography가 제안되고 있다. 이 암호화 알고리즘은 Polynomial Ring에서 연산이 행해지고, 그중 Polynomial Multiplication이 가장 큰 연산 시간을 차지한다. 그러므로 다항식 곱셈 계산을 빠르게 하는 하드웨어 모듈이 필요하고, 그중 Finite Field에서 연산 되는 FFT인 Number Theoretic Transform을 이용해서 다항식 곱셈을 계산하는 8-point NTT-based Polynomial Multiplier 모듈을 설계하고 시뮬레이션했다. HDL을 사용하여 로직검증을 수행하였고, Hspice를 사용하여 트랜지스터 수준에서 제안된 설계가 지연시간과 전력소모에서 얼마나 개선되는지를 비교 분석하였다. 제안된 설계에서 평균 지연속도 30%의 개선과 8% 이상의 전력소모 감소 효과를 볼 수 있었다.

One Improved RLWE-based FHE and Fast Private Information Retrieval

  • Song, Wei-Tao;Hu, Bin;Zhao, Xiu-Feng
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권12호
    • /
    • pp.6260-6276
    • /
    • 2019
  • With the rapid development of cloud computing, it raises real questions on privacy protection, which greatly limits the use of cloud computing. However, fully homomorphic encryption (FHE) can make cloud computing consistent with privacy. In this paper, we propose a simpler FHE scheme based on ring LWE problem, with a smaller size of ciphertext and a lower noise-expansion factor for homomorphic multiplication. Then based on our optimized RLWE-based FHE scheme, we propose a fast single-database private information retrieval protocol, combining with batching and number theoretic transform technology.

시간영역 및 주파수영역 블럭적응 여파기에 관한 연구 : 제1부- 구현방법 (Time- and Frequency-Domain Block LMS Adaptive Digital Filters: Part Ⅰ- Realization Structures)

  • 이재천;은종관
    • 한국음향학회지
    • /
    • 제7권4호
    • /
    • pp.31-53
    • /
    • 1988
  • 블럭적응 여파기는 구현시에 고속푸리에변환 기법을 이용하면 계산량을 대폭 줄일 수 있음이 밝혀져서 연구자들의 관심을 끌어 왔다. 본 논문은 2편으로 구성되어 있는데, 제 1 부에서는 블럭적응 여파기의 여러가지 구현방법을 연구하고 제 2 부에서는 성능분석의 결과들을 논의하고 있다. 블럭적응 여파기의 계수가 최적해를 추적하도록 하는 적응알고리즘은 시간영역 또는 주파수영역에서 동작하게 할 수 있는데 이를 각각 시간영역 및 주파수영역 블럭적응 여파기로 부른다. 특히 제 1 부에서는 이들 두 구조 사이의 공통점 및 대비 관계를 명확하게 할 것이다. 구체적으로 제 1 부에서는 먼저 overlap-add 방식에 의한 고속 구현방법과 정수론적 변환 기법에 의한 효율적인 구현방법에 관한 새로운 결과들을 발표한다. 그리고 나서 계수 설계시에 주파수영역의 정보를 주파수대역마다 차등으로 적용하는 방법과 여파기 계수의 최적해 추정에 있어서 수렴시간 단축을 위한 self-orthogonalization방법을 주파수영역은 물론 시간영역 블럭적응 여파기들에도 적응할 수 있음을 보인다. 다음으로 계수의 블럭적응을 위한 입출력데이터 블럭분할 방법의 특질에 근거해서 고속푸리에변환 연산을 (부분적으로) 생략할 수 있는 비제약 주파수영역 블럭적응 여파기에 관해서 논의한다. 제 1 부의 마지막으로 여러가지 여파기 상수값들과 서로 다른 알고리즘들이 여파기 수렴특성에 미치는 영향을 컴퓨터 시뮬레이션을 통해서 조사한 결과를 발표한다.

  • PDF