DOI QR코드

DOI QR Code

삼항 기약다항식 기반의 저면적 Shifted Polynomial Basis 비트-병렬 곱셈기

Low Space Complexity Bit-Parallel Shifted Polynomial Basis Multipliers using Irreducible Trinomials

  • 투고 : 2010.04.29
  • 심사 : 2010.08.23
  • 발행 : 2010.10.31

초록

최근 Fan과 Dai는 이진체 곱셈기의 효율성을 개선하기 위하여 Shifted Polynomial Basis(SPB)를 제안하고 이를 이용한 non-pipeline 비트-병렬 곱셈기를 제안하였다. SPB는 PB에 {1, ${\alpha}$, $\cdots$, ${\alpha}^{n-l}$}에 ${\alpha}^{-\upsilon}$를 곱한 것으로, 이 둘 사이는 매우 적은 비용으로 쉽게 기저 변환이 된다. 이후 삼항 기약다항식 $f(x)=x^n+x^k+1$을 사용하여 Modified Shifted Polynomial Basis(MSPB) 기반의 SPB 비트-병렬 Mastrovito type I과 type II 곱셈기가 제안되었다. 본 논문에서는 SPB를 이용한 비트-병렬 곱셈기를 제안한다. n ${\neq}$ 2k 일 때 제안하는 곱셈기 구조는 기존의 모든 SPB 곱셈기와 비교하여 효율적인 공간 복잡도를 가진다. 또한, 기존의 가장 작은 공간 복잡도를 가지는 곱셈기와 비교하여 1 ${\leq}$ k ${\leq}$ (n+1)/3인 경우 항상 효율적이다. 또한, (n+2)/3 $\leq$ k < n/2인 경우에도 일분 경우를 제외하고 기존 결과보다 항상 작은 공간 복잡도를 가진다.

Recently, Fan and Dai introduced a Shifted Polynomial Basis and construct a non-pipeline bit-parallel multiplier for $F_{2^n}$. As the name implies, the SPB is obtained by multiplying the polynomial basis 1, ${\alpha}$, ${\cdots}$, ${\alpha}^{n-1}$ by ${\alpha}^{-\upsilon}$. Therefore, it is easy to transform the elements PB and SPB representations. After, based on the Modified Shifted Polynomial Basis(MSPB), SPB bit-parallel Mastrovito type I and type II multipliers for all irreducible trinomials are presented. In this paper, we present a bit-parallel architecture to multiply in SPB. This multiplier have a space complexity efficient than all previously presented architecture when n ${\neq}$ 2k. The proposed multiplier has more efficient space complexity than the best-result when 1 ${\leq}$ k ${\leq}$ (n+1)/3. Also, when (n+2)/3 ${\leq}$ k < n/2 the proposed multiplier has more efficient space complexity than the best-result except for some cases.

키워드

Ⅰ. 서론

임베디드 관련 정보보호시스템 구축에 가장 중요한요소 중 하나가 유한체의 연산 시스템 구현이다. 특히 , 유한체 연산 중 곱셈 연산은 가장 높은 비중을 차지하며. 곱셈 연산의 효율성은 기저와 기약다항식 등에 의하여 달라진다. 효율적인 기약다항식을 선택하는경우 All One Irreducible Polynomial (AOP)를제외하고 대부분의 경우는 기약 다항식의 0이 아닌 항의 개수가 최소가 되는 경우가 가장 효율적이다. 따라서 본 논문과 같이 이진체 환경에서는 이항 기약다항식 (Binomial)이 존재하지 않으므로 삼항 기약다항식(Trinomial)이 가장 효율적이다.

f2. 연산은 f2 연산의 덧셈(뺄셈) 연산과 곱셈 연산에 의하여 계산되며, 덧셈과 곱셈 연산은 비트 단위의 AND와 XOR 연산에 의하여 표현된다. 이는 하드웨어에서 2-입력 1-출력의 AND와 XOR 게이트이다. 또한 하드웨어에서 연산의 효율성은 시간 및 공간 복잡도에 의하여 정의되므로 본 논문에서는 공간복잡도 계산을 위하여 AND와 XOR 게이트 수를 각각 皿와 N, 로 표기하고. 시간복잡도를 위하여 AND와 XOR 게이트 시간지연(time delay)과 전체 시간지연을 각각 Ta, Tx와 T<로 표기한다.

〔2〕에서 Shifted Polynomial Basis(SPB)를처음 제안하고, 이를 이용하여 파이프라인(pipeline) 이 아닌 비트-병렬 곱셈기를 제안하였다. SPB는 다항식 기저 (PB:Polynomial Basis)를 변형한 형태로 둘 사이의 기저 변환이 매우 간단하게 수행된다. 따라서 기존의 SPB 비트-병렬 곱셈기〔1, 2, 3, 4, 8〕는기존의 PB 비트-병렬 곱셈기〔5, 6, 7, 9, 10〕와 많이 비교되었다. 이후〔1〕에서 Modified Shifted Polynomial Basis(MSPB)를 제안하였고. 이를 이용하여 기존 결과들보다 시간 및 공간 복잡도에서 효율적인 type I, II SPB 곱셈기를 제안하였다.

본 논문에서는〔1〕의 결과와 같이 MSPB를 이용하여 새로운 SPB 비트-병렬 곱셈기를 제안한다. 삼항 기약다항식 기반에서 SPB를 사용하는 기존 결과에 비하여 제안하는 비트-병렬 Mastorvito 곱셈 기는 작은 공간복잡도를 가진다. 기존의 가장 작은 공간복잡도를 가지는 (1)의 type II와 비교하여 1 <fc< (n+l)/3인 경우 항상 AND 및 XOR 게이트■가 작으며 S + 2)/3 M *<n/2 인 경우에도 k가 n/2에 매우 근사하는 경우를 제외하고 기존 결과보다 항상 작은 공간복잡도를 가진다. 따라서 제안하는 곱셈식의 공간복잡도가 비효율적인 경우 제안하는 방법은〔1〕의 type II 구조를 사용한다. 시간복잡도의 경우 n>까를 만족하는 차수가 인 모든 삼항기약다항식 (1, 491개)에 대해〔1〕의 type II와 비교하면, 942개 (63.18%)가 같으며 549개(36.82 %)가 1TX 증가한다.〔1〕 의 Type II 곱셈기의 공간복잡도가 낮아 제안하는 곱셈기를 사용하지 않고〔1〕의 type II 곱셈기를 사용하는 경우까지 모두 고려하면 실제 399개 (26.76%)만 ITx 증가한다.

본 논문의 구성은 다음과 같다. 2절에서는 (4)에서제안된 SPB 비트-병렬 곱셈을 소개하고 이를 개선한 口〕의 삼항 기약다항식을 위한 SPB 비트-병렬 곱셈과 복잡도를 소개한다. 3절에서는 제안하는 MSPB 기반의 저면적 SPB 비트-병렬 곱셈기와 그 시간 및공간 복잡도를 기술한다. 4절에서는 제안하는 곱셈기와 기존 결과의 복잡도를 비교하고 결론을 내린다.

Ⅱ. 기존의 SPB 곱셈

# 는 3개의 항을 가지는 기약다항식#에 의하여 생성되었고, /($)의 근을 a라 정의하자. (이때 0 = % <匕 5이다.) 그러면 다항식 기저에 의하여 弓의 임의의 두 원소 a(a), b(a) n-- I — 1는 a(a)=、"匕 6(a) =, 新疽이며 (이때 瞄 beF2 i — 0i — 0이다.) , 두 원소의 곱 c(a) 는 다음과 같은 두 과정 에의하여 계산된다:

■ 다항식 곱셈:

#

・ /(游에 의한 모듈러 감산 연산:

#

곱셈 연산의 복잡도는 위의 두 과정에 의하여 결정된다. 본 논문은 삼항 기약다항식 /(c) = 站+抄+ 1에대해서만 논하도록 한다.

2.1〔4〕에서 제안된 SPB 곱셈

최근 (2)에서 처음으로 旦, 의 원소를 SPB로 표현하는 방법이 제안되었다. SPB는 PB의 변형된 형태로 다음과 같이 정의된다.

정의 1.。를 임의의 정수라 하고 r= {a! 10 < 拦 n-1}를 舟의 다항식 기저라 할 때 , 순서집합 1}를 /에 대한 SPB (Shifted Polynomial Basis)라 한다.

비트-병렬 곱셈기에서 SPB를 사용할 경우, 〔4〕에서 소개된 바와 같이。는 k 또는 k-l에서 최적의 값을가진다. SPB에 의하여 임의의 두 원소 aM, b(a)는

#

#

이다. 따라서 곱 c(a) =(z(a)b(cv) modf (3))는 다음과 같다〔4〕:

#(1)

식 (1) 에서 疽 (—U W" —U—1) 의 계수를 비교하여 연산량 감소를 위하여 공통 电를 이용하여 간소화한다(4). 예를 들어 , t = n-2Ll인 경우

#

이다. 이때 병렬 계산을 위하여 E/21 개의 아)…— 항과 n-v 개의 ag"f_"[+b”T_[) 항은 XOR 트리에 의하여 계산된다. 따라서 삼항 기약다항식 /(0)=r”+抄+ 1에 대하여 SPB 비트-병렬 곱셈기는 다음과 같은 복잡도를 가진다.

#

이때 u는 A: 또는 为- 1 이다.

2.2 〔1〕에서 제안된 SPB 곱셈

〔1〕에서 새로운 MSPB 기저와。값을 이용하여 비트-병렬 SPB 곱셈기를 제안하였다. 제안된 곱셈 기는 다음 정의를 기반으로 한다.

정의 2. 0를 정수라 하고 "={疽「"|0容Mn-l} 를 弓의 SPB라 할 때, 만약

#

이면, 순서집합(ordered set) 厶={疽-叫4 <i<\ + k-l, S2 <i<52+n-fc-l}> oTvIe\ 대한 삼항 기으¥ 다항식 /(£)=、+抄+ 1를 위한 MSPB(Modified Shifted Polynomial Basis)라 한다.

〔1〕의 식 (6)을 다시 정리하면 다음과 같다.

#(2)

이때 瓦는

#

이다. 또한〔1〕에서 식 (2)의 (f) + ((e) + (i)eTG W 舞—3歸~2사이에서

#

로 간소화됨을 보였다. 식 (2)에서 알 수 있듯이 n-欢 값의 범위에 따라 顼항의 계수값이 일부 달라지며 그림 1과 같다.

(그림 1) (n>2k) 식 (2)의 도식도

[그림 1] 에서와 같이 식 (2)에서 항 疽의 계수들은 化의 조건에 따라 달라진다. t의 범위가

#

#

#

인 경우를 제외하고, n>2左인 경우의 繕 범위에 따라 항을 구분하여 계수를 정리하면〔표 1〕과 같으며 , 〔표 1〕에서 밑줄이 있는 부분은 간소화되는 부분이다. 구분된 항에 따라 계수 계산과 시간지연을 정리하면〔1〕의〔표 1〕과 같다. (1)의 SPB 곱셈기는 제안된 MSPB와 Karatsuba-Ofman (KO) 방법의 곱셈을 효율적으로 적용하여 KO 곱셈시 발생하는 시간복잡도 증가의 trade-off를 제거하였다’ 또한 그림 2 와 같이 비트-병렬 곱셈기는 기저변환, 다항식 곱셈, 모듈러 감산이 병렬로 계산된다.〔1〕에서는 시간복잡도를 최적화한 type I과 공간복잡도를 최적화한 type II를 제안하였다.

(표 1) 모든 경우에 대한 계수 Ci-2k의 식

(그림 2) (1)의 SPB 비트-병렬 곱셈기

Ⅲ. 제안하는 저면적 SPB 비트-병렬 곱셈기

본 절에서는〔1〕에서 제안된 SPB 비트-병렬 곱셈기를 변형하여〔1〕의 type II 보다 공간 복잡도가 효율적인 삼항 기약다항식 f(x) = xn +ik + l 기반의 SPB 비트-병렬 곱셈기를 제안한다. 제안하는 방법은 n과 의 값에 따라 각 항 疽의 계수가 달라진다. 따라서 다음과 같이 세 가지 경우로 구분한다.

1. 九-3人:20인 경우

2. n —3k=—1 인 경우

3. n —3初 三-2인 경우

제안하는 비트-병렬 곱셈은 식 (2)에서 Z가 n-3k < t < n-次-2사이인 항에서 공간 복잡도를 효율적으로 줄인다. 만약 이고 이면, (2)에

#(3)

를 두 번 더하고, 이를 각각 (jl), 。2)라 하자.(弓 이므로 (jl) + (j2)는 0이다.) 그러면 식 (2)는

#(4)_

이다. 이때 (j2)를 풀어쓰면

#(5)

이며, (以4)는

#(6)

이므로 식 (6)은 식 (2)의 (a1) + (jl) + (b)+9c1)에 #을 곱한 값과 같다. 따라서 이 부분은 실제 계산되지 않는다. 이를 이용하여 식 (4)를 정리하면 다음과 같다.

#(7)

따라서 이후 소절에서 구분된 세 가지 경우에 따라달라지는 항 疽의 계수에 대하여 기술한다.

3.1 n-3k≤t≤n-2k-2차수 항의 곱셈식

본소절에서는 식 (7)에서 17\ n — 3k <t<n- -弘-2사이 차수인 항 (*) g)+(h)+(i)+G + G22)+ (払)를 고려한다.

3.1.1 n-3k≥0인 경우

식 (2)에서 (g)는

#(8)

이고, t가 n —3AYZ d —次 —2일 때 (i)를 풀어쓰면

#(9)

이다. 따라서 식 (5), ⑻과 (9)로 부터 (g) +(1) + (必) + (必) + (為)는 다음과 같다.

#(10)

식 (10)의 결과를 (k)라 중卜자. 식 (10)에서 (g) 와 (鶴)은 같은 값으로 소거되고, («)과 (J22), G3) 와 (必)는 각각 毎와 ㈤에 의하여 간소화된다. 또한, 〔1〕에서 소개된 바와 같이 ((f) + ((e) +(1)))는 (3m歸mm에 의하여 간소화된다. y 일 때 계산되는 값

#(11)

는 가정 n 兰 醯 에 의하여

#(12)

이다. 결국 T+l G -秋-2에서 계산되는 모든 + 云 t + « + m, Q는 t=-k일 때 모두 계산

되므로 실제 연산은 ”-泌-1번의 XOR 연산만 수행된다. 식 (k) 의 <흐t — 2 — « + 5fc + 角-好4互)와 (4 —2-转+ 5為 + 妃混蘇)도 마찬가지로 £ = n-3&일 때 계산되는

#(13)

에 의하여 n-3fc+l < t <n-2fc-2lHW 계산되는 모든 (%_「『 十涕+ 改 -i + 4k 와(4-._«+我+砧+&)는 계산되었으므로 실제 연산은 2Q-1)번의 XOR 연산만수행된다. 그러나 식 (12)와 (13)의 ("”+“+*, * + 云 T+" + 4") 와(4- — ” + 5*+4-" 地)는 일부 같은값을 가진다. 가정에 의하여 n+1 W*+l3na2 藁이므로, 식 (12)에서 0。의 모든(4… 措 이 계산되고, 식 (13)은 k-1 번의 (%_-5 +缶_, +软)의 XOR 연산으로 계산된다. 따라서 儿-:由no인 경우 추가적으로 소요되는 XOR 연산량은 Nx =n — k —2이다.

3.1.2 n-3k=-1 또는 n-3k≤-2인 경우

본 절의 서두에서 소개한 바와 같이 아:=-1 또는 e-아: M-2 인 경우에 t 가 n-3k<t <n-2k-2 사이일 때 다음 항이 고려된다.

, n-3k < t <—2 : (c2).+ (e) + (g) + G'2j) + G'23) + G'23) (在-까:=—1인 경우 존재하지 않는다.)

. t=-l : (e) + (g) + (;21) + G22) + (j23)

- OMtMn-까-2 : (g)+(h)十 (1)+ ㈤+ (爲)

+ (j'23)(?i = 2&+1 인 경우는 제외된다.)

이때. 이전 소절에서와 같이 (g)와(J%)은 같은 값이므로 소거된다. t가 0<t <n-2fc-2 사이일 때의 항의 계수는 식 (10)에 의하여

#

이다, ne-3k<t <52인 항과 Z=T인 항을 고려하기위하여 (e), (c2), G%)와 (必)을 다시 정리하면 다음과 같다.

#(13)

식 (13)에서 t=-i일 때 (■犯"J와。&_2)는 존재하지 않으며, (ej과 (%T), ((3))와。爲T).(C2)와 (j2, . J 는 다음과 깉-이 간소화된다.

#(14)

#(15)

#(16)

식 (16)은 £=—1 인 항에서 존재하지 않는다. 식 (11)은 가정 n —3X—1에 의하여 t=—裁일 때 계산되는 값

#

에 의하여, 나머지 T + UVtl3S2 항에서 계산되는 모든(丄…心+ …4加0)가 계산된다. 그굔고식 (10)의 (角…“皿+曲… M)와©—F +弘 + 4 —34^도 마찬가지로 £ =。일 때 계산되는

#

에 의하여 , 1 < I <n-2k-2<^^\ 계산되는 모든 (知十-…弘+。"?: + 独)와(4 _ , — « + 5* + 4 — . + 4*) 、- 계 J 된다. 또한, 식 (14). (15). (16) 도 마찬가지로 t = n —아;일 때 계산되는 값

#

에 의해 나머지 항의 모든 값이 계산된다.

n-舞=-1인 경우 위에서 기술한 바와 같이 (14) 과 (15)의 계산값에 의하여 (k)와 식 (11)의 모든 값이 계산되며 (16)은 존재하지 않는다. n-3fc<t <-2 인 경우 또한 (14)과 (15)의 계산값에 의하여 (k)와식 (11)의 모든 값이 계산되며 추가적으로 (16)이 계산된다. 따라서 n — 3k=—l 또는 n — 3k <—2 경우의 XOR 연산량은 다음과 같다. n-3k=-1인 경우 (14) 과 (15)에서 2(n —fc) = (n —2fc+3fc—l)=n—A:—1 번의 XOR 연산이 소요되며, n —3KM-2인 경우 (14)과 (15)에서 2(7»-周번의 XOR 연산과 (14.3)에서 -n+아c-i 번의 XOR 연산이 소요되므로 전체 2(n—») + (— n + 3A—1)= n—北- 1번의 XOR 연산이 소요된다. 즉, n-3北£-1 인 경우 추가적으로 소요되는 XOR 연산량은 Nx = n — k-T이다.

3.2 제안하는 비트-병렬 곱셈기의 복잡도

본 소절에서는 이전 소절에서 기술한 새로운 SPB 비트-병렬 곱셈기의 구조와 시간 및 공간 복잡도에 대하여 논한다. 이전 절에서 보인바와 같이 식 (10)에서항 疽의 계수들은 /c의 조건에 따라 달라진다’ 이와 같이 구분된 k에 따른 계수 q + M의 계산을 정리하면〔표 2〕와 같다.〔표 2〕에서 AND 게이트 수는 중복된 연산은 제외한 결과이다(〔표 2〕에서〔 .〕로 표현된 부분은 연산량에서 제외된다.). 즉, 식 (2)에서 (c2)와식 ⑹의 (a2) + (jl) + (jM)의 AND 게이트 수는 제외된 결과이다. 제안하는 SPB 비트-병렬 곱셈 방법은 nx 1이고">次인 경우〔1〕에서 제안된 식 (6)의 n-3k<t<n-2k-2^ 경우의 항만 식을 변형된다. 따라서 구분된 化에 따라 제안하는 형태로 식이 변형되는 부분을 정리하면 다음과 같다.

[표 2] 모든 경우에 대한 Ct+2k의 식의 XOR 시간지연

① . 儿 * 2서-1인 경우 :

max{n-3&아:M t M —와c—2사이 항

② . n—3為=-1 인 경우 : t=-l인 항,

max{n —3서아M t M n —와:—2사이 항

③ . n -斑三-2인 경우 :# 사이 항,

t=—1 인 항, max{n — 3爲아W t M n —가:-2사이 항

제안하는 비트-병렬 Mastrovito 곱셈기의 시간 및 공간 복잡도를 정리하면 다음 정리와 같다.

정리 1. &>까: 일 때 제안하는 비트-병렬 MSPB 곱셈기의 공간 복잡도는

#

이다.

증명 . 우선 제안하는 비트-병렬 Mastrovito 곱셈기의 AND 게이트 복잡도를 고려해보자.〔표 1〕 에서소개한 바와 같이 사의 계수는 n과 *에 따라 달라진다. 따라서〔표 1〕에서 구분된 1)~5)에 따라 복잡도를 기술한 斗. 1)의 경우 t에 따라 t =5 A:-l, 5k < t <-2 , t =…1, 0 < ^ < n-3k--2, Z = ?z —3北-1, n~3k<t <n —2Jc—2^- t — n — 2k— 15-나누어지므로〔표 2〕의 AND 게이트 수에 의하여 각각의 (顼항은 n, n, n + t + 1, n, n, n, n —糸와 n—/c개의 AND 연산으로 계산된다. 따라서 1)의 AND 게이트수는

#

이다.〔표 1〕에서 2) ~4)의 경우도 이와 같은 방법으로 계산하면 疗—妒 T职-1)/2개의 AND 게이트로 계산된다. 마지막으로 5)를 살펴보자. 5)의 경우 t에 따라 —2k < t < — k~2, t ~k<t <n—3k—2, t — n-3k~l, n-3fc< t <-2, t=-l, 0 <t < n-次-2와 t = n-로 나누어지므로〔표 2〕의 AND 게이트수에 의하여 각각의 泌 항은 n. n, n +1 +1, n + t + 1, n — k ■■■■■■■■■■ t - 1, n — k, n-서와 n — A:개의 AND 연산으로 계산된다. 따라서 1)의 AND 게이트수는 展+(3”-4k+l)/2 + (n + £ — 1)(—n + 3fc)/2+ (n — 2fc)(n— k) — 2(n—(3/2)£户 + n + A:(6希-5)/2이다. 다음으로 XOR 게이트 복잡도를고려해보자. 먼저〔표 1〕에서 구분된 1)~4)의 경우 XOR 게이트 복잡도를 살펴보자. 전체 AND 게이트수에서 각각 항마다 1개씩 n개가 감소되고 (c2)와 ((a2) + (jl) +。為))의 덧셈에서 각각 /lT개와 A개의 XOR 게이트가 필요하다. 또한. 3.1.1과 3.L2절에서 소개한 간소화 과정의 (如+b。)들의 덧셈에서 nT-2(〔표 1〕, 〔표 4〕)의 경우 개)의 XOR 게이트가 소요되고. MSPB로의 기저변환에서 계산되는

#

에서 2A개의 XOR 게이트가 소요된다. 따라서 전체 XOR 게이트 수는

#

이다(단, 4)의 경우 /* -:2 + 1-(点-:1)@-6)/2이다.). 5)의 XOR 게이트 또한 이와 같이 계산되지만 m.1.2절에서 소개한 바와 같이 n-3k<t<~2 사이에서 (c2)의 일부가 간소화되므로 fc-1 XOR 게이트가 아닌 n-아: 개의 XOR 게이트가 소요된다. 그리고 m.1.2절에서 소개한 간소화 과정 (妃+4, )들의 덧셈에서 n-k-1 XOR 게이트:가 소요된다. 따라서 전체 XOR 게이트 수는

#

이다.

정리 2 m>2初일 때 제안하는 비트-병렬 Mastrovito 곱셈기의 시간 복잡도는

#

이다.

증명. 제안하는 비트-병렬 Mastrovito 곱셈기의 釦於의 回 따른 시간 복잡도는〔표 2〕와 같다.〔표 2) 에서 t가- 2k GMT—2일 때의 경우를 제외하고 나머지 경우에서는 /가 가장 작은 값일 때 구간내의 최대시간지연을 가진다. 仑가 -2인 경우의 시간지연은 2「岫(- — 心 가 최대값이 되는 경우의 값 2「心1)1 을 만족하는 t의 값 중 가장 큰 t값에서 최대 시간 지연을 가진다. 北-1= 2「他1)1-1라 가정하자(이때, 也«<2「心1)1-1이다) 그러면 t =—2fc+u — 때 최대 시간지연을 가지므로

#

이다.〔표 2〕로 부터〔표 1〕에서 1)의 경우는 t가 ~k <t <—2 또는 n —< t < n —2/c—2 사이 일 때 최대시간 지연을 가지므로, 만약 n>4k-2 + 2{ 颱"小 이면, -次wy-2에서 최대시간지연을 가지고, 그렇지 않으면 找32에서 최대시간 지연을 가진다. 또한 2)~3)의 경우는 모두 n-3k<t< 育…次52에서 최대시간지연을 가지므로

#

이다. 4) 경우는 £=-1인 최대시간지연을 가지므로

#

이다(4)의 경우 n-3/c-l). 마지막 5)의 경우 71-2에서 최대시간지연을 가지므로

#

이다. 이를 모두 정리하면 제안하는 비트-병렬 Mastrovito 곱셈기의 시간 복잡도는 n-3fc < t < -2에서 최대시간지연을 가지므로

#

이다. 따라서 이를 모두 정리하면 제안하는 비트-병렬 Mastrovito 곱셈기의 시간 복잡도는

#

이다’

본 논문에서는 勤< 次인 경우는〔1)의 결과와 같이 k 대신에 71T를 사용하여 전개하면 동일하므로 생략한다. 정리 1에서 알 수 있듯이 1)~4) 경우는

모두〔1〕의 결과보다 AND 게이트와 XOR 게이트가 모두 감소한다. 그러나 5)의 경우 A에 따라 효율성이 달라진다. 따라서〔1〕의 type Ⅱ의 XOR 게이트 수 ■쉬 ”보다 2n2 6nk+2n — 1 + 果(狄-1)/2 가 큰 경우는 제안하는 방법을 적용하지않고〔1〕의 typ얀 II 곱셈기 구조를 사용한다. 이는 Q卜 泌2에 매우 근사한 경우 식 (13)의 眞“)가매우 커지기 때문이다. 따라서 제안하는 방법이〔1〕 의 Typ양 II 보다 효율성이 같거나 작은 경우는 다음과 같다、

■ 门>2&인 경우

-k—1

- 亨w<] ** 면서 (1)의 type Ⅱ의 3 Z

XOR 게이트 수 보다 많은 경우

■ n = 까:인 경우

■ 71 < 2»인 경 우

-n =肉+1

- 3<&y 씈2이면서 (1)의 type II의

XOR 게이트 수 보다 많은 경우

Ⅳ. 비교 및 결론

본 소절에서는 SPB 기반의 기존의 결과와 제안하는 SPB 비트, 병렬 Mastrovito 곱셈기의 효율성을 비교하고 결론을 내린다. 삼항 기약다항식 기반에서 SPB를 사용하는 기존 결과와 제안하는 비트 -병렬 Mastorvito 곱셈기와 공간 및 시간 복잡도를 비교하면 각각〔표 3), 〔표 4〕와 같다.〔표 3〕에서 알 수 있듯이 제안하는 곱셈기는 기존의 가장 작은 공간 복잡도를 가지는〔1〕의 type II와 비교하여 1MKMS + D/3인 경우 항상 공간복잡도가 작으며 (n + 2)/3< k<n/2°l 경우에도 A가 部2에 매우 근사하는 경우를 제외하고 기존 결과보다 항상 작은 공간복잡도를 가진다. 따라서 제안하는 곱셈식의 공간복잡도가 비효율적인 경우 제안하는 방법은〔1〕의 type II 구조를 사용한다. n> 까를 만족하는 차수가 1 < n < 1,000^ 모든 삼항 기약다항식 L491개 중 〔1〕의 type II 곱셈기 보다 더 작은 공간 복잡도를 가지는 경우는 1314개(88.13%) 존재한다. 기약다항식을 선택할 때 주어진 차수에서 가장 작은 "를 선택한다면 이러한 기약다항식을 사용할 확률은 매우 낮다.

[표 3] SPB 곱셈기의 게이트 수 비교

[표 4] SPB 곱셈기의 시간지연 비교

다음으로 〔표 4〕의 결과를 이용하여 시간 복잡도를 고려하여 보자. n>가를 만족하는 차수가 lMn< 1, 000인 모든 삼항 기약다항식 1, 491개에 대하여〔1〕 의 type I, II와 비교하면 다음과 같다. (1)의 type I 곱셈기와 비교하여 2개(0.14%)가 1TX 감소하고, 969개(68.29%)가 같으며 343개(24.17%)가 1TX 증가한다. 또한〔1〕의 Type II 곱셈기와 비교하여 942개(63.18%)가 같으며 549개(36.82%)가 1TX 증가한다.〔1〕의 Type II 곱셈기의 공간복잡도가 낮아 제안하는 곱셈기를 사용하지 않고〔1〕의 Type II 곱셈기를 사용하는 경우까지 모두 고려하면 실제 399 개(26.76%)만 1TX 증가한다.

제안하는 곱셈기는 차수가 1,000 이하인 모든 삼항기약 다항식을 고려할 때, 그 중 대략 30%정도만 1乌 증가하지만 기존의 곱셈기와 비교하여 더 작은 공간복잡도를 가지므로 저면적이 요구되는 환경에 효율적으로 적용가능하다,

후기

본 연구는 2009년도 세명대학교 교내학술연구비 지원에 의해 수행된 연구임

참고문헌

  1. 장남수, 김창한, 홍석희, 박영호, "삼항 기약다항식을 위한 효율적인 Shifted polynomial Basis 비트-병렬 곱셈기," 정보보호학회논문지, 19(2), pp. 49-61, 2009년 4월.
  2. H. Fan and Y. Dai, "Fast bit parallel GF($2^n$) multiplier for all trinomials," IEEE Trans. Computers., vol. 54, no. 4, pp. 485-490, Apr. 2005. https://doi.org/10.1109/TC.2005.64
  3. H. Fan and M.A. Hasan, "Relationship between GF($2^n$) Montgomery and shifted polynomial basis multiplication algorithms," IEEE Trans. Computers., vol. 55, no. 9, pp. 1202-1206, Sep. 2006. https://doi.org/10.1109/TC.2006.152
  4. H. Fan and M.A. Hasan, "Fast Bit Parallel Shifted Polynomial Basis Multipliers in GF($2^n$) ," IEEE Trans. Circuits & Systems-I, vol. 53, no. 12, pp. 2606-2615, Dec. 2006. https://doi.org/10.1109/TCSI.2006.883855
  5. A. Halbutogullari and M.A. Hasan, "Mastorovito Multiplier for General Irreducible Polynomials," IEEE Trans. Comput., vol. 49, no. 5, pp. 503-518, May. 2000. https://doi.org/10.1109/12.859542
  6. E.D. Mastrovito, "VLSI designs for multiplication over finite fields GF($2^m$) ," In Proceedings of the Sixth Symposium on Applied Algebra, Algebraic Algorithms, and Error Correcting Codes, vol. 6, pp. 297-309, July. 1988.
  7. E.D. Mastrovito, "VLSI Architectures for Computation in Galois Fields," PhD thesis, Linkoping University Dept. Electr. Eng., Linkoping, Sweden, 1991.
  8. C. Negre, "Efficient parallel multiplier in shifted polynomial basis," Journal of Systems Architecture, vol. 53, no. 2-3, pp. 109-116, Feb. 2007. https://doi.org/10.1016/j.sysarc.2006.09.004
  9. A. Reyhani-Masoleh and M.A. Hasan, "Low complexity bit parallel architectures for polynomial basis multiplication over GF($2^n$) ," IEEE Trans. Computers., vol. 53, no. 8, pp. 945-959, Aug. 2004. https://doi.org/10.1109/TC.2004.47
  10. H. Shen and Y. Jin, "Low complexity bit parallel multiplier for GF($2^n$) generated by equally-spaced trinomials," Information Processing Letters., vol. 107, pp. 211-215, Aug. 2008. https://doi.org/10.1016/j.ipl.2008.01.012