• 제목/요약/키워드: LUT

검색결과 261건 처리시간 0.033초

CNN에서 입력 최댓값을 이용한 SoftMax 연산 기법 (SoftMax Computation in CNN Using Input Maximum Value)

  • Kang, Hyeong-Ju
    • 한국정보통신학회논문지
    • /
    • 제26권2호
    • /
    • pp.325-328
    • /
    • 2022
  • A convolutional neural network(CNN) is widely used in the computer vision tasks, but its computing power requirement needs a design of a special circuit. Most of the computations in a CNN can be implemented efficiently in a digital circuit, but the SoftMax layer has operations unsuitable for circuit implementation, which are exponential and logarithmic functions. This paper proposes a new method to integrate the exponential and logarithmic tables of the conventional circuits into a single table. The proposed structure accesses a look-up table (LUT) only with a few maximum values, and the LUT has the result value directly. Our proposed method significantly reduces the space complexity of the SoftMax layer circuit implementation. But our resulting circuit is comparable to the original baseline with small degradation in precision.

고속 FPGA 구현에 적합한 효율적인 정수 나눗셈 알고리즘 (An Efficient Integer Division Algorithm for High Speed FPGA)

  • 홍승모;김종훈
    • 대한전자공학회논문지TC
    • /
    • 제44권2호
    • /
    • pp.62-68
    • /
    • 2007
  • 본 논문에서는 메모리와 곱셈기가 내장된 고속 FPGA(Field Programmable Gate Array)에서 효율적으로 구현할 수 있는 정수 나눗셈 알고리즘을 제안하였다. 제안된 알고리즘은 메모리를 이용한 Look-up Table(LUT)과 곱셈기를 사용하여 반복 계산(Iteration)구조로 FPGA의 자원을 최소화할 수 있으며 반복연산 횟수가 일반적으로 알려진 뺄셈 또는 뺄셈-곱셈에 의한 나눗셈 알고리즘에 비해 매우 적어 Latency를 최소화 할 수 있다. Xilinx사의 Virtex-4 FPGA에 VHDL coding을 통해 Pipeline구조로 구현한 결과 17bit의 정수 나눗셈을 300MSPS( Mega Sample per Second)의 속도로 수행하였다. 또한 일반적으로 사용되고 있는 뺄셈 또는 뺄셈-곱셈 구조에 비해 FPGA의 소요자원인 Slices의 경우 1/6이하, 곱셈기-누산기 수는 1/4이하로 줄일 수 있었으며, 입출력 간의 지연 Latency를 1/3이하로 줄일 수 있어 다른 알고리즘에 비해 매우 효율적인 구조임을 확인하였다.

모바일 디스플레이를 위한 특성화 방법과 색 정합 기술 (Characterization Method and Color Matching Technology for Mobile Display)

  • 박기현;하영호;이철희
    • 한국멀티미디어학회논문지
    • /
    • 제9권4호
    • /
    • pp.434-442
    • /
    • 2006
  • 본 논문에서는 모니터와 모바일 디스플레이간의 복잡한 색 정합 과정을 단순화시키는 3차원의 색 정합 look-up table(LUT)을 설계하였다. 여기에서 영상의 색은 CIEXYZ 혹은 CIELAB 등의 장치 독립적인 색 공간에서 처리되며, 색역의 차이를 보상하기 위해 색역 사상이 수행된다. 장치 의존적인 RGB 색 공간에서 장치 독립적인 색 공간으로의 변환은 디스플레이 특성화 과정을 수행함으로써 이루어진다. 기존의 S-curve 모텔을 이용하여 모바일 LCD 를 특성화 하면 모바일 LCD의 채널 색도 변화와 채널 의존 특성으로 인해 특성화 오차가 허용 오차보다 커지게 된다. 본 논문에서는 R, G, B, C, M, Y, K 성분의 X, Y, Z의 전기-빛 입출력 곡선을 모두 이용하여 특성화 오차를 줄였다. 제안한 색 정합 LUT 와 복잡하고 단계적인 색 정합 절차 사이의 색 정합 결과 영상 비교 실험을 통해 허용오차 내의 영상을 재현할 수 있는 색 정합 LUT의 최소 크기가 64($4{\times}4{\times}4$)라는 것을 확인하였다.

  • PDF

핑거프린트 방식의 자기 공진형 무선전력전송 코일 정렬 상태 개선 기법 연구 (A Study on Fingerprint-Based Coil Alignment Improvement Technique for Magnetic Resonant Wireless Power Transfer System)

  • 김성재;이의범;구현철
    • 한국전자파학회논문지
    • /
    • 제30권1호
    • /
    • pp.38-44
    • /
    • 2019
  • 본 논문에서는 자기 공진형 무선전력전송 시스템에서 사용 가능한 핑거프린트 방식의 측위 기법을 제안하고 성능을 검증하였다. 측위를 위해 3축 방향의 자기장 신호 측정이 가능한 소형 직교 보조코일을 가지는 수신기 코일 설계 방안을 제시하고, 제안한 코일을 이용해 획득한 3축의 기전력의 크기와 위상 특성을 추출하였다. 측정 지점에서 획득된 값을 이용하여 위치를 측정하기 위해 LUT(Look-up Table)를 이용하는 기법과 기계학습 방식 중 LDA(Linear Discriminant Analysis)을 이용하는 기법을 제안하고, 각 기법별 측위 정확도 및 계산 속도를 비교 제시하였다. 6.78 MHz 무선전력전송시스템에서 75개의 지점을 측위하는 실험에서 제안하는 코일과 기전력 특성을 이용한 LUT 기법을 적용하여 측위 정확도 97.33%를 달성하였다. LDA 기법의 경우, 기전력과 위상을 이용하여 측위하는 경우 LUT 기법에 비해 계산 속도가 늘어나지만 정확도를 향상시킬 수 있었다.

시분할 FPGA 합성에서 마이크로 레지스터 개수에 대한 하한 추정 기법 (A Lower Bound Estimation on the Number of Micro-Registers in Time-Multiplexed FPGA Synthesis)

  • 엄성용
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권9호
    • /
    • pp.512-522
    • /
    • 2003
  • 시분할 FPGA는 회로가 동작하는 중 회로의 기능을 재구성할 수 있는 동적 재구성 기능을 갖춘 FPGA 칩이다. 따라서 이러한 칩을 위한 회로 합성 기법에서는 주어진 논리 회로를 각각 다른 시간대에 수행할 여러 개의 부분회로로 분할한 후, 동일한 하드웨어 회로를 시간차를 두고 공유하도록 해야 한다. 기존의 연구에서는, 칩의 제한된 용량 문제를 해결하기 위해, 동일 시간대에 필요한 자원으로서 각 세부 함수를 수행하는 LUT(Look-Up Table)의 개수와 LUT의 출력 결과를 다른 시간대에 사용하기 위해 그 결과를 임시 저장하는데 필요한 마이크로 레지스터(micro register)의 개수를 최소화하는 데 중점을 두고 있다. 본 논문에서는 시분할 FPGA 합성용 도구 중의 하나로서 회로 구현에 필요한 메모리 원소, 즉 마이크로 레지스터의 개수에 대한 하한(lower bound)을 추정하는 기법에 대해 설명한다. 이 방법에서는 입력되는 논리 회로를 직접 합성하지 않고서도 그 회로가 필요로 하는 전체 마이크로 레지스터 개수에 대한 하한을 각각 추정함으로써 특정한 합성 기법에 관계없이 회로 구현에 필요한 최소한의 마이크로 레지스터의 개수에 대한 정보를 추출한다. 만일, 기존의 합성 결과가 본 연구에서 추정된 하한과 일치할 경우, 그 결과는 최적의 결과를 의미한다. 반면에, 하한과의 차이가 있는 경우에는 기존의 연구 결과에 비해 더 좋은 합성 결과가 존재하거나, 또는 본 연구에서 추정한 하한보다 더 좋은(큰, 정확한) 하한이 실제 존재함을 의미한다. 따라서 이러한 비교 분석을 통해, 기존 연구는 물론, 향후에 개발할 새로운 합성 방법의 결과가 최적인지, 또는 개선의 여지가 있는지를 판단하는 좋은 지표를 얻을 수 있다. 실험 결과, 추정된 하한은 기존 연구의 합성 결과와 다소 차이가 있었다. 이러한 차이는 우선, 기존의 합성 결과는 LUT 개수를 적절히 유지하는 가운데 마이크로 레지스터를 최소화한 결과인 반면, 본 하한 추정에서는 합성 가능한 모든 결과 중, LUT 개수와는 전혀 무관하게, 마이크로 레지스터 개수를 최대한 작게 사용할 합성 예를 추정하기 때문이라고 판단된다. 또 한편으로는 마이크로 레지스터 개수에 대한 하한 추정 문제 자체가 갖는 거대한 변동성과 복잡성으로 인해 제안한 추정 기법이 정밀도에 한계를 가지는 것으로 해석할 수 있으며, 다른 한편으로는 기존 연구 결과보다 더 좋은 합성 결과가 존재할 가능성이 높음을 의미하는 것으로 해석될 수 있다.

디스플레이 장치를 위한 9개 채널 계조 응답 곡선에 기반한 역 특성화 기법 (Inverse Characterization Method Based on 9 Channel Tone Response Curves for Display Device)

  • 임혜봉;조양호;박기현;하영호
    • 대한전자공학회논문지SP
    • /
    • 제42권5호
    • /
    • pp.85-94
    • /
    • 2005
  • 디지털 입력값과 이에 대응되는 CIEXYZ 삼 자극치 값에 대한 관계를 도출하는 기법인 디스플레이 특성화는 칼라 운영 시스템에서 정확한 색을 재현하는데 중요하다. 9개 채널 제조 응답 곡선으로부터 추정된 디스플레이 장치의 특성화는 기존 3개 채널의 계조 응답 곡선을 사용한 것 보다 성능이 향상된다. 하지만 9개 채널의 계조 응답 곡선을 사용한 디스플레이 장치의 특성화는 각각의 RGB값에 대응되는 CIEXYZ값이 분리되지 않기 때문에, 역 특성화 과정이 직접적으로 적용되지 않는다. 따라서 일반적인 경우 역 특성화 과정은 3차원 참조표를 사용하여 구현된다. 3차원 참조표를 역 특성화 과정에 적용할 경우, 결과의 정확도는 향상 되지만 많은 양의 메모리 공간과 다수의 측정 데이터가 필요한 단점이 있다. 그러므로 본 논문에서는 채널 의존적인 값의 모델링과 GOG(gain, offset gamma) 모델에 기반한 9개 채널의 역 변환 과정을 적용한 역 특성화 기법을 제안한다. 제안한 방법은 디스플레이 특성화의 정확도를 향상할 뿐 아니라 3차원 참조표 방법을 사용할 경우 요구되는 복잡도와 다수의 측정 데이터도 감소할 수 있다.

Loop-Up Table과 필터 중첩영역 버퍼링 기법을 이용한 컨벌루션 영상처리 고속화 (Accelerated Convolution Image Processing by Using Look-Up Table and Overlap Region Buffering Method)

  • 김현우;김민영
    • 전자공학회논문지SC
    • /
    • 제49권4호
    • /
    • pp.17-22
    • /
    • 2012
  • 컨벌루션 기법은 디지털 영상처리 분야에서 블러링(blurring), 샤프닝(sharpening), 에지 검출(edge detection), 잡음 제거(noise reduction)등 다양한 목적을 위해 사용되고 있으며, 상황에 따라 다양한 필터 마스크 값을 가지고 적용된다. 본 논문은 영상처리에서 다양하게 응용되는 컨벌루션 영상처리 기법을 2차원 Look-Up Table(LUT)와 필터의 중첩영역 버퍼링 기법을 통하여, 이의 영상처리 속도를 고속화하는 방법을 제안한다. 첫째, 사전에 필터의 마스크 값과 영상 화소 값의 곱셈 연산 결과값을 2차원 LUT에 저장하여, 연산에 대한 결과를 참고 하였다. 둘째, 대부분의 컨벌루션 필터가 가지는 필터 대칭성 특징에 의해 연산이 중복 수행되는 부분을 효율적으로 연산하기 위해, 중첩영역 처리 결과를 버퍼 공간에 임시 저장하고, 다음 연산에서 사용할 때 버퍼의 값을 가져오는 방식으로 중첩 영역의 불필요한 반복 연산을 최소화한다. 제안하는 알고리즘은 실시간 처리를 필요로 하는 PC환경과 제한된 컴퓨팅 자원을 가지는 임베디드 시스템 환경에서 연산량을 최소화함으로써 기존 컨벌루션 알고리즘 보다 고속화된 성능 결과를 확인할 수 있었다.

R-LWE 암호화를 위한 근사 모듈식 다항식 곱셈기 최적화 (Optimization of Approximate Modular Multiplier for R-LWE Cryptosystem)

  • 이재우;김영민
    • 전기전자학회논문지
    • /
    • 제26권4호
    • /
    • pp.736-741
    • /
    • 2022
  • 격자 기반 암호화는 최악의 경우를 기반으로 한 강력한 보안, 비교적 효율적인 구현 및 단순성을 누리기 때문에 포스트 양자 암호화 방식 중 가장 실용적인 방식이다. 오류가 있는 링 학습(R-LWE)은 격자 기반 암호화(LBC)의 공개키암호화(Public Key Encryption: PKE) 방식이며, R-LWE의 가장 중요한 연산은 링의 모듈러 다항식 곱셈이다. 본 논문은 R-LWE 암호 시스템의 중간 보안 수준의 매개 변수 집합을 대상으로 하여 근사 컴퓨팅(Approximate Computing: AC) 기술을 기반으로 한 모듈러 곱셈기를 최적화하는 방법을 제안한다. 먼저 복잡한 로직을 간단하게 구현하는 방법으로 LUT을 사용하여 근사 곱셈 연산 중 일부의 연산 과정을 생략하고, 2의 보수 방법을 활용하여 입력 데이터의 값을 이진수로 변환 시 값이 1인 비트의 개수를 최소화하여 필요한 덧셈기의 개수를 절감하는 총 두 가지 방법을 제안한다. 제안된 LUT 기반의 모듈식 곱셈기는 기존 R-LWE 모듈식 곱셈기 대비 속도와 면적 모두 9%까지 줄어들었고, 2의 보수 방법을 적용한 모듈식 곱셈기는 면적을 40%까지 줄이고 속도는 2% 향상되는 것으로 나타났다. 마지막으로 이 두 방법을 모두 적용한 최적화된 모듈식 곱셈기의 면적은 기존대비 43%까지 감소하고 속도는 10%까지 감소하는 것으로 나타났다.

등시지각 색 샘플링에 기반한 $CIEL^{*}a^{*}b^{*}$-CMY로의 비선형 색변환 ($CIEL^{*}a^{*}b^{*}$-CMY nonlinear color transformation based on equi-visual perception color sampling)

  • 류승민;오현수;이철희;유미옥;최환언;안석출
    • 한국인쇄학회지
    • /
    • 제18권1호
    • /
    • pp.103-112
    • /
    • 2000
  • The color space transformation to link device-dependent color spaces and device-independent color spaces is essential for device characterization and cross-media color reproduction. There are various color conversion methods such as regression, 3D interpolation with LUT(look-up table), and neural network. In the color transformation with these methods, the conversion accuracy is essentially based on the sample data to be exploited for device characterization. In conventional method, color samples are uniformly selected in device-dependent space such as CMY and RGB. However, distribution of these color samples is very non-uniform in device-independent color space such as CIEL*a*b*. Accordingly, the conversion error in device-independent color space is irregular according to the distribution of the samples. In this paper, a color sampling method based on equi-visual perception is proposed to obtain approximate uniform color samples in CIEL*a*b* space. In order to evaluate transformation accuracy of proposed method, color space transformations are simulated using regression, 3D interpolation with LUT and neural network techniques, respectively.

  • PDF