• 제목/요약/키워드: high speed multiplication

검색결과 107건 처리시간 0.023초

정수 DCT를 이용한 H.263 부호기에 관한 연구 (A Study on the H.263 Encoder using Integer DCT)

  • 김용욱;허도근
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.2072-2075
    • /
    • 2003
  • This paper is studied the high speed processing moving picture encodec to compress and encode a moving picture by real time. This is used the new motion vector search algorithm with smallest search point in H.263 encodec, and is applied the integer DCT for the encodec by converting a moving picture. The integer DCT behaves DCT by the addition operation of the integer using WHT and a integer lifting than conventional DCT that needs the multiplication operation of a floating point number. Therefore, the integer DCT can reduce the operation amount than basis DCT with having an equal PSNR because the multiplication operation of a floating point number does not need.

  • PDF

디지털 서명을 위한 고속 RSA 암호 시스템의 설계 및 FPGA 구현 (Design and FPGA Implementation of a High-Speed RSA Algorithm for Digital Signature)

  • 강민섭;김동욱
    • 정보처리학회논문지C
    • /
    • 제8C권1호
    • /
    • pp.32-40
    • /
    • 2001
  • 본 논문에서는 기존의 Montgomery 알고리듬을 개선한 고속 모듈러 곱셈 알고리듬을 제안하고, 이를 기본으로 하여 디지털 서명에 적용 가능한 1024비트 RSA 암호 시스템의 설계 및 구현에 관하여 기술한다. 제안된 방법은 부분합 계산시 단지 1번지의 덧셈 연산이 필요하지만, 기존 Montgomery 알고리듬에서는 2번의 덧셈연산이 요구되므로 기존 방법에 비해 계산 속도가 빠르며, 하드웨어 면적도 매우 감소된다. 제안된 RSA 암호 시스템은 VHDL(VHSIC Hardware Description Language)을 이용하여 모델링하였고, $Synopsys^{TM}$사의 Design Analyzer를 이용하여 논리합성(Altera 10K lib. 이용)을 수행하였다. 또한, FPGA 구현을 위하여 Altera MAX+PLUS II상에서 타이밍 시뮬레이션을 수행하였다. 실험을 통하여 제안된 방법은 계산 속도가 매우 빠르며, 하드웨어 면적도 매우 감소함을 확인하였다.

  • PDF

Radix-4 Booth Recoding과 RB 연산을 이용한 새로운 복소수 승산 알고리듬 및 10-bit CMAC코어 설계 (A New Complex-Number Multiplication Algorithm using Radix-4 Booth Recoding and RB Arithmetic, and a 10-bit CMAC Core Design)

  • 김호하;신경욱
    • 전자공학회논문지C
    • /
    • 제35C권9호
    • /
    • pp.11-20
    • /
    • 1998
  • 고속 복소수 연산장치는 채널등화, 동기신호 복원, 변조 및 복조 등 디지탈 통신 시스템의 기저대역 신호처리에 필수적인 기능블록이다. 본 논문에서는 redundant binary (RB) 연산과 radix-4 Booth recoding을 결합한 새로운 복소수 승산 알고리듬을 제안한다. 제안되는 복소수 승산 방법은 실수 승산기를 사용하는 기존의 방법과 비교하여 부분곱의 수를 반으로 감소시키며, 단순화된 병렬구조로 구현되므로 고속 동작 및 저전력 소모를 가능하게 한다. 제안된 알고리듬을 적용하여 10-bit operand를 갖는 prototype 복소수 승산-누적기(complex-number multiplier-accumulator ; CMAC) 코어를 0.8-㎛ N-Well CMOS 공정으로 설계, 제작하였다. 제작된 CMAC 칩은 18,000여개의 트랜지스터로 구성되며, 코어부분의 면적은 약 1.60 × 1.93 ㎟이다. 제작된 칩을 테스트 보드에 실장하여 특성을 평가한 결과, 전원전압 V/sub DD/=3.3-V에서 120-MHz의 속도로 동작함을 확인하였으며, 이때의 전력소모는 약 63-mW로 측정되었다.

  • PDF

희소한 부호 자리수 계수를 갖는 FIR 필터 설계 (Design of FIR Filters With Sparse Signed Digit Coefficients)

  • 김시현
    • 전기전자학회논문지
    • /
    • 제19권3호
    • /
    • pp.342-348
    • /
    • 2015
  • 광대역 통신 모뎀이나 초고해상도 비디오 코덱 등과 같이 높은 데이터율을 갖는 시스템을 하드웨어로 구현할 때에는 디지털 필터의 고속 구현이 필수적이다. 디지털 필터의 임계경로는 대부분 MAC (multiplication and accumulation) 연산 회로이므로 필터 계수의 0이 아닌 비트의 갯수가 희소하다면 하드웨어 비용이 적은 덧셈기로도 디지털 필터를 고속으로 구현할 수 있다. 압축센싱은 신호의 희소 표현이나 희소 신호의 복원에 우수한 성능을 보임이 최근 연구에서 보고되고 있다. 본 논문에서는 압축센싱에 기반한 디지털 FIR 필터의 CSD (canonic signed digit) 계수를 찾는 방법을 제안한다. 주어진 주파수 응답과의 오차를 최소하면서 탐욕적 방법으로 희소한 0이 아닌 부호자리수를 찾고 잘못 선택되었던 부호자리수는 제거하는 과정을 반복한다. 설계 예를 통해 제안된 방법으로 희소한 0이 아닌 CSD 계수의 FIR 필터를 설계할 수 있음을 보인다.

변형 비적 적응 필터의 수렴 특성 개선에 관한 연구 (A Study on the Convergence Characteristics Improvement of the Modified-Multiplication Free Adaptive Filer)

  • 김건호;윤달환;임제탁
    • 한국통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.815-823
    • /
    • 1993
  • 본 논문에서는 곱셈연산이 필요치 안은 변형 비적 적응필터(MMADF : Modified Multiplication-free adaptive Filter) 알고리즘을 제안하고 수렴특성을 해석하였다. 제안한 구조는 DPCM(Differential Pulse Code Modulation)과 Sign 알고리듬을 이용한 MADF 구조에서 1차 필터를 첨가한 구조이다. 해석방법은 계수 비정렬벡터와 그 자기상관행렬의 수렴을 유도하였다. 수렴특성을 평가하기 위하여 분할등기(FSE : Fractionally Spaced Equallizer)에 적용하였으며, Sign 알고리듬, MADF 알고리듬, MMADF 알고리듬을 사용하여 정상상태오차와 수렴속도로 특성을 비교평가 하였다. MMADF 알고리듬을 FSE에 적용한 결과 안정된 수렴특성을 나타내었으며, 동일한 정상상태오차를 갖는 조건에서 시뮬레이션한 결과 기존의 Sign 및 MADF 알고리듬에 비해 신호특성 및 수렴속도가 개선 되었다.

  • PDF

실시간 멀티미디어 시스템을 위한 새로운 고속 병렬곱셈기 (New High Speed Parallel Multiplier for Real Time Multimedia Systems)

  • 조병록;이명옥
    • 정보처리학회논문지A
    • /
    • 제10A권6호
    • /
    • pp.671-676
    • /
    • 2003
  • 본 논문에서는 고속 병렬 곱셈기에서 속도향상을 위해 부분 곱을 가산하는 과정에 구성되는 CSA(Carry Select Adder) 트리에 새로운 압축기를 적용한 새로운 첫 번째 부분 곱가산(First Partial Product Addition : FPA)를 제안하여 기존의 전가산기를 이용한 병렬가산기보다 부분곱을 계산하는 속도를 약 20% 개선할 수 있게 했다. 새로운 회로는 새로운 FPA 구조를 사용하여 최종 합 CLA 비트를 N/2로 줄인다. 2.5v 0.25um CMOS 기술을 이용하여 제작된 16${\times}$16 곱셈기는 5.14nS의 곱셈 고속을 얻었다. 이 곱셈기의 구조는 파이프라인 설계에 용이하며 고성능을 낸다.

An Efficient Architecture Design of Low Complexity in Quantization of H.264/AVC

  • Lama, Ramesh Kumar;Yun, Jung-Hyun;Kwon, Goo-Rak
    • 한국멀티미디어학회논문지
    • /
    • 제14권10호
    • /
    • pp.1238-1242
    • /
    • 2011
  • An efficient architecture for the reduction of complexity in forward quantization of H.264/AVC is presented in this paper. Since the multiplication operation in forward quantization plays crucial role in complexity of algorithm. More efficient quantization architecture with simplified high speed multiplier is proposed. It uses the modification of the quantization operation and the high speed multiplier is applied for simplification of quantization process.

RNS에 의한 고속 곱셈기 구성에 관한 연구 (A Study on the High-Speed Multiplier Architecture Using RNS)

  • 김선영;김재공
    • 대한전자공학회논문지
    • /
    • 제20권5호
    • /
    • pp.43-49
    • /
    • 1983
  • 조합논리회로를 사용한 고속 RNS 곱셈기의 구성을 제안하였다. 연산시간과 하드웨어 절감을 결정하는 최적 moduti 선택조건에 대해서도 검토하였으며 RRNS에서는 magnitude index를 사용한 변형된 CRT로써 출력 변환하였다. 제안된 곱셈기의 추정시간은 파이프 라인없이 NRNS인 경우 31. 7ns, RRNS인 경우 47.95ns이었다.

  • PDF

ADSL용 4D TCM Decoder 저전력 구조 설계 연구 (A low-power VLSI architecture of 4D TCM decoder for ADSL)

  • 이금형;김재석
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1999년도 추계종합학술대회 논문집
    • /
    • pp.871-874
    • /
    • 1999
  • We propose a low complexity M-D(multidimensional) TCM decoder VLSI architecture for ADSL System. We use the shared subset decoder module by modifying the whole decoding procedure. We reduce power consumption by using the MSA (modulo set area) operation, which removes multiplication in 4D metric calculation. Also the proposed TCM decoder reduces chip area. It can be adopted in high-speed xDSL system.

  • PDF

데이터패스를 이용한 SA-DCT 구현 (Implementation of SA-DCT using a datapath)

  • 박주현;김영민
    • 전자공학회논문지C
    • /
    • 제35C권5호
    • /
    • pp.25-32
    • /
    • 1998
  • In this paper, SA (shape adaptive)-DCT is implemented using a datapath with 4 MACs (multiplication & accumulator). DCT is a well-known bottleneck of real-time video compression using MPEG-like schemes. High-speed pipelined MACs presented here implement real-time DCT. A datapath in this paper executes DCT/IDCT algorithms for QCIF 15fps(frame per second), maximum rate of VLBV(very low bitrte video) in MPEG-4. A 32bit accumulator in a MAC prevents distortion caused by fixed-point process. It can be applied to various operations such as ME (motion estimation) and MC(motion compensation) with a absolutor and a halfer.

  • PDF