• 제목/요약/키워드: 연산 감소

검색결과 1,091건 처리시간 0.029초

Common sub-expression sharing과 CORDIC을 이용한 OFDM 시스템의 저면적 파이프라인 FFT 구조 (Low-area Pipeline FFT Structure in OFDM System Using Common Sub-expression Sharing and CORDIC)

  • 최동규;장영범
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.157-164
    • /
    • 2009
  • 이 논문에서는 OFDM시스템에서 가장 큰 칩 면적을 차지하고 높은 전력을 요구하는 핵심 연산 블록인 FFT에 대하여 파이프라인 Radix-4 MDC 방식의 저면적 구조를 제안하였다. 나비연산기에서 Twiddle factor 복소 곱셈연산을 수행할 때, 기존의 곱셈기를 사용하지 않고 CSD형 계수의 공통패턴을 공유하여 덧셈의 수를 줄일 수 있는 Common sub-expression sharing 방식과 CORDIC 알고리즘을 사용하여 구현 면적을 감소시켰다. 제안구조는 Verilog-HDL을 통해 모델링하고 Synopsys로 논리합성한 결과 기존구조와 비교하여 복소곱셈부는 48.2%감소효과, 전체 FFT구조는 22.1%의 면적 감소효과를 달성하였다. 따라서 제안된 FFT구조는 다양한 크기의 FFT를 사용하는 OFDM용 시스템에 효율적으로 사용될 수 있는 구조임을 보였다.

CORDIC을 이용한 OFDM용 저전력 DIF Radix-4 FFT 프로세서 (A Low-power DIF Radix-4 FFT Processor for OFDM Systems Using CORDIC Algorithm)

  • 장영범;최동규;김도한
    • 대한전자공학회논문지SP
    • /
    • 제45권3호
    • /
    • pp.103-110
    • /
    • 2008
  • 이 논문에서는 8K/2K-Point FFT Radix-4 알고리즘을 CORDIC 연산을 이용하여 효율적으로 나비연산 구조를 설계할 수 있음을 보였다. 즉 CORDIC 연산을 사용하여 cosine 과 sine 값을 저장하지 않고 4개의 복소 곱셈연산을 효과적으로 수행할 수 있음을 보였다. 제안된 CORDIC 나비연산기 구조를 Verilog HDL 코딩으로 구현한 결과, 기존의 승산기를 사용한 나비연산기 구조와 비교하여 36.9%의 cell area 감소 효과를 보였다. 또한 전체 8K/2K-point Radix-4 FFT 구조의 Verilog-HDL 코딩을 기존의 승산기를 사용한 구조의 코딩과 비교한 결과, 11.6%의 cell area 감소효과를 볼 수 있었다. 따라서 제안된 FFT 구조는 DMB용 OFDM 모뎀과 같은 큰 크기의 FFT에 효율적으로 사용될 수 있는 구조임을 보였다.

HEVC 부호기를 위한 효율적인 SAO의 저면적 하드웨어 설계 (Low Area Hardware Design of Efficient SAO for HEVC Encoder)

  • 조현표;류광기
    • 한국정보통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.169-177
    • /
    • 2015
  • 본 논문에서는 HEVC(High Efficiency Video Coding) 부호기를 위한 효율적인 SAO(Sample Adaptive Offset)의 저면적 하드웨어 구조를 제안한다. SAO는 HEVC 영상 압축 표준에서 채택된 새로운 루프 내 필터 기술로서 최적의 오프셋 값들을 화소 단위로 적용하여 영역 내 평균 화소 왜곡을 감소시킨다. 하지만 표준 SAO는 화소 단위 연산을 수행하기 때문에 초고해상도 영상을 처리하기 위해서 많은 연산시간과 연산량을 요구한다. 제안하는 SAO 하드웨어 구조는 SAO의 연산시간을 감소시키기 위해서 한번에 4개의 입력 화소들을 병렬적으로 처리하며, 2단계 파이프라인 구조를 갖는다. 또한 하드웨어 면적을 최소화하기 위해서 휘도 성분과 색차 성분에 대해 단일 구조를 가지며, 하드웨어에 적합한 연산기 및 공통 연산기를 사용한다. 제안하는 SAO 하드웨어 구조는 Verilog HDL로 설계하였으며, TSMC $0.13{\mu}m$ CMOS 표준 셀 라이브러리로 합성한 결과 약 190k개의 게이트로 구현되었다. 제안하는 SAO 하드웨어 구조는 200MHz의 동작주파수에서 4K UHD@60fps 영상의 실시간 처리가 가능하며, 최대 250MHz까지 동작 가능하다.

동시연산 다중 digit을 이용한 직렬 십진 곱셈기의 설계 (Design of Serial Decimal Multiplier using Simultaneous Multiple-digit Operations)

  • 유창헌;김진혁;최상방
    • 전자공학회논문지
    • /
    • 제52권4호
    • /
    • pp.115-124
    • /
    • 2015
  • 본 논문에서는 직렬 십진 곱셈기의 성능을 향상시키는 방안을 제안하고 다중 digit을 동시에 연산하는 방안을 제안한다. 제안하는 직렬 십진 곱셈기는 부분 곱 생성단계의 2배수, 4배수를 생성하기 위한 인코딩 모듈을 없애고 쉬프트 연산만으로 부분 곱을 생성해 지연시간을 감소시킨다. 또한 다중 digit 연산을 이용해 연산의 횟수를 줄인다. 제안하는 직렬 십진 곱셈기의 성능을 평가하기 위해서 Synopsys사의 Design Compiler를 이용하여 SMIC사의 110nm CMOS 공정 라이브러리로 합성하였다. 그 결과 제안한 곱셈기는 기존의 직렬 십진 곱셈기와 비교해 전체 면적은 4% 증가하였지만, 전체 지연시간은 5% 감소함을 보였다. 또한 동시 연산 수가 증가함에 따른 제안한 다중 digit 곱셈기의 면적과 지연시간의 trade-off를 확인하였다.

움직임 추정을 위한 개선된 다단계 연속 제거 알고리즘 (AMSEA: Advanced Multi-level Successive Elimination Algorithms for Motion Estimation)

  • 정수목;박명순
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.98-113
    • /
    • 2002
  • 본 논문에서는 블록 정합 알고리즘(BMA: block matching algorithm)인 다단계 연속 제거 알고리즘(MSEA: multi-level successive elimination algorithm)[1]의 연산량을 줄이기 위하여 네 가지 방안을 제안하였다. 첫 번째 제안 방안은 MSEA에서 서브 블록(sub block)의 합 놈(sum norm)에 대한 절대 오차의 합(SAD: sum of absolute difference)을 계산할 때 부분 왜곡 제거(PDE: partial distortion elimination) 기법을 적용하여 연산량을 감소시킨 알고리즘이다. 두 번째 제안 방안인 적응 SAD 계산 알고리즘은 SAD 계산 시 절대 오차가 큰 값에서부터 작은 값의 순으로 SAD를 계산하면 PDE가 빨리 발생하게 되어 연산량을 줄일 수 있는 성질을 이용한 알고리즘이다. 세 번째 제안 방안인 제거 레벨 추정 알고리즘은 탐색점의 제거 레벨을 추정하고 추정된 레벨에서부터 상위 레벨로 다단계 연속 제거 과정을 수행함으로 추정된 제거레벨보다 낮은 레벨들과 연관된 연산량을 감소시킨 알고리즘이다. 제안된 첫 번째, 두 번째, 세 번째 방안은 움직임 추정의 정확도가 전역 탐색 알고리즘(FSA: full search algorithm) 및 MSEA와 동일하면서 MSEA의 연산량을 효과적으로 감소시킨 알고리즘들이다. 네 번째 제안 방안인 나선형 다이아몬드 그물 탐색 알고리즘은 움직임 추정의 정확도가 거의 100%이면서 움직임 추정에 필요한 연산량을 획기적으로 감소시킨 고속 블록 정합 알고리즘이다. 위의 네 가지 제안 방안에 대한 성능을 평가하기 위하여 실험을 수행하였으며 실험에서 제안 방안들의 효율성을 확인하였다.

분산 공간 데이터베이스 시스템에서의 효율적인 질의 처리를 위한 병렬 연쇄 공간 죠인 기법 (Parallel Pipelined Spatial Join Method for Efficient Query Processing In Distributed Spatial Database Systems)

  • 고주일;이환재;김명근;이순조;배해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.11-14
    • /
    • 2002
  • 분산 공간 데이터베이스 시스템에서 자주 수행되는 공간 죠인 질의는 공간 데이터의 특징인 대용량성과 복잡성으로 인하여 공간 연산 수행시 연간을 수행하는 서버의 CPU 및 디스크 I/O상의 과부하를 일으킨다. 본 논문은 이러한 분산 광간 데이터베이스 시스템에서 수행 비용이 많이 드는 원격 사이트간의 공간 죠인 질의를 병렬적이며 연쇄적으로 수행하는 기법을 제안한다. 본 기법은 공간 죠인 연산의 대상이 되는 릴레이션들을 공간 연산의 특성에 따라 순서화하고, 그 중 최하위의 죠인에 참여하는 릴레이션들 중 하나를 이등분 하는 방법으로 공간 죠인 연산을 분리한 추, 질의 수행에 참여하는 두 서버에게 죠인 연산을 분배한다. 각 서버는 분할된 공간 죠인 연산을 동시에 연쇄적으로 저리하고 결과를 병합하여 최종 죠인 결과를 생성한다. 본 기법은 릴레이션을 분할하여 죠인을 수행함으로써 공간 연산에 참여하는 객체의 수를 절반으로 줄이며 R-Tree 등의 공간 인덱스 탐색 횟수와 그 범위를 감소시킨다. 또한 연쇄적인 질의 처리로 죠인의 결과인 임시 릴레이션을 생성하지 않으므로 대용량의 데이터에 대한 복잡한 질의에 대해서도 제한 없이 수행한다.

  • PDF

계층적 평활화 방법을 이용한 움직임 추정 알고리듬 (Hierachically Regularized Motion Estimation Technique)

  • 김용태;임정은;손광훈
    • 한국통신학회논문지
    • /
    • 제26권11A호
    • /
    • pp.1889-1896
    • /
    • 2001
  • 본 논문에서는 보다 효율적이고 정확한 움직임 벡터를 추정하기 위하여 계층적 평활화 방법(hierachical regularization technique)을 이용한 움직임 추정 알고리듬을 제안한다. 계층적 평활화 기법을 이용하여 움직임 벡터들의 신뢰도를 증가시켰고, 주위 벡터와의 평활화를 통해 움직임 벡터들의 비트량을 감소시켰다. 또한 적은 후보 벡터를 이용하여 움직임 벡터를 예측하는 고속 움직임 추정 알고리듬을 적용하여 평활화 과정의 추가로 인해 생기는 많은 연산량을 감소시켰다. 실험 결과 제안한 계층적 평활화 방법을 이용한 고속 움직인 추정 알고리듬은 전방향 탐색(full search) 알고리듬과 비교하여 비슷한 영상 화질에서 많은 연산량 감소를 얻을 수 있었으며 잘못된 벡터의 추정 및 확산을 줄일 수 있음을 확인하였다.

  • PDF

맵리듀스 기반 kNN join 질의처리 알고리즘의 설계 및 성능평가 (Design and Performance Analysis of MapReduce-based kNN join Query Processing Algorithm)

  • 김태훈;이현조;장재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.733-736
    • /
    • 2014
  • 최근 대용량 데이터에 대한 효율적인 데이터 분석 기법이 활발히 연구되고 있다. 대표적인 기법으로는 맵리듀스 환경에서 보로노이 다이어그램을 이용한 k 최근접점 조인(VkNN-join) 알고리즘이 존재한다. VkNN-join 알고리즘은 부분집합 Ri에 연관된 부분집합 Sj만을 후보탐색 영역으로 선정하여 질의를 처리하기 때문에 질의처리 시간을 감소시킨다. 그러나 VkNN-join은 색인 구축 비용이 높으며, kNN 연산 오버헤드가 큰 문제점이 존재한다. 이를 해결하기 위해, 본 논문에서는 대용량 데이터 분석을 위한 맵리듀스 기반 kNN join 질의처리 알고리즘을 제안한다. 제안하는 알고리즘은 시드 기반의 동적 분할을 통해 색인구조 구축비용을 감소시킨다. 또한 시드 간 평균 거리를 기반으로 후보 영역을 선정함으로써, 연산 오버헤드를 감소시킨다. 아울러, 성능 평가를 통해 제안하는 기법이 질의처리 시간 측면에서 기존 기법에 비해 우수함을 나타낸다.

직교 주파수 분할 다중화 시스템에서 최대전력대 평균전력의 비를 줄이기 위한 연산량이 적은 새로운 선택사상 기법 (A Modified SLM Scheme with Low Complexity for PAPR Reduction of OFDM Systems)

  • 허석중;노형석;노종선;신동준
    • 한국통신학회논문지
    • /
    • 제32권11C호
    • /
    • pp.1087-1094
    • /
    • 2007
  • 본 논문에서는 직교 분할 주파수 다중화 (이하 OFDM) 시스템에서 최대전력 대 평균전력의 비 (이하 PAPR)를 줄일 수 있는 새로운 선택사상기법 (selected mapping; 이하 SLM) 방법에 대해서 제안한다. 제안된 방법의 PAPR 감소 성능은 기존의 SLM과 동일하게 유지하면서도 연산 복잡도는 크게 감소시킨다. 또한, 본 논문에서는 모의실험을 통하여 IEEE 802.16에 제안된 표준에 근거한 OFDM 시스템을 수식적이고 해석적으로 분석하였다. 2048개의 부반송파를 사용하는 시스템에서 본 논문에서 제안하는 방법을 이용하여 4개의 서로 다른 위상 시퀀스를 생성하여 (U=4) PAPR 감소에 이용하는 경우 기존의 SLM에서 16개의 서로 다른 위상 시퀀스를 이용하여 (U=16) PAPR을 줄이는 경우와 비슷한 PAPR 감소 성능을 가지면서도 연산복잡도는 63.5% 감소되었다.

진보된 혼돈 대각화 방법을 이용한 상호작용하는 페르미온 계의 기저상태 계산 (Ground State Computation of Interacting Fermion Systems by using Advanced Stochastic Diagonalization)

  • 안설아;조명원
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.209-211
    • /
    • 2007
  • 2차원 상호작용하는 페르미온 계에 대한 혼돈 대각화 계산의 컴퓨터 계산 시간이, 대칭성 연산과 같은 여러 가지 방법을 이용함으로써 감소되었다. 첫째로, 각각의 격자를 업스핀(${\uparrow}$) 격자와 다운스핀(${\downarrow}$) 격자로 나누어서 2부분 격자가 가능케 했다. 이에 따라, 유효한 바탕 상태는 업스핀 배열에 다운스핀 배열을 겹침으로써 얻어진다. 결과적으로, 시험 바탕 상태를 저장하는데 사용되는 메모리 공간이 현저하게 감소되었다. 두 번째로, 바탕 상태 집합을 구성할 때, 해밀토니안 행렬의 원소들을 순람표에 기록하였다. 그럼으로써, 혼돈 대각화 과정에서 해밀토니안 행렬의 원소들을 반복적으로 계산하는 것을 피했다. 세 번째로, 바탕 상태 집합에 대칭성 연산을 적용함으로써 원 바탕 상태 집합이 대칭성 연산의 고유벡터들로 구성된 새로운 바탕 상태 집합으로 변환되었다. 기저 상태 파동함수는 대칭적인 바탕상태 (결합상태) 집합으로부터 구성되었다. 결과로서, 대칭성 연산을 이용함으로써, 혼돈 대각화 계산에 쓰이는 바탕상태의 총 개수가 50%까지 감소되었다.

  • PDF