• 제목/요약/키워드: 고정소수점 연산

검색결과 91건 처리시간 0.02초

고정 소수점 연산시 오차의 전파를 줄이는 고속 이산 여현 변환 알고리즘 (A fast DCT algorithm with reduced propagation error in the fixed-point compuitation)

  • 정연식;이임건;최영호;박규태
    • 한국통신학회논문지
    • /
    • 제23권9A호
    • /
    • pp.2365-2371
    • /
    • 1998
  • 이산 여현 변환(Discrete Cosine Transform: DCT)은 음성 및 영상 신호의 압축에 광범위하게 응용되고 있다. 본 논문에서는 $2^{m}$-포인트의 일반적인 경우로 확장이 가능한 새로운 고속 DCT 알고리즘과 구조를 제안한다. 제안한 알고리즘은 커널의 대칭성을 이용하여 N-포인트의 DCT를 N/2-포인트의 DCT로 나누어 처리하며 이를 재귀적으로 적용해 나간다. 제안한 알고리즘은 적은 덧셈 및 곱셈 연산을 통해 변환을 수행하며, 변환을 위해 통과해야 하는 곱셈 연산단의 수가 적고 대부분의 곱셈 연산이 흐름도상의 후반부에서 일괄적으로 수행되므로 고정 소수점 연산시에 발생할 수 있는 오차의 전파를 줄일 수 있다.

  • PDF

3GPP 규격 오류 정정 부호 기법의 성능 평가 (Performance Analysis of Error Correction Codes for 3GPP Standard)

  • 신나나;이창우
    • 한국전자파학회논문지
    • /
    • 제15권1호
    • /
    • pp.81-88
    • /
    • 2004
  • 3GPP 표준의 오류 정정 부호 기법 중의 하나로 채택된 turbo 부호는 그 성능이 Shannon이 제시하는 이론적 한계 값에 근사하기 때문에 많은 관심을 받고 있다. 그러나 계산상의 복잡함과 많은 메모리를 요구한다는 단점이 있고 이를 보완할 수 있는 Log-MAP, Max-Log-MAP, SOVA, sliding window 알고리즘 등이 제안되었다. 본 논문에서는 turbo복호 알고리즘을 부동 소수점 연산과 고정 소수점 연산을 이용하여 구현하였을 때 성능을 해석하였다. 그리고 Log-MAP 알고리즘의 성능에 근사하는 효율적인 고정 소수점 구현 방법을 제안하였다. 이 방법을 Log-MAP과 sliding window 알고리즘에 적용하여 성능을 분석하였다.

OpenGL을 이용한 OpenGL ES 1.1 구현 (OpenGL ES 1.1 Implementation Using OpenGL)

  • 이환용;백낙훈
    • 정보처리학회논문지A
    • /
    • 제16A권3호
    • /
    • pp.159-168
    • /
    • 2009
  • 본 논문에서는 데스크탑과 같이 OpenGL 기능이 전용 하드웨어로 제공되는 환경을 대상으로, OpenGL ES 1.1 표준을 효율적으로 구현하는 방법을 제시한다. OpenGL ES는 기존의 OpenGL 표준을 바탕으로 하였지만, 고정소수점 연산, 이를 수용하는 버퍼 기능, 완전히 새로운 텍스처 처리 등의 도입으로, 임베디드 시스템에 특화된 3차원 그래픽스 라이브러리로 새롭게 제정되어, 구글 안드로이드, 애플 아이폰, 플레이스테이션3 등에서 공식 3차원 그래픽스 API로 채택되었다. 본 논문에서는 OpenGL ES의 특징적 자료형인 고정소수점 표현에 대한 산술 연산들을 개선하였고, 특히 고정소수점 자료형들을 부동소수점 형태로 변환하여 하위의 OpenGL API로 넘기는 과정에서 표준을 준수하면서도 효율적인 처리가 가능하도록 하였다. 새로 도입된 고정소수점 자료형을 허용하는 버퍼 기능에 대해서는 변환된 자료들을 별도의 메모리 공간에서 관리하는 방식으로 속도 향상에 중점을 두었으며, 요구 사항이 완전히 달라진 텍스처 처리 부분은 전체 기능을 별도의 소프트웨어로 완전히 새롭게 구현하였다. 최종 구현 결과인 OpenGL ES 라이브러리는 OpenGL ES 1.1 표준에 규정된 총 200여 함수를 제공하며, 표준인증 테스트를 완전히 통과하여 1.1 표준을 완벽히 만족시켰음을 보였다. 수행 속도 면에서는 OpenGL ES에 특화된 응용 프로그램들에 대한 처리 속도 측정에서 기존의 구현 사례들에 비해 최대 33.147배의 속도 향상을 가져왔으며, 동일한 범주의 구현 사례들 중에서 가장 빠른 구현 결과이다.

다중 채널 디지털 보청기 알고리즘의 고정 소수점 연산 최적화 (Fixed-point Optimization of a Multi-channel Digital Hearing Aid Algorithm)

  • 이근상;백용현;박영철
    • 한국정보전자통신기술학회논문지
    • /
    • 제2권2호
    • /
    • pp.37-43
    • /
    • 2009
  • 본 논문에서는 저 전력 시스템에 적합한 고정 소수점 연산기로 구현된 다중 채널 디지털 보청기 알고리즘의 최적화 기법을 제시한다. 먼저 입력 신호를 고속 MDCT(modified discrete cosine transform) 방법을 사용하여 주파수 대역 분할함으로써 알고리듬의 복잡도를 최소화 하였고, MDCT 출력을 비선형 대역 분할 과정을 거쳐 채널별 그룹핑을 한 다음, 각 채널 신호를 난청인의 청각 손실 정도에 따라 구성한 라우드니스 보상 함수(loudness compensation function: LCF)표를 이용하여 이득을 조절하고, 최종적으로 TDAC 기법을 구현하는 IMDCT(Inverse MDCT) 변환을 거쳐 보상된 출력을 합성한다. 모든 과정은 16비트 정수 연산으로 구현되며, 이득을 계산하기 위해 측정되는 로그 단위의 연산 과정은 미리 계산된 테이블과 고속 탐색 알고리듬을 이용하여 구현된다. 구성된 보청기 알고리즘의 성능을 컴퓨터 시뮬레이션을 통해 평가하였다.

  • PDF

Systolic Array를 이용한 3×3 Convolution 연산기 설계 (Design 3×3 Convolution Calculator with Systolic Array)

  • 김형순;이준희;서영호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.221-222
    • /
    • 2021
  • 본 연구는 Convolution Neural Network에서 사용되는 Convolution 연산기를 Systolic Array를 이용하여 구현한다. 두 개의 층으로 나뉜 연산기에 고정 소수점 값을 가지는 커널 값과 연속적인 입력을 넣고 정확한 출력이 나오는지 확인한다. 연산기 구현은 Verilog HDL로 하였으며 대조 연산은 Python에서 진행하였다.

  • PDF

EGML 이동 객체 검출 알고리듬의 고정소수점 구현 및 성능 분석 (A fixed-point implementation and performance analysis of EGML moving object detection algorithm)

  • 안효식;김경훈;신경욱
    • 한국정보통신학회논문지
    • /
    • 제19권9호
    • /
    • pp.2153-2160
    • /
    • 2015
  • EGML (effective Gaussian mixture learning) 기반 이동 객체 검출 (moving object detection; MOD) 알고리듬의 하드웨어 구현을 위한 설계조건을 분석하였다. EGML 알고리듬을 OpenCV 소프트웨어로 구현하고 다양한 영상들에 대한 시뮬레이션을 통해 배경학습 시간과 이동 객체 검출에 영향을 미치는 파라미터 조건을 분석하였다. 또한, 고정소수점 시뮬레이션을 통해 파라미터들의 비트 길이가 이동 객체 검출 성능에 미치는 영향을 평가하고, 최적 하드웨어 설계 조건을 도출하였다. 본 논문의 파라미터 비트 길이를 적용한 고정소수점 이동 객체 검출 모델은 부동소수점 연산 대비 약 절반의 비트 길이를 사용하면서 MOD 성능의 차이는 0.5% 이하이다.

Approximate computing 기법을 이용한 FPGA 기반 인공 신경망 가속기 최적화 (FPGA-based Artificial Neural Network Accelerator Optimization Using Approximate Computing)

  • 박상우;김한이;서태원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.479-481
    • /
    • 2019
  • 본 연구에서는 이미지를 분류하는 인공 신경망 가속기를 최적화했고, 이를 구현하여 기존 인공 신경망 가속기와 성능을 비교 분석했다. FPGA(Field Programmable Fate Array) 보드를 이용하여 가속기를 구현했으며, 해당 보드의 내부 메모리인 BRAM 을 FIFO(First In First Out)구조로 설계하여 메모리 시스템을 구현했다. Approximate computing 기법을 효율적으로 적용하기 위해 FWL(Fractional Word Length)최적점을 분석했고, 이를 기반으로 인공 신경망 가속기의 부동 소수점 연산을 고정 소수점 연산으로 변환했다. 구현된 인공 신경망 가속기는 기존의 인공 신경망에 비해, 약 7.4%더 효율적인 전력소모량을 보였다.

임베디드 시스템에서의 성능 향상을 위한 루프 펼침과 형변환 (Loop unrolling and type casting operation for performance improvement in embedded system)

  • 성운;신동영;박준석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2012년도 제45차 동계학술발표논문집 20권1호
    • /
    • pp.1-4
    • /
    • 2012
  • 임베디드 시스템에서 최적화 기술의 성능은 크로스 컴파일러의 성능과 실행상황, 대상 하드웨어의 특징 등에 따라 좌우된다. 본 논문에서는 최적화 기술 중 루프 펼침과 형 변환을 이미지 처리 코드에 적용하여 성능을 측정하였다. 그 결과 기술을 적용하지 않은 성능을 기준으로 55%의 성능향상이 이루어졌다.

  • PDF

컴퓨터 생성 홀로그램의 하드웨어 구현을 위한 버스 구조 분석 (Bus Architecture Analysis for Hardware Implementation of Computer Generated Hologram)

  • 서영호;김동욱
    • 한국정보통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.713-720
    • /
    • 2012
  • 최근 차세대 영상 기술로 홀로그래피가 많은 주목을 받고 있다. 홀로그램은 광학적인 촬영을 통해서 획득할 수도 있지만 최근에는 컴퓨터를 이용한 홀로그램 생성 방법을 많이 사용하고 있다. 이를 컴퓨터 생성 홀로그램(computer generated hologram, CGH)이라 하는데 CGH는 많은 연산량이 요구되어 S/W를 이용하면 실시간으로 생성하는 것이 불가능하다. 따라서 실시간의 CGH를 위해서 FPGA나 GPU를 이용한 연산 방법이 주로 사용되고 있다. 하드웨어를 기반으로 하여 구현할 경우에 내부 시스템의 비트 제한으로 인하여 S/W와 같은 품질을 얻을 수 없다. 따라서 본 논문에서는 품질의 저하를 최소화하면서 하드웨어의 자원을 최대한 감소시킬 수 있는 하드웨어 비트 너비를 분석하여 가이드라인을 제시하고자 한다. 이를 위해서 1비트 단위의 고정소수점 시뮬레이션을 모든 내부 변수 및 연산과정에 대해 수행하고, 수치적인 결과와 시각적인 결과를 종합적으로 분석하여 최적의 비트 너비와 응용분야에 따른 비트 너비를 제시한다.

MPEG-2 AAC 디코더의 DSP 구현에 관한 연구 (DSP based implementation of MPEG-2 AAC decoder)

  • 정종훈;김정근;이재식;장태규;장흥엽
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.481-484
    • /
    • 2001
  • 본 논문에서는 MPEG-2 AAC 디코더의 DSP구현에 관한 연구결과로서 IS0/1EC 13818-7 표준에 의거 구현된 MPEC-2 AAC 디코더의 각 세부 기능블럭들의 구성 및 동작원리에 대하여 요약 기술하고. DSP연산에 최적화된 연산구조의 연구를 바탕으로 16bit 고정소수점 연산구조를 가지는 DSP상에서 구현된 MPEG-2 AAC 디로더의 시스템의 하드웨어 및 소프트웨어 구성에 관하여 간략한 기술하였다. 구성된 디코더의 성능평가를 통하여 MPEC-2 AAC 비트스트림을 디코딩하기 위하여 필요로 하는 연산량 및 소요 메모리의 양을 측정하고, 디코더 성능의 중요 척도인 음질평가를 수행하였다. 수행방법으로서 conformance test에 의거하여 PSNR을 측정함으로써 객관적인 성능 지표의 제시와 함께, 주관적인 음질 평가도 병행하여 수행하였다.

  • PDF