• 제목/요약/키워드: 연산 수행

검색결과 2,660건 처리시간 0.039초

순환 DFT에 기초한 페이저 연산 장치의 ASIC 구현 (An ASIC implementation of Phasor Measurement Unit based on Sliding-DFT)

  • 김종윤;김석훈;장태규;김재화
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.143-146
    • /
    • 2001
  • 본 논문에서는 다 채널 페이저 연산 장치를 전용하드웨어로 구현하기 위한 설계 구조에 대하여 제시하였으며, 이를 연산량이 많은 곱셈기를 시분할에 의해 공유하는 구조를 제시하였다. 또한 페이저 측정을 위한 Sliding-DFT 알고리즘을 순환 구현할 경우의 근사구현 오차에 관한 정량적인 연구를 수행하였다. 이러한 오차 영향의 해석을 기반으로 하여 곱셈기 공유 구조를 적용한 페이저 연산 장치를 설계하고, 설계한 하드웨어의 내부동작을 보여주는 시뮬레이션을 통해 설계의 정확성을 확인하였다

  • PDF

16 비트 고정소수점 연산기를 이용한 고음질 MPEG-2 Layer-III 오디오 복호화 알고리듬 (High Quality MPEG-2 Layer-III Audio Decoding Algorithm Using 16-bit Fixed-point Arithmetic)

  • 이근섭;이규하;오현오;황태훈;박영철;윤대희
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.775-778
    • /
    • 2000
  • 2채널의 MPEG-2 Layer-Ⅲ 오디오 복호화 알고리듬이 16비트의 고정소수점 연산기로도 고음질의 오디오출력을 얻을 수 있도록 최적화를 수행하였다. 고음질을 얻기 위하여 고정소수점 연산기에서 발생하는 양자화 오차를 최소화 하였으며 각 복호화 과정 별로 최소의 오차를 발생시키는 알고리듬을 제안하고 사용하였다. 고정소수점 모의실험은 C-언어를 사용하여 수행되었으며, ISO-IEC 13818-4 Compliance Test를 수행하여 최적화된 복호화기가 ISO/IEC 13818-4 audio decoder의 기준을 만족함을 보였다.

  • PDF

영상내의 다중 후보 블록의 통계적 특징을 이용한 객체추적 (Object Tracking using Statistical Properties of Multiple Candidate Blocks in Image)

  • 천재봉;박명철;하석운
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 춘계종합학술대회
    • /
    • pp.149-152
    • /
    • 2007
  • 비전 연구에 있어서 객체 추적은 무엇보다도 중요시 되어 왔다. 특히 비디오 감시 시스템에서의 객체 추적은 매우 중요하다. 본 논문에서는 영상 내에서 움직이는 객체를 추출하고 객체내의 다중 후보블록의 통계적 특징을 이용한 추적 시스템을 구성하였다. 객체를 추적하기 위해서는 먼저 움직이는 객체 추출이 선행되어야 한다. 객체 추출은 영상 내에서 배경 프레임과 매 프레임에서의 현재 프레임간의 차 연산에 의한 가중치를 이용하여 객체의 움직임을 판단하고 추출하였다. 움직이는 객체는 본 논문에서 제안한 다중 후보 블록 알고리즘을 수행하여 추적에 필요한 통계 값을 획득한다. 통계 값으로는 방향성에 필요한 블록의 중심 좌표 값과 객체추적에 필요한 객체간의 매칭 정도를 사용하였다. 본 논문에서 제안한 추적 시스템은 민감한 빛의 변화에도 강건하였으며, 특정 블록에 대해서만 연산 수행을 수행하므로 컴퓨터의 연산을 줄여 실시간 추적도 가능하다.

  • PDF

블록 암호알고리즘을 위한, 추적불가능한 동적 키를 갖는 연산모드 (A Mode for Block Ciphers, with Untraceable Dynamic Keys)

  • 김윤정;조유근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.285-287
    • /
    • 1999
  • 블록 암호알고리즘에 대한 기존의 연산 모드들(ECB 또는 CBC 등)은, 각 블록에 대하여 동일한 키로 암호화를 수행한다. 이것은 침입자가 한번의 암호 요청만을 수행하여 많은 수의 평문/암호문 쌍을 얻을 수 있게 함으로써 차분해독법 등의 공격에는 안전성을 제공하지 않는다. 본 논문에서는 블록 암호 알고리즘을 위한 새로운 모드를 제안하는데, 이 모드에서는 암호화되는 각각의 블록이 서로 다른 키로 암호화되도록 함으로써 블록의 개수가 많아짐에 따라 안전성 면에서 상당한 이득을 얻게 된다. 각 블록을 위한 서로 다른 키를 생성하는 것이 추가 연산을 필요로 하지만, 제안하는 모드를 DES에 적용한 TDK(a mode for DEA with unTraceable Dynamic Keys)의 수행 시간을 pentium과 sun sparc 상에서 측정해 본 결과 ECB 모드와 거의 유사함을 알 수 있었다.

  • PDF

움직임 벡터들의 방향과 크기를 고려한 프레임율 증가 기법 (Frame Rate Up-Conversion Considering The Direction and Magnitude of Motion Vectors)

  • 박종근;배창영;이경준;정제창
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.328-331
    • /
    • 2015
  • 본 논문은 EBME(Extended Bilateral Motion Estimation) 알고리듬에서 움직임 벡터들의 방향과 크기를 고려한 알고리듬을 제안하였다. EBME는 높은 연산량을 요구하기 때문에 프레임 내의 x, y방향 각각의 평균 움직임 벡터크기를 이용하여 동적 프레임과 정적프레임을 판단하고, EBME 수행여부를 결정하여 연산량을 줄인다. 또한 동일한 움직임 벡터들의 방향과 크기를 비교하여 MVS(Motion Vector Smoothing)단계 수행여부를 판단함으로써 연산량을 줄인다. 제안하는 알고리듬을 적용한 실험 결과 기존의 EBME 알고리듬에 비해 수행시간은 단축되었으나 PSNR(Peak Signal to Noise Ratio)은 향상 되었다.

  • PDF

영역 중심점 선형 보간을 이용한 분기 객체의 네비게이션 경로 생성 기법 (Navigation path generation of branched object based on linear interpolation of centers of ROI)

  • 최유주;송수민;김효선;김명희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.455-458
    • /
    • 2002
  • 분기를 가지는 대상객체에 대한 가상 네비게이션 시 네비게이션 경로를 지정하기 위하여 일반적으로 반복적인 형태학적 연산(Iterative Morphological Operation)중 세선화(thining)연산을 기반으로 한 골격화(skeletonization)기법들이 널리 사용되었다. 이러한 방법은 반복적인 세선화 연산 수행과정을 거쳐야하므로 수행효율성이 떨어지고, 잡음에 의하여 잘못된 경로를 생성하기 쉽다. 본 연구에서 수행효율성을 개선하고, 잡음에 안정적으로 네비게이션 경로를 추적하기 위하여 영역 중심점 선형 보간 기법을 기반으로 한 네비게이션 경로추적 기법을 제안한다. 본 제안 기법에서는 2 차원 영상 분할 후, 분할 영상에 대한 영역의 수와 영역 중심점을 기반으로 분기위치를 추적하고, 분기영역에서의 영역 중심점 선명 보간을 통하여 자연스러운 네비게이션 경로를 생성한다.

  • PDF

랜덤워크 기법을 위한 GPU 기반 희소행렬 벡터 곱셈 방안에 대한 성능 평가 (GPU-based Sparse Matrix-Vector Multiplication Schemes for Random Walk with Restart: A Performance Study)

  • 유재서;배홍균;강석원;유용승;박영준;김상욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.96-97
    • /
    • 2020
  • 랜덤워크 기반 노드 랭킹 방식 중 하나인 RWR(Random Walk with Restart) 기법은 희소행렬 벡터 곱셈 연산과 벡터 간의 합 연산을 반복적으로 수행하며, RWR 의 수행 시간은 희소행렬 벡터 곱셈 연산 방법에 큰 영향을 받는다. 본 논문에서는 CSR5(Compressed Sparse Row 5) 기반 희소행렬 벡터 곱셈 방식과 CSR-vector 기반 희소행렬 곱셈 방식을 채택한 GPU 기반 RWR 기법 간의 비교 실험을 수행한다. 실험을 통해 데이터 셋의 특징에 따른 RWR 의 성능 차이를 분석하고, 적합한 희소행렬 벡터 곱셈 방안 선택에 관한 가이드라인을 제안한다.

희소 행렬 곱셈을 효율적으로 수행하기 위한 유동적 시스톨릭 어레이 구조 설계 (Design of the Adaptive Systolic Array Architecture for Efficient Sparse Matrix Multiplication)

  • 서주원;공준호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.24-26
    • /
    • 2022
  • 시스톨릭 어레이는 DNN training 등 인공지능 연산의 대부분을 차지하는 행렬 곱셈을 수행하기 위한 하드웨어 구조로 많이 사용되지만, sparsity 가 높은 행렬을 연산할 때 불필요한 동작으로 인해 효율성이 크게 떨어진다. 본 논문에서 제안된 유동적 시스톨릭 어레이는 matrix condensing, weight switching, 그리고 direct output path 의 방법과 구조를 통해 sparsity 가 높은 행렬 곱셈의 수행 사이클을 줄일 수 있다. 시뮬레이션을 통해 기존 시스톨릭 어레이와 유동적 시스톨릭 어레이의 성능을 비교하였으며 8×8, 16×16, 32×32 의 크기를 가진 행렬을 동일 크기의 시스톨릭 어레이로 연산하였을 때 필요 사이클 수를 최대 12 사이클 절감할 수 있는 것을 확인하였다.

메모리가 제한된 장치를 위한 효율적인 유한체 연산 알고리즘 (Efficient Algorithms for Finite Field Operations on Memory-Constrained Devices)

  • 한태윤;이문규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권4호
    • /
    • pp.270-274
    • /
    • 2009
  • 본 논문에서는 초소형 장치 상에서 적은 메모리만으로 효율적으로 연산 가능한 GF($2^m$) 상의 연산방법을 제안한다. 기존 구현들은 속도의 향상을 위한 곱셈연산 방법만을 제시하였으나, 본 논문에서는 곱셈 연산시 덧셈의 순서를 바꿈으로써 연산시 사용하는 메모리의 양을 줄이는 방법을 제시한다. 실험에 따르면, 본 논문에서 제안한 방법은 GF($2^{271}$)의 곱셈연산에서 이전에 제안된 방법들과 비교해 비슷한 수행 시간을 사용하면서 약 20% 적은 메모리 사용량을 보였다.

AVX2 명령어 집합을 이용한 고속 HEVC 역-변환 구현 (Implementation of Fast HEVC Inverse Transform using AVX2 Instruction Set)

  • 목정수;마종현;안용조;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.552-554
    • /
    • 2015
  • 본 논문은 AVX2 (Advanced Vector eXtension 2) 명령어 집합을 이용하여 HEVC (High Efficiency Video Coding) 복호화기의 역-변환 모듈을 고속화하는 방법을 제안한다. AVX2 명령어 집합은 256 비트 레지스터를 사용하여 다수의 데이터를 한번의 명령을 통해 병렬적으로 연산할 수 있으며 반복적인 산술 연산 혹은 논리 연산 구조에서 효율적이다. 제안하는 방법은 AVX2 명령어 집합을 이용하여 $8{\times}8{\sim}32{\times}32$ 크기의 TU (Transform Unit) 단위로 수행되는 역-변환 연산을 행렬의 곱 형태로 연산하여 고속화하였다. 실험 결과 AVX2 명령어 집합을 이용한 역-변환 연산은 Chen 알고리즘에 비해 평균 51% 속도 향상을 보였으며 SSE (Streaming SIMD Extension) 명령어 집합을 이용한 연산에 비해 평균 20%의 속도 향상 결과를 얻을 수 있었다.

  • PDF