• 제목/요약/키워드: Fast Convolution

검색결과 77건 처리시간 0.022초

온칩 컨볼루션 가속기를 포함한 대칭적 버퍼 기반 액티브 노이즈 캔슬러의 경량화된 FPGA 구현 (Lightweight FPGA Implementation of Symmetric Buffer-based Active Noise Canceller with On-Chip Convolution Acceleration Units)

  • 박승현;박대진
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1713-1719
    • /
    • 2022
  • 처리지연이 적은 노이즈 캔슬러일수록 샘플링 주파수를 높일 수 있으므로 더 좋은 품질의 출력 신호를 얻을 수 있다. 단일 버퍼를 사용할 경우 프로세서가 입력된 데이터를 처리하는 동안 새로운 데이터를 버퍼에 쓰기가 불가능하므로 처리지연이 발생한다. 이러한 처리지연은 안티-노이즈와 출력 신호를 합성시킬 때 위상을 일치시키기 위한 추가적인 버퍼링 오버헤드를 발생시킨다. 본 논문에서는 대칭적 Even-Odd-buffer 구조를 사용하여 읽기와 쓰기 작업을 번갈아 가며 수행함으로써 처리지연을 최소화하고 처리속도를 높일 수 있는 가속기의 구조를 제안한다. 또한, Fast Fourier Transform 기반 노이즈 캔슬링과 적응 Least Mean Square 알고리즘을 사용한 노이즈 캔슬링의 구조적 차이를 비교한다. 그 결과로 대칭적 Even-Odd-buffer를 사용하였을 때 단일 버퍼 대비 처리지연이 29.2% 줄어들었다. 제안하는 대칭적 Even-Odd-buffer 구조는 다양한 노이즈 캔슬링 알고리즘에 적용될 수 있다는 장점이 있다.

웨이블릿을 이용한 QRS complex 검출 알고리즘의 고정 소수점 연산 최적화 (Fixed-point Optimization of a QRS complex Detection Algorithm Using Wavelet Transform)

  • 박영철
    • 한국정보전자통신기술학회논문지
    • /
    • 제7권3호
    • /
    • pp.126-131
    • /
    • 2014
  • 본 논문에서는 웨이블릿 변환을 통하며 QRS complex를 검출 하며, 32비트 고정 소수점 연산이 가능한 프로세서에도 동작하도록 알고리즘 최적화 기법을 제시한다. 먼저 입력 ECG 신호를 밴드 패스 필터를 통과 시키고, 3개의 서로 다른 웨이블릿 함수를 하나로 병합한 웨이블릿 함수를 이용하여 웨이블릿 변환을 하며, 다음으로 시간 평균 함수를 뒤에 마지막으로 QRS complex를 검출 한다. 제안 알고리즘은 MIT-BIH arrhythmia database에 적용하여 검증한다. 모든 과정은 32비트 고정 소수점 연산으로 구현되며, 삼각함수 같은 복잡한 연산은 테이블화 하였다. 검출 알고리즘은 컴퓨터 시뮬레이션을 통해 평가 한다.

Photophysical and Electrochmical Studies of N,N-Bis (2,5-di-tert-butylphenyl) - 3,4,9,10 perylenebis (dicarboximide) (DBPI)

  • El-Hallag, Ibrahim S.;El-Daly, Samy A.
    • Bulletin of the Korean Chemical Society
    • /
    • 제31권4호
    • /
    • pp.989-998
    • /
    • 2010
  • The titled dye of DBPI gives amplified spontaneous emission (ASE) with maximum at 580 nm upon pumping by nitrogen laser (${\lambda}_{ex}\;=\;337.1\;nm$). The ground state absorption cross section (${\sigma}_A$) and emission cross section (${\sigma}_E$) as well as effective emission cross section(${\sigma}^*_E$) have been determined. The electronic absorption spectra of DBPI were measured in ethanol and tetrahydrofuran at room and low temperature. DBPI displays molecular aggregation in water. The photochemical reactivity of DBPI was also studied in carbon tetrachloride upon irradiation with 525 nm light. The electrochemical investigation of DBPI dye has been carried out using cyclic voltammetry and convolution deconvolution voltammetry combined with digital simulation technique at a platinum electrode in 0.1 mol/L tetrabutyl ammonium perchlorate (TBAP) in two different solvents acetonitrile ($CH_3CN$) and dimethylformamide (DMF). The species were reduced via consumption of two sequential electrons to form radical anion and dianion (EE mechanism). In switching the potential to positive direction, the compound was oxidized by loss of two sequential electrons, which were followed by a fast dimerization and/or aggregation process i.e $EC_{dim1}EC_{dim2}$ mechanism. The electrode reaction pathway and the chemical and electrochemical parameters of the investigated compound were determined using cyclic and convolutive voltammetry. The extracted electrochemical parameters were verified and confirmed via digital simulation method.

Development of an Acoustic-Based Underwater Image Transmission System

  • 최영철;임영곤;박종원;김시문;김승근
    • 한국해양공학회:학술대회논문집
    • /
    • 한국해양공학회 2003년도 춘계학술대회 논문집
    • /
    • pp.109-114
    • /
    • 2003
  • Wireless communication systems are inevitable for efficient underwater activities. Because of the poor propagation characteristics of light and electromagnetic waves, acoustic waves are generally used for the underwater wireless communication. Although there are many kinds of information type, visual images take an essential role especially for search and identification activities. For this reason, we developed an acoustic-based underwater image transmission system under a dual use technology project supported by MOCIE (Ministry of Commerce, Industry and Energy). For the application to complicated and time-varying underwater environments all-digital transmitter and receiver systems are investigated. Array acoustic transducers are used at the receiver, which have the center frequency of 32kHz and the bandwidth of 4kHz. To improve transmission speed and quality, various algorithms and systems are used. The system design techniques will be discussed in detail including image compression/ decompression system, adaptive beam- forming, fast RLS adaptive equalizer, ${\partial}/4$ QPSK (Quadrilateral Phase Shift Keying) modulator/demodulator, and convolution coding/ Viterbi. Decoding.

  • PDF

Spiral scan 초고속 자기공명영상 재구성 알고리즘 (Reconstruction Algorithms for Spiral-scan Echo Planar Imaging)

  • 안창범;김치영;박대준;김휴정;유완석;이윤;오창현;이흥규
    • 대한의용생체공학회:학술대회논문집
    • /
    • 대한의용생체공학회 1996년도 추계학술대회
    • /
    • pp.157-160
    • /
    • 1996
  • In this paper, reconstruction algorithms of spiral scan imaging which has been used for ultra fast magnetic resonance imaging have been reviewed, and some simulation results using two different algorithms are reported. Since the trajectory of the spiral scan in k-space is the spiral, reconstruction of the spiral scan is not as straight forward as that used in Fourier imaging technique where the sampling points are usually on the rectangular grids. Originally the reconstruction of the spiral scan imaging was based on the convolution backprojection algorithm modified with a shift term, however, some other reconstruction techniques have also been tried by remapping sampling points from spiral trajectory to Cartesian grids. Some experimental aspects of MR spiral scan imaging will also be addressed.

  • PDF

적외선 스테레오 카메라를 이용한 고속 이동객체의 위치에 대한 확률모델 (Statistical Model of 3D Positions in Tracking Fast Objects Using IR Stereo Camera)

  • 오준호;이상화;이부환;박종일
    • 전자공학회논문지
    • /
    • 제52권1호
    • /
    • pp.89-101
    • /
    • 2015
  • 본 논문에서는 비냉각방식 적외선 스테레오 카메라 시스템을 이용하여 고속으로 이동하는 고온의 소형 물체의 3차원 위치를 추정함에 있어서 무작위로 추정되는 그 위치를 확률 모델로 표현하는 방법을 제안한다. 본 논문에서 제안하는 확률적 위치 모델은 디지털 영상으로 인한 픽셀위치의 오차(pixel position error)와 비냉각식 적외선 카메라에서 영상을 취득하는 순간의 차이에 의한 지터오차(jitter error)로부터 유도되는데, 두 가지 오차를 결합한 통합 오차확률모델을 수학적으로 제시하고 실험을 통하여 그 효용성을 보여준다. 우선 본 논문에서 고안한 적외선 카메라의 지터 측정기를 이용하여 적외선 카메라에서 발생하는 타이밍 지터를 통계적으로 관찰하여 확률모델을 설정한다. 또한 디지털 영상의 스테레오 정합 과정에서 발생하는 픽셀 오차에 의하여 정확도가 떨어지는 측정거리를 확률모델로 정의한다. 실험 측정 결과, 지터는 가우시안 확률분포로 모델링하는 것이 가능하며, 픽셀오차는 균일 확률분포로 모델링된다. 이 두 가지 확률분포를 갖는 오차는 상호 독립으로서 선형 결합되는데, 전체 오차에 대한 확률분포는 지터오차 변수의 확률분포와 픽셀위치오차 변수의 확률분포를 컨볼루션함으로써 유도된다. 실제 고속 이동체에 대하여 정밀한 3차원 궤적측정기와 자체 구현한 적외선 스테레오 카메라 시스템을 이용하여 제안한 확률모델을 3차원 위치추적 실험에 적용한 결과 95% 신뢰도 구간에서 물체의 위치를 추정하는 것을 확인하였다. 즉, 물체의 위치를 정확하게 측정하는 것은 이론적으로는 불가능하며, 확률모델을 통하여 물체의 위치를 표현하는 것이 타당함을 확인할 수 있다. 본 논문에서 제안한 확률모델은 적외선 스테레오 카메라를 이용한 거리측정에서 부정확함을 확률적으로 모델링하여 위치정보에 대한 불확실성을 보정해주며, 특히 적외선 스테레오 카메라를 이용한 고속 물체의 위치추적 및 거리측정에서 이론적, 실험적 토대를 제공할 것으로 기대된다.

CUDA를 이용한 Convolutional Neural Network의 효율적인 구현 (Efficient Implementation of Convolutional Neural Network Using CUDA)

  • 기철민;조태훈
    • 한국정보통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1143-1148
    • /
    • 2017
  • 현재 인공지능과 딥 러닝이 사회적인 이슈로 떠오르고 있는 추세이며, 다양한 분야에 이 기술들을 응용하고 있다. 인공지능 분야의 여러 알고리즘들 중에서 각광받는 방법 중 하나는 Convolutional Neural Network이다. Convolutional Neural Network를 적은 양의 데이터에서 이용하거나, Layer의 구조가 복잡하지 않은 경우에는 학습시간이 길지 않아 속도에 크게 신경 쓰지 않아도 되지만, 학습 데이터의 크기가 크고, Layer의 구조가 복잡할수록 학습시간이 상당히 오래 걸린다. 이로 인해 GPU를 이용하여 병렬처리를 하는 방법을 많이 사용하는데, 본 논문에서는 CUDA를 이용한 Convolutional Neural Network를 구현하였으며, 비교에 사용한 Framework/Program들 보다 학습속도가 빨라지고 큰 데이터를 학습 시키는데 더욱 효율적으로 진행하도록 한다.

표정 분류 연구 (Analysis of facial expression recognition)

  • 손나영;조현선;이소현;송종우
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.539-554
    • /
    • 2018
  • 최근 등장하는 다양한 사물인터넷 기기 혹은 상황인식 기반의 인공지능에서는 사용자와 기기의 상호작용이 중요시 된다. 특히 인간을 대상으로 상황에 맞는 대응을 하기 위해서는 인간의 표정을 실시간으로 인식하여 빠르고 정확한 판단을 내리는 것이 필요하다. 따라서, 보다 빠르고 정확하게 표정을 인식하는 시스템을 구축하기 위해 얼굴 이미지 분석에 대한 많은 연구들이 선행되어 왔다. 본 연구에서는 웹사이트 Kaggle에서 제공한 48*48 8-bit grayscale 이미지 데이터셋을 사용하여 얼굴인식과 표정분류로 구분된 두 단계를 거치는 얼굴표정 자동 인식 시스템을 구축하였고, 이를 기존의 연구와 비교하여 자료 및 방법론의 특징을 고찰하였다. 분석 결과, Face landmark 정보에 주성분분석을 적용하여 단 30개의 주성분만으로도 빠르고 효율적인 예측모형을 얻을 수 있음이 밝혀졌다. LDA, Random forest, SVM, Bagging 중 SVM방법을 적용했을 때 가장 높은 정확도를 보이며, LDA방법을 적용하는 경우는 SVM 다음으로 높은 정확도를 보이며, 매우 빠르게 적합하고 예측하는 것이 가능하다.

Distributed Arithmetic을 사용한 OFDM용 저전력 Radix-4 FFT 구조 (Low-power Radix-4 FFT Structure for OFDM using Distributed Arithmetic)

  • 장영범;이원상;김도한;김비철;허은성
    • 대한전자공학회논문지SP
    • /
    • 제43권1호
    • /
    • pp.101-108
    • /
    • 2006
  • 이 논문에서는 64-Point FFT Radix-4 알고리즘을 DA(Distributed Arithmetic)연산을 이용하여 효율적으로 나비연산 구조를 설계할 수 있음을 보였다. 기존의 convolution 연산에 사용되어 왔던 DA연산이 FFT 나비연산의 트위들 계산에도 효과적으로 사용될 수 있음을 보였다. 제안된 DA 나비연산 구조를 Verilog HDL 코딩으로 구현한 결과, 기존의 승산기를 사용한 나비연산 구조와 비교하여 $61.02\%$의 cell area 감소 효과를 보였다. 또한 제안된 나비연산 구조를 파이프라인 구조에 적용하여 지연변환기와 함께 사용한 전체 64-point Radix-4 FFT 구조의 Verilog-HDL 코딩을 기존의 승산기를 사용한 구조의 코딩과 비교한 결과, $46.1\%$의 cell area 감소효과를 볼 수 있었다. 따라서 제안된 FFT 구조는 DMB용 OFDM 모뎀과 같은 큰 크기의 FFT에 효율적으로 사용될 수 있는 구조가 될 것이다.

The Feasibility of Event-Related Functional Magnetic Resonance Imaging of Power Hand Grip Task for Studying the Motor System in Normal Volunteers; Comparison with Finger Tapping Task

  • Song, In-Chan;Chang, Kee-Hyun;Han, Moon-Hee
    • 대한자기공명의과학회:학술대회논문집
    • /
    • 대한자기공명의과학회 2001년도 제6차 학술대회 초록집
    • /
    • pp.111-111
    • /
    • 2001
  • 목적: To evaluate the feasibility of the event-related functional MR study using power grip studying the hand motor system 대상 및 방법: Event-related functional MRI was performed on a 1.5T MR unit in seven norm volunteers (man=7, right-handedness=2, left-handedness=5, mean age: 25 years). A single-shot GRE-EPI sequence (TR/TE/flip angle: 1000ms/40ms/90, FOV = 240 mm matrix= 64$\times$64, slice thickness/gap = 5mm/0mm, 7 true axial slices) was used for functiona MR images. A flow-sensitive conventional gradient echo sequence (TR/TE/flip angl 50ms/4ms/60) was used for high-resolution anatomical images. To minimize the gross hea motion, neck-holders (MJ-200, USA) were used. A series of MR images were obtained in axial planes covering motor areas. To exclude motion-corrupted images, all MR images wer surveyed in a movie procedure and evaluated using the estimation of center of mass of ima signal intensities. Power grip task consisted of the powerful grip of all right fingers and hand movement ta used very fast right finger tapping at a speed of 3 per 1 second. All tasks were visual-guid by LCD projector (SHARP, Japan). Two tasks consisted of 134 phases including 7 activatio and 8 rest periods. Active stimulations were performed during 2 seconds and rest period were 15 seconds and total scan time per one task was 2 min 14 sec. Statistical maps we obtained using cross-correlation method. Reference vector was time-shifted by 4 seconds an Gaussian convolution with a FWHM of 4 seconds was applied to it. The threshold in p val for the activation sites was set to be 0.001. All mapping procedures were peformed usin homemade program an IDL (Research Systems Inc., USA) platform. We evaluated the activation patterns of the motor system of power grip compared to hand movement in t event-related functional MRI.

  • PDF