• 제목/요약/키워드: Fast Convolution

검색결과 76건 처리시간 0.023초

Residual Learning Based CNN for Gesture Recognition in Robot Interaction

  • Han, Hua
    • Journal of Information Processing Systems
    • /
    • 제17권2호
    • /
    • pp.385-398
    • /
    • 2021
  • The complexity of deep learning models affects the real-time performance of gesture recognition, thereby limiting the application of gesture recognition algorithms in actual scenarios. Hence, a residual learning neural network based on a deep convolutional neural network is proposed. First, small convolution kernels are used to extract the local details of gesture images. Subsequently, a shallow residual structure is built to share weights, thereby avoiding gradient disappearance or gradient explosion as the network layer deepens; consequently, the difficulty of model optimisation is simplified. Additional convolutional neural networks are used to accelerate the refinement of deep abstract features based on the spatial importance of the gesture feature distribution. Finally, a fully connected cascade softmax classifier is used to complete the gesture recognition. Compared with the dense connection multiplexing feature information network, the proposed algorithm is optimised in feature multiplexing to avoid performance fluctuations caused by feature redundancy. Experimental results from the ISOGD gesture dataset and Gesture dataset prove that the proposed algorithm affords a fast convergence speed and high accuracy.

Neutron spectrum unfolding using two architectures of convolutional neural networks

  • Maha Bouhadida;Asmae Mazzi;Mariya Brovchenko;Thibaut Vinchon;Mokhtar Z. Alaya;Wilfried Monange;Francois Trompier
    • Nuclear Engineering and Technology
    • /
    • 제55권6호
    • /
    • pp.2276-2282
    • /
    • 2023
  • We deploy artificial neural networks to unfold neutron spectra from measured energy-integrated quantities. These neutron spectra represent an important parameter allowing to compute the absorbed dose and the kerma to serve radiation protection in addition to nuclear safety. The built architectures are inspired from convolutional neural networks. The first architecture is made up of residual transposed convolution's blocks while the second is a modified version of the U-net architecture. A large and balanced dataset is simulated following "realistic" physical constraints to train the architectures in an efficient way. Results show a high accuracy prediction of neutron spectra ranging from thermal up to fast spectrum. The dataset processing, the attention paid to performances' metrics and the hyper-optimization are behind the architectures' robustness.

적분방정식을 사용한 3차원 MT 모델링에서의 텐서 그린 적분의 계산 (Computation of Green's Tensor Integrals in Three-Dimensional Magnetotelluric Modeling Using Integral Equations)

  • 김희준;이동성
    • 자원환경지질
    • /
    • 제27권1호
    • /
    • pp.41-47
    • /
    • 1994
  • 적분방정식을 사용한 3차원 전자기 모델링에 나오는 많은 텐서 그린 적분의 수치계산에 신속 한겔변환 (FHT) 아르고리즘 (Anderson, 1982)을 적용하였다. 한겔변환은 FHT에서 사용가능한 연관 및 지연 중합으로 효율적으로 계산할 수 있다. 먼저 수평 층서모형에 대한 텐서 그린 적분을 보여주고 난 다음 이들을 FHT로 신속하게 계산할 수 있도록 서로 연관된 형태의 함수로 고쳐쓴다. FHT로 연관된 한겔변환의 전행열이 단일 직접 중합과 거의 비슷한 계산시간으로 신속 정확하게 구해진다. 5층 수평 층서모형에 대한 컴퓨터실험의 결과, FHT는 직접 및 지연 중합법에 비하여 각각 117 및 4배 빠르다.

  • PDF

1,2-Dichloroethane 내 백금 전극에서의 dicarboximide 레이저 염료에 대한 convolutive 순환 전압-전류법 연구 (Convolutive Cyclic Voltammetry Investigation of Dicarboximide Laser Dye at a Platinum Electrode in 1,2-Dichloroethane)

  • Al-Bishri, Hassan M.;El-Mossalamy, E.H.;El-Hallag, Ibrahim;El-Daly, Samy
    • 대한화학회지
    • /
    • 제55권2호
    • /
    • pp.169-176
    • /
    • 2011
  • N,N-bis(2,5-di-tert-butylphenyl) - 3,4,9,10 perylenebis(dicarboximide) 레이저 염료에 대한 전기화학적 연구가 0.1 M tetrabutyl ammonium perchlorate(TBAP)/1,2 dichloroethane($CH_2Cl-CH_2Cl$) 용액내에서 백금 전극을 이용하여 순환 전압-전류법 및 디지털 시뮬레이션 기술과 결합된 convolution-deconvolution 전압-전류법으로 수행되었다. 연구에 사용된 염료는 두개의 전자를 순차적으로 소모하며 radiacal anion과 dianion으로(EE 메커니즘) 환원되었다. 전위를 positive scan으로 전환하면, 이 화합물은 두 개의 전자를 잃고 산화된 뒤 빠른 응집 과정($EC_1EC_2$ 메커니즘)을 거치게 된다. 이 화합물의 전극 반응 경로, 화학 및 전기화학적 파라미터는 순환 전압-전류법과 convolutive 전압-전류법을 이용하여 측정되었다. 이렇게 구한 전기화학적 파라미터는 디지털 시뮬레이션 방법을 통하여 검증되었다.

A Novel RGB Channel Assimilation for Hyperspectral Image Classification using 3D-Convolutional Neural Network with Bi-Long Short-Term Memory

  • M. Preethi;C. Velayutham;S. Arumugaperumal
    • International Journal of Computer Science & Network Security
    • /
    • 제23권3호
    • /
    • pp.177-186
    • /
    • 2023
  • Hyperspectral imaging technology is one of the most efficient and fast-growing technologies in recent years. Hyperspectral image (HSI) comprises contiguous spectral bands for every pixel that is used to detect the object with significant accuracy and details. HSI contains high dimensionality of spectral information which is not easy to classify every pixel. To confront the problem, we propose a novel RGB channel Assimilation for classification methods. The color features are extracted by using chromaticity computation. Additionally, this work discusses the classification of hyperspectral image based on Domain Transform Interpolated Convolution Filter (DTICF) and 3D-CNN with Bi-directional-Long Short Term Memory (Bi-LSTM). There are three steps for the proposed techniques: First, HSI data is converted to RGB images with spatial features. Before using the DTICF, the RGB images of HSI and patch of the input image from raw HSI are integrated. Afterward, the pair features of spectral and spatial are excerpted using DTICF from integrated HSI. Those obtained spatial and spectral features are finally given into the designed 3D-CNN with Bi-LSTM framework. In the second step, the excerpted color features are classified by 2D-CNN. The probabilistic classification map of 3D-CNN-Bi-LSTM, and 2D-CNN are fused. In the last step, additionally, Markov Random Field (MRF) is utilized for improving the fused probabilistic classification map efficiently. Based on the experimental results, two different hyperspectral images prove that novel RGB channel assimilation of DTICF-3D-CNN-Bi-LSTM approach is more important and provides good classification results compared to other classification approaches.

Lightweight Attention-Guided Network with Frequency Domain Reconstruction for High Dynamic Range Image Fusion

  • 박재현;이근택;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.205-208
    • /
    • 2022
  • Multi-exposure high dynamic range (HDR) image reconstruction, the task of reconstructing an HDR image from multiple low dynamic range (LDR) images in a dynamic scene, often produces ghosting artifacts caused by camera motion and moving objects and also cannot deal with washed-out regions due to over or under-exposures. While there has been many deep-learning-based methods with motion estimation to alleviate these problems, they still have limitations for severely moving scenes. They also require large parameter counts, especially in the case of state-of-the-art methods that employ attention modules. To address these issues, we propose a frequency domain approach based on the idea that the transform domain coefficients inherently involve the global information from whole image pixels to cope with large motions. Specifically we adopt Residual Fast Fourier Transform (RFFT) blocks, which allows for global interactions of pixels. Moreover, we also employ Depthwise Overparametrized convolution (DO-conv) blocks, a convolution in which each input channel is convolved with its own 2D kernel, for faster convergence and performance gains. We call this LFFNet (Lightweight Frequency Fusion Network), and experiments on the benchmarks show reduced ghosting artifacts and improved performance up to 0.6dB tonemapped PSNR compared to recent state-of-the-art methods. Our architecture also requires fewer parameters and converges faster in training.

  • PDF

사용자의 음장선호도에 따른 오디오 콘텐츠 적응 기술 (Audio Contents Adaptation Technology According to User′s Preference on Sound Fields)

  • 강경옥;홍재근;서정일
    • 한국음향학회지
    • /
    • 제23권6호
    • /
    • pp.437-445
    • /
    • 2004
  • 본 논문에서는 사용자의 음장 선호도를 이용하여 오디오 콘텐츠를 사용자가 원하는 음장으로 변환하는 기술에 대하여 설명한다. 오디오 신호가 재생되는 공간의 음장을 사용자가 원하는 음장으로 변환시켜주는 음장효과 기술은 실감있고 현장감있는 음악재생에 필수적인 요소이다. 그러나, 음장효과를 실시간으로 처리하기 위해서는 막대한 연산량이 필요하므로 MP3 플레이어와 같은 휴대용 오디오 단말에서는 구현하기 힘들다. 본 논문에서는 사용자로부터 전달된 음장 선호도를 이용하여 서버에서 음장효과를 처리하도록 하여, 단말의 성능에 구애받지 않고 음장효과를 제공할 수 있는 기술을 제안한다. 사용자가 선호하는 음장을 표현하기 위하여 선호하는 음장을 실내응답신호의 URI 주소를 이용하여 표현하는 방법 뿐만 아니라 음향공간에 대한 심리적 파라미터를 이용할 수 있게 하였다. 또한, 실내응답신호와 복적분 연산을 통한 음장효과 처리 방법을 실시간 응용에 적용하기 위하여 고속 복적분 알고리즘을 제안하였으며, 실험을 통하여 실시간 응용에도 적용이 가능함을 확인하였다. 본 논문에서 제안한 음장 선호도 서술구조의 효용성을 검증하기 위하여, 일반인을 대상으로 음장을 구분하는 능력과 음장효과가 처리된 음악에 대한 선호도에 대한 주관듣기평가를 실시하여 제안된 음장 선호도가 일반인들에게 적용이 가능함을 확인하였다.

수평다층구조에 대한 시간영역 전자기장의 계산법 (A Scheme for Computing Time-domain Electromagnetic Fields of a Horizontally Layered Earth)

  • 장한길로;김희준
    • 지구물리와물리탐사
    • /
    • 제16권3호
    • /
    • pp.139-144
    • /
    • 2013
  • 유한길이의 다중 송수신 쌍극자에 의한 수평다층구조의 시간영역 전자기장을 계산하기 위한 컴퓨터 프로그램을 개발하였다. 시간영역 반응은 주파수영역에서 계산된 값에 빠른 역푸리에변환(inverse fast Fourier transform: FFT)을 적용하여 효율적으로 얻을 수 있다. 먼저 대수영역에서 등간격으로 한 decade 당 10개의 주파수영역 반응을 구한 후 FFT를 적용시키기 위해 3차 스플라인 사이채움(cubic spline interpolation)을 실시한다. 이 때 위상의 경우에는 스플라인 사이채움 이전에 위상곡선을 연속적으로 만들어 주는 과정이 추가된다. 스플라인 사이채움된 자료들은 송신전류파형과 곱말기(convolution)를 한 후 FFT를 통해 시간영역 자료로 만들어진다. 이 논문에서는 step-off 파형만 고려하였다. 개발된 시간영역 프로그램은 해석해와 해양 탄화수소 저류층 모델에 대한 반응을 이용하여 검증하였으며, 그 결과는 충분히 정확함을 확인 할 수 있었다.

Fast R-CNN을 이용한 객체 인식 기반의 도로 노면 파손 탐지 기법 (Road Surface Damage Detection based on Object Recognition using Fast R-CNN)

  • 심승보;전찬준;류승기
    • 한국ITS학회 논문지
    • /
    • 제18권2호
    • /
    • pp.104-113
    • /
    • 2019
  • 도로 관리 주체는 도로 파손을 보수하기 위해 적지 않은 비용을 투입한다. 이러한 파손은 자연 요인과 노후화로 인하여 필연적으로 발생을 하는데, 효율적인 보수를 위한 유지보수 기술이 필요하다. 이런 수요에 대응하기 위해 여러 가지 기술들이 개발되고 적용되고 있지만, 최근 들어서는 차량용 블랙박스 형태로 수집한 영상 정보를 바탕으로 도로 노면 파손 유지 보수기술이 개발되고 있다. 이 파손 영역을 추출하는 방법에는 여러 가지가 있지만, 본 논문에서는 최근 활발히 연구되고 있는 심층 신경망 구조의 영상인식 기술에 대해 논하고자 한다. 특히 영역 기반의 합성곱 알고리즘을 이용하여 영상 내에서 도로 파손 유무와 그 영역을 추정할 수 있는 새로운 심층 신경망을 소개한다. 이를 개발하기 위해 실제 주행을 통해서 600여장의 영상 데이터를 수집하였고, 이를 활용하여 학습을 수행하였다. 그 결과 기존 모델과 성능을 비교하여 10.67% 향상된 신경망을 개발하였다.

온칩 컨볼루션 가속기를 포함한 대칭적 버퍼 기반 액티브 노이즈 캔슬러의 경량화된 FPGA 구현 (Lightweight FPGA Implementation of Symmetric Buffer-based Active Noise Canceller with On-Chip Convolution Acceleration Units)

  • 박승현;박대진
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1713-1719
    • /
    • 2022
  • 처리지연이 적은 노이즈 캔슬러일수록 샘플링 주파수를 높일 수 있으므로 더 좋은 품질의 출력 신호를 얻을 수 있다. 단일 버퍼를 사용할 경우 프로세서가 입력된 데이터를 처리하는 동안 새로운 데이터를 버퍼에 쓰기가 불가능하므로 처리지연이 발생한다. 이러한 처리지연은 안티-노이즈와 출력 신호를 합성시킬 때 위상을 일치시키기 위한 추가적인 버퍼링 오버헤드를 발생시킨다. 본 논문에서는 대칭적 Even-Odd-buffer 구조를 사용하여 읽기와 쓰기 작업을 번갈아 가며 수행함으로써 처리지연을 최소화하고 처리속도를 높일 수 있는 가속기의 구조를 제안한다. 또한, Fast Fourier Transform 기반 노이즈 캔슬링과 적응 Least Mean Square 알고리즘을 사용한 노이즈 캔슬링의 구조적 차이를 비교한다. 그 결과로 대칭적 Even-Odd-buffer를 사용하였을 때 단일 버퍼 대비 처리지연이 29.2% 줄어들었다. 제안하는 대칭적 Even-Odd-buffer 구조는 다양한 노이즈 캔슬링 알고리즘에 적용될 수 있다는 장점이 있다.