• 제목/요약/키워드: Acoustic event detection

검색결과 32건 처리시간 0.024초

음향 센서 네트워크에서의 노드 레벨 이벤트 탐지 성능향상을 위한 학습 기반 CFAR 알고리즘 개선 (Learning-based Improvement of CFAR Algorithm for Increasing Node-level Event Detection Performance in Acoustic Sensor Networks)

  • 김영수
    • 대한임베디드공학회논문지
    • /
    • 제15권5호
    • /
    • pp.243-249
    • /
    • 2020
  • Event detection in wireless sensor networks is a key requirement in many applications. Acoustic sensors are one of the most frequently used sensors for event detection in sensor networks, but they are sensitive and difficult to handle because they vary greatly depending on the environment and target characteristics of the sensor field. In this paper, we propose a learning-based improvement of CFAR algorithm for increasing node-level event detection performance in acoustic sensor networks, and verify the effectiveness of the designed algorithm by comparing and evaluating the event detection performance with other algorithms. Our experimental results demonstrate the superiority of the proposed algorithm by increasing the detection accuracy by more than 45.16% by significantly reducing false positives by 7.97 times while slightly increasing the false negative compared to the existing algorithm.

Acoustic Event Detection in Multichannel Audio Using Gated Recurrent Neural Networks with High-Resolution Spectral Features

  • Kim, Hyoung-Gook;Kim, Jin Young
    • ETRI Journal
    • /
    • 제39권6호
    • /
    • pp.832-840
    • /
    • 2017
  • Recently, deep recurrent neural networks have achieved great success in various machine learning tasks, and have also been applied for sound event detection. The detection of temporally overlapping sound events in realistic environments is much more challenging than in monophonic detection problems. In this paper, we present an approach to improve the accuracy of polyphonic sound event detection in multichannel audio based on gated recurrent neural networks in combination with auditory spectral features. In the proposed method, human hearing perception-based spatial and spectral-domain noise-reduced harmonic features are extracted from multichannel audio and used as high-resolution spectral inputs to train gated recurrent neural networks. This provides a fast and stable convergence rate compared to long short-term memory recurrent neural networks. Our evaluation reveals that the proposed method outperforms the conventional approaches.

Study and Experimentation on Detection of Nicks inside of Porcelain with Acoustic Emission

  • Jin, Wei;Li, Fen
    • 한국멀티미디어학회논문지
    • /
    • 제9권12호
    • /
    • pp.1572-1579
    • /
    • 2006
  • An usual acoustic emission(AE) event has two widely characterized parameters in time domain, peak amplitude and event duration. But noise in AE measuring may disturb the signals with its parameters and aggrandize the signal incertitude. Experiment activity of detection of the nick inside of porcelain with AE was made and study on AE signal processing with statistic be presented in this paper in order to pick-up information expected from the signal with noise. Effort is concentrated on developing a novel arithmetic to improve extraction of the characteristic from stochastic signal and to enhance the voracity of detection. The main purpose discussed in this paper is to treat with signals on amplitudes with statistic mutuality and power density spectrum in frequency domain, and farther more to select samples for neural networks training by means of least-squares algorithm between real measuring signal and deterministic signals under laboratory condition. By seeking optimization with the algorithm, the parameters representing characteristic of the porcelain object are selected, while the stochastic interfere be weakened, then study for detection on neural networks is developed based on processing above.

  • PDF

실생활 음향 데이터 기반 이중 CNN 구조를 특징으로 하는 음향 이벤트 인식 알고리즘 (Dual CNN Structured Sound Event Detection Algorithm Based on Real Life Acoustic Dataset)

  • 서상원;임우택;정영호;이태진;김휘용
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.855-865
    • /
    • 2018
  • 음향 이벤트 인식은 다수의 음향 이벤트가 발생하는 환경에서 이를 인식하고 각각의 발생과 소멸 시점을 판단하는 기술로써 인간의 청각적 인지 특성을 모델화하는 연구다. 음향 장면 및 이벤트 인식 연구 그룹인 DCASE는 연구자들의 참여 유도와 더불어 음향 인식 연구의 활성화를 위해 챌린지를 진행하고 있다. 그러나 DCASE 챌린지에서 제공하는 데이터 세트는 이미지 인식 분야의 대표적인 데이터 세트인 이미지넷에 비해 상대적으로 작은 규모이며, 이 외에 공개된 음향 데이터 세트는 많지 않아 알고리즘 개발에 어려움이 있다. 본 연구에서는 음향 이벤트 인식 기술 개발을 위해 실내외에서 발생할 수 있는 이벤트를 정의하고 수집을 진행하였으며, 보다 큰 규모의 데이터 세트를 확보하였다. 또한, 인식 성능 개선을 위해 음향 이벤트 존재 여부를 판단하는 보조 신경망을 추가한 이중 CNN 구조의 알고리즘을 개발하였고, 2016년과 2017년의 DCASE 챌린지 기준 시스템과 성능 비교 실험을 진행하였다.

음향 이벤트 검출을 위한 DenseNet-Recurrent Neural Network 학습 방법에 관한 연구 (A study on training DenseNet-Recurrent Neural Network for sound event detection)

  • 차현진;박상욱
    • 한국음향학회지
    • /
    • 제42권5호
    • /
    • pp.395-401
    • /
    • 2023
  • 음향 이벤트 검출(Sound Event Detection, SED)은 음향 신호에서 관심 있는 음향의 종류와 발생 구간을 검출하는 기술로, 음향 감시 시스템 및 모니터링 시스템 등 다양한 분야에서 활용되고 있다. 최근 음향 신호 분석에 관한 국제 경연 대회(Detection and Classification of Acoustic Scenes and Events, DCASE) Task 4를 통해 다양한 방법이 소개되고 있다. 본 연구는 다양한 영역에서 성능 향상을 이끌고 있는 Dense Convolutional Networks(DenseNet)을 음향 이벤트 검출에 적용하기 위해 설계 변수에 따른 성능 변화를 비교 및 분석한다. 실험에서는 DenseNet with Bottleneck and Compression(DenseNet-BC)와 순환신경망(Recurrent Neural Network, RNN)의 한 종류인 양방향 게이트 순환 유닛(Bidirectional Gated Recurrent Unit, Bi-GRU)을 결합한 DenseRNN 모델을 설계하고, 평균 교사 모델(Mean Teacher Model)을 통해 모델을 학습한다. DCASE task4의 성능 평가 기준에 따라 이벤트 기반 f-score를 바탕으로 설계 변수에 따른 DenseRNN의 성능 변화를 분석한다. 실험 결과에서 DenseRNN의 복잡도가 높을수록 성능이 향상되지만 일정 수준에 도달하면 유사한 성능을 보임을 확인할 수 있다. 또한, 학습과정에서 중도탈락을 적용하지 않는 경우, 모델이 효과적으로 학습됨을 확인할 수 있다.

비음수 텐서 분해와 은닉 마코프 모델을 이용한 터널 환경에서의 음향 사고 검지 방법 (An Acoustic Event Detection Method in Tunnels Using Non-negative Tensor Factorization and Hidden Markov Model)

  • 김남균;전광명;김홍국
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권9호
    • /
    • pp.265-273
    • /
    • 2018
  • 본 논문에서는 터널 환경에서 비음수 텐서분해와 가우시안 혼합을 갖는 은닉 마코프 모델을 사용한 사고 검지 시스템을 제안한다. 대부분의 터널 내 환경은 내재된 환경으로 인한 작은 사고들이 발생한다. 특히 터널 내에서 사고가 발생할 시, 2차, 3차 사고가 발생되어 큰 재해로 발전할 가능성이 높다. 주로 시각기반의 사고 검지 기법들이 많이 제안되어왔으나, 시야각 등의 문제로 오검지가 발생하는 단점이 존재한다. 이러한 시각기반의 검지 기법을 보완하기 위해 본 논문에 제안된 기법은 터널환경에서의 음향사고 검출의 정확도 개선을 위해 비음수 텐서분해와 가우시안 혼합모델(Gaussian mixture model, GMM) 기반의 은닉 마코프 모델(hidden Markov model, HMM)을 이용한다. 제안된 방법은 비음수 텐서 분해 기법에 활용되는 사고음향 모델과 잡음모델을 사용하여 사고음을 분리하고, 분리된 사고음을 기반으로 기 훈련된 GMM-HMM 기반의 음향모델을 기반으로 우도비 검증을 수행하여 사고 검지를 수행한다. 제안된 방법의 검지 정확도를 평가하기 위해 터널 내 환경잡음과 사고음을 합성하여 생성한 데이터를 생성하였고, 높은 정확도를 얻을 수 있었다.

비음수 텐서 분해 및 은닉 마코프 모델을 이용한 다음향 환경에서의 이중 채널 음향 사건 검출 (Dual-Channel Acoustic Event Detection in Multisource Environments Using Nonnegative Tensor Factorization and Hidden Markov Model)

  • 전광명;김홍국
    • 전자공학회논문지
    • /
    • 제54권1호
    • /
    • pp.121-128
    • /
    • 2017
  • 본 논문에서는 다음향(multisource) 환경에서의 음향 사건 검출 정확도를 높이기 위해 비음수 텐서 분해(nonnegative tensor factorization, NTF)와 은닉 마코프 모델(hidden Markov model, HMM)을 이용한 이중 채널 음향 사건 검출 방법을 제안한다. 제안된 방법은 먼저 이중 채널 입력 신호들에 NTF 기법을 적용하여 얻은 각 음향 사건 별 채널 이득을 활용하여 다수의 음향 사건들을 검출한다. 그러고 나서, 채널 이득에 의해 검출된 음향 사건의 발생 여부를 검증하기 위하여 채널 이득을 우도 가중치로 활용하는 HMM 기반의 우도비 검증을 수행한다. 제안된 방법의 검출 정확도를 평가하기 위하여 다양한 잡음과 사건간 중첩 밀도를 고려하는 다중 사건 발생 환경에 대한 F-measure를 측정하였고, 기존의 혼합 가우시안 모델 및 비음수 행렬 분해 기반의 음향 사건 검출 방법들과 비교하였다. 실험 결과, 제안된 방법이 기존 방법들에 비하여 모든 실험 조건에서 높은 정확도를 보였다.

Bag of Words 기반 음향 상황 인지를 위한 주파수-캡스트럴 특징 (Frequency-Cepstral Features for Bag of Words Based Acoustic Context Awareness)

  • 박상욱;최우현;고한석
    • 한국음향학회지
    • /
    • 제33권4호
    • /
    • pp.248-254
    • /
    • 2014
  • 음향 상황 인지(acoustic context awareness)는 다양하게 발생되는 음원들로부터 어떠한 장소인지 또는 어떠한 사건이 발생하는지를 판단하는 기술로 음향 이벤트 검출 또는 인식 보다 한 단계 더 복잡한 문제이다. 기존의 상황인지 기술은 음향 이벤트 검출 또는 인식 기술에 기반하여 현재 상황을 인지하는 방법을 사용하고 있다. 하지만 이와 같은 접근 방법은 여러 음원이 동시에 발생하거나 유사한 음원이 발생하는 실제 환경에서 정확한 상황 판단이 어렵다. 특히 버스와 지하철은 승객들에 의한 잡음으로 상황을 인지하기 힘들다. 이러한 문제를 극복하기 위해 본 논문에서는 유사한 음향 이벤트가 발생하는 버스와 지하철 상황을 인식할 수 있는 Bag of Words 기반의 상황 인지 알고리즘을 연구하고 코드북 생성을 위한 특징벡터를 제안한다. 제안하는 특징벡터의 효용성은 Support Vector Machine을 이용한 실험을 통해 검증했다.

약지도 음향 이벤트 검출을 위한 파형 기반의 종단간 심층 콘볼루션 신경망에 대한 연구 (A study on the waveform-based end-to-end deep convolutional neural network for weakly supervised sound event detection)

  • 이석진;김민한;정영호
    • 한국음향학회지
    • /
    • 제39권1호
    • /
    • pp.24-31
    • /
    • 2020
  • 본 논문에서는 음향 이벤트 검출을 위한 심층 신경망에 대한 연구를 진행하였다. 특히 약하게 표기된 데이터 및 표기되지 않은 훈련 데이터를 포함하는 약지도 문제에 대하여, 입력 오디오 파형으로부터 이벤트 검출 결과를 얻어내는 종단간 신경망을 구축하는 연구를 진행하였다. 본 연구에서 제안하는 시스템은 1차원 콘볼루션 신경망을 깊게 적층하는 구조를 기반으로 하였으며, 도약 연결 및 게이팅 메커니즘 등의 추가적인 구조를 통해 성능을 개선하였다. 또한 음향 구간 검출 및 후처리를 통하여 성능을 향상시켰으며, 약지도 데이터를 다루기 위하여 평균-교사 모델을 적용하여 학습하는 과정을 도입하였다. 본 연구에서 고안된 시스템을 Detection and Classification of Acoustic Scenes and Events(DCASE) 2019 Task 4 데이터를 이용하여 평가하였으며, 그 결과 약 54 %의 구간-기반 F1-score 및 32%의 이벤트-기반 F1-score를 얻을 수 있었다.

AE에 의한 알루미나 세라믹스의 Microcrack 생성과 파괴거동의 평가 (Evaluation of Fracture Behavior and Formation of Microcrack of Alumina Ceramics by Acoustic Emission)

  • 장병국;우상국
    • 한국세라믹학회지
    • /
    • 제35권6호
    • /
    • pp.551-558
    • /
    • 1998
  • Detection of microcrack in {{{{ {Al }_{2 } {O }_{3 } }} ceramics were studided by AE(acoustic emission) technique with 4-point bending test in order to evaluate the fracture process and formation of microcrack. Fully-dense alu-mina ceramics having a different grain size were fabricated by varing the hot-pressing temperature. The grain size of alumina increased with increasing the hot-pressing temperature whereas the bending strength decreasd. The microcracks were observed by SEM and TEM. The generation of AE event increased with increasing the applied load and many AE event was generated at maximum applied load. Alumina with smaller grain size shows the generation of many AE event resulting in an increase of microcrack formation. An intergranular fracture is predominantly observed in fine-grained alumina whereas intragranular fracture occurs predominantly in coarse-grained alumina,. Analysis of micorstructure and AE prove that primary mi-crocracks occur within grain-boundaries of alumina. The larger microcracking were formed by the growth and/or coalesence of primary microcracks. Then the materials become to fracuture by main crack gen-eration at the maximum applied load.

  • PDF