• 제목/요약/키워드: Sound detection

검색결과 448건 처리시간 0.031초

실생활 음향 데이터 기반 이중 CNN 구조를 특징으로 하는 음향 이벤트 인식 알고리즘 (Dual CNN Structured Sound Event Detection Algorithm Based on Real Life Acoustic Dataset)

  • 서상원;임우택;정영호;이태진;김휘용
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.855-865
    • /
    • 2018
  • 음향 이벤트 인식은 다수의 음향 이벤트가 발생하는 환경에서 이를 인식하고 각각의 발생과 소멸 시점을 판단하는 기술로써 인간의 청각적 인지 특성을 모델화하는 연구다. 음향 장면 및 이벤트 인식 연구 그룹인 DCASE는 연구자들의 참여 유도와 더불어 음향 인식 연구의 활성화를 위해 챌린지를 진행하고 있다. 그러나 DCASE 챌린지에서 제공하는 데이터 세트는 이미지 인식 분야의 대표적인 데이터 세트인 이미지넷에 비해 상대적으로 작은 규모이며, 이 외에 공개된 음향 데이터 세트는 많지 않아 알고리즘 개발에 어려움이 있다. 본 연구에서는 음향 이벤트 인식 기술 개발을 위해 실내외에서 발생할 수 있는 이벤트를 정의하고 수집을 진행하였으며, 보다 큰 규모의 데이터 세트를 확보하였다. 또한, 인식 성능 개선을 위해 음향 이벤트 존재 여부를 판단하는 보조 신경망을 추가한 이중 CNN 구조의 알고리즘을 개발하였고, 2016년과 2017년의 DCASE 챌린지 기준 시스템과 성능 비교 실험을 진행하였다.

청각장애인을 위한 웨어러블 기기의 위험소리 검출 엔진 설계 (A Design of Dangerous Sound Detection Engine of Wearable Device for Hearing Impaired Persons)

  • 변성우;이석필
    • 전기학회논문지
    • /
    • 제65권7호
    • /
    • pp.1263-1269
    • /
    • 2016
  • Hearing impaired persons are exposed to the danger since they can't be aware of many dangerous situations like fire alarms, car hones and so on. Therefore they need haptic or visual informations when they meet dangerous situations. In this paper, we design a dangerous sound detection engine for hearing impaired. We consider four dangerous indoor situations such as a boiled sound of kettle, a fire alarm, a door bell and a phone ringing. For outdoor, two dangerous situations such as a car horn and a siren of emergency vehicle are considered. For a test, 6 data sets are collected from those six situations. we extract LPC, LPCC and MFCC as feature vectors from the collected data and compare the vectors for feasibility. Finally we design a matching engine using an artificial neural network and perform classification tests. We perform classification tests for 3 times considering the use outdoors and indoors. The test result shows the feasibility for the dangerous sound detection.

3차 샤논 에너지 변화량을 이용한 제 1심음과 제 2심음 검출 알고리듬 (Detection of the First and Second Heart Sound Using Three-order Shannon Energy Difference)

  • 이기현;김필운;이윤정;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제14권7호
    • /
    • pp.884-894
    • /
    • 2011
  • 본 논문에서는 심음에서 제 1심음(S1)과 제 2심음(S2)을 찾기 위한 새로운 알고리듬을 제안하였다. 심음의 주성분을 찾기 위한 기존의 알고리듬들은 심 잡음이 없는 정상 심음 신호에서는 높은 성능을 보이지만 심 질환에 의해 발생하는 심 잡음이 섞여 있는 신호에서는 현저한 성능저하를 보인다. 따라서 본 논문에서는 심 질환이 있는 심음에서 제 1심음과 제 2심음의 검출 성능 향상을 위해 3차 샤논 에너지 변화량을 이용한 알고리듬을 제안하였다. 제 1심음과 제 2심음의 에너지 변화량이 심 잡음에 비해 더 크게 나타나는 특징을 이용하여, 심 잡음을 감쇄시키고 제 1심음, 제 2심음을 검출하였다. 제안한 알고리듬은 정상 심음 뿐 아니라 대동맥 협착증, 승모판막 협착증과 같은 비정상 심음에서도 높은 검출 성능을 가질 수 있도록 개발하였으며 실험 결과 기존의 검출방법에 비하여 높은 검출 성능을 보였다.

교차로 교통사고 자동감지를 위한 사고음의 음향특성 분석 (A Study on the Acoustic Characteristic Analysis for Traffic Accident Detection at Intersection)

  • 박문수;김재이;고영권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년 학술대회 논문집 정보 및 제어부문
    • /
    • pp.437-439
    • /
    • 2006
  • Actually, The present traffic accident detection system is subsisting limitation of accurate distinction under the crowded condition at intersection because the system defend upon mainly the image information at intersection and digital image processing techniques nearly all. To complement this insufficiency, this article aims to estimate the level of present technology and a realistic possibility by analyzing the acoustic characteristic of crash sound that we have to investigate for improvement of traffic accident detection rate at intersection. The skid sound of traffic accident is showed the special pattern at 1[kHz])${\sim}$3[kHz] bandwidth when vehicles are almost never operated in and around intersection. Also, the frequency bandwidth of vehicle crash sound is showed sound pressure difference oyer 30[dB] higher than when there is no occurrence of traffic accident below 500[Hz].

  • PDF

음향 이벤트 검출을 위한 DenseNet-Recurrent Neural Network 학습 방법에 관한 연구 (A study on training DenseNet-Recurrent Neural Network for sound event detection)

  • 차현진;박상욱
    • 한국음향학회지
    • /
    • 제42권5호
    • /
    • pp.395-401
    • /
    • 2023
  • 음향 이벤트 검출(Sound Event Detection, SED)은 음향 신호에서 관심 있는 음향의 종류와 발생 구간을 검출하는 기술로, 음향 감시 시스템 및 모니터링 시스템 등 다양한 분야에서 활용되고 있다. 최근 음향 신호 분석에 관한 국제 경연 대회(Detection and Classification of Acoustic Scenes and Events, DCASE) Task 4를 통해 다양한 방법이 소개되고 있다. 본 연구는 다양한 영역에서 성능 향상을 이끌고 있는 Dense Convolutional Networks(DenseNet)을 음향 이벤트 검출에 적용하기 위해 설계 변수에 따른 성능 변화를 비교 및 분석한다. 실험에서는 DenseNet with Bottleneck and Compression(DenseNet-BC)와 순환신경망(Recurrent Neural Network, RNN)의 한 종류인 양방향 게이트 순환 유닛(Bidirectional Gated Recurrent Unit, Bi-GRU)을 결합한 DenseRNN 모델을 설계하고, 평균 교사 모델(Mean Teacher Model)을 통해 모델을 학습한다. DCASE task4의 성능 평가 기준에 따라 이벤트 기반 f-score를 바탕으로 설계 변수에 따른 DenseRNN의 성능 변화를 분석한다. 실험 결과에서 DenseRNN의 복잡도가 높을수록 성능이 향상되지만 일정 수준에 도달하면 유사한 성능을 보임을 확인할 수 있다. 또한, 학습과정에서 중도탈락을 적용하지 않는 경우, 모델이 효과적으로 학습됨을 확인할 수 있다.

깊은 시계열 특성 추출을 이용한 폐 음성 이상 탐지 (Detection of Anomaly Lung Sound using Deep Temporal Feature Extraction)

  • ;변규린;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.605-607
    • /
    • 2023
  • Recent research has highlighted the effectiveness of Deep Learning (DL) techniques in automating the detection of lung sound anomalies. However, the available lung sound datasets often suffer from limitations in both size and balance, prompting DL methods to employ data preprocessing such as augmentation and transfer learning techniques. These strategies, while valuable, contribute to the increased complexity of DL models and necessitate substantial training memory. In this study, we proposed a streamlined and lightweight DL method but effectively detects lung sound anomalies from small and imbalanced dataset. The utilization of 1D dilated convolutional neural networks enhances sensitivity to lung sound anomalies by efficiently capturing deep temporal features and small variations. We conducted a comprehensive evaluation of the ICBHI dataset and achieved a notable improvement over state-of-the-art results, increasing the average score of sensitivity and specificity metrics by 2.7%.

K-SVD 기반 사전 훈련과 비음수 행렬 분해 기법을 이용한 중첩음향이벤트 검출 (Overlapping Sound Event Detection Using NMF with K-SVD Based Dictionary Learning)

  • 최현식;금민석;고한석
    • 한국음향학회지
    • /
    • 제34권3호
    • /
    • pp.234-239
    • /
    • 2015
  • 비음수 행렬 분해(Nonnegative Matrix Factorization, NMF) 기법은 사전행렬과 크기성분을 번갈아 가며 업데이트 하면서 구하는 방법이며 직관적 해석 및 구현의 용이성으로 인해 중첩음향이벤트 분리 및 검출방법으로 널리 활용되었다. 하지만 비음수 행렬 분해의 고유한 특성인 부분기반표현(part-based representation)으로 인해 하나의 음향 이벤트를 구성 하는 사전(dictionary)의 파편화 현상이 발생하고, 다른 음향이벤트와 중복되는 사전이 생성되어 결과적으로 분리, 검출 성능의 저하 문제가 발생한다. 본 논문에서는 사전 획득 단계의 부분기반표현에 의한 문제를 해소하기 위해 K-Singular Value Decomposition(K-SVD)을 사용하여 사전을 획득하고, 음향이벤트 검출 단계 에서는 기존 비음수 행렬 분해 기법을 이용하여 크기를 획득 한다. 제안하는 방식을 통해 비음수 행렬 분해 기반의 사전을 사용하는 경우보다 중첩음향이벤트 검출 성능이 개선되는 것을 확인하였다.

약지도 음향 이벤트 검출을 위한 파형 기반의 종단간 심층 콘볼루션 신경망에 대한 연구 (A study on the waveform-based end-to-end deep convolutional neural network for weakly supervised sound event detection)

  • 이석진;김민한;정영호
    • 한국음향학회지
    • /
    • 제39권1호
    • /
    • pp.24-31
    • /
    • 2020
  • 본 논문에서는 음향 이벤트 검출을 위한 심층 신경망에 대한 연구를 진행하였다. 특히 약하게 표기된 데이터 및 표기되지 않은 훈련 데이터를 포함하는 약지도 문제에 대하여, 입력 오디오 파형으로부터 이벤트 검출 결과를 얻어내는 종단간 신경망을 구축하는 연구를 진행하였다. 본 연구에서 제안하는 시스템은 1차원 콘볼루션 신경망을 깊게 적층하는 구조를 기반으로 하였으며, 도약 연결 및 게이팅 메커니즘 등의 추가적인 구조를 통해 성능을 개선하였다. 또한 음향 구간 검출 및 후처리를 통하여 성능을 향상시켰으며, 약지도 데이터를 다루기 위하여 평균-교사 모델을 적용하여 학습하는 과정을 도입하였다. 본 연구에서 고안된 시스템을 Detection and Classification of Acoustic Scenes and Events(DCASE) 2019 Task 4 데이터를 이용하여 평가하였으며, 그 결과 약 54 %의 구간-기반 F1-score 및 32%의 이벤트-기반 F1-score를 얻을 수 있었다.

Stress Detection and Classification of Laying Hens by Sound Analysis

  • Lee, Jonguk;Noh, Byeongjoon;Jang, Suin;Park, Daihee;Chung, Yongwha;Chang, Hong-Hee
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제28권4호
    • /
    • pp.592-598
    • /
    • 2015
  • Stress adversely affects the wellbeing of commercial chickens, and comes with an economic cost to the industry that cannot be ignored. In this paper, we first develop an inexpensive and non-invasive, automatic online-monitoring prototype that uses sound data to notify producers of a stressful situation in a commercial poultry facility. The proposed system is structured hierarchically with three binary-classifier support vector machines. First, it selects an optimal acoustic feature subset from the sound emitted by the laying hens. The detection and classification module detects the stress from changes in the sound and classifies it into subsidiary sound types, such as physical stress from changes in temperature, and mental stress from fear. Finally, an experimental evaluation was performed using real sound data from an audio-surveillance system. The accuracy in detecting stress approached 96.2%, and the classification model was validated, confirming that the average classification accuracy was 96.7%, and that its recall and precision measures were satisfactory.

소리 정보를 이용한 철도 선로전환기의 스트레스 탐지 (Stress Detection of Railway Point Machine Using Sound Analysis)

  • 최용주;이종욱;박대희;이종현;정용화;김희영;윤석한
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권9호
    • /
    • pp.433-440
    • /
    • 2016
  • 철도 선로전환기는 열차의 진로를 현재의 궤도에서 다른 궤도로 제어하는 장치이다. 선로전환기의 이상 상황은 탈선 등과 같은 심각한 문제를 발생할 수 있기 때문에, 선로전환기의 스트레스를 지속적으로 모니터링 하는 것은 매우 중요하다. 본 논문에서는 선로전환기가 작동할 때 발생하는 소리 정보를 이용하여 선로전환기의 스트레스를 탐지하는 시스템을 제안한다. 제안하는 시스템은 선로전환기의 동작 시 발생하는 소리 데이터로부터 자질 선택방법을 사용하여 스트레스 탐지에 유효한 감소된 차원의 자질 부분집합을 선택한 후, 기계학습의 대표적 모델인 SVM(Support Vector Machine)을 이용하여 선로전환기의 스트레스 상태 여부를 탐지한다. 테스트용 선로전환기를 실제 구동하며 수집한 소리 데이터를 이용하여, 본 논문에서 제안하는 시스템의 성능을 실험적으로 검증한 바 98%를 넘는 정확도를 확인하였다.