• Title/Summary/Keyword: sound classification

검색결과 300건 처리시간 0.028초

스파이크그램과 심층 신경망을 이용한 음악 장르 분류 (Music Genre Classification using Spikegram and Deep Neural Network)

  • 장우진;윤호원;신성현;조효진;장원;박호종
    • 방송공학회논문지
    • /
    • 제22권6호
    • /
    • pp.693-701
    • /
    • 2017
  • 본 논문은 스파이크그램과 심층 신경망을 이용한 새로운 음악 장르 분류 방법을 제안한다. 인간의 청각 시스템은 최소 에너지와 신경 자원을 사용하여 최대 청각 정보를 뇌로 전달하기 위하여 입력 소리를 시간과 주파수 영역에서 부호화한다. 스파이크그램은 이러한 청각 시스템의 부호화 동작을 기반으로 파형을 분석하는 기법이다. 제안하는 방법은 스파이크그램을 이용하여 신호를 분석하고 그 결과로부터 장르 분류를 위한 핵심 정보로 구성된 특성 벡터를 추출하고, 이를 심층 신경망의 입력 벡터로 사용한다. 성능 측정에는 10개의 음악 장르로 구성된 GTZAN 데이터 세트를 사용하였고, 제안 방법이 기존 방법에 비해 낮은 차원의 특성 벡터를 사용하여 우수한 성능을 제공하는 것을 확인하였다.

지능형 오디오 그래픽 이퀄라이저 시스템 구현 (Implementation of an Intelligent Audio Graphic Equalizer System)

  • 이강규;조윤호;박규식
    • 대한전자공학회논문지SP
    • /
    • 제43권3호
    • /
    • pp.76-83
    • /
    • 2006
  • 오디오 이퀄라이저의 주목적은 사용자가 원하는 음색을 낼 수 있도록 음악의 주파수 특성을 변환 하는 것으로 대형 오디오시스템으로부터 휴대용 MP3플레이어까지 음악을 재생하는 대부분의 기기에 사용되고 있다. 현재까지는 각 음악 장르에 적합한 음색을 재생하기위해 사용자가 각 이퀄라이저 주파수 대역 별로 일일이 수동으로 조절해 주어야 한다는 불편함이 있다. 본 논문에서는 내용기반 음악 장르 분류 기술을 이용하여 음악 장르를 분류하고, 분류된 장르에 알맞은 이퀄라이저를 자동으로 적용하여 주는 지능형 오디오 그래픽 이퀄라이저 시스템을 제안하였다. 이퀄라이져의 경우 초기 음악 재생 중 이퀄라이저 적용에 의한 갑작스런 음의 변화를 방지하기 위하여 Coarse Level과 Fine Level의 2단계 장르분류 절차를 거치면서 각 단계별 이퀄라이저를 적용 하였다. 제안된 시스템의 각 단계별 분류 성공률은 약 80%에 이르며, 2초 안에 모든 동작이 이루어지는 것을 확인 하였다. 제안된 시스템은 PC상에서 비주얼 C 을 이용하여 3-밴드 지능형 이퀄라이저의 SW GUI를 구현 하였다.

약지도 음향 이벤트 검출을 위한 파형 기반의 종단간 심층 콘볼루션 신경망에 대한 연구 (A study on the waveform-based end-to-end deep convolutional neural network for weakly supervised sound event detection)

  • 이석진;김민한;정영호
    • 한국음향학회지
    • /
    • 제39권1호
    • /
    • pp.24-31
    • /
    • 2020
  • 본 논문에서는 음향 이벤트 검출을 위한 심층 신경망에 대한 연구를 진행하였다. 특히 약하게 표기된 데이터 및 표기되지 않은 훈련 데이터를 포함하는 약지도 문제에 대하여, 입력 오디오 파형으로부터 이벤트 검출 결과를 얻어내는 종단간 신경망을 구축하는 연구를 진행하였다. 본 연구에서 제안하는 시스템은 1차원 콘볼루션 신경망을 깊게 적층하는 구조를 기반으로 하였으며, 도약 연결 및 게이팅 메커니즘 등의 추가적인 구조를 통해 성능을 개선하였다. 또한 음향 구간 검출 및 후처리를 통하여 성능을 향상시켰으며, 약지도 데이터를 다루기 위하여 평균-교사 모델을 적용하여 학습하는 과정을 도입하였다. 본 연구에서 고안된 시스템을 Detection and Classification of Acoustic Scenes and Events(DCASE) 2019 Task 4 데이터를 이용하여 평가하였으며, 그 결과 약 54 %의 구간-기반 F1-score 및 32%의 이벤트-기반 F1-score를 얻을 수 있었다.

Classification of Porcine Wasting Diseases Using Sound Analysis

  • Gutierrez, W.M.;Kim, S.;Kim, D.H.;Yeon, S.C.;Chang, H.H.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제23권8호
    • /
    • pp.1096-1104
    • /
    • 2010
  • This bio-acoustic study was aimed at classifying the different porcine wasting diseases through sound analysis with emphasis given to differences in the acoustic footprints of coughs in porcine circo virus type 2 (PCV2), porcine reproductive and respiratory syndrome (PRRS) virus and Mycoplasma hyopneumoniae (MH) - infected pigs from a normal cough. A total of 36 pigs (Yorkshire${\times}$Landrace${\times}$Duroc) with average weight ranging between 25-30 kg were studied, and blood samples of the suspected infected pigs were collected and subjected to serological analysis to determine PCV2, PRRS and MH. Sounds emitted by coughing pigs were recorded individually for 30 minutes depending on cough attacks by a digital camcorder placed within a meter distance from the animal. Recorded signals were digitalized in a PC using the Cool Edit Program, classified through labeling method, and analyzed by one-way analysis of variance and discriminant analysis. Input features after classification showed that normal cough had the highest pitch level compared to other infectious diseases (p<0.002) but not statistically different from PRRS and MH. PCV2 differed statistically (p<0.002) from the normal cough and PRRS but not from MH. MH had the highest intensity and all coughs differed statistically from each other (p<0.0001). PCV2 was statistically different from others (p<0.0001) in formants 1, 2, 3 and 4. There was no statistical difference in duration between different porcine diseases and the normal cough (p>0.6863). Mechanisms of cough sound creation in the airway could be used to explain these observed acoustic differences and these findings indicated that the existence of acoustically different cough patterns depend on causes or the animals' respiratory system conditions. Conclusively, differences in the status of lungs results in different cough sounds. Finally, this study could be useful in supporting an early detection method based on the on-line cough counter algorithm for the initial diagnosis of sick animals in breeding farms.

HMM에 의한 원형 마이크로폰 어레이 적용 드론 위치 추적 (Drone Location Tracking with Circular Microphone Array by HMM)

  • 정형찬;임원호;곽준봉;이시티아크 아메드;장경희
    • 한국항행학회논문지
    • /
    • 제24권5호
    • /
    • pp.393-407
    • /
    • 2020
  • 불법 무인기에 의한 위협을 줄이기 위해, 음향 기반 기법에 의한 추적시스템을 구현하였다. 드론 음향 추적 방식에는 3가지 주요 사항이 있다. 첫째, 가변 빔 형성을 통해 공간을 스캔하여 음원을 찾아 마이크 어레이를 사용하여 소리를 녹음한다. 둘째, 음원의 존재 유·무 여부를 알기 위해 은닉 마르코프 모델(HMM)로 분류한다. 마지막으로 음원이 드론인 경우, 적응형 빔 패턴을 기반의 추적기준 신호로 기록 및 저장된 음원을 사용한다. 시뮬레이션은 배경 노이즈 및 간섭 사운드가 없는 이상적인 상태와 배경 노이즈 및 간섭 사운드가 있는 비이상적인 조건 모두에서 수행되며 불법적인 드론의 추적 성능을 평가하였다. 드론 추적 시스템은 마이크 어레이 성능에 따른 탐색 거리 성능향상 및 음향 패턴 일치 정도에 따른 드론 유무 판정 기준을 설계하여 음성판독 회로설계에 반영하였다.

반향 소리를 이용한 기계 학습 기반 수박의 당도 예측 (Prediction of watermelon sweetness using a reflected sound)

  • 김기훈;우지환
    • 한국융합학회논문지
    • /
    • 제11권8호
    • /
    • pp.1-6
    • /
    • 2020
  • 수박의 맛을 평가하는 다양한 방식이 있으나, 기존의 방법들은 주관적 방식, 평가 비용, 대상의 손상 등과 같은 평가 방식의 한계점이 있다. 최근에는 이러한 단점들을 해소하기 위해 소리를 이용하여 수박을 평가하는 연구들이 진행되고 있다. 본 연구에서는 수박을 두드렸을 때 나는 반향 소리를 AI기반의 기계 학습을 이용하여 수박의 당도를 예측하는 모델을 개발 하였다. 수박의 당도가 높을수록 높은 주파수 성분이 특이점으로 나타나며, 따라서 반향소리 시간-주파수 특이점에 기반 하여 기계 학습 방법을 개발하였다. 2개의 수박 당도별 그룹을 구분 시에 83.2%, 3개의 그룹을 구분시에 59.6%의 정확도로 당도를 예측 할 수 있었다.

바닥 衝擊音 遮音性能基準 및 等級化에 관한 硏究(Ⅱ) (A Study on the Standard and Classification of Impact Sound Insulation Performance for Apartment House(II))

  • 김선우;손철봉;송용식;장길수;이태강;국찬;김재수;한명호
    • 한국음향학회지
    • /
    • 제9권4호
    • /
    • pp.5-17
    • /
    • 1990
  • 국내 설정에 적합한 차음성능기준 및 등급화 방안을 설정하기 위하여 그 기초 연구단계로서 주민반응조사 및 차음성능수준을 측정하고, 차음성능 평가치와 생활감과의 상관관계를 분석 외국의 기존 평가기준곡선 적응가능성을 검토하였다. 분석결과 ISO에 의한 평가방법보다는 JIS에 의한 평가방법이 국내 공동주택의 경우에는 보다 합리적임을 파악하였고, 표준충격원은 경량 및 중량충격원을 사용하는 것이 타당하다고 판단된다. 또한 측정시 문제가 되는 63Hz 중심 주파수대역을 측정범위에서 제외하여도 차음성능 지수상의 오차는 무시할 수 있었다.

  • PDF

프린터 음질평가를 위한 순음도 설계 (Tonality Design for Sound Quality Evaluation in Printer)

  • 김의열;이영준;이상권
    • 한국소음진동공학회논문집
    • /
    • 제22권4호
    • /
    • pp.318-327
    • /
    • 2012
  • The operating sound radiated from a laser printer includes tonal noise components caused by the rotating mechanical parts such as gear, shaft, motor, fan, etc. The negative effects of the tonal noise components need to be considered in the process of developing a sound quality index for the quantitative evaluation of the emotional satisfaction in terms of psycho-acoustics. However, in a previous paper, it was confirmed that the Aures tonality did not have enough correlation with the results of jury evaluation. The sound quality index based on loudness, articulation index, fluctuation strength has a little problem in considering the effects of rotating mechanical parts on the sound quality. In this paper, to solve the tonality evaluation problem, the calculation algorithm of Aures tonality was investigated in detail to find the cause of decreasing the correlation. The new tonality evaluation model was proposed by modifying and optimizing the masking effect, loudness ratio, and shape of weighting curve based on the basic algorithm of Aures tonality, and applied to two kinds of operating sound groups in order to verify the usefulness of proposed model. As a result, it is confirmed that the proposed tonality evaluation model has enough correlation and usefulness for expressing the tonalness in the operating sounds of laser printers. In the following paper, this results will be used to model the sound quality index as the input data by using the classification algorithm.

능동형 기울기 가중치 제약에 기반한 환경소리 인식시스템용 DTW 알고리듬 (Active Slope Weighted-Constraints Based DTW Algorithm for Environmental Sound Recognition System)

  • 정영진;이윤정;김필운;김명남
    • 한국멀티미디어학회논문지
    • /
    • 제11권4호
    • /
    • pp.471-480
    • /
    • 2008
  • 농자들은 청각장애를 가지고 있기 때문에 알람, 도어 벨, 싸이렌, 경적, 전화 벨 등과 같은 유용한 소리정보를 인식할 수 없다. 이러한 문제를 해결하기 위해서는 주요한 환경소리 인식방법을 탑재한 휴대형 청각보조 장구가 요구되어진다. 본 논문에서는 환경소리 인식시스템에 적용할 수 있는 능동형 기울기 가중치제약 방식의 새로운 동적 시간정합 알고리듬을 제안하였다. 환경소리 인식방법은 크게 세 단계로 구성된다. 첫 번째 단계에서는 소리의 주파수 성분과 크기를 이용하여 시작점과 끝점을 추출한다. 두 번째 단계에서는 추출된 구간에 대하여 특징을 추출하며 세 번째 단계에서는 추출된 특징들을 분류한다. 실험 결과 제안한 방법의 인식률이 거의 90%가 되었다. 그리고 기존의 동적 시간정합 알고리듬과 비교하였을 때 인식율에 있어서 약 20%정도의 개선이 있었다. 따라서 제안된 방법을 사용하여 농자가 환경소리를 인식할 수 있는 휴대형 청각 보조 장구가 개발된다면 그들의 생활에 편리함을 줄 수 있을 것으로 판단된다.

  • PDF

완충구조에 의한 공동주택 바닥충격음 차단성능 변화 연구 (A Study on the Floor Impact Sound Insulation Performance of Apartments depending on the Damping Materials)

  • 기노갑;송민정;김선우
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2005년도 춘계학술대회논문집
    • /
    • pp.79-82
    • /
    • 2005
  • This study aims to propose fundamental data for development of noise reduction system that is applied to classification for light-weight impact sound. For this reason, eight types of damping materials were constructed in new construction field. Comparison and analysis among the reduction materials were carried out on the acoustical characteristics through test. In the end, the suitability as a damping material was evaluated by the analysis.

  • PDF