• Title/Summary/Keyword: 스펙트로그램

Search Result 137, Processing Time 0.023 seconds

A Study on 3-Dimensional Near-Field Source Localization Using Interference Pattern Matching in Shallow Water Environments (천해에서 간섭패턴 정합을 이용한 근거리 음원의 3차원 위치추정 기법연구)

  • Kim, Se-Young;Chun, Seung-Yong;Son, Yoon-Jun;Kim, Ki-Man
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.4
    • /
    • pp.318-327
    • /
    • 2009
  • In this paper, we propose a 3-D geometric localization method for near-field broadband source in shallow water environments. According to the waveguide invariant theory, slope of the interference pattern which is seen in a sensor spectrogram directly proportional to a range of the source. The relative ratio of the range between source and sensors was estimated by matching of two interference patterns in spectrogram. Then this ratio is applied to the Apollonius's circle which shows the locus of a source whose range ratio from two sensors is constant. Two Apollonius's circles from three sensors make the intersection point that means the horizontal range and the azimuth angle of the source. And this intersection point is constant with source depth. Therefore the source depth can be estimated using 3-D hyperboloid equation whose range difference from two sensors is constant. To evaluate a performance of the proposed localization algorithm, simulation is performed using acoustic propagation program and analysis of localization error is demonstrated. From simulation results, error estimate for range and depth is described within 50 m and 15 m respectively.

A Tonal signal automatic recognition for noise sources classification of the ship radiated noise (선박의 방사소음원 분류를 위한 Tonal 신호 자동인식 기법 연구)

  • Lee Phil-Ho;Yoon Jong-Rak;Park Kyu-Chil;Lim Ki-Hyun
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.175-178
    • /
    • 2004
  • 선박의 수중방사소음은 다양한 기계류나 추진기 혹은 선체와 유체간의 상호 작용으로 인하여 여러 형태의 특성신호로 나타나게 된다. 이는 선박의 운용조건, 장비 회전특성 및 내부구조에 따라 스펙트럼상에 상이한 주파수로 확인됨은 물론, 신호의 출현 형태에도 다양성을 보이고 있다. 일반적으로 선박소음은 속력 종속적인 추진 계통 성분과 비종속적인 보기류 신호로 구분되나 다수의 신호성분이 혼재되어 발생기원을 분류하는 것은 복잡한 과정을 거쳐야 한다. 본 연구에서는 이러한 점을 해결하기 위해 선박의 Tonal성 신호를 자동으로 탐지하고 분류하기 위해 규준화된 스펙트로그램 상에서 연속되는 신호에 가중치를 주어 지속성 신호여부를 판별한 후에 정해진 임계치를 초과하는 성분을 Tonal로 선정하였다. 선정된 Tonal에 대해 주파수선의 대역특성 및 시간 변동성에 대한 패턴인식 방법을 적용하여 Tonal의 발생기원이 속력 종속/비종속적인지를 자동으로 판별하는 알고리즘의 유용성에 대한 결과를 기술하였다.

  • PDF

Prediction of watermelon sweetness using a reflected sound (반향 소리를 이용한 기계 학습 기반 수박의 당도 예측)

  • Kim, Ki-Hoon;Woo, Ji-Hwan
    • Journal of the Korea Convergence Society
    • /
    • v.11 no.8
    • /
    • pp.1-6
    • /
    • 2020
  • There are various approaches to evaluate a watermelon sweetness. However, there are some limitations to evaluating cost, watermelon damage, and subjective issue. In this study, we developed a novel approach to predict a watermelon sweetness using reflected sound and the machine learning algorithm. It was observed that higher brix watermelon produced higher spectral power is reflected sound. Based on the spectral-temporal features of reflected sound, the machine learning algorithms could accurately predict the sweetness group at a rate of 83.2 and 59.6 % in 2-groups and 3-groups classification, respectively.

Multi-band multi-scale DenseNet with dilated convolution for background music separation (배경음악 분리를 위한 확장된 합성곱을 이용한 멀티 밴드 멀티 스케일 DenseNet)

  • Heo, Woon-Haeng;Kim, Hyemi;Kwon, Oh-Wook
    • The Journal of the Acoustical Society of Korea
    • /
    • v.38 no.6
    • /
    • pp.697-702
    • /
    • 2019
  • We propose a multi-band multi-scale DenseNet with dilated convolution that separates background music signals from broadcast content. Dilated convolution can learn the multi-scale context information represented by spectrogram. In computer simulation experiments, the proposed architecture is shown to improve Signal to Distortion Ratio (SDR) by 0.15 dB and 0.27 dB in 0dB and -10 dB Signal to Noise Ratio (SNR) environments, respectively.

A Study on Analysis of Speech Duration Between the Existing Singer and New Generation Singer (기존 가수 및 신세대 가수의 소리지속시간 분석에 관한 연구)

  • Jung YoungHoon;BAE MyungJin
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.119-122
    • /
    • 2002
  • 음악을 함에 있어서 정확하고 매력적인 발성을 하는 것도 중요하지만 더욱 기본적이고 중요한 것이 정확한 발음을 내는 것이다. 정확한 발음이 해결되지 않은 상태에서는 아무리 발성법을 꿰뚫고 있다하더라도 많은 사람들에게 자신이 전달하고자 하는 메시지를 제대로 전달하지 못하게 된다. 보통 노래를 잘 부르기 위해서 노래방 같은 곳을 찾아가 노래 연습을 하는 사람들이 많이 있는데, 무엇보다 기본적인 발음이 명확하지 않으면 노래를 잘 부른다고 볼 수는 없는 것이다. 랩을 주로 하는 신세대 가수들의 음악을 들어 보면 자막을 보지 않고서는 무슨 말인지 알아들을 수가 없다. 그들이 노래할 때 입 크기의 변화 없이 입술모양만 변화시키면서 발성하기 때문이다. 음성은 기본적으로 여기성분과 성도성분으로 구분할 수 있다. 성도는 인두강과 구강을 합쳐서 일컫는다. 따라서 입 모양을 어떻게 하느냐에 따라서 같은 말이라도 명료성이 달라지게 된다. 본 논문에서는 이 소리지속시간을 비교 평가하기 위해서 기존가수와 신세대 가수의 한 음절에 대한 지속시간을 비교하여 보았고 8Khz까지의 스펙트로그램을 비교하였다. 비교결과 기존 가수가 신세대 가수에 비하여 말의 의사 전달에 있어서 명료하게 전달 할 수 있다는 것을 알 수 있었다.

  • PDF

An Optimally-Modified Multichannel Wiener Filter Using Speech Presence Probability (음성존재확률을 이용한 최적 변형 다채널 위너 필터)

  • Jeong, Sangbae;Kim, Youngil
    • Smart Media Journal
    • /
    • v.7 no.3
    • /
    • pp.9-15
    • /
    • 2018
  • This paper proposes an optimal gain modification method of the Multichannel Wiener filter (MWF) using speech presence probabilities. Conventional gain modification methods of MWFs have the problem of the increase of speech distortions while reducing residual noises with its relative heuristic approach. However, the proposed optimal gain modification method, derived by solving the unconstrained minimization problem of the probability-involved cost function, reduces amounts of residual noises and signal distortions simultaneously. Through an evaluation of the filtered waveforms and spectrograms, it is verified that the proposed method results in an improved SNR with less signal distortions compared to the conventional MWF.

Study on data augmentation methods for deep neural network-based audio tagging (Deep neural network 기반 오디오 표식을 위한 데이터 증강 방법 연구)

  • Kim, Bum-Jun;Moon, Hyeongi;Park, Sung-Wook;Park, Young cheol
    • The Journal of the Acoustical Society of Korea
    • /
    • v.37 no.6
    • /
    • pp.475-482
    • /
    • 2018
  • In this paper, we present a study on data augmentation methods for DNN (Deep Neural Network)-based audio tagging. In this system, an audio signal is converted into a mel-spectrogram and used as an input to the DNN for audio tagging. To cope with the problem associated with a small number of training data, we augment the training samples using time stretching, pitch shifting, dynamic range compression, and block mixing. In this paper, we derive optimal parameters and combinations for the augmentation methods through audio tagging simulations.

Scalogram and Switchable Normalization CNN(SN-CNN) Based Bearing Falut Detection (Scalogram과 Switchable 정규화 기반 합성곱 신경망을 활용한 베이링 결함 탐지)

  • Delgermaa, Myagmar;Kim, Yun-Su;Seok, Jong-Won
    • Journal of IKEEE
    • /
    • v.26 no.2
    • /
    • pp.319-328
    • /
    • 2022
  • Bearing plays an important role in the operation of most machinery, Therefore, when a defect occurs in the bearing, a fatal defect throughout the machine is generated. In this reason, bearing defects should be detected early. In this paper, we describe a method using Convolutional Neural Networks (SN-CNNs) based on continuous wavelet transformations and Switchable normalization for bearing defect detection models. The accuracy of the model was measured using the Case Western Reserve University (CWRU) bearing dataset. In addition, batch normalization methods and spectrogram images are used to compare model performance. The proposed model achieved over 99% testing accuracy in CWRU dataset.

Snoring sound detection method using attention-based convolutional bidirectional gated recurrent unit (주의집중 기반의 합성곱 양방향 게이트 순환 유닛을 이용한 코골이 소리 검출 방식)

  • Kim, Min-Soo;Lee, Gi Yong;Kim, Hyoung-Gook
    • The Journal of the Acoustical Society of Korea
    • /
    • v.40 no.2
    • /
    • pp.155-160
    • /
    • 2021
  • This paper proposes an automatic method for detecting snore sound, one of the important symptoms of sleep apnea patients. In the proposed method, sound signals generated during sleep are input to detect a sound generation section, and a spectrogram transformed from the detected sound section is applied to a classifier based on a Convolutional Bidirectional Gated Recurrent Unit (CBGRU) with attention mechanism. The applied attention mechanism improved the snoring sound detection performance by extending the CBGRU model to learn discriminative feature representation for the snoring detection. The experimental results show that the proposed snoring detection method improves the accuracy by approximately 3.1 % ~ 5.5 % than existing method.

Extraction and Analysis of Voice Feature Parameter of Chungbuk News Announcers (충북방송 뉴스 진행자의 음성적 특징 추출 및 분석)

  • Kim, Bong-Hyun;Lee, Se-Hwan;Ka, Min-Kyoung;Cho, Dong-Uk;J.Bae, Young-Lae
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.363-364
    • /
    • 2009
  • 방송 산업이 기술적 구조적으로 발전하고 시청자의 수준 향상 및 문화 산업이 급변함에 따라 현대사회에서 방송 분야는 거대 성장을 거듭하고 있다. 이러한 방송 산업의 시대적 변화속에서 지속적으로 관심의 대상이 되고 있는 것이 시청자들의 수준 및 변화의 초점이며 이를 파악하여 원활한 방송의 진행을 주도해야 하는 것이 방송 진행자의 역할이다. 따라서 본 논문에서는 충북지역의 방송 3사에서 뉴스를 담당하고 있는 진행자에 대한 음성을 수집하여 다양한 음성 분석 요소들을 적용하고 이에 따른 결과값을 기반으로 방송 진행자의 음성에 대한 특징적 정보를 추출하는 실험을 수행하였다. 특히, 음성을 통해 전달할 수 있는 영향력을 분석하기 위해 피치, 지터, 짐머, 안정도, 및 스펙트로그램 등의 다양한 음성 분석 요소를 적용하였으며 결과값에 대한 비교, 분석을 수행하였다.