• Title/Summary/Keyword: 스펙트로그램

Search Result 136, Processing Time 0.042 seconds

The Pitch detection of 3 Level Clipping Algorithm using by Pre-Post Processing (전.후 처리를 이용한 3 레벨 클리핑 알고리즘의 피치검출)

  • 최승영
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.167-170
    • /
    • 1998
  • 음성신호의 특징적인 성분인 피치를 검출하는 알고리즘 중 실시산 구현이 손쉬운 3단계를 클리핑 알고리즘을 PC상에서의 처리를 위하여 구현하였다. 이 알고리즘을 통하여 검출되는 피치의 안정성 및 정확성을 높이기 위해서 적용된 창함수, LPF, 클리핑 자기상관값계산, 비선형 감쇄, 등의 전처리 필터링과, 배수피치 검출 및 정정, 메디언 필터링을 사용하여 피치를 검출하였다. 또한 이 알고리즘을 이용하여 DSP의 도움을 얻지 않고 PC상에서 음성을 분석하여 스펙트로그램, 파형, 에너지, 피치 등을 출력하는 프로그램인 Visual Analysis Tool for sounds(VAT)의 출력화면을 통하여 피치검출을 나타내었다.

  • PDF

Objective Evaluation of Vehicle Interior Noise in Transient Operation (주행중 차실 내부 소음의 평가)

  • Jeong, Hyuk;Ih, Jeong-Guon
    • Journal of KSNVE
    • /
    • v.6 no.4
    • /
    • pp.499-502
    • /
    • 1996
  • Interior noise, engine speed and vehicle speed are measured under transient road-load condition and interior noise signal is transformed by using the transient signal analysis methods, such as the spectrogram and wavelet transform. Using the analyzed results, subjective noise metrics such as the loudness, sharpness and articulation index at each vehicle speed can be estimated and characteristics of interior noise for various running modes can be discussed in the viewpoint of noise quality.

  • PDF

A Study on the Korean Text-to-Speech Conversion Using the Formant Synthesizer(I) (포만트 합성방식에 의한 한국어 문자/음성 변환에 관한 연구 (I))

  • 김민년
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.119-122
    • /
    • 1995
  • 음소단위의 포만트 합성방식을 이용하여 한국어의 규칙합성에 대해 시험하였다. 포만트 합성방식으로는 Klatt가 제안한 직/병렬 합성기를 수정하여 사용하였으며, 운율 정보를 나타내는 피치값의 제어는 Fujisaki 모델을 이용하였다. 합성에 사용되는 각 파라미터들이 합성음의 음질 및 파형에 미치는 영향을 분석할 수 있도록 합성 파라미터와 음성파형 및 스펙트로그램을 화면에 나타내고 마우스를 이용하여 파라미터 값을 사용자가 적절히 변경한 후 합성할 수 있는 포만트 방식의 합성 Tool을 개발하였으며, 이를 이용하여 한국어 문자/음성변환 시스템을 지속적으로 연구하고자 한다.

  • PDF

A wavelet packet system for detecting the visual anomalies of spun-yarn diameter profiles (방적사 외관에 영향을 미치는 이상신호의 검출을 위한 웨이블릿 패킷 시스템)

  • 김주용
    • Proceedings of the Korean Fiber Society Conference
    • /
    • 2001.10a
    • /
    • pp.159-161
    • /
    • 2001
  • 지난 수 십년 동안 단위 길이당의 질량이나 지름의 변동은 섬유 공정 및 품질 관리에 있어서 매우 중요한 특성으로 알려져왔다. [1,2] 특히 방적사의 균제도는 최종 제품의 성능이나 외관을 결정하는 중요한 요인중의 하나로 그 특성을 밝히기 위해 불균제 지수, 스펙트로그램, 자기 상관 계수도 등이 사용되어져 왔다. (중략)

  • PDF

The Performance Analysis of On-line Audio Genre Classification (온라인 오디오 장르 분류의 성능 분석)

  • Yun, Ho-Won;Jang, Woo-Jin;Shin, Seong-Hyeon;Park, Ho-Chong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.11a
    • /
    • pp.23-24
    • /
    • 2016
  • 본 논문에서는 온라인 오디오 장르 분류의 성능을 비교 분석한다. 온라인 동작을 위해 1초 단위의 오디오 신호를 입력하여 music, speech, effect 중 하나의 장르로 판단한다. 학습 방법은 GMM과 심층 신경망을 사용하며, 특성은 MFCC와 스펙트로그램을 포함하는 네 가지 종류의 벡터를 사용한다. 각 성능을 비교 분석하여 장르 분류에 적합한 학습 방법과 특성 벡터를 확인한다.

  • PDF

Speech Denoising using Conditional Wavenet (조건부 Wavenet을 이용한 음성 신호의 잡음 제거 기술)

  • Yu, Jeongchan;Seo, Eunmi;Lim, Yujin;Park, Hochong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.61-62
    • /
    • 2021
  • 본 논문에서는 조건부 wavenet을 이용한 음성 신호의 잡음 제거 기술을 제안한다. 기존의 음성 신호 잡음 제거 기술은 스펙트로그램을 기반으로 발전되어 왔으나, 잡음으로 인해 변형된 원음의 위상 정보를 복원할 수 없는 문제점을 가진다. 이를 해결하기 위해 시간 영역에서 전 과정을 실행하는 기계학습 모델인 wavenet을 사용하여 음성 신호의 잡음을 제거하는 방법을 제안한다. 특히, 잡음 종류를 조건으로 입력하여 성능 향상을 얻도록 한다. 성능 평가를 통하여 제안 방법이 시간 영역에서 잡음을 감소시킬 수 있음을 확인하였다.

  • PDF

Noise-Robust Anomaly Detection of Railway Point Machine using Modulation Technique (모듈레이션 기법을 이용한 잡음에 강인한 선로 전환기의 이상 상황 탐지)

  • Lee, Jonguk;Kim, A-Yong;Park, Daihee;Chung, Yongwha
    • Smart Media Journal
    • /
    • v.6 no.4
    • /
    • pp.9-16
    • /
    • 2017
  • The railway point machine is an especially important component that changes the traveling direction of a train. Failure of the point machine may cause a serious railway accident. Therefore, early detection of failures is important for the management of railway condition monitoring systems. In this paper, we propose a noise-robust anomaly detection method in railway condition monitoring systems using sound data. First, we extract feature vectors from the spectrogram image of sound signals and convert it into modulation feature to ensure robust performance, and lastly, use the support vector machine (SVM) as an early anomaly detector of railway point machines. By the experimental results, we confirmed that the proposed method could detect the anomaly conditions of railway point machines with acceptable accuracy even under noisy conditions.

Discrimination of Local Microearthquakes and Artificial Underground Explosions on the Basis of Time-Frequency Domain (시간-주파수 영역에서의 국지 미소지진과 지하인공폭발의 구별)

  • 김소구;박용철
    • The Journal of Engineering Geology
    • /
    • v.7 no.1
    • /
    • pp.63-79
    • /
    • 1997
  • In this study, our purpose is to develop a technique to discriminate artificial explosions from local microearthquakes on the basis of time-frequency domain. To obtain spectral features of artificial explosions and microearthquakes, we used 3-d spectrograms(frequency, time and amplitude) because this is a useful tool to study the frequency content of entire seismic waveforms observed at local and regional distances (e. g., Kim et al., 1994). P and S waves from quarry blasts show that frequency content of dominant amplitude appeared above 10 Hz and Rg phases that are observed at near distance ranges. But P and S waves from microearthquakes have more broad frequency content as well as below 10 Hz. And for discrimination, Pg/Lg spectral ratio is performed below 10 Hz. In order to select time windows we computed group velocity using multiple filter method(MFM) and removed free surface effects from all 3-components data for improving on data quality. Next step, we computed Fast-Fourier transform, and a log average spectral amplitude over seven frequency bands : 0.5 to 3, 2 to 4, 3 to 5, 4 to 6, 5 to 7, 6 to 8 and 8 to 10 Hz. The best separation is observed from 6 to 8 Hz.

  • PDF

Design and Implementation of Human-Detecting Radar System for Indoor Security Applications (실내 보안 응용을 위한 사람 감지 레이다 시스템의 설계 및 구현)

  • Jang, Daeho;Kim, Hyeon;Jung, Yunho
    • Journal of IKEEE
    • /
    • v.24 no.3
    • /
    • pp.783-790
    • /
    • 2020
  • In this paper, the human detecting radar system for indoor security applications is proposed, and its FPGA-based implementation results are presented. In order to minimize the complexity and memory requirements of the computation, the top half of the spectrogram was used to extract features, excluding the feature extraction techniques that require complex computation, feature extraction techniques were proposed considering classification performance and complexity. In addition, memory requirements were minimized by designing a pipeline structure without storing the entire spectrogram. Experiments on human, dog and robot cleaners were conducted for classification, and 96.2% accuracy performance was confirmed. The proposed system was implemented using Verilog-HDL, and we confirmed that a low-area design using 1140 logics and 6.5 Kb of memory was possible.

Voice Conversion using Generative Adversarial Nets conditioned by Phonetic Posterior Grams (Phonetic Posterior Grams에 의해 조건화된 적대적 생성 신경망을 사용한 음성 변환 시스템)

  • Lim, Jin-su;Kang, Cheon-seong;Kim, Dong-Ha;Kim, Kyung-sup
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2018.10a
    • /
    • pp.369-372
    • /
    • 2018
  • This paper suggests non-parallel-voice-conversion network conversing voice between unmapped voice pair as source voice and target voice. Conventional voice conversion researches used learning methods that minimize spectrogram's distance error. Not only these researches have some problem that is lost spectrogram resolution by methods averaging pixels. But also have used parallel data that is hard to collect. This research uses PPGs that is input voice's phonetic data and a GAN learning method to generate more clear voices. To evaluate the suggested method, we conduct MOS test with GMM based Model. We found that the performance is improved compared to the conventional methods.

  • PDF