• 제목/요약/키워드: 스펙트로그램

검색결과 136건 처리시간 0.051초

전.후 처리를 이용한 3 레벨 클리핑 알고리즘의 피치검출 (The Pitch detection of 3 Level Clipping Algorithm using by Pre-Post Processing)

  • 최승영
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.167-170
    • /
    • 1998
  • 음성신호의 특징적인 성분인 피치를 검출하는 알고리즘 중 실시산 구현이 손쉬운 3단계를 클리핑 알고리즘을 PC상에서의 처리를 위하여 구현하였다. 이 알고리즘을 통하여 검출되는 피치의 안정성 및 정확성을 높이기 위해서 적용된 창함수, LPF, 클리핑 자기상관값계산, 비선형 감쇄, 등의 전처리 필터링과, 배수피치 검출 및 정정, 메디언 필터링을 사용하여 피치를 검출하였다. 또한 이 알고리즘을 이용하여 DSP의 도움을 얻지 않고 PC상에서 음성을 분석하여 스펙트로그램, 파형, 에너지, 피치 등을 출력하는 프로그램인 Visual Analysis Tool for sounds(VAT)의 출력화면을 통하여 피치검출을 나타내었다.

  • PDF

주행중 차실 내부 소음의 평가 (Objective Evaluation of Vehicle Interior Noise in Transient Operation)

  • 정혁;이정권
    • 소음진동
    • /
    • 제6권4호
    • /
    • pp.499-502
    • /
    • 1996
  • Interior noise, engine speed and vehicle speed are measured under transient road-load condition and interior noise signal is transformed by using the transient signal analysis methods, such as the spectrogram and wavelet transform. Using the analyzed results, subjective noise metrics such as the loudness, sharpness and articulation index at each vehicle speed can be estimated and characteristics of interior noise for various running modes can be discussed in the viewpoint of noise quality.

  • PDF

포만트 합성방식에 의한 한국어 문자/음성 변환에 관한 연구 (I) (A Study on the Korean Text-to-Speech Conversion Using the Formant Synthesizer(I))

  • 김민년
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
    • /
    • pp.119-122
    • /
    • 1995
  • 음소단위의 포만트 합성방식을 이용하여 한국어의 규칙합성에 대해 시험하였다. 포만트 합성방식으로는 Klatt가 제안한 직/병렬 합성기를 수정하여 사용하였으며, 운율 정보를 나타내는 피치값의 제어는 Fujisaki 모델을 이용하였다. 합성에 사용되는 각 파라미터들이 합성음의 음질 및 파형에 미치는 영향을 분석할 수 있도록 합성 파라미터와 음성파형 및 스펙트로그램을 화면에 나타내고 마우스를 이용하여 파라미터 값을 사용자가 적절히 변경한 후 합성할 수 있는 포만트 방식의 합성 Tool을 개발하였으며, 이를 이용하여 한국어 문자/음성변환 시스템을 지속적으로 연구하고자 한다.

  • PDF

방적사 외관에 영향을 미치는 이상신호의 검출을 위한 웨이블릿 패킷 시스템 (A wavelet packet system for detecting the visual anomalies of spun-yarn diameter profiles)

  • 김주용
    • 한국섬유공학회:학술대회논문집
    • /
    • 한국섬유공학회 2001년도 가을 학술발표회 논문집
    • /
    • pp.159-161
    • /
    • 2001
  • 지난 수 십년 동안 단위 길이당의 질량이나 지름의 변동은 섬유 공정 및 품질 관리에 있어서 매우 중요한 특성으로 알려져왔다. [1,2] 특히 방적사의 균제도는 최종 제품의 성능이나 외관을 결정하는 중요한 요인중의 하나로 그 특성을 밝히기 위해 불균제 지수, 스펙트로그램, 자기 상관 계수도 등이 사용되어져 왔다. (중략)

  • PDF

온라인 오디오 장르 분류의 성능 분석 (The Performance Analysis of On-line Audio Genre Classification)

  • 윤호원;장우진;신성현;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.23-24
    • /
    • 2016
  • 본 논문에서는 온라인 오디오 장르 분류의 성능을 비교 분석한다. 온라인 동작을 위해 1초 단위의 오디오 신호를 입력하여 music, speech, effect 중 하나의 장르로 판단한다. 학습 방법은 GMM과 심층 신경망을 사용하며, 특성은 MFCC와 스펙트로그램을 포함하는 네 가지 종류의 벡터를 사용한다. 각 성능을 비교 분석하여 장르 분류에 적합한 학습 방법과 특성 벡터를 확인한다.

  • PDF

조건부 Wavenet을 이용한 음성 신호의 잡음 제거 기술 (Speech Denoising using Conditional Wavenet)

  • 유정찬;서은미;임유진;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.61-62
    • /
    • 2021
  • 본 논문에서는 조건부 wavenet을 이용한 음성 신호의 잡음 제거 기술을 제안한다. 기존의 음성 신호 잡음 제거 기술은 스펙트로그램을 기반으로 발전되어 왔으나, 잡음으로 인해 변형된 원음의 위상 정보를 복원할 수 없는 문제점을 가진다. 이를 해결하기 위해 시간 영역에서 전 과정을 실행하는 기계학습 모델인 wavenet을 사용하여 음성 신호의 잡음을 제거하는 방법을 제안한다. 특히, 잡음 종류를 조건으로 입력하여 성능 향상을 얻도록 한다. 성능 평가를 통하여 제안 방법이 시간 영역에서 잡음을 감소시킬 수 있음을 확인하였다.

  • PDF

모듈레이션 기법을 이용한 잡음에 강인한 선로 전환기의 이상 상황 탐지 (Noise-Robust Anomaly Detection of Railway Point Machine using Modulation Technique)

  • 이종욱;김아용;박대희;정용화
    • 스마트미디어저널
    • /
    • 제6권4호
    • /
    • pp.9-16
    • /
    • 2017
  • 열차의 방향을 기존 방향에서 다른 방향으로 이동시키기 위한 변환 장치인 선로 전환기의 고장은 열차의 탈선 등을 유발시킬 수 있다. 따라서 열차운행의 안전 측면에서 해당 장비에 대한 모니터링은 필수 요소이다. 본 논문에서는 선로 전환기의 구동시 발생하는 소리 정보를 기반으로 잡음에도 강인한 선로 전환기의 이상 상황 탐지시스템을 제안한다. 먼저 제안한 시스템은 소리 센서에서 실시간으로 취득하는 소리 신호에 STFT(Short-Time Fourier Transform)를 적용하여 스펙트로그램을 취득한다. 실제 환경에서 발생하는 잡음의 영향에도 강인한 성능을 보장하기 위하여, 해당 스펙트로그램에 대한 전처리 과정을 수행 후 모듈화 한다. 각각의 모듈에서 평균값과 표준편차를 계산 및 조합하여 특징 벡터로 생성한 후 이진 분류에 뛰어난 성능이 확인된 SVM(Support Vector Machine)에 적용하여 이상 상황을 탐지한다. 실제 선로 전환기의 전환 시 발생하는 소리 데이터를 이용하여 모의실험을 수행한 결과, 제안한 시스템은 잡음이 발생하는 상황에서도 효과적으로 이상 상황을 탐지함을 확인하였다.

시간-주파수 영역에서의 국지 미소지진과 지하인공폭발의 구별 (Discrimination of Local Microearthquakes and Artificial Underground Explosions on the Basis of Time-Frequency Domain)

  • 김소구;박용철
    • 지질공학
    • /
    • 제7권1호
    • /
    • pp.63-79
    • /
    • 1997
  • 본 연구의 목적은 시간-주파수 영역에서의 미소지진과 인공폭발을 구별하는 것으로 미소지진과 인공폭발의 주파수특성을 연구하기 위해서 3차원 스펙트로그램(주파수, 시간, 진폭)을 이용하였다. 3차원 스펙트로그램은 국지 및 광역 거리에서 관측된 자료에 대하여 각각의 위상에 대한 주파수대역의 연구에 매우 유용한 방법이다. 채석장 발파로부터 관측된 P파와 S파는 Hz 이상에서 큰 진폭을 가졌고 또한 가까운 거리에서는 뚜렷한 Rg파가 관측되었다. 미소 지진의 경우 P파와 S파는 넓은 주파수 대역에서 큰 진폭이나타났다. 인공 폭발과 미소지진의 구별을 위해서는 10Hz 이하에서 Pg/Lg 스펙트럼 비를 이용하였고 각각의 위상에서의 정확한 시간창(time window)을 구하기 위해서 다중 필터 방법(MFM)을 이용하여 군속도를 계산하였다. 또한 3 성분 자료에 관해서는 자료의 순수한 P, SV, SH 성질을 구하기 위해 자유 표면에서의 영향을 보정하고 각각의 위상에 대하여 FFT을 실시하여 7개의 주파수 대역(0.5-3, 2-4, 3-5, 4-6, 5-7, 6-8, 8-10Hz)에서 Pg/Lg 스펙트럼 비를 계산하였다. 위의 과정을 통해 6-8Hz 대역에서 미소지진과 인공폭발이 가장 잘 구별되었다.

  • PDF

실내 보안 응용을 위한 사람 감지 레이다 시스템의 설계 및 구현 (Design and Implementation of Human-Detecting Radar System for Indoor Security Applications)

  • 장대호;김현;정윤호
    • 전기전자학회논문지
    • /
    • 제24권3호
    • /
    • pp.783-790
    • /
    • 2020
  • 본 논문에서는 실내 보안 응용을 위한 사람 감지 레이다 시스템을 제안하고, 이의 FPGA 기반 설계 및 구현 결과를 제시하였다. 연산의 복잡도와 메모리 요구량을 최소화하기 위해 스펙트로그램의 상측 절반만 특징점 추출에 사용하였으며, 복잡한 연산이 필요한 특징점 추출기법을 배제하고, 분류 성능과 연산 복잡도를 고려한 효율적인 특징점 추출기법이 제안되었다. 또한, 전체 스펙트로그램에 대한 저장이 불필요한 파이프라인 구조로 설계하여 메모리 요구량을 최소화하였다. 제안된 시스템의 분류 학습을 위해 사람, 개, 로봇 청소기에 대한 실험이 수행되었고, 96.2%의 정확도 성능을 확인하였다. 제안된 시스템은 Verilog-HDL을 이용하여 구현되었으며, 1140개의 logic과 6.5 Kb의 메모리를 사용하는 저면적 설계가 가능함을 확인하였다.

Phonetic Posterior Grams에 의해 조건화된 적대적 생성 신경망을 사용한 음성 변환 시스템 (Voice Conversion using Generative Adversarial Nets conditioned by Phonetic Posterior Grams)

  • 임진수;강천성;김동하;김경섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.369-372
    • /
    • 2018
  • 본 논문은 매핑 되지 않은 입력 음성과 목표음성 사이에 음성 변환하는 비 병렬 음성 변환 네트워크를 제안한다. 기존 음성 변환 연구에서는 변환 전후 스펙트로그램의 거리 오차를 최소화하는 방법을 주로 학습 한다. 이러한 방법은 MSE의 이미지를 평균 내는 특징으로 인하여 생성된 스펙트로그램의 해상도가 저하되는 문제점이 있었다. 또한, 병렬 데이터를 사용해 연구를 진행했기 때문에 데이터를 수집하는 것에도 어려움이 많았다. 본 논문에서는 입력 음성의 발음 PPGs를 사용하여 비 병렬 데이터 간 학습을 진행 하며, GAN 학습을 통해 더욱 선명한 음성을 생성하는 방법을 사용하였다. 제안한 방법의 유효성을 검증하기 위해서 기존 음성 변환 시스템에서 많이 사용하는 GMM 기반 모델과 MOS 테스트를 진행하였으며 기존 모델에 비하여 성능이 향상되는 결과를 얻었다.

  • PDF