• 제목/요약/키워드: Spectrogram

검색결과 234건 처리시간 0.023초

노이즈 추가와 디노이징 처리에 따른 회전 기계설비의 결함 분류 모델 성능 변화 (Performance change of defect classification model of rotating machinery according to noise addition and denoising process)

  • 이세훈;김성수;조비건
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.1-2
    • /
    • 2023
  • 본 연구는 환경 요인이 통제되어 있는 실험실 데이터에 산업 현장에서 발생하는 유사 잡음을 노이즈로 추가하였을 때, SNR비에 따른 노이즈별 STFT Log Spectrogram, Mel-Spectrogram, CWT Spectrogram 총 3가지의 이미지를 생성하고, 각 이미지를 입력으로 한 CNN 결함 분류 모델의 성능 결과를 확인하였다. 원본 데이터의 영향력이 큰 0db 이상의 SNR비로 합성할 경우 원본 데이터와 분류 결과상 큰 차이가 존재하지 않았으며, 노이즈 데이터의 영향이 큰 0db 이하의 SNR비로 합성할 경우, -20db의 STFT 이미지 기준 약 26%의 성능 저하가 발생하였다. 또한, Wiener Filtering을 통한 디노이징 처리 이후, 노이즈를 효과적으로 제거하여 분류 성능의 결과가 높아지는 점을 확인하였다.

  • PDF

성문(聲紋)과 사상체질(四象體質)과의 상관성(相關性)에 관(關)한 연구(硏究) (A Study on the Correlation between Sound Spectrogram and Sasang Constitution)

  • 양승현;김달래
    • 사상체질의학회지
    • /
    • 제8권2호
    • /
    • pp.191-202
    • /
    • 1996
  • 사상의학(四象醫學)에 있어서 체질변증(體質辨證)은 매우 중요한 과제로서 많은 의가(醫家)들에 의해 연구되고 있으나 지금까지 객관적으로 인정된 방법은 없다고 하겠다. 본 연구는 성문(聲紋)과의 상관성(相關性)을 통하여 사상체질(四象體質) 변증(辨證)에 도움이 되고자 하였다. 태음인(太陰人) 26명, 소음인(少陰人) 25명, 소양인(少陽人) 15명의 음성(音聲)울 녹음하여 시간 측정을 하였고, 성문분석기로 음성의 기본주파수(基木周波數)를 분석하여 비교하였으며 결과는 다음과 같다. 1. 태음인, 소음인, 소양인의 측정된 문장 발음 속도는 유사한 경향을 보였다. 2. 기본주파수 빈도분포그래프와 정규분포 그래프에서 태음인의 중심값이 소음인과 소양인에 비해 낮게 나타났으며, 소음인과 소양인 사이의 중심값은 유사한 경향을 보였다. 3. 기본주파수 빈도분포 그래프와 정규분포 그래프에서 폭의 경우는 체질 간에 유사한 경향을 보였다. 4. 세 체질의 기본주파수 평균값의 경우 태음인은 소음인에 비해 낮게 나타나서 태음인과 소음인은 통계학적으로 유의적인 차이점이 인정되었으며, 이는 태음인의 저음 사용이 소음인에 비하여 많음을 의미 한다고 볼 수 있다. 따라서 성문의 기본주파수 분석을 통한 사상체질 분류검사방법은 사상체질의 객관화를 위한 하나의 보조적인 방법이 될 수 있다고 사료된다. 제언 및 문제점 1. 문장뿐만 아니라 실제 대화음성의 분석이 필요할 것으로 생각된다. 2. 좀 더 많은 자료의 수집 분석이 필요하며, 남성뿐만 아니라 여성과 연령별로의 분석도 연구되어야 한다고 생각된다. 3. 녹음시의 여러 변수, 예를 들연 녹음시의 잡음, 조사대상자의 긴장, 또는 감기나 기타 질병으로 인한 음성변화 등에 대한 문제점도 주의해야 할 것으로 생각된다. 4. 기본주파수이외의 다른 변수, 예를 들어 공명주파수나 음의 강도등을 이용한 체질과의 상관성에 관한 연구가 필요하다고 생각된다.

  • PDF

저작권자의 로고를 워터 마킹하는 장치 (Watermarking System That Inserts Copyright Holder′s Logo)

  • 남상엽;이천우;김형배;이상원;박인정
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1487-1490
    • /
    • 2003
  • This paper shows the watermarking system that inserts copyright holder's logo in music file. In other words, a sound file is able to have an image information like a logo or letters. The watermarking system converts a sound file into an image file using spectrogram. In the spectrogram domain, a logo is inserted using spread spectrum. The proposed technique shows that the verification of copyright is better than the method using PN-Sequence.

  • PDF

주행중 차실 내부 소음의 평가 (Objective Evaluation of Vehicle Interior Noise in Transient Operation)

  • 정혁;이정권
    • 소음진동
    • /
    • 제6권4호
    • /
    • pp.499-502
    • /
    • 1996
  • Interior noise, engine speed and vehicle speed are measured under transient road-load condition and interior noise signal is transformed by using the transient signal analysis methods, such as the spectrogram and wavelet transform. Using the analyzed results, subjective noise metrics such as the loudness, sharpness and articulation index at each vehicle speed can be estimated and characteristics of interior noise for various running modes can be discussed in the viewpoint of noise quality.

  • PDF

Eddy Current Testing for Radiator Tubes Surrounded by Cooling Fins

  • Nagata, Shoichiro;Tsubusa, Yoshiaki;Enokizono, Masato
    • Journal of Magnetics
    • /
    • 제16권3호
    • /
    • pp.276-280
    • /
    • 2011
  • This paper presents a non-destructive evaluation study on a radiator with cooling fins as a complex shaped specimen. Radiator structures are used in various heat exchangers, such as automobiles, air conditioners and refrigerators. An eddy current testing method, namely multi-frequency excitation and spectrogram method (MFES), was employed to detect a defect on the radiator tube surrounded by cooling fins. Overall, experimental results suggested that the influence of cooling fin is not as noticeable as that of the defect signals.

오디오 전처리 방법에 따른 콘벌루션 신경망의 환경음 분류 성능 비교 (Comparison of environmental sound classification performance of convolutional neural networks according to audio preprocessing methods)

  • 오원근
    • 한국음향학회지
    • /
    • 제39권3호
    • /
    • pp.143-149
    • /
    • 2020
  • 본 논문에서는 딥러닝(deep learning)을 이용하여 환경음 분류 시 전처리 단계에서 사용하는 특징 추출 방법이 콘볼루션 신경망의 분류 성능에 미치는 영향에 대해서 다루었다. 이를 위해 환경음 분류 연구에서 많이 사용되는 UrbanSound8K 데이터셋에서 멜 스펙트로그램(mel spectrogram), 로그 멜 스펙트로그램(log mel spectrogram), Mel Frequency Cepstral Coefficient(MFCC), 그리고 delta MFCC를 추출하고 각각을 3가지 분포로 스케일링하였다. 이 데이터를 이용하여 4 종의 콘볼루션 신경망과 이미지넷에서 좋은 성능을 보였던 VGG16과 MobileNetV2 신경망을 학습시킨 다음 오디오 특징과 스케일링 방법에 따른 인식률을 구하였다. 그 결과 인식률은 스케일링하지 않은 로그 멜 스펙트럼을 사용했을 때 가장 우수한 것으로 나타났다. 도출된 결과를 모든 오디오 인식 문제로 일반화하기는 힘들지만, Urbansound8K의 환경음이 포함된 오디오를 분류할 때는 유용하게 적용될 수 있을 것이다.

지면 반사효과를 이용한 비행 궤적 추정에 대한 실험적 연구와 스펙트로그램 및 캡스트로그램 방법 비교 (Experimental Study on Estimation of Flight Trajectory Using Ground Reflection and Comparison of Spectrogram and Cepstrogram Methods)

  • 정욱진;고영주;이재형;최종수
    • 한국군사과학기술학회지
    • /
    • 제18권2호
    • /
    • pp.115-124
    • /
    • 2015
  • A methodology is proposed to estimate a trajectory of a flying target and its velocity using the time and frequency analysis of the acoustic signal. The measurement of sound emitted from a flying acoustic source with a microphone above a ground shall receive both direct and ground-reflected sound waves. For certain frequency contents, the destructive interference happens in received signal waveform reflected path lengths are in multiple integers of direct path length. This phenomenon is referred to as the acoustical mirror effect and it can be observed in a spectrogram plot. The spectrogram of acoustic measurement for a flying vehicle measurement shows several orders of destructive interference curves. The first or second order of curve is used to find the best approximate path by using nonlinear least-square method. Simulated acoustic signal is generated for the condition of known geometric of a sensor and a source in flight. The estimation based on cepstrogram analysis provides more accurate estimate than spectrogram.

스펙트로그램과 심층 신경망을 이용한 온라인 오디오 장르 분류 (On-Line Audio Genre Classification using Spectrogram and Deep Neural Network)

  • 윤호원;신성현;장우진;박호종
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.977-985
    • /
    • 2016
  • 본 논문은 스펙트로그램과 심층 신경망을 이용한 온라인 오디오 장르 분류 방법을 제안한다. 제안한 방법은 온라인 동작을 위하여 1초 단위로 신호를 입력하여 speech, music, effect 중 하나의 장르로 분류하고, 동작의 범용성을 위하여 기존 오디오 분석에 널리 사용되는 MFCC 대신에 스펙트로그램 기반의 특성 벡터를 사용한다. 실제 TV 방송 신호를 사용하여 장르 분류 성능을 측정하였고, 제안 방법이 기존 방법보다 각 장르에 대하여 우수한 성능을 제공하는 것을 확인하였다. 특히 제안 방법은 기존 방법에서 나타나는 music과 effect 사이를 잘못 분류하는 문제점을 감소시킨다.

음질 및 속도 향상을 위한 선형 스펙트로그램 활용 Text-to-speech (Text-to-speech with linear spectrogram prediction for quality and speed improvement)

  • 윤혜빈
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.71-78
    • /
    • 2021
  • 인공신경망에 기반한 대부분의 음성 합성 모델은 고음질의 자연스러운 발화를 생성하기 위해 보코더 모델을 사용한다. 보코더 모델은 멜 스펙트로그램 예측 모델과 결합하여 멜 스펙트로그램을 음성으로 변환한다. 그러나 보코더 모델을 사용할 경우에는 많은 양의 컴퓨터 메모리와 훈련 시간이 필요하며, GPU가 제공되지 않는 실제 서비스 환경에서 음성 합성이 오래 걸린다는 단점이 있다. 기존의 선형 스펙트로그램 예측 모델에서는 보코더 모델을 사용하지 않으므로 이 문제가 발생하지 않지만, 대신에 고품질의 음성을 생성하지 못한다. 본 논문은 뉴럴넷 기반 보코더를 사용하지 않으면서도 양질의 음성을 생성하는 Tacotron 2 & Transformer 기반의 선형 스펙트로그램 예측 모델을 제시한다. 본 모델의 성능과 속도 측정 실험을 진행한 결과, 보코더 기반 모델에 비해 성능과 속도 면에서 조금 더 우세한 점을 보였으며, 따라서 고품질의 음성을 빠른 속도로 생성하는 음성 합성 모델 연구의 발판 역할을 할 것으로 기대한다.

스펙트로그램 이미지를 이용한 CNN 기반 자동화 기계 고장 진단 기법 (CNN-based Automatic Machine Fault Diagnosis Method Using Spectrogram Images)

  • 강경원;이경민
    • 융합신호처리학회논문지
    • /
    • 제21권3호
    • /
    • pp.121-126
    • /
    • 2020
  • 소리 기반 기계 고장 진단은 기계의 음향 방출 신호에서 비정상적인 소리를 자동으로 감지하는 것이다. 수학적 모델을 사용하는 기존의 방법은 기계 시스템의 복잡성과 잡음과 같은 비선형 요인이 존재하기 때문에 기계 고장 진단이 어려웠다. 따라서 기계 고장 진단의 문제를 딥러닝 기반 이미지 분류 문제로 해결하고자 한다. 본 논문에서 스펙트로그램 이미지를 이용한 CNN 기반 자동화 기계 고장 진단 기법을 제안한다. 제안한 방법은 기계의 결함 시 발생하는 주파수상의 특징 벡터를 효과적으로 추출하기 위해 STFT를 사용하였으며, STFT에 의해 검출된 특징 벡터들은 스펙트로그램 이미지로 변환하여 CNN을 이용해 기계의 상태별로 분류한다. 그 결과는 제안한 방법은 효과적으로 결함을 탐지할 뿐만 아니라 소리 기반의 다양한 자동 진단 시스템에도 효과적으로 활용될 수 있다.