• 제목/요약/키워드: Spectrogram Analysis

검색결과 91건 처리시간 0.026초

SASW시험에 의한 위상속도 결정을 위한 임펄스 응답필터 기법 (Impulse Response Filtration Technique for the Determination of Phase Velocities from SASW Measurements)

  • 조성호
    • 한국지반공학회지:지반
    • /
    • 제13권1호
    • /
    • pp.111-122
    • /
    • 1997
  • 표면파를 이용하여 지반의 강성을 추정하는 기법인 SASW 시험에서 위상속도(phase volocity)를 결정하기 위해서는 위상각(phase angle)의 전개(unwrapping)가 필수적이다. 포장 구조에서처럼 깊이에 따라 강성의 차이가 현저한 경우는 기존의 위상각 전개방식으조는 정확한 위상속도를 결정하기가 용이하지 않다. 이는 기존의 위상각 전개방식은 주위상각(principal phase angle)에 2n의 정수배를 더하는 것인데, 위상각 스펙트럼(phase spectrum)에서 정수배를 결정하는 데에 어려움이 있기 때문이다. 본 연구에서는 이러한 문제점을 해결하기 위해서, 임펄스 응답 필터 기법(Impulse Response Filtration Technique), 또는 IRF기법이라고 하는 새로운 위상각 분석 기법을 제안하였다. IRF 기법의 원리는 임펄스 응답을 필터 처리함으로써 파군(wave group)을 분리하는 것인데,파군의 분리는 임펄스 응답에 대한 Gabor spectrogram을 분석한 정보를 근거로 한다. Gabor spectrogram은 전파되는 파의 에너지를 주파수-시간 공간에서 나타내는 contour 그림으로서, 파군의 전파 상황을 시각적으로 표현하는 수단이다. 이렇게 필터 처리된 임펄스 응답을 이용하면, 위상각 스펙트럼의 분석을 정확하게 할 수 있으며, 위상각의 전개에 있어서 난해함을 제거할 수 있다. 끝으로, 전쳔적인 포장 구조에 대하여 이론적으로 SASW 시험을 모사하였으며, 그 결과를 이용하여 IRF기법의 효용성을 입증하였다.

  • PDF

고등어(Scomber japonicus), 불볼락(Sebastes thompsoni) 및 쥐노래미(Hexagrammos otakii)에 의한 광대역 음향산란신호의 시간-주파수 분석 (Time-Frequency Analysis of Broadband Acoustic Scattering from Chub Mackerel Scomber japonicus, Goldeye Rockfish Sebastes thompsoni, and Fat Greenling Hexagrammos otakii)

  • 이대재
    • 한국수산과학회지
    • /
    • 제48권2호
    • /
    • pp.221-232
    • /
    • 2015
  • Broadband echoes measured in live chub mackerel Scomber japonicus, goldeye rockfish Sebastes thompsoni, and fat greenling Hexagrammos otakii with different morphologies and internal characteristics were analyzed in time and frequency domains to understand the species-specific echo feature characteristics for classifying fish species. The mean echo image for each time-frequency representation dataset obtained as a function of orientation angle was extracted to mitigate the effect of fish orientation on acoustic scattering. The joint time-frequency content of the broadband echo signals was obtained using the smoothed pseudo-Wigner-Ville distribution (SPWVD). The SPWVDs were analyzed for each echo signature of the three fish species. The results show that the time-frequency analysis provided species-specific echo structure patterns and metrics of the broadband acoustic signals to facilitate fish species classification.

Sample selection approach using moving window for acoustic analysis of pathological sustained vowels according to signal typing

  • 이지연
    • 말소리와 음성과학
    • /
    • 제3권3호
    • /
    • pp.99-108
    • /
    • 2011
  • The perturbation parameters like jitter, shimmer, and signal-to-noise ratio (SNR) are largely estimated in the particular segment from the subjective or whole portion of the given pathological voice signal although there are many possible regions to be able to analyze the voice signals. In this paper, the pathological voice signals were classified as type 1, 2, 3, or 4 according to narrow band spectrogram and the value differences of the perturbation parameters extracted in the subjective and entire portion tended to be getting bigger as from type 1 to type 4 signals. Therefore, sample selection method based on moving window to analyze type 2 and 3 signals as well as type 1 signals is proposed. Although type 3 signals cannot be analyzed using the perturbation analysis, the type 3 signals by selecting out the samples in which error count is less than 10 through moving window were analyzed. At present, there is no method to be able to analyze the type 4 signals. Future research will endeavor to determine the best way to evaluate such voices.

  • PDF

레이저 용접 모니터링에 적합한 디지털 필터와 웨이블렛 변환 방법에 관한 연구 (A Study on the Digital Filter and Wavelet Transform of Monitoring for Laser Welding)

  • 김도형;신호준;유영태
    • 한국정밀공학회지
    • /
    • 제30권1호
    • /
    • pp.67-76
    • /
    • 2013
  • We present an innovative real-time laser welding monitoring technique employing the correlation analysis of the plasma plume optical emission generated during the process. The plasma optical radiation emitted during Nd:YAG laser welding of S45C steel samples has detected with a Photodiode and analyzed under different process conditions. The discrete DC voltage difference, filter methods and wavelet transform has been used to decompose the optical signal into various discrete series of sequences over different frequency bands. Considering that wavelet analysis can decompose the optical signals, extract the characteristic information of the signals and define the defects location accurately, it can be used to implement process-control of laser welding.

영어강세음절의 외국인어투에 관한 연구 (A Study on the Foreign Accent of English Stressed Syllables)

  • 박희석
    • 중소기업융합학회논문지
    • /
    • 제6권4호
    • /
    • pp.51-57
    • /
    • 2016
  • 본 연구는 강세음절이 있는 8개의 단어를 선정하여 원어민과 한국 대학생들 사이의 모음발음 길이를 스펙트로그램을 이용하여 측정한 후에 비교분석한 실험적 연구이다. 이 실험을 위하여 20명의 한국인 피 실험자들이 8개의 단어들이 들어있는 문장들을 발화하고 녹음하였으며, 음향적 특질들은 Praat 소프트웨어 프로그램을 이용하여 측정하였으며 그 결과를 통계분석 하였다. 분석결과, 8개의 강세모음에서 두 집단 간 차이가 있었으며, 7개의 강세모음에서는 그 차이가 유의미하였다. 두 실험집단 간 실험결과를 보면, 제1음절에 강세가 있는 모음들은 모두 집단 간 유의미한 차이를 보여주었다. 그 중에서 wonderful과 glasses의 강세음절에서는 유의미성이 크게 나타나고 있었는데, 특히 영어저모음 /${\ae}$/의 발음에서는 원어민이 한국인집단보다 훨씬 큰 길이로 발음하는 것을 알 수 있었다. 이러한 실험결과는 영어교육현장에서 외국인어투의 개선을 위한 수업자료로 활용할 수 있으리라 판단된다.

예방진단기술을 이용한 지능형 GIS 감시시스템에 관한 연구 (A Study on a Intelligent GIS Monitoring System using the Preventive Diagnostic Technology)

  • 박기영;이종하;조숙진;최형기;정의붕
    • 전자공학회논문지
    • /
    • 제51권6호
    • /
    • pp.244-251
    • /
    • 2014
  • 본 논문에서, 가스절연개폐장치(GIS)의 정상상태와 비정상상태에 대해 예방진단기술을 이용하여 자세하게 서술하였다. 이 기술은 지능형 GIS 감시시스템에 의해 저장된 GIS의 데이터의 분석과 진단에 근거한다. GIS음의 파형은 방전과 자체내의 코로나 방전음에 의해 발생되는 것으로 잡음과 비슷하다. 그러므로, 본 논문에서, GIS음의 정상 상태와 비정상 상태로 분류하는데, 정상과 비정상 상태를 레벨교차율(LCR)과 스펙트로그램 에너지비율로 이용하여 구분하였다.

음소 음향학적 변화 정보를 이용한 한국어 음성신호의 자동 음소 분할 (Automatic Phonetic Segmentation of Korean Speech Signal Using Phonetic-acoustic Transition Information)

  • 박창목;왕지남
    • 한국음향학회지
    • /
    • 제20권8호
    • /
    • pp.24-30
    • /
    • 2001
  • 본 논문에서는 발음표기가 주어진 상황에서 음성 신호의 자동 음소 분할에 관한 것이며 음소의 경계를 음소 음향학적인 변화특성에 따라 3가지 형태로 분류하여 각각에 적합한 분할 알고리즘을 개발하였다. 형태 1은 묵음·유성음·무성음간의 분할이며 히스토그램분석으로 구한 문턱 값으로 초기 분할 후, 웨이블릿 계수의 SVF (Spectral Variation Function)를 이용하여 분할하였다. 형태 2는 연속적인 모음의 분할이며 각 모음변화특성을 템플릿으로 구성하여 분할에 활용하였다. 형태 3은 모음과 유성자음 혹은 유성화 자음의 분할이며 특성주파수대역의 진폭변화를 이용하여 후보구간을 정한 후, 캡스트럼 계수의 SVF를 이용하여 최종적인 분할을 수행하였다. 본 실험에서는 분할 성능을 테스트하기 위하여 한국어 PBWSpeech DB에서 342개의 단어를 자동으로 분할한 후, 수작업으로 분할한 결과와 비교하였다. 전체적인 자동 분할 성능은 20 msec내에서 81.5%의 분할성능을 보였다.

  • PDF

합성곱 신경망과 장단기 메모리를 이용한 사격음 분석 기법 (Shooting sound analysis using convolutional neural networks and long short-term memory)

  • 강세혁;조지웅
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.312-318
    • /
    • 2022
  • 본 논문은 딥러닝기법 중 하나인 합성곱 신경망과 순환 신경망 중 하나인 장단기 메모리를 이용하여 사격시 발생하는 소음(이하 사격음)만으로 화기의 종류, 사격음 발생지점에 관한 정보(거리와 방향)을 추정하는 모델을 다루었다. 이를 위해 미국 법무부 산하 연구소의 지원하에 생성된 Gunshot Audio Forensic Dataset을 이용하였으며, 음향신호를 멜 스펙트로그램(Mel-Spectrogram)으로 변환한 후, 4종의 합성곱 신경망과 1종의 장단기 메모리 레이어로 구성된 딥러닝 모델에 학습 및 검증 데이터로 제공하였다. 제안 모델의 성능을 확인하기 위해 합성곱 신경망으로만 구성된 대조 모델과 비교·분석하였으며, 제안 모델의 정확도가 90 % 이상으로 대조모델보다 우수한 성능을 보였다.

스마트폰 음성 녹음 파일 위변조 검출을 위한 스펙트로그램 분석의 한계점 (Limitations of Spectrogram Analysis for Smartphone Voice Recording File Forgery Detection)

  • 한상민;손영민;박재완
    • 문화기술의 융합
    • /
    • 제9권2호
    • /
    • pp.545-551
    • /
    • 2023
  • 오늘날 누구나 디지털 정보를 용이하게 활용할 수 있게 됨에 따라 디지털 증거의 채택이 증가되고 있다. 하지만 다양한 음성 파일 편집 도구를 보급과 함께 정교한 편집 과정을 거친 음성 녹음 파일의 경우 위변조 진위 여부를 판단하는 것은 사실상 불가능하다. 본 연구는 음성 녹음 파일에 삽입, 삭제, 연결 및 합성 편집 기술을 활용해 원본 파일과 구별하기 어려운 위변조가 가능함을 증명하고자 한다. 본 연구는 위변조 된 음성 파일을 원본과 동일한 확장자로 인코딩하는 작업을 통해 위변조 검출의 어려움을 제시한다. 또한 특징점이 발생한 실험에 한 하여 추가적으로 천이대역의 삭제 및 2차 인코딩 작업을 수행할 경우 위변조 검출은 불가능함을 나타냈다. 이를 통해 본 연구는 음성 녹음 파일을 디지털 증거로 채택하기 위한 더 엄격한 증거능력 판단 기준 수립에 공헌할 것으로 기대된다.

Speech Denoising via Low-Rank and Sparse Matrix Decomposition

  • Huang, Jianjun;Zhang, Xiongwei;Zhang, Yafei;Zou, Xia;Zeng, Li
    • ETRI Journal
    • /
    • 제36권1호
    • /
    • pp.167-170
    • /
    • 2014
  • In this letter, we propose an unsupervised framework for speech noise reduction based on the recent development of low-rank and sparse matrix decomposition. The proposed framework directly separates the speech signal from noisy speech by decomposing the noisy speech spectrogram into three submatrices: the noise structure matrix, the clean speech structure matrix, and the residual noise matrix. Evaluations on the Noisex-92 dataset show that the proposed method achieves a signal-to-distortion ratio approximately 2.48 dB and 3.23 dB higher than that of the robust principal component analysis method and the non-negative matrix factorization method, respectively, when the input SNR is -5 dB.