• 제목/요약/키워드: 스펙트로그램

검색결과 136건 처리시간 0.035초

Analyzing performance of time series classification using STFT and time series imaging algorithms

  • Sung-Kyu Hong;Sang-Chul Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.1-11
    • /
    • 2023
  • 본 논문은 순환 신경망 대신 합성곱 신경망을 사용하여 시계열 데이터 분류 성능을 분석한다. TSC(Time Series Community)에는 GAF(Gramian Angular Field), MTF(Markov Transition Field), RP(Recurrence Plot)와 같은 전통적인 시계열 데이터 이미지화 알고리즘들이 있다. 실험은 이미지화 알고리즘들에 필요한 하이퍼 파라미터들을 조정하면서 합성곱 신경망의 성능을 평가하는 방식으로 진행된다. UCR 아카이브의 GunPoint 데이터셋을 기준으로 성능을 평가했을 때, 본 논문에서 제안하는 STFT(Short Time Fourier Transform) 알고리즘이 최적화된 하이퍼 파라미터를 찾은 경우, 기존의 알고리즘들 대비 정확도가 높고, 동적으로 feature map 이미지의 크기도 조절가능하다는 장점이 있다. GAF 또한 98~99%의 높은 정확도를 보이지만, feature map 이미지의 크기를 동적으로 조절할 수 없어 크다는 단점이 존재한다.

사전 학습된 딥러닝 모델의 Mel-Spectrogram 기반 기침 탐지를 위한 Attention 기법에 따른 성능 분석 (Attention Modules for Improving Cough Detection Performance based on Mel-Spectrogram)

  • 박창준;김인기;김범준;전영훈;곽정환
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.43-46
    • /
    • 2023
  • 호흡기 관련 전염병의 주된 증상인 기침은 공기 중에 감염된 병원균을 퍼트리며 비감염자가 해당 병원균에 노출된 경우 높은 확률로 해당 전염병에 감염될 위험이 있다. 또한 사람들이 많이 모이는 공공장소 및 실내 공간에서의 기침 탐지 및 조치는 전염병의 대규모 유행을 예방할 수 있는 효율적인 방법이다. 따라서 본 논문에서는 탐지해야 하는 기침 소리 및 일상생활 속 발생할 수 있는 기침과 유사한 배경 소리 들을 Mel-Spectrogram으로 변환한 후 시각화된 특징을 CNN 모델에 학습시켜 기침 탐지를 진행하며, 일반적으로 사용되는 사전 학습된 CNN 모델에 제안된 Attention 모듈의 적용이 기침 탐지 성능 향상에 도움이 됨을 입증하였다.

  • PDF

지면 반사효과를 이용한 비행 궤적 추정에 대한 실험적 연구와 스펙트로그램 및 캡스트로그램 방법 비교 (Experimental Study on Estimation of Flight Trajectory Using Ground Reflection and Comparison of Spectrogram and Cepstrogram Methods)

  • 정욱진;고영주;이재형;최종수
    • 한국군사과학기술학회지
    • /
    • 제18권2호
    • /
    • pp.115-124
    • /
    • 2015
  • A methodology is proposed to estimate a trajectory of a flying target and its velocity using the time and frequency analysis of the acoustic signal. The measurement of sound emitted from a flying acoustic source with a microphone above a ground shall receive both direct and ground-reflected sound waves. For certain frequency contents, the destructive interference happens in received signal waveform reflected path lengths are in multiple integers of direct path length. This phenomenon is referred to as the acoustical mirror effect and it can be observed in a spectrogram plot. The spectrogram of acoustic measurement for a flying vehicle measurement shows several orders of destructive interference curves. The first or second order of curve is used to find the best approximate path by using nonlinear least-square method. Simulated acoustic signal is generated for the condition of known geometric of a sensor and a source in flight. The estimation based on cepstrogram analysis provides more accurate estimate than spectrogram.

他話者의 勵起信號를 이용한 抑揚變換 (Intonatin Conversion using the Other Speaker's Excitation Signal)

  • 이기영;최창석;최갑석;이현수
    • 한국음향학회지
    • /
    • 제14권4호
    • /
    • pp.21-28
    • /
    • 1995
  • 본 논문에서는 원음성을 원하는 억양의 음성으로 변환시켜 주기 위한 기초연구로서 타화자의 여기신호를 이용한 억양변환방법을 제안하였다. 이방법에서는 타화자의 여기신호를 억양정보로 이용하였으며, 타화자의 성도스펙트럼과 DTW에 의해 정합되는 원신호의 성도스펙트럼를 추출하여 여기신호의 스펙트럼과 곱한 후 단시간푸리에 역변환해 줌으로써 억양변환된 음성을 합성하였다. 본 방법에 의해 억양변환된 합성음성을 평가하기 이하여 30명의 남성화자가 발성한 한국어 단모음과 문장음성을 대상으로 억양변환실험을 수행한 후 기본주파수의 궤적과 스펙트로그램 및 왜곡측정을 비교하고 MOS테스트를 실시한 결과 제안된 방법에 의해 임의의 음성을 타화자음성의 억양으로 변환시킬 수 있음을 확인하였다.

  • PDF

출산 후 새끼와의 분리에 따른 유우의 발성음 특성 (Characteristics of Dairy Cow's Vocalization in Postpartum Related with Calf Isolation)

  • 김민진;손승훈;임신재;장문백
    • Journal of Animal Science and Technology
    • /
    • 제52권1호
    • /
    • pp.51-56
    • /
    • 2010
  • 본 연구는 출산 직후 송아지와의 분리에 따른 어미소의 발성음특징을 파악하고자 출산 후 이틀 이내의 홀스타인 암소 16두를 대상으로 실시하였다. 어미소와 송아지 사이의 후각적, 청각적 접촉이 가능한 경우(실험군 1)와 전혀 접촉을 하지 못하게 격리한 경우(실험군 2)로 나누어 오전 1시부터 4시까지와 오후 1시부터 4시하루 6시간 동안 3일에 걸쳐 디지털 녹음기와 지향성 마이크를 이용하여 발성음을 녹음하여 분석하였다. 어미소의 발성음은 특징에 따라 4가지 유형으로 구분되었다. 발성음의 빈도 및 스펙트로그램과 스펙트럼은 유형별로 차이가 있었으며 발성음의 주파수, 강도 및 길이 역시 차이를 보였다. 또한 날짜의 경과에 따라 어미소의 발성음은 급격하게 감소하였다. 본 연구를 통해 어미소와 송아지의 분리 여부에 따라 어미소의 발성음에는 차이가 있는 것으로 나타났으며, 발성음은 어미소와 송아지 사이 유대관계의 형성에 영향을 미칠 수 있는 매우 중요한 요인으로 판단된다.

모돈의 인공수정 후 시기별 발성음의 특성 (Characteristics of Estrus-related Vocalizations of Sows after Artificial Insemination)

  • 임신재;김민진;이주영;김나라;강정훈
    • Journal of Animal Science and Technology
    • /
    • 제50권3호
    • /
    • pp.401-406
    • /
    • 2008
  • 본 연구는 모돈의 인공수정 후 시기별 발성음의 특성을 파악하기 위해 요크셔(Yorkshire)와 랜드레이스(Landrace)의 교잡종을 대상으로 2006년 9월부터 2007년 3월까지의 기간 동안 실시되었다. 모돈의 인공수정 상태에 따라 수정 당일, 수정 후 3일, 수정 후 50일로 구분하였고, 하루 3회 각각 1시간씩 디지털녹음기(MD Recorder, Marantz PMD650)와 마이크(RF Condesner MIC, MKH 416P48)를 이용하여 발성음을 수집한 후 분석하였다. 발성음의 스펙트로그램을 비교한 결과 수정 후 시기별 차이가 있는 것으로 나타났으며, 수정 후 시기별 발성음의 스펙트럼을 비교한 결과 역시 차이가 있었다. 또한 모돈 발성음의 주파수, 강도는 시기별로 유의한 차이를 보였으나 발성음의 길이는 큰 차이가 없었다. 모돈은 인공 수정 후 시기별로 발성음의 차이를 보였으며, 앞으로 더욱 깊이 있는 연구를 통해서 돼지의 신체적, 심리적 상태를 비롯한 동물복지의 지표로 이용이 가능 할 것으로 판단된다.

음향신호분석 기술을 적용한 한국가요의 시대별 선호도 분석 (An Analysis of Preference for Korean Pop Music By Applying Acoustic Signal Analysis Techniques)

  • 조동욱;김봉현
    • 정보처리학회논문지D
    • /
    • 제19D권3호
    • /
    • pp.211-220
    • /
    • 2012
  • 최근 들어 K-POP의 인기가 국내 뿐 아니라 외국에서도 선풍적인 인기를 모으고 있다. 이 이유는 한 곡에서 똑같은 멜로디의 반복이 70여번까지 행해지는 등 귀에 박힐 듯이 반복되는 후크송이라는데 특징이 있다. 여기에 군무 등 시각적 요소 등이 가미되면서 인기를 끌고 있다. 본 논문에서는 60년대부터 K-POP에 이르기까지 우리나라 가요의 시대별 선호이유를 음향 신호 분석기술을 적용하여 분석하는 방법을 제안하고자 한다. 이를 위해 각 시대별로 유행했던 여자 가수들의 가요를 중심으로 음향 신호 분석을 통해 한국가요의 선호도가 어찌 변해 왔는지를 규명하는 실험을 행하고자 한다. 음향신호분석 기술을 적용하여 실험을 행한 결과 한국가요의 선호도에 대한 과학적 규명 및 이를 시대별로 구분 짓는 작업이 가능했으며 기존에 한국 가요의 선호 이유에 대한 주관적, 통계적 자료를 음향 신호 분석의 정량적 잣대로 객관화, 수치화를 행할 수 있었다.

음성신호 분석에 의한 판소리의 음성학적 특징 연구 (A Study on the Acoustic Characteristics of the Pansori by Voice Signals Analysis)

  • 김현숙
    • 한국산학기술학회논문지
    • /
    • 제14권7호
    • /
    • pp.3218-3222
    • /
    • 2013
  • 판소리는 우리나라 전통 성악곡이며 소리, 대화, 몸짓이 어울린 종합 예술로 독창성과 우수성을 세계적으로 인정받은 세계무형유산이다. 특히, 판소리는 소리꾼의 해학적 표현과 청중의 참여도가 높은 점에서 예술적 가치가 있으며 모든 계층이 두루 즐기는 예술로서 사회적 통합의 기능을 담당한 것으로 평가되고 있다. 따라서 본 논문에서는 사회와 시대를 표현한 판소리의 음향학적 특징을 분석하기 위해 판소리 다섯 마당을 대상으로 음성신호 분석 기술을 적용한 상관성 추출 연구를 수행하였다. 이를 위해 판소리 다섯 마당에 대한 스펙트로그램, 피치, 안정도 및 강도 분석을 실험하였다. 실험 결과를 통해 판소리는 청중들에게 집중과 흥미를 지속적으로 유지시키면서 이야기를 풀어가는 특징을 잘 반영하기 위해 목소리의 파동 및 성대 떨림의 변화 폭이 크고 안정적이며 음성 에너지가 큰 소리로 표현하고 있는 것으로 분석되었다.

주목 메커니즘 기반의 심층신경망을 이용한 음성 감정인식 (Speech emotion recognition using attention mechanism-based deep neural networks)

  • 고상선;조혜승;김형국
    • 한국음향학회지
    • /
    • 제36권6호
    • /
    • pp.407-412
    • /
    • 2017
  • 본 논문에서는 주목 메커니즘 기반의 심층 신경망을 사용한 음성 감정인식 방법을 제안한다. 제안하는 방식은 CNN(Convolution Neural Networks), GRU(Gated Recurrent Unit), DNN(Deep Neural Networks)의 결합으로 이루어진 심층 신경망 구조와 주목 메커니즘으로 구성된다. 음성의 스펙트로그램에는 감정에 따른 특징적인 패턴이 포함되어 있으므로 제안하는 방식에서는 일반적인 CNN에서 컨벌루션 필터를 tuned Gabor 필터로 사용하는 GCNN(Gabor CNN)을 사용하여 패턴을 효과적으로 모델링한다. 또한 CNN과 FC(Fully-Connected)레이어 기반의 주목 메커니즘을 적용하여 추출된 특징의 맥락 정보를 고려한 주목 가중치를 구해 감정인식에 사용한다. 본 논문에서 제안하는 방식의 검증을 위해 6가지 감정에 대해 인식 실험을 진행하였다. 실험 결과, 제안한 방식이 음성 감정인식에서 기존의 방식보다 더 높은 성능을 보였다.

청각 장애인용 홈 모니터링 시스템을 위한 다채널 다중 스케일 신경망 기반의 사운드 이벤트 검출 (Sound event detection based on multi-channel multi-scale neural networks for home monitoring system used by the hard-of-hearing)

  • 이기용;김형국
    • 한국음향학회지
    • /
    • 제39권6호
    • /
    • pp.600-605
    • /
    • 2020
  • 본 논문에서는 청각 장애인을 위한 소리 감지 홈 모니터링을 위해 다채널 다중 스케일 신경망을 사용한 사운드 이벤트 검출 방식을 제안한다. 제안하는 시스템에서는 홈 내의 여러 무선 마이크 센서들로부터 높은 신호 품질을 갖는 두 개의 채널을 선택하고, 그 신호들로부터 도착신호 지연시간, 피치 범위, 그리고 다중 스케일 합성 곱 신경망을 로그멜 스펙트로그램에 적용하여 추출한 특징들을 양방향 게이트 순환 신경망 기반의 분류기에 적용함으로써 사운드 이벤트 검출의 성능을 더욱 향상시킨다. 검출된 사운드 이벤트 결과는 선택된 채널의 센서 위치와 함께 텍스트로 변환되어 청각 장애인에게 제공된다. 실험결과는 제안한 시스템의 사운드 이벤트 검출 방식이 기존 방식보다 우수하며 청각 장애인에게 효과적으로 사운드 정보를 전달할 수 있음을 보인다.