• 제목/요약/키워드: spectral tilt

검색결과 29건 처리시간 0.027초

잡음 환경에서 음성인식을 위한 스펙트럼 기울기의 효과적인 보상 방법 (Efficient Compensation of Spectral Tilt for Speech Recognition in Noisy Environment)

  • 조정호
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.199-206
    • /
    • 2017
  • 환경 잡음은 음성인식 시스템의 성능을 떨어뜨릴 수 있다. 이 논문은 인식 시스템이 잡음에 강인하도록 만들기 위하여, 켑스트럼에 기초한 특징 보상을 수행하는 과정을 제시한다. 이 방법은 부가적인 잡음의 영향을 제거하기 위한 직접적인 스펙트럼 기울기 보상에 기초를 둔다. 잡음 보상 방법은 로그 전력 스펙트럼의 스펙트럼 기울기 계산에 의하여 캡스트럼 영역에서 동작한다. 스펙트럼 보상은 SNR에 의존하는 켑스트럼 평균 보상 방법과 함께 사용된다. 백색 가우스 잡음, 지하철 잡음 및 자동차 잡음에 있는 조건에서, 실험 결과는 제안한 보상 방법이 여러 SNR에서 인식률을 상당히 개선한다는 것을 보여준다.

한국어 자음군의 후행모음에 나타난 발성유형의 음향음성학적 연구 (An Acoustic Study of Phonation Types in Vowels Following Consonant Clusters in Korean)

  • 박한상
    • 대한음성학회지:말소리
    • /
    • 제64호
    • /
    • pp.53-76
    • /
    • 2007
  • This study investigates phonation types of Korean obstruents associated with the vowels immediately following singletons or geminates in intervocalic positions. F0, H1-H2, and spectral tilt were measured from the 20 ms segment at the onset of the vowels for the tokens of /paCa/ and /paCCa/, where Cs are of the same manner and place of articulation. The results showed a remarkable change in the values of F0, H1-H2, and spectral tilt as the preceding obstruents shifts from the lenis singletons to the lenis geminates, which suggests that the spectral characteristics of the vowels following the lenis geminates are not different from those of the vowels following fortis singletons or geminates. Significantly enough, this study adds data about the spectral characteristics of Korean phonation types.

  • PDF

모음 주파수 범위에 따른 성문전도 스펙트럼 기울기 (Electroglottographic Spectral Tilt in Frequency Ranges of Vowel Sound)

  • 김지혜;장애란;정동근
    • 센서학회지
    • /
    • 제24권4호
    • /
    • pp.247-251
    • /
    • 2015
  • In this study, electroglottographic spectral tilt (EST) was investigated for characterization of vocal cords vibration. EST was analyzed from the power spectrum of electroglottographic signals by dividing frequency analysis range as full range (0~4 octave), low range (0~2 octave), and high range (2~4 octave). EST of all ranges in female were greater than those in male. In female and male groups, EST of high range was higher than that of low range. This result suggests that EST has at least two components and dividing frequency range in analysis of EST is effective for investigating characteristics of vocal cords vibration.

FIR 필터링과 스펙트럼 기울이기가 MFCC를 사용하는 음성인식에 미치는 효과 (The Effect of FIR Filtering and Spectral Tilt on Speech Recognition with MFCC)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제5권4호
    • /
    • pp.363-371
    • /
    • 2010
  • 특징벡터의 분류를 개선시켜 화자독립 음성인식의 오류율을 줄이려는 노력의 일환으로서, 우리는 MFCC의 추출에 있어서 푸리에 스펙트럼을 기울이는 방법이 미치는 효과를 연구한다. 음성신호에 FIR 필터링을 적용하는 효과의 조사도 병행된다. 제안된 방법은 두 가지 독립적인 방법에 의해 평가된다. 즉, 피셔의 차별함수에 의한 방법과 은닉 마코브 모델 및 퍼지 벡터양자화를 사용한 음성인식 오류율 조사 방법이다. 실험 결과, 적절한 파라미터의 선택에 의해 기존의 방법에 비해 10% 정도 낮은 인식 오류율이 얻어짐을 확인하였다.

발성유형지수 k (Phonation Type Index k)

  • 박한상
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2002년도 11월 학술대회지
    • /
    • pp.77-80
    • /
    • 2002
  • This study proposes phonation type index k as a descriptor of the overall spectral tilt, which is free from the effects of fundamental frequency and vowel quality. The newly proposed phonation type index k presents a simple and single measure of the overall spectral tilt. Phonation type index k can be applied to speech technology. It can also be used in diagnosing patients voice qualities in speech pathology. The distribution of phonation type index k, which is speaker-dependent, may be useful in forensic phonetics and voice recognition as an indicator of speaker identity.

  • PDF

잡음에 강인한 음성인식을 위한 스펙트럼 보상 방법 (A Spectral Compensation Method for Noise Robust Speech Recognition)

  • 조정호
    • 전자공학회논문지 IE
    • /
    • 제49권2호
    • /
    • pp.9-17
    • /
    • 2012
  • 음성 인식 시스템의 용용에서 실제 문제점의 하나는 음성신호의 왜곡에 의한 인식성능의 저하이다. 음성신호의 왜곡에 가장 중요한 원인은 부가적인 잡음이다. 이 논문은 잡음에 강인한 음성인식을 위하여, 스펙트럼 피크 향상 기법과 효과적인 잡음 차감 기법에 기초한 스펙트럼 보상 방법을 기술한다. 제안한 방법은 음성 스펙트럼의 포먼트 구조를 향상시키고 스펙트럼 기울기를 보상하면서도 광 대역폭 스펙트럼 요소는 그대로 유지한다. 백색 가우스 잡음, 자동차 잡음, 음성 잡음 또는 지하철 잡음에 의해 왜곡된 음성을 이용한 인식실험을 수행한 결과, 새로운 방법은 스펙트럼 보상을 하지 않은 경우에 비해, 높은 SNR(Signal to Noise Ratio) 환경에서는 평균 오인식율을 약간 줄였으며, 낮은 SNR(10 dB) 환경에서는 평균 오인식율을 1/2로 크게 줄였다.

Glottal Parameters Contributing to the Perception of Loud Voices

  • Yi, So-Pae;Lee, One-Good;Kim, Hyung-Soon
    • 음성과학
    • /
    • 제8권1호
    • /
    • pp.143-157
    • /
    • 2001
  • This paper focused on glottal parameters contributing to the perception of loud voices because energy of a voice is not the only effective factor. We used a formant synthesizer to synthesize loud voices. We divided F0 tilt (the tilt of F0 contour), SQ (Speed Quotient), OQ (Open Quotient) and TL (spectral Tilt Level) into three levels to get different combinations with default values for the other synthesizer parameters. Analysis of listening tests indicated that F0 tilt, SQ, OQ and TL in descending order had significant influence on the perception of loud voices. F0 tilt had a far more significant effect than the others. The influence of SQ increased greatly with the exclusion of F0 tilt as a factor. The interaction between parameters was not significant.

  • PDF

뇌 손상 환자(Cerebral palsy)의 Head up Tilt 상태에서의 심박변동과 자율 신경 활동 평가 (Assessment of autonomic function in Cerebral palsy patients during graded head-up tilt)

  • 최종주;조성래;이정환;이명호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2002년도 하계학술대회 논문집 D
    • /
    • pp.2693-2695
    • /
    • 2002
  • In this paper, the power spectral analysis of heart rate variability(HRV) was performed to evaluate effects of orthostatic stress with head-up tilt on autonomic nervous system(ANS) for 20 healthy male subjects(age : 245 yr.) and a new method was proposed to assess the autonomic balance. The ECG signals wore recorded for 3 minutes in both the supine and 70 head-up tilt positions, and then the HRV signals underwent power spectrum analysis at each position. The results of this study suggest that cardiac autonomic functions, such as sympathetic tone in autonomic balance with the increment of sympathetic tone and the decrement of parasympathetic tone which occur during head-up tilt position, arc not sufficient to overcome tile orthostatic stress arising in Cerebral Palsy.

  • PDF

음성감정인식에서 음색 특성 및 영향 분석 (Analysis of Voice Quality Features and Their Contribution to Emotion Recognition)

  • 이정인;최정윤;강홍구
    • 방송공학회논문지
    • /
    • 제18권5호
    • /
    • pp.771-774
    • /
    • 2013
  • 본 연구는 감정상태와 음색특성의 관계를 확인하고, 추가로 cepstral 피쳐와 조합하여 감정인식을 진행하였다. Open quotient, harmonic-to-noise ratio, spectral tilt, spectral sharpness를 포함하는 특징들을 음색검출을 위해 적용하였고, 일반적으로 사용되는 피치와 에너지를 기반한 운율피쳐를 적용하였다. ANOVA분석을 통해 각 특징벡터의 유효성을 살펴보고, sequential forward selection 방법을 적용하여 최종 감정인식 성능을 분석하였다. 결과적으로, 제안된 피쳐들으로부터 성능이 향상되는 것을 확인하였고, 특히 화남과 기쁨에 대하여 에러가 줄어드는 것을 확인하였다. 또한 음색관련 피쳐들이 cepstral 피쳐와 결합할 경우 역시 인식 성능이 향상되었다.

한국어 발성 유형의 음향음성학적 연구 (An Acoustic Study of Korean Phonation Types)

  • 박한상
    • 한국음향학회지
    • /
    • 제24권6호
    • /
    • pp.343-352
    • /
    • 2005
  • 발성유형지수 k (PTI k)는 F0와 모음 음가의 영향을 배제한, 단순하고 단일화된 스펙트럼 기울기의 척도다. 본 논문은 한국인 20대 남성화자 10명으로부터 얻은 모음 /이, 에, 아, 오, 우/에 나타난 PTI k를 연구한다. 환경, 발성유형, 모음, 그리고 화자를 요인으로 하여 각 집단간에 PTI k의 값에 유의미한 차이가 있는지 알아본다. 연구 결과 환경, 발성유형, 모음, 그리고 화자 각각에 집단간에 유의미한 차이가 있었다.