• Title/Summary/Keyword: 음성변화

Search Result 1,374, Processing Time 0.03 seconds

The Evaluation of Changes Of Acoustic Parameters With Aging by the Multi-Dimensional Acoustic Analysis (다차원음향분석을 이용한 연령변화에 따른 음향지표의 변화)

  • 김형태;김민식;조승호
    • Proceedings of the KSLP Conference
    • /
    • 1996.11a
    • /
    • pp.77-77
    • /
    • 1996
  • 성대구조는 연령변화에 따라 조직학적인 변화가 일어나게 된다. 이에 따른 음성의 노화현상을 알아보고자 Multi-Dimensional Voice Program(Model 4305, Kay Elemetrics Corp, USA)을 이용하여 모든 연령층에서 정상적인 목소리와 성대에 병변이 없는 300명(남자141명, 여자159명)을 대상으로 다차원음향분석 지표의 연령변화에 따른 양적변화를 측정하여 연령에 따른 음향분석지표의 정상기준치와 음성지표의 연령별 변화를 밝혀내려 하였다. (중략)

  • PDF

Emotion Recognition using Robust Speech Recognition System (강인한 음성 인식 시스템을 사용한 감정 인식)

  • Kim, Weon-Goo
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.18 no.5
    • /
    • pp.586-591
    • /
    • 2008
  • This paper studied the emotion recognition system combined with robust speech recognition system in order to improve the performance of emotion recognition system. For this purpose, the effect of emotional variation on the speech recognition system and robust feature parameters of speech recognition system were studied using speech database containing various emotions. Final emotion recognition is processed using the input utterance and its emotional model according to the result of speech recognition. In the experiment, robust speech recognition system is HMM based speaker independent word recognizer using RASTA mel-cepstral coefficient and its derivatives and cepstral mean subtraction(CMS) as a signal bias removal. Experimental results showed that emotion recognizer combined with speech recognition system showed better performance than emotion recognizer alone.

Effects of Aging and Smoking on Acoustic Characteristics of Voice (노화와 흡연에 따른 음성 변화의 측정)

  • 남의철;남순열;이광선
    • Proceedings of the KSLP Conference
    • /
    • 1996.11a
    • /
    • pp.75-75
    • /
    • 1996
  • 노화와 흡연에 따른 음성의 변화에 대하여 객관적인 음향 지표들을 측정함으로써, 노화와 흡연에 따른 정상적인 음성의 변화와 질병에 기인한 변화를 감별하는 지표를 제시하고자 본 연구를 시행하였다. 정상의 발성기관과 청력을 가진 20세 이상의 성인으로, 60세 이상군과 35세 이하군으로 남녀 각각 30명을 대상으로 CSL50-MDVP(Computerized Speech Lab50-Multidimensional voice program)을 이용하여 기본 주파수(Fundamental frequency), jitter, shimmer, NHR(Noise to harmonic ratio)을 측정하였다. (중략)

  • PDF

A Study on Weighted Spectral Subtraction Using Adaptive Threshold In Car Noise Environment (차량내 잡음 환경에서 적응적 경계값을 이용한 가중치 주파수 차감에 관한 연구)

  • 전선도
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.185-188
    • /
    • 1998
  • 실제의 음성 인식 및 음성 통신 등의 음성 처리 시스템에서는 음성 신호를 손상시키는 배경 잡음 신호의 존재로 그 성능이 많이 저하된다. 특히 차량 내와 같은 잡음이 극심한 상황에서는 전처리 부분에서 이러한 잡음을 제거시켜 주어야한다. 본 연구는 자동차 내의 배경 잡음에 의해 손상된 음성에서 배경 잡음을 주파수 차감에 의하여 제거시킨다. 특히 음성 정보의 손실이 적은 잡음 추정 방법으로 가중치를 이용하여 잡음을 추정하는 가중치 주파수 차감법을 이용하였다. 이러한 가중치 주파수 차감법 사용의 전제 조건은 잡음의 변화가 완만한 경우에 적당하다. 그러나 실제적인 상황에서 배경잡음신호의 변화가 큰 경우가 존재한다. 이러한 이유에서 본 연구는 잡은 추정시 잡음 추정값을 이용하여 추정 잡음 경계값을 적응적으로 변화하는 차감법을 제안한다. 이러한 방법은 추정된 잡음 신호의 변화율을 이용하여 경계값을 상황에 따라 적응적으로 변화시키는 방법이다. 모의 실험에 의하여 고정적인 경계값을 갖는 가중치 주파수 차감법에 비해 제안한 적응적 경계값을 갖는 가중치 주파수 차감법의 출력 SNR이 증가함을 확인하였고, 음성 인식 시스템에 정용한 인식 실험에서도 성능이 향상됨을 확인하였다.

  • PDF

Speech and Music Discrimination Using Spectral Transition Rate (주파수 변화율을 이용한 음성과 음악의 구분)

  • Yang, Kyong-Chul;Bang, Yong-Chan;Cho, Sun-Ho;Yook, Dong-Suk
    • The Journal of the Acoustical Society of Korea
    • /
    • v.28 no.3
    • /
    • pp.273-278
    • /
    • 2009
  • In this paper, we propose the spectral transition rate (STR) as a novel feature for speech and music discrimination (SMD). We observed that the spectral peaks of speech signal are gradually changing due to coarticulation effect. However, the sound of musical instruments in general tends to keep the peak frequencies and energies unchanged for relatively long period of time compared to speech. The STR of speech is much higher than that of music. The experimental results show that the STR based SMD method outperforms a conventional method. Especially, the STR based SMD gives relatively fast output without any performance degradation.

Robust Speech Recognition Parameters for Emotional Variation (감정 변화에 강인한 음성 인식 파라메터)

  • Kim Weon-Goo
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.15 no.6
    • /
    • pp.655-660
    • /
    • 2005
  • This paper studied the feature parameters less affected by the emotional variation for the development of the robust speech recognition technologies. For this purpose, the effect of emotional variation on the speech recognition system and robust feature parameters of speech recognition system were studied using speech database containing various emotions. In this study, LPC cepstral coefficient, met-cepstral coefficient, root-cepstral coefficient, PLP coefficient, RASTA met-cepstral coefficient were used as a feature parameters. And CMS and SBR method were used as a signal bias removal techniques. Experimental results showed that the HMM based speaker independent word recognizer using RASTA met-cepstral coefficient :md its derivatives and CMS as a signal bias removal showed the best performance of $7.05\%$ word error rate. This corresponds to about a $52\%$ word error reduction as compare to the performance of baseline system using met - cepstral coefficient.

Analysis of Speech Signals According to the Various Emotional Contents (정서정보의 변화에 따른 음성신호의 특성분석에 관한 연구)

  • Jo, Cheol-Woo;Jo, Eun-Kyung;Min, Kyung-Hwan
    • The Journal of the Acoustical Society of Korea
    • /
    • v.16 no.3
    • /
    • pp.33-37
    • /
    • 1997
  • This paper describes experimental results from emotional speech materials, which is analysed by various signal processing methods. Speech materials with emotional informations are collected from actors. Analysis is focused to the variations of pitch informations and durations. From the analysed results we can observe the characteristics of emotional speech. The materials from this experiment provides valuable resources for analysing emotional speech.

  • PDF

Acoustics of Young People's In Busan : Developmental Changes of Spectral Parameters (부산 지역 청소년 음성의 연령별 특징 변화 분석)

  • Back Sung-Kwan;Ro Yong-Ju;Yoon Jong-Rak
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.49-52
    • /
    • 2001
  • 부산지역 청소년 음성의 지속시간, 피치주파수 포만트 주파수 특성을 연령별, 성별로 분석하였다. 실제 발음 환경에서의 음성 패턴은 발성화자 개인 및 화자별로 다양하게 변화한다. 이를 모델 화하기 위해서는 다량의 음성 데이터로부터 통계적 방법에 의한 변화 요인별 파라미터 분석이 선행되어야 할 것이다. 실험에 사용된 데이터는 부산지역에 거주하는 청소년(초등학생, 중학생, 고등학생)들이 연령별로 3회 발성한 우화의 일부와 단모음(/아/,/이/,/우/,/에/,/오/)이다 실험 결과로부터 얻어진 지속시간, 주파수 특성 변화 패턴을 연령별, 성별로 구분하여 통계적으로 분석한 뒤 이를 정량화 하였다. 실험 결과로부터 부산 지역 청소년 음성의 지속시간, 주파수 특성은 예측된 바와 같이 기 연구된 성인 음성과 많은 차이를 보였으며 이는 부산 지역 방언의 DB 구축 시 설계자가 고려해야 할 기초자료로 활용 될 수 있을 것이다.

  • PDF

Speech Recognition based on Variable Information Rate Model (가변 정보율 모델을 이용한 음성인식)

  • 김남수
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.171-174
    • /
    • 1995
  • 기존의 음성인식에서는 음성의 모든 구간의 정보적 중요도를 같게 두는 고정정보율 처리가 일반적이다. 고정 정보율 처리는 변화가 작은 장 구간을 변화가 큰 단 구간보다 중시하는 경향이 있기 때문에, 음성인식에는 부적절한 요소를 내포하고 있다. 본 논문에서는, 가변 정보율 모델을 제시하여, 음성인식 시, 가변정보율 처리를 수용하게 하였다. 음성의 각 구간마다 정보율 파라메타를 두어, 확률값 계산에 그 구간의 중요도를 반영하였다. 또한 maximum mutual information을 이용하여 정보율 파라메타를 학습시키는 방법을 제안하였다. 화자독립 연속어 인식 실험을 통하여, 가변정보율 모델을 이용한 방법이 기존의 고정 정보율 방법보다 우수한 인식 성능을 보임을 확인할 수 있었다.

  • PDF

A Study on Context Environment and Model State for Robustness Acoustic Models (강건한 음향모델을 위한 모델의 상태와 문맥환경에 관한 연구)

  • 최재영;오세진;황도삼
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2003.05b
    • /
    • pp.366-369
    • /
    • 2003
  • 본 연구에서는 강건한 문맥의존 음향모델을 작성하기 위한 기초적인 연구로서 문맥환경과 상태수의 변화에 따른 음향모델의 성능을 고찰하고자 한다. 음성은 시간함수로 표현되며 음절, 단어, 연속음성을 발성할때 자음과 모음에 따라 발성시간에 차이가 있으며 음성인식의 최소 인식단위로 널리 사용되는 음소의 앞과 뒤에 오는 문맥환경에 따라 인식성능에 많은 차이를 보이고 있다. 따라서 본 연구에서는 시간의 변화(상태수의 변화)와 상태분할 과정에서 문맥환경의 변화를 고려하여 다양한 형태의 문맥의존 음향모델을 작성하였다. 모델학습은 음소결정트리 기반 SSS 알고리즘(Phonetic Decision Tree-based Successive State Splitting: PDT-555)을 이용하였다 PDT-SSS 알고리즘은 미지의 문맥정보를 해결하기 위해 문맥방향과 시간방향으로 목표 상태수에 도달할 때까지 상태분할을 수행하여 모델을 작성하는 방법이다. 본 연구에서 강건한 문맥의존 음향모델을 학습하기 위한 방법의 유효성을 확인하기 위해 국어공학센터의 452 단어를 대상으로 음소와 단어인식 실험을 수행하였다. 실험결과, 음성의 시간변이에 따른 모델의 상태수와 각 음소의 문맥환경에 따라 인식성능의 변화를 고찰할 수 있었다. 따라서 본 연구는 향후 음성인식 시스템의 강건한 문맥의존 음향모델을 작성하는데 유효할 것으로 기대된다.

  • PDF