• 제목/요약/키워드: 음성 음질

Search Result 390, Processing Time 0.024 seconds

Change in acoustic characteristics of voice quality and speech fluency with aging (노화에 따른 음질과 구어 유창성의 음향학적 특성 변화)

  • Hee-June Park;Jin Park
    • Phonetics and Speech Sciences
    • /
    • v.15 no.4
    • /
    • pp.45-51
    • /
    • 2023
  • Voice issues such as voice weakness that arise with age can have social and emotional impacts, potentially leading to feelings of isolation and depression. This study aimed to investigate the changes in acoustic characteristics resulting from aging, focusing on voice quality and spoken fluency. To this end, tasks involving sustained vowel phonation and paragraph reading were recorded for 20 elderly and 20 young participants. Voice-quality-related variables, including F0, jitter, shimmer, and Cepstral Peak Prominence (CPP) values, were analyzed along with speech-fluency-related variables, such as average syllable duration (ASD), articulation rate (AR), and speech rate (SR). The results showed that in voice quality-related measurements, F0 was higher for the elderly and voice quality was diminished, as indicated by increased jitter, shimmer, and lower CPP levels. Speech fluency analysis also demonstrated that the elderly spoke more slowly, as indicated by all ASD, AR, and SR measurements. Correlation analysis between voice quality and speech fluency showed a significant relationship between shimmer and CPP values and between ASD and SR values. This suggests that changes in spoken fluency can be identified early by measuring the variations in voice quality. This study further highlights the reciprocal relationship between voice quality and spoken fluency, emphasizing that deterioration in one can affect the other.

Enhanced 2.4kbps Harmonic Stochastic Excitation Coding (향상된 2.4kbps 하모닉 스토케스틱 여기 음성 부호화 방법)

  • 김종학;신경진;이인성
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.831-834
    • /
    • 2000
  • 본 논문은 주파수 전이신호와 시간 전이 신호에 대해서 고조파 잡음 여기 방법과 시간 분리 여기 방법을 적용한 2.4kbps 음성부호화 방법을 제안한다. 혼합 여기 부호화 방법은 주기 신호와 비 주기 신호를 효과적으로 표현하기 위해 하모닉 잡음 모델을 사용한다. 혼합신호에 대한 잡음 성분은 캡스트럴 분석 방법을 사용함으로써 추출되고, AR(Autoregressive Model) 모델에 의해 표현된다. 시간 전이구간 신호에서의 모호한 음성을 효과적으로 제거하기 위한 또 다른 방법이 제안된다. 제안된 시간 분리 방법은 시간 에너지 변화정도를 관찰함으로써 전이 시점을 감지하고 다른 시간 길이를 가지는 두 블록으로 분리하여 분석한다. 시간 분리 방법은 분석을 위한 비대칭 윈도우와 합성에서의 위상 합성 방법을 포함한다. 제안된 방법을 사용한 2.4kbps 음성부호화 방법은 주관적 음질 평가에서 전이구간에서의 지각적 음질의 향상을 보여주었으며, 원본 음성 스펙트럼과의 고조파 비 매칭에 의한 윙윙거리는 기계적인 잡음을 감소시킨다.

  • PDF

Implementation of G.723.1 speech codec on OAK DSP Core based CSD17C00 (OAK DSP Core 기반 CSD17C00에서의 G. 723.1 Speech Codec 의 구현)

  • 성유나
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.151-154
    • /
    • 1998
  • 이중 전송율(5.3 과 6.3kbit/s)을 제공하는 G.723.1 음성 코더는 공중망을 통한 H.324 POTS 영상 회의 규격의 음성 코더로 채택된 것으로, MPMLQ, ACELP 알고리즘에 근거한다. 본 논문에서는 Annex A를 포함한 G.723.1 음성 코더 알고리즘을 C&S Technology에서 개발한 음성 신호 처리를 위한 범용 DSP인 CSD17C00 칩을 이용하여 실시간 응용이 가능하도록 구현하였다. G.723.1 에 대한 양방향 평가가 Codec loopback을 통해 수행되었으며, ITU에서 제공한 테스트 절차에 따라 평가되었다. 또한, 본 논문에서 구현된 G.723.1 음성 코더는 27MIPS의 계산 속도를 갖으며, 프로그램 ROM의 크기는 8.85K Words이고, 10K 데이터 ROM과 4K 데이터 RAM을 필요로 하고 있다. 경쟁 제품과의 MOS 측정 음질 평가를 실시한 결과, CSD17C00에서의 음질 성능이 더 우수함을 입증 함으로써, 본 논문에서 보여준 CSD17C00을 기반으로 구현된 G.723.1 알고리즘의 실시간 구현기술의 타당성을 검증하게 되었다.

  • PDF

Enhaced 2.4 kbps Harmonic Stochastic Excitation Coding for Time/Frequency Transitional Speech (시간/주파수 전이신호를 위한 향상된 2.4 kbps 하모닉 스토케스틱 여기 음성 부호화 방법)

  • 김종학;이인성
    • The Journal of the Acoustical Society of Korea
    • /
    • v.19 no.7
    • /
    • pp.53-58
    • /
    • 2000
  • 본 논문은 주파수 전이신호와 시간 전이 신호에 대해서 고조파 잡음 여기 방법과 시간 분리 여기 방법을 적용한 2.4 kbps 음성부호화 방법을 제안한다. 혼합 여기 부호화 방법은 주기 신호와 비 주기 신호를 효과적으로 표현하기 위해 하모닉 잡음 모델을 사용한다. 혼합신호에 대한 잡음 성분은 캡스트럴 분석 방법을 사용함으로써 추출되고, AR (Autoregressive Model) 모델에 의해 표현된다. 시간 전이구간 신호에서의 모호한 음성을 효과적으로 제거하기 위한 또 다른 방법이 제안된다. 제안된 시간 분리 방법은 시간 에너지 변화정도를 관찰함으로써 전이 시점을 감지하고 다른 시간 길이를 가지는 두 블록으로 분리하여 분석한다. 시간 분리 방법은 분석을 위한 비대칭 윈도우와 합성에서의 위상 합성 방법을 포함한다. 제안된 방법을 사용한 2.4 kbps 음성부호화 방법은 주관적 음질 평가에서 전이구간에서의 지각적 음질의 향상을 보여주었으며, 원본 음성 스펙트럼과의 고조파 비 매칭에 의한 윙윙거리는 기계적인 잡음을 감소시킨다.

  • PDF

A Study on Multi-Pulse Speech Coding Method by Using Individual Pitch Information (개별 피치정보를 이용한 멀티펄스 음성부호화 방식에 관한 연구)

  • Lee, See-Woo
    • The Journal of the Korea Contents Association
    • /
    • v.6 no.2
    • /
    • pp.59-64
    • /
    • 2006
  • In this paper, 1 propose a new method of Multi-Pulse Coding(IP-MPC) use individual pitch pulses in order to accommodate the changes in each pitch interval and reduce pitch errors. The extraction rate of individual pitch pulses was $85\%$ for female voice and $96\%$ for male voice respectively, 1 evaluate the MPC by using pitch information of autocorrelation method and the IP-MPC by using individual pitch pulses. As a result, 1 knew that synthesis speech of the IP-MPC was better in speech quality than synthesis speech of the MPC.

  • PDF

A Study on Voice Quality and Speed Upgrade for Internet phone System (인터넷폰 시스템의 음질 및 속도향상연구)

  • 임종설;김성호;조남인;오춘석
    • Journal of the Korea Computer Industry Society
    • /
    • v.3 no.5
    • /
    • pp.631-640
    • /
    • 2002
  • The internet phones that are currently available in use adopt packet exchange system, transferring through various routes and lacking sufficient band width with a result that there is an accompanied delay for packet transmission since the traffic is increased, accordingly affecting a lot in sound quality and speed. Two solutions for such troubles are suggested in this study to improve sound quality of internet phones. Firstly, we minimize the delay and damage regarding packet size based on traffic size by using the data algorithm from variable packets in order to supplement decreased sound quality due to the delay and damage of sound data. The second suggestion is to employ a method of Jitter compensation by giving an appropriate initial delay time with regenerating buffers to bypass troubles from Jitter, From employing the Jitter compensation method, we found that there is a sound quality improvement due to the less stoppage phenomenon.

  • PDF

Analyzing the element of emotion recognition from speech (음성으로부터 감성인식 요소분석)

  • 심귀보;박창현
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.11 no.6
    • /
    • pp.510-515
    • /
    • 2001
  • Generally, there are (1)Words for conversation (2)Tone (3)Pitch (4)Formant frequency (5)Speech speed, etc as the element for emotional recognition from speech signal. For human being, it is natural that the tone, vice quality, speed words are easier elements rather than frequency to perceive other s feeling. Therefore, the former things are important elements fro classifying feelings. And, previous methods have mainly used the former thins but using formant is good for implementing as machine. Thus. our final goal of this research is to implement an emotional recognition system based on pitch, formant, speech speed, etc. from speech signal. In this paper, as first stage we foun specific features of feeling angry from his words when a man got angry.

  • PDF

Digital Speech Communication Simulator (디지털 통신시스템의 음성 전달 Simulator 개발)

  • Choi Younchang;Cha Sungho;Park Hochong
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.63-66
    • /
    • 2000
  • 고품질의 디지털 이동 통신 서비스를 제공하기 위해서는 다양한 통신 상황 및 통신 경로에 대한 음질의 검증이 필요하다. 그러나 다양한 환경에서의 음질 측정을 위하여 실제 통신 시스템 환경을 구축하는 것은 시간과 비용이 많이 드는 문제점을 가진다. 이러한 문제점들을 해결하기 위하여 본 논문에서는 디지털 이동 통신시스템의 End-to-End 음성 전달 과정 전체를 Software로 Simulation하는 Simulator를 개발하였으며. 이를 통하여 통신 환경과 경로에 따른 통신 시스템의 통화 품질을 매우 간단하게 측정할 수 있다.

  • PDF

The Algorithm for pitch analysis of noise (소음의 피치 분석을 위한 알고리즘)

  • Shin Sung-Hwan;Ih Jeong-Guon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.541-544
    • /
    • 2002
  • 피치 (pitch)는 주파수와 관련된 인간이 실제 느끼는 음의 높이로 라우드니스 (loudness), 음색 (timbre)과 함께 소리의 음질을 결정하는 중요한 요소로 알려져 있다. 이러한 피치는 음성 해석 및 분리를 위해 많은 연구가 이루어진 반면 소음 분석 및 음질 향상을 위한 방향으로의 연구는 부족한 상황이다. 본 연구에서는 기저막 (basilar membrane)의 위치에 따른 주파수 분리 이론인 위치이론 (place theory)을 기본으로 한 기존의 가상 피치 (virtual pitch) 분석 알고리즘을 소음에 적용하기 위해서 수정하고, 절러가지 소음에 적용하였다. 본 연구에서의 알고리즘은 소음의 주파수 특성에 의존한 방법이기 때문에, 토널 (tonal) 성분이 존재하는 소음의 적용에는 적합한 결과를 나타냈지만, 그 이외의 소음에 대해서는 정확한 분석이 어렵다. 따라서 기본 주파수 (fundamental frequency)와 이와 관련된 고조파음(harmonics)이 음질에 중요한 영향을 미치는 소음의 음질 해석 린 음질 향상을 위해 본 연구의 알고리즘에 의한 피치 분석과 기존의 음질 인자를 적용하면 보다 효율적인 결과를 얻을 수 있을 것이다. 이런 소음의 예로는 엔진의 부밍 소음이나 기어 whine 소음 등이다.

  • PDF

Speech Modification and Concatenative Speech Synthesis by using Analysis-By-Synthesis/OverLap-Add(ABS/OLA) Sinusoidal Model (Analysis- By-Synthesis/OverLap- Add( ABS/OLA) Sinusoidal Model 을 이용한 음성변환과 연결음성합성)

  • 구자형
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.339-343
    • /
    • 1998
  • Sinusoidal model 은 음성신호처리의 넓은 분야에 적용되고 있는 방법으로 고음질의 합성음을 생성해 낼 수 있고, 조작이 용이하다는 장점을 가지고 있다. 본 논문에서는 Analysis-by-synthesis/Overlap-add Sinusoidal model 이라는 방법을 이용하여 시간축 변환과 dam성 변환을 수행하였다. 특히 본 논문에서는 음질향상을 위하여 시간축 변환시에는 정적인 구간과 변화하는 구간을 구별하여 서로 다른 시간축 변환비를 이용하였고, 기존의 LPC 방법에 비해 스펙트럼 포락선을 보다 잘 추정하는 Improved Cepstrum을 이용하여 음정변환에 적용하였다. 또 서로 다른 문맥에서 얻어진 음성단위들을 결합할 때 생기는 위상차이를 극복하기 위하여, 기본주파수 성분이 일치하도록 시간축을 이동하여 합성하였다. 실험결과 본 논문에서 적용한 방법들을 통해 기존 방식에 비해 개선된 음질을 얻을 수 있었다.

  • PDF