• Title/Summary/Keyword: 음성변화

Search Result 1,373, Processing Time 0.026 seconds

On Detecting the Steady State Segments of Phonemes by Using the Magnitude Distribution of Speech Waveforms (음성파형의 진폭분포를 이용한 음소의 정상상태 구간 검출)

  • 정덕조;배명진;안수길
    • The Journal of the Acoustical Society of Korea
    • /
    • v.10 no.6
    • /
    • pp.5-11
    • /
    • 1991
  • 연속음 인식을 위하여 연결된 음향 신호를 음소단위로 분할하는 것이 필요하다. 본 논문에서는 연속 음성에서의 정상상태 구간 검출을 위한 파라미터로서 진폭분포를 이용하는 방법을 제안하였다. 제 안된 진폭분포는 음성신호의 변화특성을 정확히 나타내며 이러한 프레임사이의 진폭분포를 이용하는 방 법을 제안하였다. 제안된 지폭분포는 음성 신호의 변화특성을 정확히 나타내며 이러한 프레임사이의 진 폭 분포 차이값을 비교하여 프레임의 안정구간과 천이구간을 구분할 수 있었다.

  • PDF

The Influence of Vocal Cords and Intensity by Hemodialysis in End Stage Renal Disease (말기 신부전 환자에서 혈액투석 치료가 성대 및 강도의 변화에 미치는 영향)

  • Kim, Bong-Hyun;Cho, Dong-Uk;Kang, Eung-Taek
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.35 no.7B
    • /
    • pp.1066-1072
    • /
    • 2010
  • Kidney diseases rates in modern Korean society, which is entering an aging society, are growing. These diseases diagnosed at early stage can be cured with the drug or dietary treatment. If, however, at worsening stage, kidney dialysis or transplant is needed. In this context, we analyzed the relationship between kidney and voice by measuring and analyzing the changing rate of the vocal chord and intensity according to hemodialysis. For this, we collected voice samples before and after hemodialysis, and compared and analyzed them through application of vocal analytical element. Namely, based on oriental medical diagnosis theory that voice is quieted down when kidney is abnormal, we collected voice samples before and after hemodialysis, and applied trembling and intensity analysis of vocal chord.

Effects of Talker Sidetone and Room Noise on the Speech Level of a Talker (송화측음 및 실내소음이 송화 음성레벨에 미치는 영향)

  • Kang, Kyeong-Ok;Kang, Seong-Hoon
    • The Journal of the Acoustical Society of Korea
    • /
    • v.11 no.1
    • /
    • pp.52-59
    • /
    • 1992
  • In order to see the effects of talker sidetone on a talker's speech level quantitatively when he converses with others on a telephone, we reviewed the measuring algorithm of speech level and assessed variation of speech level due to that of sidetone masking rating(STMR). We measured room noise effects on speech level, when STMR values were changed, as well. If we consider the effects of talker sidetone and room noise on speech level, the results of experiments suggest that a talker continuously tries to keep the psychological loudness of his own speech, heard by himeself via a telephone handset, at the constant and comfortable level by controlling his speaking level according as STMR value and room noise are change. That is, because the amount of his speech masked by his talker sidetone and room noise is different when STMR value and room noise are changed, we can see the tendency that he controls his speaking level in order to keep the perceived psychological loudness of his own speech to be constant.

  • PDF

An Automatic Diphone Segmentation for Korean Speech Synthesis-by-Rule (한국어 규칙 합성을 위한 다이폰의 자동 추출)

  • 정인종;경연정;김한우;이양희
    • The Journal of the Acoustical Society of Korea
    • /
    • v.12 no.2E
    • /
    • pp.63-72
    • /
    • 1993
  • 본 논문에서는 무제한 음성 생성을 위한 단위음성으로서의 다이폰을 2음절 자연음성으로부터 자동 추출하는 알고리즘을 제안한다. 입력음성을 개량 켑스트럼 파라미터로 분석하여 이로부터 다이폰 추출 파라미터들을 도출한다. 제안된 파라미터로는 에너지 레벨을 나타내는 0차 켑스트럼의 동적변화량, 스펙트럼의 시간 변화량 영교차율, 캡스트럼의 유클리디안 거리이다. 스펙트럼 포락의 변화가 완만한 모음 연쇄등의 음소 경계를 보다 효율적으로 검출하기 위해 스펙트럼의 시간 변화를 미세부분과 개형부분으로 나누어 각각을 파라미터로 사용한다. VV(모음연쇄), VCV(C: 반모음, 자음), VCCV형들로 이루어진 2음절 단어들에 대해 실험한 결과, 모음연쇄 등이 포함되어 있음에도 약 85% 정확도의 음소경계검출을 얻었다. 본 논문에 의한 다이폰을 이용한 합성음의 청취실험 결과 명료도가 높음을 확인하였다.

  • PDF

Analysis of Voice Feature Change by Stimulating the Sexual Desire (성욕(性慾) 자극에 의한 음성 특징 변화 분석)

  • Seo, Youn-Taek;Yoo, Hwang-Jun;Cho, Dong-Uk;Ka, Min-Kyoung;Kim, Bong-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.908-911
    • /
    • 2012
  • 인간의 본능적인 욕구 중 생리적 욕구는 생존을 위해서 불가결한 것 중 하나이며 이러한 생리적 요구엔 성욕이 포함되어 있다. 성욕은 외부자극으로 인하여 욕구가 충동되며 도파민과 테스토스테론의 호르몬 분비가 일어나 성적 충동을 증가시켜 신체변화에 영향을 미친다. 따라서 본 논문에서는 성욕을 자극하여 성적 충동이 증가되었을 때 목소리의 변화를 분석하는 연구를 수행하였다. 이를 위해 성적 충동이 증가되기 전과 후의 음성을 수집하고 성대 관련 음성분석 요소인 Pitch, Intensity 기술을 적용하여 변화된 음성의 특징을 추출하였다.

성대 결절 환자를 대상으로 한 음성치료의 효과

  • 표화영;김명상;최홍식
    • Proceedings of the KSLP Conference
    • /
    • 1997.11a
    • /
    • pp.252-252
    • /
    • 1997
  • 성대결절은 음성 과다 사용으로 유발되는 후두의 만성적 질환 중 가장 대표적인 질환 가운데의 하나로서, 이에 대한 치료는 수술적 처치 또는 음성치료로 시행된다. 본 논문에서는 이러한 성대 결절의 치료법 중 음성치료에 초점을 맞추어, 음성치료를 실시한 성대 결절 환자의 음성에 대한 변화를 음향학적, 공기역학적으로 분석하여, 치료 전과 후를 비교함으로써 그 효과에 대한 객관적 자료를 제시하고자 한다. (중략)

  • PDF

The Effect of Frequency and Amplitude of /a/ Phonation on the Result of MDVP (발성의 강도와 주파수의 변화가 음성분석검사(MDVP) 결과에 미치는 영향)

  • 손영익;윤영선;권중근;추광?
    • Proceedings of the KSLP Conference
    • /
    • 1996.11a
    • /
    • pp.76-76
    • /
    • 1996
  • 음성분석검사는 주어진 음성의 주파수, 진폭, 시간 등의 기본 변수를 이용하여 음성을 객관적으로 비교, 분석하는 방법 중의 하나이며, 그 중 MDVP(Multi-dimensional voice program, Kay Elemetrics Corp, NJ, USA)는 33가지 방법의 다양한 계산을 통하여 주어진 음성을 여러 가지 측면에서 분석이 가능하게 하는 장점을 갖고 있다. 그러나 약 3초 내외의 지속적인 /아/ 발성을 기계적으로 분석하고 있기 때문에 발성의 상태에 따라 한 환자의 음성에서도 여러 가지 일정치 않은 결과를 보일 수 있음을 관찰하였다. (중략)

  • PDF

Laryngeal Findings in Childhood without Hoarsenss as a Chief Complaints (애성이 주증상이 아닌 소아환자에서 후두질환의 소견)

  • 안철민;김현호;김희규;조진규
    • Proceedings of the KSLP Conference
    • /
    • 1996.11a
    • /
    • pp.80-80
    • /
    • 1996
  • 음성은 일상생활에서 표현과 대화의 중요한 수단으로 쓰이는 것으로, 자기 표현이 어려운 영유아나 소아에서는 통증이나 배고픔, 불편함 등을 울음소리로서 표현하기도 한다. 이러한 음성을 이용한 말은 성장과정에서 주변으로부터 듣고 이를 흉내냄으로써 자기 나름대로의 독특한 음성양상을 갖게되는 것이고, 어린 시절 잘못된 발성습관은 후일 성인에서의 잘못된 발성양상으로 지속적인 음성질환을 나타낼 수 있을 것이다. 그러나 이러한 소아에서는 후두 검사가 어렵고, 또 음성변화가 왔을 때 후두의 악성질환이 드물며 보통 저절로 잘 치유되리라는 생각에 진단과 치료가 늦어지는 경우가 흔히 있게된다. (중략)

  • PDF

Visual Voice Activity Detection and Adaptive Threshold Estimation for Speech Recognition (음성인식기 성능 향상을 위한 영상기반 음성구간 검출 및 적응적 문턱값 추정)

  • Song, Taeyup;Lee, Kyungsun;Kim, Sung Soo;Lee, Jae-Won;Ko, Hanseok
    • The Journal of the Acoustical Society of Korea
    • /
    • v.34 no.4
    • /
    • pp.321-327
    • /
    • 2015
  • In this paper, we propose an algorithm for achieving robust Visual Voice Activity Detection (VVAD) for enhanced speech recognition. In conventional VVAD algorithms, the motion of lip region is found by applying an optical flow or Chaos inspired measures for detecting visual speech frames. The optical flow-based VVAD is difficult to be adopted to driving scenarios due to its computational complexity. While invariant to illumination changes, Chaos theory based VVAD method is sensitive to motion translations caused by driver's head movements. The proposed Local Variance Histogram (LVH) is robust to the pixel intensity changes from both illumination change and translation change. Hence, for improved performance in environmental changes, we adopt the novel threshold estimation using total variance change. In the experimental results, the proposed VVAD algorithm achieves robustness in various driving situations.

A Study on the Compensating System for the Acoustic Characteristics Caused by the Variation of Distance from Sound Source to Microphone (음원과 마이크로폰 사이의 거리변화에 의한 음향 특성 보정에 관한 연구)

  • Jeoung, Byung-Chul;Choe, Yoon-Sik
    • The Journal of the Acoustical Society of Korea
    • /
    • v.31 no.3
    • /
    • pp.197-204
    • /
    • 2012
  • In this thesis, studied the method to minimize the changes in frequency response and level due to the variation of the distance from the source to the microphone. selecting three microphones (omni directional, cardioid, super cardioid) which are being used generally, frequency responses were measured in accordance with the distance changes. Gotten the difference from the reference as the result of measurement, changed responses for each frequency range were compensated in comparison of the original human vocal source. In low frequency range, the low frequency boost caused by the proximity effect and decrease in accordance with the distance were compensated. The variation in mid-frequency range is comparatively small, however since the mid-range is the most important part of the human vocal signal, were compensated the mid-frequency range in comparison of the reference. The human vocal signal variation in high frequency range is extremely small and the high frequency is compensated close to the original source without difficulty. Understanding the microphone characteristics and compensations, this study showed that the response can be maintain among the change of the distance from the source to the microphone.