• 제목/요약/키워드: Voice evaluation

검색결과 357건 처리시간 0.023초

자가 음성평가와 체질량지수의 특성 비교 (A Comparison study on the relationship between the Self-reported Voice Problem and Body Mass Index)

  • 이인애;황영진
    • 한국산학기술학회논문지
    • /
    • 제14권3호
    • /
    • pp.1330-1334
    • /
    • 2013
  • 본 연구에서는 자가 음성평가에 따른 체질량지수를 비교하고자 하였다. 제5기(2010년) 1차년도 국민건강영양 조사 이비인후과 검진을 완료한 19세 이상의 성인을 5,811명을 대상으로 하며 자가음성평가와 체질량지수의 연관성을 분석하였다. 또한 체질량지수와 연관성이 깊은 키, 몸무게, 허리둘레 등도 함께 비교하여 자가음성평가와 어떠한 상관을 보이는지 살펴보았다. 비교를 위해 chi-square, t-test, 이변량 로지스틱 회귀분석을 이용하였으며 그 결과, 자가 음성평가에 따른 체질량지수는 유의한 차이를 나타내는 특성을 보이며, 체질량지수가 과체중-2단계 비만인 경우 정상체중보다 음성장애 위험률이 1.77배 높은 결과를 나타내었다. 또한 체질량지수가 음성장애 통제변수로서의 유의함을 확인하였으며, 음성장애 진단 시 키와 몸무게를 통한 체질량지수를 함께 비교하는 것은 필요하다는 것이 확인되었다.

한국판 목소리 자기조절 척도의 신뢰도 및 타당도 예비연구 (Validation of the Korean Voice Perceived Present Control Scale: A Pilot Study)

  • 이정민;정수연;김빛나;김한수
    • 대한후두음성언어의학회지
    • /
    • 제33권2호
    • /
    • pp.103-109
    • /
    • 2022
  • Background and Objectives The Voice Perceived Present Control scale (VPPC) has been developed to provide better insight into patients' perceived control over their thoughts or behaviors related to voice disorders. The objective of the present study was to validate the Korean VPPC (K-VPPC) by evaluating its internal consistency and reliability. Materials and Method All items of the English VPPC were translated into Korean. Content validity was analyzed through three Delphi survey rounds by an expert panel (n=44) with active clinical and research experience in treating dysphonic patients. Twenty-three patients with a heterogeneous diagnosis of dysphonia and twenty-three gender-matched vocally normal controls (total n=46) were asked to complete the K-VPPC and the Korean Voice Handicap Index-10 (KVHI-10). Psychometric properties including internal consistency and reliability were evaluated to examine the appropriateness of cross-cultural use of K-VPPC. Results Cronbach's alpha coefficient of K-VPPC was 0.89 for dysphonic patients, indicating good internal consistency in clinical samples. Furthermore, patients with dysphonia scored significantly lower on the total score of K-VPPC and higher on voice handicap than the vocally normal controls. Spearman's correlation coefficients indicated an inverse and moderate association between the K-VPPC and all domains of KVHI-10 (Spearman's r=-0.44- -0.68). Conclusion The findings of the current study indicated that the K-VPPC is a valid and reliable tool for the assessment of perceived control in Korean patients with dysphonia. Therefore, the K-VPPC could be a useful and complementary tool for the comprehensive evaluation of dysphonia, thereby improving care in Korean patients with voice disorders.

음성 비식별화 모델과 방송 음성 변조의 한국어 음성 비식별화 성능 비교 (Comparison of Korean Speech De-identification Performance of Speech De-identification Model and Broadcast Voice Modulation)

  • 김승민;박대얼;최대선
    • 스마트미디어저널
    • /
    • 제12권2호
    • /
    • pp.56-65
    • /
    • 2023
  • 뉴스와 취재 프로그램 같은 방송에서는 제보자의 신원 보호를 위해 음성을 변조한다. 음성 변조 방법으로 피치(pitch)를 조절하는 방법이 가장 많이 사용되는데, 이 방법은 피치를 재조절하는 방식으로 쉽게 원본 음성과 유사하게 음성 복원이 가능하다. 따라서 방송 음성 변조 방법은 화자의 신원 보호를 제대로 해줄 수 없고 보안상 취약하기 때문에 이를 대체하기 위한 새로운 음성 변조 방법이 필요하다. 본 논문에서는 Voice Privacy Challenge에서 비식별화 성능이 검증된 Lightweight 음성 비식별화 모델을 성능 비교 모델로 사용하여 피치 조절을 사용한 방송 음성변조 방법과 음성 비식별화 성능 비교 실험 및 평가를 진행한다. Lightweight 음성 비식별화 모델의 6가지 변조 방법 중 비식별화 성능이 좋은 3가지 변조 방법 McAdams, Resampling, Vocal Tract Length Normalization(VTLN)을 사용하였으며 한국어 음성에 대한 비식별화 성능을 비교하기 위해 휴먼 테스트와 EER(Equal Error Rate) 테스트를 진행하였다. 실험 결과로 휴먼 테스트와 EER 테스트 모두 VTLN 변조 방법이 방송 변조보다 더 높은 비식별화 성능을 보였다. 결과적으로 한국어 음성에 대해 Lightweight 모델의 변조 방법은 충분한 비식별화 성능을 가지고 있으며 보안상 취약한 방송 음성 변조를 대체할 수 있을 것이다.

모음 유형과 표준문단의 문장 위치가 음성장애 환자의 청지각적 및 켑스트럼 및 스펙트럼 분석에 미치는 효과 (Effects of vowel types and sentence positions in standard passage on auditory and cepstral and spectral measures in patients with voice disorders)

  • 최미현;최성희
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.81-90
    • /
    • 2023
  • 청지각적 평가 및 음향학적 분석은 음성평가를 위해 임상 현장에서 일반적으로 사용해오고 있다. 본 연구는 음성장애 환자의 청지각적 및 음향학적 측정 시 말 과제 효과를 조사하고자 한다. 음성장애로 진단받은 총 22명의 환자로부터 모음연장발성(/a/, /e/, /i/, /o/, /u/, /ɯ/, /ʌ/)과 연속구어('가을'표준문단의 9개 하위문장)를 녹음하였다. 음성장애 평가 및 치료 경험이 있는 2명의 음성언어치료사가 맹검 및 무작위 음성 샘플을 사용하여 GRBAS('G', 'R', 'B', 'A', 'S')척도 및 CAPE-V('OS', 'R', 'B', 'S', 'P', 'L')를 사용하여 청지각적 평가를 실시하였다. 또한, ADSV(analysis of dysphonia in speech and voice model)를 이용하여 켑스트럼 및 스펙트럼 측정치를 구하였다. 모음 유형에 따라 GRBAS 척도에서 'B'를 제외하고 청지각적 평가에 영향을 미치지 않았으나, CAPE-V에서는 'OS', 'R', 'B'에 영향을 미쳤다(p<.05). CPP 및 L/H ratio 는 모음 유형과 문장 위치의 영향을 받았다. 표준문단의 CPP값은 모든 모음에서 'G', 하위 9문장과 유의미한 부적 상관 관계가 나타났고, 특히, /e/모음(r=-.739)에서 가장 높은 상관관계를 보였다. 두 번째 문장의 CPP는 모든 모음과 높은 상관관계를 보였다. CAPE-V는 말 자극에 따라 GRBAS보다 청지각적 평가에 더 많은 영향을 받을 수 있으며, 'B' 척도, CPP, L/H ratio는 모음 유형과 자음을 포함한 문장 위치에 따라 영향을 받았다. 따라서, 음성 장애 환자의 음성 평가에서 모음을 사용할 때는 /a/뿐만 아니라 ' 기식성'음질과 음향적으로 상관성이 높은 /i/모음을 함께 사용하는 것이 유용할 수 있다. 또한 /e/모음은 한국 표준문단 '가을' 및 하위 문장들과 음향적으로 상관성이 높았으므로 문단 대신 사용할 수 있을 것이다. 또한, 음성장애 신호들이 대부분 비주기적이라는 점을 감안할 때, CPP와 함께 표준문단 중 가장 음향적으로 상관성이 높은 두 번째 문장을 사용할 수 있을 것이다. 이러한 결과는 말과제가 청지각적 평가 및 음향학적 측정에 미치는 영향에 대한 임상적 증거를 제공하며, 이는 음성장애 환자의 음성 평가에 대한 가이드라인을 제공하는 데 도움을 줄 수 있을 것이다.

스펙트로그램을 이용한 내전형 연축성 발성 장애와 근긴장성 발성 장애의 감별 (Differentiation of Adductor-Type Spasmodic Dysphonia from Muscle Tension Dysphonia Using Spectrogram)

  • 노승호;김소연;조재경;이상혁;진성민
    • 대한후두음성언어의학회지
    • /
    • 제28권2호
    • /
    • pp.100-105
    • /
    • 2017
  • Background and Objectives : Adductor type spasmodic dysphonia (ADSD) is neurogenic disorder and focal laryngeal dystonia, while muscle tension dysphonia (MTD) is caused by functional voice disorder. Both ADSD and MTD may be associated with excessive supraglottic contraction and compensation, resulting in a strained voice quality with spastic voice breaks. The aim of this study was to determine the utility of spectrogram analysis in the differentiation of ADSD from MTD. Materials and Methods : From 2015 through 2017, 17 patients of ADSD and 20 of MTD, underwent acoustic recording and phonatory function studies, were enrolled. Jitter (frequency perturbation), Shimmer (amplitude perturbation) were obtained using MDVP (Multi-dimensional Voice Program) and GRBAS scale was used for perceptual evaluation. The two speech therapist evaluated a wide band (11,250 Hz) spectrogram by blind test using 4 scales (0-3 point) for four spectral findings, abrupt voice breaks, irregular wide spaced vertical striations, well defined formants and high frequency spectral noise. Results : Jitter, Shimmer and GRBAS were not found different between two groups with no significant correlation (p>0.05). Abrupt voice breaks and irregular wide spaced vertical striations of ADSD were significantly higher than those of MTD with strong correlation (p<0.01). High frequency spectral noise of MTD were higher than those of ADSD with strong correlation (p<0.01). Well defined formants were not found different between two groups. Conclusion : The wide band spectrograms provided visual perceptual information can differentiate ADSD from MTD. Spectrogram analysis is a useful diagnostic tool for differentiating ADSD from MTD where perceptual analysis and clinical evaluation alone are insufficient.

  • PDF

노화에 따른 음질과 구어 유창성의 음향학적 특성 변화 (Change in acoustic characteristics of voice quality and speech fluency with aging)

  • 박희준;박진
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.45-51
    • /
    • 2023
  • 나이가 들면서 발생하는 음성 문제는 사회적, 정서적으로 영향을 미칠 수 있으며, 나아가 고립감과 우울증으로 이어질 수 있다. 이에 본 연구에서는 노화로 인한 음향학적 특성 변화를 음질과 구어 유창성의 변화를 알아보고자 한다. 이를 위해 노년층 남성 20명과 청년층 남성 20명이 산출한 연장발성과 구절 읽기 과제를 녹음하여 분석하였다. 음질 분석 변수로 기본주파수(F0), 주기 변동률(jitter), 진폭 변동률(shimmer), 켑스트럼 정점(cepstral peak prominence, CPP) 값을 분석하였으며 구어 유창성 분석 변수로는 평균 음절 길이(average syllable duration, ASD), 조음 속도(articulation rate, AR), 구어 속도(SR)를 분석하였다. 연구결과, 음질 측정에서 노년층의 경우 F0가 높게 나타났으며 jitter, shimmer, CPP의 결과값을 통해 음질이 저하된 것으로 나타났다. 구어 유창성 분석 결과, 노년층은 ASD, AR, SR의 결과값을 통해 느리게 발화하는 것으로 나타났다. 음질과 구어유창성 간 상관관계 분석 결과, shimmer와 CPP 값과 각각 ASD와 SR에서 높은 상관관계가 나타났다. 본 연구결과를 통해 노화에 따른 음성과 구어 유창성 변화를 조기에 발견하고 이에 대한 적절한 훈련법을 제공할 수 있을 것으로 기대된다.

음성 및 데이터 집적 다속도 회선 교환망 성능 분석 (Performance Analysis of Integrated Data/Voice Multi-Rate Circuit-Switched Networks)

  • Jong Kyu Lee
    • 전자공학회논문지A
    • /
    • 제28A권12호
    • /
    • pp.1-11
    • /
    • 1991
  • Multi rate circuit switching ISDN which assumes a star topology consisting of LANs(local area networks) interconnected through a backbone MAN (metropolitan area network) is considered. The stations are classified into two categories data and voice stations they are characterized by different arrival rate and session-length (holding time) statistics. We first model the data and voice terminals as finite-source stations and derive analytically exact expressions for the end-to-end blocking probabilities. For more exact evaluation, these probabilities are calculated in terms of three components:circuit blocking probability, destination busy probability and concurrent busy probability. For large size systems, we develop an develop an iterative algorithm that provides a computationally efficient and fast method for the calculation of the end-to-end blocking probabilities.

  • PDF

Multiple Average Ratings of Auditory Perceptual Analysis for Dysphonia

  • Choi, Seong-Hee;Choi, Hong-Shik
    • 말소리와 음성과학
    • /
    • 제1권4호
    • /
    • pp.165-170
    • /
    • 2009
  • This study was to investigate for comparison between single rating and average ratings from multiple presentations of the same stimulus for measuring the voice quality of dysphonia using 7-point equal-appearing interval (EAI) rating scale. Overall severity of voice quality for 46 /a/ vowel stimuli (23 stimuli from dysphonia, 23 stimuli from control) was rated by 3 experienced speech-language pathologists (averaged 19 years; range = 7 to 40 years). For average ratings, each stimulus was rated five times in random order and averaged from two to five times. Although higher inter-rater reliability was found in average ratings than in single rating, there were no significant differences in rating scores between single and multiple average ratings judged by experienced listeners, suggesting that auditory perceptual ratings judged by well-trained listeners have relatively good agreement with the same stimulus across the judgment. Larger variations in perceptual ratings were observed for moderate voices than for mild or severe voices, even in the average ratings.

  • PDF

음성구간검출을 위한 비정상성 잡음에 강인한 특징 추출 (Robust Feature Extraction for Voice Activity Detection in Nonstationary Noisy Environments)

  • 홍정표;박상준;정상배;한민수
    • 말소리와 음성과학
    • /
    • 제5권1호
    • /
    • pp.11-16
    • /
    • 2013
  • This paper proposes robust feature extraction for accurate voice activity detection (VAD). VAD is one of the principal modules for speech signal processing such as speech codec, speech enhancement, and speech recognition. Noisy environments contain nonstationary noises causing the accuracy of the VAD to drastically decline because the fluctuation of features in the noise intervals results in increased false alarm rates. In this paper, in order to improve the VAD performance, harmonic-weighted energy is proposed. This feature extraction method focuses on voiced speech intervals and weighted harmonic-to-noise ratios to determine the amount of the harmonicity to frame energy. For performance evaluation, the receiver operating characteristic curves and equal error rate are measured.