• 제목/요약/키워드: Voice evaluation

검색결과 358건 처리시간 0.028초

성대마비와 성대구증의 강도 변화에 따른 최대발성지속시간 비교 (Comparison of Maximum Phonation Time Associated with the Changes in Vocal Intensity in Patients with Unilateral Vocal Fold Palsy and Sulcus Vocalis)

  • 최세진;최홍식;김재옥;최예린
    • 말소리와 음성과학
    • /
    • 제4권1호
    • /
    • pp.125-131
    • /
    • 2012
  • The patients with incomplete glottic closure have an important feature decreasing the maximum phonation time (MPT) because airflow rate or air leakage is greater than people without voice disorders. Also they can appear a problem in the intensity regulation. This study analyzed MPT difference based on the comfortable intensity and louder intensity and the correlation between MPT and respiration volume of unilateral vocal fold palsy (UVFP) and sulcus vocalis (SV) group. The twenty with UVFP, the 21 with SV, the 21 normal subjects measured MPT in /a/ vowel prolongation task with comfortable intensity and louder intensity and compared analysis by measuring FVC, $FEV_1$, $FEV_1/FVC$ to analyze the correlation between MPT and respiration volume. First, a comparison of MPT according to the intensity between groups is that MPT of the normal group was statistically significant long compared to the patient group in comfortable intensity, but MPT between groups was not statistically significant difference in the louder intensity. Second, an analysis of the correlation between MPT and respiration volume is that this was statistically significant correlation between MPT in comfortable intensity and MPT in louder intensity. But this did not show statistically significant correlation between intensity and respiration volume. This study can be supported the preceding study results deduced that shorting MPT of the patient group compared to the normal group was originated in the problem of laryngeal valving mechanism at the level of vocal folds rather than a problem of respiratory function. Also at the phonation by varying the intensity, the result can deduce that in the case of patient group, the length of MPT had been improved by increasing the glottal closure ratio in the louder intensity. These results can support the theoretical basis that should be applied to the clinicians by varying the intensity at the voice evaluation and voice therapy for the patients with the glottis incompetence.

Dr. Speech Science를 이용한 정상 및 후두질환 환자의 음향분석 (Acoustic Analysis of Normal and Vocal Pathologic Voice Using Dr. Speech Science)

  • 이형석;태경;장경진;김경우;김경래;박철원
    • 대한후두음성언어의학회지
    • /
    • 제8권2호
    • /
    • pp.166-172
    • /
    • 1997
  • Background : For example, aerodynamic study, vibratory study, acoustic study, neuro-muscular test and psychoacoustic evaluation, a number of objective methods are now available for assessing pathologic voice change. They help to differentiate pathologic condition from normal condition and to monitor pathologic and aging change. These laboratory analyses are used commonly to monitor speech therapy and to follow a patient's recovery after surgery. Objectives : We investigated the values of jitter, shimmer and NNE of normal person and hoarseness patients in Korea. The values of Jitter and shimmer might be meaningful parameters distinguishing pathologic vibration from normal and recovery after surgery. Materials and Methods : Statistical significance between normal control and 48 subjects taken microlaryngeal surgery were compared with Dr. speech science program that is computerized system for acoustic analysis of voice production employed to determine vocal characteristics of pitch perturbation(jitter) and amplitude perturbation(shimmer). Results : The mean normal values of jitter and shimmer were 0.226${\pm}$0.110(%), 2.200${\pm}$0.421(%) in male and 0.164${\pm}$0.060(%), 2.063 ${\pm}$0.575(%) in female. In patients with vocal nodule, the preoperative and postoperative values of jitter and shimmer were valueless. In patients with vocal polyps, the preoperative and postoperative values of jitter and shimmer were valuable. Conclusion : Dr. speech science program was effective to monitor laryngeal disease and aging changes.

  • PDF

분리된 보컬을 활용한 음색기반 음악 특성 탐색 연구 (Investigation of Timbre-related Music Feature Learning using Separated Vocal Signals)

  • 이승진
    • 방송공학회논문지
    • /
    • 제24권6호
    • /
    • pp.1024-1034
    • /
    • 2019
  • 음악에 대한 선호도는 다양한 요소들에 의해 결정되며, 추천의 이유를 보여주는 특성을 발굴하는 것은 음악 추천에 있어 중요하다. 본 논문은 가수 인식 작업을 통해 학습한 모델을 활용하여 다양한 음악적 특성을 반영하는 요소들 중 가수의 목소리 특성을 추출하는 방법을 제안한다. 배경음이 포함된 음원 역시 활용할 수 있지만, 음원에 포함된 배경음은 네트워크가 가수의 목소리를 온전하게 인식하는 것을 방해할 수 있다. 이를 해결하기 위해 본 연구에서는 음원 분리를 통해 배경음을 분리하는 사전 작업을 수행하고자 하며, SiSEC에 등장해 검증된 모델 구조를 활용하여 분리된 보컬로 이루어진 데이터 세트를 생성한다. 최종적으로 분리된 보컬을 활용하여 아티스트의 목소리를 반영하는 음색 기반 음악 특성을 발굴하고자 하며, 배경음이 분리되지 않은 음원을 활용한 기존 방법과의 비교를 통해 음원 분리의 효과를 알아보고자 한다.

음악성 평가 지표 설계를 위한 성도 모양의 변화 분석 (Variation Analysis of Spectrogram for Indicators Design of Musicality Evaluation)

  • 김봉현;조동욱
    • 한국산학기술학회논문지
    • /
    • 제10권8호
    • /
    • pp.2110-2116
    • /
    • 2009
  • 문화 산업은 보건, 의료 산업과 함께 삶의 혜택을 누릴 수 있는 기회를 제공해 주는 분야라고 할 수 있을 정도로 현대 사회에서 많은 관심을 받고 있다. 특히, 대중적 지지 기반을 보유하고 있는 음악 산업은 대중성과 독창성이 함께 공존하여 감정을 표출하고 쉽게 접근할 수 있는 예술적 가치로 인정받고 있다. 본 논문에서는 이러한 음악산업에서 핵심적인 부분이라 할 수 있는 가수의 음악적 재능을 평가하는 지표를 설계하고자 한다. 이를 위해 동일한 음악에 대한 가수의 목소리와 일반인의 목소리에서 성도의 모양 변화에 대한 분석을 수행하기 위해 스펙트로그램 분석 요소를 적용하였으며 결과 파형의 패턴 분석을 실험하여 두 집단간의 비교, 분석을 수행하였다. 따라서 실험에 사용될 대중적 음악을 선정하고 동일 부분에 대한 가수와 일반인의 목소리를 수집하여 시간의 흐름에 따른 성도 모양의 변화를 패턴 분석하고 이를 비교, 분석하여 음악성을 평가할 수 있는 지표를 설계하였다.

Noise Elimination Using Improved MFCC and Gaussian Noise Deviation Estimation

  • Sang-Yeob, Oh
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.87-92
    • /
    • 2023
  • 음성 인식 시스템의 지속적인 발전으로 음성에 대한 인식율은 급속도로 발전되었지만 사용 환경에서의 잡음과 여러 음성이 혼합되어 발생하는 잡음으로 정확한 음성을 인식할 수 없는 단점을 가진다. 환경 잡음이 있는 음성을 처리할 때 음성 인식률을 높이기 위해서는 잡음을 제거해야 하며, 기존의 HMM, CHMM, GMM, 그리고 AI 모델이 적용된 DNN에서도 예상치 못한 잡음이 발생하거나 기본적으로 디지털 신호에 양자화 잡음이 추가되면 소스 신호가 변경되거나 손상되어 인식률이 저하된다. 이를 해결하기 위해 각 음성 프레임에 대한 음성 신호의 특징을 효율적으로 추출하기 위해 MFCC를 개선하여 처리하였으며, 음성 신호에 대한 잡음을 제거하기 위해 가우시안 모델을 적용한 잡음 편차 추정을 이용한 잡음 제거 방법을 개선하여 적용하였다. 제안된 모델에 대한 성능 평가는 음성에 대한 정확성 평가를 위해 교차 상관 계수를 사용하여 처리하였으며, 제안하는 방법의 인식률을 평가한 결과 이들에 대한 상관 계수에 대한 평균값 차이는 0.53 dB 개선된 것을 확인하였다.

유무선 통합망에서의 음성 서비스의 성능 테스트 및 평가 (Performance Test and Evaluation of Voice Traffic in Wired and Wireless Integrated Network)

  • 조준모;최대우
    • 한국산학기술학회논문지
    • /
    • 제10권2호
    • /
    • pp.280-286
    • /
    • 2009
  • NGN(Next-Generation Network)의 구조는 전 IP 유무선 통합망으로서 다양한 관점에서 연구되어져왔으며 이러한 네트워크의 성능은 가장 중요한 쟁점의 하나이다. 본 연구에서는 다양한 유무선 통합망에서 음성 서비스를 제공할 때에 발생할 수 있는 문제점과 요인들을 발견하기 위하여 OPnet 시뮬레이터를 활용하여 성능분석을 수행하였다. 단일의 유선망이나 무선망과는 달리 유무선 통합망에서만 보이는 특성을 측정하고 분석하였다. 특히, 유무선 통합망에서는 네트워크의 전송이 빈번하지 않은 환경에서도 전반적인 망의 성능이 저하되는 결과를 측정하였으며 그밖에도 노드수의 증가와 전송량의 변화에 따른 망의 성능을 비교 분석하였다.

멀티미디어 시스템의 통신 채널 모델링 및 성능분석 (Modeling and Performance Analysis of Communication Channels for Multimedia System)

  • 방석윤;노철우
    • 한국콘텐츠학회논문지
    • /
    • 제5권1호
    • /
    • pp.147-155
    • /
    • 2005
  • 본 논문에서는 음성과 동영상을 포함한 멀티미디어 시스템의 통신 채널에 대한 모델링과 성능분석을 수행한다. 음성과 동영상에 적합한 서로 다른 도착 처리 과정을 고려한 멀티미디어 패킷의 입력 트래픽 특성, 통신 채널의 동적 할당 방법, 가용 채널 부족시 데이터 패킷의 큐잉 허용과 제한 시간 경과시의 패킷 손실 처리, 큐잉을 허용하지 않으나 가드 채널을 갖는 음성 패킷의 채널 처리 방식 등을 모델링하고 가용채널 부족시 서비스를 받지 못하는 차단 확률과 큐에서 지정시간 경과시 손실되는 패킷 손실률 등의 성능 지표에 대한 수치결과를 분석한다. 이를 위하여 멀티미디어 시스템 통신 채널 SRN 모델을 개발한다. 본 논문에서 제시한 SRN 모델링 기법은 성능분석을 위하여 필요한 마르코프 체인의 복잡한 해석적 분석 대신 보상 개념에 의한 손쉬운 성능분석 방법을 보여준다.

  • PDF

역방향 링크에 대한 디지털 셀룰러 CDMA 시스템의 용량 평가 (Capacity Evaluation of a Digital Cellular CDMA System for Reverse Link)

  • 박용서
    • 한국음향학회지
    • /
    • 제14권1호
    • /
    • pp.48-55
    • /
    • 1995
  • 서비스 영역이 중심 셀로부터 3개의 궤도가 포함하고 있는 37개의 6각형 셀의 역방향 링크(이동체-기지국)에 대한 디지털 셀룰러 CDMA의 용량을 컴퓨터 시뮬레이션에 의하여 구하였다. 채널에는 shadow페이딩이 존재하며, 시스템은 이상적으로 전력제어가 이루어지고 있다고 가정하였다. 본 논문에서는 전파손실계수와 음성통화율 그리고 인접 셀의 통화량을 고려한 CDMA 시스템의 용량 평가를 통하여 CDMA 시스템의 용량은 전과손실계수가 증가하고 음성통화율이 감소함에 따라 증가하며 $\gamma=4일$ 때 아날로그 셀룰러 FM/FDMA와 디지털 셀룰러 TDMA의 용량에 비하여 각각 15배와 5배 가량 크며 인접하고 있는 셀의 통화량에 매우 민감하다는 결과를 얻었다.

  • PDF

연결발화에서 마비말화자의 음질 특성 (Voice Quality of Dysarthric Speakers in Connected Speech)

  • 서인효;성철재
    • 말소리와 음성과학
    • /
    • 제5권4호
    • /
    • pp.33-41
    • /
    • 2013
  • This study investigated the perceptual and cepstral/spectral characteristics of phonation and their relationships in dysarthria in connected speech. Twenty-two participants were divided into two groups; the eleven dysarthric speakers were paired with matching age and gender healthy control participants. A perceptual evaluation was performed by three speech pathologists using the GRBAS scale to measure the cepstrual/spectral characteristics of phonation between the two groups' connected speech. Correlations showed dysarthric speakers scored significantly worse (with a higher rating) with severities in G (overall dysphonia grade), B (breathiness), and S (strain), while the smoothed prominence of the cepstral peak (CPPs) was significantly lower. The CPPs were significantly correlated with the perceptual ratings, including G, B, and S. The utility of CPPs is supported by its high relationship with perceptually rated dysphonia severity in dysarthric speakers. The receiver operating characteristic (ROC) analysis showed that the threshold of 5.08 dB for the CPPs achieved a good classification for dysarthria, with 63.6% sensitivity and the perfect specificity (100%). Those results indicate the CPPs reliably distinguished between healthy controls and dysarthric speakers. However, the CPP frequency (CPP F0) and low-high spectral ratio (L/H ratio) were not significantly different between the two groups.

애성환자에 있어서 잘못된 발성습관에 관한 연구 (The Study of Faulty Vocal Habits in Patients with Hoarsenes)

  • 안철민;박정은
    • 대한후두음성언어의학회지
    • /
    • 제10권1호
    • /
    • pp.12-16
    • /
    • 1999
  • Background and Objectives : The common cause of voice disorders may be bad habits of phonation. faulty vocal habits might aggravate the voice disorder or make the dysphonia. Authors thought the analysis of faulty vocal habits might help to evaluate the causes and to choose the treatment methods in patients with dysphonia. Authors studied to evaluate which vocal habits were used in patients with dysphonia. Materials and Methods : Patients with dysphonia(N= 32) and person without dysphonia(N=20) were evaluated through pre-evaluation test by otolaryngologist and SLP. All subjects were evaluated accordingly Posture of body, expansion of cervical vein, excessive movements of thyroide prominence, position of tongue, tension of lower lip, tension of jaw, breathing pattern related with phonation. Results : In dysphonia group, we found 23 cases with tension of jaw, 15 cases with expansion of cervical vein, 7 cases with bad position of tongue, 3 cases with excessive movement of thyroid prominence and a lot of cases with bad breathing Pattern on Phonation. In control group, only 3 cases with bad position of tongue, 2 cases with tension of lower lip, 1 case with tension of jaw were found. Conclusions : More faulty vocal habits were found in dysphonia group. Authors thought faulty vocal habits could be the cause of dysphonia and aggravate the dysphonia and the control of vocal habits would be very important in patients with dysphonia.

  • PDF