• 제목/요약/키워드: Speech quality measure

검색결과 55건 처리시간 0.021초

음질, 운율, 발음 특징을 이용한 마비말장애 중증도 자동 분류 (Automatic severity classification of dysarthria using voice quality, prosody, and pronunciation features)

  • 여은정;김선희;정민화
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.57-66
    • /
    • 2021
  • 본 논문은 말 명료도 기준의 마비말장애 중증도 자동 분류 문제에 초점을 둔다. 말 명료도는 호흡, 발성, 공명, 조음, 운율 등 다양한 말 기능 특징의 영향을 받는다. 그러나 대부분의 선행연구는 한 개의 말 기능 특징만을 중증도 자동분류에 사용하였다. 본 논문에서는 음성의 장애 특성을 효과적으로 포착하기 위해 마비말장애 중증도 자동 분류에서 음질, 운율, 발음의 다양한 말 기능 특징을 반영하고자 하였다. 음질은 jitter, shimmer, HNR, voice breaks 개수, voice breaks 정도로 구성된다. 운율은 발화 속도(전체 길이, 말 길이, 말 속도, 조음 속도), 음높이(F0 평균, 표준편차, 최솟값, 최댓값, 중간값, 25 사분위값, 75 사분위값), 그리고 리듬(% V, deltas, Varcos, rPVIs, nPVIs)을 포함한다. 발음에는 음소 정확도(자음 정확도, 모음 정확도, 전체 음소 정확도)와 모음 왜곡도[VSA(vowel space area), FCR (formant centralized ratio), VAI(vowel articulatory index), F2 비율]가 있다. 본 논문에서는 다양한 특징 조합을 사용하여 중증도 자동 분류를 시행하였다. 실험 결과, 음질, 운율, 발음 특징 세 가지 말 기능 특징 모두를 분류에 사용했을 때 F1-score 80.15%로 가장 높은 성능이 나타났다. 이는 마비말장애 중증도 자동 분류에는 음질, 운율, 발음 특징이 모두 함께 고려되어야 함을 시사한다.

개선된 델타검색기법을 이용한 피치검색시간의 단축 (AN ALGORITHM TO REDUCE THE PITCH SEARCHING TIME USING MODIFIED DELTA SEARCH IN CELP VOCODER)

  • 이주헌
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.214-217
    • /
    • 1994
  • The major drawback in the Code Excited Linear Prediction type vocoders is their large computational requirements. In this paper, a simple method is proposed to reduce the pitch searching time in the pitch filter almost without degradation of quality. On the basis of the observational regularity of the correlation function of speech, only the limited numbers of pitch lags are considered to be an optimum pitch. This is done by skipping the negative envelope side of the correlation function and limiting the maximum number of lags to be considered preliminarily. By doing so, we can reduce the computational time of pitch searching more than 51% with negligible quality degradation. In addition to that, by combining that method with the conventional delta search technique, we can reduce the computational time requirements more than 60% without serious lowering the speech quality in segmental SNR measure compared to the conventional full search method.

  • PDF

E-모델 기반 통화 품질 분석을 통한 VoIP Planning 및 평가 (VoIP Planning and Evaluation through the Analysis of Speech Transmission Quality Based on the E-Model)

  • 배성용;김광훈
    • 인터넷정보학회논문지
    • /
    • 제5권6호
    • /
    • pp.31-43
    • /
    • 2004
  • 인터넷의 발달은 통신 기술에 커다란 변화를 요구하고 있다. 특히 공중전화망(PSTN: Public Switched Telephone Network)은 장기적으로 인터넷으로 흡수 통합되고, 현재는 이들간의 연동이 요구되고 있는 실정이다. 이처럼 인터넷에서의 전화 서비스는 인터넷 응용 서비스 중 가장 활용 가치가 높고, 기대를 모으고 있는 서비스이다. 그러나 높은 기대와 적은 서비스 이용료에도 불구하고 인터넷 전화 서비스의 보급이 부진한 이유는 낮은 서비스 품질에 있다. 지금까지 VoIP(Voice over IP) 서비스 품질 평가를 위해 송수신되는 음성에 기반 한 다수의 통화 품질 측정 알고리즘들이 사용되어 왔지만, 이러한 알고리즘들은 음성 샘플에 따라 그 결과가 다르고, 일부 알고리즘은 음성 전송 경로의 네트워크 환경 요소를 반영하지 못하는 단점이 있다. E-모델은 이러한 알고리즘들의 문제점을 해결하기 위해 사용될 수 있다. 본 논문에서는 VoIP 단말의 통화 품질은 물론, 음성 전송 경로의 네트워크 품질 손실 요소들을 체계적으로 분석할 수 있는 E-모델의 다양한 분석을 통해 인터넷 전화 사업자나 망 운용자의 VoIP 계획(planing)에 대한 가이드라인과 통화 품질 평가 방법 및 결과를 제시하고자 한다.

  • PDF

PCS 이동전화망에서의 객관적인 음질평가척도별 성능비교 (Performance Comparison for Objective Measures of Speech Quality Evaluation in PCS Wireless Telephone Network)

  • 김낙철;김광수;정호열;정현열
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 1호
    • /
    • pp.48-51
    • /
    • 1999
  • 본 연구에서는 PCS 이동전화의 객관적 통화품질평가 척도개발을 위한 기초연구로 기존의 CD(Cepstral Distance), MSD (Mel Spectral Distance), BSD(Bark Spectral Distance), PSQM (Perceptual Speech Quality Measure) 척도를 적용하여 그 성능을 비교 분석하였다. 이 척도들을 실제환경에서 수집된 PCS 음성데이터에 대해서 적용하였고 이 결과치와 청취자들의 평가 반응에 의해 얻어진 MOS 결과치와의 상관성을 조사하였다. 실험 결과, BSD와 PSQM 척도의 상관성이 0.81, 0.84로 나타나 CD, MSD보다 성능이 더 우수함을 보였다.

  • PDF

CDMA 이동전화 통화품질평가를 위한 객관적 음질평가척도별 성능 비교 (Performance Comparison of Objective Measures for Speech Quality for Evaluation in CDMA Mobile Telephone)

  • 이준희;김광수;윤정오
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2001년도 춘계학술대회논문집:21세기 신지식정보의 창출
    • /
    • pp.256-260
    • /
    • 2001
  • 본 논문에서는 디지털 이동전화(CDMA) 채널환경을 통과한 왜곡된 전화음성에 대해 객관적 음질평가 척도의 개발을 위한 기초 연구로서 기존의 CD(Cepstral Distance), MSD(Mel Spectral Distance), BSD(Bark Spectral Distance), Modified BSD, PSQM(Perceptual Speech Quality Measure)를 대상으로 객관척도 알고리즘을 성능평가 하였다. 이 척도들은 실제 이동전화 환경에서 수집된 PCS 음성데이터에 대해서 적용하였으며 이 결과치를 주관적 음질평가 방법인 MU와 상관성을 비교 조사하였다. 실험 결과, BSD와 MBSD, 그리고 PSQM 척도의 상관성이 각각 0.80, 0.85, 0.84로 나타났으며 CD, MSD 보다 성능이 상대적으로 더 우수함을 보였다.

  • PDF

식도발성 환자의 음향학적 특성과 음성장애지수의 상관성 (The Relationship between Acoustic Characteristics and Voice Handicap Index in Esophageal Speakers)

  • 장효령;심희정;신희백;고도흥;김현기
    • 말소리와 음성과학
    • /
    • 제6권2호
    • /
    • pp.115-121
    • /
    • 2014
  • This paper investigates the relationship between acoustic characteristics and voice handicap index for 29 males with esophageal speakers. Acoustic characteristics were measured by using a sustained vowel /a/ three times. The stable vocalization for 2 seconds was analyzed by MDVP program. Specifically, relationships between four VHI scores (total, functional, physical, and emotional) and three acoustic characteristics (jitter, shimmer, and NHR) were investigated using the Pearson correlation coefficient. As results, we found no relationship between NHR and VHI scores. However, both jitter and shimmer had statistically significant correlations with all four VHI scores. This research will contribute to establishing a baseline related to speech characteristics in voice rehabilitation with esophageal speakers. Further research could be done to examine the overall quality of life survey, which is widely used as a subjective measure about voice for patients with esophageal speakers.

잡음 환경에서의 전송률 감소를 위한 G.723.1 음성활동 검출기 성능 개선에 관한 연구 (Improvement of VAD Performance for the Reduction of the Bit Rate Under the Noise Environment in the G.723.1)

  • 김정진;장경아;배명진
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.42-47
    • /
    • 2001
  • 본 논문에서는 인터넷 폰 및 화상통신 등을 위해 개발된 G.723.1 부록 A 6.3kbps/5.3kbps 이중 전송율 음성 코덱의 음성활동 검출기의 성능을 개선한다. 본 논문에서는 에너지 레벨을 크게 3가지 범위로 구분하여 음성활동 유무 판정을 하도록 한다. 제안한 알고리즘에 대한 처리시간, 음질평가 및 전송율 감소량을 측정한 결과 처리시간의 경우 묵음구간에 대한 판정의 정확성에 기인하여 G.723.1에 비해 감소하고 주관적인 음질평가의 경우 G.723.1과 거의 차이가 없다. 전송율 측정을 위해 VAD=1로 판정한 프레임을 측정한 결과 묵음 구간이 많이 나타날수록 뚜렷한 전송율 감소효과를 얻을 수 있다.

  • PDF

QCELP에서 중첩된 코드북 검색의 개선 (Improvement of Overlapped Codebook Search in QCELP)

  • 박광철;한승진;이정현
    • 정보처리학회논문지C
    • /
    • 제8C권1호
    • /
    • pp.105-112
    • /
    • 2001
  • 본 논문에서는 이동통신 시스템에서 사용할 수 있는 잡음에 강인하면서 음질이 개선된 QCELP 코드북 검색을 제안한다. 기존 QCELP는 고정 코드 북을 한 번 검색하지만, 본 논문에서는 두 번에서 다섯 번까지 검색을 하고 이를 실험해 본 결과 두 번 검색이 전송률에 따른 음질향상이 최적임을 알게 되었다. 따라서 본 논문에서는 두 번의 정밀 양자화를 통해 여기신호를 상세히 나타내므로써 음질을 향상시키는 개선된 QCELP 부호화기를 제안한다. 실험에서 잡음을 고려하지 않은 환경(강의실, 가정집, 거리, 연구실 등)에서 얻은 음성을 입력자료로 사용하고, 음질은 SNR과 segSNR을 이용하여 측정하였다. 실험 결과, 개선된 QCELP는 기존 QCELP 보다 SNR, segSNR에서 각각 38.35%, 65.51% 향상되었다.

  • PDF

잡음 환경에서의 음성 명료도 향상 기술 (Improvement of Speech Intelligibility in Noisy Environments)

  • 윤제열;김중회;오은미;박호종
    • 한국음향학회지
    • /
    • 제28권1호
    • /
    • pp.70-76
    • /
    • 2009
  • 주변 잡음이 심한 환경의 음성 통신에서 음성 명료도는 주변 잡음의 마스킹 효과로 인하여 크게 저하된다. 본 논문에서는 잡음 환경에서 음성 명료도를 향상시켜 통화 품질을 높이는 새로운 방법을 제안한다. 청각 이론에 의하면 음성의 시간축포락선은 명료도 결정에 중요한 역할을 한다. 이에 따라 본 논문에서는 대역별 시간축 포락선의 변화를 강화하여 명료도를 향상시키는 방법을 사용하며, 음질을 추가로 향상시키기 위한 피치 강화동작을 포함한다. 또한, 실제 통화상황에서의 정확한 주관적 성능 평가를 위하여 양 귀를 이용하는 새로운 주관적 성능 평가 방법을 제안한다. 제안하는 평가 방식을 통하여 제안하는 명료도 향상 기술의 성능을 평가하였으며, 명료도와 음질이 모두 향상되는 것을 확인하였고, 동작 파라미터 조정을 통하여 명료도와 음질 사이의 상호 관계가 조정되는 것을 확인하였다.

인공와우 사용자의 심리음향적 음질평가 예비연구 (A preliminary study of sound quality evaluation of cochlear implant users)

  • 방정화;오수희
    • 한국음향학회지
    • /
    • 제41권1호
    • /
    • pp.45-51
    • /
    • 2022
  • 음질평가는 물리적 음향 자극에 대해 주관적으로 지각되는 음색을 평가한다는 측면에서 심리음향학적 측정과 관련이 있다. 본 논문은 인공와우 사용자의 음질평가를 위한 예비연구로서 바이모달 인공와우 사용자를 대상으로 음질평가를 시행하고 인공와우만 착용했을 때와 바이모달을 착용했을 때의 음질평가 차이를 파악하고자 하였다. 총 13명의 바이모달 인공와우 사용자와 7명의 편측 인공와우 사용자가 연구에 참여하였고 순음 및 어음 청력검사, 보청기 기능이득과 실이삽입이득을 측정하였다. 음질평가에서는 바이올린소리, 남자와 여자 노래소리, 냉장고 소음의 4개 음향자극을 방음실에서 들려주고 6개 음질평가 항목에 대해 0에서 10까지의 척도로 표시하도록 하였다. 검사결과 바이모달 사용자는 편측 인공와우만 착용했을 때보다 바이모달을 착용했을 때 음질평가 5개 항목에서 0.8점 높았고, 바이모달 사용자와 편측 인공와우 사용자 그룹간 비교에서는 두 그룹 사이에 차이를 보이지 않았다. 주관적 측면의 바이모달 혜택 측정을 위해서 좀 더 체계적인 음질평가 도구와 방법에 대한 후속 연구가 필요할 것으로 생각된다.