• 제목/요약/키워드: 음성 명료도

검색결과 189건 처리시간 0.03초

경직형 뇌성마비 아동의 음질이 말명료도에 미치는 영향 (The effect of voice quality on speech intelligibility in children with spastic cerebral palsy)

  • 정필연;심현섭
    • 말소리와 음성과학
    • /
    • 제9권4호
    • /
    • pp.129-136
    • /
    • 2017
  • This study investigates the effect of voice quality on speech intelligibility and the relationship between voice quality and intelligibility for children with spastic CP. We recruited 36 children with spastic CP (mean age 10.43 year, 17 girls, 19 boys, spastic type 34, mixed 2) from a special school and a rehabilitation hospital. Voice samples for the perceptual analysis of voice quality were extracted from a sustained vowel /a/ and were rated on the GRBAS scales by two experienced speech language pathologists. Ten adult subjects with no hearing problems evaluated speech intelligibility for the 37 words listed in the Assessment of Phonology and Articulation for Children on a 7-point interval scale. The children with spastic CP were divided into three groups according to the rated G scores on the GRBAS scales (G1(n)=10, G2(n)=13, G3(n)=13). Analyses of ANCOVA and Pearson correlation showed that there was a significant difference in speech intelligibility among three groups. There was also a significant correlation in G scale (grade), A scale (asthenia), B scale (breathy) score, and speech intelligibility. These findings suggest that poor speech intelligibility of spastic CP might be related to asthenia and breathiness. Vocal intensity should be increased and vocal functioning should be improved for speech therapy to improve speech intelligibility of the children with spastic CP.

VoIP 음질의 주관적 평가에 관한 연구 (A Study of Subjective Speech Quality Measurement in VoIP)

  • 강영도;강진석;최연성;김장형
    • 한국정보통신학회논문지
    • /
    • 제5권2호
    • /
    • pp.279-287
    • /
    • 2001
  • 본 논문은 초고속 인터넷을 이용한 음성전송 방식인 VoIP(Voice over IP) 서비스에서의 음질의 주관적 평가에 관한 연구이다. PSNR이나 지터 갊은 멀티미디어 서비스의 객관적 파라미터는 명료히 정의되어 있고 쉽게 측정되나, 그것이 이용자의 지각적 인지도와는 일치하지 않는다. 본 연구에서는 송화자 내용 발생과정에 있어서 어느 정도 완전히 표현되었는가를 나타내는 송화 품질과 음성이 전송계를 통해 수화자에게 전달되는 과정에서 왜곡이나 잡음 등의 방해요인에 의해 열화 되는 정도를 나타내는 전송 품질, 그리고 수화자가 청각에서 신호처리 과정을 거친 송화자의 내용을 어느 정도 이해할 수 있는지를 나타내는 수화 품질에 대한 주관적 평가법과 그 척도를 제시한다. 또한 제안된 방법으로 실험하여 그 유효성을 검증한다.

  • PDF

마비말장애 심각도에 따른 음절단위 말명료도와 모음공간 (Speech Intelligibility in Syllables and Vowel Space according to Dysarthric Severity)

  • 이옥분;한지연;박상희
    • 말소리와 음성과학
    • /
    • 제2권2호
    • /
    • pp.85-92
    • /
    • 2010
  • The purpose of this study was to know the differences in perceptual judgement for speech intelligibility in monosyllables by inexperienced listeners and vowel space area according to different dysarthric severity. Three dysarthric speakers with different severity(mild, moderate and severe) screened by 3 clinicians' screening tests before the experiment were conducted. Corner vowels (i, u, ae, a) in monosyllable level (CVC, 'p_p') and carrier phrases ('종이에_써') were chosen and analyzed for vowel space. Inexperience listeners (n=20) performed the intelligibility test for spoken syllables and carrier phrases by dysarthric speakers. The results show that there is a significant differences in both F1 and F2 values among 4 corner vowels. Vowel space area in the data of mildly impaired speakers was significantly higher than two others. In the scores of speech intelligibility judged by inexperienced listeners, the scores by a moderately impaired speaker were more higher than two other speakers. The discrepancy between perceptual judgement by inexperienced listeners and vowel space area will be discussed in this area.

  • PDF

다운증후군아동과 일반아동의 구강운동기능이 자음정확도 및 말명료도에 미치는 영향 (Effects of oral-motor function on PCC and intelligibility in children with Down's syndrome and typically developing children)

  • 강은혜;심현섭
    • 말소리와 음성과학
    • /
    • 제9권2호
    • /
    • pp.125-135
    • /
    • 2017
  • The current study examines PCC (percentage of correct consonant), speech intelligibility, and oral motor function between the group of typically developing children and the group of children with Down's syndrome. To 15 children with Down's syndrome (mean CA: 9;7) and 15 typically developing children on receptive language age, the following tests were administered: K-WPPSI (2001), Picture Vocabulary Test (Kim et al., 1995), Oral and Speech Motor Control Protocol for total oral functional score (Robbins et al., 1987), DDK and Assessment of Phonology and Articulation for Children (APAC, Kim et al., 2007) for PCC and speech intelligibility. Pearson correlation coefficients were computed for the total oral functional score, PCC and DDK of each group. The statistical analysis showed that there is no significant difference in total functional score and DDK when IQ was controlled. There was a significant correlation between total oral functional score and PCC in the Down's syndrome group and a significant correlation between total oral functional score and intelligibility in the Down's syndrome group whether IQ was controlled or not. The findings suggest that both cognitive ability and overall oral motor function need to be considered for the intervention to enhance PCC or speech intelligibility of children with Down's syndrome.

ITU-T G.729/G.729E와 호환성을 갖는 광대역 음성/오디오 부호화기 (A New Wideband Speech/Audio Coder Interoperable with ITU-T G.729/G.729E)

  • 김경태;이민기;윤대희
    • 대한전자공학회논문지SP
    • /
    • 제45권2호
    • /
    • pp.81-89
    • /
    • 2008
  • 광대역 신호는 16 kHz로 표본화되어 50-7000 Hz로 밴드 제한된 신호를 말하며, 전화대역 음성 신호에 비해서 높은 자연성(naturalness)과 명료성(intelligibility)을 가진다. 이런 특징으로 광대역 부호화기는 화상회의, 디지털 AM 방송 및 고음질 음성통신 등에 사용될 수 있다. 본 논문에서는 가변대역 특징을 갖는 광대역 음성 오디오 부호화기를 제안하였다. 제안된 부호화기는 대역분한 구조를 가진다. 저주파 대역은 전화대역 음성 부호화기로 많이 사용되고 있는 8 kbit/s ITU-T G.729나 보다 높은 전송률로 오디오 신호까지 처리할 수 있는 11.8 kbit/s ITU-T G.729 Annex E로 부호화한다. 고주파 대역은 청각 모델을 기반으로 한 파라미터 부호화 방법으로 부호화한다. 제안된 고주파 대역 부호화는 감마톤 필터뱅크(gammatone filterbank)를 이용하여 입력신호를 임계대역으로 분할한 후, 각각의 임계대역 신호를 양자화한다. 저주파 대역 부호화기와 고주파 대역 부호화기는 서로 독립되어 있으므로, 복호화기에서는 채널 조건에 따라 전화대역 합성신호와 광대역 합성신호를 선택할 수 있는 특징이 있다. 성능 평가 결과, 제안된 부호화기는 낮은 전송률과 짧은 지연 시간으로 음성과 오디오 신호 모두에 대해 ITU-T G.722.1 24 kbit/s와 동등한 음질을 제공한다는 것을 확인하였다.

우수한 교실음향 구현을 위한 설계기준 및 개선방향조사

  • 정정호
    • 방재기술
    • /
    • 통권42호
    • /
    • pp.17-25
    • /
    • 2007
  • 쾌적하고 명료성이 높은 교실내의 음향환경은 학생들의 학업 성취도 및 교사의 언어전달 이해 향상을 이룩할 수 있는 중요한 사항이다. 이러한 우수한 교육환경을 위해서는 우선 우리나라의 교실 음향 실태 파악과 함께 교육시설의 음향상태 및 소음에 의한 학업 성취도, 심리적, 사회적 영향에 대한 정량적 조사가 이루어 져야 한다. 국내 교육시설의 음향 실태 파악을 통해 교육시설에서의 음향 및 소음 기준을 수립하여 교육시설내의 음환경 개선을 추진해야 한다. 교실 음향개선을 합리적으로 평가할 수 있는 지표로서 잔향시간과 배경소음이 가장 중요한 요소로 알려져 있다. 교실의 우수한 음환경을 위해 적절한 잔향시간은 $0.4\sim0.6$초, 배경소음은 NC-$25\sim30$수준이 확보되어야 하는 것으로 조사되었다. 또한 교사의 음성레벨과 배경소음과의 비(S/N비)는 최소 10 dB이상 되어야 강의 내용 전달이 가능하며, 각종 기계설비에서 발생되는 소음 및 진동은 저소음 기기 선정을 통해 최소화하여야 한다. 인접 실에서 발생되는 소음을 충분히 차단하기 위해서는 차음성능 우수한 구조의 벽계로 개선되어야 하며, 기밀성이 높은 출입문사용과 적절한 출입구 배치를 통해 인접한 교실로의 소음 전달을 최소화 할 수 있다.

  • PDF

Text-to-Speech 변환 시스템을 위한 회귀 트리 기반의 음소 지속 시간 모델링 (Regression Tree based Modeling of Segmental Durations For Text-to-Speech Conversion System)

  • 표경란;김형순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.191-195
    • /
    • 1999
  • 자연스럽고 명료한 한국어 Text-to-Speech 변환 시스템을 위해서 음소의 지속 시간을 제어하는 일은 매우 중요하다. 음소의 지속 시간은 여러 가지 문맥 정보에 의해서 변화하므로 제어 규칙에 의존하기 보다 방대한 데이터베이스를 이용하여 통계적인 기법으로 음소의 지속 시간에 변화를 주는 요인을 찾아내려고 하는 것이 지금의 추세이다. 본 연구에서도 트리기반 모델링 방법중의 하나인 CART(classification and regression tree) 방법을 사용하여 회귀 트리를 생성하고, 생성된 트리에 기반하여 음소의 지속 시간 예측 모델과, 자연스러운 끊어 읽기를 위한 휴지 기간 예측 모델을 제안하고 있다. 실험에 사용한 음성코퍼스는 550개의 문장으로 구성되어 있으며, 이 중 428개 문장으로 회귀 트리를 학습시켰고, 나머지 122개의 문장으로 실험하였다. 모델의 평가를 위해서 실제값과 예측값과의 상관관계를 구하였더니 음소의 지속 시간을 예측하는 회귀 트리에서는 상관계수가 0.84로 계산되었고, 끊어 읽는 경계에서의 휴지 기간을 예측하는 회귀 트리에서는 상관계수가 0.63으로 나타났다.

  • PDF

문장-언어 변환을 위한 한국어 액센트에 관한 연구 (A Study on the Korean Accentuation Rule for the Korean text to speech conversion)

  • 진달복;김성곤
    • 한국정보통신학회논문지
    • /
    • 제8권4호
    • /
    • pp.804-806
    • /
    • 2004
  • 본 논문은 한국어 문서로부터 음성을 합성해 낼 때 액센트를 자동적으로 만듬으로써 보다 명료하고 자연스러운 회화음을 내기 위한 형식화된 액센트 규칙을 제안하는 데 그 목적이 있다. 이 규칙은 이호영님의 액센트 규칙으로부터 이끌어 낸 것으로서, 그 내용은 다음과 같다. (1) 첫 음절의 음운(rhyme)이 -v인 경우에는 그 다음 음절에 액센트가 온다. (2) 첫 음절의 음운(rhyme)이 -v가 아닌 경우에는 첫 음절에 액센트가 온다.

DWT영역에서 LMS를 이용한 저 샘플링 비율 오디오 신호의 음질 향상 (Sound Enhancement of low Sample rate Audio Using LMS in DWT Domain)

  • 백수진;윤원중;박규식
    • 한국음향학회지
    • /
    • 제23권1호
    • /
    • pp.54-60
    • /
    • 2004
  • 44.1 kHz 샘플링 비율의 표준 CD음질의 오디오 신호를 인터넷 상에서 전송 및 분배하기 위해서 네트워크 대역폭과 저장 공간의 제한점을 고려해야 한다. 이러한 제한은 오디오 신호의 샘플링 비율을 낮추거나 MP3와 같은 오디오 데이터 압축 기법을 이용하여 해결할 수 있지만, 공통적으로 고 주파수 (High frequency) 대역의 정보가 손실 된다는 문제가 발생한다. 이러한 고 주파수 손실은 결국 저 샘플링 비율의 오디오 신호를 생성하게 되며 표준 CD음질을 가지는 오디오 신호보다 제한된 저 주파수 대역만을 재생할 수 있게 된다. 일반적으로 오디오 신호의 고주파 성분은 위치정보와 명료도, 재생 환경 등에 대한 음의 풍부한 정보를 제공한다. 본 논문의 목적은 LMS 적응 필터링과 DWT 분석/합성을 이용하여 저 샘플링 비율을 가지는 오디오 신호로부터 고 주파수 대역의 정보를 효과적으로 추정하는 것이다. 제안된 알고리즘은 DWT 영역에서 LMS 적응 알고리즘을 이용하여 고 주파수 정보를 추정하고 DWT 합성을 이용하여 고 주파수 정보가 강화된 고음질의 오디오 신호를 재생한다. 제안된 알고리즘의 성능 평가를 위해 실제 음성신호와 음악 신호를 이용하여 컴퓨터 모의 실험과 청취 평가를 수행하여 기존 알고리즘과 비교하였으며, 실험 결과 제안된 알고리즘의 우수성을 확인하였다.

라우드니스 복원에 기반한 잡음 환경에서의 오디오 청취 향상 (Audio Listening Enhancement in Adverse Environment based on Loudness Restoration)

  • 박준형;신종원
    • 전자공학회논문지
    • /
    • 제50권12호
    • /
    • pp.210-216
    • /
    • 2013
  • 잡음이 있는 환경에서 음악을 들을 경우 잡음의 영향으로 인해 명료한 음악의 청취가 힘들다. 본 논문에서는 잡음 환경에서 오디오 신호를 자동으로 변화시킴으로써 잡음 환경에서의 오디오 청취 경험을 향상시킬 수 있는 방법을 제안한다. 구체적으로, 잡음이 있는 환경에서 밴드 별 오디오 신호의 지각적 크기가 잡음이 없는 경우와 비슷해지도록 오디오 신호를 변화시키는 방법을 제안하였다. 이를 위해 Moore의 라우드니스 지각 모델을 도입하였으며, 기존의 음성 강화를 목적으로 한 논문을 더욱 발전시켜 48kHz로 샘플링된 전대역 신호를 증폭시키는 기법을 제안하였다. 잡음이 심할 때에는 라우드니스를 복원시켜도 명료성이 떨어지므로 이를 위해 라우드니스를 복원하는 데에 그치지 않고 일부러 고주파의 라우드니스를 약간 더 증폭하는 방법도 제안하였다. 실험 결과를 통해 우리는 제안된 알고리즘이 잡음 환경에서의 오디오 청취 경험을 얼마나 향상시킬 수 있는지를 알 수 있었다.