• 제목/요약/키워드: intelligibility score

검색결과 30건 처리시간 0.023초

운율 및 분절음의 독립적 발음 평가 연구: 한국인, 중국인, 일본인 영어 학습자의 액센트 차이를 중심으로 (A Study of an Independent Evaluation of Prosody and Segmentals: with Reference to the Difference in the Foreign Accent of Korean, Chinese, and Japanese Learners of English)

  • 박한상
    • 말소리와 음성과학
    • /
    • 제4권4호
    • /
    • pp.37-43
    • /
    • 2012
  • This study investigates an independent evaluation of prosody and segmentals with reference to the difference in the foreign accent of Korean, Chinese, and Japanese learners of English. For this study, a set of stimuli were made of English sentences read by male and female Korean, Chinese, and Japanese learners of English by prosody swapping technique. Two groups of American and Korean subjects evaluated the difference in the prosody and segmentals of the stimuli by pairwise difference rating. The results showed that there was no significant difference in the evaluation scores of prosody and segmentals across accents for either subject group. The results also showed that both subject groups indicated a greater score with segmentals than with prosody. The results of the present study are significant in that they are opposite to the claim of some previous studies that prosodic factors could have a greater influence on the foreign accent and intelligibility than segmentals.

소음 환경에서 강인한 어학용 헤드폰 구현 (The implementation of the Language-Study-Headphone storng to Noise Environment)

  • 손재혁;신재호
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2005년도 하계학술대회
    • /
    • pp.397-405
    • /
    • 2005
  • This paper presents a headphone system which has adopted two algorithm to increase sound clearness and to separate signal from noisy environment. In the field of adaptive signal processing, LMS algorithm which is a kind of steepest decent method, can be implemented with more simple calculation, so that we use it to eliminate unwanted noise elements for the proposed system. Futhermore we generate early echo using some delays, then mix it in signal. This process can increase the clearness of signal. In this paper, we prove that the proposed system can be implemented in real time. The proposed system is satisfied to subject assessment test base on MOS(Mean Opinion Score) of ITU-T.

  • PDF

Long-Term Follow-Up Study of Young Adults Treated for Unilateral Complete Cleft Lip, Alveolus, and Palate by a Treatment Protocol Including Two-Stage Palatoplasty: Speech Outcomes

  • Kappen, Isabelle Francisca Petronella Maria;Bittermann, Dirk;Janssen, Laura;Bittermann, Gerhard Koendert Pieter;Boonacker, Chantal;Haverkamp, Sarah;de Wilde, Hester;Van Der Heul, Marise;Specken, Tom FJMC;Koole, Ron;Kon, Moshe;Breugem, Corstiaan Cornelis;van der Molen, Aebele Barber Mink
    • Archives of Plastic Surgery
    • /
    • 제44권3호
    • /
    • pp.202-209
    • /
    • 2017
  • Background No consensus exists on the optimal treatment protocol for orofacial clefts or the optimal timing of cleft palate closure. This study investigated factors influencing speech outcomes after two-stage palate repair in adults with a non-syndromal complete unilateral cleft lip and palate (UCLP). Methods This was a retrospective analysis of adult patients with a UCLP who underwent two-stage palate closure and were treated at our tertiary cleft centre. Patients ${\geq}17$ years of age were invited for a final speech assessment. Their medical history was obtained from their medical files, and speech outcomes were assessed by a speech pathologist during the follow-up consultation. Results Forty-eight patients were included in the analysis, with a mean age of 21 years (standard deviation, 3.4 years). Their mean age at the time of hard and soft palate closure was 3 years and 8.0 months, respectively. In 40% of the patients, a pharyngoplasty was performed. On a 5-point intelligibility scale, 84.4% received a score of 1 or 2; meaning that their speech was intelligible. We observed a significant correlation between intelligibility scores and the incidence of articulation errors (P<0.001). In total, 36% showed mild to moderate hypernasality during the speech assessment, and 11%-17% of the patients exhibited increased nasalance scores, assessed through nasometry. Conclusions The present study describes long-term speech outcomes after two-stage palatoplasty with hard palate closure at a mean age of 3 years old. We observed moderate long-term intelligibility scores, a relatively high incidence of persistent hypernasality, and a high pharyngoplasty incidence.

초기 구강설암 환자에서 부분 설절제술 후 조음변화 (Articulation Changes after Partial Glossectomy in Patients with Early Tongue Cancer)

  • 이길준;염혜연;이강규;이은경;손영익
    • 대한후두음성언어의학회지
    • /
    • 제21권1호
    • /
    • pp.42-47
    • /
    • 2010
  • Backgrounds and Objects: Carcinoma of the tongue is the most common cancer of the oral cavity. A primary treatment strategy includes surgery and/or radiotherapy. Resection of the tongue often results in speech dysfunction, which depends on the site and extent of resection, type of reconstruction, and the mobility of remaining tongue. This study aimed to evaluate the characteristics of articulation errors that were resulted from the partial glossectomy without free flap reconstruction. Materials & Method : Articulation evaluations including speech intelligibility and percent of correct consonants (PCC) were performed for 24 patients who underwent partial glossectomy for their T1 or T2 tongue cancer. Mobility of the tongue, size of the resected tongue, and the history of adjuvant radiotherapy were analyzed for their relationship with the results of articulation evaluation. Results: Speech intelligibility score was $6.4{\pm}0.9$ (on 7-point scale) and overall PCC was 96.9%. There were close relationships between the size of resection and limitations in the tongue mobility, especially in "protrusion and elevation (r=-0.687)" and "retroflexion (r=-0.775)". Errors in "alveolar fricatives" and "palatal affricates" were also closely related with the size of resection (r=-0.537 and -0.538, respectively). PCC for "liquid sound" /r/ was 83.2%, which was closely related with the history of radiation therapy. Conclusion : Overall articulatory function was satisfactory in cases of early tongue cancer after partial glossectomy of a limited volume without flap reconstruction. However, the size of resection and the history of radiation therapy were closely related to the limitations in some types of tongue mobility and the resultant articulation errors.

  • PDF

무형문화유산 영상아카이브 활용을 위한 수용자 반응 연구 (Research of User's Respondence for Application in Image Achieve of Intangible Cultural Heritage)

  • 김미숙;정성환
    • 한국콘텐츠학회논문지
    • /
    • 제12권8호
    • /
    • pp.114-122
    • /
    • 2012
  • 최근 전통문화의 패러다임은 무형문화유산의 가치 재창출에 있다고 할 수 있다. 본 연구는 무형문화유산의 중요성에 대한 가치인식과 이를 통해 무형문화유산을 기록 보존하고 관리하는 아카이브를 활용하여 새로운 가치를 창출하기 위한 방법의 기초연구이다. 무형문화유산의 중요성에 대한 가치인식을 전문가와 일반인을 구분하여 실증적인 연구를 하였고, 아카이브의 기록물 중 기록영상과 기록영화를 전문가와 일반인을 대상으로 몰입도, 교육효과, 흥미도, 이해도, 행동의지에 대한 수용자 반응 실험을 진행하였다. 그 결과 전문가와 일반인의 차이점이 나타났는데. 전문가 집단에서는 기록영상에 대한 몰입도, 이해도가 높게 측정되었으며, 일반인 경우는 기록영화에 대한 몰입도와 교육효과가 높게 나타났다. 본 연구 결과, 전문가와 일반인을 모두 만족시키기 위해서는 그에 수준에 맞는 기록영상, 기록영화 등을 따로 분리 하여 제작 보급하여야 하며, 일반인들을 위해서는 무형문화유산에 대한 몰입과 흥미를 갖게 하는 요소가 무엇인지 파악하여 그에 해당하는 다양한 콘텐츠를 개발하고 전문가를 위해서는 그 기.예능을 전수 받을 수 있는 다양한 교육적인 콘텐츠가 요구 된다.

음질, 운율, 발음 특징을 이용한 마비말장애 중증도 자동 분류 (Automatic severity classification of dysarthria using voice quality, prosody, and pronunciation features)

  • 여은정;김선희;정민화
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.57-66
    • /
    • 2021
  • 본 논문은 말 명료도 기준의 마비말장애 중증도 자동 분류 문제에 초점을 둔다. 말 명료도는 호흡, 발성, 공명, 조음, 운율 등 다양한 말 기능 특징의 영향을 받는다. 그러나 대부분의 선행연구는 한 개의 말 기능 특징만을 중증도 자동분류에 사용하였다. 본 논문에서는 음성의 장애 특성을 효과적으로 포착하기 위해 마비말장애 중증도 자동 분류에서 음질, 운율, 발음의 다양한 말 기능 특징을 반영하고자 하였다. 음질은 jitter, shimmer, HNR, voice breaks 개수, voice breaks 정도로 구성된다. 운율은 발화 속도(전체 길이, 말 길이, 말 속도, 조음 속도), 음높이(F0 평균, 표준편차, 최솟값, 최댓값, 중간값, 25 사분위값, 75 사분위값), 그리고 리듬(% V, deltas, Varcos, rPVIs, nPVIs)을 포함한다. 발음에는 음소 정확도(자음 정확도, 모음 정확도, 전체 음소 정확도)와 모음 왜곡도[VSA(vowel space area), FCR (formant centralized ratio), VAI(vowel articulatory index), F2 비율]가 있다. 본 논문에서는 다양한 특징 조합을 사용하여 중증도 자동 분류를 시행하였다. 실험 결과, 음질, 운율, 발음 특징 세 가지 말 기능 특징 모두를 분류에 사용했을 때 F1-score 80.15%로 가장 높은 성능이 나타났다. 이는 마비말장애 중증도 자동 분류에는 음질, 운율, 발음 특징이 모두 함께 고려되어야 함을 시사한다.

시간영역에서의 파형분석에 의한 무제한 어휘 합성 및 음절 유형별 규칙합성음 음질평가 (Speech Synthesis for the Korean large Vocabulary Through the Waveform Analysis in Time Domains and Evauation of Synthesized Speech Quality)

  • 강찬희;진용옥
    • 한국음향학회지
    • /
    • 제13권1호
    • /
    • pp.71-83
    • /
    • 1994
  • 본 논문은 한국어 문어면환(TTS : Text-to-Speech) 시스템내에서의 음성합성시 음질 및 자연성 개선을 위한 연구 결과이다. 합성방법으로는 단음절단위의 파형을 시간영역에서 분석(표1)하여 규칙합성에 필요한 매개변수(표2)를 추출하여 규칙합성시켰다. 실험에 사용된 음절은 한국어 발음 대사전의 빈도순위에 따라 V형 19개, CV형 80개, VC형 30개, CVC형 100개등 총 229음절을 선정하여 규칙합성시켰다. 규칙합성음의 평가방법으로는 229개의 규칙합성음중 음절 유형별로 15개씩 무작위로 추출한 합성음을 사전지식이 없는 임의의 그룹을 선정하여 이해도, 명료도, 잡음감, 자연성등 4가지 항목에 대하여 주관적인 오피니온 평가를 수행하였다. 실험결과, 합성음의 음질은 대단히 명료한 수준이었으며, 운율요소의 제어결과는 지속시간(장단)과 악센트(강약)의 제어(그림 9, 그림 10)가 가능하였으며, 피치주기(억양)의 제어도 Lagrange 보간법을 사용함으로써 가능하였다(그림 11, 그림 12).

  • PDF

EVALUATION OF THE SYNTHETIC SPEECH QUALITY BY THE TD-PCULI METHOD

  • Kang, Chan-Hee;Shin, Yong-Jo;Kim, Yun-Seok;Kwon, Ki-Hyung;Chin, Yong-Ohk
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.977-983
    • /
    • 1994
  • In this paper we have evaluated the synthetic speech quality by the proposed TD-PCULI speech synthesis method. For the synthesis we have extracted parameters from the Korean monosyllables through the analysis of speech waveforms in the time domain. We have constructed the Korean data format dictionary for the synthesis-by-rule depending upon the frequencies of the Korean pronunciation large vocabulary dictionary, in which V type syllables are 19, CV type's are 80, VC type's are 30 and CVC type's are 100. And using them we have synthesized various Korean monosyllables, words and sentences. We have tested each 10 syllables selected according to the 4 Korean syllable types with the objective MOS(Mean Opinion Score) evluation method about the 4 items i.e., intelligibility, clearness, loudness, and naturality after selecting random group without the knowledge of them. And also we have tested the possibility to modify a duration and F0 into another forms with changing a duration (i.e., 150msec, 300msec, 500msec, 700msec and 1sec) and a central fundamental frequency(i.e., 80Hz, 118Hz, 140Hz, 170Hz, and 200Hz). As the results of experiments the noises occurred in the course of synthesizing the speech by the rules are removed to be a very clear level and we can find that the prosodic elements can be controled as a good condition.

  • PDF

구개인두부전증 환자의 한국어 음성 코퍼스 구축 방안 연구 (Research on Construction of the Korean Speech Corpus in Patient with Velopharyngeal Insufficiency)

  • 이지은;김욱은;김광현;성명훈;권택균
    • Korean Journal of Otorhinolaryngology-Head and Neck Surgery
    • /
    • 제55권8호
    • /
    • pp.498-507
    • /
    • 2012
  • Background and Objectives We aimed to develop a Korean version of the velopharyngeal insufficiency (VPI) speech corpus system. Subjects and Method After developing a 3-channel simultaneous speech recording device capable of recording nasal/oral and normal compound speech separately, voice data were collected from VPI patients aged more than 10 years with/without the history of operation or prior speech therapy. This was compared to a control group for which VPI was simulated by using a french-3 nelaton tube inserted via both nostril through nasopharynx and pulling the soft palate anteriorly in varying degrees. The study consisted of three transcriptors: a speech therapist transcribed the voice file into text, a second transcriptor graded speech intelligibility and severity and the third tagged the types and onset times of misarticulation. The database were composed of three main tables regarding (1) speaker's demographics, (2) condition of the recording system and (3) transcripts. All of these were interfaced with the Praat voice analysis program, which enables the user to extract exact transcribed phrases for analysis. Results In the simulated VPI group, the higher the severity of VPI, the higher the nasalance score was obtained. In addition, we could verify the vocal energy that characterizes hypernasality and compensation in nasal/oral and compound sounds spoken by VPI patients as opposed to that characgerizes the normal control group. Conclusion With the Korean version of VPI speech corpus system, patients' common difficulties and speech tendencies in articulation can be objectively evaluated. Comparing these data with those of the normal voice, mispronunciation and dysarticulation of patients with VPI can be corrected.

CT 외래환자의 만족도 향상을 위한 업무개선 연구 (Effect of Work Improvement for Promotion of Outpatient Satisfaction on CT scan)

  • 한만석;이승열;이명구;전민철;조재환;김태형
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제35권1호
    • /
    • pp.45-50
    • /
    • 2012
  • 국내병원 대부분의 CT검사실은 One Stop Services를 목표로 운영하여 예약환자는 물론이고 전처치가 준비된 외래환자의 경우 당일 CT검사를 수행하고 있다. 하지만 One Stop Service라는 목표에는 양적인 접근은 가능할지언정 지루한 대기시간, 직원의 불친절도 등에 의한 질적인 저하를 야기 시키게 되었고 환자와 보호자들의 민원을 발생시키는 등 검사에 대한 불만족으로 이어지기도 한다. 따라서 본 연구는 직원의 친절도 향상, CT검사에 대한 이해도 향상, CT검사실의 환경개선, 당일 CT검사 대기시간의 단축 등, CT검사를 받는 환자의 불편사항을 찾아 만족도 향상을 위한 방안을 도출하고자 한다. CT검사 외래환자 중 조영제를 투여하는 복부 CT검사 환자를 대상으로 하고 CT검사 외래환자의 만족도를 확인하기 위해 설문지를 사용하였으며 개선 활동 전인 48명, 개선 활동 후 41명, 총 89명의 설문지를 2011.4.1-2011.9.30까지 조사 하였다. 조사 방법은 직원의 친절도, CT검사 이해도, 환경 만족도는 설문을 통해서 조사하고 당일 CT검사 대기시간은 의료정보 통계로 조사하였으며 SPSS V. 15.0 을 이용하여 분석하였다. 개선 전과 개선 후의 전반적인 만족도를 비교한 결과 CT검사실 이용절차의 편리성은 Mean(SD) $5.83{\pm}2.06$에서 Mean(SD) $8.88{\pm}1.87$로 52.32%, 직원의 친절도는 Mean(SD) $7.15{\pm}1.72$에서 Mean(SD) $9.44{\pm}1.24$로 32%, 환경만족도는 Mean(SD) $5.90{\pm}1.89$에서 Mean(SD) $9.00{\pm}1.59$로 52.54%, CT검사의 이해도는 Mean(SD) $5.94{\pm}1.83$에서 Mean(SD) $9.05{\pm}1.70$로 52.36%가 각각 상승하였다. 또한 대기시간은 평균 25.33분에서 21.04분으로 약 16.93% 단축시키는 큰 효과를 얻을 수 있었고 병원의 경쟁력 강화와 수익 증대에도 기여할 것으로 사료 된다.