• 제목/요약/키워드: Speech Confidence

검색결과 70건 처리시간 0.022초

Self-Reported Speech Problems in Adolescents and Young Adults with 22q11.2 Deletion Syndrome: A Cross-Sectional Cohort Study

  • Spruijt, Nicole E.;Vorstman, Jacob A.S.;Kon, Moshe;Molen, Aebele B. Mink Van Der
    • Archives of Plastic Surgery
    • /
    • 제41권5호
    • /
    • pp.472-479
    • /
    • 2014
  • Background Speech problems are a common clinical feature of the 22q11.2 deletion syndrome. The objectives of this study were to inventory the speech history and current self-reported speech rating of adolescents and young adults, and examine the possible variables influencing the current speech ratings, including cleft palate, surgery, speech and language therapy, intelligence quotient, and age at assessment. Methods In this cross-sectional cohort study, 50 adolescents and young adults with the 22q11.2 deletion syndrome (ages, 12-26 years, 67% female) filled out questionnaires. A neuropsychologist administered an age-appropriate intelligence quotient test. The demographics, histories, and intelligence of patients with normal speech (speech rating=1) were compared to those of patients with different speech (speech rating>1). Results Of the 50 patients, a minority (26%) had a cleft palate, nearly half (46%) underwent a pharyngoplasty, and all (100%) had speech and language therapy. Poorer speech ratings were correlated with more years of speech and language therapy (Spearman's correlation=0.418, P=0.004; 95% confidence interval, 0.145-0.632). Only 34% had normal speech ratings. The groups with normal and different speech were not significantly different with respect to the demographic variables; a history of cleft palate, surgery, or speech and language therapy; and the intelligence quotient. Conclusions All adolescents and young adults with the 22q11.2 deletion syndrome had undergone speech and language therapy, and nearly half of them underwent pharyngoplasty. Only 34% attained normal speech ratings. Those with poorer speech ratings had speech and language therapy for more years.

On Effective Speaker Verification Based on Subword Model

  • Ahn, Sung-Joo;Kang, Sun-Mee;Ko, Han-Seok
    • 음성과학
    • /
    • 제9권1호
    • /
    • pp.49-59
    • /
    • 2002
  • This paper concerns an effective text-dependent speaker verification method to increase the performance of speaker verification. While various speaker verification methods have already been developed, their effectiveness has not yet been formally proven in terms of achieving acceptable performance levels. This paper proposes a weighted likelihood procedure along with a confidence measure based on subword-based text-dependent speaker verification. Our aim is to remedy the low performance problem in speaker verification by exploring a means to strengthen the verification likelihood via subword-based hypothesis criteria and weighted likelihood method. Experimental results show that the proposed speaker verification method outperforms that of the speaker verification scheme without using the proposed decision by a factor of up to 1.6 times. From these results, the proposed speaker verification method is shown to be very effective and to achieve a reliable performance.

  • PDF

BMS 알고리즘을 이용한 핵심어 검출기 거절기능 성능 향상 실험 (Improvement of Confidence Measure Performance in Keyword Spotting using Background Model Set Algorithm)

  • 김병돈;김진영;최승호
    • 대한음성학회지:말소리
    • /
    • 제46호
    • /
    • pp.103-115
    • /
    • 2003
  • In this paper, we proposed Background Model Set algorithm used in the speaker verification to improve calculating confidence measure(CM) in speech recognition. CM is to display relative likelihood between recognized models and antiphone models. In previous method calculating of CM, we calculated probability and standard deviation using all phonemes in composition of antiphone models. At this process, antiphone CM brought bad recognition result. Also, recognition time increases. In order to solve this problem, we studied about method to reconstitute average and standard deviation using BMS algorithm in CM calculation.

  • PDF

핵심어 인식기에서 단어의 음소레벨 로그 우도 비율의 패턴을 이용한 발화검증 방법 (Utterance Verification using Phone-Level Log-Likelihood Ratio Patterns in Word Spotting Systems)

  • 김정현;권석봉;김회린
    • 말소리와 음성과학
    • /
    • 제1권1호
    • /
    • pp.55-62
    • /
    • 2009
  • This paper proposes an improved method to verify a keyword segment that results from a word spotting system. First a baseline word spotting system is implemented. In order to improve performance of the word spotting systems, we use a two-pass structure which consists of a word spotting system and an utterance verification system. Using the basic likelihood ratio test (LRT) based utterance verification system to verify the keywords, there have been certain problems which lead to performance degradation. So, we propose a method which uses phone-level log-likelihood ratios (PLLR) patterns in computing confidence measures for each keyword. The proposed method generates weights according to the PLLR patterns and assigns different weights to each phone in the process of generating confidence measures for the keywords. This proposed method has shown to be more appropriate to word spotting systems and we can achieve improvement in final word spotting accuracy.

  • PDF

감정 상호작용 로봇을 위한 신뢰도 평가를 이용한 화자독립 감정인식 (Speech Emotion Recognition Using Confidence Level for Emotional Interaction Robot)

  • 김은호
    • 한국지능시스템학회논문지
    • /
    • 제19권6호
    • /
    • pp.755-759
    • /
    • 2009
  • 인간의 감정을 인식하는 기술은 인간-로봇 상호작용 분야의 중요한 연구주제 중 하나이다. 특히, 화자독립 감정인식은 음성감정인식의 상용화를 위해 꼭 필요한 중요한 이슈이다. 일반적으로, 화자독립 감정인식 시스템은 화자종속 시스템과 비교하여 감정특징 값들의 화자 그리고 성별에 따른 변화로 인하여 낮은 인식률을 보인다. 따라서 본 논문에서는 신뢰도 평가방법을 이용한 감정인식결과의 거절 방법을 사용하여 화자독립 감정인식 시스템을 일관되고 정확하게 구현할 수 있는 방법을 제시한다. 또한, 제안된 방법과 기존 방법의 비교를 통하여 제안된 방법의 효율성 및 가능성을 검증한다.

다양한 신뢰도 척도를 이용한 SVM 기반 발화검증 연구 (SVM-based Utterance Verification Using Various Confidence Measures)

  • 권석봉;김회린;강점자;구명완;류창선
    • 대한음성학회지:말소리
    • /
    • 제60호
    • /
    • pp.165-180
    • /
    • 2006
  • In this paper, we present several confidence measures (CM) for speech recognition systems to evaluate the reliability of recognition results. We propose heuristic CMs such as mean log-likelihood score, N-best word log-likelihood ratio, likelihood sequence fluctuation and likelihood ratio testing(LRT)-based CMs using several types of anti-models. Furthermore, we propose new algorithms to add weighting terms on phone-level log-likelihood ratio to merge word-level log-likelihood ratios. These weighting terms are computed from the distance between acoustic models and knowledge-based phoneme classifications. LRT-based CMs show better performance than heuristic CMs excessively, and LRT-based CMs using phonetic information show that the relative reduction in equal error rate ranges between $8{\sim}13%$ compared to the baseline LRT-based CMs. We use the support vector machine to fuse several CMs and improve the performance of utterance verification. From our experiments, we know that selection of CMs with low correlation is more effective than CMs with high correlation.

  • PDF

음의 유사도 비율 누적 방법을 이용한 발화검증 연구 (A Study on Utterance Verification Using Accumulation of Negative Log-likelihood Ratio)

  • 한명희;이호준;김순협
    • 한국음향학회지
    • /
    • 제22권3호
    • /
    • pp.194-201
    • /
    • 2003
  • 음성인식에서 신뢰도 측정이란 인식된 결과에 대한 신뢰 여부를 결정하는 것이다. 신뢰도는 프레임을 음소 및 단어 수준으로 통합하여 측정된다. 단어 인식의 경우, 신뢰도를 이용하여 인식 결과와 미등록 어휘를 검증한다. 따라서 이러한 후처리를 통해 이를 인식 결과로 승인하지 않음으로써 성능을 높일 수 있다. 본 논문에서는 기존의 신뢰도 측정 방법인 로그 유사도 비를 수정하여 신뢰도를 측정하였다. 제안된 방법은 프레임 수준에서 음소 수준으로 신뢰도를 통합할 때 로그 유사도 비가 음수인 것만을 누적하는 것이다. 단어 인식기의 인식 결과에 대한 검증 성능을 기존의 방법과 비교한 결과, CAR (Correct Acceptance Ratio)이 90%인 지점에서 FAR (False Acceptance Ratio)을 미등록 어휘에 대해서는 약 3.49%, 오인식에 대해서는 15.25% 감소시킬 수 있었다

성인 스피치교육 전후 효과에 관한 목소리변화스펙트로그램 비교 연구 (A Study on the Effects of Speech Training for Adults Focusing on the Analysis of Voices Before and After Speech Training)

  • 정은이;이상호
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권6호
    • /
    • pp.1049-1056
    • /
    • 2017
  • 본 연구는 스피치교육의 효과를 측정하는데 있어 화자의 목소리의 변화에 주목하였다. 본 연구에서는 스피치교육을 통해 얻게 되는 실질적 효과 중 목소리의 변화를 보다 가시적이고, 과학적으로 평가하고자 하였다. 연구결과 모든 학습자의 목소리에서 스피치교육 전과는 다른 객관적인 변화를 찾을 수 있었다. 학습자 모두 공명, 음색, 발음의 정확성, 휴지 등 다양한 목소리 요소에서 점진적 기술향상이 이루어졌다. 즉, 스피치교육을 받기 전보다 목소리가 풍부해지고 발음이 정확하고, 휴지를 잘 활용하는 안정화된 결과를 볼 수 있었다. 이 연구결과를 통해 스피치훈련을 통해 목소리의 변화가 나타날 수 있는지 분석하고, 스피치 학습자들이 스피치교육에 적극 임해 스피치실력 향상의 결과를 얻을 수 있을 것으로 기대된다.

스마트폰과 음성합성을 활용한 영어 말하기 과제의 개발과 평가 (Development and Evaluation of an English Speaking Task Using Smartphone and Text-to-Speech)

  • 문도식
    • 한국인터넷방송통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.13-20
    • /
    • 2016
  • 본 연구는 국내 영어 학습자들의 말하기 출력 활동을 활성화시킬 방안으로서 스마트폰과 음성합성(Text-to-Speech)이 지닌 장점을 활용하여 모바일 영어 학습의 한 형태인 영어 말하기 영상 과제 학습 모델을 개발, 적용한 후, 이 모델이 학습자들에게 미친 효과를 탐구하였다. 설문 조사 결과 모바일 기기를 활용한 영어 말하기 영상 과제는 학습자들의 전반적인 영어실력 뿐 아니라 발음, 말하기, 듣기, 쓰기 영역에서 자신감과 실력 향상에 긍정적인 영향을 미친 것으로 나타났다. 이런 결과를 기반으로 외국어로서 영어를 학습해야 하는 상황적 한계로 인해 충분한 영어 입력에 노출되지 못하고 말하기 출력활동이 부족한 국내 영어 학습자들의 영어 말하기 능력을 향상시킬 한 가지 방안으로써 말하기 영상 과제의 가능성과 한계를 논의한다.

Learner-Generated Digital Listening Materials Using Text-to-Speech for Self-Directed Listening Practice

  • Moon, Dosik
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제12권4호
    • /
    • pp.148-155
    • /
    • 2020
  • This study investigated learners' perceptions of using self-generated listening materials based on Text to Speech. After taking an online training session to learn how to make listening materials for extensive listening practice outside the classroom, the learners were engaged in practice with self-generated listening materials for 10 weeks in a self-directed way. The results show that a majority of the learners found the TTS-based listening materials helpful to reduce anxiety toward listening and enhance self-confidence and motivation, with a positive effect on improving their listening ability. The learners' general satisfaction can be attributed to some beneficial features of TTS-based listening material, including freedom to choose what they want to learn, convenient accessibility to the material, availability of various native speakers' voices, and novelty of digital tools. This suggests that TTS-based digital listening materials can be a useful educational tool to support learners' self-directed listening practice outside the classroom in EFL settings.