• Title/Summary/Keyword: 음성평가

Search Result 1,638, Processing Time 0.035 seconds

Emotional Speech Synthesis using the Emotion Editor Program (감정 편집기를 이용한 감정 음성 합성)

  • Chun Heejin;Lee Yanghee
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.79-82
    • /
    • 2000
  • 감정 표현 음성을 합성하기 위하여 본 연구에서는 감정 음성 데이터의 피치와 지속시간의 음절 유형별 및 어절 내 음절 위치에 따른 변화를 분석하였고, 스펙트럼 포락이 감정 변화에 어떤 영향을 미치는지를 분석하였다. 그 결과, 피치와 지속시간의 음절 유형별, 어절 내 음절 위치에 따른 변화와, 스펙트럼 포락 등도 감정 변화에 영향을 미치는 것으로 나타났다. 또한, 감정 음성의 음향학적 분석 결과를 적용하여 감정 음성을 합성하고 평가하기 위하여, 평상 음성의 음운 및 운율 파라미터 (피치, 에너지, 지속시간, 스펙트럼 포락)를 조절함으로써 감정 음성을 생성하는 감정 편집기를 구현하였다.

  • PDF

발성치료

  • 남도현
    • Proceedings of the KSLP Conference
    • /
    • 2003.11a
    • /
    • pp.215-218
    • /
    • 2003
  • 발성치료는 약400여년간 내려오고 있는 성악발성법 (벨칸토 발성)을 이용하여 음성을 교정하고 치료하는 방법으로 과학적이고 의학적으로 인정된 방법을 통하여 음성을 교육하고 교정하는 약물적이고 비 수술적인 치료 방법이다. 음성크리닉검사 1) 공기역학검사(Phonatory function analyzer test) 2) 최대발성지속시간(Maximum phonation time) 3) 컴퓨터 음성검사(Dotor speech. MDVP) 4) 듣기평가 5) 내시경검사(Stroboscopy) 6) 전기성문파형검사(EGG) 7) 호흡근력검사. (MIP. MEP. 등)및 호흡검사(FVC. FEVI. PF. 등) 8) 음성전문의사의 확진 후 발성치료권유 (중략)

  • PDF

The SLP's Perspectives for the Vocal Elites and Singing Voice (가수 음성에 대한 언어재활사의 관점)

  • Yoo, Jae Yeon
    • Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
    • /
    • v.28 no.1
    • /
    • pp.11-13
    • /
    • 2017
  • This article addresses the roles of the speech language pathologist (SLP) for singers who require prompt and effective treatment when a voice problem arises. The causes of voice problem are often vocal abuse/misuse/overuse, muscle tension dysphonia and inappropriate singing technique. The SLP should conduct voice counseling and voice assessment for maintaining healthy voice of singer constantly.

  • PDF

A Study on Speech Recognition System Using Continuous HMM (연속분포 HMM을 이용한 음성인식 시스템에 관한 연구)

  • Kim, Sang-Duck;Lee, Geuk
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.10a
    • /
    • pp.221-225
    • /
    • 1998
  • 본 논문에서는 연속분포(Continuous) HMM(hidden Markov model)을 기반으로 하여 한국어 고립단어인식 시스템을 설계, 구현하였다. 시스템의 학습과 평가를 위해 자동차 항법용 음성 명령어 도메인에서 추출한 10개의 고립단어를 대상으로 음성 데이터 베이스를 구축하였다. 음성 특징 파라미터로는 MFCCs(Mel Frequency Cepstral Coefficients)와 차분(delta) MFCC 그리고 에너지(energy)를 사용하였다. 학습 데이터로부터 추출한 18개의 유사 음소(phoneme-like unit : PLU)를 인식단위로 HMM 모델을 만들었고 조음 결합 현상(채-articulation)을 모델링 하기 위해 트라이폰(triphone) 모델로 확장하였다. 인식기 평가는 학습에 참여한 음성 데이터와 학습에 참여하지 않은 화자가 발성한 음성 데이터를 이용해 수행하였으며 평균적으로 97.5%의 인식성능을 얻었다.

  • PDF

Implementation and Performance Evaluation of the System for Speech Services using VMEbus (VMEbus 를 이용한 음성 서비스 시스템의 구현 및 성능평가)

  • Kwon, Oh-Il;Kang, Kyung-Young;Kim, Tong-Ha;Rhee, Tae-Won
    • The Journal of the Acoustical Society of Korea
    • /
    • v.15 no.1
    • /
    • pp.93-101
    • /
    • 1996
  • In this paper, we implement the system for speech processing to provide the subscribers who are using the telephone network with better speech services. We develop the specified board which is processing speech signal and devise the system which carries out storing and replaying the speech signal under the condition that one master board controls multiple DSP(Digital Signal Processing) boards using VME bus. We use CPU30 board as a maste board and develop SPM(Signal Processing Module) board as a DSP board and then evaluate performance of the system.

  • PDF

Design and Performance Evaluation of Wireless Packet Voice Convergence Protocol based on cdmaOne's Third Generation CDMA MAC (cdmaOne 의 3세대 CDMA MAC을 이용한 무선 패킷 음성 프로토콜의 설계 및 성능평가)

  • Lee, Seong-Won;Song, Yeong-Jae;Jo, Dong-Ho;Lee, Hyeon-Seok
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.26 no.4
    • /
    • pp.500-512
    • /
    • 1999
  • 본 연구에서는 CDMA 기술에 기반한 IMT2000 시스템을 연구중인 cdmaOne 3세대 CDMA MAC을 이용한 무선 패킷 음성 서비스 프로토콜(WPVCP : Wireless Packet Voice Convergence Protocol)을 설계하고 성능을 평가하였다. 설계한 WPVCP 프로토콜은 회선형 서비스 중심인 이동 통신의 음성 서비스 구조를 패킷형 서비스 개념에서 지원하도록 하였으며, 이를 통하여 제한된 무선자원의 활용을 극대화하였다. 아울러, 묵음 구간으로 인한 기존 회선형 방안의 음성 서비스와 제안한 패킷형 음성 서비스를 비교 분석한 결과 제안한 방안의 성능이 end-to-end 의 음성 품질을 지원하는 구조에서 최대 250% ~280% 수준의 가입자 증대효과를 나타내는 것으로 확인하였다.

Voice inactivity detection for Analysis of Acoustic data of Emergency Rescue (응급구조에서의 음향데이터 분석을 위한 음성 부재구간 검출 기술)

  • Huang, Seng Hyun;Chang, Joon-Hyuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1348-1349
    • /
    • 2015
  • 본 논문에서는 응급구조의 신고 상황에서의 수보자의 보다 정확하고 신속한 대응를 위하여 수화자의 음향환경을 분석하여 주변상황에 대한 정보를 알고자 심화 신경망 기반의 음성 부재구간 검출 기법을 제안한다. 제안한 알고리즘은 음성 신호에서의 23차의 Mel-filter bank를 추출하고 이를 심화 신경망 기법을 이용하여 음성 부재구간을 검출한다. 객관적인 성능 평가를 위해 제안된 기법은 실제 응급구조 상황에서 평가되었으며, 기존의 음성검출기를 이용한 음성 부재구간 검출 성능에 비하여 향상된 성능을 보였다.

A Study on the Comparison of the Commercial API for Recognizing Speech with Emotion (상용 API 의 감정에 따른 음성 인식 성능 비교 연구)

  • Janghoon Yang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.52-54
    • /
    • 2023
  • 최근 인공지능 기술의 발전에 따라서 다양한 서비스에서 음성 인식을 활용한 서비스를 제공하면서 음성 인식에 대한 중요성이 증가하고 있다. 이 논문에서는 국내에서 많이 사용되고 있는 대표적인 인공지능 서비스 API 를 제공하는 구글, ETRI, 네이버에 대해서 감정 음성 관점에서 그 차이를 평가하였다. AI Hub 에서 제공하는 감성 대화 말뭉치 데이터 셋의 일부인 음성 테스트 데이터를 사용하여 평가한 결과 ETRI API 가 문자 오류율 (1.29%)과 단어 오류율(10.1%)의 성능 지표에 대해서 가장 우수한 음성 인식 성능을 보임을 확인하였다.

Evaluation of the readability of self-reported voice disorder questionnaires (자기보고식 음성장애 설문지 문항의 가독성 평가)

  • HyeRim Kwak;Seok-Chae Rhee;Seung Jin Lee;HyangHee Kim
    • Phonetics and Speech Sciences
    • /
    • v.16 no.1
    • /
    • pp.41-48
    • /
    • 2024
  • The significance of self-reported voice assessments concerning patients' chief complaints and quality of life has increased. Therefore, readability assessments of questionnaire items are essential. In this study, readability analyses were performed based on text grade and complexity, vocabulary frequency and grade, and lexical diversity of the 11 Korean versions of self-reported voice disorder questionnaires (KVHI, KAVI, KVQOL, K-SVHI, K-VAPP, K-VPPC, TVSQ, K-VDCQ, K-VFI, K-VTDS, and K-VoiSS). Additionally, a comparative readability assessment was conducted on the original versions of these questionnaires to discern the differences between their Korean counterparts and the questionnaires for children. Consequently, it was determined that voice disorder questionnaires could be used without difficulty for populations with lower literacy levels. Evaluators should consider subjects' reading levels when conducting assessments, and future developments and revisions should consider their reading difficulties.