• Title/Summary/Keyword: Voice Training

검색결과 177건 처리시간 0.025초

경증 자폐성 장애인을 위한 보완·대체의사소통 지원프로그램 (Individual with mild autistic disorder Augmentative and alternative communication Training Program)

  • 유성령;박정화;박수현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.507-509
    • /
    • 2013
  • 본 논문에서는 최근 많은 관심을 받고 있는 안드로이드를 활용한 경증 자폐성장애인을 위한 보완대체의사소통 지원프로그램을 구현하였다. 보완대체의사소통이란 구어 및 비구어적 의사표현하기 어려운 사람들을 위해 사용하는 의사소통체계로서, 본 프로그램에서는 자폐장애인의 의사소통과 의사소통 언어의 선택적 빈도를 측정하는 방법과 자폐 아등의 지적 장애인의 언어에 대한 기본적인 훈련을 하는 방법을 소개한다. 본 논문에서는 보완대체 의사소통에서의 언어표상기법을 활용하여 여러 의사소통의 자유가 없는 사용자들이 효과적인 의사소통 및 학습을 할 수 있도록 개발하였으며, TTS(Text to Speech)를 사용하여 사용자의 의사를 육성으로 전달할 수 있도록 하였다. 그림판기능을 제공하여 사용자의 의사전달의 폭을 넓히고 언어빈도 측정을 통한 사용자의 언어사용빈도 그리고 자폐아의 경우 의식적 무의식 의사전달에 따른 백분율 수치를 두어 도움을 주도록 구현하였다.

  • PDF

d-vector를 이용한 한국어 다화자 TTS 시스템 (A Korean Multi-speaker Text-to-Speech System Using d-vector)

  • 김광현;권철홍
    • 문화기술의 융합
    • /
    • 제8권3호
    • /
    • pp.469-475
    • /
    • 2022
  • 딥러닝 기반 1인 화자 TTS 시스템의 모델을 학습하기 위해서 수십 시간 분량의 음성 DB와 많은 학습 시간이 요구된다. 이것은 다화자 또는 개인화 TTS 모델을 학습시키기 위해서는 시간과 비용 측면에서 비효율적 방법이다. 음색 복제 방법은 새로운 화자의 TTS 모델을 생성하기 위하여 화자 인코더 모델을 이용하는 방식이다. 학습된 화자 인코더 모델을 통해 학습에 사용되지 않은 새로운 화자의 적은 음성 파일로부터 이 화자의 음색을 대표하는 화자 임베딩 벡터를 만든다. 본 논문에서는 음색 복제 방식을 적용한 다화자 TTS 시스템을 제안한다. 제안한 TTS 시스템은 화자 인코더, synthesizer와 보코더로 구성되어 있는데, 화자 인코더는 화자인식 분야에서 사용하는 d-vector 기법을 적용한다. 학습된 화자 인코더에서 도출한 d-vector를 synthesizer에 입력으로 추가하여 새로운 화자의 음색을 표현한다. MOS와 음색 유사도 청취 방법으로 도출한 실험 결과로부터 제안한 TTS 시스템의 성능이 우수함을 알 수 있다.

Speech cues를 이용한 반복훈련이 뇌성마비 아동의 자음정확도 및 말명료도에 미치는 영향: 단일대상연구 (The effects of repeated speech training using speech cues on the percentage of correct consonants and speech intelligibility in children with cerebral palsy: A single-subject design research)

  • 서새희;정필연;심현섭
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.79-90
    • /
    • 2021
  • 본 연구에서는 단일대상연구로서 speech cues를 이용한 반복훈련이 뇌성마비 아동의 자음정확도 및 말명료도에 미치는 영향에 대해 알아보고자 하였다. 연구에는 만 5-8세의 뇌성마비 아동 3명이 참여하였다. 중재는 한 달간 주 4회, 총 16회기 동안 진행하였으며, 한 회기는 30분으로 구성하였다. 훈련과제는 목표 음소가 포함된 1-2음절의 단어와 2어절의 문장을 speech cues의 두 가지 발화유형인 'Big mouth'와 'Strong voice'로 훈련하였다. 연구 결과, 첫째, 세 아동 모두 자음정확도와 말명료도의 평균이 중재단계에서 증가하였으나, 효과크기는 아동 간 상이하였다. 또한, 자음정확도에 비해 말명료도에서 더 높은 효과가 나타났다. 세 아동 모두 훈련 문항에서 유지 효과도 나타났다. 둘째, 세 아동 모두 비훈련 단어와 문장에서 일반화 효과가 나타났다. 따라서 speech cues를 이용한 반복훈련을 통해 뇌성마비 아동의 자음정확도와 말명료도가 증가된 것을 알 수 있었으며, 임상에서 좀 더 쉽고 간편한 중재로 그 효용성이 있다는 것을 확인하였다.

폴란드인이 한국어 학습에 나타난 발음상의 음성학적 문제 (Basic Phonetic Problems Encountered by Poles Studying Korean.)

  • 안나 빠라돕스카
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.247-251
    • /
    • 1996
  • This paper is intended as a preliminary study on phonetic and phonological differences between Polish and Korean languages. In this paper an attempt is made to examine the most conspicious difficulties encountered by Polish learners who begin to speak Korean (and in doing so, 1 would hope that it might be of help to future learners of both languages). Since the phoneme inventory and general phonetic rules for both languages are very different, teaching and learning accurate pronunciation is extremely difficult for both the Poles and Koreans without any previous phonetic training. In the case of Polish and Korean we can see how strong and persistent the influences of the mother-tongue are on the target language. As an example I would like to discuss the basic differences between Polish and Korean consonants. The most important consonantal opposition in Polish is voice-/voicelessness (f. ex.; 〔b〕 / 〔p〕, 〔g〕 / 〔k〕) while in Korean, opposition such as voice-/voicelessness is of secondary importance. Therefore Korean speakers do not perceive the difference between Polish voiced and voiceless consonants. On the other hand, Polish speakers can not distinguish Korean lenis / fortis / aspirated consonants (f. ex.; ㅂ 〔b〕 / ㅃ 〔p〕 / ㅍ〔ph〕, ㄱ 〔g〕 / ㄲ 〔k〕 / ㅋ 〔kh〕)) opposition. The other very important factor is palatalization which is of vital importance in Polish and, because of this, Polish speakers are extremely sensitive to it. In Korean palatalization is not important phonetically and Korean speakers do not distinguish between palatalized and non-palatalized consonants. The transcription used here is based on ' The principles of the International Phonetic Association and the Korean Phonetic Alphabet ' (1981) by Hyun Bok Lee.

  • PDF

가상현실 기반 상황몰입형 영어 대화 학습 시스템 (Virtual Reality based Situation Immersive English Dialogue Learning System)

  • 김진원;박승진;민가영;이건명
    • 융합정보논문지
    • /
    • 제7권6호
    • /
    • pp.245-251
    • /
    • 2017
  • 이 논문에서는 학습자가 가상현실 안에서 음성으로 원어민 캐릭터와 대화하는 영어 대화 학습 시스템을 제안한다. 제안 시스템에서 사용자는 다양한 시나리오의 가상현실 상황에서 대화를 한다. 시스템은 사용자의 음성을 인식하고, 음성 합성을 이용하여 캐릭터의 음성을 제공한다. 몰입감과 현실감 있는 환경을 제공하는 가상현실 환경을 통해 영어 대화하는 과정에서 학습의 발음을 평가한 정보를 학습자에게 피드백으로 제공한다.

유사언어 활용 훈련이 오디오북 텍스트 형상화에 미치는 영향 연구 - 교수자의 우호적 행동을 매개변수로 - (The Effects of Paralanguage Utilization Training for Audiobook Text Shaping - Professor's Friendly Behavior as a Parameters -)

  • 조예신
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제14권2호
    • /
    • pp.141-153
    • /
    • 2020
  • 본 연구의 목적은 발음, 강세, 목소리의 톤, 속도, 휴지(Pause), 감정표현 등 유사언어 활용 훈련이 오디오북 텍스트 형상화에 영향을 미치는 과정에서 교수자의 우호적 행동의 매개역할 관계를 알아보고자 함에 있다. 본 연구결과는 오디오북 텍스트의 동적(動的)형상화를 위한 유사언어 활용 훈련과 매개변수인 교수자의 우호적 행동에 대한 필요성과 영향력을 인식하는 참고자료가 될 것이다. 연구의 결과는 다음과 같다. 첫째, 유사언어 활용 훈련은 오디오북 텍스트 형상화에 긍정적인 영향을 미치는 것으로 나타났으며 텍스트 본래의 의미를 전달하는 핵심 요인으로 작용하였다. 이에 따라 유사언어 활용 훈련의 의의와 내용을 살펴보고 유사언어 활용 훈련을 지속한다면 오디오북 텍스트 형상화에 도움이 될 것이다. 둘째, 교수자의 우호적 행동은 유사언어의 활용 훈련과 오디오북 텍스트 형상화 간에 부분 매개역할을 하였다. 교수자의 우호적 행동은 훈련생에게 호의와 신뢰를 갖게 하여 유사언어 활용 훈련에 도움을 주었으며 오디오북 텍스트 형상화에 대한 완성도를 높일 것이다. 따라서 유사언어 활용 훈련은 교수자의 우호적 행동과 함께 이루어질 때 오디오북 텍스트 형상화에 보다 효과적이라는 결과를 도출할 수 있었다.

동의보감·내경편 독활(獨活)의 용법을 통해 본 한의학 기초와 임상의 연계 교육 방안 (Bridging Basic Knowledge and Clinical Practice in the Education of Traditional Korean Medicine: A case of Pubescent Angelica usages in Internal Bodily Elements section, Treasured Mirror of Eastern Medicine)

  • 홍지성;강인혜;이영미;이훈연;강연석
    • 한국의사학회지
    • /
    • 제33권1호
    • /
    • pp.1-9
    • /
    • 2020
  • Pubescent Angelica is generally used in musculoskeletal diseases of lower extremity, itching, external contraction (外感) and furuncle, with the effect of dispelling wind, draining dampness, dispersing the external (解表) and stopping pain. The disease parts of Treasured Mirror of Eastern Medicine (東醫寶鑑) contain 121 examples of the usage of Pubescent Angelica. Cases of musculoskeletal diseases and itching are mainly in the External Bodily Elements section (外形篇), and those of external contraction and furuncle are mainly in the Miscellaneous Disorder section (雜病篇). Internal Bodily Elements section (內景篇) has 10 prescriptions that involve Pubescent Angelica, in Dreams (2), Voice (1), Uterus (4), Parasites (1), and Feces (2) chapters. Their specific symptoms are insomnia and sleep paralysis (Dreams), loss of voice due to external contraction (Voice), uterine hemorrhage (Uterus), phthisis (Parasites), and constipation and diarrhea (Feces). It is not easy for students beginning their clinical training to link the effects of Pubescent Angelica and its actual usage, especially in the area of internal medicine. By Analyzing the whole cases of Pubescent Angelica in the Treasured Mirror, we found various usages out of reach of basic knowledge of the herb. Such method can be utilized not only in developing herbal knowledge-based products, but also in improving Korean medicine education, by enhancing the occupational competency bridging basic and clinical knowledge.

음도 고정 시 강도 변화에 따른 일반인과 성악인 발성의 성대접촉률 변화 특성의 비교 (The Changes in the Closed Qutient of Trained Singers and Untrained Controls Under Varying Intensity at a Constant Vocal Pitch)

  • 김한수;전용선;정성민;조근경;박은희
    • 대한후두음성언어의학회지
    • /
    • 제16권1호
    • /
    • pp.28-32
    • /
    • 2005
  • Background and Objectives : The most important two factors of the voice production are the respiratory function which is the power source of voice and the glottic closure that transform the air flow into sound signals. The purpose of this study was to investigate the differences between trained singers and untrained controls under varying intensity at a constant vocal pitch by simulataneous using the airway interruption method and electroglottography(EGG). Materials and Methods : Under two different intensity condition at a constant vocal pitch(/G/), 20(Male 10, Female 10) trained singers were studied. Mean flow rate(MFR), subglottic pressure(Psub) and intensity were measured with aerodynamic test using the Phonatory function analyzer. Closed quotients(CQ), jitter and shimmer were also investigated by electroglottography using Lx speech studio. These data were compared with that of normal controls. Results : MFR and Psub were increased on high intensity condition in all subject groups but there was no statistically significance. Statistically significant increasing of CQ. were observed in male trained singers on high intensity condition (untrained male : 51.31${\pm}$3.70%, trained male :55.52${\pm}$6.07%, p=.039). Shimmer percent, one of the phonatory stability parameters, was also decreased statistically in all subject groups(p<.001). Conclusion : The trained singers' phonation was more efficient than untrained singers. The result means that the trained singers can increase the loudness with little changing of mean flow rate, subglottic pressure but more increasing of glottic closed quotients.

  • PDF

기계학습에 의한 후두 장애음성 식별기의 성능 비교 (Performance comparison on vocal cords disordered voice discrimination via machine learning methods)

  • 조철우;왕수건;권익환
    • 말소리와 음성과학
    • /
    • 제14권4호
    • /
    • pp.35-43
    • /
    • 2022
  • 본 논문은 후두 장애음성 데이터의 식별률을 CNN과 기계학습 앙상블 학습 방법에 의해 개선하는 방법에 대한 연구이다. 일반적으로 후두 장애음성 데이터는 그 수가 적으므로 통계적 방법에 의해 식별기가 구성되더라도, 훈련 방식에 따라 과적합으로 인해 일어나는 현상으로 인해 외부 데이터에 노출될 시 식별률의 저하가 발생할 수 있다. 본 연구에서는 다양한 정확도를 갖도록 훈련된 CNN 모델과 기계학습 모델로부터 도출된 결과를 다중 투표 방식으로 결합하여 원래의 훈련된 모델에 비해 향상된 분류 효율을 갖도록 하는 방법과 함께, 기존의 기계학습 중 앙상블 방법을 적용해 보고 그 결과를 확인하였다. 알고리즘을 훈련하고 검증하기 위해 PNUH(Pusan National University Hospital) 데이터셋을 이용하였다. 데이터셋에는 정상음성과 양성종양 및 악성 종양의 음성 데이터가 포함되어 있다. 실험에서는 정상 및 양성 종양과 악성종양을 구분하는 시도를 하였다. 실험결과 random forest 방법이 가장 우수한 앙상블 방법으로 나타났으며 85%의 식별률을 보였다.

성악가와 훈련 받지 않은 일반인의 음도, 강도, 성구 변화 시 발성 및 호흡조절 특성 (Characteristics of Phonatory and Respiratory Control on Pitch, Loudness, Register Change in Untrained and Trained Singers)

  • 최성희;남도현;김덕원;김영호;최홍식
    • 대한후두음성언어의학회지
    • /
    • 제17권2호
    • /
    • pp.115-126
    • /
    • 2006
  • Background and Objectives : Training of breath support and laryngeal muscles control are important components in the development of the singing voice. The purpose of this study is to compare characteristics of respiratory and phonatory control on pitch, loudness, register change with untrained males and trained male singers. Materials and Methods : The 11 untrained males and 11 trained male singers participated. Closed Quotient(CQ), fundamental frequency (fo) and relative volume contribution of the rib cage (in percentage rib cage, % RC) and relative volume contribution of abdomen (in percentage abdomen, % AB) were measured during various pitch, loudness, register tasks using /a/ vowel phonation : Legato, staccato with C3-D3-E3-F3-G3 notes and crescendo and decrescendo with C3 note as well as modal register with C3 and falsetto register with C4 note using an integrated analysis system of Respiration, EGG and Voice. Results : (1) When pitch increased with legato task, loudness also increased in untrained male group but maintained in trained male singers. CQ was also increased both untrained and trained male singers but it was not significantly different ($p>.05$). The abdomen contribution to lung volume were significantly predominant both in inhalation and exhalation in trained males singers ($p<.05$). (2) When pitch increased with staccato task, CQ was not significantly different in untrained but significantly different in trained male singers. The respiratory function of male singers were characterized by significantly predominant abdomen contribution to lung volume in exhalation except for inhalation ($p<.05$) (3) When loudness increased with crescendo, fo was significantly increased with increasing CQ in untrained males but fo was relatively consistent with increasing CQ in trained male singers. The respiratory function of male singers were characterized by significantly predominant abdomen contribution to lung volume in exhalation except for inhalation ($p<.05$). (4) Most male singers were able to change register from modal to falsetto register, but untrained males were not. Thus, CQ was significantly different between modal and falsetto register in trained male singers ($p<.05$). The respiratory function of male singers were characterized by significantly predominant abdomen contribution to lung volume in exhalation except for inhalation ($p<.05$). Conclusion : Male singers were superior to untrained males in coordination of respiratory and phonatory control on pitch, loudness, register change. Implication are offered regarding how the results might be applied to the voice therapy as well as singing training.

  • PDF