• 제목/요약/키워드: voice problem

검색결과 337건 처리시간 0.024초

An Interactive Voice Web Browser Usable as a Multimodal Interface in Information Devices by Using VoiceXML

  • Jang, Min-Seok
    • 한국지능시스템학회논문지
    • /
    • 제14권6호
    • /
    • pp.771-775
    • /
    • 2004
  • The present Web surroundings is mostly composed of HTML(Hypertext Mark-up Language) and thereby users obtain web informations mainly in GUI(Graphical User Interface) environment by clicking mouse in order to keep up with hyperlinked informations. However it is very inconvenient to work in this environment comparing with easily accessed one in which human`s voice is utilized for obtaining informations. Using VoiceXML, resulted from XML, for supplying the information through telephone on the basis of the contemporary matured technology of voice recognition/synthesis to work out the inconvenience problem, this paper presents the research results about VoiceXML VUI(Voice User Interface) Browser designed and implemented for realizing its technology and also the VoiceXML Dialog designed for the purpose of the browser's efficient use.

성악가를 위한 VAT 음성치료 개발 및 적용 사례연구 (A Case Study on Vocal Aerobic Treatment Voice Therapy Development and Application for Classical Singers)

  • 유재연;이하나
    • 재활복지
    • /
    • 제22권1호
    • /
    • pp.157-168
    • /
    • 2018
  • 본 연구는 반폐쇄성도훈련에 기반을 둔 성대에어로빅치료(Vocal Aerobic Treatment: VAT)가 소프라노 성악가 음성개선에 미치는 영향을 알아보고자 하였다. 연구대상은 성대결절로 음성문제를 호소하는 소프라노 성악가 1명으로 연구를 진행하였다. 연구방법은 치료 전 후 음향학적평가와 주관적 음성평가를 실시하여 측정값을 비교하였으며, 성대에어로빅치료는 주 2회 총 32회기동안 진행하였다. 음향학적 평가는 MDVP (multi-dimensional voice program)와 VRP (voice range profile)를 사용하여 음도, 음질, 음역을 평가하였으며, 주관적 음성평가는 SVHI (singing voice handicap index)로 주관적인 음성만족도를 평가하였다. 음도 평가 결과 치료 후 소프라노 가수에 적절한 기본주파수(Fo)를 유지하였다. 음질평가 결과 주파수변동률(Jitter), 진폭변동률(Shimmer), 배음대소음비(NHR) 수치가 치료 전보다 감소하였다. 음역평가결과 음역의 범위가 넓어졌으며 반음의 개수가 30개에서 35개로 증가하였다. 주관적 음성평가는 설문 보고 후 획득한 총 점수를 문항수로 나눈 결과 3.6점에서 0.6점으로 감소하였으며, 본인이 느끼는 음성문제의 정도가 경미하다고 보고하였다. 이러한 결과를 정리해보면 성대에어로빅치료는 성악가 음성개선에 효과적인 것으로 사료된다. 그러나 본 연구는 소프라노 성악가 1명을 대상으로 한 성대에어로빅치료의 치료 효과에 관한 사례연구로 향후 더 많은 성악가를 대상으로 효과에 대한 연구가 이루어져야 할 것이다. 또한 성악가뿐만 아니라 다양한 직업적 음성사용자를 위한 음성관리 및 음성치료프로그램에 관한 후속 연구가 필요할 것이다.

의사결정나무 모형을 이용한 주관적 음성장애 예측모형 (The Prediction Model for Self-Reported Voice Problem Using a Decision Tree Model)

  • 변해원
    • 한국산학기술학회논문지
    • /
    • 제14권7호
    • /
    • pp.3368-3373
    • /
    • 2013
  • 본 연구에서는 주관적 음성문제의 위험요인으로 구명된 주요 변수를 기반으로 주관적 음성장애를 예측할 수 있는 모형을 개발 하였다. 연구자료는 2008년도 국민건강영양조사이며, 이비인후검진을 완료한 전국의 19세 이상 지역사회 성인 3,600명(남 1,501명, 여 2,099명)을 분석대상으로 하였다. 분석방법은 주관적 음성장애 여부를 결과변수로 성, 연령, 흡연, 음주, 교육수준, 직업, 갑상선장애, 최근 2주간 급성 및 만성질환으로 인한 통증 및 불편감을 설명변수로 사용하였고, 예측모형은 의사결정나무 모형(Decision Tree)의 exhaustive CHAID(Chi Squared Automatic Interaction Detection) 알고리즘을 이용하였다. 주관적 음성 장애와 관련된 통계학적 분류 모형을 구축한 결과, 유의미한 예측 변수는 연령, 교육수준, 최장 직업, 갑상선 장애, 최근 2주 동안의 신체 불편 및 통증경험 여부였다. 이 연구의 모형을 기초로 음성장애 예방을 위해서 음성장애 고위험군에 대한 조기 관리의 필요성이 제기된다.

교사, 목사 및 교환수들의 음성발성에 대한 음향분석학적 특징 (Acoustic and Stroboscopic Characteristics in Teachers, Clergies and Telephone Operators)

  • 진성민;박상욱;이정우;이경철;이용배
    • 대한후두음성언어의학회지
    • /
    • 제9권1호
    • /
    • pp.53-58
    • /
    • 1998
  • Objectives : To compare the voice quality and voice problems of untrained professional voice user groups with that of normal control group without voice problem. Materials and Methods : The sustained vowel sounds of 13 male and 36 female teachers, 46 clergies and 15 telephone operators, and 40 normal male and 20 normal female persons were analyzed, using a videostroboscopy and acoustic analyzer. Together with these analyses, a questionnaire associated with risk factors for current and past voice problems was handed over to the patients. Results : The most common symptom in subjective groups was the voice fatigue. In stroboscopic examination, the professional voice user groups shelved functional voice disorder findings regardless of the Intensity of voice use. In the clergy and teacher using loud voice, vocal polyp, vocal nodule and hyperfunction of laryngeal muscle were frequently observed. In the clergy and telephone operator, jitter and shimmer were significantly increased. In the female teacher, the value of jitter, fundamental frequency variation and fundamental frequency were statiscally significant. However, the voice of male teacher showed no significant findings in the acoustic and aerodynamic studies. Conclusion : In the management of voice problems for untrained professional voice user groups, it is important to find the exact causes and patterns of voice problems, and to be individualized the management according to the causes.

  • PDF

실용음악의 기식성발성으로 인한 목소리 손상 최소화 연습방법 (Vocal Exercises for Reducing Vocal Damages Caused by Breathy Phonation in Pop Singing)

  • 유미란
    • 대한후두음성언어의학회지
    • /
    • 제28권1호
    • /
    • pp.14-16
    • /
    • 2017
  • Pop singers frequently use breathy voice to express diverse emotion. Such method is the major factor that divides vocalization in pop and classical music. Using breathy voice too much for a long time could make singer short-winded, which might cause the voice injured. In order to prevent the problem, singers need to find resonance balance between high notes and low notes and among vowels. Moreover, they should take more attention when producing resonance in consonants with much air flow. Along with finding resonance balance, if skilled at controlling the volume of voice, singers can use the breathy voice selectively at the desired part, adjusting close quotient freely. Through this kind of approach, pop singers can develope their unique style of vocalization and avoid the vocal damage.

  • PDF

VoiceXML VUI Browser 설계/구현 (Design and Implementation of VoiceXML VUI Browser)

  • 장민석;예상후
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.788-791
    • /
    • 2002
  • 현재의 웹 환경은 HTML로 구성이 되어있으며 이로 인해 하이퍼링크를 따라가기 위해 마우스 클릭을 통해 작업하는 GUI 환경이 주를 이룬다. 하지만 이러한 방법은 인간이 가장 손쉽게 사용하는 음성과 비교해 볼 때 상당히 불편한 축에 속한다. 본 논문에서는 이를 해결하기 위해 현재 무르익은 음성인식/합성 기술과 전화기를 통해 정보를 제공하고자 하는 XML의 파생언어인 VoiceXML을 이용하여, 현재의 HTML주축인 GUI 웹 환경을 VoiceXML을 이용하여 VUI(Voice User Interface) 환경으로 전환해 주는 VoiceXML VUI Browser를 설계/구현하였다.

  • PDF

노인성 음성장애의 음성치료 효과 (The Effects of Voice Therapy in Age-related Dysphonia)

  • 김성태
    • 말소리와 음성과학
    • /
    • 제2권2호
    • /
    • pp.117-121
    • /
    • 2010
  • The This study aimed to evaluate the effects of the voice therapy we operated to the patients with age-related dysphonia. Thirty four participants who were diagnosed as age-related dysphonia in laryngoscopic finding from January, 2009 to December, 2009 completed the study. The participants were aged from 60 to 82 years old with a mean age of 70.6. All participants had received the abdominal breath technique, SKHPIP with laughter, and basic vocal training with description of their problem, the length of which ranged from four sessions to twelve sessions. We executed the videostroboscopy to compare the aspect of voicing change and the perceptual assessment, voice range profile, acoustic and aerodynamic measures to identify change of voice. Participants had glottal gap due to incomplete glottic closure during voicing on the pretest. After they took the voice therapy, the glottic gap became narrow and rough and breathy voice was reduced. There were significant difference in acoustic and aerodynamic measures. Jitter, Shimmer, MFR were reduced and MPT, Psub were increased(p<.05). Participants' pitch range and intensity range were increased on the posttest performance after taking voice therapy. Especially, most of them were showed that pitch range was increased significantly in high frequency area. The results of this investigation indicate that the voice therapy using abdominal breath, SKHPIP, and exercise together is effective for the patients who have age-related dysphonia to improve their voice quality. We recommend to apply this technique to functional voice disorders who are showed glottal gap.

  • PDF

음성 에너지 최대화와 묵음 특징 정규화를 이용한 잡음 환경에 강인한 음성 검출 (Voice Activity Detection in Noisy Environment using Speech Energy Maximization and Silence Feature Normalization)

  • 안찬식;최기호
    • 디지털융복합연구
    • /
    • 제11권6호
    • /
    • pp.169-174
    • /
    • 2013
  • 음성 인식 성능 저하의 문제는 모델 훈련 환경과 인식 환경의 차이이다. 이러한 환경의 불일치를 줄이기 위한 방법으로 다양한 묵음 특징 정규화 방법을 사용하고 있다. 기존의 묵음 특징 정규화 방법은 낮은 신호 대 잡음비에서 묵음 구간의 에너지 레벨이 증가하여 음성과 비음성에 대한 분류의 정확도가 떨어짐으로 인해 인식 성능이 저하되는 문제점이 있다. 본 논문에서는 음성 에너지 최대화와 묵음 특징 정규화를 이용한 잡음 환경에 강인한 음성 검출 방법을 제안하였다. 제안한 방법은 높은 신호 대 잡음비에서는 음성 에너지를 최대화시켜 특징이 잡음의 영향을 적게 받는 특성을 이용하였고 낮은 신호 대 잡음비에서는 음성/비음성의 켑스트럼 특징 분포 특성을 이용하여 인식 성능을 향상시켰다. 인식 실험 결과 기존 방법에 비해 향상된 인식 성능을 확인할 수 있었다.

보이스피싱 발생 및 대응방안 (Voice Phishing Occurrence and Counterplan)

  • 조호대
    • 한국콘텐츠학회논문지
    • /
    • 제12권7호
    • /
    • pp.176-182
    • /
    • 2012
  • 보이스피싱(Voice Phishing)은 전화를 이용하여 개인정보를 불법적으로 알아내어 이를 토대로 예금을 인출해가는 사기수법으로 피해사례들이 속출하면서 새로운 사회문제로 등장하였다. 그 피해의 대상은 선량한 일반 시민으로 무차별적으로 공략하고 있으며 주로 중국인 대만인 등 외국인들에 의해 저질러지는 범죄이다. 범죄의 착수가 우리나라 국경 밖에서 이루어지고 있다는 점에서 새로운 형태의 범죄유형이라 할 수 있다. 이에 본 연구는 보이스피싱과 관련하여 현재의 발생실태와 사례를 분석하고 효과적인 대응현황을 모색하고자 한다. 보이스피싱 관련 범죄는 지속적인 홍보와 단속에도 불구하고 범죄가 근절되지 않고 오히려 수법이 다양화 전문화 되면서 발전해 가는 양상을 보이고 있다. 향후 보이스피싱을 근절하기 위해서는 금융 통신 수사분야에서 문제점에 대한 대응방안이 마련되어야 할 것으로 본다. 또한 신속한 수사의 착수와 수사관련 기법의 개발을 통해 경찰 단속활동이 강화되어야 할 것이고, 국제 범죄적 성격을 보이고 있으므로 인터폴등 관련기관 및 국제공조협력이 강화되어야 한다.

양성후두 질환의 지속모음을 대상으로 한 기존 피치 추정 방법들의 성능 비교 분석 (Comparative Analysis of Performance of Established Pitch Estimation Methods in Sustained Vowel of Benign Vocal Fold Lesions)

  • 장승진;김효민;최성희;박영철;최홍식;윤영로
    • 음성과학
    • /
    • 제14권4호
    • /
    • pp.179-200
    • /
    • 2007
  • In voice pathology, various measurements calculated from pitch values are proposed to show voice quality. However, those measurements frequently seem to be inaccurate and unreliable because they are based on some wrong pitch values determined from pathological voice data. In order to solve the problem, we compared several pitch estimation methods to propose a better one in pathological voices. From the database of 99 pathological voice and 30 normal voice data, errors derived from pitch estimation were analyzed and compared between pathological and normal voice data or among the vowels produced by patients with benign vocal fold lesions. Results showed that gross pitch errors were observed in the cases of pathological voice data. From the types of pathological voices classified by the degree of aperiodicity in the speech signals, we found that pitch errors were closely related to the number of aperiodic segments. Also, the autocorrelation approach was found to be the most robust pitch estimation in the pathological voice data. It is desirable to conduct further research on the more severely pathological voice data in order to reduce pitch estimation errors.

  • PDF