• 제목/요약/키워드: speech analysis

검색결과 1,585건 처리시간 0.031초

남성성악가의 Vocal Register Transition(Passaggio)시 공기역학적 변화와 EGG의 변화 연구 (Analysis of Phonatory Aerodynamic & E.G.G. during Passaggio of the Trained Male Singers)

  • 남도현;최성희;최재남;최홍식
    • 대한후두음성언어의학회지
    • /
    • 제15권1호
    • /
    • pp.21-26
    • /
    • 2004
  • Vocal Register Transition(Passaggio) is one of the most important vocal technique for classically trined male singers(tenor). Passaggio is that it bridges the chest register to head register without a noticeable voice break. Vocalist gest the feeling that voice is not locked a particular register. The purpose of this study was to clarify the difference between easy($B_3$) tone and non passaggio(F#_4$) & passaggio(F#_4$). We selected 6 trained singers(tenor), who had more than 12.6 years of experience and were well trained in passaggio technique. Simulataneous measurement was performed frequency(F0), mean flow rate(MFR), intensity(I), and subglottal pressure(Psub) using a phonatory function analyzer(Nagashima) and Closed Quotient(CQ), Jitter, Shimmer, NHR a Electro-glottography(EGG) of Lx. Speech Studio(Laryngogrph Lt, London, UK) and vocal efficiency was calculated by Carroll's method. For the tenor, target tone/a/was measured in three conditions : 1) easy phonation : $B_3$, 2) high tone without passaggio : F#_4$, 3) high tone with passaggio : F#_4$). The results revealed that F0 of the target tones between non-passaggio group and passaggio group were not significantly different though higher is F0, higher is subglottal pressure. And also CQ, MFR, Psub were increased in passagio than nonpssagio but these values were not statistically different. This study concluded that passaggio is the vocal technique to make the same quality of tone between chest register and head register in tenor.

  • PDF

경부형 전기인공후두 Blueton의 개발과 음향학적 성능 분석 (Development of Neck-Type Electrolarynx Blueton and Acoustic Characteristic Analysis)

  • 최성희;박용재;박영관;김태정;남도현;임성은;이성은;김한수;최홍식;김광문
    • 대한후두음성언어의학회지
    • /
    • 제15권1호
    • /
    • pp.37-42
    • /
    • 2004
  • Electrolarynx(EL), battery operated vibrators which are held against the neck by on-off button, has been widely used as a verbal communication method among post-laryngectomized patients. EL speech can produce easily without need of any additional surgery or special training and be used with any other methods. This institute developed a neck-typed EL named "Blueton" in commperation with EL Company Linkus, which consists of 3 parts : Vibrator part, Control part, Battery part. In this study we evaluated the acoustic characteristics of the produced voices by Blueton compared with Servox-inton using MDVP. Three EL users (2 full time users, 1 part time user) were participated. The results revelaed that NHR higher in Servox than Blueton and intensity is higher in Blueton than Servox. The spectra for vowels produced by EL speakers are mixed signals combined with talkers' vocal output and electrolarynx noise. The spectra pattern is similar with two ELs. High, SPI index and vowel spectra from MDVP demonstrated characteristics of both electrolarynxes related to noise signal. This finding suggests that Blueton helps to provide one of useful rehabilitation options in the post laryngectomy patients.

  • PDF

Coarticulation and vowel reduction in the neutral tone of Beijing Mandarin

  • Lin Maocan
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.207-207
    • /
    • 1996
  • The neutral tone is one of the most important distinguishing features in Beijing Mandarin, but there are two completely different views on its linguistic function: a special tone(Xu, 1980) versus weak stress(Chao, 1968). In this paper, the acoustic manifestation of the neutral tone will be explored to show that it is closely related to weak stress. 122 disyllabic words in which the second syllable carries the neutral tone, including 22 stress pairs, were uttered by a native male speaker of Beijing dialect and analysed by Kay Digital Sonagraph 5500-1. The results of the acoustic analysis are presented as follows: 1) The first two formants of the medial and the syllabic vowel moves towards that of central vowel with a greater magnitude in the syllable with the neutral tone than in the syllable with any of the four normal tones. Also the vowel ending, and nasal coda /n/ and / / in the syllable with the neutral tone tends to be deleted. 2) In the syllables with the neutral tone, there are strong carryover coarticulations between the medial and syllabic vowel and the preceding unvoiced consonant. In general, the vowel is affected to move towards the position of the central vowel with more greater magnitude by coronal consonant than by labial or velar consonant. 3) In the syllable with the neutral tone, when and only when it precedes a syllable with tone-4, the high vowel following [f], [ts'], [s], [ts'], [s], [tc'] or [c] tends to be voiceless. 4) It can be seen from the acoustical results of 22 stress pairs that the duration of the syllable with the neutral tone is on the average reduced to 55% of that of the syllable with the four normal tones, and the duration of the final in the syllable with neutral tone is on the average reduced to 45% of that of the final in the syllable with the four normal tones(Lin & Yan 1980). 5) The FO contour of the neutral tone is highly dependent on the preceding normal tone(Lin & Yan 1993). For a number of languages it has been found that the vowel space is reduced as the level of stress placed upon the vowel is reduced(Nord 1986). Therefore we reach the conclusion that the syllable with neutral tone is related to weak stress(Lin & Yan 1990). The neutral tone is not a special tone because the preceding normal tone.

  • PDF

Damping 요소를 첨가한 매칭 퍼슈잇 정현파 모델링 (Matching Pursuit Sinusoidal Modeling with Damping Factor)

  • 정규혁;김종학;임정우;주기호;이인성
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.105-113
    • /
    • 2007
  • 본 논문은 정현파 모델 기반의 코덱을 위한 매칭 퍼슈잇(Matching Pursuit)의 성능을 개선시킨 새로운 정현파 모델링을 제안한다. 제안하는 damping 요소를 첨가한 매칭 퍼슈잇 정현파 모델링은 과거와 현재 프레임에서 파라미터들간의 상관성을 이용하여 damping 요소를 정의하고 현재 프레임에서 보다 정확한 정현파 파라미터를 damping 요소에 따라 매칭 퍼슈잇 방법으로 추출한 후 합성한다. 따라서 인접 프레임과의 보간 없이 현재 프레임에서의 정현파 파라미터만으로 효율적인 모델링이 가능하다. 제안한 모델링 방법은 보간법을 사용한 일반적인 정현파 모델과 달리 추가지연을 가지지 않으면서 유성음 구간 신호뿐만 아니라 모든 구간에서 개선된 음질을 보인다. 제안한 모델링 방법의 성능을 SNR, MOS값, LR(Itakura-Saito likelihood ratio), CD(cepstral distance)를 통해 보간법을 사용한 매칭 퍼슈잇과 비교 평가한다.

특징 선택에서 선택적 평가를 사용하는 개미 군집 최적화의 수렴 특성 (Convergence Characteristics of Ant Colony Optimization with Selective Evaluation in Feature Selection)

  • 이진선;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.41-48
    • /
    • 2011
  • 최근 특징 선택에서 개미군집 최적화를 위한 선택적 평가 기법이 제안되었다. 이 기법은 불필요하거나 가능성이 적은 후보 해를 실제 평가 과정에서 제외함으로써 계산량을 줄인다. 실험을 통해 이 기법의 우수성을 보였으나, 하나의 데이터만을 사용하였으므로 통계적으로 충분한 신뢰성을 보여주지 못한다. 이 논문의 목적은 선택적 평가 기법의 수렴 특성을 분석하고 결론의 신뢰성을 높이는 것이다. 실험을 위해 UCI 데이터베이스에서 필기, 의료, 음성에 관련된 세가지 데이터를 선택하였다. 이들의 특징 집합 크기는 256부터 617까지 분포한다. 통계적으로 안정된 데이터를 얻기 위해, 이들 각각에 대해 프로그램을 독립적으로 12번 실행하였다. 긴 시간에 걸친 수렴을 관찰하기 위해, 각각의 프로그램 실행은 72시간 동안 이루어졌다. 실험 데이터의 분석을 바탕으로, 선택적 평가 기법의 우수성에 대한 이유와 이 기법의 적용 범위에 대해 기술한다.

음악요소와 노래 부르기를 활용한 호흡 및 구강훈련이 정상노인의 음성에 미치는 영향 (Effects of Respiration and Oral Motor Training based on Musical Elements and Singing on Voice of Healthy Elderly)

  • 전희운;김수지
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.380-387
    • /
    • 2011
  • 본 연구는 음악요소와 노래 부르기 중심의 호흡 및 구강운동 훈련이 정상노인 음성개선에 효과가 있는지 알아보고자 실시되었다. 연구 대상은 서울 소재 노인 기관에서 노래 부르기 활동에 참여하고 있는 65세~80세 노인 27명을 대상으로 실험군 11명, 통제군 16명을 무작위 분류하여 선정하였으며, 훈련은 4주 동안 25분씩 4회의 그룹치료 형태로 실시되었다. 연구 결과는 두 집단의 사전 사후 결과를 Praat(음성프로그램)으로 분석하였으며, 측정된 결과는 평균을 산출한 후 SPSS 19.0으로 통계처리를 하였다. 연구 결과에서 실험군은 강도(p < .001), 기본주파수(p < .01), 최대발성지속시간(p < .05), 일련운동속도(p < .001)가 유의미하게 향상을 보였으며, 통제군은 강도만 유의미한 차이로 감소를 보이고(p < .05), 나머지는 통계적으로 유의미하지 않은 감소를 보였다. 따라서 음악요소와 노래 부르기를 활용한 호흡 및 구강훈련은 노화로 인한 정상 노인의 음성 기능 개선에 치료적 효과를 나타내며, 이후 음성 장애를 예방하는 음성 훈련프로그램으로 활용될 수 있을 것이다.

안드로이드 플랫폼 기반 시각장애인용 음성도서 서비스 모델 구축 및 평가 (Designing and Evaluating an Audiobook Service Model on Android Platform for the Visually-Impaired)

  • 장원홍;오삼균
    • 정보관리학회지
    • /
    • 제32권2호
    • /
    • pp.221-236
    • /
    • 2015
  • 본 연구의 목적은 LG상남도서관 '책 읽어주는 도서관' 서비스의 안드로이드 플랫폼 기반 서비스 구축과정과 모델에 대한 기술과 그 서비스의 유용성을 평가하는 것이다. 연구방법은 서베이를 통한 이용자 요구조사, 이용현황통계분석 및 이용자 인터뷰를 실시하였고, 도출된 중요한 연구결과는 다음과 같다: 1) 시각장애인이 스마트기기 사용에 높은 관심을 보였고, 스마트기기를 사용해 본 적이 없는 시각장애인도 비용과 접근성만 해결된다면 사용할 의사가 있음을 표명하였으며, 2) 스트리밍보다는 다운로드 방식을 선호하는 것으로 나타났다. 3) 육성과 TTS 음성 차이를 중요하게 생각치 않는 것으로 밝혀졌으며, 4) 희망도서의 종류는 연령별로 각기 다른 선호도를 보였다. 5) 2014년 거의 14만 건의 다운로드가 이루어졌고 - 피처폰에 비해 36.3% 증가, 6) 가장 중요한 기능은 책갈피와 페이지/목차 이동 기능인 것으로 판명되었다.

한국어 양순 파열음 발음시 구강내압과 폐쇄기, VOT에 대한 연구 (The Study on Intraoral Pressure, Closure Duration and VOT During Phonation of Korean Bilabial Stop Consonants)

  • 표화영;최홍식
    • 대한후두음성언어의학회지
    • /
    • 제7권1호
    • /
    • pp.50-55
    • /
    • 1996
  • Acoustic analysis study was performed on 20 normal subjects by speaking nonsense syllables composed of Korean bilabial stops$(/P, P^{\star}, P^{h}/)$ and their preceding and/or following vowel /a/ (that is, $[pa, p^{\star}a, p^{h}a, apa, ap^{\star}a, ap^{h}a]$) with an ultraminiature pressure, sensor. in their mouths. Speech materials were phonated twice, once with a moderate voice, another time with a loud voice. The acoustic signal and intraoral pressure were recorded simultaneously on computer. By these procedures, we were to measure the intraoral pressure, closure duration and VOT of Korean bilabial stops, and to compare the values one another according to the intensity of phonation and the position of the target consonants. Intraoral pressure was measured by the peak intraoral pressure value of Its wave closure duration by the time interval between the onset of intraoral pressure build-up and the burst meaning the release of closure ; Voice onset time(VOT) on by the time interval between the burst and the onset or glottal vibration. Heavily aspirated bilabial stop consonant /$p^h$/ showed the highest intraoral pressure value, unaspirated /$p^{\star}$/, the second, slightly aspirated /P/, the lowest. The syllable initial bilabial stops showed higher intraoral pressure than word initial stops, and the value of loudly phonated consonants were higher than moderate consonants. The longest closure duration period was that of /$p^{\star}$/ and the shortest, /P/, and the duration was longer in word initial position and in the moderate voice. In VOT, the order of the longest to shortest was $/{p^h}/, /p/, /{p^\star}/$, and the value was shorer when the consonant was in intervocalic position and when it was phonated with a loud voice.

  • PDF

일개 광역시 지역주민의 뇌졸중 조기증상 인식도와 관련요인 (Awareness of Stroke Warning Symptoms and Related Factors among Residents in a Province)

  • 이유미;김건엽;김기수
    • 한국산학기술학회논문지
    • /
    • 제15권8호
    • /
    • pp.5116-5123
    • /
    • 2014
  • 이 연구에서는 일개 광역시 지역주민을 대상으로 하여 뇌졸중의 조기증상에 대한 인식도와 관련요인를 파악함으로써 향후 뇌졸중 조기 증상에 대한 인식도를 향상시킬 수 있는 교육 및 홍보 전략의 근거를 마련하고자 하였다. 연구 대상자는 일개 광역시에 거주하는 성인 585명이었으며, 전화조사를 통하여 대상자의 인구학적 특성과 뇌졸중 조기증상에 대한 인식도를 조사하였다. 조사 결과 '언어, 발음장애(84.6%)', '편마비(73.9%)' 등에 대한 인식도는 상대적으로 높은 반면, '몸의 균형장애(67.0%)', '시야장애(55.4%)', '심한 두통(51.3%)'에 대한 인식도는 낮은 편이었다. 선형회귀분석 결과 남성, 젊은 연령층, 가족력이 없을 때, 이웃의 뇌졸중 진단 경험이 없을 때, 학력이 낮을 때, 홍보물 접촉 경험이 없을 때 뇌졸중 조기증상에 대한 인식도가 낮았다. 뇌졸중 조기증상에 관한 인식도가 낮은 집단에 대하여 집단별 맞춤형 프로그램을 제공함으로써 홍보 및 교육의 효율성을 높일 수 있을 것이다.

Design of Implantable Microphone for Artificial Middle Ear System

  • Kim Min-Kyu;Lim Hyung-Gyu;Yoon Young-Ho;Lee Jyung-Hyun;Park Il-Yong;Song Byung-Seop;Kim Myoung-Nam;Cho Jin-Ho
    • 대한의용생체공학회:의공학회지
    • /
    • 제26권3호
    • /
    • pp.139-144
    • /
    • 2005
  • An implantable microphone that can be utilized as part of a totally implantable hearing aid is designed and implemented. The proposed microphone is implanted in the center of the pinna, and designed to ensure the speech frequency range and the appropriate sensitivity. The characteristics of the proposed microphone are evaluated using a finite element analysis (FEA). The microphone is composed of a small electric condenser microphone, titanium case 6.2mm in diameter and 3mm high, and $10{\mu}m$ SUS316L vibrating membrane in contact with hypodermic tissue to maintain the sensitivity of the microphone. The microphone components are all made of biocompatible materials, then the assembled microphone is hermetically sealed using a polymer and ceramic. Experiments with the fabricated microphone confirm an operational bandwidth of up to 5kHz without any decline of sensitivity in 6mm of hypodermic tissue.