• 제목/요약/키워드: Formant

검색결과 415건 처리시간 0.027초

소아 망진을 위한 얼굴 특징 추출 및 영아 산통 진단을 위한 울음소리 분석 (Face Feature Extraction for Child Ocular Inspection and Diagnosis of Colics by Crying Analysis)

  • 조동욱;김봉현
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.97-104
    • /
    • 2006
  • 의사 표현 능력이 떨어지는 소아들은 질병 발생시 이를 효과적으로 자신의 불편함을 표현할 방법이 없다. 따라서 임상의들은 소아 환자의 부모들로부터 문진(inquiring)을 통해 질병 진단을 하고 있는 것이 현 실정이며 이는 잘못된 진단 결과를 초래 할 수 있는 문제점을 가지고 있다. 이를 위해 본 연구에서는 인체 오장 육부의 생체 신호가 안면과 음성에 반영되어 나타난다는 한방 원리를 이용하여 소아 망진, 소아 청진 기기를 개발한다. 그 결과 진단시 임상의들의 직관을 시각화, 객관화, 정량화하여 소아 질병 진단의 정확성을 기하고자 한다. 본 논문은 전체 개발 시스템 중 그 첫 번째 작업 수행 결과로서 소아 망진의 경우 색상 보정, YCbCr 적용과 살색 영역 선정 그리고 오관 및 명당 추출 방법 등을 개발한다. 또한 소아 청진의 경우 피치, 강도, 포먼트 분석을 통해 영아 산통 질병의 울음소리 특성을 수치화하였으며 이를 통해 임상의들의 직관을 객관화한다. 끝으로 실험에 의해 제안한 방법의 유용성을 입증한다.

비디오투시조영검사를 통한 침습/흡인에 따른 음성의 음향적 분석 (Acoustic Voice Analysis in Patients with Penetration/Aspiration Via Videofluoroscopic Swallowing Study)

  • 강영애;지성주;구본석
    • Korean Journal of Otorhinolaryngology-Head and Neck Surgery
    • /
    • 제60권9호
    • /
    • pp.454-462
    • /
    • 2017
  • Background and Objectives The present study aimed to investigate the effects of penetration/aspiration (P/A) on voice acoustic parameters. Subjects and Method Twenty-seven patients were analyzed with the videofluoroscopic swallowing study (VFSS) and then divided into two groups based on the modified Penetration and Aspiration Scale results. Ten patients (5 males and 5 females) were included in the Non-P/A group, and 17 patients (12 males and 5 females) in the P/A group. Stroke was the major cause of swallowing disorders. Three sustained /a/ vowels recorded in pre- and post-VFSS were analyzed. Mann-Whitney U-test was used to compare acoustic values before and after VFSS, and the receiver operating characteristics (ROC) curve with combination of significant parameters was also conducted. Results Among acoustic parameters, the length of analyzed sample (p=0.010), number of segments computed (p=0.018), total number detected pitch periods (p=0.017), and second formant (p=0.013) in pre- and post-VFSS were significantly different between Non-P/A and P/A groups. In the P/A group after VFSS, the means of these significant parameters decreased. According to ROC combined with four significant parameters, the probability of predicting P/A condition was 84% (p=0.005), the sensitivity was 80%, and the specificity was 80%. Conclusion Voice acoustic analysis can reflect voice changes by penetration/aspiration and the combination of significant parameters can also detect swallowing disorders. Therefore, voice analysis can be a reliable screening tool for patients with swallowing disorders.

카페인 섭취량 증가에 따른 음성 분석 요소의 변화 측정 (Change Measurement of Voice Analysis Parameter by an Increase of Intake the Caffeine)

  • 서경원;장영조;강덕현;배정수;연용흠;임순용;민지선;김봉현;가민경;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.656-659
    • /
    • 2010
  • 오늘날 현대 사회에서 여가생활시간이 늘어나고 이에 따라 사람들은 잦은 커피타임을 갖고 있으며 이로 인해 커피의 섭취량이 날로 늘어나고 있다. 날로 늘어나는 커피 섭취량과 같이 커피의 주성분인 카페인 섭취량 또한 날로 증가 하고 있다. 따라서 본 논문에서는 카페인의 성분과 효능, 인체에 미치는 영향 정도와 음성에 관여하는 정도 등에 대한 결과를 추출하여 실질적으로 카페인이 음성에 미치는 요소를 분석하였다. 이를 위해 본 논문에서는 음성분석 프로그램인 Praat를 사용하였으며 성대의 변화량과 몸 속의 공명음인 Formant를 실험 요소로 적용하였다. 데이터 자료에서 유용성을 입증하고 문제점 해결에 대해 분석하였으며 실험에 의해 제안한 방법의 활용성을 입증하는 연구를 수행하였다.

음성학적 분석 기반의 간접흡연이 조음기관에 미치는 영향 (The Effects of Secondhand Smoking on Articulators Based on Phonetic Analysis)

  • 서경원;강덕현;배정수;장영조;연용흠;임순용;민지선;김봉현;가민경;조동욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.648-651
    • /
    • 2010
  • 웰빙의 바람을 타고 이제 자신의 건강을 관리하는 사람들이 많아지고, 흡연에 대한 좋지 않은 인식이 높아지면서 금연의 열풍이 강하게 불고 있다. 하지만 금연을 한다고 해도 주위의 담배연기는 우리 몸의 건강을 해치기 때문에 담배연기로부터 해방되기는 매우 어렵다. 실제로 흡연하는 배우자를 가진 사람은 그렇지 않은 사람에 비해 심장병 발생률은 40%, 폐암 발생률은 30%가 더 높다. 따라서 본 논문에서는 간접흡연이 인체의 조음기관에 미치는 영향을 분석하기 위해 간접흡연에 따른 음성의 변화를 측정하고 비교, 분석하는 실험을 수행하였다. 이를 위해 간접흡연 전과 후의 음성을 수집하여 음성분석학적 요소 기술 중 Pitch, Jitter, Shimmer 등의 성대 진동 요소를 적용하고 인체 내의 공명기관을 분석하는 Formant를 적용하여 실험을 수행하여 간접흡연이 음성에 미치는 영향을 연구하였다.

PATTERNS OF ASSIMILATION OF IGBO VOWELS : AN ACOUSTIC ACCOUNT

  • Clara I. Ikekeonwu
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.514-514
    • /
    • 1996
  • Igbo, a new Benue Congo language has a vowel harmony system which, like that of Akan, is based on the pharynx size or tongue root position. In this study we examine Igbo vowel harmony with particular reference to assimilatory patterns of vowels in different harmony sets. This is to gain some insight into the factors involved in Igbo vowel assimilation, and to establish to what extent reports on Akan vowel assimilation are validated in Igbo. Tokens of the eight phonemic vowels of Standard Igbo are recorded from three native speakers of Igbo. The vowels are acoustically investigated (using the LPC analysis of CSL) in individual lexical items and within carefully designed carrier phrases. The F1 and F2 values of the vowels are obtained as these formant values are generally useful in establishing the salient characteristics of vowels. Vowels from the harmony sets are juxtaposed in the carrier phrases to ascertain the extent of assimilation. Results of the investigation show that the F1 values, to a large extend, are enough to characterize these vowels. The (-Expanded) vowels have higher F1 values than their (+Expanded) counterpart. Where there is an overlap in F1 values for some vowels the F1 bandwidth values serve to distinguish between the vowels. The overlap often reported in Akan for /I/ and /e/ on the one hand and /${\mho}$/ and /o/ on the other is not validated in Igbo. While the F1 values for these pairs of vowels are quite similar for one of our speakers, there is an appreciable difference between the F1 values of these vowels for the other two speakers. There is however an overlap for /e/ and /o/ for one of the speakers. Assimilations are generally regressive across word boundaries. It is, however, necessary to point out that the general perceptual impression that one of the vowels completely assimilates to the other, is not borne out by our investigation. Most of our F1 and F2 values for the vowels in individual lexical items are altered in assimilations. This then suggests that assimilation involving these vowels is partial rather than complete. The emerging 'allophones' are acoustically similar to the (+Expanded) vowel involved in the assimilation, that is when vowels from different harmony sets are involved. We conclude that while assimilation of Igbo vowels involves some phonological considerations, phonetic factors appear to be permanent in deciding the final form of the vowels.

  • PDF

캡스트럼 분석을 이용한 해금의 스펙트럼 모델링 (Spectral Modeling of Haegeum Using Cepstral Analysis)

  • 홍연우;강명수;조상진;김종면;이정철;정의필
    • 한국음향학회지
    • /
    • 제29권4호
    • /
    • pp.243-250
    • /
    • 2010
  • 본 논문에서는 해금 소리의 시간에 따른 변화를 사실적으로 묘사하기 위해 캡스트럼 분석을 이용한 전통 악기 해금의 스펙트럼 모델링을 제안한다. 정확한 캡스트럼 분석 결과를 얻기 위해 프레임 사이즈는 입력 신호의 3주기로 하였고 포만트 추출에 더 많은 캡스트럼 계수를 활용하였다. 정현파 성분 합성 과정에서 대역통과 필터의 차단주파수를 공명점 별로 유동적으로 조절하고 노이즈 성분에 남아있는 피크 성분들을 제거하는 과정을 추가하여 성능을 향상시켰다. 음 높이의 변화를 판단하기 위해 입력 프레임을 묵음구간, 어택구간, 지속구간으로 분류하였고 기본주파수에 따라 프레임 사이즈를 가변적으로 조절하였으며 지속구간에서의 기본주파수 검출 오류를 수정함으로써 정확도를 향상시켰다. 해금 연주 전문가의 청취테스트를 통해 원음과 합성음이 96~100 % 유사하다는 평가 결과를 얻었다.

말하는 닭의 발성 특성 분석 (Vocal Analysis of Talking Rooster)

  • 견두헌;배명진
    • 한국음향학회지
    • /
    • 제29권2호
    • /
    • pp.125-132
    • /
    • 2010
  • 예로부터 사람의 말을 흉내 낼 수 있는 동물들은 특별한 대우를 받고 있다. 이러한 동물은 앵무새를 비롯한 매우 극소수에 해당하며, 닭이 사람의 목소리를 내는 경우는 지금까지 알려진 바가 없다. 본 논문에서는 최근 화제가 된 한국과 키르기스스탄의 말하는 닭의 발성 특성을 살펴보고, 발음 통계와 실제 음원을 분석하였다. 분석결과 닭이 실제로 사람과 대화를 하는 것은 아니지만, 닭의 날개를 잡을 경우 "안돼," "아니야" 등의 한글 발음을 하는 것으로 확인하였으며, 키르기스스탄의 닭 역시 사람과 매우 유사한 발음을 하는 것으로 확인되었다. 청음 설문조사 결과에서도 대부분의 사람이 닭이 말하는 단어를 인지하였으며, 닭이 내는 소리로 판단한사람은 없었다. 이처럼 닭이 사람의 발음을 할수 있는 이유는, 선천적인 발음기관과 발성시의 기질적 특정이 일반 닭과 현저히 다르며, 사람에게 붙잡힐 때 긴장에 따른 성대/발성 특성 변화때문으로 판단된다.

언어재활사의 주관적 음성피로도와 관련된 음향적 특성 (Acoustic characteristics of speech-language pathologists related to their subjective vocal fatigue)

  • 전혜원;김지연;성철재
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.87-101
    • /
    • 2022
  • 대전·충남지역 20-30대 여성 언어재활사 50명을 대상으로 주관적 음성 피로도 설문과 더불어 하루 4회기를 기준으로 언어치료 전/후 음성 샘플 수집을 하였다. 연구 결과, Korean Vocal Fatigue Index의 음성 피로로 인한 음성 사용회피 항목과 음성 사용으로 인한 신체 피로 항목에서 피로 집단과 피로 없는 집단 간 유의한 차이가 있었다. 두 집단의 음향음성학적 특성과 관련하여, 두 집단 모두 치료 후 저주파 대역 에너지가 상대적으로 낮아지고 고주파 대역 에너지가 상승하는 패턴을 보였다. 이러한 특징이 분산분석 결과, 주 효과로 나타난 low to high-ratio[t1(time.1)>t2(time.2)], slope_ltas(t2>t1), 3rd formant's energy(t1>t2), high energy(t2>t1) 등에 잘 반영되어 있다. 집단 간 차이는 음향변수들 중 치료 전 모음 연장발성 스펙트럼 저주파 대역의 에너지인 low energy에서만 관찰되었고 피로 없는 집단의 값이 더 컸다(no.fatigue>fatigue in t1). 음향변수에서의 이러한 특징과 더불어 치료 세션 후 피로 없는 집단의 연결발화에서의 왜도 증가는 장시간의 목소리 노동으로 인한 성대 과긴장(higher muscle tonus)과 목소리 남용 때문으로 해석할 수 있다. 섭동변수 shimmer_local은 피로 없는 집단이 언어치료 후 낮아졌고(t1>t2), 켑스트럼 변수인 RNR(rhamonics to noise ratio)은 언어치료 후 값이 높아졌다(t2>t1). NHR(noise to harmonic ratio)은 두 집단 모두 치료 후 낮아졌다. NHR의 감소와 shimmer_local의 하강은 치료 세션을 진행하면서 발성 과정이 안정화되었거나 혹은 전문 지식이 있는 언어재활사(특히 피로 없는 집단)들의 효율적 목소리 사용이 기여했다고 결론지을 수 있다. 피로 없는 집단의 경우는 치료 후에 RNR값이 유의하게 커졌으므로 치료 후 오히려 조화음(harmonic) 구조가 더 안정되었다고도 말할 수 있을 것이다.

하악전돌증환자(下顎前突症患者)의 악교정수술후(顎矯正手術後) 음성변화(音聲變化)에 관(關)한 연구(硏究) (THE STUDY OF PHONETIC CHANGE AFTER THE ORTHOGNATHIC SURGERY FOR THE PATIENT OF MANDIBULAR PROGNATHISM)

  • 김병주;김여갑
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제15권4호
    • /
    • pp.239-252
    • /
    • 1993
  • This study was done to analyze phonetic dysfunction and the effect of orthognathic surgery to phonation in the patients of mandibular prognathism. 20 persons were chosen as normal group and 20 patients of mandibular prognathism as abnormal for this study. 5 vowel sounds-'ㅏ(a)', 'ㅔ(e)', 'ㅣ(i)', 'ㅗ(o)', 'ㅜ(u)' and 14 consonant sounds-'ㄱ(g)', "ㄴ(n), 'ㄷ(d)', 'ㄹ(l)', 'ㅁ(m)', 'ㅂ(b)', 'ㅅ(s)', 'ㅇ(ng)', 'ㅈ(j)', 'ㅊ(ch)', 'ㅋ(k)', 'ㅌ(t)', 'ㅍ(p)', 'ㅎ(h)', were checked. We recorded these sounds in the period of preopration, postop. 12 months, postop. 24 months. A Formant ratio and a length of consonant time were studied with discriminant analysis. As a result of the study, the following conclusion were gained. 1. As a result of the analysis on vowel dysfunction patiensts of mandibular prognathism, more than 80% of men patients showed the dysfunction in prelingual sound 'ㅔ(e)' and 'ㅣ(i)'. More than 70% of women patients showed the dysfunction in all vowel. 2. One year later from the orthognathic surgery, men patients showed a marked improvement in 'ㅏ(a)'. The next were 'ㅗ(o)', 'ㅜ(u)' and 'ㅣ(i)'. Women patients showed a marked improvement in 'ㅜ(u)'. 3. Two year later from the orthognathic surgery, men patients showed a marked improvement in prelingual sound 'ㅔ(e)' and postlingual sound 'ㅗ(o)'. Women patients showed a marked improvement in 'ㅏ(a)'. More than 20% of patients showed the phonetic improvement compared with the condition of the postop. 12 months. 4. As a result of the analysis on consonant dysfunction patient of mandibular prognathism. more than 80% of men patients showed the dysfunction in lingual sound 'ㅅ(s)'. Most women patients showed the dysfunction in labial sound 'ㅁ(m)' and lingual sound 'ㄴ(n)'. More than 50% of patients showed the dysfunction in labial sound and lingual sound. 5. One year later from the orthognathic surgery. men patients showed a complete improvement in hard palatal sound 'ㅈ(j)'. The next were labial sound 'ㅂ(b)', lingual sound 'ㅅ(s)', soft palatal sound 'ㄱ(g)' and 'ㅋ(k)'. Women patients showed a marked improvement in soft palatal sound 'ㅇ(ng)' and 'ㄱ(g)'. 6. Two year later from the orthognathic surgery, all patients showed remarkable improvement in consonant sounds. except for labial sound 'ㅁ(m)', 'ㅍ(p)' and lingual sound 'ㄴ(n)'. The improvement ratio was increased as the time was going on compared with the condition of postop 12 months.

  • PDF

침치료가 뇌졸중으로 인한 구음장애에 미치는 음향적 특성에 대한 증례보고 (Clinical Acoustic Study of Acupuncture Therapy Effects on Post-Stroke Dysarthria)

  • 이민구;박세욱;이선우;유현희;이승언;김용정;손지우;임은경;김성남;이인;문병순;윤종민
    • 대한한방내과학회지
    • /
    • 제26권3호
    • /
    • pp.660-669
    • /
    • 2005
  • Objectives : The aim of this study is to find the acoustic characteristics of acupuncture therapy effects on post-stroke dysarthria. Methods : Acupuncture therapy was applied for four to six weeks by inserting needles into eight acupuncture points, CV23, CV24, bilateral 'Sheyu' and ipsilateral ST4, ST6 and contralateral LI4, ST36 on facial palsy side. All the speech samples were collected, pre-treatment and post-treatment, using Computerized Speech Lab. VOT and TD of each speech sample and vowel formant(F1&F2) were analyzed on spectrogram. Result : VOT and TD were decreased after treatment. F1 was decreased, and F2 was increased after treatment. Conclusions : This suggests that acupuncture therapy improves symptoms of post-stroke dysarthria by stimulating articulation organs such as tongue, lips, cheeks, larynx and pharynx.

  • PDF