• 제목/요약/키워드: formant characteristics

검색결과 128건 처리시간 0.026초

소아 망진을 위한 얼굴 특징 추출 및 영아 산통 진단을 위한 울음소리 분석 (Face Feature Extraction for Child Ocular Inspection and Diagnosis of Colics by Crying Analysis)

  • 조동욱;김봉현
    • 정보처리학회논문지B
    • /
    • 제13B권2호
    • /
    • pp.97-104
    • /
    • 2006
  • 의사 표현 능력이 떨어지는 소아들은 질병 발생시 이를 효과적으로 자신의 불편함을 표현할 방법이 없다. 따라서 임상의들은 소아 환자의 부모들로부터 문진(inquiring)을 통해 질병 진단을 하고 있는 것이 현 실정이며 이는 잘못된 진단 결과를 초래 할 수 있는 문제점을 가지고 있다. 이를 위해 본 연구에서는 인체 오장 육부의 생체 신호가 안면과 음성에 반영되어 나타난다는 한방 원리를 이용하여 소아 망진, 소아 청진 기기를 개발한다. 그 결과 진단시 임상의들의 직관을 시각화, 객관화, 정량화하여 소아 질병 진단의 정확성을 기하고자 한다. 본 논문은 전체 개발 시스템 중 그 첫 번째 작업 수행 결과로서 소아 망진의 경우 색상 보정, YCbCr 적용과 살색 영역 선정 그리고 오관 및 명당 추출 방법 등을 개발한다. 또한 소아 청진의 경우 피치, 강도, 포먼트 분석을 통해 영아 산통 질병의 울음소리 특성을 수치화하였으며 이를 통해 임상의들의 직관을 객관화한다. 끝으로 실험에 의해 제안한 방법의 유용성을 입증한다.

비디오투시조영검사를 통한 침습/흡인에 따른 음성의 음향적 분석 (Acoustic Voice Analysis in Patients with Penetration/Aspiration Via Videofluoroscopic Swallowing Study)

  • 강영애;지성주;구본석
    • Korean Journal of Otorhinolaryngology-Head and Neck Surgery
    • /
    • 제60권9호
    • /
    • pp.454-462
    • /
    • 2017
  • Background and Objectives The present study aimed to investigate the effects of penetration/aspiration (P/A) on voice acoustic parameters. Subjects and Method Twenty-seven patients were analyzed with the videofluoroscopic swallowing study (VFSS) and then divided into two groups based on the modified Penetration and Aspiration Scale results. Ten patients (5 males and 5 females) were included in the Non-P/A group, and 17 patients (12 males and 5 females) in the P/A group. Stroke was the major cause of swallowing disorders. Three sustained /a/ vowels recorded in pre- and post-VFSS were analyzed. Mann-Whitney U-test was used to compare acoustic values before and after VFSS, and the receiver operating characteristics (ROC) curve with combination of significant parameters was also conducted. Results Among acoustic parameters, the length of analyzed sample (p=0.010), number of segments computed (p=0.018), total number detected pitch periods (p=0.017), and second formant (p=0.013) in pre- and post-VFSS were significantly different between Non-P/A and P/A groups. In the P/A group after VFSS, the means of these significant parameters decreased. According to ROC combined with four significant parameters, the probability of predicting P/A condition was 84% (p=0.005), the sensitivity was 80%, and the specificity was 80%. Conclusion Voice acoustic analysis can reflect voice changes by penetration/aspiration and the combination of significant parameters can also detect swallowing disorders. Therefore, voice analysis can be a reliable screening tool for patients with swallowing disorders.

PATTERNS OF ASSIMILATION OF IGBO VOWELS : AN ACOUSTIC ACCOUNT

  • Clara I. Ikekeonwu
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.514-514
    • /
    • 1996
  • Igbo, a new Benue Congo language has a vowel harmony system which, like that of Akan, is based on the pharynx size or tongue root position. In this study we examine Igbo vowel harmony with particular reference to assimilatory patterns of vowels in different harmony sets. This is to gain some insight into the factors involved in Igbo vowel assimilation, and to establish to what extent reports on Akan vowel assimilation are validated in Igbo. Tokens of the eight phonemic vowels of Standard Igbo are recorded from three native speakers of Igbo. The vowels are acoustically investigated (using the LPC analysis of CSL) in individual lexical items and within carefully designed carrier phrases. The F1 and F2 values of the vowels are obtained as these formant values are generally useful in establishing the salient characteristics of vowels. Vowels from the harmony sets are juxtaposed in the carrier phrases to ascertain the extent of assimilation. Results of the investigation show that the F1 values, to a large extend, are enough to characterize these vowels. The (-Expanded) vowels have higher F1 values than their (+Expanded) counterpart. Where there is an overlap in F1 values for some vowels the F1 bandwidth values serve to distinguish between the vowels. The overlap often reported in Akan for /I/ and /e/ on the one hand and /${\mho}$/ and /o/ on the other is not validated in Igbo. While the F1 values for these pairs of vowels are quite similar for one of our speakers, there is an appreciable difference between the F1 values of these vowels for the other two speakers. There is however an overlap for /e/ and /o/ for one of the speakers. Assimilations are generally regressive across word boundaries. It is, however, necessary to point out that the general perceptual impression that one of the vowels completely assimilates to the other, is not borne out by our investigation. Most of our F1 and F2 values for the vowels in individual lexical items are altered in assimilations. This then suggests that assimilation involving these vowels is partial rather than complete. The emerging 'allophones' are acoustically similar to the (+Expanded) vowel involved in the assimilation, that is when vowels from different harmony sets are involved. We conclude that while assimilation of Igbo vowels involves some phonological considerations, phonetic factors appear to be permanent in deciding the final form of the vowels.

  • PDF

언어재활사의 주관적 음성피로도와 관련된 음향적 특성 (Acoustic characteristics of speech-language pathologists related to their subjective vocal fatigue)

  • 전혜원;김지연;성철재
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.87-101
    • /
    • 2022
  • 대전·충남지역 20-30대 여성 언어재활사 50명을 대상으로 주관적 음성 피로도 설문과 더불어 하루 4회기를 기준으로 언어치료 전/후 음성 샘플 수집을 하였다. 연구 결과, Korean Vocal Fatigue Index의 음성 피로로 인한 음성 사용회피 항목과 음성 사용으로 인한 신체 피로 항목에서 피로 집단과 피로 없는 집단 간 유의한 차이가 있었다. 두 집단의 음향음성학적 특성과 관련하여, 두 집단 모두 치료 후 저주파 대역 에너지가 상대적으로 낮아지고 고주파 대역 에너지가 상승하는 패턴을 보였다. 이러한 특징이 분산분석 결과, 주 효과로 나타난 low to high-ratio[t1(time.1)>t2(time.2)], slope_ltas(t2>t1), 3rd formant's energy(t1>t2), high energy(t2>t1) 등에 잘 반영되어 있다. 집단 간 차이는 음향변수들 중 치료 전 모음 연장발성 스펙트럼 저주파 대역의 에너지인 low energy에서만 관찰되었고 피로 없는 집단의 값이 더 컸다(no.fatigue>fatigue in t1). 음향변수에서의 이러한 특징과 더불어 치료 세션 후 피로 없는 집단의 연결발화에서의 왜도 증가는 장시간의 목소리 노동으로 인한 성대 과긴장(higher muscle tonus)과 목소리 남용 때문으로 해석할 수 있다. 섭동변수 shimmer_local은 피로 없는 집단이 언어치료 후 낮아졌고(t1>t2), 켑스트럼 변수인 RNR(rhamonics to noise ratio)은 언어치료 후 값이 높아졌다(t2>t1). NHR(noise to harmonic ratio)은 두 집단 모두 치료 후 낮아졌다. NHR의 감소와 shimmer_local의 하강은 치료 세션을 진행하면서 발성 과정이 안정화되었거나 혹은 전문 지식이 있는 언어재활사(특히 피로 없는 집단)들의 효율적 목소리 사용이 기여했다고 결론지을 수 있다. 피로 없는 집단의 경우는 치료 후에 RNR값이 유의하게 커졌으므로 치료 후 오히려 조화음(harmonic) 구조가 더 안정되었다고도 말할 수 있을 것이다.

한국어 스펙트럼과 캡스트럼 측정시 안면마스크의 영향: 남녀 성우 2인 사례 연구 (Impact of face masks on spectral and cepstral measures of speech: A case study of two Korean voice actors)

  • 양원영;권미지
    • 한국음향학회지
    • /
    • 제43권4호
    • /
    • pp.422-435
    • /
    • 2024
  • 본 연구의 목적은 안면 마스크가 한국어에 미치는 영향을 음향적, 공기역학적, 포먼트 매개변수 측면에서 검증하고자 하였다. 국내에서 판매되는 모든 종류의 마스크를 필터 성능과 접이식 방식을 기준으로 선택하였다. 본 연구에는 표준 한국어를 구사하는 경력 20년 이상의 한국인 전문 성우 2명(남녀)이 음성 데이터의 화자로 참여하였다. 연구 결과, 안면 마스크는 고주파수 범위를 약화시켜 Vowel Space Area(VSA) 및 Vowel Articulation Index(VAI) 점수를 감소시키고 모든 음성 샘플에서 Low-to-High spectral ratio(L/H ratio)을 증가시킨 것으로 나타났다. 이로 인해 음성 명료도가 낮아질 수 있음을 파악하였다. 그러나 음성 특성에 따라 증가 및 감소 정도가 결정되며 여성 화자의 경우 안면 마스크 두께가 증가함에 따라 Speech Level(SL)과 Cepstral Peak Prominence(CPP)가 증가하였다. 그러나 남성 화자의 경우 안면 마스크 두께가 증가함에 따라 이 두 매개변수가 감소하였다. 결론적으로, 본 연구에서는 마스크의 유무나 필터 성능이 음성 특성에 따른 음성 음향 매개변수에 영향을 미치는 것으로 나타났다. 안면 마스크는 음성 강도가 충분히 강하지 않거나 환경의 반향이 덜할 때 음성 노력에 영향을 미치는 것으로 나타났다. 마스크 착용시 음향 변형을 극복하기 위해 안면 마스크로 유도된 음성 노력에 대한 추가적인 연구가 수행되어야 함을 시사한다.

침치료가 뇌졸중으로 인한 구음장애에 미치는 음향적 특성에 대한 증례보고 (Clinical Acoustic Study of Acupuncture Therapy Effects on Post-Stroke Dysarthria)

  • 이민구;박세욱;이선우;유현희;이승언;김용정;손지우;임은경;김성남;이인;문병순;윤종민
    • 대한한방내과학회지
    • /
    • 제26권3호
    • /
    • pp.660-669
    • /
    • 2005
  • Objectives : The aim of this study is to find the acoustic characteristics of acupuncture therapy effects on post-stroke dysarthria. Methods : Acupuncture therapy was applied for four to six weeks by inserting needles into eight acupuncture points, CV23, CV24, bilateral 'Sheyu' and ipsilateral ST4, ST6 and contralateral LI4, ST36 on facial palsy side. All the speech samples were collected, pre-treatment and post-treatment, using Computerized Speech Lab. VOT and TD of each speech sample and vowel formant(F1&F2) were analyzed on spectrogram. Result : VOT and TD were decreased after treatment. F1 was decreased, and F2 was increased after treatment. Conclusions : This suggests that acupuncture therapy improves symptoms of post-stroke dysarthria by stimulating articulation organs such as tongue, lips, cheeks, larynx and pharynx.

  • PDF

하악골 전돌증 수술 후 하악골 이동량에 따른 발음 양상에 관한 비교 연구 (COMPARISON OF SPEECH PATTERNS ACCORDING TO THE DEGREE OF SURGICAL SETBACK IN MANDIBULAR PROGNATHIC PATIENTS)

  • 신기영;이동근;오승환;성헌모;이숙향
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제23권1호
    • /
    • pp.48-58
    • /
    • 2001
  • After performing mandibular setback surgery, we found some changes in patterns and organs of speech. This investigation was undertaken to investigate the aspect and degree of speech patterns according to the amount of surgical setback in mandibular prognathic patients. Thirteen patients with skeletal Class III malocclusion were studied preoperative and postoperative over 6 months. They had undergone the mandible setback operation via bilateral sagittal split ramus osteotomy(BSSRO). We split the patients into two groups. Group 1 included patients whose degree of mandibular setback was 6mm or less, and Group 2 above 6mm. Control group was two adults wish normal speech patterns. A phonetician performed narrow phonetic transcriptions of tape-recorded words and sentences produced by each of the patients and the acoustic characteristics of the plosives, fricatives, and flaps were analyzed with a phonetic computer program (Computerized Speech Lab(CSL) Model 4300B(USA)). The results are as follows: 1. Generally, Patients showed longer closure duration of plosives, shorter VOT(voice onset time) and higher ratio of closure duration against VOT. 2. Patients showed more frequent diffuse distribution than the control group in frication noise energy of fricatives. 3. In fricatives, frequency of compact from were higher in group 1 than in group 2. 4. Generally, a short duration of closure for /ㄹ/ was not realized in the patient's flaps. Instead, it was realized as fricatives, sonorant with a vowel-like formant structure, or trill type consonant. 5. Abnormality of the patient's articulation was reduced, but adaptation of their articulation after surgery was not perfect and the degree of adaptation was different according to the degree of surgical setback.

  • PDF

챈트 및 읽기 발화조건에 따른 한국어 모음 포먼트 비교 (A comparison of Korean vowel formants in conditions of chanting and reading utterances)

  • 박지혜;성철재
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.85-94
    • /
    • 2020
  • 모음의 조음은 발화 시 자음과 결합하여 인접한 자음의 조음에 영향을 미칠 수 있기 때문에 정확한 조음위치를 형성하고 적절한 구강개방을 이루는 것이 중요하나 언어병리 분야의 다양한 대상자들은 이에 어려움을 보인다. 따라서 이들을 위한 치료를 위해서 언어의 특성을 적절히 반영하고 있는 노래(챈트)가 효과적인 도구로 사용될 수 있다. 본 연구에서는 챈트조건과 읽기조건에 따른 모음 특성을 비교하여 챈트조건이 모음 발화 강화의 수단으로 적절한지를 알아보고자 하였다. 연구 대상은 한국어를 모국어로 하는 20~30대 일반 성인 60명(남 30명, 여 30명)이었으며, 모음 /이/, /아/, /우/가 포함된 챈트 및 읽기 과제를 각 4회씩 반복 발화하도록 하여 녹음한 뒤 음성 자료를 분석하였다. 음향 변수를 분석한 결과, 읽기조건과 비교해 챈트조건 발화에서 F1, F2 값이 더 커지고, 모음 삼각형 무게중심의 이동 방향이 전방화, 하강화 된다는 의미 있는 결과를 확인하였다. 남녀 비교 시 여성의 값이 유의하게 컸고, 4회 반복 발화 간에 차이를 보이지 않아 결과의 신뢰도를 높였다. 발화조건 중 단어 수준과 구 수준에 따른 차이는 대부분 보이지 않았으며, 챈트조건의 음악요소에는 악센트가 영향을 미치는 것으로 나타났다. 이와 같은 결과는 챈트의 사용이 웅얼거리는 듯한 발화를 하는 대상자들에게 적절한 구강개방을 이루도록 도울 수 있으며, 후방화된 조음 위치로 인해 오조음을 보이는 이들에게 모음의 무게중심을 이동시키는 효과적인 방법이 될 것임을 시사한다.