• Title/Summary/Keyword: Formant Analysis

Search Result 191, Processing Time 0.038 seconds

디지털 보청기에서의 포먼트 강조에 의한 마스킹 효과 연구 (A Study of Acoustic Masking Effect from Formant Enhancement in Digital Hearing Aid)

  • 전유용;길세기;윤광섭;이상민
    • 전자공학회논문지SC
    • /
    • 제45권5호
    • /
    • pp.13-20
    • /
    • 2008
  • 청력 손실을 보상하고 난청인이 다른 사람들과 대화할 수 있도록 디지털 보청기 알고리즘은 개발 되어 왔음에도 불구하고, 디지털 보청기 사용자들은 음성을 듣는데 어려움이 있다고 불만을 토로한다. 그 이유는 피드백이나 잔여 노이즈 등에 의해 디지털 보청기를 통한 음성의 질이 이해하기에 불충분하기 때문이다. 또 다른 이유로 포먼트들 사이에서 일어나는 마스킹 현상이 될 수 있다. 이 연구에서 정상 청각 피험자와 노인성 난청을 갖고 있는 난청인 피험자의 마스킹 특성을 측정하여 음성에서의 마스킹에 의한 음성 인지 저하를 확인하기 위한 실험을 하였다. 실험은 순음검사, 어음 청취 역치 검사, 낱말 분별력 검사, 수음 마스킹 검사, 어음 마스킹 검사의 5개 테스트로 이루어졌다. 어음 마스킹 검사에서 각각 어음 세트에 25개의 어음이 사용되었다. 각 어음의 왜곡을 객관적으로 평가하기 위해서 log likelihood ratio (LLR)를 도입하였다. 결과적으로 포먼트 향상의 양을 늘리면 늘릴수록 어음 인지는 낮아졌고, 각 어음 세트에서 각각의 향상된 어음은 통계적으로 비슷한 LLR을 갖지만 어음인지는 그렇지 않게 나타났다. 이것은 왜곡이 아닌 음향 마스킹이 어음 인지에 영향을 준다는 것을 의미한다. 실제로 피험자들 대부분이 맞추지 못한 음성을 주파수 분석한 결과 첫 번째와 두 번째 포먼트 사이의 레벨 차이가 약 35dB이며 이는 순음 마스킹 실험 결과(정상 청각 피험자:36.36dB, 난청인 피험자:32.86dB)와 비슷한 양상을 보였다. 실험 결과에서 볼 수 있듯이 음향 마스킹의 특성은 정상 청각인과 난청인 사이에서 다르게 나타난다. 그렇기 때문에 보청기 착용 전 마스킹 특성을 검사하고, 피팅 시에 적용해야 한다.

통계적 방법과 인지실험을 통한 한국어 초성파열음의 음소단위 분석에 관한 연구 (A Study on the Phoneme Based Analysis of Korean Initial Plosives Using Statistical Method and Perception Tests)

  • 조철우;이우선;이규호;김종안;임광일;이태원
    • 한국음향학회지
    • /
    • 제8권5호
    • /
    • pp.78-85
    • /
    • 1989
  • 본 논문에서는 한국어의 규칙합성에 관한 연구중 파열음의 함성 파라미터를 추정하기 위하여 사용한 통계적 방법과 인지실험에 의한 방법에 관하여 기술하고 있다. 합성기로는 직렬 포만트 합성기를 구성하여 사용하였고 통제적 분석에 사용된 음성시료는 9개의 초성 파열음과 8개의 모음으로 구성되는 72개의 독립 CV형태를 갖는 단음절을 만일 화자를 통하여 수집하였다. 음성의 분석은 시간 및 주파수 평면에서 파라미터의 변화를 중심으로 행하였으며, 인지실험을 통한 파라미터 추정방법을 통하여 독립적으로 포만트 파라미터의 변화에 관하여 조사하였다.

  • PDF

CSL을 통한 음향특성과 사상체질간의 상관성 연구 (An Study on the Correlation between Sound Characteristics and Sasang Constitution by CSL)

  • 신미란;김달래
    • 사상체질의학회지
    • /
    • 제11권1호
    • /
    • pp.137-157
    • /
    • 1999
  • 1. 연구배경 사상인은 생리 및 병리 현상에 차이를 나타낼 뿐만 아니라 섭생법 및 치료법에서도 각기 다른 방법을 적용하고 있다. 그러므로 사상의학에 있어서 체질변증분야가 매우 중요한 과제라 하겠다. 동무는 사상인변증의 진단지표를 외형 심성 병증 등을 제시하였고, 많은 의가들에 의해 여러 가지 새로운 체질변증의 방법이 모색되어 임상에 시도 활용되고 있는 추세이나 체질변증의 객관성유지에 어려운 점이 많아서 학문의 발전에 적지 않은 난관이 따랐다. 최근에는 음성과학의 발달에 힘입어 음성의 특성을 가시적 수치적으로 객관화 할 수 있는 가능성이 높아졌다. 본 연구는 이러한 음성과학을 바탕으로 여러 의가들에 의해 제시되어 온 사상인의 음성적 특정을 각 개인의 사상체질과 직접적으로 연관성이 있다고 판단되는 공명주파수와 기본주파수 등 여러 음성학적인 pattern자료들을 모집단으로부터 획득하여 체질별로 객관적인 수치로 비교 분석함으로써 음성과 체질과의 관계에 대하여 살펴보고 개인의 성문에 의한 사상체질 판단의 기본자료로 활용하고자 하였다. 2. 연구방법 상지대한의과대학 남학생 132명과 기타8명을 대상으로 하였다. 음향특성과 체질과의 상관성에 관하여 문헌조사를 하였다. 설문지와 체질전문가에 의하여 연구대상자를 체질 판별하였다. 연구대상자의 음성특성에 대한 설문조사를 하였고 CSL로 Pitch. Formant Frequency. Energy, Time of reading composition 등을 분석하고 통계 처리하여 체질 판별을 시도하였다. 3. 연구결과 1) 설문조사결과 소음인은 음성이 낮고 완만하며 조용한 편으로, 소양인은 음성이 높고 밝으며 급하고 함부로 말을 하는 것으로, 태음인은 음성이 낮고 무거우며 완만하고 굵고 성량이 풍부한 것으로 나타났다. 2) 문장의 평균 발음 시간에서 태양인은 다른 체질에 비하여 유의성 있게 길었다. 몸무게에서 태음인은 다른 체질에 비하여 유의성 있게 높았다. Formant frequency 1에서는 태양인이, Bandwidth 1에서는 소음인과 태양인이 다른 체질에 비하여 유의성 있게 낮았으며, Bandwidth 2와 Formant frequency 5에서는 태양인이 유의성 있게 높았다. Pitch Maximum과 Pitch Maximum-Pitch Minimum에서는 소음인과 태양인이 유의성 있는 차이를 나타내었다. Energy Mean에서는 태양인과 태음인에서 유의성 있는 차이를 나타내었다. 3) Multi-dimensional 4-class minimum-distance classifier 분석결과 모든 항목으로 분석한 것 보다 체질별로 특정 항목을 갖고 분석한 것이 높은 일치를 나타내었다. SPSS/PC+프로그램에서 일원분산분석과 판별분석결과 네 체질사이에서의 정판별력보다 소양인을 제외한 3체질 사이에서의 정판별력이 높았다. CART모형에서 앞에서 제시된 다른 방법들보다 높은 예측율을 보이고 있다. 연구수행과정 중에 표준화, 녹음기술, 적적한 문장의 선택, 음성분석 항목선택, 통계기법, 적절한 알고리즘의 개발 등의 많은 문제점이 나타나고 있으며 관련분야의 보완과 연구진행이 지속적으로 있어야 할 것으로 사려 된다. 다각도로 진행되고 있는 사상의학에서의 객관화 노력과 통계적인 방법론들이 적용되고 체질진단에 있어 가장 최적의 알고리즘을 찾아낼 수 있다면, 정확한 체질 진단과 더불어 그에 따른 환자들의 치료와 약물처방에 있어서도 많은 도움을 줄 수 있으리라 생각된다. 성문과 음성특성의 분석을 통한 사상체질 분류검사방법은 사상체질의 객관화를 위한 하나의 보조적인 방법이 될 수 있다고 사료된다.

  • PDF

Development of an Optimized Feature Extraction Algorithm for Throat Signal Analysis

  • Jung, Young-Giu;Han, Mun-Sung;Lee, Sang-Jo
    • ETRI Journal
    • /
    • 제29권3호
    • /
    • pp.292-299
    • /
    • 2007
  • In this paper, we present a speech recognition system using a throat microphone. The use of this kind of microphone minimizes the impact of environmental noise. Due to the absence of high frequencies and the partial loss of formant frequencies, previous systems using throat microphones have shown a lower recognition rate than systems which use standard microphones. To develop a high performance automatic speech recognition (ASR) system using only a throat microphone, we propose two methods. First, based on Korean phonological feature theory and a detailed throat signal analysis, we show that it is possible to develop an ASR system using only a throat microphone, and propose conditions of the feature extraction algorithm. Second, we optimize the zero-crossing with peak amplitude (ZCPA) algorithm to guarantee the high performance of the ASR system using only a throat microphone. For ZCPA optimization, we propose an intensification of the formant frequencies and a selection of cochlear filters. Experimental results show that this system yields a performance improvement of about 4% and a reduction in time complexity of 25% when compared to the performance of a standard ZCPA algorithm on throat microphone signals.

  • PDF

제주어 화자에서 '아래 아'(/ㆍ/) 조음의 영상의학적 및 음향학적 특성 (Radiological and acoustic characteristics of "Arae-a" (/ㆍ/) articulation in Jeju language speakers)

  • 이승진;최홍식
    • 말소리와 음성과학
    • /
    • 제10권1호
    • /
    • pp.57-64
    • /
    • 2018
  • The purpose of the present study was to explore the radiological and acoustic characteristics of "Arae-a" (/${\cdot}$/) articulation in two male Jeju language speakers, focusing on selected measures in radiological images derived from computed tomography scans, as well as the first and the second formant measures in selected vowels. An elderly male speaker (a 78-year-old) and a young male speaker (a 34-year-old) participated in the study. During the production of four selected vowels, the shape of the vocal tract was identified, and selected measures were obtained from the elderly participant's computed tomography (CT) scans. For acoustic analysis, the participants were given a list of near-minimal pairs consisting of 112 words and asked to read them aloud. The results indicated that the "Arae-a" (/${\cdot}$/) articulation of the elderly speaker showed unique acoustic and radiological characteristics compared to other similar vowels, thus presenting substantial consistency with the descriptions of the "Hunminjeongeum Haeryebon." In contrast, the F1 and F2 measures of the young male's /${\cdot}$/ articulation were not distinguished from those of /ㅗ/. Current results, in part, support the scientific principles underlying the invention of "Arae-a," which reflects the shape of the vocal tract during production, and the necessity for further research.

장기간의 양측 감각신경성 난청환자에서 음성지표의 변화 (The Change of the Voice Parameters in Long-term Sensorineural Hearing Loss Patients)

  • 윤자복;조경래;정상원;최정환;유영삼;우훈영;이강수
    • 대한후두음성언어의학회지
    • /
    • 제12권2호
    • /
    • pp.140-144
    • /
    • 2001
  • Backgrounds & Objectives : Prolonged hearing loss was considered as one of the factors which have the potential to cause vocal changes. However, the analysis of quality of phonation in hearing loss patients has not been achieved enough. The purpose of the study was to evaluate the difference in objective acoustic parameters between long-term hearing impaired patients and normal control group. Material & Methods : The material of this investigation comprised a group of 20 patients (M : F=10 : 10) with moderate or profound hearing loss(over 50dB). The duration of all hearing loss was over 1 year. All of them underwent the acoustic examinations comprising electroglottography, multidimensional voice program and formant analysis during phonation of the bowels /a/ with free confortable tone and /i/ with voluntary high tone. The results of the acoustic examinations were compared with those of a control group, composed of 20 sex- and age-matched normal hearing subjects. Results : In the male hearing loss subjects, the significant increase was detected in pitch and shimmer during phonation of /a/ and in pitch during phonation of /i/. In addition, this group was characterized by decreased fundamental frequency during phonation of /i/. In female, there was no difference between hearing loss group and normal control group except a decreased formant 1 frequency. Conclusion : Long-term moderate and profound sensorineural hearing loss could affect the objective voice parameters.

  • PDF

성악도의 두성구와 흉성구 발성에 대한 음향학적 분석 (Acoustic Analysis of Singing Voice)

  • 진성민
    • 대한후두음성언어의학회지
    • /
    • 제13권1호
    • /
    • pp.52-58
    • /
    • 2002
  • The pitch range of the human voice is variable, extending from chest register to falsetto. Although numerous studies have investigated after laryngeal mechanism description of registers, systematic and objective studies were lack. The purpose of this study was to analyze and compare head register with chest register of singers acoustically. Fifteen healthy tenor major students were selected. Fifteen healthy untrained adults were the control group for this study. Long term average(LTA) power spectrum using the Fast Fourier transform(FFT) algorithm and Linear predictive coding (LPC) filter response were made during /a/ sustained in both head(G4, 392Hz) md chest registers (C3, 131Hz). Statistical analysis was performed using Mann-Whitney test. In the LTA power spectrum, head register of singer has increased level(energy gain) in the frequency band of 2.2-3.4kHz(p<0.01), and 7.5-8.4kHz(p<0.01, p<0.05). Chest register of singer has increased level in the frequency band of 2.2-3.1kHz(p<0.01), 7.8-8.4kHz(p<0.05) and around 9.6kHz(p<0.01). LTA power spectrum reveals a peak of acoustic energy around 2500Hz known as the singer's formant and another peak of acoustic energy around 8000Hz in singer's voice.

  • PDF

음향학적 분석을 통한 뇌성마비 아동의 호흡 및 구강 운동 전.후 치료 효과 (The Effect of the Treatment on the Pre- and Post Respiration and the Oral Motor for Children with Cerebral Palsy by Acoustic Analysis)

  • 김숙희;김현기;신용일
    • 음성과학
    • /
    • 제15권2호
    • /
    • pp.131-141
    • /
    • 2008
  • The purpose of this study was to find out the acoustic variation on the pre-and post respiration and oral motor for children with cerebral palsy. Five children with spastic CP at the age of 6 in average were practiced by a caregiver at home each for 25 minutes, in total, 45 times. The sustained of vowel /a/ and vowels /a/, /i/, /u/, /e/, /o/ were recorded on CSL and MDVP and analyzed by acoustic parameters. As a result, the maximum phonation time(MPT) was increased from 2.06 to 6.31 and the formant of vowels(F1, F2, F3) had significant differences in F1(/a, i/), F2(/i.u.o/), and F3(/a/) between the controls and the children with CP in pre-treatment. The total average value of vowels had significant differences between the pre-and post-treatment (p< .05). The energy of vowels had significant differences in the vowels /i, u, e, o/ and the total average value between the pre-and post-treatment(p< .001). The jitter percent, shimmer percent, and noise to harmonic ratio had significant differences between the pre-and post-treatment(p< .05). As the respiration and the oral motor improved MPT, voice quality, and articulation of vowel, and the variation of the formant(F1, F2, F3) showed the changes in the shape of lips, the place and the height of the tongue, the various development of therapy programs and the consistent intervention of treatment is needed for the children with cerebral palsy.

  • PDF

음향분석에 사용할 녹음장비로 갤럭시 스마트폰 녹음기능의 유용성 (Feasibility of Galaxy Smartphone Recording as Portable Recorder for Acoustic Analysis of Voice)

  • 윤매화;이재혁;이상혁;진성민
    • 대한후두음성언어의학회지
    • /
    • 제26권2호
    • /
    • pp.104-111
    • /
    • 2015
  • Background and Objectives : Acoustic analysis of voice could be influenced so much by the quality of voice files which were recorded by recording device. In clinical practice, voice files that were recorded by analysis program directly or portable digital recording device were analyzed mostly. This study examined the feasibility of using Galaxy smartphone recordings for acoustic analysis of voice. Materials and Methods : Acoustic measures were compared between voice signals recorded from 30 normal speakers (15 males and 15 females) through Galaxy smartphone, portable digital recording device and CSL. Fo, jitter, shimmer, NHR (Noise-Harmony ratio) and Formant frequencies were analyzed by MDVP. Results : Fo, Jitter, Shimmer, NHR and formant frequencies from 3 devices were no significantly difference. The intraclass correlation coefficient (ICC) was higher between each of the voice perturbation measures. Conclusion : The findings indicated that Galaxy smartphone recording system was useful device for acoustic analysis of voice. Furthermore, Galaxy smartphone can be applied widely in various way for acoustic analysis of voice.

  • PDF

포먼트 주파수 대역폭 추출 및 분석을 이용한 신장 질환 진단 방법의 설계 (A Design of Kidney Diseases Diagnosis Method Using Formant Frequency Bandwidth Extraction and Analysis)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제34권10B호
    • /
    • pp.1062-1069
    • /
    • 2009
  • 비만으로 인해 대사증후군을 많이 앓고 있는 상황에서 후유증으로 신장 질환이 커다란 사회문제가 되고 있는 실정이다. 따라서 자각증상이 없는 신장의 이상 유무를 조기에 판단하여 적절한 조치를 취하는 것이 무엇보다 중요하다. 이를 위해 본 논문에서는 음성 분석을 통해 신장 질환을 무자각, 무구속, 무통종의 방법으로 진단할 수 있는 방법을 제안하였다. 구성하고자 하는 전체 시스템은 크게 음성 분석과 얼굴색을 살피는 방법을 결합시키는 시스템이 개발되고 있으며 이 중 본 논문은 입술소리를 기반으로 신장 질환을 진단하는 방법에 설계하였다. 이를 위해 본 논문에서는 첫째, 신장 질환을 앓고 있는 환자와 정상인을 대상으로 피실험자 집단을 각각 구성하고 입술소리의 수치학적 분석을 실험으로 출력하고 그 결과값에 대한 비교 분석을 수행하였으며 둘째, 한의학적 청진 이론과 언어학, 음성학과의 상관성을 분석하고 이를 기반으로 음성에 대한 신장의 특징 요소를 추출하여 제1포먼트 주파수와의 연관성을 도출하였다. 실험 결과 신장 질환자 집단이 정상인 집단보다 제1포먼트 주파수 대역폭이 넓게 형성되는 결과를 추출하였으며 최종적으로 입술소리만으로 신장 질환을 진단할 때의 오진 확률에 대해 계산하였다.