• 제목/요약/키워드: Formant Analysis

검색결과 191건 처리시간 0.018초

구관조 음성모방의 음향학적 분석을 통한 음성인식에 대한 고찰 (The Study of Voice Perception with Formant Analysis of Two Myna Bird's Voice Imitation)

  • 이옥분;정옥란
    • 음성과학
    • /
    • 제12권2호
    • /
    • pp.121-128
    • /
    • 2005
  • This study was an attempt to determine acoustic characteristics in myna bird's notes. Two myna birds' sounds imitating a normal male voice in his late 20's were sampled and analyzed. The analyses included the mean values of F1, F2, F3 and pitch contours. The results were as follows; First, there was a significan difference in the mean values of F1, F2, and F3 in isolatd vowel /a/ and /i/ between the myna birds' sounds and the human voice. However, there was no apparent difference in pitch contour of their formants. Second, there was a difference in pitch contour of their formants in their sentence ('hn-nyung-ha-se-yo?' meaning 'How are you?') production. Namely, the myna birds' pitch contour was located higher than that of the human's.

  • PDF

성악 전공 학생의 가칭 시 음성의 SPR(Singing Power Ratio)에 관한 연구 (A Study of the SPR (Singing Power Ratio) on the Singing Voice in Singing Students)

  • 조성미;정옥란;이상욱
    • 음성과학
    • /
    • 제11권4호
    • /
    • pp.121-127
    • /
    • 2004
  • This study attempted to provide a spectrum analysis for quantitative evaluation of singing voice quality of singing students rather than the presence or absence of the singer's formant. The regression analysis was used to analyse the relationship between ringing quality, SPR, and SPP of singing voice of college student subjects majoring in music. This study measured singing. power ratio (SPR) in 41 singing students. Digital audio recordings were made in sung vowels for acoustic analyses. Each sample was judged by 1 experienced singing teacher and 4 voice pathologists on one semantic bipolar 7-point scales (ringing-dull). The results showed that the SPR and SPP had significant correlations with ringing quality. The SPR had a significant relationship with ringing quality on singing voice in singing students. The SPR can be an important quantitative measurement for evaluating singing voice quality.

  • PDF

비후성 비염환자에서 음성검사 및 음향비강통기도검사를 이용한 수술전후 비교 (Postoperative Change in Hypertrophic Rhinitis(Study Using Nasometer, CSL and Acoustic Rhinometer))

  • 유영삼;우훈영;윤자복;최정환;조경래
    • 대한후두음성언어의학회지
    • /
    • 제12권1호
    • /
    • pp.34-38
    • /
    • 2001
  • Background and Objectives : With the development of computerized systems, an objective evaluation methods of nasal speech and nasal geometry have become readily available by means of a simple, noninvasive technique. In this study, we assessed the nasality, nasal formant, nasal volume and nasal area in patients with hypertrophic rhinitis before and after turbinate surgery. Material and Method : With the nasometer, we measured nasalance, which reflects the ratio of acoustic energy output of nasal sounds from the nasal and oral cavities. With CSL 4300B, we measured nasal formants. We used acoustic rhinometer to measure nasal area and nasal volume. Postoperative changes of above factors were compared with preoperative values. Paired t-test and Pearson's correlation were used for statistical analysis. Results : The first nasal formant frequency, nasalance scores of three passages(baby, mamma and rabbit passages), minimal cross sectional area(MCA) of narrow side, nasal volume of narrow side and nasal volume of wide side had increased significantly after turbinate surgery (p <0.05). The MCA and nasal volume of narrow side and MCA of wide side showed significant correlation with nasalance score of rabbit passage and baby passage showed significant correlation with nasal volume of narrow side(p<0.05). Conclusion : There were significant increases in nasalance scores, first nasal formant frequency, MCA and nasal volume after turbinate surgery. Thus, we must consider the possibility of voice changes postoperatively in professional voice users.

  • PDF

한국어 모음에서 연령증가에 따른 제2음형대의 변화양상 ($F_2$ Formant Frequency Characteristics of the Aging Male and Female Speakers)

  • 김찬우;차흥억;장일환;김선태;오승철;석윤식;이영숙
    • 대한후두음성언어의학회지
    • /
    • 제10권2호
    • /
    • pp.119-123
    • /
    • 1999
  • Background and Objectives : Conditions such as muscle atrophy, stretching of strap muscles, and continued craniofacial growth factors have been cited as contributing to the changes observed in the vocal tract structure and function in elderly speakers. The purpose of the present study is to compare F$_1$ and F$_2$ frequency levels in elderly and young adult male and female speakers producing a series of vowels ranging from high-front to low-back placement. Material and Methods : The subjects were two groups of young adults(10 males, 10 females, mean age 21 years old range 19-24 years) and two groups of elderly speakers(10 males, 10 females, mean age 67 years : range 60-84 years). Each subject participated in speech pathologist to be a speaker of unimpared standard Korean. The headphone was positioned 2 cm from the speakers lips. Each speaker sustained the five vowels for 5 s. Formant frequency measures were obtained from an analysis of linear predictive coding in CSL model 4300B(Kay co). Results : Repeated measure AVOVA procedures were completed on the $F_1$ and $F_2$ data for the male and female speakers. $F_2$ formant frequency levels were proven to be significantly lower fir elderly speakers. Conclusions : We presume $F_2$ vocal cavity(from the point of tongue constriction to lip) lengthening in elderly speakers. The research designed to observe dynamic speech production more directly will be needed.

  • PDF

편도외 농양 환자의 발화시 조음 및 음성의 변화 (The Acoustic Characteristics of Articulation and Phonation in Peritonsillar Abscess)

  • 최현진;송윤경;여장옥;허세형;진성민
    • 대한후두음성언어의학회지
    • /
    • 제19권2호
    • /
    • pp.133-135
    • /
    • 2008
  • Background and Objectives: The voice changes can occur in peritonsillar abscess and the labeling of this changes as a "muffled voice". The aim of this study was to investigate the changes in acoustic feature of voice before and after treatment in patients with peritonsillar abscess. Materials and Method: 12 patients with peritonsillar abscess were enrolled in the study. Acoustic analysis on sustained Korean vowels /a/, /i/ and /u/ were performed before and after treatment. Results: In patients with peritonsillar abscess, the first formant frequency (F1) and second formant frequency (F2) of /a/ were decreased. There was tendency of articulation of back-low vowel /a/ as back-high vowel /u/. F1 of /i/ and /u/ were increased, while F2 were decreased. There was tendency of articulation of front-high vowel /i/ as back-low vowel /a/. The third, forth, fifth formant frequency (F3, F4, F5) of /a/, /i/ and /u/ were decreased although statistically not significant. Conclusion: The anatomical and functional changes of oropharynx by peritonsillar abscess can cause changes in resonance and speech quality. We suggest that these changes could be the cause of 'muffled voice' in patients of peritonsillar abscess.

  • PDF

캡스트럼 포락선을 이용한 해금 소리의 포만트 합성 (Formant Synthesis of Haegeum Sounds Using Cepstral Envelope)

  • 홍연우;조상진;김종면;정의필
    • 한국음향학회지
    • /
    • 제28권6호
    • /
    • pp.526-533
    • /
    • 2009
  • 본 논문에서는 전통 현악기 해금의 스펙트럼 모델링을 위해 캡스트럼 포락선을 이용한 포만트 합성법을 제안한다. 스펙트럼 모델링은 입력 신호를 정현파 성분과 노이즈 성분의 합으로 해석하여 음을 합성하는 기술로 주기성이 있는 현악기나 관악기의 음 합성에 효과적이다. 캡스트럼 포락선의 포만트는 정현파 성분 합성을 위한 파라미터로 활용하였다. 정현파 성분을 합성하기 위해 기존의 가산합성 방식과는 달리 IIT (Impulse Invariant Transform)로 공명기를 설계하였으며 배음간 크기 보완을 위해 대역 통과 필터를 추가하였다. 원음과 합성된 정현파 성분의 차로 구해진 노이즈 성분에 포함된 일부 유효배음을 제거하면 완전한 노이즈 성분을 구할 수 있으며 선형 보간법 (linear interpolation)에 기초하여 그 주파수 특성을 파라미터화 하였다. 최종적으로 합성된 노이즈 성분과 정현파 성분을 더하여 해금 단위음을 합성하였고 합성음은 원음과 매우 유사하였다.

만 2-4세 한국 아동의 단모음과 이중모음 산출 특징 (Characteristics of 2 to 4 year old Korean children's production of monophthongs and diphthongs)

  • 송인미;성철재
    • 말소리와 음성과학
    • /
    • 제10권1호
    • /
    • pp.65-74
    • /
    • 2018
  • The purpose of this study is to investigate age-specific features of 2;1- to 4;1-year -olds' production of monophthongs and diphthongs through both auditory perceptual analysis and acoustic analysis. Test material included {vowel+'da'} consisting of 7 monophthongs and 10 diphthongs and meaningful words beginning with vowels. The percentage of correct vowels was used for perceptual analysis and Praat(5.2.12) was used for acoustic analysis, analyzing variables related to monophthongs and diphthongs. The results of this study are as follows: First, perceptual analysis showed that children from an age group of 2;1 to 2;8 years showed significant difference in the accuracy level of both monophthongs and diphthongs as compared to those aged 2;9 to 3;4 years and those aged 3;5 to 4;1 years. Second, the results of acoustic analysis provided that formant (F1 and F2) of monophthong, in general, tended to decrease as age increased. In terms of F2 differentiation slope and regression slope, which were diphthong-related variables, the age group of 3;5 to 4;1 years showed a large general slope change.

C8H10O2H4 섭취량에 의한 조음기관의 변화 요소 분석 연구 (A Study on the Change Parameter Analysis of Articulator by Intake the C8H10O2H4)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제36권1B호
    • /
    • pp.93-100
    • /
    • 2011
  • 현대사회에서 일에 대한 스트레스, 여가 생활, 기호 식품에 대한 매력 등이 증가되면서 커피를 즐겨 마시는 사람들이 늘고 있다. 커피는 품종, 가공방법, 원두의 혼합여부 및 인위적인 향의 첨가여부 등에 따라 다양한 종류로 현대인의 입맛을 사로잡고 있다. 그러나 대부분의 커피에는 $C_8H_{10}O_2N_4$ 함유되어 있고 이로 인해 인체의 여러부위에 영향을 미치고 있다. 이러한 $C_8H_{10}O_2N_4$이 커피의 주성분인 카페인이다. 따라서 본 논문에서는 블랙커피 한 잔에 함유되어 있는 $C_8H_{10}O_2N_4$ 250mg에 대해 섭취량이 증가할 때마다 조음기관에 미치는 영향을 분석하였다. 이를 위해 20대 남성 30명을 대상으로 $C_8H_{10}O_2N_4$ 섭취량을 점차 늘라면서 이에 대해 반응하는 조음기관의 변화를 음성 분석 요소인 Jitter, Formant 및 Spectrum을 적용하여 결과값을 추출하고 이를 분석하는 연구를 수행하였다.

음성신호를 이용한 A16 혈자리와 심장 기능의 연관관계 분석 (Analysis of Association Relationship Between A16 Acupuncture Point and Heart Function Using Voice Signals)

  • 김봉현;조동욱
    • 한국통신학회논문지
    • /
    • 제35권11B호
    • /
    • pp.1651-1658
    • /
    • 2010
  • 최근 들어 삶의 지표가 향상됨에 따라 질병이 발생되지 전에 조기 진단하는 예방, 보건의 건강 패턴이 행해지고 있다. 이와 같은 예방, 보건 분야를 반영하는 대체의학으로 수지침 요법이 널리 사용되고 있다. 따라서 본 논문처리 기술을 이용하여 성장에 해당하는 상응점인 A16 혈자리를 자극하여 심장과 관련된 음성 요소의 변화를 측정하고 상호간의 비교, 분석을 통해 성장 가능의 향상을 측정하였다. 이를 위해 우선 심장 상응점인 A16 혈자리를 자극하기 전과 후의 음성을 수집하였으며 심장과 연관성이 있는 음성 신호 분석 요소인 제2포먼트 대역폭과 지터를 적용한 실험을 수행하였다. 결과적으로, A16 혈자리 자극에 의해 제2포먼트 대역폭과 지터가 낮아지는 결과를 추출했으며 이를 통해 IT 음성 신호 처리 기술을 이용하여 심장 기능이 향상되는 것을 입증할 수 있었다.

감정 표현 방법: 운율과 음질의 역할 (How to Express Emotion: Role of Prosody and Voice Quality Parameters)

  • 이상민;이호준
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권11호
    • /
    • pp.159-166
    • /
    • 2014
  • 본 논문에서는 감정을 통해 단어의 의미가 변화될 때 운율과 음질로 표현되는 음향 요소가 어떠한 역할을 하는지 분석한다. 이를 위해 6명의 발화자에 의해 5가지 감정 상태로 표현된 60개의 데이터를 이용하여 감정에 따른 운율과 음질의 변화를 살펴본다. 감정에 따른 운율과 음질의 변화를 찾기 위해 8개의 음향 요소를 분석하였으며, 각 감정 상태를 표현하는 주요한 요소를 판별 해석을 통해 통계적으로 분석한다. 그 결과 화남의 감정은 음의 세기 및 2차 포먼트 대역너비와 깊은 연관이 있음을 확인할 수 있었고, 기쁨의 감정은 2차와 3차 포먼트 값 및 음의 세기와 연관이 있으며, 슬픔은 음질 보다는 주로 음의 세기와 높낮이 정보에 영향을 받는 것을 확인할 수 있었으며, 공포는 음의 높낮이와 2차 포먼트 값 및 그 대역너비와 깊은 관계가 있음을 알 수 있었다. 이러한 결과는 감정 음성 인식 시스템뿐만 아니라, 감정 음성 합성 시스템에서도 적극 활용될 수 있을 것으로 예상된다.