• 제목/요약/키워드: Voice Production

검색결과 141건 처리시간 0.021초

음성의 준주기적 현상 분석 및 구현에 관한 연구 (Analysis and synthesis of pseudo-periodicity on voice using source model approach)

  • 조철우
    • 말소리와 음성과학
    • /
    • 제8권4호
    • /
    • pp.89-95
    • /
    • 2016
  • The purpose of this work is to analyze and synthesize the pseudo-periodicity of voice using a source model. A speech signal has periodic characteristics; however, it is not completely periodic. While periodicity contributes significantly to the production of prosody, emotional status, etc., pseudo-periodicity contributes to the distinctions between normal and abnormal status, the naturalness of normal speech, etc. Measurement of pseudo-periodicity is typically performed through parameters such as jitter and shimmer. For studying the pseudo-periodic nature of voice in a controlled environment, through collected natural voice, we can only observe the distributions of the parameters, which are limited by the size of collected data. If we can generate voice samples in a controlled manner, experiments that are more diverse can be conducted. In this study, the probability distributions of vowel pitch variation are obtained from the speech signal. Based on the probability distribution of vocal folds, pulses with a designated jitter value are synthesized. Then, the target and re-analyzed jitter values are compared to check the validity of the method. It was found that the jitter synthesis method is useful for normal voice synthesis.

신경성 발성장애와 기능성 발성장애의 감별 진단 (Differential Diagnosis between Neurogenic and Functional Dysphonia)

  • 김소연;이상혁
    • 대한후두음성언어의학회지
    • /
    • 제28권2호
    • /
    • pp.71-78
    • /
    • 2017
  • Voice disorder is classified into three categories, structural, neurogenic and functional dysphonia. Neurogenic dysphonia refers to a disruption in the nerves controlling the larynx. Common examples of this include complete or partial vocal cord paralysis, spasmodic dysphonia. Also it occurs as part of an underlying neurologic condition such as Parkinson's disease, myasthenia gravis, Lou Gehrig's disease or disorder of the central nervous system that causes involuntary movement of the vocal folds during voice production. Functional dysphonia is a voice disorder in the absence of structual or neurogenic laryngeal characteristics. A near consensus exist that Muscle tension dysphonia (MTD) is functional voice disorder wherein hyperfunctional laryngeal muscle activity whereas Spasmodic dysphonia (SD) is neurogenic, action-induced focal laryngeal dystonia including several subtype. Both Adductor type spasmodic dysphonia (AdSD) and MTD may be associated with excessive supraglottic contraction and compensation, resulting in a strained voice quality with spastic voice breaks. It makes these two disorders extremely difficult to differentiate based on clinical interpretation alone. Because treatment for AdSD and MTD are quite different, correct diagnosis is important. Clinician should be aware of the specific vocal characteristics of each disease to improve therapeutic outcome.

  • PDF

구관조 음성모방의 음향학적 분석을 통한 음성인식에 대한 고찰 (The Study of Voice Perception with Formant Analysis of Two Myna Bird's Voice Imitation)

  • 이옥분;정옥란
    • 음성과학
    • /
    • 제12권2호
    • /
    • pp.121-128
    • /
    • 2005
  • This study was an attempt to determine acoustic characteristics in myna bird's notes. Two myna birds' sounds imitating a normal male voice in his late 20's were sampled and analyzed. The analyses included the mean values of F1, F2, F3 and pitch contours. The results were as follows; First, there was a significan difference in the mean values of F1, F2, and F3 in isolatd vowel /a/ and /i/ between the myna birds' sounds and the human voice. However, there was no apparent difference in pitch contour of their formants. Second, there was a difference in pitch contour of their formants in their sentence ('hn-nyung-ha-se-yo?' meaning 'How are you?') production. Namely, the myna birds' pitch contour was located higher than that of the human's.

  • PDF

앉은 자세에서 골반 경사도가 음성에 미치는 영향 (The Effect of Pelvic Inclination on Voice Production in sitting)

  • 최정희
    • 문화기술의 융합
    • /
    • 제1권2호
    • /
    • pp.91-95
    • /
    • 2015
  • 본 연구는 앉은 자세에서 골반의 경사도에 따른 음성의 변화를 관찰하여 자세에 따른 치료적 접근을 고려하고자 그 목적이 있다. 골반경사의 3가지 자세를 Praat program을 이용하여 음성의 변화를 측정하였다. 세 가지 유형의 앉은 자세에 따라 pitch값의 변화가 통계학적 유의미한 차이를 보였다. 그 중에서도 전방경사에 비해 중립에서 현저히 낮은 피치값을 나타내어 유의한 차이가 있었다. 본 연구의 결과를 통해 우리는 골반의 중립적인 경사자세가 가장 안정적인 발성형태를 나타내었다.

영어권 화자의 국어 폐쇄음 발화와 지각 (The Production and Perception of the Korean Stops by English Learners)

  • 김기호;박윤진;전윤실
    • 음성과학
    • /
    • 제13권4호
    • /
    • pp.51-67
    • /
    • 2006
  • This study examined the acoustic properties of initial stops in Korean, produced by Korean native speakers and English Korean learners. The productions of Korean native speakers were compared with those of beginners and advanced learners of Korean. Fundamental frequency(F0) and Voice Onset Time(VOT) were measured in condition of one or two syllable words, containing word-initial lenis, fortis, and aspirated stops. English Korean Learners showed that they produced stops with relatively shorter VOT and lower F0, compared with those of Korean native speakers. In case of the manner of articulation, English Korean learners have production difficulties in order of lenis stops, aspirated stops, and fortis stops. In regard to the place of articulation, English Korean learners showed production troubles in order of labial stops, velar stops, and alveolar stops. In the experiment of perception, it is hard for English Korean learners to distinguish stops of lenis and aspirated. Therefore, the results of production experiment were almost consistent with those of the perception experiment. Finally, according to both groups of proficiency, the results demonstrated that the advanced learners produce or perceive Korean stops easier than the beginners.

  • PDF

Executive function and Korean children's stop production

  • Eun Jong Kong;Hyunjung Lee;Jeffrey J. Holliday
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.45-52
    • /
    • 2023
  • Previous studies have established a role for cognitive differences in explaining variability in speech processing across individuals. In the case of perceptual cue weighting in the context of a sound change, studies have produced conflicting results regarding the relationship between executive function and the use of redundant cues. The current study aimed to explore this relationship in acoustic cue weighting during speech production. Forty-one Korean-speaking children read a list of stop-initial words and completed two tests that assess executive function, i.e., Dimensional Change Card Sorting (DCCS) and digit n-back. Voice onset time (VOT) and fundamental frequency (F0) were measured in each word, and analyses were carried out to determine the extent to which children's executive function predicted their use of both informative and less informative cues to the three pairs comprising the Korean three-way stop laryngeal contrast. No evidence was found for a relationship between cognitive ability and acoustic cue weighting in production, which is at odds with previous, albeit conflicting, results for speech perception. While this result may be due to the lack of task demands in the production task used here, it nevertheless expands the empirical ground upon which future work in this area may proceed.

음 변화 관점에서 바라본 한국어 어두 폐쇄음의 발화 및 지각 (Production and perception of Korean word-initial stops from a sound change perspective)

  • 김진우
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.39-51
    • /
    • 2021
  • 본고에서는 2020년에 수집된 자유 발화 자료를 바탕으로 어두 폐쇄음 평음, 격음, 경음의 발화가 어떻게 달라지고 있는지 그리고 지각은 어떻게 이루어지고 있는지에 대해 자세히 살펴보았다. 기존 연구의 통제된 실험에서와 다르게, 자유 발화에서는 30대 남성까지도 VOT(voice onset time)에 의해 평음과 격음의 변별이 이루어지지 않았다. 지각실험은 언어 변화의 주도 계층인 젊은 여성 세대를 대상으로 하였다. 그 결과 어두 폐쇄음의 지각에서 F0이 평음과 나머지 둘을 변별하는 역할을 하였고, 그 다음 VOT가 격음과 경음을 변별하는 역할을 하였다. 특히 F0이 낮을 때에는 VOT의 길이가 짧든 길든 간에 항상 평음으로 지각되었다는 점은 평음의 지각에서 F0이 절대적인 역할을 한다는 것을 보여주었다. 그러나 어떤 F0의 경우에는 VOT에 따라 평음과 격음이 변별되기도 하였는데, 이는 20대 여성의 발화와 지각 체계가 일치하지 않기 때문이다. 음 변화의 관점에서 발화와 지각 체계가 일치하지 않는다는 것은 음 변화가 진행 중이라는 것을 의미하는데, 특히 20대 여성에서처럼 발화의 변화가 지각의 변화에 앞서는 경우는 음 변화가 후반 단계에 있을 때이다. 이처럼 언어 변화를 주도하는 계층에서 여전히 지각에서 이전의 체계를 유지하고 있는 이유는 그들의 부모 세대의 발화에서 VOT에 의한 평음과 격음의 변별이 이루어졌기 때문이며 이를 습득한 것이라고 볼 수 있다. 즉 다른 집단과의 소통을 위해 여전히 VOT를 지각에 사용하고 있는 것이다.

자가음성 모니터링을 응용한 가창 프로그램이 인공와우이식 아동의 억양과 음고 변화에 미치는 영향 (Effects of a singing program using self-voice monitoring on the intonation and pitch production change for children with cochlear implants)

  • 김성경;김수지
    • 말소리와 음성과학
    • /
    • 제12권1호
    • /
    • pp.75-83
    • /
    • 2020
  • 본 연구는 인공와우아동을 대상으로 자가음성 모니터링(self-voice monitoring)을 응용한 가창 프로그램을 시행하여 억양의 개선과 음고 산출의 변화에 미치는 영향을 알아보기 위함이다. 연구대상자는 모집된 19명의 아동 중 참여기준을 충족하고 본인 및 보호자가 자발적인 참여 의사를 표현한 7명이 최종으로 선정되었다. 연구자는 CI 집단과 비교하기 위하여 같은 연령의 건청 아동 6명을 모집하였다. 자가음성 모니터링을 응용한 가창은 노래를 녹음하여 들어보고(listen), 음성의 음고 진행방향과 숨쉬기 구간 및 음질을 확인한(explore) 다음, 목소리를 수정하여 의도한 대로 재산출하는(reproduce) 세 단계로 구성되어 있다. 데이터는 문장과 노래로 나누어 측정하였다. 문장은 발화시간과 억양 기울기 및 산출 음고의 주파수 변화, 노래는 프레이즈(phrase) 구간 내 평균 음고의 주파수의 데이터를 수집하여 선율윤곽과 산출 주파수 범위를 측정한 후 건청집단과 비교하였다. 연구 결과 문장 분석에서 인공와우 아동 집단의 사후검사 시 의문문의 문미 2음절의 억양 기울기 및 패턴이 건청 아동과 같이 상행하는 윤곽으로 변화되었으며, 노래 데이터에서는 음고의 도약 및 산출 음고의 주파수 범위가 증가하였다. 이러한 결과는 인공와우 아동을 대상으로 한 자가음성 모니터링을 응용한 가창 프로그램이 억양의 개선과 음고 산출 정확도의 효과적인 중재방안이 될 수 있으며 이를 위한 지속적인 연구가 필요하다는 것을 시사한다.

A Case Study about Koreanese-Japanese Students' Convergence Cartoon Using Photovoice

  • Kwon, Kyung-min
    • International Journal of Advanced Culture Technology
    • /
    • 제10권4호
    • /
    • pp.77-85
    • /
    • 2022
  • Today's universities have a keen interest in educational reform. The issue of population decline in college-age due to population decline is not new. Universities have been developing quantitatively for a long time and are now considering ways to survive rather than qualitative growth. Since the sharp decline in the school-age population due to the population decline has no clear solution immediately, universities are overcoming this crisis by creating many alternatives. Attracting international students is one of them. In this study, the effectiveness of photovoice was examined through the analysis of the case of the Korean-Japanese convergence cartoon class. The photo-voice method has sufficient potential as a teaching method for foreign convergence classes and can be expected to play a role as a teaching method suitable for students participating in convergence classes with different social, cultural, and linguistic backgrounds. In particular, in the convergence class, since participating students generate research materials through photo production, it can be a tool for inner exploration necessary for webtoon production and a tool for narrative inquiry for storytelling. It is expected that expanding the understanding and use of photo voice will have the methodological value of convergence classes. In addition, the teaching method using photo voice produced in the composition of photos and stories is likely to be used as an appropriate tool for convergence classes for students with different social, cultural, and linguistic backgrounds.

음성인식기술의 노인간병 적용을 위한 정책연구 (A policy study for the voice recognition technology based on elderly health care)

  • 조병철;전수영;김갑년;육현승
    • 디지털융복합연구
    • /
    • 제16권2호
    • /
    • pp.9-17
    • /
    • 2018
  • 본 연구는 음성인식기술이 급격한 고령화를 맞고 있는 우리 사회의 노인문제 해결을 위해 어떻게 활용될 수 있는지를 목표로 삼았다. 국내에서도 본격적으로 고령자들을 위한 공공지원서비스나 민간간병 서비스 등이 확대될 것으로 예상된다. 이 때 음성인식기술은 미디어인터페이스에 익숙하지 못한 노인들에게 다양하게 활용될 수 있다. 이를 위해 본 연구진은 국내의 음성인식기술의 활용가능성과 일본 방문시 노인 간병에서 음성인식기술을 통해 이룬 성과를 조사했다. 특히 간병인들이 보고서를 작성할 때 음성인식기술을 이용해 수기로 작성하던 보고를 대체하여 업무시간을 크게 축소한 바 있는데, 이러한 방법은 국내에서도 쉽게 정책적으로 실행될 수 있다고 판단했으며, 음성인식기술이 탑재된 로봇의 개발을 통해 노인부양의 사회적 비용을 줄여야 한다는 결론 역시 도달했다. 아울러 음성인식기술이 다양한 정서인식기능의 인공지능기반 프로그램과 결합을 통한 다양한 정책이 도모되어야 한다는 사실 역시 제안할 수 있게 되었다.