• 제목/요약/키워드: Speech articulation

검색결과 357건 처리시간 0.033초

Supralaryngeal Articulatary Characteristics of Coronal Consonants /n, t, $t^h$, $t^*$/ in Korean

  • Son, Min-Jung;Kim, Sa-Hyang;Cho, Tae-Hong
    • 말소리와 음성과학
    • /
    • 제3권4호
    • /
    • pp.33-43
    • /
    • 2011
  • The present study investigates supralaryngeal articulatory characteristics of denti-alveolar (coronal) stops /t, $t^h$, $t^*$/ and /n/ in /aCa/ context in Seoul Korean. An Electromagnetic Articulograph (EMA, Carstens) was used to explore kinematics of the consonants by examining the kinematic data of the tongue tip (the primary articulator for the coronal consonants), along with some additional supplementary position data of the tongue body, the tongue dorsum and the jaw. The results showed that the constriction duration was the most robust articulatory correlates of the three-way stop contrast with a pattern of /t/$t^h$/$t^*$/. The contrast was further reinforced by the tongue body position (higher for /$t^h$, $t^*$/) and the tongue tip opening displacement (less displaced for /$t^h$, $t^*$/). The articulation of /n/ was quite similar to that of the lenis /t/ in terms of the constriction duration, and it was different from the oral stops in that it was produced with larger tongue tip displacement and lower jaw position than the oral stops, indicating its weak articulatory nature. The results are also discussed in comparison with those of bilabial stops with implications that the three-way contrast may be kinematically expressed differently depending on the physiological constraints imposed on the primary articulator (the tongue tip versus the lips). The present study, therefore, provides new articulatory (kinematic) data of denti-alveolar consonants in Korean, and demonstrates that the three-way stops, that have been known to differ primarily in their laryngeal settings, are indeed produced with kinematic distinctions at the supralaryngeal level.

  • PDF

방송 오디오 신호로부터 음악 신호 검출에 관한 연구 (A Study of Automatic Detection of Music Signal from Broadcasting Audio Signal)

  • 윤원중;박규식
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.81-88
    • /
    • 2010
  • 본 논문에서는 실제 방송 환경에 적용 가능한 방송용 음원 모니터링 시스템을 구축하기 위한 사전연구로 방송 오디오 신호로부터 음악신호 구간을 자동으로 검출할 수 있는 시스템을 제안하였다. 음악구간과 비음악구간의 구분을 위한 특징으로는 사람의 음성 발화 특성을 반영하여 에너지 표준편차와 log 에너지 표준편차 그리고 log 에너지 평균 등 3개의 간단한 시간영역 특징들을 사용하였으며 최종 음악신호 구간 판별은 각 에너지 한계값(threshold)을 이용한 Rule-base 분류를 기반으로 하였다. 실제 FM 라디오 방송 신호를 24시간 녹음하여 진행한 모의실험에서 음악구간 인식률은 96%, 비-음악구간 인식률은 87%를 나타내어 방송용 음원 모니터링 시스템의 전처리기로 손색이 없음을 확인할 수 있었다.

갑상선 기능저하 음성에 대한 청지각적 및 파열음 분석에 대한 연구 (The Perceptual and Consonant Analysis for the Voice with Hypothyroidism)

  • 한백화;이다해;김준선;홍기환
    • 대한후두음성언어의학회지
    • /
    • 제27권2호
    • /
    • pp.95-101
    • /
    • 2016
  • Background and Objectives : The main purpose of this study is to clarify perceptual and acoustic analysis for the patients with hypothyroidism after thyroidectomy especially focused on the characteristics of speech articulation with special reference to the consonant production. Materials and Methods : The subjects of the research were 40 male and female adults (males : 5, females : 35). They were all received radioactive iodine treatment which after total thyroidectomy. Voice samples were collected during the three stages of after surgery, pre-radioisotope treatment (RIT), and post-RIT. The acoustic analysis was conducted by using Pratt (ver.5.2.21) after measuring voice onset time (VOT). The subjective evaluation of the voices used CAPE-V. Results : A significant decrease in overall severity was displayed in the CAPE-V following RIT. It may be conjectured that this is connected to the change in voice following RIT. The loudness of the sound displayed a significant decrease in the CAPE-V following RIT. It is conjectured that this is connected to the decrease in vocal intensity following RIT. No statistically significant results were revealed for the comparative analysis on the voice onset time (VOT) in all plosives during the three periods. Conclusion : Perceptually, the overall severity of the voice with hypothyroidism was changed significantly before and after RIT. Eventhough VOT were not significantly changed, it tended to decrease VOT in patients with hypothyroidism.

  • PDF

음향학적 분석을 통한 뇌성마비 아동의 호흡 및 구강 운동 전.후 치료 효과 (The Effect of the Treatment on the Pre- and Post Respiration and the Oral Motor for Children with Cerebral Palsy by Acoustic Analysis)

  • 김숙희;김현기;신용일
    • 음성과학
    • /
    • 제15권2호
    • /
    • pp.131-141
    • /
    • 2008
  • The purpose of this study was to find out the acoustic variation on the pre-and post respiration and oral motor for children with cerebral palsy. Five children with spastic CP at the age of 6 in average were practiced by a caregiver at home each for 25 minutes, in total, 45 times. The sustained of vowel /a/ and vowels /a/, /i/, /u/, /e/, /o/ were recorded on CSL and MDVP and analyzed by acoustic parameters. As a result, the maximum phonation time(MPT) was increased from 2.06 to 6.31 and the formant of vowels(F1, F2, F3) had significant differences in F1(/a, i/), F2(/i.u.o/), and F3(/a/) between the controls and the children with CP in pre-treatment. The total average value of vowels had significant differences between the pre-and post-treatment (p< .05). The energy of vowels had significant differences in the vowels /i, u, e, o/ and the total average value between the pre-and post-treatment(p< .001). The jitter percent, shimmer percent, and noise to harmonic ratio had significant differences between the pre-and post-treatment(p< .05). As the respiration and the oral motor improved MPT, voice quality, and articulation of vowel, and the variation of the formant(F1, F2, F3) showed the changes in the shape of lips, the place and the height of the tongue, the various development of therapy programs and the consistent intervention of treatment is needed for the children with cerebral palsy.

  • PDF

반음절쌍과 변형된 연쇄 상태 분할을 이용한 연속 숫자 음 인식의 성능 향상 (Performance Improvement of Continuous Digits Speech Recognition Using the Transformed Successive State Splitting and Demi-syllable Pair)

  • 서은경;최갑근;김순협;이수정
    • 한국멀티미디어학회논문지
    • /
    • 제9권1호
    • /
    • pp.23-32
    • /
    • 2006
  • 본 논문에서는 언어모델과 음향모델을 개선함으로써 단위 숫자음의 인식성능 최적화에 대해 설명한다. 언어모델은 한국어 단위 숫자음 문장의 문법적 특징을 분석하고, Finile State Network(FSN) 노드를 두 음절로 구성하여 오 인식률을 감소시켰다. 음향모델은 단 음절로 구성되어 발성기간이 짧고 조음이 많이 생기는 불명확한 음소, 음절의 분할로 인한 오 인식을 줄이기 위해 인식단위를 반음절 쌍으로 하였다. 인식단위의 특징을 효과적으로 모델링하기 위해 특징부분에서 K-means 알고리즘으로 군집화 하여, 상태를 분할하는 변형된 연쇄 상태 분할방법을 이용하였다. 실험 결과 제안된 언어모델의 적용 후 동일 문맥종속 음소모델에서 10.5%, 음향모델에서 인식단위를 반음절 쌍으로 하였을 경우 문맥종속 음소모델에 비해 12.5%, 변형된 연쇄 상태분할을 하였을 경우 1.5%의 인식률을 향상시킬 수 있었다.

  • PDF

Phonetic Functionalism in Coronal/Non-coronal Asymmetry

  • Kim, Sung-A.
    • 음성과학
    • /
    • 제10권1호
    • /
    • pp.41-58
    • /
    • 2003
  • Coronal/non-coronal asymmetry refers to the typological trend wherein coronals rather than non-coronals are more likely targets in place assimilation. Although the phenomenon has been accounted for by resorting to the notion of unmarkedness in formalistic approaches to sound patterns, the examination of rules and representations cannot answer why there should be such a process in the first place. Furthermore, the motivation of coronal/non-coronal asymmetry has remained controversial to date even in the field of phonetics. The present study investigated the listeners' perception of coronal and non-coronal stops in the context of $VC_{1}C_{2}V$ after critically reviewing the three types of phonetic accounts for coronal/non-coronal asymmetry, i.e., articulatory, perceptual, and gestural overlap accounts. An experiment was conducted to test whether the phenomenon in question may occur, given the listeners' lack of perceptual ability to identify weaker place cues in VC transitions as argued by Ohala (1990), i.e., coronals have weak place cues that cause listeners' misperception. 5pliced nonsense $VC_{1}C_{2}V$ utterances were given to 20 native speakers of English and Korean. Data analysis showed that majority of the subjects reported $C_{2}\;as\;C_{1}$. More importantly, the place of articulation of C1 did not affect the listeners' identification. Compared to non-coronals, coronals did not show a significantly lower rate of correct identifications. This study challenges the view that coronal/non-coronal asymmetry is attributable to the weak place cues of coronals, providing evidence that CV cues are more perceptually salient than VC cues. While perceptual saliency account may explain the frequent occurrence of regressive assimilation across languages, it cannot be extended to coronal/non-coronal asymmetry.

  • PDF

한국어 숫자음의 음운변화 및 화자 발성특성을 고려한 연결숫자 인식의 성능향상 (Performance Improvement of Connected Digit Recognition by Considering Phonemic Variations in Korean Digit and Speaking Styles)

  • 송명규;김형순
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.401-406
    • /
    • 2002
  • 한국어 숫자는 모두 단음절로 이루어져 있으며, 연속적으로 발음될 때 인접 숫자들의 상호조음현상에 의해 각 숫자의 고유 발음이 변화하고, 또한 그 숫자들의 경계도 모호해지는 문제점이 있다. 이러한 문제점들과 더불어 배경잡음이나 채널에 의한 왜곡에 따른 문제점들로 인해 한국어 연결숫자의 인식 성능은 만족스럽지 못한 것이 현실이다. 본 논문에서는 연결숫자의 인식성능 향상을 위해서 한국어 숫자들의 음운변화를 고려하여 유사음소 (phonelike units: PLUs)군을 정의하고, 사용자의 여러 가지 발성형태에 따른 다양한 음운 현상의 변화를 흡수할 수 있도록 인식 시스템을 구성하는 방식을 검토하였다. 전화망 4연숫자를 이용한 화자독립 인식 실험을 수행한 결과 제안된 방법의 숫자열 인식률은 상태당 믹스쳐 (mixture) 개수가 1인 경우 83.2%로, 기준 시스템 (baseline)에 대한 오류감소률이 7.2%였고 가장 높은 성능을 나타낸 믹스쳐 개수가 11인 경우 숫자열 인식률은 91.8% 오류감소율은 4.7%였다.

반음절쌍과 변형된 연쇄 상태 분할을 이용한 연속 숫자음 인식의 성능 향상 (Performance Improvement of Continuous Digits Speech Recognition using the Transformed Successive State Splitting and Demi-syllable pair)

  • 김동옥;박노진
    • 한국정보통신학회논문지
    • /
    • 제9권8호
    • /
    • pp.1625-1631
    • /
    • 2005
  • 본 논문에서는 언어모델과 음향모델을 개선함으로써 단위 숫자음의 인식성능 최적화에 대해 설명한다. 언어모델은 한국어 단위 숫자음 문장의 문법적 특징을 분석하고, FSN 노드를 두음절로 구성하여 오 인식률을 감소시켰다. 음향모델은 단음절로 구성되어 발성기간이 짧고 조음이 많이 생기는 불명확한 음소, 음절의 분할로 연한 오 인식을 줄이기 위해 인식단위를 반음절쌍으로 하였다. 인식단위의 특징을 효과적으로 모델링하기 위해 특징레벨에서 K-means 알고리즘(4)으로 클러스터링 하여 상태를 분할하는 변형된 연쇄 상태 분할방법을 이용하였다. 실험 결과 제안된 언어모델의 적용 후 동일 문백종속 음소모델에서 $10.5\%$, 음향모델에서 인식단위를 반음절쌍으로 하였을 경우 문백종속 음소모델에 비해 $12.5\%$, 변형된 연쇄 상태분할을 하였을 경우 $1.5\%$의 인식률을 향상시킬 수 있었다.

스웨덴어 발음 교육상의 몇 가지 문제점 - 모음을 중심으로 -

  • 변광수
    • 대한음성학회지:말소리
    • /
    • 제4호
    • /
    • pp.20-30
    • /
    • 1982
  • The aim of this paper is to analyse difficulties of the pronunciation in swedish vowels encountered by Koreans learners and to seek solutions in order to correct the possible errors. In the course of the analysis the swedish and Korean vowels in question are compared with the purpose of describing differences aha similarities between these two systems. This contrastive description is largely based on the students' articulatory speech level ana the writer's auditory , judgement . The following points are discussed : 1 ) Vowel length as a distinctive feature in Swedish compared with that of Korean. 2) A special attention is paid on the Swedish vowel [w:] that is characterized by its peculiar type of lip rounding. 3) The six pairs of Swedish vowels that are phonologically contrastive but difficult for Koreans to distinguish one from the other: [y:] ~ [w:], [i:] ~ [y:], [e:] ~ [${\phi}$:], [w;] ~ [u:] [w:] ~ [$\theta$], [$\theta$] ~ [u] 4) The r-colored vowel in the case of the postvocalic /r/ that is very common in American English is not allowed in English sound sequences. The r-colored vowel in the American English pattern has to be broken up and replaced hi-segmental vowel-consonant sequences . Korean accustomed to the American pronunciation are warned in this respect. For a more distinct articulation of the postvocalic /r/ trill [r] is preferred to fricative [z]. 5) The front vowels [e, $\varepsilon, {\;}{\phi}$) become opener variants (${\ae}, {\;}:{\ae}$] before / r / or supradentals. The results of the analysis show that difficulties of the pronunciation of the target language (Swedish) are mostly due to the interference from the Learner's source language (Korean). However, the Learner sometimes tends to get interference also from the other foreign language with which he or she is already familiar when he or she finds in that language more similarity to the target language than in his or her own mother tongue. Hence this foreign language (American English) in this case functions as a second language for Koreans in Learning Swedish.

  • PDF

대사를 생명력 있게 만드는 멘탈 이미지의 하위양식 (Sub-modality of Mental Images to Make lines Alive)

  • 최정선
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권4호
    • /
    • pp.119-129
    • /
    • 2019
  • 연기교육에서 기존의 화술교육은 장단음 찾기, 자음과 모음의 조음연습, 딕션연습 등 대사를 표현하는 기술적인 측면에 치중되어 있었으며, 이러한 교육으로 대사가 말처럼 살아나기에는 한계가 있었다. 대사가 살아나는 순간은 배우가 대사를 말하는 사이 단어 이면의 멘탈 이미지를 구체적으로 보는 순간이다. 필자는 뇌과학 분야에서 인지뇌과학과 NLP (Neural Linguistic Programing)의 지식을 빌려와 멘탈 이미지가 무엇인지, 왜 멘탈 이미지가 생각과 감정의 기본 요소인지를 추적한다. 또한, 멘탈 이미지를 섬세하게 떠올리는 과정(하위양식)에서 신체의 근육들이 어떻게 반응하게 되고, 그 반응하는 근육들을 이용해 어떻게 강세, 사이, 피치, 억양 등의 말하기 재료들(강세, 사이, 피치, 억양 등)이 살아나는지를 살펴본다. 이러한 연구를 바탕으로 화술교육에서 왜 멘탈 이미지 교육이 선행되어야 하는지를 증명한다. 결론에서는 멘탈 이미지를 공부하는 과정에서 배우가 만나게 되는 장애물에 대해 열거하고, 장애물을 제거하는 방법 중 하나로 '호흡의 활성화'를 후속논문으로 계획한다.