• 제목/요약/키워드: coarticulation

검색결과 39건 처리시간 0.023초

계층구조 시간지연 신경망을 이용한 한국어 변이음 인식에 관한 연구 (A Study on Korean Allophone Recognition Using Hierarchical Time-Delay Neural Network)

  • 김수일;임해창
    • 전자공학회논문지B
    • /
    • 제32B권1호
    • /
    • pp.171-179
    • /
    • 1995
  • In many continuous speech recognition systems, phoneme is used as a basic recognition unit However, the coarticulation generated among neighboring phonemes makes difficult to recognize phonemes consistently. This paper proposes allophone as an alternative recognition unit. We have classified each phoneme into three different allophone groups by the location of phoneme within a syllable. For a recognition algorithm, time-delay neural network(TDNN) has been designed. To recognize all Korean allophones, TDNNs are constructed in modular fashion according to acoustic-phonetic features (e.g. voiced/unvoiced, the location of phoneme within a word). Each TDNN is trained independently, and then they are integrated hierarchically into a whole speech recognition system. In this study, we have experimented Korean plosives with phoneme-based recognition system and allophone-based recognition system. Experimental results show that allophone-based recognition is much less affected by the coarticulation.

  • PDF

Is Voicing of English Voiced Stops Active?

  • Yun, Il-Sung
    • 음성과학
    • /
    • 제10권2호
    • /
    • pp.207-221
    • /
    • 2003
  • Phonetic voicing does not support the phonological distinction of voiced/voiceless in English stops. The present study is aimed at defining the nature of voicing of English voiced stops. A review of the literature reveals that the voicing is position-conditioned and its length is notably inconsistent relative to the closure duration. No consistent relationships are found between vocal fold adduction and glottal pulsing in initial position. Stress reduced the voicing, etc. The hypothesis for experiments was: (1) active voicing: stress generates longer (stronger) voicing during the closure duration of a voiced stop; (2) passive voicing: stress induces shorter (weaker) voicing during the closure. Instead the voiced stop becomes more voiced when the preceding vowel (syllable) is stressed. The literature review and the results of two experiments comparing English and Slovakian suggested that the voicing of English voiced stops is passive (i.e., a coarticulation of glottal pulsing for adjacent vowels-syllables) and should be distinguished from active voicing in some other languages.

  • PDF

An Acoustic Study of the Perceptual Significance of F2 Transition of /w/ in English and Korean

  • Kang, Hyun-Sook
    • 음성과학
    • /
    • 제13권4호
    • /
    • pp.7-21
    • /
    • 2006
  • The intent of the present study is to investigate the acoustic properties of Korean /w/ in various phonological contexts, compare them with those of English /w/, and attempt to explain why English /w/'s are perceived differently by Korean speakers depending on the phonological contexts. Experiments 1 and 2 present the acoustic measure of F2 of Korean /w/ in various linguistic positions and show that unlike English /w/, Korean /w/ shows quite a strong coarticulation with the following vowel. Based on these experiments, Experiment 3 investigates why English /w/ is adapted differently into Korean. Specifically, it discusses why English /wain/ is adapted as /wain/ whereas English /twin/ is adapted into Korean as $/t^{h_i}win/$ with an extra vowel. This study argues that the different perception of English /w/ by Korean and English speakers is due to the different F2 transitional pattern of /w/ in Korean and English in various phonological contexts. It also argues that the F2 transitional pattern is an important factor in the perception of /w/.

  • PDF

V-to-C Coarticulation Effects in Non-native Speakers of English and Russian: A Locus-equation Analysis

  • 오은진
    • 대한음성학회지:말소리
    • /
    • 제63호
    • /
    • pp.1-21
    • /
    • 2007
  • Locus equation scatterplots for [bilabial stop + vowel] syllables were obtained from 16 non-native speakers of English and Russian. The results indicated that both Russian speakers of English and English speakers of Russian exhibited modifications towards respective L2 norms in slopes and y-intercepts. All non-native locus equations generated exhibited linearity. Accordingly, the basic results reported in [17] were reverified by securing a larger subject base. More experienced speakers displayed better approximations to L2 norms than less experienced speakers, indicating the necessity of perception- and articulation-related learning for allophonic variations due to adjacent phonetic environments.

  • PDF

모음 스펙트럼에 기반한 전후 비자음 조음위치 판별 (Classification of nasal places of articulation based on the spectra of adjacent vowels)

  • 윤지현;성철재
    • 말소리와 음성과학
    • /
    • 제15권1호
    • /
    • pp.25-34
    • /
    • 2023
  • 본 연구에서는 한국어 비음의 조음위치 변별을 위한 지표로서 모음 음향 특성의 활용 가능성을 타진하였다. 비음에 인접한 /ㅏ/ 모음 시료를 대용량 한국어 자연발화 말소리 자료에서 추출하여 모음 구간의 25%, 50%, 75% 시점에서 음향 매개변수를 측정하였다. 이 스펙트럼 및 지속시간 변수를 이용하여 판별분석을 수행하고 이를 바탕으로 선행 또는 후행 비자음의 조음위치 분류정확도를 추정하였다. 또한 조음위치 공조음(coarticulation)의 관점에서 순행적 공조음과 역행적 공조음의 영향을 확인하기 위하여 측정 대상 모음에 비음이 선행하는 경우와 후행하는 경우로 나누어 비교하였다. 분석 결과, 전후 비자음의 조음위치 분류정확도는 약 50%-60%로 나타났다. 모음의 음향 매개변수 측정값만으로 비음의 조음위치를 예측·분류하기에는 어려움이 있으나, 공조음 정도가 가장 약할 것으로 예상되는 모음 정중 구간에서 측정된 음향 변수만으로도 위와 같은 정확도를 얻었다는 점에서 비음 구간의 분석결과와 함께 모음 측정치를 활용함으로써 비음 조음위치 인식률 향상에 기여할 수 있을 것으로 기대한다. 한편 측정 대상 모음에 선행 또는 후행하는 비음 조건 간에 비교하였을 때, 후행 비음 조음위치의 분류정확도가 더 높게 나타났다는 점에서 역행적 조음위치 공조음의 영향이 더 클 가능성이 확인되었다.

한국인의 외국어 $/\int/$음에 대한 실험음성학적 연구 (An Experimental Phonetic study of Perception of native Korean speakers on English and German $/\int/$)

  • 이숙향;강현숙
    • 대한음성학회지:말소리
    • /
    • 제40호
    • /
    • pp.1-12
    • /
    • 2000
  • This paper investigated how $/\int/$ in English and German is perceived and interpreted in the loanwords in Korean. $/\int/$ in these languages does not show one-to-one correspondence in Korean: $/\int/$ in the coda position in English and German is perceived as [swi] in Korean while $/\int/$ in the onset position is perceived as [syu]. This paper examined phonetic characteristics of $/\int/$ in English and German through its acoustic analysis and attempted to figure out which factor could explain this surface distribution of [swi] and [syu]; phonological (onset vs. coda) or phonetic (coarticulation) factor. Two acoustic features of $/\int/$ in English and German were examined: duration and energy Peak frequency of the frication noise. German $/\int/$ Perceived as [swi] in Korean showed higher energy Peak frequency and longer duration than that perceived as [syu] in Korean. English iii perceived as [swi] also showed longer duration than that Perceived as [syu] in Korean but energy Peak frequency showed different behavior. English $/\int/$ showed coarticulation with the preceding vowel rather than being affected by its position in the syllable in English. This paper concludes that 1)Phonetic characteristics used are duration and energy Peak frequency of its frication noise when $/\int/$ in English and German are adopted in Korean, 2)duration is used prior to energy peak frequency, which can be used as an enhancing feature.

  • PDF

Vowel Duration and the Feature of the Following Consonant

  • Yun, Il-Sung
    • 말소리와 음성과학
    • /
    • 제1권1호
    • /
    • pp.41-46
    • /
    • 2009
  • Duration of the preceding vowel is known to vary as a function of the (phonological or phonetic) voicing feature of the following consonant. This study raises a question against this general belief. A spectrographic experiment using 14 Korean obstruents (three sets of stops: /p, p', $p^h$/, /t, t', $t^h$/, /k, k', $k^h$/; one set of affricates: /c, c', $c^h$/; one set of fricatives: /s, s'/) reveals that (1) phonetic voicing in the intervocalic lax consonants /p, t, k, c, s/ has nothing to do with the duration of the preceding vowel; (2) vowel length is significantly shorter before tense consonants than before their lax cognates while tense consonants are significantly longer than their lax cognates. Importantly, Korean obstruents are all phonologically voiceless. Therefore, the voicing feature is rejected as the cause of preconsonantal vowel shortening in Korean both phonetically and phonologically. It is suggested that the temporal phenomenon is basically a kind of physiologically-motivated coarticulation though it is restricted by the phonology of a given language. To meet this assumption, the feature voicing should be replaced with the feature tenseness as the cause, which will enable us to explain the temporal phenomenon on the same basis irrespective of language.

  • PDF

연속 음성으로부터 추출한 CVC 음성세그먼트 기반의 음성합성 (Speech Synthesis Based on CVC Speech Segments Extracted from Continuous Speech)

  • 김재홍;조관선;이철희
    • 한국음향학회지
    • /
    • 제18권7호
    • /
    • pp.10-16
    • /
    • 1999
  • 본 논문에서는 설계하지 않은 연속 음성 코퍼스로부터 추출된 CVC 음성 세그먼트를 사용하는 연결 기반 음성 합성기를 제안한다. 연속 음성은 각 음운간의 상호조음효과가 비교적 잘 반영되고, 자연스러운 억양 변화를 포함하고 있으므로 이를 적절하게 활용할 수 있는 합성 단위를 선택하면 자연스런 음성합성이 가능하다. 여러 가지 합성단위 가운데 CVC 합성 단위는 자음의 안정 부분에서 접속이 일어나므로 연결부에서의 음질 저하가 적고, 전후 자음과 모음간의 조음 현상을 잘 반영하는 장점이 있다. 본 논문에서는 CVC 합성 단위를 사용하는 경우 나타나는 문장 세그먼트들의 조합을 4가지로 분류하여 각각의 통계적 특성과 합성음성의 품질을 분석하고, CVC에 근거한 새로운 복합 합성 단위를 사용하는 방식을 제안한다. 제안된 방식을 사용하여 설계하지 않은 연속 음성 코퍼스로부터 CVC 음성 세그먼트를 추출하여 다양한 예제 문장을 합성하였다. 만일 필요한 CVC 음성 세그먼트가 음성 코퍼스에 존재하지 않는 경우 반음절 음성 세그먼트로 대치하여 합성하였다. 실험 결과 약 100 Mbytes의 연속 음성 코퍼스로 비교적 자연스러운 음성합성이 가능함을 알 수 있었다.

  • PDF

연속된 수화 인식을 위한 자동화된 Coarticulation 검출 (Automatic Coarticulation Detection for Continuous Sign Language Recognition)

  • 양희덕;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권1호
    • /
    • pp.82-91
    • /
    • 2009
  • 수화 적출은 연속된 손 동작에서 의미 있는 수화 단어를 검출 및 인식하는 것을 말한다. 수화는 손의 움직임과 모양의 변화가 다양하기 때문에 수화 문장에서 수화를 적출하는 것은 쉬운 문제가 아니다. 특히, 자연스러운 수화 문장에는 의미 있는 수화, 수화가 아닌 손동작이 무작위로 발생한다. 본 논문에서는 CRF(Conditional Random Field)에 기반한 적응적 임계치 모델을 제안한다. 제한된 모델은 수화 어휘집에 정의된 수화 손동작과 수화가 아닌 손동작을 구별하기 위한 적응적 임계치 역할을 수행한다. 또한, 수화 적출 및 인식의 성능 향상을 위해 손 모양 기반 수화 인증기, 짧은 수화 적출기, 부사인(subsign) 추론기를 제안된 시스템에 적용하였다. 실험 결과, 제안된 방법은 연속된 수화 동작 데이타에서 88%의 적출률, 사전에 적출된 수화 동작 데이타에서 94%의 인식률을 보였으며, 적응적 임계치 모델, 짧은 수화 적출기, 손 모양 기반 수화 인증기, 부사인 추론기를 사용하지 않은 CRF 모델은 연속된 수화 동작 데이터에서 74%의 적출률, 사전에 적출된 수화 동작 데이타에서 90%의 인식률을 보였다.