• 제목/요약/키워드: segmental durations

검색결과 19건 처리시간 0.019초

Acoustic Measurement of English read speech by native and nonnative speakers

  • Choi, Han-Sook
    • 말소리와 음성과학
    • /
    • 제3권3호
    • /
    • pp.77-88
    • /
    • 2011
  • Foreign accent in second language production depends heavily on the transfer of features from the first language. This study examines acoustic variations in segments and suprasegments by native and nonnative speakers of English, searching for patterns of the transfer and plausible indexes of foreign accent in English. The acoustic variations are analyzed with recorded read speech by 20 native English speakers and 50 Korean learners of English, in terms of vowel formants, vowel duration, and syllabic variation induced by stress. The results show that the acoustic measurements of vowel formants and vowel and syllable durations display difference between native speakers and nonnative speakers. The difference is robust in the production of lax vowels, diphthongs, and stressed syllables, namely the English-specific features. L1 transfer on L2 specification is found both at the segmental levels and at the suprasegmental levels. The transfer levels measured as groups and individuals further show a continuum of divergence from the native-like target. Overall, the eldest group, students who are in the graduate schools, shows more native-like patterns, suggesting weaker foreign accent in English, whereas the high school students tend to involve larger deviation from the native speakers' patterns. Individual results show interdependence between segmental transfer and prosodic transfer, and correlation with self-reported proficiency levels. Additionally, experience factors in English such as length of English study and length of residence in English speaking countries are further discussed as factors to explain the acoustic variation.

  • PDF

Text-to-Speech 변환 시스템을 위한 회귀 트리 기반의 음소 지속 시간 모델링 (Regression Tree based Modeling of Segmental Durations For Text-to-Speech Conversion System)

  • 표경란;김형순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.191-195
    • /
    • 1999
  • 자연스럽고 명료한 한국어 Text-to-Speech 변환 시스템을 위해서 음소의 지속 시간을 제어하는 일은 매우 중요하다. 음소의 지속 시간은 여러 가지 문맥 정보에 의해서 변화하므로 제어 규칙에 의존하기 보다 방대한 데이터베이스를 이용하여 통계적인 기법으로 음소의 지속 시간에 변화를 주는 요인을 찾아내려고 하는 것이 지금의 추세이다. 본 연구에서도 트리기반 모델링 방법중의 하나인 CART(classification and regression tree) 방법을 사용하여 회귀 트리를 생성하고, 생성된 트리에 기반하여 음소의 지속 시간 예측 모델과, 자연스러운 끊어 읽기를 위한 휴지 기간 예측 모델을 제안하고 있다. 실험에 사용한 음성코퍼스는 550개의 문장으로 구성되어 있으며, 이 중 428개 문장으로 회귀 트리를 학습시켰고, 나머지 122개의 문장으로 실험하였다. 모델의 평가를 위해서 실제값과 예측값과의 상관관계를 구하였더니 음소의 지속 시간을 예측하는 회귀 트리에서는 상관계수가 0.84로 계산되었고, 끊어 읽는 경계에서의 휴지 기간을 예측하는 회귀 트리에서는 상관계수가 0.63으로 나타났다.

  • PDF

An Acoustical Study on the Syllable Structures of Korean Numeric Sounds

  • Yang, Byung-Gon
    • 음성과학
    • /
    • 제14권1호
    • /
    • pp.137-147
    • /
    • 2007
  • The purpose of this study was to examine the syllable structures of ten Korean numeric sounds produced by ten students. Each sound was normalized by its maximum intensity value and divided into onset, vowel, and coda sections after finding abrupt or visible changes in energy values or cumulative values of lower spectral energy at each pulse point using four Praat scripts. Then, segmental durations and cumulative intensity values of each syllable were obtained to find a statistical summary of the syllable structure. Intensity values at 100 proportional time points were also collected to compare the ten sounds. Results showed as follows: Firstly, there was not much deviation from the grand average duration and intensity for the majority of the sounds except the two diphthongal sounds on which their boundary points varied among the speakers. Secondly, the onset point for the CV or CVC category sounds and the boundary between the vowel and the nasal or lateral sound were easy to identify, which may be automatically traced later. Thirdly, there seems some tradeoff among the sections maintaining the same total duration per each syllable. Further studies on syllables with various onsets or codas would be desirable to make a general statement on the Korean syllable structure.

  • PDF

Building a Sentential Model for Automatic Prosody Evaluation

  • 윤규철
    • 말소리와 음성과학
    • /
    • 제1권4호
    • /
    • pp.47-59
    • /
    • 2009
  • The purpose of this paper is to propose an automatic evaluation technique for the prosodic aspect of an English sentence uttered by Korean speakers learning English. The underlying hypothesis is that the consistency of the manual prosody scoring is reflected in an imaginary space of prosody evaluation model constructed out of the three physical properties of the prosody considered in this paper, namely: the fundamental frequency (F0) contour, the intensity contour, and the segmental durations. The evaluation proceeds first by building a prosody evaluation model for the sentence. For the creation of the model, utterances from native speakers of English and Korean learners for the target sentence are manually scored by either native teachers of English or Korean phoneticians in terms of their prosody. Multiple native utterances from the manual scoring are selected as the "model" native utterances against which all the other Korean learners' utterances as well as the model utterances themselves can be semi-automatically evaluated by comparison in terms of the three prosodic aspects [7]. Each learner utterance, when compared to the multiple model native utterances, produces multiple coordinates in a three-dimensional space of prosody evaluation, each axis of which corresponds to the three prosodic aspects. The 3D coordinates from all the comparisons form a prosody evaluation model for the particular sentence and the associated manual scores can display regions of particular scores. The model can then be used as a predictive model against which other Korean utterances of the target sentence can be evaluated. The model from a Korean phonetician appears to support the hypothesis.

  • PDF

Prosodic Modifications of the Internal Phonetic Structure of Monosyllabic CVC Words in Conversational Speech

  • Mo, Yoonsook
    • 말소리와 음성과학
    • /
    • 제5권1호
    • /
    • pp.99-108
    • /
    • 2013
  • Previous laboratory studies have shown that prosodic structures are encoded in the modulations of phonetic patterns of speech including suprasegmental as well as segmental features. In particular, effects of prosodic context on duration and intensity of syllables and words have been widely reported. Drawing on prosodically annotated large-scale speech data from the Buckeye corpus of conversational speech of American English, the current study attempted to examine whether and how prosodic prominence and phrase boundary of everyday conversational speech, as determined by a large group of ordinary listeners, are related to the phonetic realization of duration and intensity. The results showed that the patterns of word durations and intensities are influenced by prosodic structure. Closer examinations revealed, however, that the effects of prosodic prominence are not the same as those of prosodic phrase boundary. With regard to intensity measures, the results revealed the systematic changes in the patterns of overall RMS intensity near prosodic phrase boundary but the prominence effects are restricted to the nucleus. In terms of duration measures, both prosodic prominence and phrase boundary are the most closely related to the lengthening of the nucleus. Yet, prosodic prominence is more closely related to the lengthening of the onset while phrase boundary lengthens the coda duration more. The findings from the current study suggest that the phonetic realizations of prosodic prominence are different from those of prosodic phrase boundary, and speakers signal different prosodic structures through deliberate modulations of the internal phonetic structure of words and listeners attend to such phonetic variations.

가변 Break를 이용한 코퍼스 기반 일본어 음성 합성기의 성능 향상 방법 (A Performance Improvement Method using Variable Break in Corpus Based Japanese Text-to-Speech System)

  • 나덕수;민소연;이종석;배명진
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.155-163
    • /
    • 2009
  • Text-to-speech 시스템에서 입력 텍스트로부터 운율 정보를 생성하기 위해서는 운율구 경계, 음소 지속시간, 기본주파수 포락선 설정의 3가지 기본적인 모듈이 필요하다. Break 인덱스 (BI; Break Index)는 합성기에서 운율구의 경계를 나타내고, 자연스러운 합성음을 생성하기 위해서는 BI를 정확히 예측하여야 한다. 그러나 BI는 문장의 의미나 화자의 읽기 습관(reading style)에 따라 임의적으로 결정되는 경우가 많아 정확한 예측이 매우 어렵다. 특히 일본어 합성기에서는 악센트 구 경계 (APB; Accentual Phrase Boundary)와 major phrase 경계 (MPB; Major Phrase Boundary)의 정확한 예측이 어렵다. 따라서 본 논문에서는 APB와 MPB 예측 오류를 보완할 수 있는 방법을 제안한다. BI를 고정 break (FB; Fixed Break)와 가변 break (VB; Variable Break)로 분류하여 합성단위 선택을 수행한다. 일반적으로 BI는 한번 생성되면 변하지 않는다. 따라서 BI가 잘못 생성된 경우 최적의 합성음을 생성할 수 없게 되는데, VB는 생성된 BI와 그것과 유사한 BI를 함께 이용하여 합성단위 선택을 수행함으로써 합성음의 BI가 생성된 BI와 다를 수 있는 것을 의미한다. APB와 MPB에 해당하는 BI에 대하여 VB인지 FB인지 CART(Classification and Regression Tree)를 이용하여 예측하고, VB인 경우 기본 주파수와 음소 지속시간에 대해 다중 운율 모델을 생성하여 합성단위 선택을 수행하였다. MOS 테스트 결과 원음이 4.99, 제안한 방법을 4.25, 기존의 방법은 4.01로 합성음의 자연성을 향상시킬 수 있었다.

심초음파의 조영제의 임상적 유용성: 개에서 좌심영상화에 대한 조영제 용량의 영향 (Clinical Usefulness of Contrast Echocardiography: The Dose Effect for Left Ventricle Visualization in Dogs)

  • 신창호;황태성;윤영민;정동인;연성찬;이희천
    • 한국임상수의학회지
    • /
    • 제32권6호
    • /
    • pp.486-490
    • /
    • 2015
  • 이차원 초음파는 심장 기능의 평가에 있어 널리 이용되어지고 있다. 심혈관계 질환의 진단을 위해서는 좌심실 내강의 영상화가 필수적이다. SonoVue$^{TM}$는 육불화황 가스로 안정화된 새로 나온 조영제이다. 현재 이 초음파 조영제를 이용하여 활발한 연구가 진행되고 있으나, 개에서 진단을 위한 가장 효율적인 용량에 대한 연구가 없었다. 이 연구의 목적은 SonoVue$^{TM}$ 조영제를 이용하여 좌심실 내강의 영상화에 있어 효율적인 용량을 찾는데 있다. 열 마리의 건강한 비글 성견을 실험에 이용하였다. 본 연구에서는 조영제의 용량을 각 0.03 ml/kg, 0.05 ml/kg 그리고 0.1 ml/kg 으로 사용하여 각 용량에서의 좌심실 내강의 영상화 되는 시간을 비교하였다. 내강이 영상화되는 시간의 측정은 segmental score를 이용하였다. Segmental score법은 좌심실 내강을 6개의 가상의 구역으로 나누고 각 구역이 영상화되는 것을 수치화 하는 방법이다. 본 연구에서는 일반적으로 유의성이 있다고 할 수있는 segmental score가 5이상일 때의 시간을 측정하였다. 그리고 재연성의 평가를 위해 3명의 관찰자가 실험에 동참하였다. 측정치의 통계분석은 SPSS 14.0버전에서 일원배치 분산분석과 Scheffe 다중 비교를 이용하였다. 각 용량에서(0.03 ml/kg, 0.05 ml/kg, 0.1 ml/kg) 좌심실이 영상화 되는 평균 시간은 3.54초, 6.15초, 24.39초로 나타났다. 표준편차는 각 용량별 2.14124, 2.61205, 11.09802로 나타났다. 실험에 참여한 모든 동물에서 과민 반응, 심마진, 혈관 부종 등의 부작용이 나타나지 않았다. 결론적으로 소노뷰 조영제를 이용하여 좌심실 내강의 영상화시 가장 효율적인 조영제의 용량은 단위체중당 0.1 ml/kg이며, 이 용량에서 재연성 역시 가장 높았다.

기관지내시경을 통한 Endobronchial Watanabe Spigot (EWS) 삽입으로 치료한 기관지흉막루 1례 (A Case of RUL Bronchopleural Fistula Occluded by Flexible Bronchoscope with Endobronchial Watanabe Spigot (EWS))

  • 최영인;조진희;심진영;신승수;오윤정;박주헌;황성철;이성수
    • Tuberculosis and Respiratory Diseases
    • /
    • 제58권4호
    • /
    • pp.404-409
    • /
    • 2005
  • 기관지흉막루는 수술적 치료를 고려해야 하나 대부분의 환자들이 전신상태가 불량하고 기저질환으로 인해 수술을 시행할 수 없는 경우가 많다. 이런 환자들에게 있어서 굴곡성 기관지내시경을 이용하여 누공을 폐쇄시키는 다양한 방법들이 시도되고 있다. 저자들은 폐렴 및 농흉이 동반된 고령의 환자에서 흉관삽입 후 발생한 원위부 기관지 흉막루를 굴곡성 기관지내시경을 이용한 EWS 삽입으로 치료에 성공한 1례가 있어 보고하는 바이다.

프랏을 이용한 영시 운율 교육 (Teaching English Prosody through English Poems with Cloned Native Intonation)

  • 윤규철;오지연;안상철
    • 영어영문학
    • /
    • 제56권4호
    • /
    • pp.753-772
    • /
    • 2010
  • The purpose of this work is to examine the viability of employing the prosody cloning technique in teaching English prosody. Ten native speakers of Korean high school students with similar level of English proficiency participated in the poem self-study experiment. Five of them were grouped into the experimental group and the remaining five into the control group. One popular English poem from a high school textbook was selected and its recording by a professional native speaker of English was used in the experiment. The members of the two groups made a recording of the poem both before and after the experiment. For the study material, the experimental group used their own recorded utterances with their prosody cloned from the professional English speaker, while the control group used the utterances of the professional speaker alone. The acoustic analysis of the recordings by the prosodic foot both before and after the experiment showed that the experimental group performed slightly better than the control group in the realization of the intensity contour of the poem. There were no significant differences in the realization of the intonation contour and segmental durations between the two groups. The recording after the experiment was also subjectively evaluated by a native speaker of English and the scores for the experimental group were slightly higher than the control group. These findings suggest that the use of English poems with the help of the prosody cloning technique is a potentially viable approach to teaching English intonation to high school students. A long-term study with more students is necessary.