• 제목/요약/키워드: Prosody

검색결과 208건 처리시간 0.021초

Post-focus compression is not automatically transferred from Korean to L2 English

  • Liu, Jun;Xu, Yi;Lee, Yong-cheol
    • 말소리와 음성과학
    • /
    • 제11권2호
    • /
    • pp.15-21
    • /
    • 2019
  • Korean and English are both known to show on-focus pitch range expansion and post-focus pitch range compression (PFC). But it is not clear if this prosodic similarity would make it easy for Korean speakers to learn English focus prosody. In the present study, we conducted a production experiment using phone number strings to examine whether Korean learners of English produce a native-like focus prosody. Korean learners of English were classified into three groups (advanced, intermediate and low) according to their English proficiency and were compared to native speakers. Results show that intermediate and low groups of speakers did not increase duration, intensity, and pitch in the focus positions, nor did they compress those cues in the post-focus positions. Advanced speakers noticeably increased the acoustic cues in the focus positions to a similar extent as native speakers. However, their performance in post-focus positions was quite far from that of native speakers in terms of pitch and excursion size. These results thus demonstrate a lack of positive transfer of focus prosody from Korean to English in L2 learning, and learners may have to relearn it from scratch, which is consistent with a previous finding. More importantly, the results provide further support for the view proposed in other works that acoustic properties of PFC were not easily transferred from one language to another.

인공 신경망의 한국어 운율 발생에 관한 연구 (The Study on Korean Prosody Generation using Artificial Neural Networks)

  • 민경중;임운천
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2004년도 춘계학술발표대회 논문집 제23권 1호
    • /
    • pp.337-340
    • /
    • 2004
  • 한국어 문-음성 합성 시스템(TTS: Text-To-Speech)은 합성음의 자연스러움을 증가시키기 위해 운율 발생 알고리듬을 만들어 시스템에 적용하고 있다. 운율 법칙은 각국의 언어에 대한 언어학적 정보나 자연음에서 구한 운율에 대한 지식을 기반으로 음성 합성 시스템에 적용하고 있다. 그러나 이렇게 구한 운율 법칙이 자연음에 존재하는 모든 운율 법칙을 포함할 수도 없고, 또 추출한 운율 법칙이 틀린 법칙이라면, 합성음의 자연감이나 이해도는 떨어질 것이므로, TTS의 실용화에 장애가 될 수 있다. 이러한 점을 감안하여 본 논문에서는 자연음에 내재하는 운율을 학습할 수 있는 인공 신경망을 이용한 운율발생 신경망을 제안하였다. 훈련단계에서 인공 신경망의 입력 단에 한국어 문장의 음소 열을 차례로 이동시켜 인가하면 입력 단의 중앙에 해당하는 음소의 운율 정보가 출력되도록 훈련시킬 때, 목표 패턴을 이용한 감독학습을 통해, 자연음에 내재하는 운율을 학습하도록 하였다. 평가 단계에서 문장의 음소 열을 입력하고, 추정율을 측정하여 인공 신경망이 한국어 문장에 내재하는 운율을 학습하여 발생시킬 수 있음을 살펴보았다.

  • PDF

감정 표현 방법: 운율과 음질의 역할 (How to Express Emotion: Role of Prosody and Voice Quality Parameters)

  • 이상민;이호준
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권11호
    • /
    • pp.159-166
    • /
    • 2014
  • 본 논문에서는 감정을 통해 단어의 의미가 변화될 때 운율과 음질로 표현되는 음향 요소가 어떠한 역할을 하는지 분석한다. 이를 위해 6명의 발화자에 의해 5가지 감정 상태로 표현된 60개의 데이터를 이용하여 감정에 따른 운율과 음질의 변화를 살펴본다. 감정에 따른 운율과 음질의 변화를 찾기 위해 8개의 음향 요소를 분석하였으며, 각 감정 상태를 표현하는 주요한 요소를 판별 해석을 통해 통계적으로 분석한다. 그 결과 화남의 감정은 음의 세기 및 2차 포먼트 대역너비와 깊은 연관이 있음을 확인할 수 있었고, 기쁨의 감정은 2차와 3차 포먼트 값 및 음의 세기와 연관이 있으며, 슬픔은 음질 보다는 주로 음의 세기와 높낮이 정보에 영향을 받는 것을 확인할 수 있었으며, 공포는 음의 높낮이와 2차 포먼트 값 및 그 대역너비와 깊은 관계가 있음을 알 수 있었다. 이러한 결과는 감정 음성 인식 시스템뿐만 아니라, 감정 음성 합성 시스템에서도 적극 활용될 수 있을 것으로 예상된다.

인공와우이식 난청인의 말소리 운율변화에 따른 구어 이해와 음도 변별, 선율윤곽 확인 간 관련성 (The Relationship Between Perception of Prosody, Pitch Discrimination, and Melodic Contour Identification in Cochlear Implants Recipients)

  • 김은연;문일준;조양선;정원호;홍성화
    • 인간행동과 음악연구
    • /
    • 제14권2호
    • /
    • pp.1-18
    • /
    • 2017
  • 본 연구에서는 인공와우이식 난청인(N = 15)을 대상으로 말소리 운율변화에 따른 구어 이해와 음도 변별, 선율윤곽 확인(Melodic contour identification: MCI) 간 관련성을 살펴보았다. 말소리 운율 변화에 따른 구어이해를 살펴보기 위해 말소리 운율지각 검사를 시행하였고, 긍정적인 운율과 부정적인 운율 조건에 따른 의미 변화를 피검자에게 판단하게 하였다. 검사 시 긍정적인 의미(Positive meaning: PW)와 중립적인 의미(Neutral meaning: NW)를 갖는 낱말 및 낱말 조합 형태를 제시하고, 긍정적인 운율과 부정적인 운율 조건에 따른 의미 변화를 피검자에게 판단하게 하였다. 음도 변별 검사를 위해서는 단음도 변화 변별 과제와 3개 음으로 구성된 패턴에서의 음도 변별 과제가 실시되었다. MCI 검사는 기대 확률을 달리한 세부 검사 1, 2로 구성하여 시행하였다. 실시한 검사 간 관련성을 살펴본 결과, 말소리 운율지각 검사 결과는 보청기 착용으로도 청지각적 이득을 기대할 수 없었던 기간과 유의한 관련성을 보였다. PW와 NW 검사에서 운율 조건에 따라 유의한 수행 차를 보였지만, 단어조합 형태에 따른 통계적 유의성은 발견하지 못하였다. 말소리 운율지각 검사 결과는 MCI 1과 유의한 상관을 보인 반면(p < .01), 말지각 검사 수행력과는 유의한 관련성을 보이지 않았다. 이는 인공와우이식 후 시각적 단서 없이 말소리, 음소 지각이 가능해졌다 하더라도 미묘한 운율 변화에 따른 의미 지각의 제한은 계속될 수 있음을 시사한다. 또한 인공와우이식 후 선율윤곽 변화 확인은 음도 변별에 비해 제한을 보이며, 운율지각과 관련 있음을 확인할 수 있었다.

일본어 유악센트 방언과 무악센트 방언의 통사적 애매성의 해소와 운율적 특징 (Syntactic Ambiguities and their Resolution in Prosody in Japanese)

  • 최영숙
    • 음성과학
    • /
    • 제9권3호
    • /
    • pp.211-221
    • /
    • 2002
  • The prosody can play a crucial role in differentiating ambiguous sentences to correctly reflect their intended syntactic structures. In what way do the speakers in Tokyo and Sendai dialects of Japanese use prosodic elements to differentiate syntactic ambiguities? Acoustic measurement was made of utterances of ambiguous sentences in Japanese to observe prosodic strategies for disambiguation. Materials were sentences of the type ADV-VP1-NP-VP2, ADV-NP1-NP2-VP2, where the ambiguity lies in locative adverbial modification, ADV modifying either VP1 or VP2. For this construction the Japanese create the same ambiguities. After defining the depth of a syntactic boundary, F0 of the phrase before and after the boundary, and duration of the syllable and pause before the boundary were measured. The results show that Tokyo dialects speakers use F0 after syntactic boundary, and Sendai dialects speakers use of the syllable and/or pause before the boundary.

  • PDF

Sensitivity to Phrase-initial Tone and Laryngeal Feature Identification of Foreign Learners of Korean

  • Lee, Hye-Sook
    • 말소리와 음성과학
    • /
    • 제2권3호
    • /
    • pp.91-99
    • /
    • 2010
  • This paper reports on an identification test where KFL learners identified the Korean three-way laryngeal contrast in the phrase-initial position, when the phrase-initial tone was systematically manipulated. It turns out that heritage learners have some sensitivity to phrase-initial tone and show a plain-aspirated alternation in their identification according to the phrase-initial tone, as native speakers do, whereas non-heritage students do not show such tone sensitivity. However, after a weekly prosody training, second-year non-heritage students have shown a significant improvement in their performance. This paper clearly shows that the phrase-initial tone plays a critical role in distinguishing laryngeal features of Korean obstruents, and also suggests that prosody including the tone-segment correlation should be incorporated in the KFL curriculum.

  • PDF

자연어 처리 기반 한국어 TTS 시스템 구현 (Implementation of Korean TTS System based on Natural Language Processing)

  • 김병창;이근배
    • 대한음성학회지:말소리
    • /
    • 제46호
    • /
    • pp.51-64
    • /
    • 2003
  • In order to produce high quality synthesized speech, it is very important to get an accurate grapheme-to-phoneme conversion and prosody model from texts using natural language processing. Robust preprocessing for non-Korean characters should also be required. In this paper, we analyzed Korean texts using a morphological analyzer, part-of-speech tagger and syntactic chunker. We present a new grapheme-to-phoneme conversion method for Korean using a hybrid method with a phonetic pattern dictionary and CCV (consonant vowel) LTS (letter to sound) rules, for unlimited vocabulary Korean TTS. We constructed a prosody model using a probabilistic method and decision tree-based method. The probabilistic method atone usually suffers from performance degradation due to inherent data sparseness problems. So we adopted tree-based error correction to overcome these training data limitations.

  • PDF

낭독체에 나타난 중국인 학습자들의 운율구 실현 양상 -청취실험을 바탕으로- (Aspects of Prosodic Phrases' Formation Produced by Chinese Speakers in the Reading of Korean Text)

  • 윤영숙
    • 음성과학
    • /
    • 제15권4호
    • /
    • pp.29-41
    • /
    • 2008
  • The purpose of this paper is to examine how Chinese speakers realize Korean prosodic phrases in the reading of Korean texts. Prosodic phrase, in this study, is defined as basic unit of spoken language which can be perceived as purely separate phonetic unit by both hearer and speaker, and is realized with a coherent intonational configuration. Prosodic phrase plays an important role in both speech production and perception. In the second language acquisition, prosody influences the accuracy and fluency of spoken language. The main purpose of this study is to describe the aspect of syntagmatic operation of prosody that produces prosodic phrases. We have specifically examined the relations between the prosodic phrase's boundary and its syntactic status. Furthermore, we examined internal syntactic structure of each prosodic phrase. And the results of each analysis were compared to the aspects of prosodic phrases' formation produced by native Korean speakers. The results show that Chinese speakers tend to coincide the prosodic phrases with syntactic structure more than native Korean speakers.

  • PDF

The Role of Prosody in Dialect Synthesis and Authentication

  • Yoon, Kyu-Chul
    • 말소리와 음성과학
    • /
    • 제1권1호
    • /
    • pp.25-31
    • /
    • 2009
  • The purpose of this paper is to examine the viability of synthesizing Masan dialect with Seoul dialect and to examine the role of prosody in the authentication of the synthesized Masan dialect. The synthesis was performed by transferring one or more of the prosodic features of the Masan utterance onto the Seoul utterance. The hypothesis is that, given an utterance composed of the phonemes shared by both dialects, as more prosodic features of the Masan utterance are transferred onto the Seoul utterance, the Seoul utterance will be identified as more authentic Masan utterance. The prosodic features involved were the fundamental frequency contour, the segmental durations, and the intensity contour. The synthesized Masan utterances were evaluated by thirteen native speakers of Masan dialect. The result showed that the fundamental frequency contour and the segmental durations had main effects on the perceptual shift from Seoul to Masan dialect.

  • PDF

한국어 음성합성기의 운율 예측을 위한 의사결정트리 모델에 관한 연구 (A Study of Decision Tree Modeling for Predicting the Prosody of Corpus-based Korean Text-To-Speech Synthesis)

  • 강선미;권오일
    • 음성과학
    • /
    • 제14권2호
    • /
    • pp.91-103
    • /
    • 2007
  • The purpose of this paper is to develop a model enabling to predict the prosody of Korean text-to-speech synthesis using the CART and SKES algorithms. CART prefers a prediction variable in many instances. Therefore, a partition method by F-Test was applied to CART which had reduced the number of instances by grouping phonemes. Furthermore, the quality of the text-to-speech synthesis was evaluated after applying the SKES algorithm to the same data size. For the evaluation, MOS tests were performed on 30 men and women in their twenties. Results showed that the synthesized speech was improved in a more clear and natural manner by applying the SKES algorithm.

  • PDF