• 제목/요약/키워드: prosodic factor

검색결과 8건 처리시간 0.02초

모음 상승 현상의 음성적 고찰: 어미 {-고}의 실현을 중심으로 (A Phonetic Study of Vowel Raising: A Closer Look at the Realization of the Suffix {-go})

  • 이향원;신지영
    • 한국어학
    • /
    • 제81권
    • /
    • pp.267-297
    • /
    • 2018
  • Vowel raising in Korean has been primarily treated as a phonological, categorical change. This study aims to show how the Korean connective suffix {-go} is realized in various environments, and propose a principle of vowel raising based on both acoustic and perceptual data. To that end, we used a corpus of spoken Korean to analyze the types of syntactic constructions, the realization of prosodic boundaries (IP and PP), and the types of boundary tone associated with {-go}. It was found that the vowel tends to be raised most frequently in utterance-final position, while in utterance-medial position the vowel was raised more when the syntactic and prosodic distance between {-go} and the following constituent was smaller. The results for boundary tone also showed a correlation between vowel raising and the discourse function of the boundary tone. In conclusion, we propose that vowel raising is not simply an optional phenomenon, but rather a type of phonetic reduction related to the comprehension of the following constituent.

LDA와 tri-tone 모델을 이용한 운율경계강도 예측 (Prosodic Break Index Estimation using LDA and Tri-tone Model)

  • 강평수;엄기완;김진영
    • 한국음향학회지
    • /
    • 제18권7호
    • /
    • pp.17-22
    • /
    • 1999
  • 본 논문에서는 발화된 문장으로부터 운율 경계 강도를 효과적으로 예측하기 위해 LDA와 tri-tone 모델을 혼합한 방법을 제안하였다. 이 방법은 기존의 LDA 방법을 사용하여 음절과 휴지기의 길이 정보를 운율경계강도 예측에 적용하고 피치정보를 벡터양자화에 적용하여 tri-tone이란 개념을 도입한 혼합형 모형이다. 제안된 방법은 주어진 200문장의 운율경계 강도를 예측하는 실험에서 72%의 정확성을 나타내었다.

  • PDF

한국어 음성합성기의 성능 향상을 위한 합성 단위의 유무성음 분리 (Separation of Voiced Sounds and Unvoiced Sounds for Corpus-based Korean Text-To-Speech)

  • 홍문기;신지영;강선미
    • 음성과학
    • /
    • 제10권2호
    • /
    • pp.7-25
    • /
    • 2003
  • Predicting the right prosodic elements is a key factor in improving the quality of synthesized speech. Prosodic elements include break, pitch, duration and loudness. Pitch, which is realized by Fundamental Frequency (F0), is the most important element relating to the quality of the synthesized speech. However, the previous method for predicting the F0 appears to reveal some problems. If voiced and unvoiced sounds are not correctly classified, it results in wrong prediction of pitch, wrong unit of triphone in synthesizing the voiced and unvoiced sounds, and the sound of click or vibration. This kind of feature is usual in the case of the transformation from the voiced sound to the unvoiced sound or from the unvoiced sound to the voiced sound. Such problem is not resolved by the method of grammar, and it much influences the synthesized sound. Therefore, to steadily acquire the correct value of pitch, in this paper we propose a new model for predicting and classifying the voiced and unvoiced sounds using the CART tool.

  • PDF

Perception of Transplanted English Prosody by American and Korean Listeners

  • Yi, So-Pae
    • 음성과학
    • /
    • 제14권1호
    • /
    • pp.73-89
    • /
    • 2007
  • This study explored the perception of transplanted English prosody by thirty American and Korean, male and female listeners. The English utterances of various sentence types produced by Korean and American male speakers were employed to transplant the American prosody contours to Korean English utterances. Then, the thirty subjects were instructed to rate the transplanted prosodic components. Results showed that the interactions between the three factors (e.g., rater groups & transplantation types; transplantation types & sentence types; rater groups & transplantation types & sentence types) turned out to be meaningful. Both Americans and Koreans perceived the effectiveness of the combined effect of transplanted duration and pitch or duration and pitch and intensity. However, when perceiving individual prosodic components, Americans and Koreans showed different perceptual ratings. As for the overall prosody change, Americans perceived the change of intensity in a significant way but Koreans did not because intensity is not a crucial semantic factor in Korean. Americans rated the transplantation of duration alone as ineffective while Koreans rated otherwise. This was explained by the difference between English and Korean. The difference of perspective was also significant with different sentence types, especially with the three sentence types that had speech rates slower than other sentence types. A slower speech rate intensified the mismatch between the transplanted duration and the original pitch causing a negative impression on American listeners whereas this did not affect Korean listeners. Pedagogical implications of the findings are discussed.

  • PDF

Computer Codes for Korean Sounds: K-SAMPA

  • Kim, Jong-mi
    • The Journal of the Acoustical Society of Korea
    • /
    • 제20권4E호
    • /
    • pp.3-16
    • /
    • 2001
  • An ASCII encoding of Korean has been developed for extended phonetic transcription of the Speech Assessment Methods Phonetic Alphabet (SAMPA). SAMPA is a machine-readable phonetic alphabet used for multilingual computing. It has been developed since 1987 and extended to more than twenty languages. The motivating factor for creating Korean SAMPA (K-SAMPA) is to label Korean speech for a multilingual corpus or to transcribe native language (Ll) interfered pronunciation of a second language learner for bilingual education. Korean SAMPA represents each Korean allophone with a particular SAMPA symbol. Sounds that closely resemble it are represented by the same symbol, regardless of the language they are uttered in. Each of its symbols represents a speech sound that is spectrally and temporally so distinct as to be perceptually different when the components are heard in isolation. Each type of sound has a separate IPA-like designation. Korean SAMPA is superior to other transcription systems with similar objectives. It describes better the cross-linguistic sound quality of Korean than the official Romanization system, proclaimed by the Korean government in July 2000, because it uses an internationally shared phonetic alphabet. It is also phonetically more accurate than the official Romanization in that it dispenses with orthographic adjustments. It is also more convenient for computing than the International Phonetic Alphabet (IPA) because it consists of the symbols on a standard keyboard. This paper demonstrates how the Korean SAMPA can express allophonic details and prosodic features by adopting the transcription conventions of the extended SAMPA (X-SAMPA) and the prosodic SAMPA(SAMPROSA).

  • PDF

발화 속도와 말차례 교체 빈도에 따른 운율 단위 변화에 관한 연구 (A study on the change of prosodic units by speech rate and frequency of turn-taking)

  • 원유권
    • 말소리와 음성과학
    • /
    • 제14권2호
    • /
    • pp.29-38
    • /
    • 2022
  • 이 연구는 국립국어원 일상 대화 음성 코퍼스(2020)에서 나타나는 발화를 분석하여 발화 속도 및 말차례 교체 빈도가 운율 단위 변화에 어떤 영향을 끼치는지 밝히는 것을 목적으로 하였다. 분석 결과, 발화 속도가 증가할수록 억양구, 어절 빈도, 발화 길이가 증가하는 양의 상관관계를 보였으나 상관관계가 낮았고, 회귀모형의 적합도는 3%-11%로 설명력이 약했다. 말차례 교체 빈도에 따른 평균 발화 속도는 유의미한 차이가 있었고, 말차례 교체 빈도가 증가할수록 발화 속도는 감소하였다. 또한 말차례 교체 빈도가 증가할수록 억양구 및 어절 빈도와 발화 길이는 감소하였으며 높은 음의 상관관계가 있는 것으로 나타났다. 회귀 모형의 적합도는 27%-32%로 계산되었다. 말차례 교체 빈도가 발화 속도와 운율 단위를 변화시키는 요인으로 작용했을 수 있다. 이는 대화체에서 나타나는 비유창성, 말차례 교체 특성, 화자 간 활발한 상호작용 등이 영향을 미쳤을 것이라 추측된다.

음향학적 자질을 활용한 비디오 스피치 요약의 자동 추출과 표현에 관한 연구 (Investigating an Automatic Method for Summarizing and Presenting a Video Speech Using Acoustic Features)

  • 김현희
    • 정보관리학회지
    • /
    • 제29권4호
    • /
    • pp.191-208
    • /
    • 2012
  • 스피치 요약을 생성하는데 있어서 두 가지 중요한 측면은 스피치에서 핵심 내용을 추출하는 것과 추출한 내용을 효과적으로 표현하는 것이다. 본 연구는 강의 자료의 스피치 요약의 자동 생성을 위해서 스피치 자막이 없는 경우에도 적용할 수 있는 스피치의 음향학적 자질 즉, 스피치의 속도, 피치(소리의 높낮이) 및 강도(소리의 세기)의 세 가지 요인을 이용하여 스피치 요약을 생성할 수 있는지 분석하고, 이 중 가장 효율적으로 이용할 수 있는 요인이 무엇인지 조사하였다. 조사 결과, 강도(최대값 dB과 최소값 dB간의 차이)가 가장 효율적인 요인으로 확인되었다. 이러한 강도를 이용한 방식의 효율성과 특성을 조사하기 위해서 이 방식과 본문 키워드 방식간의 차이를 요약문의 품질 측면에서 분석하고, 이 두 방식에 의해서 각 세그먼트(문장)에 할당된 가중치간의 관계를 분석해 보았다. 그런 다음 추출된 스피치의 핵심 세그먼트를 오디오 또는 텍스트 형태로 표현했을 때 어떤 특성이 있는지 이용자 관점에서 분석해 봄으로써 음향학적 특성을 이용한 스피치 요약을 효율적으로 추출하여 표현하는 방안을 제안하였다.

한국어 초점 발화 시 우반구 손상인의 초점 운율 특성 (Characteristics of Right Hemispheric Damaged Patients in Korean Focused Prosodic Sentences)

  • 이명순;박현
    • 재활치료과학
    • /
    • 제8권3호
    • /
    • pp.69-81
    • /
    • 2019
  • 목적: 본 연구의 목적은 우반구 손상인에게 대조 초점의 중의성 문장에 대한 운율 특성을 알아보고자 하였다. 연구방법: 본 연구는 본 연구는 초점 운율을 조사하기 위해서 강도, F0, 지속시간 등의 음향학적 매개변수를 검사하였다. 정상인과 우반구 손상인의 모든 구어 샘플은 Praat 4.3.14로 분석하였으며 SPSS 18.0을 사용하여 독립 t-test를 통해 자료를 분석하였다. 결과: 본 연구의 결과는 다음과 같다. 첫째, 첫음절의 강도는 집단 간 유의미한 차이를 나타내었다. 둘째, F0은 모든 집단에서 유의미한 차이를 나타내었다. 셋째, 지속시간은 모든 집단에서 유의미한 차이를 나타내었다. 결론: 강도, 지속시간, F0는 모두 구조적 화용적 의미를 강조하는 데 있어서 운율의 요소로써 사용되지만, 초점에 따라서 강도와 지속시간은 F0와 연관성이 있었다. 그에 비해 F0는 언어학적으로도 유의미한 차이가 있었지만 손상인과 정상인 간에도 유의미한 차이가 있었기 때문에 F0는 우반구 손상인의 운율적 평가의 변별 요인이 될 수 있으며 차후의 연구를 통해 더 강력한 증거를 축적할 필요가 있을 것이다.