• 제목/요약/키워드: 한국어 자음

검색결과 125건 처리시간 0.023초

Trainable TTS System을 위한 음운 지속시간 모델링 (An Analysis on the Phoneme Duration Modeling For the Trainable TTS System)

  • 서지인;이양희
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.109-112
    • /
    • 2001
  • 본 논문에서는 한국어 Trainable TTS System의 자연스러운 음성 합성을 위해 400문장(어절수 : 6,220, 음운수: 총43,701: 자음 23,899,모음: 19,802)에 대하여 단일 남성화자가 발성한 문 음성 데이터를 음운레벨세그먼트, 음운 라벨링 ,어절간의 띄어쓰기 ,어절에 대한 음운별 품사가 태깅된 문 음성 코퍼스를 사용하여 음운 환경과 품사에 의하여 음운의 지속시간이 어떻게 변화하는가에 대하여 통계적으로 분석하였다. 그리고 음운 지속시간을 보다 정교하게 예측하기 위하여, 각 음운에 대한 고유 지속시간의 영향이 배제된 정규화 음운지속시간에 대한 회귀트리를 이용하여 정규화 지속시간에 영향을 미치는 특징요소들 간의 관계를 통계적인 방법으로 분석하였다. 그 결과 문법적인 특징요소를 나타내는 요소들간에 서로 상관이 높게 나타나는 것을 알 수 있었다 그리고 이러한 경우 유사한 특징 요소들간에 상관이 1에 가까울 정도로 상관이 높은 요소들의 경우 예측지수가 낮은 요소들을 제거하여도 지속시간변화에 영향을 미치지 못하는 것으로 나타났다. 그 결과 문법적 성질이 유사한 특징 요소들을 회귀트리를 통해 모델링할 경우에 요소들간의 상관정도를 분석하여 최소한의 특징요소들을 선택 할 수 있는 방법을 제시하였다 그리고 이를 토대로 한 정규화 회귀트리의 모델링이 지속시간 회귀트리 모델링보다 우수함을 입증하였다.

  • PDF

Electroglottography를 사용한 한국어 폐쇄자음의 특성 및 임상적 적용 (Characteristics of Korean Stop Consonants by Using Electroglottography and Its Clinical Application)

  • 채윤정;김현기;홍기환
    • 음성과학
    • /
    • 제4권2호
    • /
    • pp.157-177
    • /
    • 1998
  • An electroglottography (EGG) was used to investigate the function of the vocal folds during their vibration. In this study, four Korean native speakers and 10 vocal polyp patients were selected. To investigate the dynamic change of EGG waveforms for the three-way distinction of Korean stops, a DSP-Sona graph model 5500, a Rino- Laryngeal stroboscope, a CSL model 4300B and a Laryngograph were used. An EGG Model 4338 was used to exam the vocal polyp of patients' voices during high, low, comfortable pitch production. The purpose of this study is to investigate the characteristics of Korean stop consonants in relation to pitch and to observe laryngeal movement during vocal fold vibration and speech production. The basic data accumulated during this research can be applied in clinical treatment. The results are as follows: on the Korean stop consonants, the aspirated stop is the highest in the GOT and PC1. On the angle of vowel contour, the angle of lenis is smaller than the angle of heavily aspirated and glottalized stops. The fundamental frequency is lowest at the lenis stop, In vocal polyp patients', the low pitch range is smaller than in normal speakers'. The pitch break and the vocal fry were observed. The jitter and OQ value are higher in vocal polyp patients than in those of normal speakers'.

  • PDF

한국어 말소리 지각에 미치는 조음에 관한 시각정보의 영향: 한국인의 McGurk 효과 (The influence of visual information on place of articulation in Korean speech perception: The McGurk effect in Korean subjects)

  • 최양규;남기춘
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.293-296
    • /
    • 2002
  • 운동이론(motor theory)에 따르면 조음에 관한 정보는 말소리 지각에 중요한 역할을 한다고 한다. 조음에 관한 시각정보가 자음지각에 중요함을 시사하는 것이 바로 McGurk 효과이다. McGurk 효과는 말소리 지각에서 청각정보와 시각정보가 상충될 때 지각의 결과는 청각에 의한 조음정보와 시각에 의한 조음정보가 통합(integration)되어서 나타나는 것을 말한다. 예컨대, 시각적으로는 /ga/를 발음하는 모습을 보여주면서 동시에 청각적으로는 /ba/를 들려주면 그 결과로 /da/로 지각된다. 마찬가지로 시각적으로는 /ka/를, 청각적으로는 /ma/를 제시하면 /na/로 지각된다. 따라서 McGurk 효과는 시각적인 조음 정보가 자동적으로, 무의식적으로 말소리 지각과정에 통합됨은 보여준다. 한편 이러한 McGurk 효과는 문화마다 그 강도가 다르게 나타난다는 보고가 있다(Sekiyama, 1997). 예컨대, 일본가 중국 원어민의 경우 미국 원어민보다 McGurk 효과가 약하게 나타났다. 본 연구는 한국인에게는 McGurk 효과가 어떠한 양상으로 나타날지를 규명해 보고 아울러 기존의 미국, 일본 그리고 중국 원어민에 대한 연구결과와 비교 분석해 보았다.

  • PDF

한국어 자음에서 변별 자질들의 지각적 위계 (The Perceptual Hierarchy of Distinctive Features in Korean Consonants)

  • 배문정
    • 말소리와 음성과학
    • /
    • 제2권4호
    • /
    • pp.109-118
    • /
    • 2010
  • Using a speeded classification task (Garner, 1978), we investigated the perceptual interaction of distinctive features in Korean consonants. The main questions of this study were whether listeners can perceptually identify the component features that make up complex consonant sounds, whether these features are processed independently or dependently and whether there is a systematic hierarchy in their dependency. Participants were asked to classify syllables based on their difference in distinctive features in the task. Reaction times for this task were also gathered. For example, participants classified spoken syllables /ta/ and /pa/ as one category and /$t^ha$/ and /$p^ha$/ as another in terms of aspiration condition. In terms of articulation, participants classified /ta/ and /$t^ha$/ as one category and /pa/ and /$p^ha$/ as another. We assumed that the difference between their RTs represents their interdependency. We compared the laryngeal features and place features (Experiment 1), resonance features and place features (Experiment 2), and manner features and laryngeal features (Experiment 3). The results showed that distinctive features were not perceived in a completely independent way, but they had an asymmetric and hierarchical interdependency. The laryngeal features were found to be more independent compared to place and manner features. We discuss these results in the context of perceptual basis in phonology.

  • PDF

한국어 CV단음절의 음소합성 (The Phoneme Synthesis of Korean CV Mono-Syllables)

  • 안점영;김명기
    • 한국통신학회논문지
    • /
    • 제11권2호
    • /
    • pp.93-100
    • /
    • 1986
  • 子音 音素/ㄱ, ㄷ, ㅂ, ㅈ/과 이에 대응한 硬音, 激音 그리고 母音 音素/ㅏ, ㅓ, ㅗ, ㅜ, ㅣ/로 구성된 韓國語 CV單音節을 偏自己相關方式으로 分析하고, 分析된 parameter를 적절히 제어하여 音素合成方法으로 이들 音節을 合成하였다. 분석결과 자음길이는 激音일 때 제일 길고, 硬音이 가장 짧았으며 이 音들의 gain도 비슷한 변화를 나타내었다. 그리고 平音뒤의 모음 pitch 주기가 가장 길고, 硬音, 激音으로 바뀌면 pitch주기가 짧아졌다. 子音 音素는 激音의 길이와 gain을 제어하여 합성하고 母音 音素는 平音뒤에 오는 母音의 pitch와 길이를 제어하여 합성하였다. 子音과 母音 音素를 結合시켜 CV單音節을 合成하였다. 實驗結果 合成音質은 대체로 양호하였고, 韓國語 音聲의 音素合成에 필요한 規則作成의 可能性을 확인하였다.

  • PDF

20세기 초 베를린 한인 음원의 음운과 형태 (A Research on the Spoken Language in Korean Voices from Berlin: Focusing on Phonological and Morphological Features)

  • 차재은;홍종선
    • 한국어학
    • /
    • 제72권
    • /
    • pp.257-282
    • /
    • 2016
  • The aim of this paper is to research phonological and morphological features in Korean Voices from Berlin. The Korean Voices from Berlin was recorded in 1917 at Berlin by 5 Korean prisoners engaged in World War I, some of them came from North Hamgyeong Province, the others came from Pyeongan Province, therefore these data show a North Korean regional dialect. The data are composed of three materials, counting numbers, reciting scriptures and singing folksongs. The results of this research are as follows. 1) The consonant system of Korean voices is similar to standard Korean. The 19 consonants are classified according to 5 manners of articulations and 5 points of articulations. 2) The liquid /l/ has three allophones, [ɾ] appeared in an onset position, [l] in a word medial coda position or preceded by [l], [ɹ] in a word final coda position. 3) The vowel system of Korean voices is similar to early 20th Korean's. It has 8 monophthongs, /a, ʌ, o, u, ɯ, i, e, ${\varepsilon}$/. 4) The 1 to 10 numbers in Korean voices are similar to Middle-Korean numerals. 5) The genitive particle '/ɯi/의' is pronounced [i], [ɯ], [${\varepsilon}$], especially [ɯ] is appeared in Sino Korean. 6) The /l/-deletion of conjugations are similar to Middle-Korean, /l/ deletion always occurred, if [+cor] consonants are followed.

뇌성마비 마비말장애 성인의 파찰음 실현 양상 분석 (Acoustic analysis of Korean affricates produced by dysarthric speakers with cerebral palsy)

  • 문지현;김선희;정민화
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.45-55
    • /
    • 2021
  • 본 연구는 경직형 경도-중등도 뇌성마비 마비말장애 성인이 산출한 한국어 파찰음의 음향학적인 특징을 분석한다. 한국어의 마찰음과 파찰음은 조음오류가 빈번하게 발생하는 자음인데, 기존 연구들은 마찰음에만 집중했다. 따라서 본 연구에서는 마비말장애 화자가 산출한 파찰음을 음향학적으로 분석하고자 한다. QoLT_SPEECH_2014 데이터베이스 내에서 파찰음 /tɕ, tɕh, ͈tɕ/이 어두 초성 및 어중 초성에 위치하는 단어를 선정하여 경도-중등도 경직형 장애 남성 화자 6명과 비장애 남성 화자 5명의 발화 데이터를 분석에 사용하였다. 한국어의 파찰음의 특성을 고려하여 파찰음의 음향학적 특징을 나타내는 매개변수를 선정하여 분석을 시행하였다: 마찰구간의 길이, 묵음 구간의 길이, 무게중심, 분산, 왜도, 첨도, 중심적률. 분석 결과는 다음과 같다: 1) 어중 초성 파찰음에서 마비말장애인이 유의하게 긴 마찰구간의 길이를 보였다, 2) 마비말장애인이 유의하게 긴 묵음 구간의 길이를 보였다, 3) 무게중심의 경우 두 집단 간의 유의한 차이가 존재하지 않았다, 4) 마비말장애인이 유의하게 큰 왜도 값을 보였다, 5) 마비말장애인이 유의하게 큰 중심적률 값을 보였다. 본 연구는 마비말장애인이 산출한 파찰음의 특성을 분석하고, 비장애인이 산출한 파찰음과의 차이를 밝혔다.

한국어 단음절에서 자음과 모음 자질의 비선형적 지각 (Nonlinear Interaction between Consonant and Vowel Features in Korean Syllable Perception)

  • 배문정
    • 말소리와 음성과학
    • /
    • 제1권4호
    • /
    • pp.29-38
    • /
    • 2009
  • This study investigated the interaction between consonants and vowels in Korean syllable perception using a speeded classification task (Garner, 1978). Experiment 1 examined whether listeners analytically perceive the component phonemes in CV monosyllables when classification is based on the component phonemes (a consonant or a vowel) and observed a significant redundancy gain and a Garner interference effect. These results imply that the perception of the component phonemes in a CV syllable is not linear. Experiment 2 examined the further relation between consonants and vowels at a subphonemic level comparing classification times based on glottal features (aspiration and lax), on place of articulation features (labial and coronal), and on vowel features (front and back). Across all feature classifications, there were significant but asymmetric interference effects. Glottal feature.based classification showed the least amount of interference effect, while vowel feature.based classification showed moderate interference, and place of articulation feature-based classification showed the most interference. These results show that glottal features are more independent to vowels, but place features are more dependent to vowels in syllable perception. To examine the three-way interaction among glottal, place of articulation, and vowel features, Experiment 3 featured a modified Garner task. The outcome of this experiment indicated that glottal consonant features are independent to both the place of articulation and vowel features, but the place of articulation features are dependent to glottal and vowel features. These results were interpreted to show that speech perception is not abstract and discrete, but nonlinear, and that the perception of features corresponds to the hierarchical organization of articulatory features which is suggested in nonlinear phonology (Clements, 1991; Browman and Goldstein, 1989).

  • PDF

프랙탈 차원을 이용한 단음절 음성의 자$\cdot$모음 분리 (Consonant/Vowel Segmentation in Monosyllabic Speech Data Using the Fractal Dimension)

  • 최철영;김형순;김재호;손경식
    • 한국음향학회지
    • /
    • 제13권3호
    • /
    • pp.51-62
    • /
    • 1994
  • 본 논문에서는 음성신호의 프랙탈 차원을 이용하여 한국어 CV(Consonant-Vowel) 단음절에서 자음과 모음을 분리하는 실험을 하였다. 프랙탈 차원은 Minkowski-Bouligand 차원을 사용하였으며, 형태학적 커버링 (morphological covering) 방법을 이용하여 구하였다. 프랙탈 차원의 음성분리에 있어서의 유용성을 조사하기 위하여 프랙탈 차원과 단구간 에너지 각각을 이용한 음성분리 실험과 에너지와 프랙탈 차원을 같이 이용한 음성분리 실험을 하여 그 결과들을 비교하였다. 실험 결과 에너지의 기울기를 사용한 경우는 $88.0\%$의 바른 분리 결과를 보였고, 프랙탈 차원의 기울기를 사용한 경우는 그보다 더 나은 $93.6\%$의 바른 분리 결과를 보였으며, 에너지의 기울기와 프랙탈 차원의 기울기의 곱을 사용한 경우는 $96.1\%$로 가장 높은 바른 분리결과를 나타냈다. 이를 통해 프랙탈 차원이 음성신호의 분리에 있어서 하나의 유용한 파라메타가 될 수 있음을 확인하였다.

  • PDF

음소판별필터를 이용한 한국어 단음절 음성인식 (Speech Recognition on Korean Monosyllable using Phoneme Discriminant Filters)

  • 허성필;정현열;김경태
    • 한국음향학회지
    • /
    • 제14권1호
    • /
    • pp.31-39
    • /
    • 1995
  • 선형판별함수를 이용하여 음소단위의 판별필터를 구성하였다. 음소판별필터를 이용한 음성인식 시스템은 발성구간의 검출에 유용하고, 음성의 구분과 식별을 동시에 시행할 수 있으며 모든 음소를 동일한 인식모델로 취급하는 것이 가능하였다. 이 때 전문가의 경험적 지식을 이용하지 않고 수리적인 반복학습방법으로 시스템을 구성한 것이 특징이다. 모든 음소판별필터는 독립적으로 동작하므로 하나의 음소구간에 대해 복수필터 출력이 발생될 수 있으며, 발성구간의 음소가 탈락하는 경우도 있다. 따라서 본 연구에서는 무게벡터와 패턴벡터와의 내적에 통합계수를 이용하여 최대값을 선택하는 방법으로 다수개의 경합출력을 하나로 통합하였으며, 동시에 시간적인 정보와 중간값필터를 이용하여 탈락과 오인식되는 음소를 보상하므로써 인식율을 향상시켰다. 인식실험결과 모음의 경우 학습용자료에서는 $96.5\%$, 평가용자료에서는 $87.6\%$의 인식율을 얻었고, 자음은 각각 $84.0\%,70.8\%$의 음소인식율을 얻었다.

  • PDF