• 제목/요약/키워드: accentual phrase

검색결과 61건 처리시간 0.025초

Momel을 이용한 한국어의 억양 연구 (A Study on Korean Intonation Using Momel)

  • 김선희;유현지;홍혜진;이호영
    • 대한음성학회지:말소리
    • /
    • 제63호
    • /
    • pp.85-100
    • /
    • 2007
  • This paper aims to propose how to extract intonation patterns using Momel, a pitch stylization algorithm, and to present results of analyzing speech corpora in comparison with those in earlier researches. Two speech corpora are used: one is the sound files obtained from the K-ToBI web site, and the other consists of 80 passages pronounced by 4 speakers (2 male and 2 female). The results show that Momel provides significant pitch targets which can be labeled as H and L tones within prosodic units such as Accentual Phrase (AP) and Intonation Phrase (IP). The resulting AP patterns and IP boundary tone patterns correspond to those in earlier researches. Thus, this study will contribute to the study of intonation as well as to the development of automatic intonation labeling systems.

  • PDF

한국어 음운구 억양 유형의 변별적 특성과 변이 조건에 대한 연구: 음절 수와 분절음 종류의 영향을 중심으로 (Distinguishing features and variability of intonation patterns in Korean phonological phrases: The effects of syllable count and segmental content)

  • 오재혁
    • 말소리와 음성과학
    • /
    • 제14권3호
    • /
    • pp.27-40
    • /
    • 2022
  • 이 연구는 한국어 음운구 억양 유형의 변별적 특성과 변이 조건을 밝히기 위한 목적의 일환으로 음운론적인 조건인 음절 수와 분절음 종류가 음운구 억양에 미치는 영향에 대해서 살펴보았다. 4음절을 기준으로, 음운구 억양은 LHLH를 기본형으로 설정할 수 있으며, 음절 수와 분절음 종류가 변이를 만드는 조건으로 작용한다고 할 수 있다. 음절 수는 억양을 곡선에서 직선으로 바꾸는데, 그 기준은 3음절 이하이다. 분절음은 음높이 대역과 음높이 변동에 영향을 미치는데, 첫 번째 분절음은 음운구 억양이 형성되는 음높이 대역에 영향을 미치고, 그 이하의 분절음은 음높이 변동에 영향을 미친다. 첫 번째 분절음이 [+기식성], [+긴장성], [+지속성]을 지니면 높은 대역, 그렇지 않으면 낮은 대역에서 억양이 형성된다. 높은 대역에서 실현되는 억양에서 두 번째 이하의 분절음이 [-기식성], [-긴장성], [-지속성]을 지니게 되면 음높이를 낮은 대역의 최하위까지 하강시키고, 낮은 대역에서 실현되는 억양에서는 [+기식성], [+긴장성], [+지속성]을 지닌 분절음이 LHLH의 두 번째 하강을 저지한다.

한국어 자유 발화 음성의 억양 패턴 (Intonation Patterns of Korean Spontaneous Speech)

  • 김선희
    • 말소리와 음성과학
    • /
    • 제1권4호
    • /
    • pp.85-94
    • /
    • 2009
  • This paper investigates the intonation patterns of Korean spontaneous speech through an analysis of four dialogues in the domain of travel planning. The speech corpus, which is a subset of spontaneous speech database recorded and distributed by ETRI, is labeled in APs and IPs based on K-ToBI system using Momel, an intonation stylization algorithm. It was found that unlike in English, a significant number of APs and IPs include hesitation lengthening, which is known to be a disfluency phenomenon due to speech planning. This paper also claims that the hesitation lengthening is different from the IP-final lengthening and that it should be categorized as a new category, as it greatly affects the intonation patterns of the language. Except for the fact that 19.09% of APs show hesitation lengthening, the spontaneous speech shows the same AP patterns as in read speech with higher frequency of falling patterns such as LHL in comparison with read speech which show more LH and LHLH patterns. The IP boundary tones of spontaneous speech, showing the same five patterns such as L%, HL%, LHL%, H%, LH% as in read speech, show higher frequency of rising patterns (H% and LH%) and contour tones (HL%, LH%, LHL%) while read speech on the contrary shows higher frequency of falling patterns and simple tones at the end of IPs.

  • PDF

Peak 파라미터와 피치 검색테이블을 이용한 억양 생성방식 연구 (A Study on Generation Method of Intonation using Peak Parameter and Pitch Lookup-Table)

  • 장석복;김형순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-190
    • /
    • 1999
  • 본 논문에서는 Text-to-Speech 시스템에서 사용할 억양 모델을 위해 음성 DB에서 모델 파라미터와 피치 검색테이블(lookup-table)을 추출하여 미리 구성하고, 합성시에는 이를 추정하여 최종 F0 값을 생성하는 자료기반 접근방식(data-driven approach)을 사용한다. 어절 경계강도(break-index)는 경계강도의 특성에 따라 고정적 경계강도와 가변적 경계강도로 세분화하여 사용하였고, 예측된 경계강도를 기준으로 억양구(Intonation Phrase)와 액센트구(Accentual Phrase)를 설정하였다. 특히, 액센트구 모델은 인지적, 음향적으로 중요한 정점(peak)을 정확하게 모델링하는 것에 주안점을 두어 정점(peak)의 시간축, 주파수축 값과 이를 기준으로 한 앞뒤 기울기를 추정하여 4개의 파라미터로 설정하였고, 이 파라미터들은 CART(Classification and Regression Tree)를 이용하여 예측규칙을 만들었다. 경계음조가 나타나는 조사, 어미는 정규화된(normalized) 피치값과 key-index로 구성되는 검색테이블을 만들어 보다 정교하게 피치값을 예측하였다. 본 논문에서 제안한 억양 모델을 본 연구실에서 제작한 음성합성기를 통해 합성하여 청취실험을 거친 결과, 기존의 상용 Text-to-Speech 시스템에 비해 자연스러운 합성음을 얻을 수 있었다.

  • PDF

낭독속도에 따른 강세구 경계 검출에 관한 연구 (A Study on Detection of Accentual Phrase's Boundaries according to Reading Speeds)

  • 주장규;이기영;송민석
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.91-94
    • /
    • 2000
  • 최근 운율 구조와 문장구조 및 음운규칙과 관련 된 많은 언어학적 연구가 이루어져, 언어 이해 차원에서 의미 정보, 문장 구조 정보, discourse structure 등을 위한 운율 정보의 유용성이 입증되었으나, 이러한 결과가 최근의 음성인식 시스템에는 거의 적용되지 못하고 있다. 본 연구에서는 계층적인 방법을 기초로 하여 한국어의 연속음성으로부터 운율구를 검출하는 세그멘테이션법을 제안하였다. 우선, 입력된 음성으로부터 문장단위의 경계를 검출하기 위하여 휴지기를 이용하였으며 에너지, 휴지기의 지속시간 및 피치궤적을 참조하여 강세구의 경계를 검출하였다. 실험음성의 텍스트는 "만물상"이며, 남녀 각 2명의 표준어 화자가 빠른 속도와 보통 속도로 낭독한 음성데이터를 대상으로 비교하였다.

  • PDF

음운환경에 따른 서울말 악센트구초의 고성조 (High Tone of Accentual Phrase in Seoul Korean: with reference to phonological environments)

  • 전은;이숙향
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.329-332
    • /
    • 2000
  • 변수로서 악센트구 내 음절수, 첫째 음절과 둘째 음절의 음절 유형 (폐음절 대 개음절), 첫째 음절과 둘째 음절의 초성 자음의 유형 등을 고려하여 선택된 3음절 무의미 단어 35개와 4음절 무의미 단어 35개를 사용하여 4음절 이상으로 이루어진 서울말 악센트구의 성조에 대 하여 조사하였다. 이 실험의 발화에서는 1) 악센트구성조에 대하여 4음절과 5음절의 차이는 나타나지 않았다. 2) 음절 유형은 첫째 음절의 초성 자음이 보통음일 때는 유의한 영향을 미치지 않았으나, 센소리일 때는 둘째 음절의 유형이 유의한 영향을 미치는 것으로 드러났다 3) 악센트구 성조에 대하여 첫째 음절의 초성 자음의 유형이 중요한 역할을 하는 것으로 나타났다 첫째 음절의 초성 자음이 센소리일 때 악센트구 4개 성조 모두 보통음일 때에 비해 높게 나타났다. 4) 둘째 음절의 초성 자음의 유형도 자신의 성조에 유의한 영향을 끼치는 것으로 드러났으며 센 소리로 시작하는 경우에 다른 유형의 자음에 비하여 자신의 피치 값이 높은 것으로 나타났다.

  • PDF

한국어 위치정보 데이터의 발음 분석 (A Pronunciation Analysis on Korean Point-of-Interest Data)

  • 김선희
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2007년도 한국음성과학회 공동학술대회 발표논문집
    • /
    • pp.91-94
    • /
    • 2007
  • This paper aims to analyze the pronunciation of Korean Point-of-Interest (POI) data, which consist of 224 sound files, from the phonological point of view, adapting the notion of prosodic word within the framework of Intonational Phonology. Each POI word is broken down into prosodic words, which are defined as the minimal sequence of segments which can be produced as one Accentual Phrase (AP). Then the pronunciation of the POI word considering its prosodic words are analyzed. The results show that: in most cases, a prosodic word is realized as one AP; that, in some cases, two prosodic words are pronounced as one AP: and that no cases are found where 3 prosodic words are realized as one AP.

  • PDF

한국인 영어 학습자의 영어 관계절 모호성 해소의 운율적 전략 (Korean English Learners' Prosodic Disambiguation in English Relative Clause Attachment)

  • 전윤실;신지영;김기호
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 춘계 학술대회 발표논문집
    • /
    • pp.67-70
    • /
    • 2006
  • Prosody can be used to resolve syntactic ambiguity of a sentence. English relative clause construction with complex NP(the N1, N2, and RC sequence) has syntactic ambiguity and the clause can be interpreted as modyfying N1(high attachment) or N2(low attachment), Speakers and listeners can disambiguate those sentences based on the prosody. In this paper, we investigate the Korean English learners production on the prosodic structure of English relative clause construction. The production experiment shows that the beginner learners use the phrasing frequently and the advanced learners depend on both the phrasing and the accent. One of the characteristic of the Korean English learners' intonation is that the Korean accentual phrase tone pattern LHa is transferred to their production.

  • PDF

일본어 합성기에서 유동 Break를 이용한 합성단위 선택 방법 (A Unit Selection Methods using Flexible Break in a Japanese TTS)

  • 송영환;나덕수;김종국;배명진;이종석
    • 한국음향학회지
    • /
    • 제26권8호
    • /
    • pp.403-408
    • /
    • 2007
  • 대용량 코퍼스를 이용하는 합성단위 선택(unit selection) 기반 합성기에서 break는 자연성 및 명료성에 큰 영향을 미치는 파라미터로 unit selection 과정에서 음소 정보와 함께 중요한 특징으로 사용된다. 일본어는 피치의 상대적 높낮이로 표현되는 악센트를 가지는 언어이고, 악센트의 변화에 따라 AP(Accentual Phrase)가 결정되고 AP 경계에서 break가 형성된다. break는 규칙 기반 방식이나 통계적 방식인 J-ToBI를 이용하여 예측 할 수 있으나 다양성으로 인해 정확한 예측이 어렵다. 따라서 본 논문에서는 다양한 운율 정보를 포함하고 있는 대용량 코퍼스의 장점을 이용하기 위해 break를 고정 break와 유동 break로 나누어 합성단위 검색을 수행한다. 실험 결과 제안한 합성단위 선택 방법으로 합성음의 자연성을 향상 시킬 수 있었다.

일본어 합성기에서 악센트 정보가 결합된 발음기호를 이용한 Break 예측 방법 (Break Predicting Methods Using Phonetic Symbols Combined with Accents Information in a Japanese Speech Synthesizer)

  • 나덕수;이종석;김종국;배명진
    • 대한음성학회지:말소리
    • /
    • 제62호
    • /
    • pp.69-84
    • /
    • 2007
  • Japanese is a language having intonations, which are indicated by the relative differences in pitch heights and the accentual phrases (APs) are placed according to the changes of the accents while a break occurs on a boundary of the APs. Although a break can be predicted by using J-ToBI, which is a rule-based or statistical approach, it is very difficult to predict a break exactly due to the flexibility. Therefore, in this paper, a method which can enhance the quality of synthesized speech by reducing the errors in predicting break indices (BI), are proposed. The method is to use a new definition for the phonetic symbols, which combine the phonetic values of Japanese words with the accents information. Since a stream of defined phonetic symbols includes the information on the changes in intonations, the BI can be easily predicted by dividing the intonation phrase (IP) into several APs. As a result of an experiment, the accuracy of break generations was 98 % and the proposed method contributed itself to enhance the naturalness of synthesized speeches.

  • PDF