• Title/Summary/Keyword: Pronunciation Dictionary

Search Result 45, Processing Time 0.032 seconds

EVALUATION OF THE SYNTHETIC SPEECH QUALITY BY THE TD-PCULI METHOD

  • Kang, Chan-Hee;Shin, Yong-Jo;Kim, Yun-Seok;Kwon, Ki-Hyung;Chin, Yong-Ohk
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06a
    • /
    • pp.977-983
    • /
    • 1994
  • In this paper we have evaluated the synthetic speech quality by the proposed TD-PCULI speech synthesis method. For the synthesis we have extracted parameters from the Korean monosyllables through the analysis of speech waveforms in the time domain. We have constructed the Korean data format dictionary for the synthesis-by-rule depending upon the frequencies of the Korean pronunciation large vocabulary dictionary, in which V type syllables are 19, CV type's are 80, VC type's are 30 and CVC type's are 100. And using them we have synthesized various Korean monosyllables, words and sentences. We have tested each 10 syllables selected according to the 4 Korean syllable types with the objective MOS(Mean Opinion Score) evluation method about the 4 items i.e., intelligibility, clearness, loudness, and naturality after selecting random group without the knowledge of them. And also we have tested the possibility to modify a duration and F0 into another forms with changing a duration (i.e., 150msec, 300msec, 500msec, 700msec and 1sec) and a central fundamental frequency(i.e., 80Hz, 118Hz, 140Hz, 170Hz, and 200Hz). As the results of experiments the noises occurred in the course of synthesizing the speech by the rules are removed to be a very clear level and we can find that the prosodic elements can be controled as a good condition.

  • PDF

Multiple Pronunciation Dictionary Generation For Korean Point-of-Interest Data Using Prosodic Words (운율어를 이용한 한국어 위치 정보 데이터의 다중 발음 사전 생성)

  • Kim, Sun-Hee;Jeon, Je-Hun;Na, Min-Soo;Chung, Min-Hwa
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.183-188
    • /
    • 2006
  • 본 논문에서 위치 정보 데이터란 텔레메틱스 분야의 응용을 위하여 웹상에서 수집한 Point-of-Interest (POI) 데이터로서 행정구역 및 지명 인명, 상호명과 같은 위치 검색에 사용되는 어휘로 구성된다. 본 논문은 음성 인식 시스템을 구성하는 발음 사전의 개발에 관한 것으로 250k 위치 정보데이터로부터 운율어를 이용하여 불규칙 발음과 발음 변이를 포함하는 가능한 모든 발음을 생성하는 방법을 제안하는 것을 목적으로 한다. 원래 모든 POI 는 한 번씩만 데이터에 포함되어 있으므로, 그 가운데 불규칙 발음을 포함하는 POI를 검출하거나 발음을 생성하기 위해서는 각각의 POI 하나하나를 일일이 검토하는 방법밖에 없는데, 대부분의 POI 가 복합명사구로 이루어졌다는 점에 착안하여 운율어를 이용한 결과, 불규칙 발음 검출과 다중 발음 생성을 효율적으로 수행할 수 있었다. 이러한 연구는 음성처리 영역에서는 위치정보데이터의 음성인식 성능을 향상하는 데 직접적인 기여를 할 수 있고, 무엇보다도 음성학과 음운론 이론을 음성 인식 분야에 접목한 학제적 연구로서 그 의미가 있다고 할 수 있다.

  • PDF

DECIPHERING THE DOUBLE MEANINGS OF THE COWHERD STAR (견우성의 이중적 의미에 대한 해석)

  • Ahn, Sang-Hyeon;Kim, Dong-Bin;Lee, Yong-Sam;Song, Doo-Jong
    • Publications of The Korean Astronomical Society
    • /
    • v.25 no.4
    • /
    • pp.129-139
    • /
    • 2010
  • The Cowherd Star and the Weaving Maid Star have been famous stars in East Asian countries. Nowadays Altair is defined to be the Cowherd Star in public materials including science books, mass media, public outreach programs, and movies played in public planetariums and science museums. However, in astronomical books and star-charts in history, the Cowherd Big Star (牽牛大星) has been known to be Dabih or $\beta$ Cap in the constellation Capricorn, and the asterism Cowherd consists of six stars including Dabih. Since the same title is given to the different objects simultaneously, considerable misunderstanding and confusion among the public have occurred. In this paper we consider this problem in two aspects. One aspect is which star has been defined to be the Cowherd Star in ancient literatures; the other is which stars were regarded as the Cowherd or the Cowherd Star in the historical records of occultation or conjunction in History of Koryo, Annals of the Choson Dynasty, and Daily Records of Royal Secretariat of the Choson Dynasty. As a result, we see that Altair has been regarded as the Cowherd Star in folklore and literature, but Dabih has been defined to be the Cowherd Big Star in astronomical works. An explanation proposed by previous researchers on the reason why such double meanings have been appeared is introduced. In the explanation, the fact that the Altair was defined as the Cowherd Star in ancient times had not been handed over properly, and the name of Cowherd was later put to the Dabih and its surrounding five stars to form one of 28 lunar lodges. Based upon these facts, we suggest the following ideas: (1) Altair should be introduced to be the Cowherd Star in public-friendly programs, and Dabih should be noticed to be the Cowherd Big Star in the field of history of astronomy. Dabih should be added as the astronomical Cowherd Big Star in academic books such as a dictionary of astronomical terminology. (2) The Korean pronunciation for Altair should be al-tear instead of al-tairu in accordance with the definition in the astronomical terminology dictionary compiled by the Korean Astronomical Society.

A study on Interpretating Japanese Menus (일식메뉴 해설에 관한 연구 I)

  • 송청락
    • Culinary science and hospitality research
    • /
    • v.4
    • /
    • pp.211-224
    • /
    • 1998
  • This study is research about coinage and interpretation of Japanese Menus in luxury hotels in Seoul. Japanese Menus consist of three categories. These can be expressed A+B+C groupings. A represents Ingredients, C represents the cooking method, while B shows the name of a region(B1), the seasoning(B2), and a word that expresses the shape of the food(B3), etc. B can be flexible in meaning. However, the setting, A+B+C, is not always used strictly for these category meanings. Ingredients, A, is sometimes used independently(ex, ぃくとろろ), and at other times B1 + C, B2 + C or B3 + C are used. Sometimes A+C is used without B. The most general expression is Ingredients + the method for cooking(A+C Type). By knowing the menu description the food type and cooking method can be discovered. Most concrete method is Ingredients + procedure for seasoning + cooking method(A+B2+C Type) show how something is made and what kind of seasoning. This method is frequently used for roasted dishes with seasoning. Food which is expressed by A, Ingredients, does not require a complicated cooking process and is fixed by a conventional cooking process without any explanation ; delicacies(珍味), an hors d'oeuvres(前菜), sushi(Japanese vinegared rice delicacies) and sliced raw fish. There are two obstacles in interpreting Japanese Menus. First, we cannot look up the menu words easily in a dictionary because the mixing of Chinese Characters and the pronunciation of them differs from Korean chinese characters. Secondly, the names of Japanese food are inserted with a name of a place or another symbolic word, so they sometimes cannot be translated. We should offer various and accurate information for foreign customers because various Non-Japanese people use these restaurants frequently. This will enable them to enjoy themselves more comfortably. Therefore, you should decide the words carefully and provide an explanation about the complicated parts of the Menu when you work with Menu copywriter.

  • PDF

Pronunciation Dictionary For Continuous Speech Recognition (한국어 연속음성인식을 위한 발음사전 구축)

  • 이경님;정민화
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.197-199
    • /
    • 2000
  • 연속음성인식을 수행하기 위해서는 발음사전과 언어모델이 필요하다. 이 둘 사이에는 디코딩 단위가 일치하여야 하므로 발음사전 구축시 디코딩 단위로 표제어 단위를 선정하며 표제어 사이의 음운변화 현상을 반영한 발음사전을 구축하여야 한다. 한국어에 부합하는 음운변화현상을 분석하여 학습용 자동 발음열을 생성하고, 이를 통하여 발음사전을 구축한다. 전처리 단계로 기호, 단위, 숫자 등 전처리 과정 및 형태소 분석 과정을 수행하며, 디코딩 단위인 의사 형태소 단위를 생성하기 위해 규칙을 이용한 태깅 과정을 거친다. 이를 통해 나온 결과를 발음열 생성기 입력으로 하며, 결과는 학습용 발음열 또는 발음사전 구성을 위한 형태로 출력한다. 표제어간 음운변화 현상이 반영된 상태의 표제어 단위이므로 실제 음운변화가 반영되지 않은 상태의 표제어와는 그 형태가 상이하다. 이는 연속 발음시 생기는 현상으로 실제 인식에는 이 음운변화 현상이 반영된 사전이 필요하게 된다. 생성된 발음사전의 효용성을 확인하기 위해 다음과 같은 실험을 통해 성능을 평가하였다. 음향학습을 위하여 PBS(Phonetically Balanced Sentence) 낭독체 17200문장을 녹음하고 그 전사파일을 사용하여 학습을 수행하였고, 발음사전의 평가를 위하여 이 중 각각 3100문장을 사용하여 다음과 같은 실험을 수행하였다. 형태소 태그정보를 이용하여 표제어간 음운변화 현상을 반영한 최적의 발음사전과 다중 발음사전, 언어학적 기준에 의한 수작업으로 생성한 표준 발음사전, 그리고 표제어간의 음운변화 현상을 고려하지 않고 독립된 단어로 생성한 발음사전과의 비교 실험을 수행하였다. 실험결과 표제어간 음운변화 현상을 반영하지 않은 경우 단어 인식률이 43.21%인 반면 표제어간 음운변화 현상을 반영한 1-Best 사전의 경우 48.99%, Multi 사전의 경우 50.19%로 인식률이 5~6%정도 향상되었음을 볼 수 있었고, 수작업에 의한 표준발음사전의 단어 인식률 45.90% 보다도 약 3~4% 좋은 성능을 보였다.

  • PDF