• Title/Summary/Keyword: Pronunciation Dictionary

Search Result 45, Processing Time 0.026 seconds

영어발음교육과 발음기호 (Phonetic Alphabet as a Pronunciation Guide)

  • 강용순
    • 영어영문학
    • /
    • 제56권1호
    • /
    • pp.65-78
    • /
    • 2010
  • The purpose of this paper is to suggest that the International Phonetic Alphabet be included in English curriculum and taught in English classroom. Current English curriculum for elementary and middle school students doesn't specify anything for the education of the IPA. The knowledge of IPA is essential for the students to study by themselves how to pronounce English words. The IPA, however, is either too little or too much to be taught at school. It is too little in that it doesn't tell us anything about allophones, the knowledge of which could enable us to get rid of foreign accents as much as possible. It is too much in that it can represent more than one sounds (e.g., /ɔ/ in American and British English). To overcome these drawbacks, it should be introduced gradually with the allophones in the same environments. The correct vowel sounds should be introduced with the aid of pronunciation dictionary so that the students could get their own vowel quality. Moreover, the IPA symbol should be adopted for the English textbooks.

발음열 자동 변환을 이용한 한국어 음운 변화 규칙의 통계적 분석 (Statistical Analysis of Korean Phonological Rules Using a Automatic Phonetic Transcription)

  • 이경님;정민화
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2002년도 11월 학술대회지
    • /
    • pp.81-85
    • /
    • 2002
  • We present a statistical analysis of Korean phonological variations using automatic generation of phonetic transcription. We have constructed the automatic generation system of Korean pronunciation variants by applying rules modeling obligatory and optional phonemic changes and allophonic changes. These rules are derived from knowledge-based morphophonological analysis and government standard pronunciation rules. This system is optimized for continuous speech recognition by generating phonetic transcriptions for training and constructing a pronunciation dictionary for recognition. In this paper, we describe Korean phonological variations by analyzing the statistics of phonemic change rule applications for the 60,000 sentences in the Samsung PBS(Phonetic Balanced Sentence) Speech DB. Our results show that the most frequently happening obligatory phonemic variations are in the order of liaison, tensification, aspirationalization, and nasalization of obstruent, and that the most frequently happening optional phonemic variations are in the order of initial consonant h-deletion, insertion of final consonant with the same place of articulation as the next consonants, and deletion of final consonant with the same place of articulation as the next consonants. These statistics can be used for improving the performance of speech recognition systems.

  • PDF

음성인식 후처리를 위한 음가-표기 변환표 생성에 관한 연구 (A Study on Phonetic Value - Transcription Look-Up Table Generation for Postprocessing of Voice Recognition)

  • 김경징;최영규;이상범
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권5호
    • /
    • pp.585-594
    • /
    • 2002
  • 본 논문에서는 음성인식의 후처리를 위한 음가-표기 변환표의 생성과 구현에 관한 연구를 수행하였다. 음절 단위 음가를 인식하는 음성인식 시스템을 위한 후처리를 위하여 인식된 음가로 발음되는 표기 집합을 생성하는 표기 집합 생성기를 설계 구현하였다. 표준 발음법을 페트리넷으로 모델링하여 생성된 표기-음가 변환표를 기반으로 음가표기 변환표를 생성하였다. 음가-표기 변환표가 올바른 표기 집합을 생성함을 보이기 위하여 표기 집합 생성기를 설계 구현하고, 표준 발음법 예제와 발음법 사전에서 무작위로 추출된 단어에 대하여 실험한 결과 발성 이전의 표기가 포함된 올바른 표기 집합이 생성됨을 입증하였다.

  • PDF

광학 문자 인식을 통한 단어 정리 방법 (Vocabulary Generation Method by Optical Character Recognition)

  • 김남규;김동언;김성우;권순각
    • 한국멀티미디어학회논문지
    • /
    • 제18권8호
    • /
    • pp.943-949
    • /
    • 2015
  • A reader usually spends a lot of time browsing and searching word meaning in a dictionary, internet or smart applications in order to find the unknown words. In this paper, we propose a method to compensate this drawback. The proposed method introduces a vocabulary upon recognizing a word or group of words that was captured by a smart phone camera. Through this proposed method, organizing and editing words that were captured by smart phone, searching the dictionary data using bisection method, listening pronunciation with the use of speech synthesizer, building and editing of vocabulary stored in database are given as the features. A smart phone application for organizing English words was established. The proposed method significantly reduces the organizing time for unknown English words and increases the English learning efficiency.

발음열 자동 생성기를 이용한 한국어 음운 변화 현상의 통계적 분석 (Statistical Analysis of Korean Phonological Variations Using a Grapheme-to-phoneme System)

  • 이경님;정민화
    • 한국음향학회지
    • /
    • 제21권7호
    • /
    • pp.656-664
    • /
    • 2002
  • 본 논문에서는 한국어 발음열 자동 생성기를 이용하여 한국어의 음운 규칙에 대한 통계적 분석을 수행하였다. 실험에 사용한 발음열 자동 생성기는 한국어 음운 변화 현상에 대해 형태음운론에 기반 한 언어학적 분석과 문교부 표준어 규정의 표준 발음법에서 유도된 필수 및 수의적 음소 변동 규칙과 변이음 규칙의 단계적 적용 모델을 사용해서 구현되었으며, 특히 연속음성 인식을 위한 학습용 발음열과 인식용 발음사전 생성의 최적화를 목표로 하였다. 본 논문에서는 대어휘 연속음성 인식기의 음향 모델을 구축하기 위해 만들어진 삼성 PBS(Phonetically Balanced Sentence) 음성 데이터 베이스의 60,000문장에 적용된 발음열 생성기의 음소 변동규칙들의 분포 및 그 통계를 사용해서 한국어 음운 변화 양상을 분석하였다. 적용된 빈도수를 기준으로 분석한 결과, 필수음소 변동규칙의 경우는 연음법칙, 경음화, 격음화, 장애음의 비음화순으로, 수의적 음소 변동규칙의 경우는 초성 ㅎ 탈락, 중복 자음화, 동일 조음위치 자음탈락 순으로 음운 변화가 발생하였다. 이러한 적용 규칙들의 통계적 자료를 기반으로 한국어 음운 변화 양상을 파악할 수 있었으며, 나아가 본 논문의 연구 결과는 음성 인식 시스템을 개발하는데 유용하게 사용할 수 있을 것이다.

오액(五液) 중(中) '체(涕)'의 의미에 대한 고찰 (Study on the Meaning of Nasal discharge(涕) in Five fluids)

  • 장희원;송지청;엄동명
    • 대한한의학원전학회지
    • /
    • 제29권3호
    • /
    • pp.75-80
    • /
    • 2016
  • Objectives : The paper raises an objection to the word '涕' being used to refer to nasal discharge, and proposes a word for nasal discharge upon studying a set of medical books. Methods : The author finds and confirms the dictionary definition of '涕' and studies how they are used differently in medical books. Through this study, the author shows how the word '涕' is used incorrectly and makes deductions for its reason. The author takes a look at the old form of the word '涕', its etymological origin, takes a guess as to the real word that should have been used to refer to nasal discharge, and find examples of instances where this correct word for nasal discharge are more appropriate. Results & Conclusions : In medical books such as Huangdineijing Suwen, '涕' is used to mean nasal discharge, but the word's dictionary definition does not validate such usage. Yugunryeombu (劉君廉夫), in its commentary for Somun, used '?' and '鼻夷' for '涕', and '?' means nasal discharge and used as same as '涕' when its used to mean tear. This is a phenomenon that originated from '弟' and '夷' being used interchangeably which led to the incorrect usage of '?'. If someone were to refer to nasal discharge, he needs to use '?'. '鼻夷' is believed to be the same word as '弟鼻', which is the old form of '?', and it means both tear(pronounced 'Che') and nasal discharge(pronounced 'Je'). However, the pronunciation different between 'Che' and 'Je', and its definition as tear, is divided in later periods into '涕' following the shape of '弟'. Following the shape of '夷', the meaning of nasal discharge remains in '?' while retaining the pronunciation of 'yi'. Therefore, the word '涕' used to mean nasal discharge is an incorrect form of '?', and should all be re-written to '?'.

음소변동규칙의 적합도 조정을 통한 연속음성인식 성능향상 (Improving the Performance of the Continuous Speech Recognition by Estimating Likelihoods of the Phonetic Rules)

  • 나민수;정민화
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2006년도 추계학술대회 발표논문집
    • /
    • pp.80-83
    • /
    • 2006
  • The purpose of this paper is to build a pronunciation lexicon with estimated likelihoods of the phonetic rules based on the phonetic realizations and therefore to improve the performance of CSR using the dictionary. In the baseline system, the phonetic rules and their application probabilities are defined with the knowledge of Korean phonology and experimental tuning. The advantage of this approach is to implement the phonetic rules easily and to get stable results on general domains. However, a possible drawback of this method is that it is hard to reflect characteristics of the phonetic realizations on a specific domain. In order to make the system reflect phonetic realizations, the likelihood of phonetic rules is reestimated based on the statistics of the realized phonemes using a forced-alignment method. In our experiment, we generates new lexica which include pronunciation variants created by reestimated phonetic rules and its performance is tested with 12 Gaussian mixture HMMs and back-off bigrams. The proposed method reduced the WER by 0.42%.

  • PDF

Reduction and Frequency Analyses of Vowels and Consonants in the Buckeye Speech Corpus

  • Yang, Byung-Gon
    • 말소리와 음성과학
    • /
    • 제4권3호
    • /
    • pp.75-83
    • /
    • 2012
  • The aims of this study were three. First, to examine the degree of deviation from dictionary prescribed symbols and actual speech made by American English speakers. Second, to measure the frequency of vowel and consonant production of American English speakers. And third, to investigate gender differences in the segmental sounds in a speech corpus. The Buckeye Speech Corpus was recorded by forty American male and female subjects for one hour per subject. The vowels and consonants in both the phonemic and phonetic transcriptions were extracted from the original files of the corpus and their frequencies were obtained using codes of a free software R. Results were as follows: Firstly, the American English speakers produced a reduced number of vowels and consonants in daily conversation. The reduction rate from the dictionary transcriptions to the actual transcriptions was around 38.2%. Secondly, the American English speakers used more front high and back low vowels while three-fourths of the consonants accounted for stops, fricatives, and nasals. This indicates that the segmental inventory has nonlinear frequency distribution in the speech corpus. Thirdly, the two gender groups produced vowels and consonants similarly even though there were a few noticeable differences in their speech. From these results we propose that English teachers consider pronunciation education reflecting the actual speech sounds and that linguists find a way to establish unmarked segmentals from speech corpora.

기능성게임을 활용한 게이미피케이션 영어 발음 학습이 초등학생의 정의적 영역에 미치는 영향 (Psychological Effects of Gamification on Young Learners: Focusing on a Serious Game for English Phoneme Discrimination)

  • 이선영;박주현;최정혜
    • 한국게임학회 논문지
    • /
    • 제19권2호
    • /
    • pp.111-122
    • /
    • 2019
  • 본 연구에서는 초등학교 영어 수업에서의 태블릿 PC 기반 기능성게임을 활용한 음소 구별학습이 학습자의 정의적 영역에 미치는 영향을 사전앱 사용 학습과 비교하여 알아보았다. 초등 6학년을 대상으로 기능성게임 학습반과 사전앱 학습반으로 나누어 수업을 한 후 설문 조사와 면대면 인터뷰를 실시하였다. 그 결과, 설문 조사에서는 두 반 모두 학습 흥미와 동기, 자신감, 집중력이 강화된 것으로 나타났다. 반면에 면대면 인터뷰 결과에서는 게임 학습반이 사전앱 학습반보다 위의 모든 정의적 영역에서 더 긍정적으로 나타났다. 본 연구 결과는 외국어 학습 영역에서 태블릿 PC 기반의 기능성게임을 활용하는 것이 학습자의 정의적 영역인 학습 흥미 유발, 동기, 자신감 및 집중력 강화에 효과적이라는 것을 보여 준다.

국어대사전의 표제어에 나타나는 한자 정보 (Hanja Information in the Entries of Korean Unabridged Dictionary)

  • 김철수
    • 한국콘텐츠학회논문지
    • /
    • 제10권4호
    • /
    • pp.438-446
    • /
    • 2010
  • 한글과 한자가 혼합되어 나타나는 분야의 언어정보처리를 수행하기 위해서는 한글 및 한자 정보를 동시에 지원할 수 있는 전자 사전이 요구된다. 본 논문에서는 국어대사전의 표제어에 나타나는 한자 통계 정보에 대하여 고찰하였다. 대상 정보는 KSC-5601 코드에 기초하여 엔트리에 한자가 포함된 엔트리 수, 엔트리에 나타나는 한자의 음과 훈의 출현빈도 수, 품사별 한자 출현빈도수, 엔트리당 평균 출현 한자 수 등이다. 440,594개의 표제어 중 303,951개에서 한 글자 이상의 한자가 나타나 68.99%의 표제어에서 한자가 출현 하였다. 440,594개의 표제어에서 858,595글자의 한자를 포함하고 있어 표제어 당 평균 1.95개의 한자가 출현하였다. 표제어의 평균 음절길이 3.56이고 1.95개의 한자가 출현하므로 표제어를 구성하는 글자 중 54.78%가 한자임을 알 수 있다. 4,888개의 한자 코드 중 한번 이상 출현한 한자는 4,660개이며, 228개의 한자는 한 번도 출현하지 않았다. 4,000번 이상 출현하는 한자는 5개였다. 엔트리에 출현하는 858,595개의 한자에 대응하는 한글 음은 471개였다.