• Title/Summary/Keyword: 발음 정확도

Search Result 106, Processing Time 0.03 seconds

Automatic Foreign Word Transliteration Model for Information Retrieval (정보검색을 위한 외래어 자동표기 모델)

  • 이재성;최기선
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1997.08a
    • /
    • pp.17-24
    • /
    • 1997
  • 조사에 따르면 한글 문서에서 사용되는 단어 중 외래어 또는 영어가 포함된 단어가 약 26%정도를 차지하고 있으며, 이는 정보검색의 중요 색인어로 사용된다(권윤형 1996). 그러나 이들 단어들은 서로 같은 단어인데도 영어로 표기되기도 하고 이형의 외래어들로 표기되기도 하여, 정보검색의 효율을 떨어뜨리고 있다. 본 논문에서는 영어 단어와 그에 대응되어 표기되는 외래어들을 찾기 위한 한 단계로서, 영어를 한글로 음차(transliteration)하여 자동표기하는 통계적 모델을 제안하고 실험한다. 제안된 모델은 통계적 기계번역 방식과 그의 한 방법인 문서 정렬(text alignment) 방식에 근거하고 있다. 특히 이 모델에서는 효과적으로 발음의 단위를 분리한 다음 정렬을 하여. 전체적인 계산량을 줄이고 성능도 향상시켰다. 음차표기는 피봇방식과 직접방식의 두가지로 구현하였다. 피봇방식은 영어에서 발음을 생성한 후, 그 발음을 다시 한글로 표기하는 방식이고, 직접방식은 직접 영어 단어에서 한글 표기로 포기하는 방식이다. 두 방식을 제안된 모델을 이용하여 비교 테스트한 결과 직접방식이 보다 정확하게 표준 외래어로 표기하였다.

  • PDF

Real-time Unknown Word Identification Using Support Vector Machine For Chinese Text-to-Speech (중국어 음성합성을 위한 지진 벡터 기반 실시간 미등록어 처리)

  • Ha, Ju-Hong;Zheng, Yu;Lee, Gary G.
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.267-272
    • /
    • 2003
  • 음성 합성 시스템 구축에 있어서 입력 텍스트를 정확한 발음 표기로 변환하는 것은 매우 중요하다. 중국어에는 하나의 한자가 의미나 사용에 따라 다르게 발음되는 다음자(polyphony)들이 존재한다. 다음자의 처리는 상당히 복잡한 문제이기 때문에 본 논문에서는 그 중 가장 발음에 영향을 미치는 요소인 인명과 지명에 대한 미등록어 처리를 수행했다. 무엇보다 실시간 음성 합성 시스템을 위해서는 처리 속도의 향상이 요구된다. 따라서 본 연구에서는 미등록어 후보 구간 선정을 선행하고, 선정된 후보에 대해 추정하는 두 단계로 진행하였다. 후보 구간 선정은 단일 한자 단어(monosyllable word)의 확률과 간단한 패턴들을 이용한다. 최종 선정된 후보의 미등록어 추정은 SVM(Support Vector Machine)을 기반으로 실시하였다.

  • PDF

Formation of A Phonetic-Value Look-up Table for Korean Voice Synthesis (한국어 음성 합성을 위한 음가 변환 테이블 생성)

  • Lee, Gye-Young;Yim, Jae-Geol
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.38 no.5
    • /
    • pp.44-57
    • /
    • 2001
  • In order to synthesize grammatically correct Korean voices, we have to refer to the 'Standard Pronunciation Rules(SPR)' stated in the 'Standard Grammar of Korean Language.' Therefore, the rules that is used for a Korean-voice-synthesis system to find Korean voices corresponding to a given Korean sentence must completely reflect the SPR and must be sound. However, in the field of computer science they have just used the SPR without proving the completeness and soundness of their rules. In this paper, we construct a Petri net model for each rule of SPR, integrate all the Petri net models to build one big Petri net completely representing SPR, and analyse the Petri net to prove the consistency of it. Then, we transfer the Petri net model into a look-up table for Korean voice. Using this table, we can avoid the drawbacks of existing approaches such as going through several stages or repetitively applying a converting process.

  • PDF

Identification of English labial consonants by Korean EFL learners (한국 EFL 학습자들의 영어 순자음의 인지)

  • Cho, Mi-Hui
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2006.11a
    • /
    • pp.788-791
    • /
    • 2006
  • The perception of English labial consonants was investigated via experiment where 40 Korean EFL learners identified nonwords with the target labial consonants [p, b, f, v] in 4 different prosodic locations. The results showed that there was a strong positional effect since the accuracy rates of the four target consonants differed by position. Specifically, the average accuracy rate for the target consonants was higher in the stressed intervocalic position and initial onset position than in the unstressed intervocalic position and final coda position. Further, the accuracy rate for [f] is was high in all prosodic locations except the unstressed intervocalic position. This is unexpected in markedness theory given that fricatives are assumed to be more difficult to learn than stops.

  • PDF

Speaker-Independent Isolated Word Recognition Using A Modified ISODATA Method (Modified ISODATA 집단화방법을 이용한 불특정화자 단독어 인식)

  • 황우근
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1987.11a
    • /
    • pp.66-69
    • /
    • 1987
  • 본 논문은 불특정화자의 한국어 단독음인식에 관한 연구로써 새로운 집단화 방법인 Modified-ISODATA 집단화방법을 제안한다.본 알고리즘의 목적은 종래의 ISODATA 알고리즘에서 외부 고립점 처리 및 분리과정을 단순화 하고, Lumping 과정을 제거하여 정확하고도 자동화된 집단의 중심점을 찾는 것이다. 본 알고리즘을 적용한 결과, 10명의 남성 화자와 4명의 여성 화자가 발음한 11개의 ltnt자음에 대하여, 최근에 발표된 Modified K-means 방법보다 좋은 인식율을 나타내어, 보다 정확한 집단의 중심점을 찾아 내었음을 입증해보였다.

  • PDF

A Study on production and perception of English liquids by Korean native speakers (한국어 모국어 화자의 영어유음 발성과 인지 연구)

  • Choi Jae-Ho
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.313-316
    • /
    • 2000
  • 원어민이 발성한 영어유음 시료를 사용하여 한국인 영문과와 타학과(비 영문과) 학생들을 대상으로 인지실험을 하였고, 시료의 정확성을 확인하기 위하여 원어민을 또 하나의 피험자 그룹으로 선택하였다. 영문과 피험자의 영어유음 인지결과를 살펴보면 어두$(70\%)$ < 어말$(75\%)$ < 어중$(80\%)$ glt; 연속음$(86\%)$의 순서로 인지율이 높아졌다. 타학과 피험자의 영어유음 인지에서는 어두$(59\%)$< 어말$(66\%)$ glt; 어중$(70\%)$ < 연속음$(72\%)$의 순서로 인지율의 증가를 보였다. 원어민의 영어유음 인지에서는 녹음에 참가하지 않은 다른 원어민을 대상으로 해서 총 평균 $99.6\%$로 거의 완벽한 인지율을 보였다. 그 만금 녹음된 시료가 정확하다는 것을 확인시켜 주었다. 피험자별 그룹에 대한 결과 비교에서는 원어민이 녹음한 발음으로 인지실험을 할 때 타학과$(66.8\%)$ < 영문과$(77.4\%)$< 원어민$(99.6\%)$의 순서로 점차 좋은 인지율을 보였다. 한국인이 발성한 영어유음에 대한 원어민의 인지실험에서는 한국인 영어유음 발음의 정확성을 알아보고자 하는 것이 목적이다. 한국인 발성시료에 대한 원어민의 총인지율은 $68\%$로 원어민의 발성시료에 대한 인지율 $99.6\%$와 비교해볼 때 영문과 녹음자들의 발음 정확도가 높지 못하다는 것을 보여 주었다. 평균/1/ $(79\%)$과 평균/r/$(58\%)$의 인지율을 보게 되면 한국인의 영어유음 발성에 있어서 /r/의 발성이 /1/의 경우보다 문제가 더 심각하다는 것을 알 수 있다. 특히 실험결과는 어두/1/$(87\%)$과 어두/r/$(43\%)$에서 뚜렷한 인지율의 차이를 보여주고 있다.

  • PDF

REMOVABLE FLEXIBLE DENTURE FOR CHILD WITH LOSS OF MULTIPLE TEETH : A CASE REPORT (소아에서 다수치아 상실 시 탄성의치 사용의 치험례)

  • Chung, Yang-Seok;Lee, Nan-Young;Lee, Sang-Ho
    • Journal of the korean academy of Pediatric Dentistry
    • /
    • v.34 no.3
    • /
    • pp.513-518
    • /
    • 2007
  • Loss of multiple teeth by multiple dental caries, traumatic influence or hereditable disease can cause many problem in children. Using removable appliance can be used for treatment of this problem. But conventional removable appliance has limits of retention by wire-clasp, non esthetic appearance, difficulty in pronunciation by its volume. Flexible denture using $Valplast^{(R)}$ system could be a excellent partial denture for restorarion in child because of various advantage such as retention from soft tissue, natural esthetic aspect, biocompatibility, durability to compare with conventional acrylic appliance. The present case report describe properties and consideration of flexible denture using Valplast $system^{(R)}$ in comparison with conventional acrylic appliance and report successful restoration of child using Valplast $system^{(R)}$.

  • PDF

The Investigation of Pronounciation of Primary School Students (국민학교 아동의 발음조사)

  • 소진명;박성준;김인술;김정희
    • Proceedings of the KOR-BRONCHOESO Conference
    • /
    • 1972.03a
    • /
    • pp.2.1-2
    • /
    • 1972
  • The development of our social life and standard of living should stimulate our concern not only of primary treatment of disease, but also of rehabilitation and social welfare. We ordinarily understand that rehabilitation is limited to the rehabilitation of bodies, and yet development of a speech rehabilitation program is also neccessary at the same time. One of the pollutions, the "speech pollution" should be given attention, as so many children are pronouncing words incorrectly due to the fact that they are influenced by mass communication and the wrong pronounciation of the adult. We have studies the pronounciation of 921 boys and girls of five primary schools in Chonju City, and this paper is dealing with the method of study, its result, and its casuses. It is hoped that this paper will stimulate further study of speech pathology in Korea and will help eliminate "speech pollution" of the children.

  • PDF

Grapheme-to-Phoneme Conversion of Arabic Numeral Expressions for Embedded TTS Systems (임베디드 TTS 시스템을 위한 아라비안 숫자의 문자 변환)

  • Jung, Young-Im;Yoon, Ae-Sun;Kwon, Hyuk-Chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.442-444
    • /
    • 2005
  • 본 논문에서는 아라비안 숫자의 중의성을 효과적으로 제거하고 숫자 표현의 발음을 정확하게 문자화할 수 있는 임베디드 시스템용 경량화된 아라비안 숫자 읽기 시스템을 제안한다. 이를 위해 7 가지의 숫자 읽기 방식(Headings of Arabic Numerals RAN)을 분류하였고, 문자화 규칙을 설정하기 위해. (1) 문맥 자질, (2) 패턴 자질, (3) 휴리스틱 정보를 숫자 표현의 의미에 따라 분석하였다. 그리고 숫자의 문자화 시스템을 최적화하여 임베디드 시스템에 탑재하기 위해 (1) 형태소 분석 모듈의 분리, (2) 사전 압축, (3) 인명과 지명의 제거를 하였고, 이를 홍해 심각한 정확도 손실 없이 메모리 사용량과 처리 시간을 크게 줄일 수 있었다. 경량화된 mini-TAN 은 $96.9\~98.3\%$의 정확도를 보이며, 기존 상용 TTS 시스템에 비해서도 숫자 읽기의 처리에 있어 높은 정확도를 보인다.

  • PDF

Problems of Discrepancy between English Vowels and Spelling (영어 모음과 철자간 대응성 결여 문제)

  • Youe Hansa Mahn-Gunn
    • MALSORI
    • /
    • no.48
    • /
    • pp.69-80
    • /
    • 2003
  • 음성 영어교육에서 각 음소(모음.자음) 음가 인식이 중요한 것은 물론이지만, 실제로 영어를 듣고 말하는 데는 강세모음과 약음(주로 음)이 번갈아들며 엮어내는 영어 특유 말씨 박자에 대한 이해가 오히려 더 중요한 면이 있다. 그런데 영어 철자가 자음 정보는 비교적 잘 보여주지만, 모음 정보는 정확히 알려주지 못한다. 이를테면 (equation omitted)를 적는 철자가 각각 20가지 이상이며, 특히 쭉정모음(schwa) $\partial$를 적는 철자는 무려 90가지가 넘는다. 이 $\partial$는 강세 그늘에서 비록 짧고 약하게 발음되지만 영어에서 딴 어느 모음보다도 훨씬 높은 빈도를 보이기 때문에 [(equation omitted)] 음가와 그것이 있는 자리, 즉 철자 밑에 숨어 그 존재를 알기 어려운 $\partial$ 음의 소재를 철저히 파악하는 것은 영어를 잘 듣고 영어답게 말하는 데에 필수 요체라 할 수 있다. 이 글에서는 쭉정모음(schwa) [$\partial$]를 포함한 영어 주요 모음 철자 다양성을 고찰하여 우리나라 음성 영어 교육(TEFL/TESOL)에 귀중한 참고 자료를 제공하고, 이를 통한 올바른 영어 발음 학습 태도를 제언한다.

  • PDF