• 제목/요약/키워드: pronunciation generation

검색결과 24건 처리시간 0.021초

음성인식 후처리를 위한 음가-표기 변환표 생성에 관한 연구 (A Study on Phonetic Value - Transcription Look-Up Table Generation for Postprocessing of Voice Recognition)

  • 김경징;최영규;이상범
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권5호
    • /
    • pp.585-594
    • /
    • 2002
  • 본 논문에서는 음성인식의 후처리를 위한 음가-표기 변환표의 생성과 구현에 관한 연구를 수행하였다. 음절 단위 음가를 인식하는 음성인식 시스템을 위한 후처리를 위하여 인식된 음가로 발음되는 표기 집합을 생성하는 표기 집합 생성기를 설계 구현하였다. 표준 발음법을 페트리넷으로 모델링하여 생성된 표기-음가 변환표를 기반으로 음가표기 변환표를 생성하였다. 음가-표기 변환표가 올바른 표기 집합을 생성함을 보이기 위하여 표기 집합 생성기를 설계 구현하고, 표준 발음법 예제와 발음법 사전에서 무작위로 추출된 단어에 대하여 실험한 결과 발성 이전의 표기가 포함된 올바른 표기 집합이 생성됨을 입증하였다.

  • PDF

세대 간 어두 유음의 발음 양상 비교 (Comparison of the pronunciation of word-initial liquids between generations in Korean)

  • 윤은미;심혜란;박시균;김현기;강진석
    • 말소리와 음성과학
    • /
    • 제9권3호
    • /
    • pp.7-15
    • /
    • 2017
  • The purpose of this study was to investigate the different aspects of word-initial liquid sounds in Korean according to generations. Five women in their 50s and seven in their 20s participated in the experiment. We examined FL (formant of liquids) and voice sustained time by using Praat software. Three English native speakers were asked to judge the Korean speakers' recorded speech samples for marking [l] or [r] using evaluation sheet. The results of the two experiments revealed three important aspects. First, there was a statistically significant difference between the two groups in the FL of the words 'racket' and 'ruby.' Second, we found statistically significant differences in 'rhythm', 'ruby' and 'litter' from the measurement of the duration of the acoustic data. Third, there was no difference in pronunciation between the two groups according to the phonemes of the original language. The results of this study showed that it is difficult to say that the duration of word-initial liquids and the phoneme difference of the original language are indicators to distinguish the word-initial liquids between generations. Also, it was seen that the pronunciation of Korean word-initial liquid sounds varied across generations.

자동 추출된 지식에 기반한 한국어 학습 지원 시스템 (Korean Learning Assistant System with Automatically Extracted Knowledge)

  • 박기태;이태훈;황소현;김병만;이현아;신윤식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권2호
    • /
    • pp.91-102
    • /
    • 2012
  • 정보통신기술을 활용한 학습시스템은 꾸준히 강조되어 왔지만 한국어 학습시스템의 자동화 수준은 높지 않다. 실용성 있는 학습시스템의 구축에는 대량의 기반지식이 필요하지만 이러한 지식을 구축하기 쉽지 않기 때문이다. 본 논문에서는 한국어학습시스템의 요소로 어학문제풀이, 표준발음 도우미, 글쓰기 도우미를 제안하고, 획득이 용이한 말뭉치와 웹문서, 사전을 활용하여 구축된 학습지원시스템을 소개한다. 어학문제풀이를 위한 자동문제생성에서는 말뭉치와 사전을 이용하여 문제와 보기문항을 생성하고, 웹문서 검색빈도를 활용하여 보기적합성을 검증한다. 표준발음 변환을 위해서 발음표기법을 분석하였으며, 글쓰기 지원을 위해 말뭉치에서 추출한 기분석데이터를 이용한 실시간 어휘추천과 문장추천을 구현하였다. 실험에서는 제안하는 방법으로 생성된 임의의 400문제에 대한 판정 결과 89.9%의 문제 적합률과 64.9%의 보기 적합률을 보였다.

음절 복원 후보 집합의 생성과 후보 감소에 관한 연구 (A Study on a Generation of a Syllable Restoration Candidate Set and a Candidate Decrease)

  • 김규식;김경징;이상범
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권12호
    • /
    • pp.1679-1690
    • /
    • 2002
  • 본 논문에서는 음성 인식의 후처리를 위한 음절 복원 규칙의 생성과 복원 후보의 감소에 관한 연구를 수행하였다. 대화체 연속 음성 인식의 성능 향상을 위하여 음절 단위를 인식하는 음성인식 시스템의 후처리를 통하여 인식된 로 발음되는 복원 후보를 생성하는 음절 복원 규칙을 생성하였다. 또한 복원 집합의 후보수를 줄이기 위한 방안으로 복원 규칙에서 실생활에서 사용되지 않는 표기를 생성하는 규칙을 제거하는 방안을 제시하였다. 음절 복원 규칙이 올바른 복원 후보 집합을 생성함을 보이기 위하여 복원 후보 집합 생성기를 설계 구현하고, 표준 발음법 예제와 발음법 사전에서 무작위로 추출된 단어에 대하여 실험한 결과 발성 이전의 표기가 포함된 올바른 표기 집합이 생성됨을 입증하였다.

  • PDF

한국어 음가의 표기 복원을 위한 표기 후보 생성 및 감소에 관한 연구 (A Study On Generation and Reduction of the Notation Candidate for the Notation Restoration of Korean Phonetic Value)

  • 이상범;박성현
    • 정보처리학회논문지B
    • /
    • 제11B권1호
    • /
    • pp.99-106
    • /
    • 2004
  • 음절 복원은 음성 인식 장치에서 인식된 음가열을 발성 이전의 표기 형태로 복원하는 과정이다. 본 논문에서는 음절 복원 과정을 위하여 표준 발음법을 기반으로 음절 복원 규칙을 작성하였다. 음절 복원 규칙을 이용하여 표기 후보 집합의 생성 방법을 연구하였다. 또한 생성된 표기후보의 수를 감소시키기 위하여, 비 표기 음절을 포함한 표기 후보 감소, 비 어휘 음절을 포함한 표기 후보 감소, 비어간 음절을 포함한 표기 후보 감소의 3단계 감소 과정을 제안하였다. 제안된 방법을 통하여 실험한 결과 평균 74%의 표기 후보 감소율을 나타내었다.

페트리넷을 이용한 한글-로마자 표기 변환표 생성에 관한 연구 (A Study on Creation of Hangeu-Romanization Conversion Table Using Petri-Nets)

  • 김경징;최영규;이상범
    • 정보처리학회논문지B
    • /
    • 제9B권6호
    • /
    • pp.827-834
    • /
    • 2002
  • 본 논문에서는 개정된 로마자 표기법에 일치하는 한글의 로마자 표기 생성을 위한 한글-로마자 표기 변환표의 생성에 관한 연구를 수행하였다. 로마자 표기법의 근간이 되는 표준 발음법과 로마자 표기법을 수학적으로 분석하기 위하여 페트리넷 모델을 이용한 자연 언어의 수학적 분석 방법을 도입하였다. 페트리넷 모델을 이용한 분석의 방법으로 한글 로마자 표기 변환 표를 생성하기 위한 방안과 로마자 표기법의 페트리 넷 모델링을 통하여 그 실질적인 예를 보여 한국어의 수학적 모델링 방안과 적용방법을 제시한다. 생성된 한글-로마자 표기 변환표를 검증하기 위하여 윈도우 기반 응용 프로그램을 개발하고 로마자 표기 용례사전의 로마자 표기와 응용 프로그램의 결과를 비교하였다.

광학 문자 인식을 통한 단어 정리 방법 (Vocabulary Generation Method by Optical Character Recognition)

  • 김남규;김동언;김성우;권순각
    • 한국멀티미디어학회논문지
    • /
    • 제18권8호
    • /
    • pp.943-949
    • /
    • 2015
  • A reader usually spends a lot of time browsing and searching word meaning in a dictionary, internet or smart applications in order to find the unknown words. In this paper, we propose a method to compensate this drawback. The proposed method introduces a vocabulary upon recognizing a word or group of words that was captured by a smart phone camera. Through this proposed method, organizing and editing words that were captured by smart phone, searching the dictionary data using bisection method, listening pronunciation with the use of speech synthesizer, building and editing of vocabulary stored in database are given as the features. A smart phone application for organizing English words was established. The proposed method significantly reduces the organizing time for unknown English words and increases the English learning efficiency.

학습을 통한 발음 변이 규칙 유도 및 적응을 이용한 영역 의존 발음 사전 자동 생성 (Automatic Generation of Domain-Dependent Pronunciation Lexicon with Data-Driven Rules and Rule Adaptation)

  • 전재훈;정민화
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2005년도 춘계학술대회
    • /
    • pp.233-238
    • /
    • 2005
  • 본 논문에서는 학습을 이용한 발음 변이 모델링을 통해 특정 영역에 최적화된 발음 사전 자동 생성의 방법을 제시하였다. 학습 방법을 이용한 발음 변이 모델링의 오류를 최소화 하기 위하여 본 논문에서는 발음 변이 규칙의 적응 기법을 도입하였다. 발음 변이 규칙의 적응은 대용량 음성 말뭉치에서 발음 변이 규칙을 유도한 후, 상대적으로 작은 용량의 음성 말뭉치에서 유도한 규칙과의 결합을 통해 이루어 진다. 본 논문에서 사용된 발음 사전은 해당 형태소의 앞 뒤 음소 문맥의 음운 현상을 반영한 발음 사전이며, 학습 방법으로 얻어진 발음 변이 규칙을 대용량 문자 말뭉치에 적용하여 해당 형태소의 발음을 자동 생성하였다. 발음 사전의 평균 발음의 수는 적용된 발음 변이 규칙의 확률 값들의 한계 값 조정에 의해 이루어졌다. 기존의 지식 기반의 발음 사전과 비교 할 때, 본 방법론으로 작성된 발음 사전을 이용한 대화체 음성 인식 실험에서 0.8%의 단어 오류율(WER)이 감소하였다. 또한 사전에 포함된 형태소의 평균 발음 변이 수에서도 기존의 방법론에서 보다 5.6% 적은 수에서 최상의 성능을 보였다.

  • PDF

청각장애자용 발음훈련기기 개발에 관한 연구 (A study on speech training aids for Deafs)

  • 안상필;이재혁;윤태성;박상희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1990년도 하계학술대회 논문집
    • /
    • pp.47-50
    • /
    • 1990
  • Deafs cannot speak straight voice as normal people in lack of feedback of their pronunciation, therefore speech training is required. In this study, fundamental frequency, intensity, formant frequencies, vocal tract graphic and vocal tract area function, extracted from speech signal, are used as feature parameter. AR model, whose coefficients are extracted using inverse filtering. is used as speech generation model. In connect ion between vocal tract graphic and speech parameter, articulation distances and articulation distance functions in selected 15-intervals are determined by extracted vocal tract areas and formant frequencies.

  • PDF

코퍼스 확률에 기반한 한국어 표준발음 생성 (The Corpus-probability Based Generation of Korean Standard Pronunciation)

  • 김동성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.210-215
    • /
    • 2007
  • 본 연구에서는 코퍼스 확률에 기반하여 한국어 표준 발음 생성에 대한 연구를 한다. 기존의 이은영 외 (2005)에서 연구된 규칙기반의 한국어 IPA 발음 변환방식과는 달리 본 연구에서는 음운변환 코퍼스를 바탕으로 표준발음을 변환한다. 이 방식을 위해서 Brill(1995)에서 제안한 변형기반 학습방식이 활용되었으며, 단계적인 처리방식이 아닌 입-출력 대응 방식의 확률적 처리 방식이 제안되었다. 음운변환 방식은 음운규칙에 근거한 처리가 아닌 언어자원인 코퍼스를 활용해서 처리하였다는 점에서 기존의 연구방식과 차이가 있다. 또한, 기존 연구에서는 음운규칙을 단계적으로 적용하여서 입력형이 출력형으로 도출되기 위해서 여러 단계를 거쳤지만, 본 연구에서는 입력형과 출력형의 일대일 대응이라는 점에서 차이점을 보인다.

  • PDF