Search | Korea Science

A Study on the Korean Text-to-Speech Conversion Using the Formant Synthesizer(I) (포만트 합성방식에 의한 한국어 문자/음성 변환에 관한 연구 (I))

김민년
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1995.06a
- /
- pp.119-122
- /
- 1995
음소단위의 포만트 합성방식을 이용하여 한국어의 규칙합성에 대해 시험하였다. 포만트 합성방식으로는 Klatt가 제안한 직/병렬 합성기를 수정하여 사용하였으며, 운율 정보를 나타내는 피치값의 제어는 Fujisaki 모델을 이용하였다. 합성에 사용되는 각 파라미터들이 합성음의 음질 및 파형에 미치는 영향을 분석할 수 있도록 합성 파라미터와 음성파형 및 스펙트로그램을 화면에 나타내고 마우스를 이용하여 파라미터 값을 사용자가 적절히 변경한 후 합성할 수 있는 포만트 방식의 합성 Tool을 개발하였으며, 이를 이용하여 한국어 문자/음성변환 시스템을 지속적으로 연구하고자 한다.
PDF

Korean Phoneme Recognition using Modified Self Organizing Feature Map (수정된 자기 구조화 특징 지도를 이용한 한국어 음소 인식)

Choi, Doo-Il;Lee, Su-Jin;Park, Sang-Hui
- Proceedings of the KOSOMBE Conference
- /
- v.1991 no.11
- /
- pp.38-43
- /
- 1991
In order to cluster the Input pattern neatly, some neural network modified from Kohonen's self organizing feature map is introduced and Korean phoneme recognition experiments are performed using the modified self organizing feature map(MSOFM) and the auditory model.
PDF

A voice conversion based on probabilistic modeling (확률 모델링에 기초한 음성변환 시스템)

Lee, Eun;Kong, Eun-Bae
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.10b
- /
- pp.169-171
- /
- 2001
이 논문에서 논해지는 음성변환이라는 것은 어떤 화자의 음성(소스)을 다른 화자의 음성(타겟)으로 바꾸는 것이다. 이 때, 모든 음소들을 녹음해서 데이터베이스화한 음성끼리 매칭시키는 것이 아니라, 몇 번의 학습을 통하여 음색의 특징을 파악한 후 나온 변환함수를 이용하여 원래 화자의 음성을 타겟 음성으로 변환하는 시스템을 제안하고자 한다. 여기서, 음색의 특징들을 추출한 후, 변환함수를 만들기 위한 트레이닝을 위한 방법으로 Gaussian Mixture Modeling을 이용할 것이다.
PDF

A Study on the Phonemic Segmentation by Likelihood Ratio (Likelihood Ratio에 의한 음소분류에 관한 연구)

Lee, Ki-Young;Bae, Chul-Soo;Choi, Kap-Seok
- Proceedings of the KIEE Conference
- /
- 1988.07a
- /
- pp.20-24
- /
- 1988
This paper proposed the phonemic segmentation method that employed two types of Likelihood Ratio that measures the change of spectral structure. By this method, isolated digits and words of VCV form are segmented into phoneme-unit and especially, first-burst part in an aspirated bilabial plosive is divided.
PDF

A Study on Hangul Writing Behavior (한글 필기행동의 연구)

Yi, Kwang-Oh
- Annual Conference on Human and Language Technology
- /
- 1991.10a
- /
- pp.139-146
- /
- 1991
한글 필기행동에서 나타나는 실수들을 분석하였다. 단어이하의 수준에서 오철(spelling error)와 오기(slips of the pen)가 관찰되었다. 오철은 부분적인 철자지식에 기인하는 것으로, 음소를 철자로 변환하는 과정에 영향을 받는 것임을 시사하는 사례가 발견되었다. 오기에는 지속 예기 생략 등이 있었으며, 철자정보를 운동패턴으로 변환하는 과정에서 나타나는 것 같았다. 또한 획과 관련된 실수들도 발견되었다. 전반적으로 필기과정에는 발음관련정보의 영향이 큰 것을 부정할 수 없었다.
PDF

SPHINX : Hidden Markov Model 기반 음성인식 시스템

Kim, Myeong-Won;Lee, Yeong-Jik;Jeon, In-Heng
- Electronics and Telecommunications Trends
- /
- v.5 no.2
- /
- pp.63-77
- /
- 1990
HMM(Hidden Markov Model)은 음성을 기술하는데 적합한 model이다. 본 고는 최근 CMU에서 개발한 HMM에 기반을 둔 화자독립, 연속음성 system인 SPIHNX에 대하여 기술한다. SPHINX는 단순한 음소의 HMM model을 적용한 baseline SPHINX로부터 시작하여 새로운 지식의 추가 및 음성단위의 조정 등을 통하여 지속적으로 그 성능이 개선되어 왔다. SPHINX의 최종 version은 어휘 약 1000단어 정도의 재원 관리에 관한 질문 형태의 문장을 인식하는데 96%의 높은 인식율을 보인다. SPHINX는 가장 발전된 음성인식 시스템의 하나이며 이는 화자독립, 대용량어휘의 연속음성 인식 시스템의 실현 가능성을 제시한다.
https://doi.org/10.22648/ETRI.1990.J.050205 인용 PDF

A Study on Phoneme Recognition using Neural Networks and Fuzzy logic (신경망과 퍼지논리를 이용한 음소인식에 관한 연구)

Han, Jung-Hyun;Choi, Doo-Il
- Proceedings of the KIEE Conference
- /
- 1998.07g
- /
- pp.2265-2267
- /
- 1998
This paper deals with study of Fast Speaker Adaptation Type Speech Recognition, and to analyze speech signal efficiently in time domain and time-frequency domain, utilizes SCONN[1] with Speech Signal Process suffices for Fast Speaker Adaptation Type Speech Recognition, and examined Speech Recognition to investigate adaptation of system, which has speech data input after speaker dependent recognition test.
PDF

A Study on the Vowel Recognition of Korean Speech using Spatio-temporal Method (Spatio-temporal 방법을 이용한 우리말 모음 인식에 관한 연구)

송도선;김선일;김석동;이행세
- The Journal of the Acoustical Society of Korea
- /
- v.12 no.4
- /
- pp.57-62
- /
- 1993
본 논문은 신경망을 이용한 우리말 모음에 대한 인식 연구이다. 음성을 나누거나. 음소별 인식이나, 시간 신축 방법을 사용하지 않고 모음을 인식하였다. 식나의 변화에 따른 음성의 변화를 정적인 음성으로 취급하였다. 10개로 균등히 나눈 프레임에 각 프레임마다 10차의 PARCOR계수를 추출하였다. 신경망의 구조를 간단히 하기 위해서 단모음과 복모음을 구분하여 학습시켰으며, 출력 노드의 수를 감소시키기 위해 이진 코드 형태로 구성하였다.
PDF

A study on Hangul writing behavior(II): an information processing approach (한글 필기 행동의 연구(II): 정보처리적 접근)

Yi, Kwang-Oh
- Annual Conference on Human and Language Technology
- /
- 1993.10a
- /
- pp.461-468
- /
- 1993
이광오[1]의 연구를 바탕으로 한글 필기 행동의 설명을 시도하였다. 한글 필기에 나타나는 실수에는 예기, 지속, 부가, 생략 등의 유형이 있었으며, 실수에 개입되는 단위로는 단어, 글자, 자모가 인정되었다. 필기에 필요한 기본단위로 글자표상을 가정하고, 심성어휘집에서의 부분적 표기정보 인출과 음소-자모 변환에 의해 글자표상이 생성되는 필기행동 모형에 대해 고찰하였다.
PDF

Allophonic Information Necessary for Speech Technology (음성공학을 위한 변이음 정보)

Lee, Ho-Young;Zhi, Min-Je;Kim, Young-Song
- Annual Conference on Human and Language Technology
- /
- 1993.10a
- /
- pp.131-139
- /
- 1993
하나의 음소는 보통 음성환경에 따라 여러 변이음으로 실현된다. 음성합성기로 한국어의 문장을 자연스럽게 합성해 내려고 할 때나 음성인식기가 한국어의 문장을 정확하게 인식하도록 개발하고자 할 때 변이음에 관한 정보는 필수적이다. 따라서 이 논문의 목적은 음성공학에 필요한 변이음 정보를 제공하는 것이다. 이 논문에서는 음성공학에 필요한 한국어의 주오 변이음 규칙들을 간단히 논의하고 몇몇 중요한 변이음들의 음향적 특징을 논의한다.
PDF

Search Result 529, Processing Time 0.028 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)