• 제목/요약/키워드: Formant synthesis

검색결과 34건 처리시간 0.024초

성도 변형에 따른 모음 포먼트의 변화 고찰 (A Study on Vowel Formant Variation by Vocal Tract Modification)

  • 양병곤
    • 음성과학
    • /
    • 제3권
    • /
    • pp.83-92
    • /
    • 1998
  • Vowels are classified by vocal tract shapes. These shapes form constriction points along the tract, which have an influence on such vocal tract resonance as $F_l,\;F_2,\;F_3$, and so on. This study reviews the perturbation theory of the tract and determines the corresponding formant frequencies from modified vocal tracts using vocal tract area function. Then, formant variation is observed from the theory. Finally, each set of $F_l,\;F_2,\;and\;F_3$ frequency is input to a speech synthesis software to make a vowel sound. Auditory impression of each sound without any modification of its vocal tract shape is almost the same as the corresponding phonetic symbol. Formant frequencies of $F_l,\;F_2,\;F_3$ vary according to the perturbation theory. Generally, constriction along the node causes formant values to decrease while constriction along the anti-node cause it to increase. Vocal tracts modified by more than $3\;cm^2$ change vowel qualities of /a/ and /i/ into those of f /v/ and /$\varepsilon$/, respectively. This study will be helpful in simulating sounds from modified vocal tracts before any operation. Further studies are desirable to compare vocal tract shapes of various languages and their sounds together.

  • PDF

연령 및 성별에 따른 한국인 단모음 포먼트 비교에 관한 연구 -한방병원 내원환자를 중심으로- (A Study on the Formant Comparison of Korean Monophthongs according to Age and Gender -A Survey on Patients in Oriental Hospitals-)

  • 김영수;김근호;김종열;장준수
    • 말소리와 음성과학
    • /
    • 제5권1호
    • /
    • pp.73-80
    • /
    • 2013
  • Formant is one of the essential vocal features for research of voice production, recognition and synthesis. Numerous studies were established on foreign languages including English vowels. However, studies related to Korean were done with a limited number of voice data. In this study, we compare four formants according to age and gender using a large number of Korean monophthongs. A total of 2614 Korean speakers participated in our experiments. We summarize statistical results by mean and standard deviation for each formant of five monophthongs. The results show a notable difference in each age and gender group. A quantitative study based on a large dataset is suggested for future studies on Korean speech sounds.

피치 검출을 위한 스펙트럼 평탄화 기법 (Flattening Techniques for Pitch Detection)

  • 김종국;조왕래;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(4)
    • /
    • pp.381-384
    • /
    • 2002
  • In speech signal processing, it Is very important to detect the pitch exactly in speech recognition, synthesis and analysis. but, it is very difficult to pitch detection from speech signal because of formant and transition amplitude affect. therefore, in this paper, we proposed a pitch detection using the spectrum flattening techniques. Spectrum flattening is to eliminate the formant and transition amplitude affect. In time domain, positive center clipping is process in order to emphasize pitch period with a glottal component of removed vocal tract characteristic. And rough formant envelope is computed through peak-fitting spectrum of original speech signal in frequency domain. As a results, well get the flattened harmonics waveform with the algebra difference between spectrum of original speech signal and smoothed formant envelope. After all, we obtain residual signal which is removed vocal tract element The performance was compared with LPC and Cepstrum, ACF 0wing to this algorithm, we have obtained the pitch information improved the accuracy of pitch detection and gross error rate is reduced in voice speech region and in transition region of changing the phoneme.

  • PDF

포먼트 필터와 음악 화성학에 기반한 차량 음질 연구 (Study on the Vehicle Sound Based on the Formant Filter and Musical Harmonics)

  • 장경진;박동철
    • 한국소음진동공학회논문집
    • /
    • 제25권8호
    • /
    • pp.525-531
    • /
    • 2015
  • Driving sound is an effective element to promote the product identity of a vehicle by providing customers with attractive sound which reflects the concept of a vehicle. Recently, major automakers are focusing on the target sound setting so that the sound can represent the brand image as well as the unique concept of a vehicle. In this study, a new method of target setting for the driving sound will be introduced based on using formant filter and musical harmonics characteristics. In addition, a target sound suggested from this method will be realized and verified by using active noise control in vehicle.

MRI에 의한 모음의 성도 단면적 측정 및 면적 변이에 따른 합성 연구 (Measurement of the vocal tract area of vowels By MRI and their synthesis by area variation)

  • 양병곤
    • 음성과학
    • /
    • 제4권1호
    • /
    • pp.19-34
    • /
    • 1998
  • The author collected and compared midsagittal, coronal, coronal oblique, and transversal images of Korean monophthongs /a, i, e, o, u, i, v/ produced by a healthy male speaker using 1.5 T MR, VISION. Area was measured by computer software after tracing the cross-section at different points along the tract. Results showed that the width of the oral and pharyngeal cavities varied compensatorily from each other on the midsagittal dimension. Formant frequency values estimated from the area functions of the seven vowels showed a strong correlation (r=0.978) with those analyzed from the spoken vowels. Moreover, almost all of 35 students who listened to the synthesized vowels from area data perceived the synthesized vowels as equivalent to the spoken ones. Movement of constriction points of vowel /u/ with wider lip opening sounded /i/ and led to slight changes in vowel quality. Jaw and tongue movement led to major volume variation with an anatomical limitation. Each comer vowel varied systematically from a somewhat constant volume of the average area. Thus, the author proposed that any simulation studies related to vocal tract area variation should reflect its constant volume. The results may be helpful to verify exact measurement of the vocal tract area through vowel synthesis and a simulation study before having any operation of the vocal tract.

  • PDF

포만트합성법을 이용한 한국어 규칙합성시스템의 구현에 관한 연구 (A Study on the Implementation of Korean Synthesis-By-Rule System Using Formant Synthesis Method)

  • 조철우;이태원
    • 한국음향학회지
    • /
    • 제9권6호
    • /
    • pp.38-44
    • /
    • 1990
  • 포만트 합성법을 이용하여 규칙합성시스템을 구현한 일례를 제시한다. 먼저 음소의 입력을 위한 영문 알파벳과 음소의 대응관계를 설정한 뒤 수집된 자연음성으로부터 포만트 합성을 위한 특징 파라미 터를 추출하여 데이터베이스를 작성하다. 그 다음 이러한 데이터베이스를 이용하여 제시된 음소간을 연 결하는 규칙을 제안하고 음소단위의 합성을 행한다. 합성에는 신호처리 프로세서를 사용한 실시간 포만 트 음성합성기를 구현하여 사용하였다. 합성결과 단독음소와 연결음소에 대하여 합성음성을 얻고 이를 평가하였다.

  • PDF

통계적 방법과 인지실험을 통한 한국어 초성파열음의 음소단위 분석에 관한 연구 (A Study on the Phoneme Based Analysis of Korean Initial Plosives Using Statistical Method and Perception Tests)

  • 조철우;이우선;이규호;김종안;임광일;이태원
    • 한국음향학회지
    • /
    • 제8권5호
    • /
    • pp.78-85
    • /
    • 1989
  • 본 논문에서는 한국어의 규칙합성에 관한 연구중 파열음의 함성 파라미터를 추정하기 위하여 사용한 통계적 방법과 인지실험에 의한 방법에 관하여 기술하고 있다. 합성기로는 직렬 포만트 합성기를 구성하여 사용하였고 통제적 분석에 사용된 음성시료는 9개의 초성 파열음과 8개의 모음으로 구성되는 72개의 독립 CV형태를 갖는 단음절을 만일 화자를 통하여 수집하였다. 음성의 분석은 시간 및 주파수 평면에서 파라미터의 변화를 중심으로 행하였으며, 인지실험을 통한 파라미터 추정방법을 통하여 독립적으로 포만트 파라미터의 변화에 관하여 조사하였다.

  • PDF

한국어 이중모음의 음향학적 연구 (An Acoustical Study of Korean Diphthongs)

  • 양병곤
    • 대한음성학회지:말소리
    • /
    • 제25_26호
    • /
    • pp.3-26
    • /
    • 1993
  • The goals of the present study were (3) to collect and analyze sets of fundamental frequency (F0) and formant frequency (F1, F2, F3) data of Korean diphthongs from ten linguistically homogeneous speakers of Korean males, and (2) to make a comparative study of Korean monophthongs and diphthongs. Various definitions, kinds, and previous studies of diphthongs were examined in the introduction. Procedures for screening subjects to form a linguistically homogeneous group, time point selection and formant determination were explained in the following section. The principal findings were as follows: 1. Much variation was observed in the ongliding part of diphthongs. 2. F2 values of (j) group descended while those of [w] group ascended, 3. The average duration of diphthongs were about 110 msec, and there was not much variation between speakers and diphthongs. 4. In a comparative study of monophthongs and diphthongs, Fl and F2 values of the same offgliding part at the third time point almost converged. 5. The gliding of diphthongs was very short beginning from the h-noise. Perceptual studies using speech synthesis are desirable to find major parameters for diphthongs. The results of the present study wi11 be useful in the area of automated speech recognition and computer synthesis of speech.

  • PDF

고음질 음성합성을 위한 LSP를 이용한 피치검출 성능향상에 관한 연구 (A Study on the Pitch Extraction Improvement Using LSP for the Synthesis of High Speech Quality)

  • 서지호;김종국;배명진
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.69-75
    • /
    • 2010
  • 본 논문에서는 스펙트럼 신호를 최대한 평탄화시킴으로써 포만트의 영향을 제거하고 고조파 성분을 분리해 내어 이를 피치검출에 사용한다. 스펙트럼 신호로부터 포만트의 영향과 천이진폭의 영향을 제거하기 위해 주파수 대역을 LSP(Line Spectrum Pair)를 기준으로 서브밴드로 나누고 각각의 서브밴드에서 기울기를 취한 후에 역기울기로 스펙트럼을 보상한다. 실험 결과 제안한 방법이 LPC법, Lifter법, Cepstrum법을 이용하여 평탄화시킬 때 보다 평탄화 정도가 좋아짐을 알 수 있다. 또한 제안한 방법 이외에 가장 양호한 성능을 나타낸 LPC법을 이용하여 피치를 구했을 때 제안한 방법의 조오율이 평균 1.30% 감소하였다. 또한 제안한 방법은 잡음을 부가한 음성의 경우에도 낮은 에러율을 보여 배경잡음에 강하다는 것을 알 수 있었다.

다이폰 군집화와 개선된 스펙트럼 완만화에 의한 음성합성 (Speech Synthesis using Diphone Clustering and Improved Spectral Smoothing)

  • 장효종;김관중;김계영;최형일
    • 정보처리학회논문지B
    • /
    • 제10B권6호
    • /
    • pp.665-672
    • /
    • 2003
  • 본 논문에서는 단위음소들의 연결을 통한 음성합성 방법에 관하여 기술한다. 이때, 발생하는 가장 큰 문제점은 두 단위음소 사이의 연결부분에서 불연속이 발생하는 것이며, 특히 다른 화자로부터 녹음한 단위음소의 연결에서 불연속이 많이 발생한다. 이 문제를 해결하기 위하여 본 논문에서는 군집화된 다이폰을 이용하며, 포만트 궤적과 스펙트럼의 분포특성을 사용할 뿐 아니라 인간의 청각적인 특성을 반영하여 스펙트럼을 완만화하는 방법을 제안한다. 즉, 제안하는 방법은 단위음소 연결구간의 스펙트럼 분포특성의 유사도를 사용하여 단위음소들을 군집화하고 단위음소의 연결 구간에서 인간의 청각신경 특성을 고려하여 완만화의 양과 범위를 결정한 다음, 두 다이폰 경계의 스펙트럼 분포를 시간에 따라 가중치를 다르게 주어 스펙트럼 완만화를 수행한다. 이 방법은 불연속을 제거하며 완만화로 인하여 발생할 수 있는 음성의 왜곡을 최소화한다. 제안하는 방법의 성능을 평가하기 위하여 5명으로부터 녹음한 20개의 문장 중에서 추출한 500여 개의 다이폰을 사용하여 실험을 수행하였다.