• 제목/요약/키워드: Speaker Variation

검색결과 74건 처리시간 0.025초

입력 신호의 전치 보상을 이용한 D 급 음향 전력 증폭기의 스피커 전류 구동 방법 (Method for Current-Driving of the Loudspeakers with Class D Audio Power Amplifiers Using Input Signal Pre-Compensation)

  • 은창수;이유칠
    • 한국멀티미디어학회논문지
    • /
    • 제21권9호
    • /
    • pp.1068-1075
    • /
    • 2018
  • We propose a method for driving loudspeakers from class D audio power amplifiers in current mode, instead of in conventional voltage mode, which was impossible with the feedback circuitry. Unlike analog audio amplifiers, Class D audio power amplifiers have signal delay between the input and output signals, which makes it difficult to apply the feedback circuitry for current-mode driving. The idea of the pre-distortion scheme used for the compensation of the non-linearity of RF power amplifiers is adapted to remedy the impedance variation effect of the loudspeakers for current driving. The method uses the speaker model for the pre-distorter to compensate for the speaker impedance variation with frequency. The simulation and test results confirms the validity of the proposed method.

좁은대역 스펙트럼의 차이값과 상관계수에 의한 화자확인 연구 (A Study on Speaker Identification by Difference Sum and Correlation Coefficients of Narrow-band Spectrum)

  • 양병곤;강선미
    • 음성과학
    • /
    • 제9권3호
    • /
    • pp.3-16
    • /
    • 2002
  • We examined some problems in speaker identification procedures: transformation of acoustic parameters into auditory scales, invalid measurement values, and comparability of spectral energy values across the frequency range. To resolve those problems, we analyzed the acoustic spectral energy of three Korean numbers produced by ten female students from narrow-band spectrograms at 19 proportional time points of each voiced segment. Then, cells of the first five spectral matrices were averaged to form a matrix model for each speaker. The correlation coefficients and sum of the absolute amplitude difference in each pair of the spectral models of the ten subjects were obtained. Also, some individual matrix models were compared to those of the same subject or the other subject with a similar spectral model. Results showed that in numbers '2' and '9' subjects could not be clearly distinguished from the others but in number '4' it shed some possibility of setting threshold values for speaker identification if we employed the coefficients and the sum of absolute difference. Further studies would be desirable on various combinations of the range of long-term average spectra and the degree of signal pre-emphasis.

  • PDF

화자인식을 위한 퍼지상관차원 제안 (A Proposition of the Fuzzy Correlation Dimension for Speaker Recognition)

  • 유병욱;김창석;박현숙
    • 전자공학회논문지S
    • /
    • 제36S권1호
    • /
    • pp.115-122
    • /
    • 1999
  • 본 논문은 음성신호가 카오스 신호임을 확인하고 화자인식 파라미터로 사용하기 위해 상관차원을 분석하였다. 화자식별과 인식 향상을 위하여 개인의 성도특성을 매우 잘 나타내는 음성의 스트레인지 어트렉터를 구성하고 퍼지유사도를 상관차원에 적용하여 퍼지상관차원을 제안하였다. 퍼지상관차원은 어트렉터 구성점들의 상관관계글 퍼지상관적분으로 추정하고 공간차원에 따라 퍼지상관지수가 일정하게 수렴되는 차원값을 구하여 표준패턴 어트렉터와 시험패턴 어트렉터의 변동을 흡수하였다. 퍼지상관차원에 대해 화자와 표준패턴별로 식별오차의 평균값에 따른 거리를 추정함으로써 화자인식파라미터의 타당성을 검토하였다.

  • PDF

일본어 특수박의 지속시간에 관한 음향음성학적 분석 (An acoustic study on the duration of the morn in Japanese)

  • 김선희
    • 대한음성학회지:말소리
    • /
    • 제38호
    • /
    • pp.113-124
    • /
    • 1999
  • It is well known that Japanese prosodic structure assumes mora below the syllable tier. Syllables with V or CV structure are counted as having one morn whereas those with coda consonants /-pp, -tt, -kk, -ss, -N/ or long vowels are counted as having two morns in Japanese. This study measured the acoustic duration of these special moras ('tokusyuhaku') produced by Tokyo dialect speakers to see if they are isochronic with V or CV. It also examined the production of Korean(Seoul/Kyungsang dialect) and Chinese native speakers loaming Japanese as a second language to examine how the learners' first language influence their second language. Finally, it examined how speakers of the Akita dialect, which is blown as a syllabeme dialect in Japanese, produced them. The results showed that intra-speaker variation as well as inter-speaker variation was observed in the production by Akita dialect speakers. Production of native speakers of Chinese and Kyungsang dialect of Korean -- which have vowel length contrast in their phonological systems -- showed a similar result to Tokyo dialect speakers, which implies the influence of the learners' first language on the acquisition of the second language.

  • PDF

화자 확인 시스템을 위한 적응적 모델 갱신과 사전 문턱치 결정에 관한 연구 (A Study on Adaptive Model Updating and a Priori Threshold Decision for Speaker Verification System)

  • 진세훈;이재희;강철호
    • 한국음향학회지
    • /
    • 제19권5호
    • /
    • pp.20-26
    • /
    • 2000
  • 화자 확인시스템에서 화자의 장기간 음성 변동에 대처하기 위해서는 작은 양의 데이터로써 화자 확인을 위한 HMM(hidden Markov model) 파라미터 갱신과 사전 문턱치 결정이 중요한 요소이다. 본 연구에서는 화자내 변이(mea-speaker variation)에 적응하는 모델 갱신방법과 이에 따른 문턱치 적응에 관한 방법을 제안한다. 제안하는 방법은 분기간 화자내 변이로 발생할 수 있는 오인식율을 Baum-Welch re-estimation을 통해 현재 화자 모델 파라미터에 새로운 음성 데이터를 적응시킴으로써 감소시킨다. 본 논문에서 제안하는 사전 문턱치 결정 방법은 기존의 월드 모델(world model) 방법과 군중 모델(cohort model) 방법의 하이브리드 형태로써 실험적으로 결정된다. 실험에 의해 모델 갱신을 하지 않은 경우보다 제안하는 모델 갱신방법의 화자 인식율이 우수함을 확인하였다. 또한, 사후 문턱치 결정에 의한 인식율과 제안한 사전 문턱치 결정에 의한 인식율의 차이가 근소함을 확인하였다.

  • PDF

Praat를 이용한 숫자음의 음향적 분석법 (An acoustical analysis method of numeric sounds by Praat)

  • 양병곤
    • 음성과학
    • /
    • 제7권2호
    • /
    • pp.127-137
    • /
    • 2000
  • This paper presents a macro script to analyze numeric sounds by a speech analysis shareware, Praat, and analyzes those sounds produced by three students who were born and raised in Pusan. Recording was done in a quiet office. To make a meaningful comparison, dynamic time points in relation to the total duration of voicing segments were determined to measure acoustical values. Results showed that a strong correlation coefficient was found between the repetitive production of numeric sounds within and across the speakers. Very high coefficients among diphthongal numbers (0 and 6) which usually show wide formant variation were noticed. This supports that each speaker produced numbers quite coherently. Also, the frequency differences between the three subjects were within a perceptually similar range. To identify a speaker among others may require to find subtle individual differences within this range. Perceptual experiments by synthesized numeric sounds may lead to resolve the issue.

  • PDF

국부 봉우리와 골에 의한 피치 검출과 퍼지를 이용한 화자 인식에 관한 연구 (A Study on Speaker Recognition using the Peak and valley pitch detection and the Fuzzy)

  • 김연숙;김희주;김경재
    • 한국정보통신학회논문지
    • /
    • 제8권1호
    • /
    • pp.213-219
    • /
    • 2004
  • 본 논문에서는 국부 봉우리와 골에 의한 피치 파라미터와 퍼지를 포함한 화자 인식 알고리즘을 제안한다. 음성의 패턴 인식에서 인식 성능을 저하시키는 시간 변동과 주파수 변동에 대한 문제를 해결하여 피치를 검출한다. 비선형적인 발성 시간에 따른 시간 변동의 폭을 모두 포함하기 위하여 음성 신호의 애매성을 보완할 수 있는 퍼지의 소속 함수를 이용하여 표준 패턴을 작성하고 퍼지 패턴 매칭을 이용하여 인식을 수행한다.

음성인식을 위한 성도 길이 정규화 (Vocal Tract Length Normalization for Speech Recognition)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제7권7호
    • /
    • pp.1380-1386
    • /
    • 2003
  • 화자들 사이의 성도의 길이의 변이에 의하여 음성 인식기의 성능이 저하된다. 본 연구에서는 입력 음성에서 추출한 단구간 스펙트럼의 주파수축을 확대하거나 축소하여 음성인식기에 미치는 화자사이의 성도 길이의 영향을 최소화하는 방법을 사용한다 성도의 길이를 정규화하기 위한 주파수 변환 함수로서, 선형의 주파수 변환 함수와 조각적 선형적인 변환 함수를 고려하였다. 또한, 커다란 성도길이의 변이에 따른 주파수축의 척도변화를 보다 효과적으로 모의할 수 있는 가변구간 조각적 선형함수를 제안한다. TIDIGITS 연결 숫자음 음성자료에 대하여 제안한 방법을 적용한 결과, 단어의 오인식률을 2.15%에서 0.53%로 크게 감소시킴으로서, 성도 길이 정규화가 화자 독립 음성인식기의 성능 향상에 필수적임을 알 수 있었다.

직교인자의 동적 특성을 이용한 화자인식 (Speaker Recognition Using Dynamic Time Variation fo Orthogonal Parameters)

  • 배철수
    • 한국통신학회논문지
    • /
    • 제17권9호
    • /
    • pp.993-1000
    • /
    • 1992
  • 음성신호의 분석으로부터 유도되는 직교인자는 화자의 개인성을 많이 포함하고 있으므로, 최근 많은 연구자들이 이것을 이용한 통계적 처리방법으로 화자인식을 수행하여 좋은 화자인식율을 얻고 있다. 그러나 이러한 방법들은 아직 음성의 발성속도나 시간적 동특성으로 인해서 발생하는 문제점을 갖고 있다. 따라서 본 논문에서는 이러한 문제점을 해결하기 위해서 음성분석의 한 방법인 Karhunen-Loeve 직교 변환에 의해서 추출한 직교인자를 화자인식에 이용하는 방법에 DTW법을 결합하는 두가지 기법을 제안하였다. 첫째는 직교인자를 특징벡터로 하여 DTW법을 적용하고, 둘째는 직교인자를 최적경로에 이용하는 기법이다. 이들 두 기법에 의한 화자인식 결과와 직교인자의 통계적 처리에 의한 종래의 화자인식방법의 결과를 비교하였다. 사용된 직교인자는 음성신호에서 선형예측계수와 부분자기상관계수를 각각 추출하여 위의 화자인식방법에 각각 적용하였다. 이를 실험한 결과, 선형예측계수로 부터 얻은 직교인자를 최적경로를 이용한 기법에 적용하는 경우 88.6%의 가장 높은 인식율을 얻었다.

  • PDF

Articulatory characteristics and variation of Korean laterals

  • Hwang, Young;Charles, Sherman;Lulich, Steven M.
    • 말소리와 음성과학
    • /
    • 제11권1호
    • /
    • pp.19-27
    • /
    • 2019
  • Lateral approximants are well known as having complex articulatory characteristics, which vary cross-linguistically, across speakers, and across utterances. However, less attention has been paid to the articulation of Korean laterals, which do not contrast with a rhotic and may thus exhibit greater-than-normal variability. The focus of this study is to investigate the general articulatory characteristics of the Korean lateral [l] as well as the articulatory variation using novel 3D ultrasound imaging methods. The results of this study revealed significant between-speaker variation and some vowel-dependent variation with regard to the articulation of the Korean lateral [l], which has not been reported previously. Even though all participants in this study showed an anterior occlusion, the place of articulation and the size of the occlusion varied greatly across speakers. The data also revealed that left-right asymmetry is present in the articulation of the Korean lateral. The individual variation of the Korean lateral [l] suggests that it has a large articulatory-acoustic space for variation, since it has no contrasting sound that causes perceptual confusion.