A study on the Speaker Recognition using the Pitch

피치계수를 이용한 화자인식에 관한 연구

  • 김에녹 (연암공업대학 컴퓨터정보기술과)
  • Published : 2001.04.01

Abstract

In this thesis, we perform the experiment of speaker recognition by identifying vowels in the pronunciation of each speaker using Adaptive Resource Theory 2(ART2) model. The 5 adult males and 5 adult females pronounce from 0 to 9 digits. We extract the vowels from the pronunciation of each speaker first, we are extracted characteristic coefficient through a pitch detection algorithm, a LPC analysis, and a LPC cepstral analysis to generate an input pattern of ART2. The experimental results showed that pitch coefficients are somewhat more enhanced than LPC or LPC cepstral coefficient.

본 연구에서는 적응 공명 이론(ART2) 모델을 이용하여 화자인식 실험을 수행하였으며, 모을 검출을 통하여 미리 등록된 단어가 아닌 경우에도 화자를 인식할 수 있도록 특징 파라메터를 개발하였다. 실험을 위해 0에서 9까지의 숫자 음을 남성화자와 여성화자 각각 5명씩 발음하여 사용하였으며, 이들 음성 데이터로부터 모음을 추출한 다음 얻어진 피치 계수, 선형예측 계수, 선형예측 켑스트럼 계수를 신경망의 입력 패턴으로 입력시켜 인식 성능을 측정하였다. 실험 결과 피치를 사용하는 것이 텍스트-의존, 텍스트-독립 화자인식 모두에서 다른 계수들을 사용하는 것보다 우수한 성능을 보이고 있다.

Keywords