Speaker Indexing using Vowel Based Speaker Identification Model

모음 기반 하자 식별 모델을 이용한 화자 인덱싱

  • Kum Ji Soo (Dept of Computer Engineering, Kyung Hee University) ;
  • Park Chan Ho (Dept. of Internet Information Science, Bucheon College) ;
  • Lee Hyon Soo (Dept of Computer Engineering, Kyung Hee University)
  • 금지수 (경희대학교 컴퓨터공학과) ;
  • 박찬호 (부천대학 인터넷응용과) ;
  • 이현수 (경희대학교 컴퓨터공학과)
  • Published : 2002.07.01

Abstract

본 논문에서는 음성 데이터에서 동일한 화자의 음성 구간을 찾아내는 화자 인덱싱(Speaker Indexing) 기술 중 사전 화자 모델링 과정을 통한 인덱싱 방법을 제안하고 실험하였다. 제안한 인덱싱 방법은 문장 독립(Text Independent) 화자 식별(Speaker Identification)에 사용할 수 있는 모음(Vowel)에 대해 특징 파라미터를 추출하고, 이를 바탕으로 화자별 모델을 구성하였다. 인덱싱은 음성 구간에서 모음의 위치를 검출하고, 구성한 화자 모델과의 거리 계산을 통하여 가장 가까운 모델을 식별된 결과로 한다. 그리고 식별된 결과는 화자 구간 변화와 음성 데이터의 특성을 바탕으로 필터링 과정을 거쳐 최종적인 인덱싱 결과를 얻는다. 화자 인덱싱 실험 대상으로 방송 뉴스를 녹음하여 10명의 화자 모델을 구성하였고, 인덱싱 실험을 수행한 결과 $91.8\%$의 화자 인덱싱 성능을 얻었다.

Keywords