• 제목/요약/키워드: Speaker verification

검색결과 162건 처리시간 0.028초

음성인식 보안 시스템의 구현 (Implementation of Voice Awareness Security Sytems)

  • 이문구
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.799-800
    • /
    • 2006
  • This thesis implemented security systems of voice awareness which is higher accessible than existing security system using biological authentication system and is inexpensive in module of security device, and has an advantage in usability. Proposed the security systems of voice awareness implemented algorithm for characteristic extraction of inputted speaker's voice signal verification, and also implemented database of access control that is founded on extractible output. And a security system of voice awareness has a function of an authority of access control to system.

  • PDF

화자인식을 위한 강인한 끝점 검출 알고리즘 (Robust Endpoint Detection Algorithm For Speaker Verification)

  • 정대성;김정곤;김형순
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 5월 학술대회지
    • /
    • pp.137-140
    • /
    • 2003
  • In this paper, we propose a robust endpoint detection algorithm for speaker verification. Proposed algorithm uses energy and cepstral distance parameters, and it replaces the detected endpoints with endpoints of voiced speech, when the estimated signal-to-noise ratio (SNR) is low. Experimental results show that proposed algorithm is superior to energy-based endpoint detection algorithm.

  • PDF

지능형 서비스 로봇을 위한 문맥독립 화자인식 시스템 (Context-Independent Speaker Recognition in URC Environment)

  • 지미경;김성탁;김회린
    • 로봇학회논문지
    • /
    • 제1권2호
    • /
    • pp.158-162
    • /
    • 2006
  • This paper presents a speaker recognition system intended for use in human-robot interaction. The proposed speaker recognition system can achieve significantly high performance in the Ubiquitous Robot Companion (URC) environment. The URC concept is a scenario in which a robot is connected to a server through a broadband connection allowing functions to be performed on the server side, thereby minimizing the stand-alone function significantly and reducing the robot client cost. Instead of giving a robot (client) on-board cognitive capabilities, the sensing and processing work are outsourced to a central computer (server) connected to the high-speed Internet, with only the moving capability provided by the robot. Our aim is to enhance human-robot interaction by increasing the performance of speaker recognition with multiple microphones on the robot side in adverse distant-talking environments. Our speaker recognizer provides the URC project with a basic interface for human-robot interaction.

  • PDF

유무선 전화를 통한 화자인식 알고리즘에 관한 연구 (A Study on Speaker Recognition Algorithm Through Wire/Wireless Telephone)

  • 김정호;정희석;강철호;김선희
    • 한국음향학회지
    • /
    • 제22권3호
    • /
    • pp.182-187
    • /
    • 2003
  • 본 논문에서는 방사 기저함수 (RBF: Radial Basis Function) 신경망을 이용하여 특징 파라미터를 사상시켜 화자인식의 성능을 개선하기 위한 알고리즘을 제안하였다. 동일한 화자의 유무선 전화의 백터 영역이 서로 다르므로 제안한 화자확인시스템은 유무선 학습모델을 생성하기 위해서 먼저 음성인식을 통해 유무선 채널을 판별하고, 학습하지 않은 채널의 모델은 방사 기저함수 신경망을 이용하여 학습된 모델의 특징 벡터 (LPC-켑스트럼)를 사상하는 방법이다. 모의 실험 결과 기존의 켑스트럼 평균 차감법을 사용할 때보다 제안한 알고리즘을 적용했을 때의 인식율이 약 0.6%∼10.5%의 성능 향상을 보여주었다.

화자적응을 이용한 음성인식 제어시스템 개발 (Development of Voice Activated Universal Remote Control System using the Speaker Adaptation)

  • 김용표;윤동한;최운하
    • 한국정보통신학회논문지
    • /
    • 제10권4호
    • /
    • pp.739-743
    • /
    • 2006
  • 본 논문은 신경회로망을 이용한 화자적응 음성인식 제어시스템을 개발하였다. 화자종속시스템은 단일 화자의 음성만 등록하여 이용하므로 여러 화자의 음성을 인식하는 데는 문제가 있고, 화자독립시스템은 여러 화자를 인식한다. 본 연구 개발에서는 화자적응시스템을 구현하여 화자종속형의 단점을 보완하여 화자 독립과 화자 종속을 혼합하여 사용 할 수 있는 기능으로 화자 적용방법으로 구현하였고, 화자인증(Speaker Verification)도 가능하도록 프로그램 하였다.

가변 신뢰도 문턱치를 사용한 미등록어 거절 알고리즘에 대한 연구 (A Study on Out-of-Vocabulary Rejection Algorithms using Variable Confidence Thresholds)

  • 방기덕;강철호
    • 한국멀티미디어학회논문지
    • /
    • 제11권11호
    • /
    • pp.1471-1479
    • /
    • 2008
  • 본 논문에서는 음성인식 분야에서 많이 사용되고 있는 가변어휘 단어 인식 시스템에서 미등록어에 대한 거절 성능을 향상시키는 방법을 제안한다. 거절 기능을 구현하는 방식은 핵심어 검출(keyword spotting)방식과 발화검증(utterance verification)으로 구분이 된다. 발화 검증 방식은 각 음소마다 이와 유사한 반음소모델(anti-phoneme model)을 생성한 후 정상적인 음소 모델과 반음소 모델의 유사도를 비교하여 결정하는 방식이다. 본 논문에서는 화자가 발성할 때마다 구해지는 화자확인 확률값을 신뢰도 문턱치를 결정할 때 적용하는 방법에 대하여 제안하였다. 제안한 방법을 사용하였을 때, 사무실 환경에서 CA(Correctly Accepted for keyword)가 94.23%, CR(Correctly Rejected for out-of-vocabulary)이 95.11%로 나타났고, 잡음 환경에서는 CA가 91.14%, CR이 92.74%로 나타나서 성능이 향상됨을 확인할 수 있었다.

  • PDF

Voice Verification System for m-Commerce on CDMA Network

  • Kyung, Youn-Jeong
    • The Journal of the Acoustical Society of Korea
    • /
    • 제22권4E호
    • /
    • pp.176-182
    • /
    • 2003
  • As the needs for wireless Internet service is increasing, the needs for secure m-commerce is also increasing. Conventional security techniques are reinforced by biometric security technique. This paper utilized the voice as biometric security techniques. We developed speaker verification system for m-commerce (mobile commerce) via wireless internet and wireless application protocol (WAP). We named this system the mVprotek. We implemented the system as client-server architecture. The clients are mobile phone simulator and personal digital assistant (PDA). The verification results are obtained by integrating the mVprotek system with SK Telecom's code dimension multiple access (CDMA) system. Utilizing f-ratio weighting and virtual cohort model normalization showed much better performance than conventional background model normalization technique.

전화선 채널이 화자확인 시스템의 성능에 미치는 영향 (The Effect of the Telephone Channel to the Performance of the Speaker Verification System)

  • 조태현;김유진;이재영;정재호
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.12-20
    • /
    • 1999
  • 본 논문에서는 깨끗한 환경에서 녹음된 음성데이터와 채널환경에서 수집된 음성데이터의 화자확인 성능을 비교하였다. 채널데이터의 화자확인 성능을 향상시키기 위하여 채널환경에 강인한 특징 파라메타 및 전처리에 대해 연구하였다. 실험을 위한 음성 DB는 어구지시(text-prompted) 시스템을 고려하여 두 자리의 한국어 숫자음으로 구성하였다. 적용한 음성 특징은 LPCC(Linear Predictive Cepstral Coefficient), MFCC(Mel Frequency Cepstral Coefficient), PLP(Perceptually Linear Prediction), LSP(Line Spectrum Pair)이며, 채널 잡음을 제거하기 위한 전처리 과정으로는 음성신호에 대한 필터링을 적용하였다. 추출된 특징으로부터 채널의 영향을 제거 또는 보상하기 위해 cepstral weighting, CMS(Cepstral Mean Subtraction), RASTA(RelAtive SpecTrAl)를 적용하였다. 또한 각각의 특징 및 처리 방법에 대한 음성인식 성능을 제시함으로써 화자확인에서의 성능과 음성인식에서의 성능을 비교하였다. 적용한 음성 특징 및 처리 방법들에 대한 성능 평가를 위해 HTK(HMM Tool Kit) 2.0을 이용하였다. 남자, 여자 화자별로 임계값을 다르게 주는 방법으로 깨끗한 음성데이터와 채널 데이터에 대한 EER(Equal Error Rate)을 구하여 비교하였다. 실험결과 전처리 과정에서 대역통과 필터(150~3800Hz)를 적용하여 저대역 및 고대역의 채널 잡음을 제거하고, 이 신호로부터 MFCC를 추출하였을 때 EER 측면에서의 화자확인 성능이 가장 좋게 나타났다.

  • PDF

유전자 알고리즘을 이용한 화자인식 시스템 성능 향상 (Performance Improvement of Speaker Recognition System Using Genetic Algorithm)

  • 문인섭;김종교
    • 한국음향학회지
    • /
    • 제19권8호
    • /
    • pp.63-67
    • /
    • 2000
  • 본 논문에서는 화자인식의 성능향상을 위한 dynamic time warping (DTW) 기반의 문맥 제시형 화자인식에 대해 연구하였다. 화자인식에 있어 중요한 요소인 화자의 특성을 잘 반영할 수 있는 참조패턴을 생성하기 위해 유전자 알고리즘을 적용하였다. 또한, 문맥 종속형과 문맥 독립형 화자인식의 단점을 개선하기 위해 문맥 제시형 화자인식을 수행하였다. Clos set에서 화자식별과 open set에서 화자확인 실험을 하였으며 실험결과 기존 방법의 참조패턴을 이용하였을 경우보다 유전자 알고리즘에 의한 참조패턴이 인식률과 인식속도 면에서 우수함을 보였다.

  • PDF

화자 확인에서 SPRT를 위한 새로운 테스트 데이터 생성 (A New Teat Data Generation for SPRT in Speaker Verification)

  • 서창우;이기용
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.42-47
    • /
    • 2003
  • 본 논문에서 제안하는 방법은 화자 확인 (speaker verification)에서 시퀀스 확률비 테스트 (SPRT: sequential probability ratio test)를 위한 시작 프레임의 샘플 시프트를 이용해서 새로운 테스트 데이터를 생성하는 방법이다. SPRT는 테스트 계산량을 줄일 수 있는 효과적인 알고리즘이다. 그러나 테스트의 결정과정에서 SPRT 방법은 입력신호가 확률밀도 함수로부터 독립적이고 균일하게 분포되어 있다는 가정하에 수행할 수 있으며, 또한 발성길이가 짧은 데이터에는 적용하기에 적절하지 못하다. 제안한 방법은 시작 프레임의 샘플 시프트를 통한 새로운 테스트 데이터를 생성하는 방법이기 때문에 테스트 데이터의 길이에 상관없이 SPRT를 수행할 수 있다. 또한 SPRT 방법에서 고려해야 하는 데이터의 상관성은 주성분 분석(principal component analysis)을 이용함으로써 효과적으로 제거하였다. 실험 결과 제안한 방법은 기존의 방법보다 샘플시프트를 위한 데이터의 계산량은 약간 증가하였지만, 등가오류율 (EER: equal error rate)에서 평균0.7%이상 좋은 성능결과를 보였다.