• Title/Summary/Keyword: Speaker Verification

검색결과 162건 처리시간 0.046초

다충신경망을 위한 온라인방식 학습의 개별학습단계 최적화 방법 (Local-step Optimization in Online Update Learning of Multilayer Perceptrons)

  • Tae-Seung, Lee;Ho-Jin, Choi
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.700-702
    • /
    • 2004
  • A local-step optimization method is proposed to supplement the global-step optimization methods which adopt online update mode of internal weights and error energy as stop criterion in learning of multilayer perceptrons (MLPs). This optimization method is applied to the standard online error backpropagation(EBP) and the performance is evaluated for a speaker verification system.

  • PDF

MLP 기반 화자증명 시스템에서 학습 데이터 감축을 통한 등록속도 향상방법 (An Improvement of the Enrolling Speed for the MLP-Based Speaker Verification System through Reducing Learning Data)

  • 이태승;황병원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.619-621
    • /
    • 2002
  • MLP(multilayer perceptron)는 기존의 패턴인식 방법에 비해 몇 가지 이점을 제공하지만 학습에 비교적 많은 시간을 요구한다. 이 점은 화자증명 시스템의 인식방법으로서 MLP를 사용할 경우 등록시간이 길어지는 문제를 발생시킨다. 본 논문에서는 기존의 시스템에서 채택한 화자군집 방법을 응용하여 MLP 학습에 필요만 배경화자 수를 줄임으로써 화자등록 시간을 단축하는 방법을 제안한다.

  • PDF

MLP 군집 모델에 기반한 어구독립 화자증명 (Text-Independent Speaker Verification Based on MLP Cohort Model)

  • 이태승;최호진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.434-436
    • /
    • 2000
  • 본 논문에서는 기존의 확률적 화자군집 모델을 MLP(multi-layer perceptron)로 구현하는 방법과 원형 화자군집 모델이 갖는 문제를 해결할 수정 모델을 제시한다. 화자군집 모델은 화자등록 시간에 민감한 실용 환경에서 중요한 의미를 지닌다. 본 연구에서 사용한 인식단위는 여러 음소계열에서 지속적인 부분을 추출한 지속음이므로 화자등록과 증명 단계에서 특정한 어구에 한정되지 않는 어구독립 방식을 채택한다.

  • PDF

화자 확인을 위한 하이브리드 GMM/SVM 방식에 대한 연구 (Research of Hybrid GMM/SVM Approach for Speaker Verification)

  • 윤유선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.139-140
    • /
    • 2008
  • 문장 독립 화자 확인에서 SVM을 위한 적응된 GMM을 바탕으로 특징을 추출함으로써 GMM과 SVM 사이의 새로운 접근 방식을 제안한다. 우수한 측정성으로 인해, 적응된 GMM은 SVM 화자 확인을 위한 대규모의 음성 데이터로부터 적은 양의, 전형적인 특징 벡터를 추출해오곤 했다. 이 새로운 접근방식을 사용함으로써, 제안된 화자 확인 시스템은 기존의 GMM-UBM 시스템보다 훨씬 나은 성능을 보였다.

프레임레벨유사도정규화를 적용한 문맥독립화자식별시스템의 구현 (Realization a Text Independent Speaker Identification System with Frame Level Likelihood Normalization)

  • 김민정;석수영;김광수;정현열
    • 융합신호처리학회논문지
    • /
    • 제3권1호
    • /
    • pp.8-14
    • /
    • 2002
  • 본 논문에서는 Gaussian mixture model을 이용한 실시간 문맥독립화자식별시스템을 구현하여 인식실험을 수행하였으며, 인식시스템의 성능을 향상시키기 위하여 화자검증시스템에서 좋은 결과를 보인 유사도 정규화(Likelihood normalization)방법을 적용하여 인식실험을 하였다. 시스템은 크게 전처리단과 화자모델생성단, 화자식별단으로 나누어진다. 전처리단에서는 화자의 발성변화를 고려하여 CMN(Cepstral mean normalization)과 Silence removal 방법을 적용하였다. 화자모델생성단에서는, 화자발성의 음향학적 특징을 잘 표현할 수 있는 GMM(Gaussian mixture model)을 이용하여 화자모델을 작성하였으며, GMM의 파라미터를 최적화하기 위하여 MLE(Maximum likelihood estimation)방법을 사용하였다. 화자식별단에서는 학습된 데이터와 테스트용 데이터로부터 ML(Maximum likelihood)을 이용하여 유사도를 계산하였으며, 이 과정에서 유사도 정규화를 적용한 경우에는 프레임단위로 유사도를 계산하게 된다. 계산된 유사도는 스코어(S$_{C}$)로 표현하였고, 가장 높은 스코어를 가지는 화자가 인식화자로 결정된다. 화자인식에서 발성의 종류로는 문맥독립 문장을 사용하였다. 인식실험을 위해서는 ETRI445 DB와 KLE452 DB를 사용하였으며, 특징파라미터로서는 켑스트럼계수 및 회귀계수값만을 사용하였다. 인식실험에서는 등록화자의 수를 달리하여 일반적인 화자식별방법과 프레임단위유사도정규화방법으로 각각 인식실험을 하였다. 인식실험결과, 프레임단위유사도정규화방법이 인식화자수가 많아지는 경우에 일반적인 방법보다 향상된 인식률을 얻을 수 있었다.

  • PDF

다중생체인식 기법을 이용한사용자 인식률 향상 (Improvement of User Recognition Rate using Multi-modal Biometrics)

  • 금명환;이규원;이봉환
    • 한국정보통신학회논문지
    • /
    • 제12권8호
    • /
    • pp.1456-1462
    • /
    • 2008
  • 단일 생체인식 시스템의 인식률을 높이는 것은 생체인식 방법마다 취약점이 있기 때문에 그 한계가 있기 마련이다. 얼굴 인식의 경우 조명과 같은 환경적 요인으로 인식률이 저하될 수 있으며, 화자 확인의 경우도 잡음과 같은 환경적 요인으로 인식률이 크게 저하될 수 있다. 따라서 두 가지 이상의 생체특징을 결합하여 다중 생체인식 시스템을 구현함으로써 그 취약점을 보완하는 추세에 있다. 본 논문에서는 얼굴 인식과 화자 확인 시스템을 결합하여 다중 생체인식 시스템을 구현하였고, 일반적인 가중치합 알고리즘에 환경 변수를 적용하여 기존의 다중 생체 인식 시스템보다 인식률을 향상시켰다. 본 시스템은 비밀키 기반의 애플릿으로 구현되어 있으므로 웹 상의 사용자 인증을 필요로 하는 응용에 활용될 수 있다.

화자 인증 기능이 포함된 실시간 원격 도어락 제어 시스템 개발에 관한 연구 (Study on development of the remote control door lock system including speeker verification function in real time)

  • 권순량
    • 한국지능시스템학회논문지
    • /
    • 제15권6호
    • /
    • pp.714-719
    • /
    • 2005
  • 본 논문에서는 휴대폰을 이용하여 방문자의 음성이나 영상을 원격으로 확인할 수 있는 시스템을 설계 및 구현한다 이 시스템은 주인이 집에 없을 때라도 휴대폰으로 단문 메시지가 아닌 자동 호출 서비스를 통해 방문자가 누구인지를 알 수 있도록 설계되어 있다. 일반적으로 도어락은 홈 서버를 통해 제어되지만, 실시간 측면에서 볼 때 DTMF 신호를 이용하여 도어락을 제어하는 것이 더 효율적이다. 본 논문에서 제시하는 기술은 손님이 집에 방문하였을 경우 주인이 외출 중이더라도 시스템을 통해 주인의 휴대폰에 자동으로 전차하여 음성 및 영상으로 손님과 주인간에 통화를 가능하게 하고, 필요 시 주인이 도어락을 원거리에서 제어할 수 있게 한다. 이를 통해 주인은 방문자 확인 및 도어락 제어에 시간과 공간의 제약을 받지 않는다. 또한 휴대폰 분실 시 발생할 수 있는 보안상의 악영향을 고려하여 도어락 제어 및 환경 설정 시에 필요한 인증 절차를 기존의 패스워드 형태에서 패스워드 및 화자 인증의 혼합 형태로 설계하여 보안 체계를 향상시킨다. 그리고, 통화중에 DTMF 신호를 사용하여 도어락을 실 시간적으로 제어함으로써 도어락 제어를 위해 망에 재 접속해야 하는 기존의 문제점을 해결토록 한다.

열음향 냉장시스템 (II) : 제작 및 실험 (Thermoacoustic Refrigerating System, Part II : Implementation and Experiment)

  • 하재규;안철용;성굉모
    • 한국음향학회지
    • /
    • 제14권6호
    • /
    • pp.13-20
    • /
    • 1995
  • 본 논문에서는 열음향 냉장시스템을 실제로 설계, 제작하고 그 동작을 확인하였다. 제작된 시스템은 4인치의 중음부 스피커로 구동되며 스피커 하우징, 챔버, 스택하우징, 스택, 열교환기, 가는관, 그리고 공명구로 구성되었으며 내부에 10기압의 He을 채워 실험하였다. 실행 중 온도하강측정을 위하여 T 타입의 열전쌍을 열교환기에 부착하였고, 내부음압측정용 콘덴서 마이크로폰을 장착하였다. 스피커의 열손상을 막고 고온 열교환기를 냉각시키기 위하여 냉각수를 공급하였다. 실제 실험을 위하여 제작된 열음향기관의 전기적인 임피던스를 측정하여 공진특성을 파악하였는데, 실험 결과 설계치와는 약간 다르게 340Hz로 구동하는 것이 효율적이었다. 이러한 해석을 기초로 실제 냉장실험을 수행한 결과 $30^\circ{C}$의 조건하에서 340Hz, 50W로 구동하였을 때 $16^\circ{C}$의 냉장효과를 관찰하였다. 관찰된 냉각효과와 설계치의 차이를 규명하기 위하여 제작된 열음향기관의 미비점을 고찰하였는 바, 냉각부의 단열이 제일 중요한 문제임을 파악하였으며 그외의 보완이 필요한 사항은 이후의 진행될 연구의 과제로서 제시하였다.

  • PDF

강인한 화자 확인 시스템을 위한 World 모델을 이용한 켑스트럼 정규화 연구 (A Study of Cepstrum Normalization Using World Model for Robust Speaker Verification)

  • 김유진;정재호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 하계학술발표대회 논문집 제19권 1호
    • /
    • pp.55-58
    • /
    • 2000
  • 본 논문에서는 화자 확인 시스템의 등록과 확인 과정의 채널 환경 불일치로 성능이 저하되는 문제를 해결하기 위한 새로운 정규화 방법에 대해 설명한다. 제안된 방법은 첫째, 입력 음성으로부터 효과적으로 채널을 추정$\cdot$보상하고 둘째, 스코어 정규화 과정에서 사칭자 모델로서 사용되는 world모델과의 차이를 채널 추정 및 화자 모델 생성에 효과적으로 사용하는 것을 목표로 한다. 이를 위해 입력 음성의 켑스트럼과 HMM world 모델의 파라메터인 평균 켑스트럼과의 차이를 통해 음소열에 종속적인 채널 켑스트럼인 Phone-Dependent Difference Cepstrum을 추정한다. 한편 입력 음성의 음소열은 world모델의 스코어를 얻는 과정에서 함께 얻어질 수 있다. 채널 추정 실험 결과를 통해서 가장 일반적인 채널 정규화방법인 CMS에 의해 추정된 채널에 비해 실제 채널과 유사하며 화자 고유의 특성을 왜곡시키지 않는 채널 추정이 가능함을 확인할 수 있었다.

  • PDF