• 제목/요약/키워드: 화자 식별

검색결과 105건 처리시간 0.023초

화자인식을 위한 퍼지상관차원 제안 (A Proposition of the Fuzzy Correlation Dimension for Speaker Recognition)

  • 유병욱;김창석;박현숙
    • 전자공학회논문지S
    • /
    • 제36S권1호
    • /
    • pp.115-122
    • /
    • 1999
  • 본 논문은 음성신호가 카오스 신호임을 확인하고 화자인식 파라미터로 사용하기 위해 상관차원을 분석하였다. 화자식별과 인식 향상을 위하여 개인의 성도특성을 매우 잘 나타내는 음성의 스트레인지 어트렉터를 구성하고 퍼지유사도를 상관차원에 적용하여 퍼지상관차원을 제안하였다. 퍼지상관차원은 어트렉터 구성점들의 상관관계글 퍼지상관적분으로 추정하고 공간차원에 따라 퍼지상관지수가 일정하게 수렴되는 차원값을 구하여 표준패턴 어트렉터와 시험패턴 어트렉터의 변동을 흡수하였다. 퍼지상관차원에 대해 화자와 표준패턴별로 식별오차의 평균값에 따른 거리를 추정함으로써 화자인식파라미터의 타당성을 검토하였다.

  • PDF

자동차 주행 환경에서의 화자인식 시스템 개발에 관한 연구 (A Study on Developing Speaker Recognition System In Driving Car Environment)

  • 양준영;장준혁;이창원;박기희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.934-936
    • /
    • 2017
  • 화자인식 기술은 등록된 화자 목록 내 화자 또는 사칭 화자의 발화로부터 발화자를 식별하는 기술로써, 음성 소스를 기반으로 동작하는 디바이스의 개인화를 위해 필요한 기술이다. 본 논문에서는 차량 잡음이 존재하는 자동차 주행 환경을 타겟으로 하는 화자인식 시스템 개발 방법을 제안한다. 차량 잡음에 의해 오염된 음성신호로부터 잡음 성분을 제거하기 위해 parametric multi-channel Wiener filter (PWMF)를 이용하여 실험한 결과, 남성화자 조건에서는 PMWF의 내부 파라미터 조절을 통해 필터를 minimum variance distortionless response (MVDR) 빔포머로 동작하도록 설정하였을 때, 여성화자 조건에서는 잡음을 제거하지 않았을 때 가장 낮은 동일오류율을 보임을 확인할 수 있었다.

홍채와 음성을 이용한 고도의 개인확인시스템 (Development of Advanced Personal Identification System Using Iris Image and Speech Signal)

  • 이대종;고현주;곽근창;전명근
    • 한국지능시스템학회논문지
    • /
    • 제13권3호
    • /
    • pp.348-354
    • /
    • 2003
  • 본 논문에서는 홍채인식과 화자식별 방법을 결합한 고도의 개인확인 시스템을 제안한다. 제안된 방법은 홍채인식과 화자식별의 장점만을 부각시켜 최종적으로 결정법칙에 의해 화자를 인식하는 구조로 되어 있으며, 특히 음성에 노이즈가 첨가된 환경하에서도 우수한 성능을 보일 수 있도록 시스템을 구성하였다. 제안된 알고리즘의 성능을 검증하기 위하여 실험한 결과, 보안의 정도가 높은 상급(High)에 해당하는 인식률은 홍채만을 이용한 경우보다 56.7%, 음성을 이용한 화자식별 방법만을 사용한 경우보다 10% 정도 인식률이 향상되었다. 또한 음성에 노이즈를 첨가한 경우에도 보안의 정도가 높은 상급(High)에 해당하는 인식률은 홍채만 이용한 경우보다 인식률이 30%, 노이즈가 첨가된 음성만 이용한 경우보다 60% 정도 향상된 인식률을 보였다.

지능형 반응공간을 위한 연속적 화자인식에 관한 연구 (A Study of Continuous Speaker Recognition for Intelligent Responsive Space)

  • 권순일
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.293-297
    • /
    • 2007
  • Human Computer Interaction 기술을 구체화 시키기 위한 Intelligent Responsive Space의 개발에 있어서 음성정보는 여러 가지로 유용하게 활용될 수 있다. 음성신호로부터 얻을 수 있는 다양한 정보 중의 하나가 화자인식을 이용한 화자의 신원식별이다. 이 논문에서는 화자인식 인식이 어려운 환경에서도 음성 신호로부터 추출한 특성벡터들을 선택적으로 사용함으로써 화자인식 성능을 높일 수 있는 새로운 방법을 제안하려 한다. 화자를 인식하는데 있어서 인식오류를 발생시킬 가능성이 높은 특성벡터들을 인식을 위한 판단의 대상에서 배제시킴으로써 성능을 향상시킬 수 있다. 실험결과에 의하면 0.25초에서2초 길이의 짧은 음성만으로도 기존의 방법에 비해 20에서 51%의 상대적 성능 향상을 보였다. 새롭게 제안된 방법을 적용하면 기존의 방법들에 비해 세밀하면서도 정확하게 연속적으로 화자들을 인식할 수 있게 된다.

  • PDF

독립성분 분석을 이용한 강인한 화자식별 (Robust Speaker Identification using Independent Component Analysis)

  • 장길진;오영환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권5호
    • /
    • pp.583-592
    • /
    • 2000
  • 본 논문에서는 독립성분분석을 이용한 음성의 특징 벡터 변환방법을 제안한다. 제안한 방법은 여러 환경에서 수집된 음성신호의 켑스트럼 벡터를 다수의 특징 함수들의 선형결합으로 가정하고, 독립성분분석을 이용하여 분리된 켑스트럼 벡터를 학습과 인식에 사용한다. 변환된 벡터 영역에서는 반복적으로 나타나는 화자의 특징 정보는 강조되고 임의로 나타나는 채널 왜곡은 억제되는 효과를 볼 수 있다. 제안된 방법의 유효성을 검증하기 위해 실제 전화음성으로 문장독립형 화자식별 실험을 수행하였으며, 결과를 통해 독립성분분석을 이용한 특징벡터의 변환이 채널 환경 변화에 대해 보다 강인함을 보였다.

  • PDF

경계 차감 클러스터링에 기반한 클러스터 개수 추정 화자식별 (Speaker Identification with Estimating the Number of Cluster Based on Boundary Subtractive Clustering)

  • 이윤정;최민정;서창우;한헌수
    • 한국음향학회지
    • /
    • 제26권5호
    • /
    • pp.199-206
    • /
    • 2007
  • 본 논문에서는 화자식별을 위한 특징벡터의 새로운 클러스터링 방법을 제안한다. 제안된 방법은 클러스터 센터에 대한 초기값 설정과 클러스터 개수에 대한 사전 정보 없이 클러스터링이 가능하다. 각 클러스터 센터는 경계 차감 클러스터링 알고리즘으로 한 번에 한 개의 클러스터 센터가 추가됨으로써 순차적으로 구해지며, 클러스터 개수는 클러스터간의 상호관계를 조사하여 결정된다. 인공 생성 데이터 및 TIMIT 음성을 이용하여 실험한 결과로부터 제안된 방법이 기존의 방법보다 우수함을 확인하였다.

화자인식을 위한 관측신뢰도 기반 변형된 HMM 디코더 (Modified HMM Decoder based on Observation Confidence for Speaker Identification)

  • ;민소희;김진영;나승유
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.443-446
    • /
    • 2007
  • 음성신호는 잡음 또는 전송 채널의 특성에 의하여 왜곡되고, 왜곡된 음성은 음성인식 및 화자인식의 성능을 크게 저하시킨다. 이러한 문제점을 극복하기 위해 본 논문에서는 Gaussian mixture model (GMM)에 적용된 신호대잡음비 (SNR)기반 신뢰도 가중 기법[1][2]을 Hidden Markov model(HMM) 디코더에 변형하여 적용하였다. HMM 디코더 변형은 HMM 상태별 관측확률을 논문 [1]에서 제시된 신뢰도로 가중함으로써 이루어졌다. 제안한 방법의 성능을 확인하기 위해 ETRI에서 만든 한국어 화자인식용 휴대폰 음성 DB를 사용하여 문맥종속 화자식별 실험을 하였다. 실험결과 기존 방법에 비해 제안한 방법의 화자인식률이 크게 향상됨을 확인 할 수 있었다.

  • PDF

앙상블 기법을 이용한 잡음 환경에서의 화자인식 방법에 관한 연구 (A Study on Noise-Robust Speaker Recognition Methods Based on Ensemble of Decision Scores)

  • 양준영;장준혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.457-459
    • /
    • 2018
  • 화자인식 기술은 주어진 임의의 두 발화로부터 발화자의 일치 여부를 판단하여 등록된 화자의 목록으로부터 임의로 입력된 발화의 발화자를 식별하는 기술이다. 그러나, 배경잡음이나 반향이 존재하는 경우에는 음성신호가 왜곡되어 화자인식 성능이 저하될 수 있기 때문에 별도의 음성신호 전처리 알고리즘을 함께 사용할 수 있다. 본 논문에서는 배경잡음이 존재하는 환경에서 다수의 마이크로폰을 통해 수집한 음성신호에 대해 화자인식을 수행하는 방법으로써 parametric multi-channel Wiener filter (PMWF)를 이용한 화자일치 점수 앙상블 기법을 제안한다. 입력신호의 신호대잡음비를 기준으로 점수 결합 시 사용되는 결합계수를 정하고, Wiener filter 로 잡음을 제거하여 얻은 점수와 minimum variance distortionless response (MVDR) 빔포머를 통해 잡음을 제거하여 얻은 정수를 가중결합하는 방식으로 동일오류율을 측정한 결과, 각 전처리 알고리즘을 독립적으로 사용하여 점수를 계산한 경우보다 우수한 성능을 보임을 확인할 수 있었다.

웨이블렛 필터뱅크에 기반을 둔 강인한 화자식별 기법 (A Robust Speaker Identification Method Based on the Wavelet Filter Banks)

  • 이대종;곽근창;유정웅;전명근
    • 정보처리학회논문지C
    • /
    • 제9C권4호
    • /
    • pp.459-466
    • /
    • 2002
  • 본 논문에서는 웨이블렛 서브밴드 필터링기법을 이용하여 다중의사 결정기법에 기반을 둔 잡음에 강인한 화자식별 알고리즘을 제안한다. 제안된 방법은 잡음이 첨가된 음성신호를 웨이블렛 서브밴드 필터뱅크를 이용하여 각 주파수 대역별로 신호를 분리한 후 개별적인 대역별로 인식 알고리즘을 수행하기 때문에 어떤 서브밴드에서의 노이즈 영향이 상대적으로 적으므로 대역제약된 형태로 주어지는 일반적인 주변잡음이 있는 환경하에서 우수한 성능을 보일 수 있도록 시스템을 구성하였다. 제안된 알고리즘은 화자인식 기법으로 널리 쓰이고 있는 벡터양자화 알고리즘만을 적용한 경우에 비해 15∼60%의 향상된 인식률을 보였다.

인공지능 기반의 말더듬 자동분류 방법: 합성곱신경망(CNN) 활용 (AI-based stuttering automatic classification method: Using a convolutional neural network)

  • 박진;이창균
    • 말소리와 음성과학
    • /
    • 제15권4호
    • /
    • pp.71-80
    • /
    • 2023
  • 본 연구는 말더듬 화자들의 음성 데이터를 기반으로 하여, 인공지능 기술을 활용한 말더듬 자동 식별 방법을 개발하는 것을 주목적으로 진행되었다. 특히, 한국어를 모국어로 하는 말더듬 화자들을 대상으로 CNN(convolutional neural network) 알고리즘을 활용한 식별기 모델을 개발하고자 하였다. 이를 위해 말더듬 성인 9명과 정상화자 9명을 대상으로 음성 데이터를 수집하고, Google Cloud STT(Speech-To-Text)를 활용하여 어절 단위로 자동 분할한 후 유창, 막힘, 연장, 반복 등의 라벨을 부여하였다. 또한 MFCCs(mel frequency cepstral coefficients)를 추출하여 CNN 알고리즘을 기반한 말더듬 자동 식별기 모델을 수립하고자 하였다. 연장의 경우 수집결과가 5건으로 나타나 식별기 모델에서 제외하였다. 검증 결과, 정확도는 0.96으로 나타났고, 분류성능인 F1-score는 '유창'은 1.00, '막힘'은 0.67, '반복'은 0.74로 나타났다. CNN 알고리즘을 기반한 말더듬 자동분류 식별기의 효과를 확인하였으나, 막힘 및 반복유형에서는 성능이 미흡한 것으로 나타났다. 향후 말더듬의 유형별 충분한 데이터 수집을 통해 추가적인 성능 검증이 필요함을 확인하였다. 향후 말더듬 화자의 발화 빅데이터 확보를 통해 보다 신뢰성 있는 말더듬 자동 식별 기술의 개발과 함께 이를 통한 좀 더 고도화된 평가 및 중재 관련 서비스가 창출되기를 기대해 본다.