• 제목/요약/키워드: 기동어 인식

검색결과 3건 처리시간 0.014초

Deep neural network-hidden Markov model 하이브리드 구조의 모델을 사용한 사용자 정의 기동어 인식 시스템에 관한 연구 (A study on user defined spoken wake-up word recognition system using deep neural network-hidden Markov model hybrid model)

  • 윤기무;김우일
    • 한국음향학회지
    • /
    • 제39권2호
    • /
    • pp.131-136
    • /
    • 2020
  • 음성 인식기를 대기모드에서 동작 모드로 전환하기 위해 발화하는 짧은 단어를 기동어(Wake Up Word, WUW)라고 하며, 음성 인식기를 실제로 사용하는 사용자가 지정한 기동어를 사용자 정의 기동어라고 한다. 본 논문에서는 이러한 사용자 정의 기동어를 인식하기 위해 기존의 Gaussian Mixture Model-Hidden Markov Model(GMM-HMM) 기반의 시스템, Linear Discriminant Analysis(LDA)를 적용한 LDA-GMM-HMM 기반의 시스템과, LDA-GMM-HMM 모델에서 GMM을 Deep Neural Network(DNN)로 대체한 LDA-DNN-HMM 기반의 시스템을 제작하고 각 시스템의 사용자 정의 기동어 인식 성능 및 비기동어 거절 성능을 비교한다. 또한 기동어 인식기의 체감 성능을 향상시키고자 각 모델에 threshold를 적용하여 기동어 인식 실패율을 약 10 % 수준으로 감소 시킨 후에 비기동어(non-WUW)의 거절 실패율을 비교 평가한다. Threshold 적용시에 LDA-DNN-HMM 기반의 시스템의 경우 기동어 인식 실패율 9.84 % 수준에서 비기동어 거절 실패율이 0.0058 %의 인식 성능을 나타내어 LDA-GMM-HMM 시스템 보다 약 4.82배 향상된 비기동어 거절 성능을 나타낸다. 이러한 결과는 본 논문에서 제작한 LDA-DNN-HMM 모델이 사용자 정의 기동어 인식 시스템을 구축하는데 효과적임을 입증한다.

잡음 환경에 강인한 기동어 검출을 위한 삼중항 손실 기반 도메인 적대적 훈련 (Triplet loss based domain adversarial training for robust wake-up word detection in noisy environments)

  • 임형준;정명훈;김회린
    • 한국음향학회지
    • /
    • 제39권5호
    • /
    • pp.468-475
    • /
    • 2020
  • 단어의 특성을 잘 표현하는 음성 단어 임베딩은 기동어 인식에서 중요한 역할을 한다. 하지만 기동어 인식이 수행되는 환경에서 필연적으로 발생하는 다양한 종류의 잡음으로 인해 음성 단어 임베딩의 표현 능력이 손상될 수 있으며, 인식 성능의 저하를 초래할 수 있다. 본 논문에서는 음성 단어 임베딩에 영향을 줄 수 있는 환경적인 요인을 완화시키는 삼중항 손실 기반의 도메인 적대적 훈련 방식을 제안한다. 잡음 환경에서의 기동어 검출 실험을 통해 제안하는 방식이 기존의 도메인 적대적 훈련 방식을 효과적으로 개선하는 모습을 확인할 수 있었고, 잡음 환경에서의 기동어 검출을 위해 기존에 제안된 다른 방법과의 결합을 통해 제안하는 방식의 확장성을 확인할 수 있었다.

문자 인식에서의 Fuzzy Membership Function

  • 양순성;남기동;김영종;이균하
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1990년도 제2회 한글 및 한국어정보처리 학술대회
    • /
    • pp.191-198
    • /
    • 1990
  • 본 논문에서는 문서 자동 인식 시스템에서 다중 카테고리로 모호하게 인식되어 질 수 있는 조합 심볼을 하나의 메타 심볼로 간주하고, 이 심볼을 fuzzy set theory에 기초를 두어 분석을 하였다. 분석 과정에서는 메타 심볼이 갖는 프리미티브들의 기울기와 길이, 프리미티브들간의 연결 및 프리미티브의 위치등의 어트리뷰트들을 이용하였다. 모호성을 내재하고 있는 메타 심볼들을 ACS(Ambiguous Category Set)의 원소로 간주하였으며, ACS의 원소들은 모호성의 원인을 제공하는 부분패턴들을 공동으로 포함하고 있다. 부분패턴을 구성하고 있는 프리미티브를 분리하여 어트리뷰트 값을 측정하고, 정의한 MF(Membership 함수)의 파라메터로 사용하였다. MF에서 얻어진 MFV(Membership Function Value)는 모호한 메타 심볼이 어떤 카테고리로 분류될 수 있는지를 나타내도록 하였다.

  • PDF