• 제목/요약/키워드: 시퀀스 확률비 테스트

검색결과 3건 처리시간 0.018초

화자 확인에서 SPRT를 위한 새로운 테스트 데이터 생성 (A New Teat Data Generation for SPRT in Speaker Verification)

  • 서창우;이기용
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.42-47
    • /
    • 2003
  • 본 논문에서 제안하는 방법은 화자 확인 (speaker verification)에서 시퀀스 확률비 테스트 (SPRT: sequential probability ratio test)를 위한 시작 프레임의 샘플 시프트를 이용해서 새로운 테스트 데이터를 생성하는 방법이다. SPRT는 테스트 계산량을 줄일 수 있는 효과적인 알고리즘이다. 그러나 테스트의 결정과정에서 SPRT 방법은 입력신호가 확률밀도 함수로부터 독립적이고 균일하게 분포되어 있다는 가정하에 수행할 수 있으며, 또한 발성길이가 짧은 데이터에는 적용하기에 적절하지 못하다. 제안한 방법은 시작 프레임의 샘플 시프트를 통한 새로운 테스트 데이터를 생성하는 방법이기 때문에 테스트 데이터의 길이에 상관없이 SPRT를 수행할 수 있다. 또한 SPRT 방법에서 고려해야 하는 데이터의 상관성은 주성분 분석(principal component analysis)을 이용함으로써 효과적으로 제거하였다. 실험 결과 제안한 방법은 기존의 방법보다 샘플시프트를 위한 데이터의 계산량은 약간 증가하였지만, 등가오류율 (EER: equal error rate)에서 평균0.7%이상 좋은 성능결과를 보였다.

PDA 환경에서 자동화자 확인의 계산량 개선을 위한 연구 (A Study for Complexity Improvement of Automatic Speaker Verification in PDA Environment)

  • 서창우;임영환;전성채;장남영
    • 융합신호처리학회논문지
    • /
    • 제10권3호
    • /
    • pp.170-175
    • /
    • 2009
  • 본 논문은 PDA 디바이스에서 개인정보를 보호하기 위한 자동화자확인 시스템을 제안한다. 최근 M-커머스와 같은 모바일 환경을 위한 PDA의 용량이 확장되고 사용이 증가되고 있다. 그러나 너무 많은 계산량 때문에 PDA 디바이스에서 자동화자확인의 실질적인 응용은 여전히 많은 어려움이 존재한다. 본 논문에서는 이러한 문제점을 해결하기 위해서 음성발성 동안 스펙트럼 차감법과 음성 검출과 같은 전처리를 수행함으로써 계산량을 줄일 수 있는 방법을 적용하였다. 또한 빠른 처리 결과를 얻기 위한 은닉마코프모델의 최적 상태 정합과 시퀀스 확률비 테스트를 적용하였다. 전체적인 시스템은 PDA디바이스의 제한된 메모리와 낮은 CPU 속도에 적합하도록 간결하게 구현하였다.

  • PDF

적대적 생성 모델을 활용한 사용자 행위 이상 탐지 방법 (Anomaly Detection for User Action with Generative Adversarial Networks)

  • 최남웅;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.43-62
    • /
    • 2019
  • 한때, 이상 탐지 분야는 특정 데이터로부터 도출한 기초 통계량을 기반으로 이상 유무를 판단하는 방법이 지배적이었다. 이와 같은 방법론이 가능했던 이유는 과거엔 데이터의 차원이 단순하여 고전적 통계 방법이 효과적으로 작용할 수 있었기 때문이다. 하지만 빅데이터 시대에 접어들며 데이터의 속성이 복잡하게 변화함에 따라 더는 기존의 방식으로 산업 전반에 발생하는 데이터를 정확하게 분석, 예측하기 어렵게 되었다. 따라서 기계 학습 방법을 접목한 SVM, Decision Tree와 같은 모형을 활용하게 되었다. 하지만 지도 학습 기반의 모형은 훈련 데이터의 이상과 정상의 클래스 수가 비슷할 때만 테스트 과정에서 정확한 예측을 할 수 있다는 특수성이 있고 산업에서 생성되는 데이터는 대부분 정답 클래스가 불균형하기에 지도 학습 모형을 적용할 경우, 항상 예측되는 결과의 타당성이 부족하다는 문제점이 있다. 이러한 단점을 극복하고자 현재는 클래스 분포에 영향을 받지 않는 비지도 학습 기반의 모델을 바탕으로 이상 탐지 모형을 구성하여 실제 산업에 적용하기 위해 시행착오를 거치고 있다. 본 연구는 이러한 추세에 발맞춰 적대적 생성 신경망을 활용하여 이상 탐지하는 방법을 제안하고자 한다. 시퀀스 데이터를 학습시키기 위해 적대적 생성 신경망의 구조를 LSTM으로 구성하고 생성자의 LSTM은 2개의 층으로 각각 32차원과 64차원의 은닉유닛으로 구성, 판별자의 LSTM은 64차원의 은닉유닛으로 구성된 1개의 층을 사용하였다. 기존 시퀀스 데이터의 이상 탐지 논문에서는 이상 점수를 도출하는 과정에서 판별자가 실제데이터일 확률의 엔트로피 값을 사용하지만 본 논문에서는 자질 매칭 기법을 활용한 함수로 변경하여 이상 점수를 도출하였다. 또한, 잠재 변수를 최적화하는 과정을 LSTM으로 구성하여 모델 성능을 향상시킬 수 있었다. 변형된 형태의 적대적 생성 모델은 오토인코더의 비해 모든 실험의 경우에서 정밀도가 우세하였고 정확도 측면에서는 대략 7% 정도 높음을 확인할 수 있었다.