• 제목/요약/키워드: 조건 사후 최대 확률

검색결과 8건 처리시간 0.021초

조건 사후 최대 확률과 음성 스펙트럼 변이 조건을 이용한 통계적 모델 기반의 음성 검출기 (A Statistical Model-Based Voice Activity Detection Employing the Conditional MAP Criterion with Spectral Deviation)

  • 김상균;장준혁
    • 한국음향학회지
    • /
    • 제30권6호
    • /
    • pp.324-329
    • /
    • 2011
  • 본 논문에서는 조건 사후 최대 확률 (conditional maximum a posteriori, CMAP)과 음성 스펙트럼 변이 조건을 기반으로 한 새로운 음성 검출기 (voice activity detection, VAD)를 제안한다. 제안된 음성 검출기는 통계적 모델을 기반으로 한 우도비 테스트 (likelihood ratio test, LRT)의 문턱값을 결정하는데 조건 사후 최대 확률과 스펙트럼 변이의 상태 값을 조건부 확률로 부과한다. 제안된 알고리즘을 다양한 잡음 환경에서 기존의 CMAP 기반의 음성 검출기와 비교한 결과 전체적으로 향상된 성능을 보였으며 특히 SNR이 낮은 조건에서 향상 폭이 컸다.

적응형 문턱값을 가지는 2차 조건 사후 최대 확률을 이용한 통계적 모델 기반의 음성 검출기 (Statistical Model-Based Voice Activity Detection Using the Second-Order Conditional Maximum a Posteriori Criterion with Adapted Threshold)

  • 김상균;장준혁
    • 한국음향학회지
    • /
    • 제29권1호
    • /
    • pp.76-81
    • /
    • 2010
  • 본 논문에서는 음성의 통계적 모델에 기반한 음성 검출기 (voice activity detection, VAD)의 성능 향상을 위해 2차 조건 사후 최대 확률 (second-order conditional maximum a posteriori, second-order CMAP)기법을 적용한 우도비 테스트 (likelihood ratio test, LRT)를 제안한다. 제안된 알고리즘은, 기존의 통계적 모델에 기반한 음성 검출기와 CMAP 기반의 음성 검출기를 분석한 다음, 직전 2 프레임에서 음성의 존재와 부재에 대한 조건부 확률에 따라 실시간으로 적응형 문턱값을 구하여 기하 평균한 우도비와 비교하는 음성검출 결정법 (decision rule)을 제시한다. 제안된 알고리즘을 비정상 (non-stationary) 잡음환경에서 기존의 통계적 모델에 기반한 음성 검출기, CMAP 기반의 음성 검출기와 비교하였으며, 향상된 성능을 보였다.

음성향상을 위한 2차 조건 사후 최대 확률기법 기반 Global Soft Decision (Improved Global-Soft Decision Incorporating Second-Order Conditional MAP for Speech Enhancement)

  • 금종모;장준혁
    • 한국통신학회논문지
    • /
    • 제34권6C호
    • /
    • pp.588-592
    • /
    • 2009
  • 본 논문에서는 기존의 global soft decision 방법에서 음성부재확률의 고정 파라미터에 2차 조건 사후 최대 확률기법을 적용한 음성 향상 기법을 제안한다. 기존의 global soft decision 방법은 음성부재확률을 구하기 위해 가정한 가설에 따라 파라미터값을 고정하여 다양한 음성 환경 변화에 민감한 점을 고려하여 본 논문에서 제안한 알고리즘은 기존의 고정 파라미터 값에 직전 2 프레임에서의 음성 존재와 부재에 대한 조건을 부여해주어 음성과 음성사이의 상호 연관성을 고려해주고, 보다 유동적으로 현재 프레임의 음성부재확률을 추정하는 음성향상 기법이다. 제안된 방법의 성능평가를 위해 ITU-T P.862 perceptual evaluation of speech quality (PESQ)를 이용하여 평가하였고, 그 결과 제안된 2차 조건 사후 최대 확률기법을 적용한 global soft decision 방법은 기존의 Global soft decision 방법보다 향상된 결과를 나타내었다.

2차 조건 사후 최대 확률 기반 최소값 제어 재귀평균기법을 이용한 음성향상 (Speech Enhancement based on Minima Controlled Recursive Averaging Technique Incorporating Second-order Conditional Maximum a posteriori Criterion)

  • 금종모;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.132-138
    • /
    • 2009
  • 본 논문에서는 기존의 Minima Controlled Recursive Averaging (MCRA)에 2차 조건 사후 최대 확률기법을 적용한 음성 향상 기법을 제안한다. 기존의 MCRA 방법은 현제 프레임의 음성 신호 존재 확률로 잡음 추정을 조정하기 때문에 음성 활동의 프레임간의 상호 연관성을 배제 하였다. 본 논문에서 제안한 알고리즘은 직전 2 프레임에서의 음성의 존재와 부재에 대한 조건을 부여해 주어 현제 프레임의 음성 신호 존재 확률을 수정하는 음성향상 기법을 적용한다. 제안된 2차 조건 사후 최대 확률기법을 적용한 MCRA 방법이 기존의 MCRA 방법보다 향상된 음성향상 결과를 나타내었다.

조건 사후 최대 확률 기반 최소값 제어 재귀평균기법을 이용한 음성향상 (Speech Enhancement Based on Minima Controlled Recursive Averaging Technique Incorporating Conditional MAP)

  • 금종모;박윤식;장준혁
    • 한국음향학회지
    • /
    • 제27권5호
    • /
    • pp.256-261
    • /
    • 2008
  • 본 논문에서는 기존의 최소값 제어 재귀 평균기법(minima controlled recursive averaging, MCRA) 알고리즘에 조건 사후 최대 확률 (maximun a posteriori, MAP)을 적용한 음성향상을 제안한다. 기존의 MCRA는 파워스펙트럼에 평균을 취하고 각 서브밴드에서 음성 신호 존재 확률로 조절하는 스무딩 매개변수를 사용한다. 본 논문에서 제안된 알고리즘은 현재 프레임에 들어온 신호가 이전 프레임에서의 음성의 존재와 부재에 대한 조건을 부여해 주어 음성 신호 존재확률을 수정하여 음성향상에 적용한다. 제안된 음성 향상은 ITU-T P.862 perceptual evaluation of speech quality (PESQ)와 주관적 음질평가를 이용하여 평가하였고 기존의 MCRA 방법보다 향상된 결과를 나타내었다.

음성/음악 분류 향상을 위한 2차 조건 사후 최대 확률기법 기반 SVM (Improving SVM with Second-Order Conditional MAP for Speech/Music Classification)

  • 임정수;장준혁
    • 대한전자공학회논문지SP
    • /
    • 제48권5호
    • /
    • pp.102-108
    • /
    • 2011
  • Support vector machine (SVM)은 패턴인식 분야에 많이 사용되어지고 있고 그 한 예로서 3GPP2 selectable mode vocoder(SMV)와 같은 규격화된 코덱에 쓰여 코덱의 음성/음악 분류 성능을 향상시킬 수 있다. 본 논문에서는 SVM을 개선시켜 음성/음악의 분류성능을 더욱 향상시키는 새로운 방법을 제안한다. 음성/음악신호의 각 프레임들은 서로 강한 상관관계를 가지고 있는데, 이를 바탕으로 2차 조건 사후 최대 확률기법을 SVM에 적용하여 음성/음악 분류성능을 향상시킨다. 또한 SVM을 학습시킬 때 적용되는 기존의 기법들과는 달리 제안되는 기법은 SVM이 패턴분류를 행할 때 사용된다. 그렇기 때문에 기존의 기법들과 독립적으로 개발되고 사용될 수 있고, 따라서 패턴분류의 성능을 한층 더 향상시킬 수 있다. 실험을 통해 제안된 기법의 독립성과 성능향상을 기존의 기법들과 비교하여 증명하였다.

적응적 베이즈 영상분할을 이용한 경계추출 (Boundary Detection using Adaptive Bayesian Approach to Image Segmentation)

  • 김기태;최윤수;김기홍
    • 한국측량학회지
    • /
    • 제22권3호
    • /
    • pp.303-309
    • /
    • 2004
  • 영상의 밝기값과 텍스쳐 모두를 사용하여 대상물의 경계를 보다 정확하게 추출할 수 있는 적응적 베이즈 영상 분할기법을 C 프로그래밍 언어로 개발하였다. 사전확률밀도함수를 추정하기 위하여 깁스 분포 모델을 적용하였고, 조건확률밀도함수를 추정하기 위하여 퍼지 C-군집화 기법을 도입하였다. 추정된 두 확률밀도함수로부터 최대 사후주변확률이 산출되었고, 이를 시뮬레이션영상에 적용하여 99% 이상의 신뢰도를 획득하였다. 또한 개발된 알고리즘을 1963년 미 정찰위성사진을 이용하여 제작한 남극 정사영상에 적용하여 남극 전체 해안선에 대하여 최대 300미터 정확도를 갖는 벡터지도를 제작하였다.

DINA 모형에서 응시생 분류 정확성에 영향을 미치는 요인 탐구 : 응시생 분류방법을 중심으로 (A Study on the Factors Affecting Examinee Classification Accuracy under DINA Model : Focused on Examinee Classification Methods)

  • 김지효
    • 한국산학기술학회논문지
    • /
    • 제14권8호
    • /
    • pp.3748-3759
    • /
    • 2013
  • 본 연구의 목적은 DINA(deterministic-input, noisy "and" gate)모형에서 최대우도(maximum likelihood: ML), 최대사후확률(maximum a posteriori: MAP), 사후기대(expected a posteriori: EAP)방법들의 분류 정확성이 어느 정도인가를 알아보는 것이다. 연구 목적을 달성하기 위하여 다양한 모의실험 조건들[인지요소의 수(K= 5, 7), 응시생 능력분포(고능력, 중간능력, 저능력 집단), 검사 길이(J= 15, 30, 45)]에 따라 모의자료를 생성했다. 응시생 분류 정확성을 평가하기 위한 준거로 참 인지요소(true ${\alpha}$)와 ML, MAP, EAP방법으로 추정된 인지요소가 어느 정도 일치하는지를 계산했다. 본 연구의 주요결과를 요약하면 다음과 같다. 첫째, 본 연구에서 설정한 검사 조건에서 ML, MAP방법보다 EAP방법의 정확일치도 평균이 높았다. 둘째, 다른 검사 조건이 동일할 때, 인지요소의 수가 증가하면 ML, MAP, EAP방법 모두에서 정확일치도 평균이 낮아졌다. 셋째, 동일한 검사 길이에서 사전분포로 고능력, 중간능력, 저능력 집단을 각각 가정했을 때 ML, MAP방법보다 EAP방법의 정확일치도 평균이 높았다. 넷째, 동일한 응시생 능력분포에서 검사 길이가 증가하면 ML, MAP, EAP방법 모두에서 정확일치도 평균이 높아졌다. 인지요소의 수에 따라 응시생을 정확하게 분류하기 위한 적절한 검사 길이를 보면, 인지요소의 수가 5, 7개이고 이에 대응하는 검사 길이가 각각 30, 45문항일 때 본 연구에서 설정한 높은 분류 정확성 기준에 부합하는 것으로 나타났다.