• 제목/요약/키워드: Bayesian hypotheses

검색결과 36건 처리시간 0.021초

A tutorial on generalizing the default Bayesian t-test via posterior sampling and encompassing priors

  • Faulkenberry, Thomas J.
    • Communications for Statistical Applications and Methods
    • /
    • 제26권2호
    • /
    • pp.217-238
    • /
    • 2019
  • With the advent of so-called "default" Bayesian hypothesis tests, scientists in applied fields have gained access to a powerful and principled method for testing hypotheses. However, such default tests usually come with a compromise, requiring the analyst to accept a one-size-fits-all approach to hypothesis testing. Further, such tests may not have the flexibility to test problems the scientist really cares about. In this tutorial, I demonstrate a flexible approach to generalizing one specific default test (the JZS t-test) (Rouder et al., Psychonomic Bulletin & Review, 16, 225-237, 2009) that is becoming increasingly popular in the social and behavioral sciences. The approach uses two results, the Savage-Dickey density ratio (Dickey and Lientz, 1980) and the technique of encompassing priors (Klugkist et al., Statistica Neerlandica, 59, 57-69, 2005) in combination with MCMC sampling via an easy-to-use probabilistic modeling package for R called Greta. Through a comprehensive mathematical description of the techniques as well as illustrative examples, the reader is presented with a general, flexible workflow that can be extended to solve problems relevant to his or her own work.

MCE 학습 알고리즘을 이용한 문장독립형 화자식별의 성능 개선 (Performance Improvement of a Text-Independent Speaker Identification System Using MCE Training)

  • 김태진;최재길;권철홍
    • 대한음성학회지:말소리
    • /
    • 제57호
    • /
    • pp.165-174
    • /
    • 2006
  • In this paper we use a training algorithm, MCE (Minimum Classification Error), to improve the performance of a text-independent speaker identification system. The MCE training scheme takes account of possible competing speaker hypotheses and tries to reduce the probability of incorrect hypotheses. Experiments performed on a small set speaker identification task show that the discriminant training method using MCE can reduce identification errors by up to 54% over a baseline system trained using Bayesian adaptation to derive GMM (Gaussian Mixture Models) speaker models from a UBM (Universal Background Model).

  • PDF

Bayesian HMM 기반의 건강 상태 분류 및 예측 (Health State Clustering and Prediction Based on Bayesian HMM)

  • 신봉기
    • 정보과학회 논문지
    • /
    • 제44권10호
    • /
    • pp.1026-1033
    • /
    • 2017
  • 본 논문은 계층적 디리슐레 과정(HDP)과 은닉 마르코프 모형(HMM)이 결합된 베이스 통계학적 방법과 HMM의 상태 지속 정보를 이용한 건강 상태 예측 방법을 제안한다. HDP-HMM은 베이스 방법의 HMM 확장 모형으로서 건강의 동적 특성을 고려하여 불확실하고 가늠하기조차도 어려운 건강 상태의 수를 추정할 수 있게 해준다. 모의 데이터와 실제 건건 검진 데이터를 이용한 시험을 통하여 흥미 있는 행동 특성을 볼 수 있었으며 최대 5년까지로 제한한 미래 예측도 충분한 가능함을 확인하였다. 미래는 불확실하며 예측 문제는 본질적으로 어렵다. 그러나 본 연구의 실험 결과로 동적인 문맥 하에서 다중 후보 가설을 제시함으로서 실용 가능한 건강상태의 장기 예측이 가능하다는 것을 읽을 수 있었다.

클러터 환경에서 표적 추적을 위한 다중 가설 추적 알고리듬의 성능 예측 (Performance Prediction of the MHT Algorithm for Tracking under Cluttered Environments)

  • 정영헌
    • 전자공학회논문지SC
    • /
    • 제41권4호
    • /
    • pp.13-20
    • /
    • 2004
  • 본 논문에서는 표적 추적에 널리 사용되는 다중 가설 추적(MHT: Multiple Hypothesis Tracking) 알고리듬의 추적 성능을 예측할 수 있는 방법을 제시한다. MHT 알고리듬은 최적의 베이시안 필터로서, 측정된 데이터를 기초로 가능한 가설들을 구성하고, 각 가설들의 확률을 구하게 된다. 모든 측정치들은 관심 있는 실제 표적에서 기인할 수 있을 뿐만 아니라, 새로운 표적이거나 표적이외의 거짓에서 발생할 수도 있다는 사건을 고려하고 있기 때문에 다른 여러 추적 필터에 비해 MHT 알고리듬은 우수한 추적성능을 가지고 있다고 알려져 있다. 측정 데이터와 무관하게 추적기의 성능을 표현하기 위해서 HYCA(Hybrid Conditional Average)방법을 이용하여 MHT 알고리듬에서 발생하는 모든 가설 확률의 기대 값을 구한 후, 이를 이용하여 성능을 예측하는 방법을 제시한다. 수치실험을 통하여 이 논문에서 제시한 성능 예측이 타당함을 보인다.

Multiple Comparisons for a Bivariate Exponential Populations Based On Dirichlet Process Priors

  • Cho, Jang-Sik
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권2호
    • /
    • pp.553-560
    • /
    • 2007
  • In this paper, we consider two components system which lifetimes have Freund's bivariate exponential model with equal failure rates. We propose Bayesian multiple comparisons procedure for the failure rates of I Freund's bivariate exponential populations based on Dirichlet process priors(DPP). The family of DPP is applied in the form of baseline prior and likelihood combination to provide the comparisons. Computation of the posterior probabilities of all possible hypotheses are carried out through Markov Chain Monte Carlo(MCMC) method, namely, Gibbs sampling, due to the intractability of analytic evaluation. The whole process of multiple comparisons problem for the failure rates of bivariate exponential populations is illustrated through a numerical example.

  • PDF

베이지언 문서분류시스템을 위한 능동적 학습 기반의 학습문서집합 구성방법 (An Active Learning-based Method for Composing Training Document Set in Bayesian Text Classification Systems)

  • 김제욱;김한준;이상구
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권12호
    • /
    • pp.966-978
    • /
    • 2002
  • 기계학습 기법을 이용한 문서분류시스템의 정확도를 결정하는 요인 중 가장 중요한 것은 학습문서 집합의 선택과 그것의 구성방법이다. 학습문서집합 선택의 문제란 임의의 문서공간에서 보다 정보량이 큰 적은 양의 문서집합을 골라서 학습문서로 채택하는 것을 말한다. 이렇게 선택한 학습문서집합을 재구성하여 보다 정확도가 높은 문서분류함수를 만드는 것이 학습문서집합 구성방법의 문제이다. 전자의 문제를 해결하는 대표적인 알고리즘이 능동적 학습(active learning) 알고리즘이고, 후자의 경우는 부스팅(boosting) 알고리즘이다. 본 논문에서는 이 두 알고리즘을 Naive Bayes 문서분류 알고리즘에 적응해보고, 이때 생기는 여러 가지 특징들을 분석하여 새로운 학습문서집합 구성방법인 AdaBUS 알고리즘을 제안한다. 이 알고리즘은 능동적 학습 알고리즘의 아이디어를 이용하여 최종 문서분류함수룰 만들기 위해 임시로 만든 여러 임시 문서분류함수(weak hypothesis)들 간의 변이(variance)를 높였다. 이를 통해 부스팅 알고리즘이 효과적으로 구동되기 위해 필요한 핵심 개념인 교란(perturbation)의 효과를 실현하여 문서분류의 정확도를 높일 수 있었다. Router-21578 문서집합을 이용한 경험적 실험을 통해, AdaBUS 알고리즘이 기존의 알고리즘에 비해 Naive Bayes 알고리즘에 기반한 문서분류시스템의 정확도를 보다 크게 향상시킨다는 사실을 입증한다.