• 제목/요약/키워드: Bayesian information criterion(BIC)

검색결과 40건 처리시간 0.02초

PERFORMANCE EVALUATION OF INFORMATION CRITERIA FOR THE NAIVE-BAYES MODEL IN THE CASE OF LATENT CLASS ANALYSIS: A MONTE CARLO STUDY

  • Dias, Jose G.
    • Journal of the Korean Statistical Society
    • /
    • 제36권3호
    • /
    • pp.435-445
    • /
    • 2007
  • This paper addresses for the first time the use of complete data information criteria in unsupervised learning of the Naive-Bayes model. A Monte Carlo study sets a large experimental design to assess these criteria, unusual in the Bayesian network literature. The simulation results show that complete data information criteria underperforms the Bayesian information criterion (BIC) for these Bayesian networks.

환경음 인식을 위한 GMM의 혼합모델 개수 추정 (Estimation of Optimal Mixture Number of GMM for Environmental Sounds Recognition)

  • 한다정;박아론;백성준
    • 한국산학기술학회논문지
    • /
    • 제13권2호
    • /
    • pp.817-821
    • /
    • 2012
  • 본 논문에서는 환경음 인식에 GMM(Gaussain mixture model)을 이용할 때 MDL(minimum description length)와 BIC(Bayesian information criterion) 모델선택 기준을 이용하여 최적의 혼합모델 개수를 결정하는 방법에 대해 다루었다. 실험은 모두 9가지 종류의 환경음으로부터 12차 MFCC(mel-frequency cepstral coefficients) 특징 27747개를 추출하고 이를 GMM으로 분류하였다. 각 환경음 클래스의 최적 혼합모델 개수를 추정 하기위해 MDL과 BIC를 적용하고 그 결과를 고정 개수의 혼합모델을 사용한 경우와 비교하였다. 실험 결과에 따르면 혼합모델 선택 방법을 적용한 경우가 그렇지 않은 경우에 비해 거의 유사한 인식성능을 유지하면서 계산복잡도는 BIC와 MDL를 통해 각각 17.8%와 31.7%가 감소하는 것을 확인하였다. 이는 GMM을 이용한 환경음 인식에서 BIC와 MDL 적용을 통해 계산복잡도를 효과적으로 감소시킬 수 있음을 보여준다.

Bayesian information criterion accounting for the number of covariance parameters in mixed effects models

  • Heo, Junoh;Lee, Jung Yeon;Kim, Wonkuk
    • Communications for Statistical Applications and Methods
    • /
    • 제27권3호
    • /
    • pp.301-311
    • /
    • 2020
  • Schwarz's Bayesian information criterion (BIC) is one of the most popular criteria for model selection, that was derived under the assumption of independent and identical distribution. For correlated data in longitudinal studies, Jones (Statistics in Medicine, 30, 3050-3056, 2011) modified the BIC to select the best linear mixed effects model based on the effective sample size where the number of parameters in covariance structure was not considered. In this paper, we propose an extended Jones' modified BIC by considering covariance parameters. We conducted simulation studies under a variety of parameter configurations for linear mixed effects models. Our simulation study indicates that our proposed BIC performs better in model selection than Schwarz's BIC and Jones' modified BIC do in most scenarios. We also illustrate an example of smoking data using a longitudinal cohort of cancer patients.

Multiple Change-Point Estimation of Air Pollution Mean Vectors

  • Kim, Jae-Hee;Cheon, Sooy-Oung
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.687-695
    • /
    • 2009
  • The Bayesian multiple change-point estimation has been applied to the daily means of ozone and PM10 data in Seoul for the period 1999. We focus on the detection of multiple change-points in the ozone and PM10 bivariate vectors by evaluating the posterior probabilities and Bayesian information criterion(BIC) using the stochastic approximation Monte Carlo(SAMC) algorithm. The result gives 5 change-points of mean vectors of ozone and PM10, which are related with the seasonal characteristics.

모델의 사전 확률 추정을 이용한 HMM 구조의 최적화 (HMM Topology Optimization using Model Prior Estimation)

  • 하진영;박미나
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.325-327
    • /
    • 2001
  • 본 논문은 온라인 문자 인식을 연속 밀도 HMM의 구조의 최적화 문제를 다룬다. 최적이란 최소한의 모델 파라미터를 사용하여 최소한의 오류를 허용하는 것이라고 정의할 수 있다. 본 연구에서는 HMM 구조의 최적화를 위해 Bayesian 모델 선택 방법론을 사용한다. 먼저 잘 알려진 BIC(Bayesian Information Criterion)을 적용해보고, 그것을 HMM의 복잡한 구조에 적합하도록 본 논문에서 제안한 HBIC(HMM-Oriented BIC)와 비교해본다. BIC는 모델의 사전 확률 분포를 추정하지 않고 다변량 정규분포라고 가정하는데 비해 HBIC는 모델의 각 파라미터로부터 사전 확률을 추정한 후 그것들을 사용함으로써 더 좋은 결과를 얻도록 한다. 실험 결과 BIC와 HBIC 둘 다 기존 방법보다 모델의 파라미터 수를 현저히 감소시킴을 확인했고, HBIC가 BIC에 비해 더 적은 수의 파라미터를 사용해도 비슷한 인식률을 얻을 수 있었다.

  • PDF

텔레매틱스 환경에서 화자인증을 이용한 VoIP기반 음성 보안통신 (VoIP-Based Voice Secure Telecommunication Using Speaker Authentication in Telematics Environments)

  • 김형국;신동
    • 한국ITS학회 논문지
    • /
    • 제10권1호
    • /
    • pp.84-90
    • /
    • 2011
  • 본 논문은 텔레매틱스 환경에서 문장독립형 화자인증을 이용한 VoIP 음성 보안통신기술을 제안한다. 보안통신을 위해 송신측에서는 화자의 음성정보로부터 생성된 공개키를 통해 음성 패킷을 암호화하여 수신측에 전송함으로써 중간자 공격에 대항한다. 수신측에서는 수신된 암호화된 음성패킷을 복호화한 후에 추출된 음성 특징과 송신측으로부터 수신받은 음성키를 비교하여 화자인증을 수행한다. 제안된 방식에서는 Gaussian Mixture Model(GMM)-supervector를 Bayesian information criterion (BIC) 방식과 Mahalanobis distance (MD) 방식을 이용한 Support Vector Machine (SVM) 커널에 적용하여 문장독립형 화자인증 정확도를 향상시켰다.

HBIC와 BIC_Anti 기준을 이용한 HMM 구조의 최적화 (HMM Topology Optimization using HBIC and BIC_Anti Criteria)

  • 박미나;하진영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권9호
    • /
    • pp.867-875
    • /
    • 2003
  • 본 논문에서는 연속 밀도 HMM 구조의 최적화 문제를 다룬다. HMM 구조의 최적화를 위해 여러 연구가 있었는데, 그 중에서도 잘 알려진 BIC(Bayesian Information Citerion)등과 같이 이미 제안된 모델 선택 기준은 동질의 파라미터를 갖는 데이타에 대해 통계적으로 잘 행동하는 모델을 가정하고 있어서 연속 밀도 HMM 등과 같이 복잡한 파라미터를 갖는 구조에는 적합하지 않고, 파라미터 수를 줄이는데는 어느 정도 효과가 있었으나 인식률 향상에 있어서는 한계를 보였다. 이에 본 논문에서는 HMM의 파라미터 유형에 따라 별도의 확률 밀도를 추정하여 사전 모델 확률(a priori model probability)로 사용하는 모델 선택 기준인 HBIC(HMM-oriented BIC)를 제안했다. 또한 HMM의 변별력을 높이기 위해 변별력 특성을 갖는 안티확률을 BIC와 결합한 새로운 모델 선택 기준인 BIC_Anti를 제안했다. 제안한 모델 선택 기준의 유용성을 검증하기 위해 온라인 필기 데이타를 대상으로 실험하여 기존의 연구와 비교하였다. 그 결과 제안한 HBIC와 BIC_Anti 모델 선택 기준을 사용하는 것이 BIC를 사용하는 것보다 더 적은 파라미터 수로도 향상된 인식률을 얻을 수 있음을 확인했다.

Temporal 데이터의 최적의 클러스터 수 결정에 관한 연구 (A Study for Determining the Best Number of Clusters on Temporal Data)

  • 조영희;이계성;전진호
    • 한국콘텐츠학회논문지
    • /
    • 제6권1호
    • /
    • pp.23-30
    • /
    • 2006
  • Temporal 데이터의 클러스터링 방법론 중의 하나로 모델기반 방법론이 있다. 이는 각 클러스터에 대하여 오토마타기반의 모델을 가정하는 것이다. 개별 모델을 추출하기 위해서는 먼저 전체 데이터에 대한 적합한 모델을 찾는 것이 필요하다. 전체에 대한 모델은 데이터집합에 대한 최적의 클러스터의 수를 결정함으로 개별 모델 구축의 준비를 완료한다. 본 연구에서는 클러스터 수를 결정하기 위한 기준인 베이지안 정보기준(BIC : Bayesian Information Criterion) 근사법의 활용도를 검증하고 데이터 크기와 BIC 값의 상관관계를 파악함으로 탐색 효율을 높이는 방안을 제안한다. 실험에서는 인위적 모델을 통하여 생성된 인공적인 여러 형태의 데이터집합을 활용하여 BIC근사 측도의 활용성에 대해 살펴보았다. 실험결과에서 보여주는 것처럼 BIC 근사 측도는 데이터의 크기가 비교적 클 경우에 올바른 파티션의 사이즈를 추정함을 확인하였다.

  • PDF

On Information Criteria in Linear Regression Model

  • Park, Man-Sik
    • 응용통계연구
    • /
    • 제22권1호
    • /
    • pp.197-204
    • /
    • 2009
  • In the model selection problem, the main objective is to choose the true model from a manageable set of candidate models. An information criterion gauges the validity of a statistical model and judges the balance between goodness-of-fit and parsimony; "how well observed values ran approximate to the true values" and "how much information can be explained by the lower dimensional model" In this study, we introduce some information criteria modified from the Akaike Information Criterion (AIC) and the Bayesian Information Criterion(BIC). The information criteria considered in this study are compared via simulation studies and real application.

주가 운동양태 예측을 위한 예측 모델결정에 관한 연구 (A Study on Determining the Prediction Models for Predicting Stock Price Movement)

  • 전진호;조영희;이계성
    • 한국콘텐츠학회논문지
    • /
    • 제6권6호
    • /
    • pp.26-32
    • /
    • 2006
  • 주식투자의 대중화, 관심의 증가에 따라 주가예측의 중요성이 증대되고 있다. 주가의 변화는 어떤 경향이나 패턴에 의해 움직인다고 가정할 때, 과거의 주가분석을 통해 이들의 변화를 잘 설명할 수 있는 모델의 구성이 가능할 것이다. 동적인 현상을 반영하는 최적의 모델이 구성된다면 이를 통해 향후의 일정기간의 주가의 운동양태의 예측이 가능할 것이다. 본 연구에서는 주가와 같은 템포랄(temporal) 데이터를 잘 설명할 수 있는 모델결정에 대한 방법론으로서 오토마타 기반의 모델을 가정한다. 모델의 최적 상태 수를 결정하기 위한 기준으로서 베이지안정보기준(BIC : Bayesian Information Criterion) 근사법을 사용한다. 베이지안정보기준의 유효성을 살펴보고 베이지안정보기준을 실제 주가데이터 모델의 상태 수 결정과정에 적용하여 모델을 생성한 후 결정된 모델을 통하여 일정 기간의 일별주가곡선의 운동양태를 예측한다. 실제의 주가곡선에 적용하여 모델의 유효성을 확인하였고 예측 주가곡선의 운동양태가 실제 주가 곡선과 유사함을 확인하였다.

  • PDF