• 제목/요약/키워드: Bayes Factor

검색결과 154건 처리시간 0.025초

Bayesian Analysis for a Functional Regression Model with Truncated Errors in Variables

  • Kim, Hea-Jung
    • Journal of the Korean Statistical Society
    • /
    • 제31권1호
    • /
    • pp.77-91
    • /
    • 2002
  • This paper considers a functional regression model with truncated errors in explanatory variables. We show that the ordinary least squares (OLS) estimators produce bias in regression parameter estimates under misspecified models with ignored errors in the explanatory variable measurements, and then propose methods for analyzing the functional model. Fully parametric frequentist approaches for analyzing the model are intractable and thus Bayesian methods are pursued using a Markov chain Monte Carlo (MCMC) sampling based approach. Necessary theories involved in modeling and computation are provided. Finally, a simulation study is given to illustrate and examine the proposed methods.

Bayesian Parameter :Estimation and Variable Selection in Random Effects Generalised Linear Models for Count Data

  • Oh, Man-Suk;Park, Tae-Sung
    • Journal of the Korean Statistical Society
    • /
    • 제31권1호
    • /
    • pp.93-107
    • /
    • 2002
  • Random effects generalised linear models are useful for analysing clustered count data in which responses are usually correlated. We propose a Bayesian approach to parameter estimation and variable selection in random effects generalised linear models for count data. A simple Gibbs sampling algorithm for parameter estimation is presented and a simple and efficient variable selection is done by using the Gibbs outputs. An illustrative example is provided.

정규확률변수 관측치열에 대한 베이지안 변화점 분석 : 서울지역 겨울철 평균기온 자료에의 적용 (Bayesian Change Point Analysis for a Sequence of Normal Observations: Application to the Winter Average Temperature in Seoul)

  • 김경숙;손영숙
    • 응용통계연구
    • /
    • 제17권2호
    • /
    • pp.281-301
    • /
    • 2004
  • 본 논문에서는 일변량 정규분포를 따르는 확률변수의 관측치열에 대한 변화점 문제(change point problem)를 고찰한다. 변화점의 존재유무, 그리고 만일 변화점이 존재한다면 어떠한 유형으로 발생했는지 즉, 변화점 발생 이후로 평균만 변화, 분산만 변화, 또는 평균과 분산 모두가 변화했는지를 밝힌다. 가능한 여러 유형의 변화모형들 가운데 최적의 모형을 선택하기 위해 베이지안 모형선택 기법을 이용하고, 선택된 모형에 내재된 모수를 추정 하기 위해 메트로폴리스-혜스팅스 알고리 즘을 포함한 깁스샘플링 을 이용한다. 이러한 방법론은 모의실험을 통해 검토되고, 또한 서울지역의 겨울철 평균기온 자료에 적용된다.

전방신호기가 교통사고에 미치는 영향 연구 (Impacts of Pre-signals on Traffic Crashes at 4-leg Signalized Intersections)

  • 김병은;이영인
    • 한국도로학회논문집
    • /
    • 제15권4호
    • /
    • pp.135-146
    • /
    • 2013
  • PURPOSES : This study aimed to analyze the impact the operation of pre-signals at 4-leg signalized intersections and present primary environmental factors of roads that need to be considered in the installation of pre-signals. METHODS : Shift of proportions safety effectiveness evaluation method which assesses shifts in proportions of target collision types to determine safety effectiveness was applied to analyze traffic crash by types. Also, Empirical Bayes before/after safety effectiveness evaluation method was adapted to analyze the impact pre-signal installation. Negative binomial regression was conducted to determine SPF(safety performance function). RESULTS : Pre-signals are effective in reducing the number of head on, right angle and sideswipe collisions and both the total number of personal injury crashes and severe crashes. Also, it is deemed that each factor used as an independent variable for the SPF model has strong correlation with the total number of personal injury crashes and severe crashes, and impacts general traffic crashes as a whole. CONCLUSIONS: This study suggests the following should be considered in pre-signal installation on intersections. 1) U-turns allowed in the front and rear 2) A high number of roads that connect to the intersection 3) Many right-turn traffic flows 4) Crosswalks installed in the front and rear 5) Insufficient left-turn lanes compared to left-turn traffic flows or no left-turn-only lane.

A novel nomogram of naïve Bayesian model for prevalence of cardiovascular disease

  • Kang, Eun Jin;Kim, Hyun Ji;Lee, Jea Young
    • Communications for Statistical Applications and Methods
    • /
    • 제25권3호
    • /
    • pp.297-306
    • /
    • 2018
  • Cardiovascular disease (CVD) is the leading cause of death worldwide and has a high mortality rate after onset; therefore, the CVD management requires the development of treatment plans and the prediction of prevalence rates. In our study, age, income, education level, marriage status, diabetes, and obesity were identified as risk factors for CVD. Using these 6 factors, we proposed a nomogram based on a $na{\ddot{i}}ve$ Bayesian classifier model for CVD. The attributes for each factor were assigned point values between -100 and 100 by Bayes' theorem, and the negative or positive attributes for CVD were represented to the values. Additionally, the prevalence rate can be calculated even in cases with some missing attribute values. A receiver operation characteristic (ROC) curve and calibration plot verified the nomogram. Consequently, when the attribute values for these risk factors are known, the prevalence rate for CVD can be predicted using the proposed nomogram based on a $na{\ddot{i}}ve$ Bayesian classifier model.

A Bayesian cure rate model with dispersion induced by discrete frailty

  • Cancho, Vicente G.;Zavaleta, Katherine E.C.;Macera, Marcia A.C.;Suzuki, Adriano K.;Louzada, Francisco
    • Communications for Statistical Applications and Methods
    • /
    • 제25권5호
    • /
    • pp.471-488
    • /
    • 2018
  • In this paper, we propose extending proportional hazards frailty models to allow a discrete distribution for the frailty variable. Having zero frailty can be interpreted as being immune or cured. Thus, we develop a new survival model induced by discrete frailty with zero-inflated power series distribution, which can account for overdispersion. This proposal also allows for a realistic description of non-risk individuals, since individuals cured due to intrinsic factors (immunes) are modeled by a deterministic fraction of zero-risk while those cured due to an intervention are modeled by a random fraction. We put the proposed model in a Bayesian framework and use a Markov chain Monte Carlo algorithm for the computation of posterior distribution. A simulation study is conducted to assess the proposed model and the computation algorithm. We also discuss model selection based on pseudo-Bayes factors as well as developing case influence diagnostics for the joint posterior distribution through ${\psi}-divergence$ measures. The motivating cutaneous melanoma data is analyzed for illustration purposes.

다중소스 데이터 융합 기반의 가스 누출 예측을 위한 선형 보간 및 머신러닝 기법 (Linear interpolation and Machine Learning Methods for Gas Leakage Prediction Base on Multi-source Data Integration)

  • 홍고르출;조겨리;김미혜
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.33-41
    • /
    • 2022
  • 본 논문에서는 다중 요인을 고려한 천연 가스 누출 정도 예측을 위해 관련 요인을 포함하는 기상청 자료와 천연가스 누출 자료를 통합하고, 요인 분석을 기반으로 중요 특성을 선택하는 머신러닝 기법을 제안한다. 제안된 기법은 3단계 절차로 구성되어 있다. 먼저, 통합 데이터 셋에 대해 선형 보간법을 수행하여 결측 데이터를 보완하는 전처리를 수행한다. 머신러닝 모델 학습 최적화를 위해 OrdinalEncoder(OE) 기반 정규화와 함께 요인 분석을 사용하여 필수 특징을 선택하며, 데이터 셋은 k-평균 클러스터링으로 레이블을 지정한다. 최종적으로 K-최근접 이웃, DT(Decision Tree), RF(Random Forest), NB(Naive Bayes)의 네 가지 알고리즘을 사용하여 가스 누출 수준을 예측한다. 제안된 방법은 정확도, AUC, 평균 표준 오차(MSE)로 평가되었으며, 테스트 결과 OE-F 전처리를 수행한 경우 기존 기법에 비해 성공적으로 개선되었음을 보였다. 또한 OE-F 기반 KNN(OE-F-KNN)은 95.20%의 정확도, 96.13%의 AUC, 0.031의 MSE로 비교 알고리즘 중 최고 성능을 보였다.

Inference for exponentiated Weibull distribution under constant stress partially accelerated life tests with multiple censored

  • Nassr, Said G.;Elharoun, Neema M.
    • Communications for Statistical Applications and Methods
    • /
    • 제26권2호
    • /
    • pp.131-148
    • /
    • 2019
  • Constant stress partially accelerated life tests are studied according to exponentiated Weibull distribution. Grounded on multiple censoring, the maximum likelihood estimators are determined in connection with unknown distribution parameters and accelerated factor. The confidence intervals of the unknown parameters and acceleration factor are constructed for large sample size. However, it is not possible to obtain the Bayes estimates in plain form, so we apply a Markov chain Monte Carlo method to deal with this issue, which permits us to create a credible interval of the associated parameters. Finally, based on constant stress partially accelerated life tests scheme with exponentiated Weibull distribution under multiple censoring, the illustrative example and the simulation results are used to investigate the maximum likelihood, and Bayesian estimates of the unknown parameters.

머신러닝 기반 중노년층의 기능성 위장장애 예측 모델 구현 (Prediction model of peptic ulcer diseases in middle-aged and elderly adults based on machine learning)

  • 이범주
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.289-294
    • /
    • 2020
  • 기능성 위장장애는 Helicobacter pylori 감염 및 비 스테로이드성 항염증제의 사용 등의 원인으로 발생하는 소화기 계통 질환이다. 그동안 기능성 위장장애의 위험요인에 대한 많은 연구들이 수행되어졌으나, 한국인에 대한 기능성 위장장애 예측 모델 제시에 대한 연구는 없는 실정이다. 따라서 본 연구의 목적은 중년 및 노년층을 대상으로 인구학적정보, 비만정보, 혈액정보, 영양성분 정보를 바탕으로 머신러닝을 이용하여 기능성위장장애 예측 모델을 구현하고 평가하는 것이다. 모델생성을 위해 wrapper-based variable selection 메소드와 naive Bayes 알고리즘이 사용되었다. 여성 예측 모델의 분류 정확도는 0.712의 the area under the receiver operating characteristics curve(AUC) 값을 나타냈고, 남성에서는 여성보다 낮은 0.674의 AUC값이 나타났다. 이러한 연구결과는 향후 중년 및 노년층의 위장장애 질환의 예측과 예방에 활용될 수 있다.

경험적 베이즈 방법에 의한 공용중인 고속도로 교통안전진단사업의 효과평가 (Evaluation of Road Safety Audit on Existing Freeway by Empirical Bayes Method)

  • 문승라
    • 한국도로학회논문집
    • /
    • 제14권2호
    • /
    • pp.117-129
    • /
    • 2012
  • 도로교통 안전진단은 도로의 계획 및 설계단계에서부터 교통사고가 발생할 수 있는 요소를 찾아내 미리 개선하고 건설 후 운영단계에도 도로구조나 안전시설이 사고방지에 적정한지를 평가하는 예방적 차원의 안전성 강화 제도이다. 이 제도는 2000년대 초에 우리나라에 소개된 이래 다양한 사업이 진행되어 왔고 법제화되었으며, 사업의 지속화를 위해 현재까지 진행된 사업에 대한 평가가 필요한 시점이다. 이러한 필요성에 따라 본 연구에서는 공용중인 고속도로의 교통안전진단사업에 대한 효과 평가를 수행하였다. 연구의 공간적 범위는 영동고속도로이며 2005년과 2006년도에 시행된 안전진단사업에 대해 전후 2년을 평가기간으로 하여 분석하였다. 평가방법은 관찰적 사전 사후 평가방법 중 경험적 베이즈 방법을 적용하였다. 효과평가 결과 사업이 시행된 대부분의 구간에서 개선효과가 있는 것으로 나타났으나 일부 구간에서는 효과가 없거나 미미한 것으로 나타났다. 이를 각 구간별 개선조치 내용과 비교하여 검토한 결과 해당 구간에 여러 개선조치가 시행된 경우 효과가 양호하게 나타났으며, 효과가 나타나지 않는 구간은 개선조치가 적거나 단일한 경우가 일반적이었다. 이러한 결과를 바탕으로 개선효과가 나타나지 않는 구간에 대해서는 구체적인 분석과 대응책 마련이 가능할 것이다. 또한 향후 공용중인 고속도로 안전진단사업의 사업내용 및 방향설정 등에 참고로 활용될 수 있다.