• 제목/요약/키워드: Empirical bayes method

검색결과 42건 처리시간 0.022초

Laplace-Metropolis알고리즘에 의한 다항로짓모형의 변수선택에 관한 연구 (Laplace-Metropolis Algorithm for Variable Selection in Multinomial Logit Model)

  • 김혜중;이애경
    • 품질경영학회지
    • /
    • 제29권1호
    • /
    • pp.11-23
    • /
    • 2001
  • This paper is concerned with suggesting a Bayesian method for variable selection in multinomial logit model. It is based upon an optimal rule suggested by use of Bayes rule which minimizes a risk induced by selecting the multinomial logit model. The rule is to find a subset of variables that maximizes the marginal likelihood of the model. We also propose a Laplace-Metropolis algorithm intended to suggest a simple method forestimating the marginal likelihood of the model. Based upon two examples, artificial data and empirical data examples, the Bayesian method is illustrated and its efficiency is examined.

  • PDF

베이지언 문서분류시스템을 위한 능동적 학습 기반의 학습문서집합 구성방법 (An Active Learning-based Method for Composing Training Document Set in Bayesian Text Classification Systems)

  • 김제욱;김한준;이상구
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권12호
    • /
    • pp.966-978
    • /
    • 2002
  • 기계학습 기법을 이용한 문서분류시스템의 정확도를 결정하는 요인 중 가장 중요한 것은 학습문서 집합의 선택과 그것의 구성방법이다. 학습문서집합 선택의 문제란 임의의 문서공간에서 보다 정보량이 큰 적은 양의 문서집합을 골라서 학습문서로 채택하는 것을 말한다. 이렇게 선택한 학습문서집합을 재구성하여 보다 정확도가 높은 문서분류함수를 만드는 것이 학습문서집합 구성방법의 문제이다. 전자의 문제를 해결하는 대표적인 알고리즘이 능동적 학습(active learning) 알고리즘이고, 후자의 경우는 부스팅(boosting) 알고리즘이다. 본 논문에서는 이 두 알고리즘을 Naive Bayes 문서분류 알고리즘에 적응해보고, 이때 생기는 여러 가지 특징들을 분석하여 새로운 학습문서집합 구성방법인 AdaBUS 알고리즘을 제안한다. 이 알고리즘은 능동적 학습 알고리즘의 아이디어를 이용하여 최종 문서분류함수룰 만들기 위해 임시로 만든 여러 임시 문서분류함수(weak hypothesis)들 간의 변이(variance)를 높였다. 이를 통해 부스팅 알고리즘이 효과적으로 구동되기 위해 필요한 핵심 개념인 교란(perturbation)의 효과를 실현하여 문서분류의 정확도를 높일 수 있었다. Router-21578 문서집합을 이용한 경험적 실험을 통해, AdaBUS 알고리즘이 기존의 알고리즘에 비해 Naive Bayes 알고리즘에 기반한 문서분류시스템의 정확도를 보다 크게 향상시킨다는 사실을 입증한다.

추이확률의 추정을 위한 확장된 Markov Chain 모형 (An extension of Markov chain models for estimating transition probabilities)

  • 강정혁
    • 경영과학
    • /
    • 제10권2호
    • /
    • pp.27-42
    • /
    • 1993
  • Markov chain models can be used to predict the state of the system in the future. We extend the existing Markov chain models in two ways. For the stationary model, we propose a procedure that obtains the transition probabilities by appling the empirical Bayes method, in which the parameters of the prior distribution in the Bayes estimator are obtained on the collaternal micro data. For non-stationary model, we suggest a procedure that obtains a time-varying transition probabilities as a function of the exogenous variables. To illustrate the effectiveness of our extended models, the models are applied to the macro and micro time-series data generated from actual survey. Our stationary model yields reliable parameter values of the prior distribution. And our non-stationary model can predict the variable transition probabilities effectively.

  • PDF

교통사고 추정방법 비교 연구: 경험적 베이즈 추정치 vs. 관측교통사고건수 (Comparative Study on the Estimation Methods of Traffic Crashes: Empirical Bayes Estimate vs. Observed Crash)

  • 신강원
    • 대한토목학회논문집
    • /
    • 제30권5D호
    • /
    • pp.453-459
    • /
    • 2010
  • 교통안전연구에서 한 지점 (또는 구간)의 기대교통사고건수를 신뢰성 높게 추정하는 것은 매우 중요하다. 기대교통사고건수를 추정하기 위해 현재 국내에서는 주로 관측교통사고건수를 사용하고 있으나 국외에서는 포아송-감마 혼합모형에 기반한 경험적 베이즈 추정치를 활용하고 있는 추세이다. 그간 많은 연구들이 경험적 베이즈 추정치를 이용해 기대교통사고건수 추정 및 교통안전개선사업의 평가를 시도 하였으나 전술한 2가지 추정방법의 추정오차를 비교연구한 문헌은 없는 실정인 바 본 연구는 2가지 추정방법의 추정오차를 모의실험을 통해 비교 분석하여 제시하였다. 모의 발생된 총 3,000,000개 지점의 교통사고 자료를 분석한 결과 기대교통사고건수를 경험적 베이즈 추정방법을 이용해 추정했을 경우 그 추정오차는 관측교통 사고건수만을 이용했을 때 발생하는 추정오차에 비해 항상 작은 것으로 나타나 국내의 교통안전연구 가이드라인에 경험적 베이지안 추정방법의 도입이 필요할 것으로 판단된다. 그러나 사전분포의 불확실성이 높아질수록 두 가지 추정방법의 추정오차의 차이는 감소하는 것으로 나타나, 기대교통사고건수 추정 시 추정된 음이항 모형에 대한 종합적인 검증을 수행한 후 신뢰성 있는 초모수의 추정치를 이용해 경험적 베이지안 방법을 적용하는 것이 바람직하다고 판단된다.

Prediction of 305 Days Milk Production from Early Records in Dairy Cattle Using an Empirical Bayes Method

  • Pereira, J.A.C.;Suzuki, M.;Hagiya, K.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제14권11호
    • /
    • pp.1511-1515
    • /
    • 2001
  • A prediction of 305 d milk production from early records using an empirical Bayes method (EBM) was performed. The EBM was compared with the best predicted estimation (BPE), test interval method (TIM), and the linearized Wood's model (LWM). Daily milk yields were obtained from 606 first lactation Japanese Holstein cows in three herds. From each file of 305 daily records, 10 random test day records with an interval of approximately one month were taken. The accuracies of these methods were compared using the absolute difference (AD) and the standard deviation (SD) of the differences between the actual and the estimated 305 d milk production. The results showed that in the early stage of the lactation, EBM was superior in obtaining the prediction with high accuracy. When all the herds were analyzed jointly, the AD during the first 5 test day records were on average 373, 590, 917 and 1,042 kg for EBM, BPE, TIM, and LWM, respectively. Corresponding SD for EBM, BPE, TIM, and LWM were on average 488, 733, 747 and 1,605 kg. When the herds were analyzed separately, the EBM predictions retained high accuracy. When more information on the actual lactation was added to the prediction, TIM and LWM gradually achieved better accuracies. Finally, in the last period of the lactation, the accuracy of both of the methods exceeded EBM and BPM. The AD for the last 2 samples analyzing all the herds jointly were on average 141, 142, 164, and 214 kg for LWM, TIM, EBM, and BPE, respectively. In the current practices of collecting monthly records, early prediction of future milk production may be more accurate using EBM. Alternatively, if enough information of the actual lactation is accumulated, TIM may obtain better accuracy in the latter stage of lactation.

가속수명자료를 이용한 경험적 베이즈 예측분석 (Empirical Bayesian Prediction Analysis on Accelerated Lifetime Data)

  • 조건호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제8권1호
    • /
    • pp.21-30
    • /
    • 1997
  • 가속수명시험에서 강한충격수준에서 부품들의 고장시간이 관측되고 가속화된 고장시간을 토대로 정상충격수준에서 부품들의 성능을 조사한다. 본 논문은 지수수명분포에서 중도절단된 가속수명자료를 이용하여 고장률의 사전분포의 평균을 알 때, 정상조건하에서 하나의 미래 관찰치의 예측문제를 사전분포의 모수에 대하여 적률추정량을 이용하는 경험적 베이즈 접근방법을 적용시켜 경험적 베이즈 예측분포와 예측구간에 대하여 연구하였다.

  • PDF

Mixed Model with Time Effect for Analyzing Geographic Variability in Mortality Rates

  • Yong Chul Kim
    • Communications for Statistical Applications and Methods
    • /
    • 제4권1호
    • /
    • pp.33-39
    • /
    • 1997
  • Tsutakawa(1988) proposed a mixed model for using empirical Bayes method to study the geographic variability in mortality rates of a disease. In particular cases of the analysis in mortality rate, we need to consider the effect of time. If observed data are collected annually for the time period, then time effect will be emphasized. Here, an extended model for estimating the geographic effect and the mortality rates of the disease with time effect is proposed.

  • PDF

경험적 베이즈 방법에 의한 공용중인 고속도로 교통안전진단사업의 효과평가 (Evaluation of Road Safety Audit on Existing Freeway by Empirical Bayes Method)

  • 문승라
    • 한국도로학회논문집
    • /
    • 제14권2호
    • /
    • pp.117-129
    • /
    • 2012
  • 도로교통 안전진단은 도로의 계획 및 설계단계에서부터 교통사고가 발생할 수 있는 요소를 찾아내 미리 개선하고 건설 후 운영단계에도 도로구조나 안전시설이 사고방지에 적정한지를 평가하는 예방적 차원의 안전성 강화 제도이다. 이 제도는 2000년대 초에 우리나라에 소개된 이래 다양한 사업이 진행되어 왔고 법제화되었으며, 사업의 지속화를 위해 현재까지 진행된 사업에 대한 평가가 필요한 시점이다. 이러한 필요성에 따라 본 연구에서는 공용중인 고속도로의 교통안전진단사업에 대한 효과 평가를 수행하였다. 연구의 공간적 범위는 영동고속도로이며 2005년과 2006년도에 시행된 안전진단사업에 대해 전후 2년을 평가기간으로 하여 분석하였다. 평가방법은 관찰적 사전 사후 평가방법 중 경험적 베이즈 방법을 적용하였다. 효과평가 결과 사업이 시행된 대부분의 구간에서 개선효과가 있는 것으로 나타났으나 일부 구간에서는 효과가 없거나 미미한 것으로 나타났다. 이를 각 구간별 개선조치 내용과 비교하여 검토한 결과 해당 구간에 여러 개선조치가 시행된 경우 효과가 양호하게 나타났으며, 효과가 나타나지 않는 구간은 개선조치가 적거나 단일한 경우가 일반적이었다. 이러한 결과를 바탕으로 개선효과가 나타나지 않는 구간에 대해서는 구체적인 분석과 대응책 마련이 가능할 것이다. 또한 향후 공용중인 고속도로 안전진단사업의 사업내용 및 방향설정 등에 참고로 활용될 수 있다.

관찰적 사전·사후 평가연구 방법의 비교 연구: 공용중인 고속도로 안전진단사업 효과평가를 사례로 (The Comparison Study on Observational Before-After Studies: Case Study on Safety Evaluation on Highways)

  • 문승라;이영인
    • 대한교통학회지
    • /
    • 제31권6호
    • /
    • pp.67-89
    • /
    • 2013
  • 본 연구는 관찰적 사전 사후 평가연구의 세 방법인 단순비교법, 비교그룹에 의한 방법 그리고 경험적 베이즈 방법에 대한 실증 분석을 수행하고, 그 결과를 비교하며, 평가연구에 적용 방안을 제시하고자 한다. 이를 위해 2005년과 2006년에 영동고속도로에서 시행된 안전진단사업의 평가를 수행하였다. 분석결과 세 가지 방법 모두 안전진단조치로 인한 개선효과가 나타나고 있으며, 단순비교법이 개선효과가 가장 크고 그 다음이 비교그룹에 의한 방법, 경험적 베이즈 방법의 순으로 나타났다. 단순비교법의 결과는 교통사고 감소추이가 반영되어 과대 추정되었으며, 비교그룹방법의 결과에는 비교그룹의 외부우연요인이 내재되어 있다. 경험적 베이즈 방법은 참조그룹의 사고예측모형에 의해 평균으로의 회귀 현상이 통제되므로, 두 방법과 비교해 결과가 비교적 정확하다. 평가연구의 수행에서, 분석가는 평가방법별 장 단점을 잘 이해하고, 관련된 모든 지역에서 사고추이의 검토를 선행한 후에 평가 분석을 수행하여야 한다.

중앙분리대 설치에 따른 사고전환효과 분석 (Accident Conversion Effect Analysis of Installing Median Barriers)

  • 박민호;박규영;장일준;이수범
    • 대한교통학회지
    • /
    • 제24권2호
    • /
    • pp.113-124
    • /
    • 2006
  • 교통안전시설 중 중앙분리대는 정면충돌 사고 예방에 효과가 있다고 인식되어 4차로 이상 국도를 대상으로 설치가 이루어지고 있다. 중앙분리대 설치효과분석에 관한 연구는 국내 외에서 지속적으로 이루어지고 있는데. 주로 해당구간의 전체적인 사고감소효과를 제시하고 있다. 즉, 지점에서 사고유형별 또는 심각도별로 사고발생형태가 어떻게 변화되는지에 대한 연구가 미미한 실정이다. 국외에서는 주로 중앙분리대 설치유형에 따른 사고감소효과를 산정하고 있으며, 국내에서는 일부 사고유형별 감소효과를 산정한 사례가 있기는 하나 시설물 설치전 후 각 1년만의 사고자료만을 이용함으로써 도출된 값의 통계적 신뢰성을 확보하지 못하고 있다. 이에 본 연구에서는 중앙분리대 설치에 따른 사고유형별 사고심각도별 사고전환효과를 추정하고자 한다 이를 위하여 중앙분리대가 설치된 국토 깊차로 108.6km에 대하여 사업전 후 총 7년간의 교통사고자료, 안전시설물 설치이력과 도로선형요소에 대한 조사와 자료수집이 이루어졌다 다음으로 경험적베이즈(Empirical Bayes)기법을 이용한 모형구축과 사고유형 심각도의 사고전환효과를 추정하였다. 연구결과는 향후 중앙분리대 관련 정책집행과 시설기준제시에 활용될 수 있을 것으로 기대된다.