• 제목/요약/키워드: empirical bayes

검색결과 106건 처리시간 0.026초

추이확률의 추정을 위한 확장된 Markov Chain 모형 (An extension of Markov chain models for estimating transition probabilities)

  • 강정혁
    • 경영과학
    • /
    • 제10권2호
    • /
    • pp.27-42
    • /
    • 1993
  • Markov chain models can be used to predict the state of the system in the future. We extend the existing Markov chain models in two ways. For the stationary model, we propose a procedure that obtains the transition probabilities by appling the empirical Bayes method, in which the parameters of the prior distribution in the Bayes estimator are obtained on the collaternal micro data. For non-stationary model, we suggest a procedure that obtains a time-varying transition probabilities as a function of the exogenous variables. To illustrate the effectiveness of our extended models, the models are applied to the macro and micro time-series data generated from actual survey. Our stationary model yields reliable parameter values of the prior distribution. And our non-stationary model can predict the variable transition probabilities effectively.

  • PDF

경험적 베이즈 방법에 의한 공용중인 고속도로 교통안전진단사업의 효과평가 (Evaluation of Road Safety Audit on Existing Freeway by Empirical Bayes Method)

  • 문승라
    • 한국도로학회논문집
    • /
    • 제14권2호
    • /
    • pp.117-129
    • /
    • 2012
  • 도로교통 안전진단은 도로의 계획 및 설계단계에서부터 교통사고가 발생할 수 있는 요소를 찾아내 미리 개선하고 건설 후 운영단계에도 도로구조나 안전시설이 사고방지에 적정한지를 평가하는 예방적 차원의 안전성 강화 제도이다. 이 제도는 2000년대 초에 우리나라에 소개된 이래 다양한 사업이 진행되어 왔고 법제화되었으며, 사업의 지속화를 위해 현재까지 진행된 사업에 대한 평가가 필요한 시점이다. 이러한 필요성에 따라 본 연구에서는 공용중인 고속도로의 교통안전진단사업에 대한 효과 평가를 수행하였다. 연구의 공간적 범위는 영동고속도로이며 2005년과 2006년도에 시행된 안전진단사업에 대해 전후 2년을 평가기간으로 하여 분석하였다. 평가방법은 관찰적 사전 사후 평가방법 중 경험적 베이즈 방법을 적용하였다. 효과평가 결과 사업이 시행된 대부분의 구간에서 개선효과가 있는 것으로 나타났으나 일부 구간에서는 효과가 없거나 미미한 것으로 나타났다. 이를 각 구간별 개선조치 내용과 비교하여 검토한 결과 해당 구간에 여러 개선조치가 시행된 경우 효과가 양호하게 나타났으며, 효과가 나타나지 않는 구간은 개선조치가 적거나 단일한 경우가 일반적이었다. 이러한 결과를 바탕으로 개선효과가 나타나지 않는 구간에 대해서는 구체적인 분석과 대응책 마련이 가능할 것이다. 또한 향후 공용중인 고속도로 안전진단사업의 사업내용 및 방향설정 등에 참고로 활용될 수 있다.

중앙분리대 설치에 따른 사고전환효과 분석 (Accident Conversion Effect Analysis of Installing Median Barriers)

  • 박민호;박규영;장일준;이수범
    • 대한교통학회지
    • /
    • 제24권2호
    • /
    • pp.113-124
    • /
    • 2006
  • 교통안전시설 중 중앙분리대는 정면충돌 사고 예방에 효과가 있다고 인식되어 4차로 이상 국도를 대상으로 설치가 이루어지고 있다. 중앙분리대 설치효과분석에 관한 연구는 국내 외에서 지속적으로 이루어지고 있는데. 주로 해당구간의 전체적인 사고감소효과를 제시하고 있다. 즉, 지점에서 사고유형별 또는 심각도별로 사고발생형태가 어떻게 변화되는지에 대한 연구가 미미한 실정이다. 국외에서는 주로 중앙분리대 설치유형에 따른 사고감소효과를 산정하고 있으며, 국내에서는 일부 사고유형별 감소효과를 산정한 사례가 있기는 하나 시설물 설치전 후 각 1년만의 사고자료만을 이용함으로써 도출된 값의 통계적 신뢰성을 확보하지 못하고 있다. 이에 본 연구에서는 중앙분리대 설치에 따른 사고유형별 사고심각도별 사고전환효과를 추정하고자 한다 이를 위하여 중앙분리대가 설치된 국토 깊차로 108.6km에 대하여 사업전 후 총 7년간의 교통사고자료, 안전시설물 설치이력과 도로선형요소에 대한 조사와 자료수집이 이루어졌다 다음으로 경험적베이즈(Empirical Bayes)기법을 이용한 모형구축과 사고유형 심각도의 사고전환효과를 추정하였다. 연구결과는 향후 중앙분리대 관련 정책집행과 시설기준제시에 활용될 수 있을 것으로 기대된다.

교통사고 추정방법 비교 연구: 경험적 베이즈 추정치 vs. 관측교통사고건수 (Comparative Study on the Estimation Methods of Traffic Crashes: Empirical Bayes Estimate vs. Observed Crash)

  • 신강원
    • 대한토목학회논문집
    • /
    • 제30권5D호
    • /
    • pp.453-459
    • /
    • 2010
  • 교통안전연구에서 한 지점 (또는 구간)의 기대교통사고건수를 신뢰성 높게 추정하는 것은 매우 중요하다. 기대교통사고건수를 추정하기 위해 현재 국내에서는 주로 관측교통사고건수를 사용하고 있으나 국외에서는 포아송-감마 혼합모형에 기반한 경험적 베이즈 추정치를 활용하고 있는 추세이다. 그간 많은 연구들이 경험적 베이즈 추정치를 이용해 기대교통사고건수 추정 및 교통안전개선사업의 평가를 시도 하였으나 전술한 2가지 추정방법의 추정오차를 비교연구한 문헌은 없는 실정인 바 본 연구는 2가지 추정방법의 추정오차를 모의실험을 통해 비교 분석하여 제시하였다. 모의 발생된 총 3,000,000개 지점의 교통사고 자료를 분석한 결과 기대교통사고건수를 경험적 베이즈 추정방법을 이용해 추정했을 경우 그 추정오차는 관측교통 사고건수만을 이용했을 때 발생하는 추정오차에 비해 항상 작은 것으로 나타나 국내의 교통안전연구 가이드라인에 경험적 베이지안 추정방법의 도입이 필요할 것으로 판단된다. 그러나 사전분포의 불확실성이 높아질수록 두 가지 추정방법의 추정오차의 차이는 감소하는 것으로 나타나, 기대교통사고건수 추정 시 추정된 음이항 모형에 대한 종합적인 검증을 수행한 후 신뢰성 있는 초모수의 추정치를 이용해 경험적 베이지안 방법을 적용하는 것이 바람직하다고 판단된다.

베이지언 문서분류시스템을 위한 능동적 학습 기반의 학습문서집합 구성방법 (An Active Learning-based Method for Composing Training Document Set in Bayesian Text Classification Systems)

  • 김제욱;김한준;이상구
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권12호
    • /
    • pp.966-978
    • /
    • 2002
  • 기계학습 기법을 이용한 문서분류시스템의 정확도를 결정하는 요인 중 가장 중요한 것은 학습문서 집합의 선택과 그것의 구성방법이다. 학습문서집합 선택의 문제란 임의의 문서공간에서 보다 정보량이 큰 적은 양의 문서집합을 골라서 학습문서로 채택하는 것을 말한다. 이렇게 선택한 학습문서집합을 재구성하여 보다 정확도가 높은 문서분류함수를 만드는 것이 학습문서집합 구성방법의 문제이다. 전자의 문제를 해결하는 대표적인 알고리즘이 능동적 학습(active learning) 알고리즘이고, 후자의 경우는 부스팅(boosting) 알고리즘이다. 본 논문에서는 이 두 알고리즘을 Naive Bayes 문서분류 알고리즘에 적응해보고, 이때 생기는 여러 가지 특징들을 분석하여 새로운 학습문서집합 구성방법인 AdaBUS 알고리즘을 제안한다. 이 알고리즘은 능동적 학습 알고리즘의 아이디어를 이용하여 최종 문서분류함수룰 만들기 위해 임시로 만든 여러 임시 문서분류함수(weak hypothesis)들 간의 변이(variance)를 높였다. 이를 통해 부스팅 알고리즘이 효과적으로 구동되기 위해 필요한 핵심 개념인 교란(perturbation)의 효과를 실현하여 문서분류의 정확도를 높일 수 있었다. Router-21578 문서집합을 이용한 경험적 실험을 통해, AdaBUS 알고리즘이 기존의 알고리즘에 비해 Naive Bayes 알고리즘에 기반한 문서분류시스템의 정확도를 보다 크게 향상시킨다는 사실을 입증한다.

Optimal bandwidth in nonparametric classification between two univariate densities

  • ;강기훈
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.1-5
    • /
    • 2002
  • We consider the problem of optimal bandwidth choice for nonparametric classification, based on kernel density estimators, where the problem of interest is distinguishing between two univariate distributions. When the densities intersect at a single point, optimal bandwidth choice depends on curvatures of the densities at that point. The problem of empirical bandwidth selection and classifying data in the tails of a distribution are also addressed.

  • PDF

Mixed Model with Time Effect for Analyzing Geographic Variability in Mortality Rates

  • Yong Chul Kim
    • Communications for Statistical Applications and Methods
    • /
    • 제4권1호
    • /
    • pp.33-39
    • /
    • 1997
  • Tsutakawa(1988) proposed a mixed model for using empirical Bayes method to study the geographic variability in mortality rates of a disease. In particular cases of the analysis in mortality rate, we need to consider the effect of time. If observed data are collected annually for the time period, then time effect will be emphasized. Here, an extended model for estimating the geographic effect and the mortality rates of the disease with time effect is proposed.

  • PDF

Simultaneous Estimation of Poisson Means

  • Lee, Seung-Ho
    • 한국수학교육학회지시리즈A:수학교육
    • /
    • 제23권1호
    • /
    • pp.45-50
    • /
    • 1984
  • A problem of estimating the means of Poisson populations using independent samples is considered. The total loss is the sum of component, normalized squared error losses. An empirical Bayes estimator is derived and compared, by Monte Carlo methods, with existing estimators which are proposed as improving estimators upon the usual one. Monte Carlo results show that the performance of the derived estimator is satisfactory over the whole parameter space.

  • PDF

WHEN CAN SUPPORT VECTOR MACHINE ACHIEVE FAST RATES OF CONVERGENCE?

  • Park, Chang-Yi
    • Journal of the Korean Statistical Society
    • /
    • 제36권3호
    • /
    • pp.367-372
    • /
    • 2007
  • Classification as a tool to extract information from data plays an important role in science and engineering. Among various classification methodologies, support vector machine has recently seen significant developments. The central problem this paper addresses is the accuracy of support vector machine. In particular, we are interested in the situations where fast rates of convergence to the Bayes risk can be achieved by support vector machine. Through learning examples, we illustrate that support vector machine may yield fast rates if the space spanned by an adopted kernel is sufficiently large.

Laplace-Metropolis알고리즘에 의한 다항로짓모형의 변수선택에 관한 연구 (Laplace-Metropolis Algorithm for Variable Selection in Multinomial Logit Model)

  • 김혜중;이애경
    • 품질경영학회지
    • /
    • 제29권1호
    • /
    • pp.11-23
    • /
    • 2001
  • This paper is concerned with suggesting a Bayesian method for variable selection in multinomial logit model. It is based upon an optimal rule suggested by use of Bayes rule which minimizes a risk induced by selecting the multinomial logit model. The rule is to find a subset of variables that maximizes the marginal likelihood of the model. We also propose a Laplace-Metropolis algorithm intended to suggest a simple method forestimating the marginal likelihood of the model. Based upon two examples, artificial data and empirical data examples, the Bayesian method is illustrated and its efficiency is examined.

  • PDF