• 제목/요약/키워드: MCMC Method

검색결과 103건 처리시간 0.029초

선형판별분석에서 MCMC다중대체법의 효율에 관한 연구 (A Study on the efficiency of the MCMC multiple imputation In LDA)

  • 유희경;김명철
    • 대한안전경영과학회지
    • /
    • 제11권3호
    • /
    • pp.189-198
    • /
    • 2009
  • This thesis studies two imputation methods, the MCMC method and the EM algorithm, that take care of the problem. The performance of the two methods for the linear (or quadratic) discriminant analysis are evaluated under various types of incomplete observations. Based on simulated experiments, the effect of the imputation using the EM algorithm and the MCMC method are evaluated and compared in terms of the probability of misclassification and the RMSE. This is done for the various cases of incomplete observations. The cases are differentiated by missing rates, sample sizes, and distances between two classification groups. The studies show that the probability of misclassification and the RMSE of the EM algorithm method is lower than the MCMC method. Therefore the imputation using the EM algorithm is more efficient than the MCMC method. And the probability of misclassification of the method that all vectors of observations with missing values are omitted from analysis is lower than the EM algorithm and the MCMC method when the samples size is small and the rate of missing values is extremely big.

층상 반무한 지반의 물성치 추정을 위한 마르코프 연쇄 몬테카를로 모사 기법 (Markov Chain Monte Carlo Simulation to Estimate Material Properties of a Layered Half-space)

  • 이진호;;이세혁
    • 한국전산구조공학회논문집
    • /
    • 제36권3호
    • /
    • pp.203-211
    • /
    • 2023
  • 층상 반무한체에서의 확률론적 완전파형역산을 위한 Markov chain Monte Carlo (MCMC) 모사 기법을 정식화한다. Thin-layer method를 사용하여 조화 수직 하중이 작용하는 층상 반무한체의 지표면에서 추정된 동적 응답과 관측 데이터와의 차이 및 모델 변수의 사전 정보와의 차이를 최소화하도록 목적함수와 모델 변수의 사후 확률밀도함수를 정의한다. 목적함수의 기울기에 기반하여 MCMC 표본을 제안하기 위한 분포함수와 이를 수락 또는 거절할지 결정하는 수락함수를 결정한다. 기본 진동모드 뿐만이 아니라 고차 진동모드가 우세한 경우를 포함하여 다양한 층상 반무한체의 전단파 속도 추정에 제안된 MCMC 모사 기법을 적용하고 그 정확성을 검증한다. 제안된 확률론적 완전파형역산을 위한 MCMC 모사 기법은 층상 반무한체의 전단파 속도와 같은 재료 특성의 확률적 특성을 추정하는 데 적합함을 확인할 수 있다.

Bayesian MCMC를 이용한 저수량 점 빈도분석: II. 적용과 비교분석 (At-site Low Flow Frequency Analysis Using Bayesian MCMC: II. Application and Comparative Studies)

  • 김상욱;이길성
    • 한국수자원학회논문집
    • /
    • 제41권1호
    • /
    • pp.49-63
    • /
    • 2008
  • 본 연구에서는 Bayesian MCMC 방법과 2차 근사식을 이용한 최우추정(Maximum Likelihood Estimation, MLE)방법 방법을 이용하여 낙동강 유역의 본류지점인 낙동, 왜관, 고령교, 진동지점에 대한 점 빈도분석을 수행하고 그 결과로써 불확실성을 포함한 빈도곡선을 작성하였다. 통계적 실험을 통한 두 가지 추정방법의 분석을 위하여 먼저 자료의 길이가 100인 8개의 합성 유량자료 셋을 생성하여 비교 연구를 수행하였으며, 이를 자료길이 36인 실측 유량 자료의 추정결과와 비교하였다. Bayesian MCMC 방법에 의한 평균값과 2차 근사식을 이용한 취우추정방법에 의한 모드에서의 2모수 Weibull 분포의 모수 추정값은 비슷한 결과를 보였으나, 불확실성을 나타내는 하한값과 상한값의 차이는 Bayesian MCMC 방법이 2차 근사식을 이용한 취우추정방법보다 불확실성을 감소시켜 나타내는 것을 알 수 있었다. 또한 실측 유량자료를 이용한 결과, 2차 근사식을 이용한 취우추정방법의 경우 자료의 길이가 감소됨에 따라 불확실성의 범위가 합성유량자료를 사용한 경우에 비해 상대적으로 증가되지만, Bayesian MCMC 방법의 경우에는 자료의 길이에 대한 영향이 거의 없다는 결론을 얻을 수 있었다. 그러므로 저수량 빈도분석을 수행하기 위해 충분한 자료를 확보할 수 없는 국내의 상황을 감안할 때, 위와 같은 결론으로부터 Bayesian MCMC 방법이 불확실성을 표현하는데 있어서 2차 근사식을 이용한 최우추정방법에 비해 합리적일 수 있다는 결론을 얻을 수 있었다.

Horseshoe 사전분포에 대한 MCMC 알고리듬 비교 연구 (Comparing MCMC algorithms for the horseshoe prior)

  • 마미루;강민기;이경재
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.103-118
    • /
    • 2024
  • Horseshoe 사전분포는 희박 회귀 분석에서 가장 자주 사용되는 사전분포 중 하나이다. Horseshoe 사전분포는 탐험해야 할 모수공간이 spike and slab 사전분포보다 작다는 장점이 있으나 MCMC 단계 당 시간이 오래 걸린다는 단점이 있다. 이로 인해 horseshoe 사전분포를 고차원 데이터 분석으로 확장하는 것은 한계가 존재한다. 이러한 한계를 극복하기 위해 horseshoe 사전분포에 대한 MCMC 알고리듬들이 많이 제안되었으며, 특히 최근 Johndrow 등 (2020)은 빠른 계산을 위한 근사 알고리듬을 제안하였다. 본 논문에서는 horseshoe 사전분포에 대한 (1) 전통적인 MCMC 알고리듬, (2) 근사 알고리듬 그리고 (3) 근사 알고리듬의 변형 알고리듬의 성능을 다양한 모의실험을 통해 비교하려 한다. 성능은 계산 시간, 회귀계수 추정 및 변수선택을 중심으로 비교한다. 이때 변수선택을 위해 Li와 Pati (2017)에서 제안한 horseshoe 사전분포 기반 변수선택법을 고려한다.

변동진폭하중 하에서 균열성장예지를 위한 베이지안 모델변수 추정법 (Bayesian Parameter Estimation for Prognosis of Crack Growth under Variable Amplitude Loading)

  • 임상혁;안다운;최주호
    • 대한기계학회논문집A
    • /
    • 제35권10호
    • /
    • pp.1299-1306
    • /
    • 2011
  • 본 연구에서는 측정된 균열 데이터를 토대로 변동하중 하에서의 균열성장모델 변수들을 베이지안 모델변수 추정 방법을 통해서 확률적인 분포로 구하는 방법을 제시하였다. 모델변수의 확률분포를 구하기 위해 Markov Chain Monte Carlo (MCMC) 샘플링 방법을 이용하였다. 변동하중 하에서는 균열성장 모델이 더욱 복잡해 짐에 따라 기존의 MCMC 기법으로는 확률분포를 잘 구하지 못하므로 주변확률밀도분포를 제안함수로 사용하는 MCMC 기법을 새롭게 제안하였다. 모델변수의 추정을 위해 여러 크기의 일정 진폭 하중 하에서 시편시험을 수행하여 얻은 균열성장 데이터를 이용하였다. 추정된 변수들을 사용하여 변동하중 하에서의 시편에 대해 균열성장 예측을 수행하였고, 이를 실제 시험 데이터를 통해서 검증하였다.

마코프체인 몬테카를로 방법을 이용한 에너지 저장 장치용 배터리의 잔존 수명 추정 (Remaining Useful Life Estimation of Li-ion Battery for Energy Storage System Using Markov Chain Monte Carlo Method)

  • 김동진;김석구;최주호;송화섭;박상희;이재욱
    • 대한기계학회논문집A
    • /
    • 제40권10호
    • /
    • pp.895-900
    • /
    • 2016
  • 리튬 이온 배터리의 잔존수명 추정은 품질보증, 운전계획, 교체주기 파악 등을 위해 활용된다는 점에서 그 필요성이 점점 커지고 있다. 본 논문에서는 에너지 저장 장치용 배터리의 잔존 수명을 단일지수 용량열화 모델과 마코프체인 몬테카를로(MCMC) 방법을 이용하여 추정한 결과를 제시한다. MCMC방법은 사전 정보가 제대로 주어지지 않았을 때, 추정결과가 모델 초기값과 입력 설정값에 따라 크게 변하게 되는 단점이 있어, 실제 현장에서 배터리 모델과 추정법에 익숙하지 않은 사용자가 활용하는데 어려움이 있다. 이러한 어려움을 극복하기 위해, 본 논문에서는 베이지안 추론법의 이론식을 전역 탐색하여 구한 이론값과 MCMC 추정값을 비교해서, 초기값과 설정값을 결정하는 과정을 제안한다.

MCMC 결측치 대체와 주성분 산점도 기반의 SOM을 이용한 희소한 웹 데이터 분석 (Sparse Web Data Analysis Using MCMC Missing Value Imputation and PCA Plot-based SOM)

  • 전성해;오경환
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.277-282
    • /
    • 2003
  • 웹으로부터 유용한 정보를 얻기 위한 연구는 현재 많이 진행되고 있다. 본 논문에서는 특히 웹 로그 데이터의 희소성에 대한 문제 해결과 이를 통한 웹 사용자의 군집화 방안에 대하여 연구하였다. MCMC 방법의 베이지안 추론에 의한 결측치 대체 기법을 이용하여 웹 데이터의 희소성을 제거하였고, 주성분에 의한 산점도를 통하여 형상지도의 차원을 결정한 자기 조직화지도를 이용하여 웹 사용자의 군집화를 수행하였다. 제안 기법은 기존의 방법들에 비해 모형의 정확도와 빠른 학습 시간을 제공하여 주었다. KDD Cup 데이터를 이용한 실험을 통하여 제안 방법에 대한 문제 해결 절차 및 성능 평가를 객관적으로 확인하였다.

MCMC 방법을 이용한 자율주행 차량의 보행자 탐지 및 추적방법 (Pedestrian Detection and Tracking Method for Autonomous Navigation Vehicle using Markov chain Monte Carlo Algorithm)

  • 황중원;김남훈;윤정연;김창환
    • 로봇학회논문지
    • /
    • 제7권2호
    • /
    • pp.113-119
    • /
    • 2012
  • In this paper we propose the method that detects moving objects in autonomous navigation vehicle using LRF sensor data. Object detection and tracking methods are widely used in research area like safe-driving, safe-navigation of the autonomous vehicle. The proposed method consists of three steps: data segmentation, mobility classification and object tracking. In order to make the raw LRF sensor data to be useful, Occupancy grid is generated and the raw data is segmented according to its appearance. For classifying whether the object is moving or static, trajectory patterns are analysed. As the last step, Markov chain Monte Carlo (MCMC) method is used for tracking the object. Experimental results indicate that the proposed method can accurately detect moving objects.

베이지안 통계 추론 (On the Bayesian Statistical Inference)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.263-266
    • /
    • 2007
  • 본 논문은 베이지안 통계 추론에 대하여 논의한다. 논문은 베이지안 추론, Markov Chain과 Monte Carlo 적분, MCMC(Markov Chain Monte Carlo) 기법, Metropolis-Hastings 알고리즘, Gibbs 샘플링, Maximum Likelihood Estimation, EM 알고리즘, 상실된 데이터 보완 기법, BMA(Bayesian Model Averaging) 순서로 논의를 진행한다. 이러한 통계적 기법들은 대용량의 데이터를 처리하는 생물학, 의학, 생명 공학, 과학과 공학, 그리고 일반 데이터 조사와 처리 등에 사용되고 있으며, 최적의 추론 결과를 이끌어 내는데 중요한 방법을 제공하고 있다. 그리고 마지막으로 PC(Principal Component) 분석 기법에 대하여 논의한다. PC 분석 기법도 데이터 분석과 연구에 많이 활용된다.

  • PDF

Bayesian MCMC를 이용한 저수량 점 빈도분석: I. 이론적 배경과 사전분포의 구축 (At-site Low Flow Frequency Analysis Using Bayesian MCMC: I. Theoretical Background and Construction of Prior Distribution)

  • 김상욱;이길성
    • 한국수자원학회논문집
    • /
    • 제41권1호
    • /
    • pp.35-47
    • /
    • 2008
  • 저수분석(low flow analysis)은 수자원공학에서 중요한 분야 중 하나이며, 특히 저수량 빈도분석(low flow frequency analysis)의 결과는 저수(貯水)용량의 설계, 물 수급계획, 오염원의 배치 및 관개와 생태계의 보존을 위한 수량과 수질의 관리에 중요하게 사용된다. 그러므로 본 연구에서는 저수량 빈도분석을 위한 점 빈도분석을 수행하였으며, 특히 빈도분석에 있어서의 불확실성을 탐색하기 위하여 Bayesian 방법을 적용하고 그 결과를 기존에 사용되던 불확실성 탐색방법과 비교하였다. 본 논문의Ⅰ편에서는 Bayesian 방법 중 사전분포(prior distribution)와 우도함수(likelihood function)의 복잡성에 상관없이 계산이 가능한 Bayesian MCMC(Bayesian Markov Chain Monte Carlo) 방법과 Metropolis-Hastings 알고리즘을 사용하기 위한 여러 과정의 이론적 배경과 Bayesian 방법에서 가장 중요한 요소인 사전분포를 구축하고 이를 비교 및 평가하였다. 고려된 사전분포는 자료에 기반하지 않은 사전분포와 자료에 기반한 사전분포로써 두 사전분포를 이용하여 Metropolis-Hastings 알고리즘을 수행하고 그 결과를 비교하여 저수량 빈도분석에 합리적인 사전분포를 선정하였다. 또한 알고리즘의 수행과정에서 필요한 제안분포(proposal distribution)를 적용하여 그에 따른 알고리즘의 효율성을 채택률(acceptance rate)을 산정하여 검증해 보았다. 사전분포의 분석 결과, 자료에 기반한 사전분포가 자료에 기반하지 않은 사전분포보다 정확성 및 불확실성의 표현에 있어서 우수한 결과를 제시하는 것을 확인할 수 있었고, 채택률을 이용한 알고리즘의 효용성 역시 기존 연구자들이 제시하였던 만족스러운 범위를 가지는 것을 알 수 있었다. 최종적으로 선정된 사전분포는 본 연구의 II편에서 Bayesian MCMC방법의 사전분포로 이용되었으며, 그 결과를 기존 불확실성의 추정방법의 하나인 2차 근사식을 이용한 최우추정(maximum likelihood estimation)방법의 결과와 비교하였다.