• 제목/요약/키워드: Maximum likelihood estimation (MLE)

검색결과 149건 처리시간 0.022초

다수의 고장 원인을 갖는 기기의 신뢰성 모형화 및 분석 (Reliability Modeling and Analysis for a Unit with Multiple Causes of Failure)

  • 백상엽;임태진;이창훈
    • 대한산업공학회지
    • /
    • 제21권4호
    • /
    • pp.609-628
    • /
    • 1995
  • This paper presents a reliability model and a data-analytic procedure for a repairable unit subject to failures due to multiple non-identifiable causes. We regard a failure cause as a state and assume the life distribution for each cause to be exponential. Then we represent the dependency among the causes by a Markov switching model(MSM) and estimate the transition probabilities and failure rates by maximum likelihood(ML) method. The failure data are incomplete due to masked causes of failures. We propose a specific version of EM(expectation and maximization) algorithm for finding maximum likelihood estimator(MLE) under this situation. We also develop statistical procedures for determining the number of significant states and for testing independency between state transitions. Our model requires only the successive failure times of a unit to perform the statistical analysis. It works well even when the causes of failures are fully masked, which overcomes the major deficiency of competing risk models. It does not require the assumption of stationarity or independency which is essential in mixture models. The stationary probabilities of states can be easily calculated from the transition probabilities estimated in our model, so it covers mixture models in general. The results of simulations show the consistency of estimation and accuracy gradually increasing according to the difference of failure rates and the frequency of transitions among the states.

  • PDF

시뮬레이션을 통한 다양한 로버스트 회귀추정량의 비교 연구 (A comparison study of various robust regression estimators using simulation)

  • 장수희;윤정연;전희주
    • 응용통계연구
    • /
    • 제29권3호
    • /
    • pp.471-485
    • /
    • 2016
  • 회귀모형의 대표적인 추정법인 최소제곱법은 오차항의 분포가 정규분포를 따르고 이상치가 없는 상황에서는 최적이지만, 자료가 회귀모형의 가정을 만족하지 않을 경우 또는 이상치를 포함하는 경우와 같이 자료가 오염된 상황에서는 왜곡된 추정 결과를 준다. 따라서 이상치에 민감한 최소제곱법의 단점을 보완하기 위해 다양한 로버스트 추정방법이 제안되었다. 본 논문에서는 MLE를 기반으로 제안된 M 추정량, 순서형 통계량을 기반으로 제안된 L 추정량, 잔차의 순위를 기반으로 제안된 R 추정량 계열에서 높은 붕괴점 또는 높은 효율을 갖는 대표적인 추정량들을 다양한 모의실험을 통해 비교 연구하였다. 추정량의 성능을 비교하는데 효율성 뿐만 아니라 편의, 분산을 포함한 분포를 살펴보았다. 그 결과 실제 데이터 적용에는 MM 추정량과 GR 추정량이 좋은 성능을 가진 것으로 보였다.

불검출 자료를 포함한 작업환경측정 자료의 분석 방법 비교 (A Comparison of Analysis Methods for Work Environment Measurement Databases Including Left-censored Data)

  • 박주현;최상준;고동희;박동욱;성예지
    • 한국산업보건학회지
    • /
    • 제32권1호
    • /
    • pp.21-30
    • /
    • 2022
  • Objectives: The purpose of this study is to suggest an optimal method by comparing the analysis methods of work environment measurement datasets including left-censored data where one or more measurements are below the limit of detection (LOD). Methods: A computer program was used to generate left-censored datasets for various combinations of censoring rate (1% to 90%) and sample size (30 to 300). For the analysis of the censored data, the simple substitution method (LOD/2), β-substitution method, maximum likelihood estimation (MLE) method, Bayesian method, and regression on order statistics (ROS)were all compared. Each method was used to estimate four parameters of the log-normal distribution: (1) geometric mean (GM), (2) geometric standard deviation (GSD), (3) 95th percentile (X95), and (4) arithmetic mean (AM) for the censored dataset. The performance of each method was evaluated using relative bias and relative root mean squared error (rMSE). Results: In the case of the largest sample size (n=300), when the censoring rate was less than 40%, the relative bias and rMSE were small for all five methods. When the censoring rate was large (70%, 90%), the simple substitution method was inappropriate because the relative bias was the largest, regardless of the sample size. When the sample size was small and the censoring rate was large, the Bayesian method, the β-substitution method, and the MLE method showed the smallest relative bias. Conclusions: The accuracy and precision of all methods tended to increase as the sample size was larger and the censoring rate was smaller. The simple substitution method was inappropriate when the censoring rate was high, and the β-substitution method, MLE method, and Bayesian method can be widely applied.

한국 COVID-19 확진자 수에 대한 시계열 분석: HAR-TP-T 모형 접근법 (Time series analysis for Korean COVID-19 confirmed cases: HAR-TP-T model approach)

  • 유성민;황은주
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.239-254
    • /
    • 2021
  • 이 논문에서는, 2개의 혼합된 t-분포(TP-T)의 오차과정을 따르는 이질적 자기회귀 (HAR) 모형을 이용하여, 한국 코로나 (COVID-19) 확진자 수 데이터에 대한 시계열 분석, 즉 추정과 예측에 대하여 연구한다. HAR-TP-T 시계열 모형을 고려하여 HAR 모형의 계수 뿐 아니라 TP-T 오차과정의 모수를 추정하고자 단계별 추정법을 제안한다. 본 연구에서 제안하고 있는 단계별 추정법은, HAR 계수 추정을 위해서는 통상적 최소제곱추정법을 채택하고, TP-T 모수 추정을 위해서는 최대우도추정법을 이용한다. 단계별 추정법에 대한 모의실험을 수행하여, 성능이 우수함을 입증한다. 한국 코로나 확진자 수에 대한 실증적 데이터 분석에서, HAR 모형에서의 차수 p = 2, 3, 4에 대해, 모형의 평균제곱오차가 최소가 되도록 하는 최적화 시간간격(optimal lag)을 포함하여, 여러가지 시간간격을 고려한 HAR-TP-T 모형의 모수 추정값을 계산한다. 제안된 단계별 추정방법과 기존의 MLE만의 방법을, 추정 결과를 제시함으로 함께 비교한다. 본 연구에서 제안하고 있는 추정은 두 가지의 오차 측면, 즉 HAR 모형의 평균제곱오차와 잔차분포에 대한 밀도함수 추정의 평균제곱오차, 두 측면에서 모두 우수함을 입증하였다. 나아가, 추정 결과를 활용한 코로나 확진자 수 예측을 수행하였고, 예측정확도의 한 측도로서 mean absolute percentage error (MAPE)를 계산하여 0.0953%의 매우 작은 오차값을 얻었다. 본 연구에서 선택한 최적화 시간간격을 고려한 HAR-TP-T 시계열 모형 및 단계별 추정 방법은, 정확한 한국 코로나 확진자 수 예측 성능을 제공한다고 할 수 있다.

기하분포에 기초한 관리도에서 베이즈추정량과 최대우도추정량 사용의 성능 비교 (Comparisons of the Performance with Bayes Estimator and MLE for Control Charts Based on Geometric Distribution)

  • 홍휘주;이재헌
    • 응용통계연구
    • /
    • 제28권5호
    • /
    • pp.907-920
    • /
    • 2015
  • 기하분포에 기초한 관리도는 불량품이 드물게 발생하는 고품질공정에서 불량률의 변화를 효율적으로 탐지할 수 있다고 알려져 있다. 이러한 관리도를 사용할 때 기본적인 가정은 관리상태일 때의 불량률이 알려져 있거나 또는 정확하게 추정되었다는 것이다. 그러나 고품질공정에서 불량률은 아주 작기 때문에 이를 정확하게 추정하기가 쉽지 않으며 또한 아주 큰 표본크기가 필요한 경우도 종종 발생한다. 일반적으로 제1국면에서 관리상태의 불량률을 추정할 때 최대우도추정량을 사용하지만, 이 논문에서는 베이즈추정량의 사용을 제안하였다. 베이즈추정량을 사용할 경우 실무자의 사전지식을 반영할 수 있으며 표본에 불량품이 발견되지 않을 경우 발생하는 최대우도추정량의 문제점을 해결할 수 있다는 장점이 있다. 기하 관리도와 기하누적합 관리도에서 베이즈추정량을 사용한 경우와 최대우도추정량을 사용한 경우를 비교한 결과, 표본의 크기가 크지 않은 경우 베이즈추정량을 사용하는 것의 효율이 더 좋음을 알 수 있었다.

소 모기매개 바이러스성 질병의 Vector 감염률 추정을 위한 표본추출 전략 (A Sampling Strategy for Estimating Infection Rate in Vector Mosquitoes of Mosquito-borne Bovine Viral Diseases)

  • 박선일
    • 한국임상수의학회지
    • /
    • 제29권1호
    • /
    • pp.63-67
    • /
    • 2012
  • Mosquitoes are the vectors of a number of viral diseases in cattle, such as Akabane disease, bovine ephemeral fever, Ainovirus infection, Chuzan virus infection, and Ibaraki disease. These diseases are transmitted from an infected animal to a non-infected host via the blood feeding of the vector. In Korea, the National Veterinary Research and Quarantine Services, Ministry for Food, Agriculture, Forestry and Fisheries is responsible for planning, implementation, laboratory investigations and reporting the results of the national surveillance program for mosquito-borne bovine diseases (MBD). The surveillance program, which was started in 1993, focused to determine the seroprevalence of each disease in cattle herds in space and time. From the epidemiological point of view, more important component of the surveillance program is to monitor infection rates in vectors for specific pathogens because this information is essential for a more precise understanding the dynamics of these diseases in a given environment and for determining risk of transmission. The aim of this study was to describe and compare methods for estimation of vector infection rates using maximum likelihood (MLE) and minimum infection rate in pooled samples. Factors affecting MLE such as number of pools, pooling size and diagnostic test performance are also discussed, assuming some hypothetical sampling scenarios for MBD.

적합도 검정을 통한 핸드오프 시간의 확률분포 추정 (Estimation of the Probability Distribution for Handoff Duration Time through Goodness of Fit Test)

  • 임석구
    • 디지털콘텐츠학회 논문지
    • /
    • 제8권1호
    • /
    • pp.77-83
    • /
    • 2007
  • 이동가입자 수신단에서의 평균 수신전력 레벨이 핸드오프 임계값과 수신기 임계값 사이에 있는 영역을 핸드오프 영역이라 하며, 가입자가 핸드오프 영역에 머무르는 시간을 핸드오프 시간으로 정의한다. 본 논문에서는 이동통신시스템에서 트래픽 모델링 시 중요한 파라메타중 하나인 핸드오프 시간에 대한 확률분포를 추정한다. 첫 번째로 핸드오프 시간의 분포군을 선택하기 위해 시뮬레이션 결과로부터 얻어진 샘플 데이터를 이용하여 점 통계량을 적용하며, 두 번째로 구체적인 분포함수를 결정하기 위해서 모수(parameter)의 값들을 추정하는데, 이를 위해 최우추정량(MLE)을 사용하여 모수의 값들을 산출하고 이를 토대로 적합도 점정을 수행한다. 최종적인 분석 결과 핸드오프 시간은 감마분포를 따르는 것을 제시하였다.

  • PDF

베이지안 추정법을 활용한 댐 추가방류수의 경제적 가치 추정 - 충주댐 사례 (Estimation of the value of dam flushing by using Bayesian analysis - the case of Chungju dam)

  • 이주석;최한주;유승훈
    • 한국수자원학회논문집
    • /
    • 제50권7호
    • /
    • pp.467-473
    • /
    • 2017
  • 최근 녹조현상이 심화되면서 이를 해결하기 위한 방안으로 댐의 추가방류에 대한 필요성이 제기되고 있다. 따라서 보다 합리적인 댐 추가방류와 관련된 정책 수립을 위해서 댐의 추가방류수에 대한 경제적 가치 측정의 필요성이 제기되고 있다. 이에 본 논문에서는 녹조 저감과 수질개선을 위한 댐의 추가방류에 대한 경제적 가치를 도출하기 위하여 일반가구의 지불의사액을 분석하고자 한다. 한편 연구방법론적인 측면에서 조건부 가치측정법(CVM)을 적용하되, 최우추정법(Maximum Likelihood Estimation)을 이용하는 기존의 CVM 연구와 달리 베이지안(Bayesian) 추정법을 적용하였다. 본 연구는 전국의 1,000가구를 대상으로 충주댐의 추가방류를 현재보다 200% 증가시켰을 경우를 가정하여 댐 추가방류의 사회적 편익 즉, 조류저감 효과를 산정하였다. 분석결과 가구당 연간 WTP는 1,909.3원으로 이를 연간 총편익으로 계산하면 357.1억 원, 10.56원/$m^3$이다.

Bayesian MCMC를 이용한 저수량 점 빈도분석: I. 이론적 배경과 사전분포의 구축 (At-site Low Flow Frequency Analysis Using Bayesian MCMC: I. Theoretical Background and Construction of Prior Distribution)

  • 김상욱;이길성
    • 한국수자원학회논문집
    • /
    • 제41권1호
    • /
    • pp.35-47
    • /
    • 2008
  • 저수분석(low flow analysis)은 수자원공학에서 중요한 분야 중 하나이며, 특히 저수량 빈도분석(low flow frequency analysis)의 결과는 저수(貯水)용량의 설계, 물 수급계획, 오염원의 배치 및 관개와 생태계의 보존을 위한 수량과 수질의 관리에 중요하게 사용된다. 그러므로 본 연구에서는 저수량 빈도분석을 위한 점 빈도분석을 수행하였으며, 특히 빈도분석에 있어서의 불확실성을 탐색하기 위하여 Bayesian 방법을 적용하고 그 결과를 기존에 사용되던 불확실성 탐색방법과 비교하였다. 본 논문의Ⅰ편에서는 Bayesian 방법 중 사전분포(prior distribution)와 우도함수(likelihood function)의 복잡성에 상관없이 계산이 가능한 Bayesian MCMC(Bayesian Markov Chain Monte Carlo) 방법과 Metropolis-Hastings 알고리즘을 사용하기 위한 여러 과정의 이론적 배경과 Bayesian 방법에서 가장 중요한 요소인 사전분포를 구축하고 이를 비교 및 평가하였다. 고려된 사전분포는 자료에 기반하지 않은 사전분포와 자료에 기반한 사전분포로써 두 사전분포를 이용하여 Metropolis-Hastings 알고리즘을 수행하고 그 결과를 비교하여 저수량 빈도분석에 합리적인 사전분포를 선정하였다. 또한 알고리즘의 수행과정에서 필요한 제안분포(proposal distribution)를 적용하여 그에 따른 알고리즘의 효율성을 채택률(acceptance rate)을 산정하여 검증해 보았다. 사전분포의 분석 결과, 자료에 기반한 사전분포가 자료에 기반하지 않은 사전분포보다 정확성 및 불확실성의 표현에 있어서 우수한 결과를 제시하는 것을 확인할 수 있었고, 채택률을 이용한 알고리즘의 효용성 역시 기존 연구자들이 제시하였던 만족스러운 범위를 가지는 것을 알 수 있었다. 최종적으로 선정된 사전분포는 본 연구의 II편에서 Bayesian MCMC방법의 사전분포로 이용되었으며, 그 결과를 기존 불확실성의 추정방법의 하나인 2차 근사식을 이용한 최우추정(maximum likelihood estimation)방법의 결과와 비교하였다.

허스트 지수 산정 방법에 대한 고찰 (On the Estimation Techniques of Hurst exponent)

  • 김병식;김형수;서병하
    • 한국수자원학회논문집
    • /
    • 제37권12호
    • /
    • pp.993-1007
    • /
    • 2004
  • 허스트 지수를 산정하기 위하여 기존에 여러 방법론들이 제안되어 왔다. 그러나, 이들 방법론들은 시계열들의 지속성에 대하여 각기 다른 특성들을 보이고 있음을 기존의 연구에서 알 수 있다 따라서 본 연구에서는 수문학에서 주로 이용하고 있는 보정용량, 조정용량, 수정조정용량 방법 이외에 생리학 분야와 전자 분야 등에서 이용되고 있는 1/f 파워 스펙트럼 밀도 분석, DFA, AVT 방법, 최우도법 등을 이용하여 허스트 지수를 산정하여 보았다. 즉, 단기간과 장기간 기억을 가진 카오스와 추계학적 시계열들에 대하여 각각의 방법들을 적용하여 비교 분석하고자 하였으며, 각 방법론들에 대한 장점 및 단점 그리고 한계에 대하여 논의하였다.