• 제목/요약/키워드: Markov chain Monte Carlo sampling

검색결과 63건 처리시간 0.029초

비모수 베이지안 겉보기 무관 회귀모형 (A nonparametric Bayesian seemingly unrelated regression model)

  • 조성일;석인혜;최태련
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.627-641
    • /
    • 2016
  • 본 논문에서는 겉보기 무관 회귀모형을 고려하고 디리크레 프로세스 혼합모형을 오차항의 분포로 하는 비모수 베이지안 방법을 제안한다. 제안된 모형을 바탕으로 사후분포를 유도하고 디리크레 프로세스 혼합모형의 붕괴깁스표집 방법을 통해 마코프 체인 몬테 칼로 알고리듬을 구성하고 사후추론을 실시한다. 모형의 성능을 비교하기 위해 모의실험을 실시하고, 더 나아가 한국지역의 강수량 예측에 대한 실제 자료에 적용해 본다.

A Bayesian state-space production model for Korean chub mackerel (Scomber japonicus) stock

  • Jung, Yuri;Seo, Young Il;Hyun, Saang-Yoon
    • Fisheries and Aquatic Sciences
    • /
    • 제24권4호
    • /
    • pp.139-152
    • /
    • 2021
  • The main purpose of this study is to fit catch-per-unit-effort (CPUE) data about Korea chub mackerel (Scomber japonicus) stock with a state-space production (SSP) model, and to provide stock assessment results. We chose a surplus production model for the chub mackerel data, namely annual yield and CPUE. Then we employed a state-space layer for a production model to consider two sources of variability arising from unmodelled factors (process error) and noise in the data (observation error). We implemented the model via script software ADMB-RE because it reduces the computational cost of high-dimensional integration and provides Markov Chain Monte Carlo sampling, which is required for Bayesian approaches. To stabilize the numerical optimization, we considered prior distributions for model parameters. Applying the SSP model to data collected from commercial fisheries from 1999 to 2017, we estimated model parameters and management references, as well as uncertainties for the estimates. We also applied various production models and showed parameter estimates and goodness of fit statistics to compare the model performance. This study presents two significant findings. First, we concluded that the stock has been overexploited in terms of harvest rate from 1999 to 2017. Second, we suggest a SSP model for the smallest goodness of fit statistics among several production models, especially for fitting CPUE data with fluctuations.

The Impact of Foreign Ownership on Capital Structure: Empirical Evidence from Listed Firms in Vietnam

  • NGUYEN, Van Diep;DUONG, Quynh Nga
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제9권2호
    • /
    • pp.363-370
    • /
    • 2022
  • The study aims to probe the impact of foreign ownership on Vietnamese listed firms' capital structure. This study employs panel data of 288 non-financial firms listed on the Ho Chi Minh City stock exchange (HOSE) and Ha Noi stock exchange (HNX) in 2015-2019. In this research, we applied a Bayesian linear regression method to provide probabilistic explanations of the model uncertainty and effect of foreign ownership on the capital structure of non-financial listed enterprises in Vietnam. The findings of experimental analysis by Bayesian linear regression method through Markov chain Monte Carlo (MCMC) technique combined with Gibbs sampler suggest that foreign ownership has substantial adverse effects on the firms' capital structure. Our findings also indicate that a firm's size, age, and growth opportunities all have a strong positive and significant effect on its debt ratio. We found that the firms' profitability, tangible assets, and liquidity negatively and strongly affect firms' capital structure. Meanwhile, there is a low negative impact of dividends and inflation on the debt ratio. This research has ramifications for business managers since it improves a company's financial resources by developing a strong capital structure and considering foreign investment as a source of funding.

Model-independent Constraints on Type Ia Supernova Light-curve Hyperparameters and Reconstructions of the Expansion History of the Universe

  • Koo, Hanwool;Shafieloo, Arman;Keeley, Ryan E.;L'Huillier, Benjamin
    • 천문학회보
    • /
    • 제45권1호
    • /
    • pp.48.4-49
    • /
    • 2020
  • We reconstruct the expansion history of the universe using type Ia supernovae (SN Ia) in a manner independent of any cosmological model assumptions. To do so, we implement a nonparametric iterative smoothing method on the Joint Light-curve Analysis (JLA) data while exploring the SN Ia light-curve hyperparameter space by Markov Chain Monte Carlo (MCMC) sampling. We test to see how the posteriors of these hyperparameters depend on cosmology, whether using different dark energy models or reconstructions shift these posteriors. Our constraints on the SN Ia light-curve hyperparameters from our model-independent analysis are very consistent with the constraints from using different parameterizations of the equation of state of dark energy, namely the flat ΛCDM cosmology, the Chevallier-Polarski-Linder model, and the Phenomenologically Emergent Dark Energy (PEDE) model. This implies that the distance moduli constructed from the JLA data are mostly independent of the cosmological models. We also studied that the possibility the light-curve parameters evolve with redshift and our results show consistency with no evolution. The reconstructed expansion history of the universe and dark energy properties also seem to be in good agreement with the expectations of the standard ΛCDM model. However, our results also indicate that the data still allow for considerable flexibility in the expansion history of the universe. This work is published in ApJ.

  • PDF

영 과잉 포아송 모형에 대한 베이지안 방법 연구 (Bayesian Approaches to Zero Inflated Poisson Model)

  • 이지호;최태련;우윤성
    • 응용통계연구
    • /
    • 제24권4호
    • /
    • pp.677-693
    • /
    • 2011
  • 본 논문에서는 영 과잉 계수형 자료 분석을 위한 모형중의 하나인 영 과잉 포아송 모형의 베이지안 접근 방법에 대해서 연구한다. 구체적으로는 베이지안 영 과잉 포아송 모형의 적합을 위한 사후 표본을 추출하는데 있어서, 깁스 표집기(Gibbs sampler)를 이용하는 마르코프 연쇄 몬테칼로(MCMC) 방법과 역 베이즈공식(IBF)에 의한 표본추출 방법 두 가지를 고려한다. 이러한 두 가지 사후 표본 추출방법을 비교 설명하고, IBF를 통한 사후표본을 깁스 표집기 사후표본의 수렴성 여부를 확인하는 방식에 대해서도 소개한다. 이를 바탕으로 베이지안 영 과잉 포아송 모형을 Trajan이라는 사과 품종의 발아자료(Trajan data, Marin 등, 1993)에 적용하고 모수에 대한 사후추론을 실시하고 기존의 결과와 비교한다. 또한 주어진 자료에 대하여 영 과잉 포아송 모형이 적합한지에 대한 여부를 여러 가지 모형선택 기준을 통해서 살펴보고, 아울러 기존의 자료 분석 결과 (Rodrigues, 2003)를 보완하기 위하여 계층적 베이지안 모형과 같은 대안에 대해서도 논의해본다.

보조 혼합 샘플링을 이용한 베이지안 로지스틱 회귀모형 : 당뇨병 자료에 적용 및 분류에서의 성능 비교 (Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data)

  • 이은희;황범석
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.131-146
    • /
    • 2022
  • 로지스틱 회귀 모형은 다양한 분야에서 범주형 종속 변수를 예측하거나 분류하기 위한 모형으로 많이 사용되고 있다. 로지스틱 회귀 모형에 대한 전통적인 베이지안 추론 기법으로 메트로폴리스-헤이스팅스 알고리즘이 많이 사용되었지만, 수렴의 속도가 느리고 제안 분포에 대한 적절성을 보장하기 어렵다. 따라서, 본 논문에서는 모형에 대한 베이지안 추론 방법으로 Frühwirth-Schnatter와 Frühwirth (2007)에서 제안된 보조 혼합 샘플링(auxiliary mixture sampling) 기법을 사용하였다. 이 방법은 모형의 선형성과 정규성을 만족시키기 위해 두 단계에 거쳐 잠재변수를 도입하며, 결과적으로 깁스 샘플링을 통한 추론을 가능하게 한다. 제안한 모형의 효과를 검증하기 위해 2020년 지역사회 건강조사 당뇨병 자료에 적용하여 메트로폴리스-헤이스팅스를 사용한 모형과 추론 결과를 비교 분석하였다. 또한, 다양한 분류 모형들과 본 논문에서 제안한 모형의 분류 성능을 비교한 결과 제안된 모형이 분류 분석에서도 좋은 성능을 보이는 것을 확인할 수 있었다.

Non-Simultaneous Sampling Deactivation during the Parameter Approximation of a Topic Model

  • Jeong, Young-Seob;Jin, Sou-Young;Choi, Ho-Jin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권1호
    • /
    • pp.81-98
    • /
    • 2013
  • Since Probabilistic Latent Semantic Analysis (PLSA) and Latent Dirichlet Allocation (LDA) were introduced, many revised or extended topic models have appeared. Due to the intractable likelihood of these models, training any topic model requires to use some approximation algorithm such as variational approximation, Laplace approximation, or Markov chain Monte Carlo (MCMC). Although these approximation algorithms perform well, training a topic model is still computationally expensive given the large amount of data it requires. In this paper, we propose a new method, called non-simultaneous sampling deactivation, for efficient approximation of parameters in a topic model. While each random variable is normally sampled or obtained by a single predefined burn-in period in the traditional approximation algorithms, our new method is based on the observation that the random variable nodes in one topic model have all different periods of convergence. During the iterative approximation process, the proposed method allows each random variable node to be terminated or deactivated when it is converged. Therefore, compared to the traditional approximation ways in which usually every node is deactivated concurrently, the proposed method achieves the inference efficiency in terms of time and memory. We do not propose a new approximation algorithm, but a new process applicable to the existing approximation algorithms. Through experiments, we show the time and memory efficiency of the method, and discuss about the tradeoff between the efficiency of the approximation process and the parameter consistency.

디리슈레 혼합모형을 이용한 함정 전투체계 부품의 고장시간 분포 추정 (An Application of Dirichlet Mixture Model for Failure Time Density Estimation to Components of Naval Combat System)

  • 이진환;김정훈;정봉주;김경택
    • 산업경영시스템학회지
    • /
    • 제42권4호
    • /
    • pp.194-202
    • /
    • 2019
  • Reliability analysis of the components frequently starts with the data that manufacturer provides. If enough failure data are collected from the field operations, the reliability should be recomputed and updated on the basis of the field failure data. However, when the failure time record for a component contains only a few observations, all statistical methodologies are limited. In this case, where the failure records for multiple number of identical components are available, a valid alternative is combining all the data from each component into one data set with enough sample size and utilizing the useful information in the censored data. The ROK Navy has been operating multiple Patrol Killer Guided missiles (PKGs) for several years. The Korea Multi-Function Control Console (KMFCC) is one of key components in PKG combat system. The maintenance record for the KMFCC contains less than ten failure observations and a censored datum. This paper proposes a Bayesian approach with a Dirichlet mixture model to estimate failure time density for KMFCC. Trends test for each component record indicated that null hypothesis, that failure occurrence is renewal process, is not rejected. Since the KMFCCs have been functioning under different operating environment, the failure time distribution may be a composition of a number of unknown distributions, i.e. a mixture distribution, rather than a single distribution. The Dirichlet mixture model was coded as probabilistic programming in Python using PyMC3. Then Markov Chain Monte Carlo (MCMC) sampling technique employed in PyMC3 probabilistically estimated the parameters' posterior distribution through the Dirichlet mixture model. The simulation results revealed that the mixture models provide superior fits to the combined data set over single models.

잠재변수를 이용한 NHPP 베이지안 소프트웨어 신뢰성 모형에 관한 연구 (The NHPP Bayesian Software Reliability Model Using Latent Variables)

  • 김희철;신현철
    • 융합보안논문지
    • /
    • 제6권3호
    • /
    • pp.117-126
    • /
    • 2006
  • 본 논문은 소프트웨어 신뢰성장 모형에 대한 베이지안 모수추론과 모형선택 방법이 연구되었다. 소프트웨어 성장 모형은 내재되어 있는 오류와 고장 간격시간으로 모형화하면 소프트웨어 개발 단계에서 유용하게 사용할 수 있다. 본 논문에서는 사후 분포의 정보를 얻기 위한 다중 적분문제에 있어서 일종의 마코브 체인 몬테칼로 방법인 깁스 샘플링을 사용하여 사후 분포의 계산이 이루어졌다. 확산 사전 분포를 가진 소프트웨어 신뢰성에 의존된 일반적 순서 통계량 모형에 대하여 베이지안 모수 추정이 이루어 졌고 효율적인 모형의 선택방법도 시행되었다. 모형 설정과 선택 판단기준은 편차 자승합을 이용한 적합도 검정과 추세 검정이 사용되었다. 본 논문에서 사용된 소프트웨어 고장 자료는 Minitab(version 14) 통계 페키지에 있는 와이블분포(형상모수가 2이고 척도모수가 5)에서 발생시킨 30개의 난수를 이용한 모의 실험자료를 이용하여 고장자료 분석을 시행하였다.

  • PDF

비정상성 가뭄빈도 해석 기법에 따른 가뭄 심도-지속기간-재현기간 곡선 유도에 관한 연구 (A Study on derivation of drought severity-duration-frequency curve through a non-stationary frequency analysis)

  • 정민수;박서연;장호원;이주헌
    • 한국수자원학회논문집
    • /
    • 제53권2호
    • /
    • pp.107-119
    • /
    • 2020
  • 본 연구는 한반도의 관측 강우자료를 기반으로 하여 과거의 가뭄 특성을 파악함과 동시에 RCP 8.5 기후변화 시나리오를 활용한 장래 발생 가능한 극치 가뭄에 대한 장기전망을 수행하였다. 정량적인 가뭄 분석을 위해 기상학적 가뭄지수인 표준강수지수(Standardized Precipitation Index, SPI)를 적용하였으며 일단위 강우 관측 자료 및 RCP 시나리오를 단일한 장기 시계열 자료로 구축하여 1, 3, 6, 9, 12개월 지속기간의 SPI 입력인자로 활용하였다. 한반도의 지역별 가뭄특성 분석을 위한 대상 강우관측소는 1954년 시점부터 강우 자료를 보유하고 있는 12개 관측 지점을 선정하였으며, 동일 지점의 10개 GCM(General Circulation Model)을 적용하였다. 기후변화에 따른 가뭄 특성 변화 분석을 위해 강우발생일수와 총강수량에 대한 12개 강우관측소별 추세 변동 분석 및 군집화를 수행하였다. 샘플링 기법을 활용한 비정상성 빈도분석을 위해 베이지안 기반의 DE(Differential Evolution)와 MCMC(Markov Chain Monte Carlo)를 결합한 DEMC 기법을 채택하였고, 비정상성 가뭄빈도해석을 통하여 12개 지점별 SDF(Severity-Duration-Frequency) 곡선을 유도하였다. 비정상성을 가정한 장기 수문자료를 보유한 지점들의 SDF 곡선 산정을 통해 미래의 가뭄에 대한 정량적인 전망을 수행하였다. 장기시계열 자료를 보유한 12개 지점의 군집분석을 수행한 결과 Zone 1-2, 2, 3-2에 해당하는 제주를 제외한 전주, 광주, 여순, 목포, 추풍령 등에서 장래에 가뭄발생 위험이 높은 것으로 분석되었다. 장래 발생 가능한 가뭄 위험성을 정량적으로 파악함으로써 미래 가뭄관리 정책에 충분히 활용될 수 있을 것으로 기대된다.