• 제목/요약/키워드: Bayesian 모형

검색결과 398건 처리시간 0.024초

다중대체와 재현자료 작성 (Multiple imputation and synthetic data)

  • 김정연;박민정
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.83-97
    • /
    • 2019
  • 사회가 발전함에 따라 이용자의 다양한 분석 요구에 대응하기 위해 개인 단위로 구성된 마이크로데이터 제공이 증가했다. 나아가 센서스, 행정자료와 같은 전수자료를 마이크로데이터 형태로 제공받아 연구하고자 하는 요구 역시 커지고 있다. 정책결정, 학술목적 등을 위한 마이크로데이터 분석은 가치 창출 측면에서 대단히 바람직하다. 하지만 자료 유용성이 확보된 마이크로데이터 제공은 개인정보가 노출될 가능성이라는 위험을 가질 수 밖에 없다. 이에, 자료의 유용성을 확보하면서 개인정보보호를 보장할 수 있는 여러 방법들이 고려되어 왔다. 이러한 방법 중 하나로 재현자료(synthetic data)를 생성해서 활용하는 방법이 연구되어 왔다. 본 논문은 재현자료 생성과 관련된 방법론 및 주의사항을 소개하여, 재현자료의 이해를 도모하고자 한다. 이를 위해 재현자료 작성에 필수적인 다중대체, 베이지안 예측 모형 및 베이지안 붓스트랩 등의 개념들을 먼저 설명하고, 완전 재현자료 및 부분 재현자료에 대해 살펴본다. 특히, 재현자료 작성을 심도 깊이 이해하기 위해 순차회귀 다중대체(sequential regression multivariate imputation)를 이용해 경시적(longitudinal) 자료를 재현자료로 작성하는 구체적 사례를 살펴본다.

데이터 마이닝 기법을 이용한 직무교육 성취집단 예측모형 개발

  • 곽기효;서용무
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.318-323
    • /
    • 2007
  • 국방부에서 발표한 ‘국방개혁에 관한 법률’ 에 따라 2014년까지 현역병들에 대한 복무기간이 단계적으로 단축될 예정이다. 이에 따라 좀 더 효율적인 직무교육 방안이 필요하게 되어, ‘차등제 교육’을 시행하고 있다. 이 교육의 효과를 향상시키기 위해서는 훈련병들의 예상 학업 성취도를 미리 정확하게 예측하는 것이 필수적이다. 따라서, 본 연구에서는 입교 초기에 얻을 수 있는 신병들의 제한된 자료들을 이용하여 교육 성취도 예측 모형을 개발하였다. 본 모형의 목적 변수는 ‘일반관리 인원’, ‘집중관리 인원’의 값을 갖는 이진형 성취집단 변수이며, 사용된 기법은 k-means 군집기볍과 Decision Tree 기법을 혼합한 모형, k-means 군집기법과 Neural Network 기법을 혼합한 모형, Decision Tree 모형, Neural Network 모형, Bayesian 모형, 그리고 Logistic 모형 등을 사용하였다. 그 결과 k-means 군집기법과 Decision Tree를 혼합한 모형이 가장 좋은 예측력올 보이는 것으로 나타났다. 이러한 교육 성취집단 예측 모형은 향후 군에서 이루어지는 다양한 교육 프로그램에 적극적으로 이용될 수 있을 것으로 기대된다.

  • PDF

열화시스템의 수리를 위한 베이지안 의사결정 모형의 개발 (A Bayesian Decision Model for a Deteriorating Repairable System)

  • 김택상;안선응
    • 대한산업공학회지
    • /
    • 제32권2호
    • /
    • pp.141-152
    • /
    • 2006
  • This paper presents the development of a decision model to examine the optimal repair action for a deteriorating system. In order to make a reasonable decision, it is necessary to perform an analysis of the uncertainties embedded in deterioration and to evaluate the repair actions based on the expected future cost. Focusing on the power law failure model, the uncertainties related to deterioration are analyzed based on the Bayesian approach. In addition, we develop a decision model for the optimal repair action by applying a repair cost function. A case study is given to illustrate a decision-making process by analyzing the loss incurred due to deterioration.

베이지안 추정법을 이용한 양분선택형 조건부 가치측정모형의 분석 (Using Bayesian Estimation Technique to Analyze a Dichotomous Choice Contingent Valuation Data)

  • 유승훈
    • 자원ㆍ환경경제연구
    • /
    • 제11권1호
    • /
    • pp.99-119
    • /
    • 2002
  • As an alternative to classical maximum likelihood approach for analyzing dichotomous choice contingent valuation (DCCV) data, this paper develops a Bayesian approach. By using the idea of Gibbs sampling and data augmentation, the approach enables one to perform exact inference for DCCV models. A by-product from the approach is welfare measure, such as the mean willingness to pay, and its confidence interval, which can be used for policy analysis. The efficacy of the approach relative to the classical approach is discussed in the context of empirical DCCV studies. It is concluded that there appears to be considerable scope for the use of the Bayesian analysis in dealing with DCCV data.

  • PDF

구조변화가 발생한 단순 상태공간모형에서의 적응적 예측을 위한 베이지안접근 (A Bayesian Approach for the Adaptive Forecast on the Simple State Space Model)

  • 전덕빈;임철주;이상권
    • 대한산업공학회지
    • /
    • 제24권4호
    • /
    • pp.485-492
    • /
    • 1998
  • Most forecasting models often fail to produce appropriate forecasts because we build a model based on the assumption of the data being generated from the only one stochastic process. However, in many real problems, the time series data are generated from one stochastic process for a while and then abruptly undergo certain structural changes. In this paper, we assume the basic underlying process is the simple state-space model with random level and deterministic drift but interrupted by three types of exogenous shocks: level shift, drift change, outlier. A Bayesian procedure to detect, estimate and adapt to the structural changes is developed and compared with simple, double and adaptive exponential smoothing using simulated data and the U.S. leading composite index.

  • PDF

결합확률모델 및 기상변량을 이용한 예측강수의 편의보정 기법 (Joint Probability Approach to Bias Correction on Rainfall Forecasting Using Climate State Variables)

  • 정민규;김태정;황규남;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.309-309
    • /
    • 2019
  • 기후예측모델을 통해 일단위 강수의 예측정보가 제공되고 있지만, 실제 강수량자료와 시공간적 편의로 인해 수문학적 활용은 한계가 있다. 일반적으로 기후모델의 시공간적 해석 규모 및 예측정확성을 고려할 때 계절단위에서 예측정보의 활용이 가장 현실적인 것으로 알려지고 있다. 그러나 수문해석 시 시공간적 해상도가 낮아 직접적인 활용은 어려운 상황이며, 수문해석 모형의 입력자료로 활용 시 편의보정 및 상세화 과정이 일반적으로 요구된다. 본 연구에서는 기후모델로부터 얻은 강우예측결과에 Bayesian 모델 기반의 편의보정-상세화 기법을 개발하여 강우예측정보의 활용성을 개선하고자 한다. 이 과정에서 Bayesian Copula 모델을 이용한 이변량 형태의 예측강수의 검보정 방법을 개발하였으며, 특히 기후모델 이외의 기상 상태변량인 해수면온도(sea surface temperature, SST)를 예측인자로 추가하여 Hybrid 형태의 계절 앙상블 강우예측모델을 개발하고자 한다.

  • PDF

극치자료계열의 Scaling 특성과 Bayesian GLM Model을 이용한 지역빈도해석 (A Bayesian GLM Model Based Regional Frequency Analysis Using Scaling Properties of Extreme Rainfalls)

  • 김진영;권현한;이병석
    • 대한토목학회논문집
    • /
    • 제37권1호
    • /
    • pp.29-41
    • /
    • 2017
  • 확률강수량 산정은 하천관리, 수공구조물 설계 및 위험도 분석에 있어 중요한 기초적인 자료 중 하나이다. 실무에서는 대표지속시간에 대해서 지점빈도해석을 통해 확률강수량을 추정하고 이를 지속시간에 대해서 회귀분석을 실시하여 IDF (intensity-duration-frequency) 곡선을 작성한다. 이들 IDF곡선을 활용하여 기타 지속시간에 대해서는 내삽 또는 외삽으로 보간 하여 확률강수량 추정이 이루어지고 있다. 우리나라의 경우 상대적으로 자료 연한이 짧은 점을 고려한다면, 보다 정확하고 신뢰성 있는 확률강수량 산정 기법의 필요성이 대두되고 있다. 이러한 이유로 본 연구에서는 Bayesian GLM 모형을 통하여 자료의 확률분포 매개변수의 Scaling 특성을 고려할 수 있는 지역빈도해석 모형을 개발하였다. 모형 적용결과 개별지점에서 효과적인 매개변수 추정뿐만 아니라, 유역전체의 특성을 대표하는 매개변수 추정이 가능하였다. 본 연구결과를 통해 도출된 IDF 곡선은 향후 다양한 수자원분야의 기초자료로 활용될 수 있을 것으로 기대되며, 미계측유역 또는 지속시간별 자료가 불충분한 지역에 대해서도 활용이 가능할 것으로 판단된다.

베이지안 포아송 모형을 적용한 자기-대조 환자군 연구에서의 약물상호작용 위험도 분석 (A Bayesian Poisson model for analyzing adverse drug reaction in self-controlled case series studies)

  • 이은채;황범석
    • 응용통계연구
    • /
    • 제33권2호
    • /
    • pp.203-213
    • /
    • 2020
  • 자기-대조 환자군(self-controlled case series; SCCS) 연구는 별도의 대조군 없이 환자의 비노출기간을 대조기간으로 설정하여 노출기간에 대한 상대적인 발생 위험도를 측정하는 역학 연구의 한 방법이다. 이 방법은 대조군을 선정할 때 발생하는 편의를 최소화할 수 있는 장점이 있어서 약물 복용 후 이상반응 발생 위험도를 측정하기 위한 방법으로 전통적으로 많이 사용되어왔다. 본 연구는 SCCS 연구를 바탕으로 두 개 이상의 약물을 동시에 사용했을 때 그 부작용의 위험이 어떻게 증가하는지 살펴보고자 한다. 마약성 진통제 유사체인 tramadol과 다빈도 병용 약물 간 약물상호작용에 대해 조건부 포아송 모형을 가정하고 분석하였다. 이때 베이지안 추론법을 사용하여 최대가능도추정량이 지니고 있는 과대적합 문제를 해결하며, 사전분포의 민감도를 측정하기 위해 정규 사전분포와 라플라스 사전분포를 가정하여 모형화하였다.

다중 Logistic 회귀분석을 통한 침수지역의 확률적 도출 (The probabilistic estimation of inundation region using a multiple logistic regression analysis)

  • 정민규;김진국;오랑치맥 솜야;권현한
    • 한국수자원학회논문집
    • /
    • 제53권2호
    • /
    • pp.121-129
    • /
    • 2020
  • 도시화로 인한 불투수층 증가와 하천 주변 개발은 홍수 시 위험에 노출되는 재해요인의 증가뿐 아니라 피해의 파급을 발생시켜 홍수 관리 측면에서 어려움을 낳는다. 홍수 방재대책을 위해서는 도시지역에 분포하는 다양한 지표면 공간특성을 반영하여 침수가 예상되는 지역에 대한 파악이 우선시되어야 한다. 본 연구에서는 도시하천의 홍수 위험지역을 대상으로 확률적 홍수위험 평가가 수행되었다. 홍수와 관련된 지형적 영향요인인 고도, 경사, 유출곡선지수, 하천까지 거리를 예측변수로 하여 하천 주변 침수 예상지역을 설명하기 위해 모형의 학습데이터로 100년 빈도 홍수위험 지도가 사용되었다. 연구 대상 지역은 격자로 변환하여 Bayesian Logistic 회귀분석을 수행하여 각 격자별로 홍수영향요인이 침수 여부를 설명하는 모형을 구축하였다. 최종적으로 모형을 통해 대상 지역 전체에 대하여 침수위험도를 확률적으로 제시하였다.

베이지안 동태확률일반균형모형을 이용한 유가충격 및 에너지 소비구조 전환의 효과분석 (A Study on the Effects of Oil Shocks and Energy Efficient Consumption Structure with a Bayesian DSGE Model)

  • 차경수
    • 자원ㆍ환경경제연구
    • /
    • 제19권2호
    • /
    • pp.215-242
    • /
    • 2010
  • 본 연구는 유가충격 및 에너지절감유도정책충격의 효과를 고려할 수 있는 베이지안 동태확률일반균형모형의 구축을 통해 이들 외생적 충격들의 역할과 함께 현재 우리나라에서 진행 중인 고효율 에너지 소비구조로의 전환이 유발시키는 경제적 효과에 관해 분석하였다. 분석 결과에 의하면 유가상승충격은 소비, 고용, 투자 및 산출량에 부정적 효과를 주었으며, 자본 1단위당 에너지 소비량 절감을 유발시키는 에너지절감유인정책충격은 에너지 소비량의 절감과 함께 소비, 고용, 투자 및 산출량에 긍정적 효과를 주는 것으로 나타났다. 특히, 분산분해 결과는 유가충격이 설비가동률, 에너지 소비량 및 산출량의 단기적 총 변동에 가장 큰 영향을 미치며, 에너지절약정책충격 역시 기술충격과 유가충격에 비해 그 크기와 지속성 면에서 미미한 수준이나, 이들 변수들의 단기적 총 변동을 일정부분 설명할 수 있는 것으로 나타났다. 마지막으로 석유소비의 비중 축소 및 에너지 소비의 효율성 증대는 유가충격이 주는 부정적 효과를 약화시켜, 이와 같은 에너지 소비구조의 전환이 유가변동의 충격을 축소시키고 있다는 최근의 논의들과 부합됨을 확인할 수 있었다.

  • PDF