• 제목/요약/키워드: Bayesian hierarchical model

검색결과 128건 처리시간 0.027초

무응답을 가지고 있는 범주형 자료에 대한 모형 선택 방법 (Model selection method for categorical data with non-response)

  • 윤용화;최보승
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.627-641
    • /
    • 2012
  • 본 연구는 다차원 분할표 형태로 정리된 범주형 자료가 결측치나 무응답을 가지고 있을 때 주어진 자료를 가장 잘 설명하고 예측의 정확도를 높일 수 있는 모형의 추정과 모형의 선택 문제를 다루었다. 무시할 수 없는 무응답 (non-ignorable non-response)체계하에서 최대우도 추정에서 발생할 수 있는 변방값 문제를 해결하기 위하여 계층적 베이지안 모형을 고려하였다. 또한 모형 적도를 높이기 위한 변수 조합을 찾는 모형 선택의 문제를 함께 다루었다. 베이지안 접근하에서 모형 선택의 문제를 다루기 위하여 베이즈 인자 (Bayes factor)를 모형 선택의 기준으로 이용하였다. 제시된 방법은 2004년 실시된 우리나라 국회의원 선거를 앞두고 수행된 여론조사 데이터를 이용하여 실증분석을 수행하였다. 분석결과 무시할 수 없는 무응답 체계하에서 설명변수로 투표참여여부를 이용하는 것이 가장 적합한 모형으로 판명되었다.

Korean Welfare Panel Data: A Computational Bayesian Method for Ordered Probit Random Effects Models

  • Lee, Hyejin;Kyung, Minjung
    • Communications for Statistical Applications and Methods
    • /
    • 제21권1호
    • /
    • pp.45-60
    • /
    • 2014
  • We introduce a MCMC sampling for a generalized linear normal random effects model with the ordered probit link function based on latent variables from suitable truncated normal distribution. Such models have proven useful in practice and we have observed numerically reasonable results in the estimation of fixed effects when the random effect term is provided. Applications that utilize Korean Welfare Panel Study data can be difficult to model; subsequently, we find that an ordered probit model with the random effects leads to an improved analyses with more accurate and precise inferences.

Simultaneous modeling of mean and variance in small area estimation

  • Kim, Myungjin;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1423-1431
    • /
    • 2016
  • When the sample size in a certain domain is too small to produce adequate information, small area model with random effects is usually used. Also, if we do not consider an inherent pattern which data possess, it considerably affects inference. In this paper, we mainly focus on modeling to handle increased variation of the Current Population Survey (CPS) median income as the Internal Revenue Service (IRS) mean income increases. In a hierarchical Bayesian framework, most estimations are carried out through the Gibbs sampler while the grid method is used to generate parameters from non-standard form. Numerical study indicates that the performance of proposed model is better than that of CPS method in terms of four comparison measurements.

불확실한 장면의 효과적인 인식을 위한 베이지안 네트워크의 온톨로지 기반 제한 학습방법 (A Constrained Learning Method based on Ontology of Bayesian Networks for Effective Recognition of Uncertain Scenes)

  • 황금성;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권6호
    • /
    • pp.549-561
    • /
    • 2007
  • 영상을 분석하여 얻은 증거를 바탕으로 장면의 의미를 추론하고 해석하는 것을 시각 기반 장면 이해라고 하며, 최근 인과적인 판단 및 추론 과정을 모델링하기에 유리한 베이지안 네트워크(BN)를 이용한 확률적인 접근 방법이 활발히 연구되고 있다. 하지만 실제 환경은 변화가 많고 불확실하기 때문에 의미 있는 증거를 충분히 확보하기 어려울 뿐만 아니라 전문가에 의한 설계로 유지하기 어렵다. 본 논문에서는 증거 및 학습 데이타가 부족한 장면인식 문제에서 효율적인BN 구조로 계산 복잡도가 줄어들고 정확도는 향상될 수 있는 BN 학습방법을 제안한다. 이 방법은 추론 대상 환경의 도메인 지식을 온톨로지로 표현하고 이를 제한적으로 사용하여 효율적인 계층구조의 BN을 구성한다. 제안하는 방법의 평가를 위하여 9종류의 환경에서 90장의 영상을 수집하고 레이블링하여 실험하였다. 실험 결과, 제안하는 방법은 증거의 수가 적은 불확실한 환경에서도 좋은 성능을 내고 학습의 복잡도가 줄어듦을 확인할 수 있었다.

해수면의 비정상성 검토 및 계층적 Bayesian 모형을 이용한 비정상성 빈도해석 기법 개발 (Analysis on Nonstationarity in Mean Sea Level and Nonstationary Frequency Analysis based on Hierarchical Bayesian Model)

  • 김용탁;오랑치맥 솜야;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.451-451
    • /
    • 2015
  • 최근 1900년부터 1990년 사이 해수면은 매년 평균 1.2mm 상승했지만 1990년부터는 매년 평균 3mm씩 높아지고 있으며, 이에 1990년부터 현재까지 해수면 수위의 상승속도가 이전 90년 동안 측정된 수치보다 2.5배 빠르다는 연구결과가 발표되었다. 해수면 상승으로 인한 피해는 범람과 침식을 야기할 수 있으며 해일 및 폭풍으로 인한 피해를 증가시킴으로 물질적 피해와 인명 피해를 유발할 수 있다. 이러한 이유로 해수면 상승에 따른 과학적인 분석과 신뢰성 있는 전망을 통하여 해수면 상승에 따른 대응과 대비가 필요하다. 이에 본 연구에서는 비정상성 빈도해석 방법을 통하여 미래의 해수면 상승을 고려할 수 있는 비정상성 빈도해석 기법을 개발하였다. 본 연구에서는 극치사상을 추출하기 위해 국립해양조사원 (Korea Hydrographic and Oceanographic Administration, KHOA)에서 관리한 45개 조위관측소의 시 조위 자료를 이용하였다. 45개 조위관측소의 한 시간 단위 자료로부터 연최대 및 연평균 조위계열 (annual average and annual maximum sea level series)을 추출하였다. 본 연구에서는 한반도 해안을 동해안, 서해안, 남해안, 제주 권역으로 구분하고 빈도 해석의 신뢰성을 만족하기 위해 자료 구축기간이 20년 이상이며, 각 해안을 나타낼 수 있는 지점을 선정하였다. 비정상성 빈도해석은 Gumbel 극치분포를 적용하였으며, 계층적 Bayesian 기법을 결합하여 매개변수들에 대한 사후분포를 추정하였다. 본 연구에서는 대부분의 지점에서 비정상성 빈도해석 결과와 정상성 빈도해석 결과와 상당한 차이를 보여주고 있으며, 이는 주로 정상성 가정에 기인하는 문제점으로 판단된다. 향후 기후변화에 따른 연안지역의 홍수 및 사회기반시설의 위험도를 평가하기 위해서는 비정상성을 고려한 빈도해석 절차의 수립과 적용이 필요할 것으로 판단된다.

  • PDF

근사적 우도함수를 이용한 Neyman-Scott 구형펄스모형의 공간구조 분석 (A spatial analysis of Neyman-Scott rectangular pulses model using an approximate likelihood function)

  • 이정진;김용구
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1119-1131
    • /
    • 2016
  • Neyman-Scott 구형펄스모형 (Neyman-Scott rectangular pulses model; NSRPM)은 강우의 발생, 강우세포의 강우강도 그리고 지속시간으로 표현되는 점과정에 기초한 강우생성 모형으로, 기존의 구형펄스모형 (rectangular pulse model)과 비교해서 강우사상의 군집특성을 잘 반영하기 때문에 여러 연구에서 많이 사용되는 모형이다. 하지만 NSRPM의 매개변수를 추정하는데 있어서 모멘트를 이용한 여러가지 최적화 기법들은 그 계산이 복잡하고 또한 목적함수의 구성에 따라 추정값의 변동도 크게 나타난다. 이를 보완하기 위해서, 최근 누적강수량에 대한 근사적인 우도함수 (approximated likelihood function)와 이를 통해 NSRPM의 매개변수를 추정하는 방법이 소개되었다. 본 논문에선 이 근사적 우도함수를 바탕으로 계층적 베이지안 모형을 이용하여 NSRPM에 공간구조를 표현하고 이를 통해 강우생성 모형의 공간적 특성을 알아보고자 한다.

Bayesian inference in finite population sampling under measurement error model

  • Goo, You Mee;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권6호
    • /
    • pp.1241-1247
    • /
    • 2012
  • The paper considers empirical Bayes (EB) and hierarchical Bayes (HB) predictors of the finite population mean under a linear regression model with measurement errors We discuss how to calculate the mean squared prediction errors of the EB predictors using jackknife methods and the posterior standard deviations of the HB predictors based on the Markov Chain Monte Carlo methods. A simulation study is provided to illustrate the results of the preceding sections and compare the performances of the proposed procedures.

컴퓨팅 사고력 신장을 위한 퍼즐 기반 컴퓨터과학 교육 프로그램의 효과 예측 (Predicting the Effect of Puzzle-based Computer Science Education Program for Improving Computational Thinking)

  • 오정철;김종훈
    • 정보교육학회논문지
    • /
    • 제23권5호
    • /
    • pp.499-511
    • /
    • 2019
  • 본 연구의 선행 연구에서는 1~3차에 걸쳐 초등학생의 컴퓨팅 사고력 신장을 위한 퍼즐 기반 컴퓨터과학 교육 프로그램을 개발하여 현장에 투입하며 교육 효과를 CT창의성과 CT인지력으로 나눠 검증하고 교육 프로그램을 개선해왔다. 본 연구에서는 이러한 선행 연구 결과를 바탕으로 연령과 CT사고력 하위 요소를 매개 변수로 사용하여 계층적 베이지안 추론 모델링을 실시하였다. 그리고 그 결과를 바탕으로 중 고등학교에서 퍼즐 기반 컴퓨터과학 교육 프로그램의 효과를 예측하고 향후 투입할 중 고등학교의 퍼즐 기반 컴퓨터과학 교육 프로그램의 주요 개선 항목과 개선 방향을 제안하였다.

계층적 베이지안을 활용한 개념적 강우-유출모형 앙상블 모델 구축 (Development of a conceptual rainfall-runoff ensemble model using hierarchical Bayesian method)

  • 유재웅;김민지;오세청;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.181-181
    • /
    • 2021
  • 유역 내의 물순환 평가를 위하여 적합한 강우-유출모형을 선정하고 적용하는 것은 수문학적 관점에서 주된 과제이다. 장기적인 관점의 수자원 관리를 위해서는 직접적인 계측을 통해 장기간의 유출자료를 취득하는 방법이 있으나, 국내의 주요지점을 제외한 대다수의 중소규모의 지점에 계측기를 설치하는 것은 현실적으로 어려우므로, 자료취득이 비교적 용이하고 신뢰성이 높은 장기간 강우 자료를 강우-유출모형의 입력자료로 활용하여 미계측 유역으로의 모형을 확장하는 방안이 적절하다는 평가를 받고 있다. 본 연구는 국내외 주요 연속강우-유출모형의 특성을 파악하기 위하여 비교적 신뢰성 있는 자료를 보유하고 있는 소양강댐 유역에 다수의 연속강우-유출모형을 적용하였다. 모델링 결과로 산출된 유황곡선(flow duration curve)을 소양강댐 유입량과 비교하여 각 모형의 특징을 파악하고 유량에 따른 적합성 평가를 진행하였다. 또한, 향후 미계측유역으로 모형을 확장하기 위하여 매개변수 개수 및 재현능력을 동시에 평가하였다. 다수의 모형 중 적합성이 높은 모형들을 선별하였으며, 선별된 모형들의 불확실성을 고려함과 동시에 계층적 베이지안 기법을 활용하여 최종적으로 앙상블모형을 제시하였다. 앙상블모형을 단일 모형과 비교한 결과 단일 모형보다 개선된 성능을 확인하였다.

  • PDF

일반화 극단 분포를 이용한 강우량 예측 (Prediction of extreme rainfall with a generalized extreme value distribution)

  • 성용규;손중권
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.857-865
    • /
    • 2013
  • 집중 호우로 인한 피해가 증가하면서 다양한 기법들을 이용하여 강우량 예측에 대한 관심이 높아졌다. 최근에는 극단분포를 활용하여 강우량을 예측하려는 시도가 늘고 있다. 본 연구에서는 일반화 극단 분포를 활용하여 실제 서울시의 1973년부터 2010년까지 7월달의 사후예측분포를 생성하고, 수치적인 계산을 위해서 MCMC (Markov chain Monte Carlo)알고리즘을 활용하였다. 이 연구를 통해서 사후예측분포의 점추정값들을 비교하였고 2011년 7월달의 자료와 비교해 봤을 때 집중 호우의 확률이 증가한 것을 알 수 있었다.