• 제목/요약/키워드: 베이지안 예측모형

검색결과 78건 처리시간 0.04초

보조 혼합 샘플링을 이용한 베이지안 로지스틱 회귀모형 : 당뇨병 자료에 적용 및 분류에서의 성능 비교 (Bayesian logit models with auxiliary mixture sampling for analyzing diabetes diagnosis data)

  • 이은희;황범석
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.131-146
    • /
    • 2022
  • 로지스틱 회귀 모형은 다양한 분야에서 범주형 종속 변수를 예측하거나 분류하기 위한 모형으로 많이 사용되고 있다. 로지스틱 회귀 모형에 대한 전통적인 베이지안 추론 기법으로 메트로폴리스-헤이스팅스 알고리즘이 많이 사용되었지만, 수렴의 속도가 느리고 제안 분포에 대한 적절성을 보장하기 어렵다. 따라서, 본 논문에서는 모형에 대한 베이지안 추론 방법으로 Frühwirth-Schnatter와 Frühwirth (2007)에서 제안된 보조 혼합 샘플링(auxiliary mixture sampling) 기법을 사용하였다. 이 방법은 모형의 선형성과 정규성을 만족시키기 위해 두 단계에 거쳐 잠재변수를 도입하며, 결과적으로 깁스 샘플링을 통한 추론을 가능하게 한다. 제안한 모형의 효과를 검증하기 위해 2020년 지역사회 건강조사 당뇨병 자료에 적용하여 메트로폴리스-헤이스팅스를 사용한 모형과 추론 결과를 비교 분석하였다. 또한, 다양한 분류 모형들과 본 논문에서 제안한 모형의 분류 성능을 비교한 결과 제안된 모형이 분류 분석에서도 좋은 성능을 보이는 것을 확인할 수 있었다.

베이지안 기법을 이용한 신뢰도 예측 시 관측치에 주어지는 가중치 분석에 관한 연구 (Analysis of Weights Given to Observations in the Bayesian Reliability Prediction)

  • Yang, Hee Joong
    • 산업경영시스템학회지
    • /
    • 제22권51호
    • /
    • pp.53-61
    • /
    • 1999
  • 평균치에 적용되는 credibility formula를 분산에도 적용하여 응용 할 수 있는 extended credibility formula를 개발한다. 간단한 베이지안 신뢰도 예측모형을 구축하고 이 모형에 extended credibility formula를 적용한다. 감마 사전분포 - 포아송 우도의 경우와 베타 사전분포 - 이항분포 우도의 경우에 대해 extended credibility formula를 적용해 관측치에 주어진 가중치에 따라 사후 분산이 어떻게 변화하는지를 분석한다. 사후분산도 사후평균과 마찬가지로 사전값과 관측값의 가중평균으로 표시될 수 있다는 것을 증명한다. 가중치와 불확실성 감소율간의 관계도 연구된다. 이와 같은 가중치에 따른 사전 및 사후분포의 변화 양식에 대한 이해는 올바른 사전분포를 설정하는데 큰 도움이 될 수 있다.

  • PDF

만성 폐쇄성 폐질환을 이용한 노모그램 구축과 비교 (Comparison of nomogram construction methods using chronic obstructive pulmonary disease)

  • 서주현;이제영
    • 응용통계연구
    • /
    • 제31권3호
    • /
    • pp.329-342
    • /
    • 2018
  • 노모그램은 질병의 위험 요인과 예측 확률을 쉽게 이해할 수 있도록 시각적으로 표현하는 통계적 도구이다. 본 논문은 만성 폐쇄성 폐질환(chronic obstructive pulmonary disease)의 위험 요인을 이용하여 로지스틱 회귀모형과 순수 베이지안 분류기 모형의 노모그램을 구축하고 이를 비교하였다. 분석 데이터는 국민건강영양조사 6기(2013-2015)를 이용하여 진행하였다. 총 6개의 위험 요인을 이용하였다. 그리고 로지스틱 회귀모형, 순수 베이지안 분류기 모형과 각각의 구축 방법을 이용하여 만성 폐쇄성 폐질환의 노모그램을 제시하였다. 또한, 구축된 두 노모그램을 비교하여 유용성을 살펴보았다. 마지막으로 ROC curve와 Calibration plot을 통하여 각 노모그램을 검증하였다.

베이지안 신경망을 이용한 보행자 사망확률모형 개발 (Development of Pedestrian Fatality Model using Bayesian-Based Neural Network)

  • 오철;강연수;김범일
    • 대한교통학회지
    • /
    • 제24권2호
    • /
    • pp.139-145
    • /
    • 2006
  • 본 논문에서는 보행-차량 충돌사고 시 보행자 사망 여부를 확률적으로 예측할 수 있는 모형을 개발하였다. 베이지안 신경망을 적용하여 보행자 사망확률모형을 개발하고, 로지스틱 회귀분석 기법 기반의 모형과 예측력을 비교하였다. 본 연구를 위하여 개별 교통사고 자료를 수집하였으며, 교통사고 재현을 통해 사고 당시의 충돌속도를 추정하여 보행자 연령, 차종과 함께 모형의 독립변수로 사용하였다. 보다 정확하고 신뢰성 있는 모형개발을 위해 반복적 샘플링기법을 적용하여, 다양한 학습자료 및 테스트 자료를 구성하고 모형의 성능을 평가하였다 본 연구를 통해 개발된 모형은 보행자 보호를 위한 첨단차량기술 개발, 제한속도의 설정 등 다양한 정책 및 관련기술의 개발을 지원하는 유용한 도구로 사용될 것으로 기대된다.

베이지안 확률적 접근법을 이용한 건설업체 부도 예측에 관한 연구 (Predicting Default of Construction Companies Using Bayesian Probabilistic Approach)

  • 홍성문;황재연;권태환;김주형;김재준
    • 한국건설관리학회논문집
    • /
    • 제17권5호
    • /
    • pp.13-21
    • /
    • 2016
  • 주수급자 역할을 하는 건설기업의 부실화는 발주자에게 공사계약 미이행에 따른 피해를 초래할 수 있고, 전문건설업체 및 자재공급업체의 재무건전성에 악영향을 줄 수 있다. 건설업은 프로젝트를 수주하고 진도에 따라 기성을 받는 현금흐름의 재무적 특성이 존재하고, 사업 진행 중의 부실화는 투입한 자금의 손실로 이어질 수 있으므로 건설업체의 부실화 예측은 중요하다. 국내 건설업체의 부실화 예측은 90년도 초 미국에서 개발된 KMV (Kealhofer McQuown and Vasicek)사의 KMV모형으로 수행되는 경우도 있지만, 이 모형은 일반적인 기업 및 은행의 신용위험 평가에 개발되어져 건설기업 예측력에는 부족함이 있다. 또한, KMV값의 부도확률 예측력에 대해서는 분석대상의 기업수 및 데이터의 부족으로 의문점이 지속적으로 제기되고 있다. 따라서 이러한 의문점을 해결하기 위해 기존 부도예측확률모형에 베이지안 확률적 접근법(Bayesian Probabilistic Approach)을 접목하고자 한다. 베이즈 통계학의 사전확률(Prior Probability)만 적절하게 예측가능하다면 적은 정보라도 증거에 대한 조건부 획득으로 신뢰성 있는 사후확률(Posterior Probability)을 예측할 수 있기 때문이다. 이에 본 연구에서는 기존 부도예측확률모형에 베이지안 확률적 접근법을 활용하여 예상부도확률(Expected Default Frequency, EDF)을 측정하고, 기존 모형의 예상부도확률과 비교하여 정확성을 예측하고자 한다.

비모수 베이지안 겉보기 무관 회귀모형 (A nonparametric Bayesian seemingly unrelated regression model)

  • 조성일;석인혜;최태련
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.627-641
    • /
    • 2016
  • 본 논문에서는 겉보기 무관 회귀모형을 고려하고 디리크레 프로세스 혼합모형을 오차항의 분포로 하는 비모수 베이지안 방법을 제안한다. 제안된 모형을 바탕으로 사후분포를 유도하고 디리크레 프로세스 혼합모형의 붕괴깁스표집 방법을 통해 마코프 체인 몬테 칼로 알고리듬을 구성하고 사후추론을 실시한다. 모형의 성능을 비교하기 위해 모의실험을 실시하고, 더 나아가 한국지역의 강수량 예측에 대한 실제 자료에 적용해 본다.

다중대체와 재현자료 작성 (Multiple imputation and synthetic data)

  • 김정연;박민정
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.83-97
    • /
    • 2019
  • 사회가 발전함에 따라 이용자의 다양한 분석 요구에 대응하기 위해 개인 단위로 구성된 마이크로데이터 제공이 증가했다. 나아가 센서스, 행정자료와 같은 전수자료를 마이크로데이터 형태로 제공받아 연구하고자 하는 요구 역시 커지고 있다. 정책결정, 학술목적 등을 위한 마이크로데이터 분석은 가치 창출 측면에서 대단히 바람직하다. 하지만 자료 유용성이 확보된 마이크로데이터 제공은 개인정보가 노출될 가능성이라는 위험을 가질 수 밖에 없다. 이에, 자료의 유용성을 확보하면서 개인정보보호를 보장할 수 있는 여러 방법들이 고려되어 왔다. 이러한 방법 중 하나로 재현자료(synthetic data)를 생성해서 활용하는 방법이 연구되어 왔다. 본 논문은 재현자료 생성과 관련된 방법론 및 주의사항을 소개하여, 재현자료의 이해를 도모하고자 한다. 이를 위해 재현자료 작성에 필수적인 다중대체, 베이지안 예측 모형 및 베이지안 붓스트랩 등의 개념들을 먼저 설명하고, 완전 재현자료 및 부분 재현자료에 대해 살펴본다. 특히, 재현자료 작성을 심도 깊이 이해하기 위해 순차회귀 다중대체(sequential regression multivariate imputation)를 이용해 경시적(longitudinal) 자료를 재현자료로 작성하는 구체적 사례를 살펴본다.

베이지안 신경망을 이용한 분류분석 (A Classification Analysis using Bayesian Neural Network)

  • 황진수;최성용;전홍석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제12권2호
    • /
    • pp.11-25
    • /
    • 2001
  • 자료들 사이에 존재하는 관계, 패턴, 규칙등을 찾아내서 모형화 하는 통계적인 분류기법은 여러가지가 있다. 그러나 우리가 얻게 되는 지식은 어떤 일련의 분류규칙에 의해서가 아닌 관찰과 학습을 통한 훈련으로부터 얻게 된다. 본 베이지안 학습은 모든 형태의 불확실성을 표현하는 확률로써 우리의 믿음의 정도를 표현하는 것으로 해석될 수 있으며, 확실한 결과가 알려짐에 따라 확률이론 법칙을 사용하여 이러한 확률들을 갱신한다. 또한 신경망 모형은 이미 알고 있는 속성들에 근거하여 아직 알지 못하는 집단이나 특질들을 예측하게 해준다. 본 논문에서는 이러한 두 가지 방법을 결합한 베이지안 신경망과 기존의 CHAID, CART, QUBST 분류 알고리즘에 있어서 각각 오분류율을 비교연구하였다.

  • PDF

베이지안 네트워크 및 의사결정 모형을 이용한 위성 강수자료 기반 기상학적 가뭄 전망 (Meteorological drought outlook with satellite precipitation data using Bayesian networks and decision-making model)

  • 신지예;김지은;이주헌;김태웅
    • 한국수자원학회논문집
    • /
    • 제52권4호
    • /
    • pp.279-289
    • /
    • 2019
  • 가뭄재해는 다른 재해와 다르게 광범위한 공간에 걸쳐서 충분한 강우가 발생하기 전까지 오랜 기간 동안 발생되는 특성이 있다. 위성 영상은 시공간적으로 지속적인 강수량 관측을 제공할 수 있다. 본 연구는 위성 영상 기반의 강수자료를 활용하여 기상학적 가뭄 전망 모형을 개발하였다. PERSIANN_CDR, TRMM 3B42와 GPM IMERG 영상을 활용하여 강수 자료를 구축한 뒤, 표준강수지수(SPI)를 기반으로 기상학적 가뭄을 정의하였다. 과거의 가뭄 정보와 물리적 예측 모형 기반의 가뭄 예측 결과를 결합할 수 있는 베이지안 네트워크 기반 가뭄 예측 기법을 이용하여 확률론적 가뭄 예측 결과를 생산하였으며, 가뭄 예측결과를 가뭄 전망 의사결정 모형에 적용하여 가뭄 전망 결과를 도출하였다. 가뭄 전망 정보는 가뭄 발생, 지속, 종결, 가뭄 없음의 4단계로 구분하였다. 본 연구의 가뭄 전망 결과는 ROC 분석을 통하여 물리적 예측 모형인 다중모형 앙상블(MME)을 활용한 가뭄 전망 결과와 전망 성능을 비교하였다. 그 결과, 2~3개월 가뭄 전망에 대한 가뭄 발생 및 지속의 단계에서는 MME 모형보다 높은 전망성능을 보여주었다.