• Title/Summary/Keyword: Bayesian 모형

검색결과 398건 처리시간 0.028초

순서범주형자료 분석을 위한 베이지안 분계점 모형 (A Bayesian Threshold Model for Ordered Categorical Traits)

  • 최병수;이승천
    • 응용통계연구
    • /
    • 제18권1호
    • /
    • pp.173-182
    • /
    • 2005
  • 순서를 갖는 범주형자료의 분석을 위한 중요한 통계적 방법인 순위로짓모형의 대안으로 무정보 사전분포에 의한 베이지안 분계점 모형을 정의하고, 실증 자료분석을 통해 베이지안 모형의 유용성을 살펴보았다.

자기조직화 지도를 위한 베이지안 학습 (Bayesian Learning for Self Organizing Maps)

  • 전성해;전홍석;황진수
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.251-267
    • /
    • 2002
  • Kohonen이 제안한 자기조직화 지도(Self Organizing Maps : SOM)는 매우 빠른 신경망 모형이다. 하지만 다른 신경망 모형과 마찬가지로 학습 결과에 대한 명확한 규칙을 제시하지 못할 뿐만 아니라 지역적 최적값으로 빠지는 경우가 종종 있다. 본 논문에서는 이러한 자기조직화 지도의 모형에 대한 설명력을 부여하고 전역 최적값으로 수렴할 수 있는 예측 성능을 갖는 모형으로서 자율학습 신경망에 베이지안 추론을 결합한 자기조직화 지도를 위한 베이지안 학습(Bayesian Learning for Self Organizing Maps ; BLSOM)을 제안한다. 이 방법은 기존의 자기조직화 지도가 지역적 해에 머물러 있는 것에 비해서 언제든지 전역적 해로 수렴함이 실험을 통하여 밝혀졌다.

이산형 자료 예측을 위한 베이지안 네트워크 분류분석기의 성능 비교 (The performance of Bayesian network classifiers for predicting discrete data)

  • 박현재;황범석
    • 응용통계연구
    • /
    • 제33권3호
    • /
    • pp.309-320
    • /
    • 2020
  • 방향성 비순환 그래프(directed acyclic graph; DAG)라고도 하는 베이지안 네트워크(Bayesian network)는 변수 사이의 관계를 확률과 그래프를 통해 모형화할 수 있다는 점에서 최근 의학, 기상학, 유전학 등 여러 분야에서 다양하게 활용되고 있다. 특히 이산형 자료의 예측에 사용되는 베이지안 네트워크 분류분석기(Bayesian network classifier)가 최근 새로운 데이터 마이닝 기법으로 주목받고 있다. 베이지안 네트워크는 그 구조와 학습 방법에 따라 여러 가지 다양한 모형으로 분류할 수 있다. 본 논문에서는 서로 다른 성질을 가진 이산형 자료를 바탕으로 구조 학습 방법에 차이를 두어 베이지안 네트워크 모형을 학습시킨 후, 가장 간단한 방법인 나이브 베이즈 (naïve Bayes) 모형과 비교해 본다. 학습된 모형들을 여러 가지 실제 데이터에 적용하여 그 예측 정확도를 비교함으로써 최적의 분류 분석 결과를 얻을 수 있는지 살펴본다. 또한 각각의 모형에서 나타나는 그래프를 통해 데이터의 변수 사이의 관계를 비교한다.

Bayesian Markov Chain Monte Carlo 기법을 통한 NWS-PC 강우-유출 모형 매개변수의 최적화 및 불확실성 분석 (Parameter Optimization and Uncertainty Analysis of the NWS-PC Rainfall-Runoff Model Coupled with Bayesian Markov Chain Monte Carlo Inference Scheme)

  • 권현한;문영일;김병식;윤석영
    • 대한토목학회논문집
    • /
    • 제28권4B호
    • /
    • pp.383-392
    • /
    • 2008
  • 수공구조물을 설계하거나 수자원계획을 수립할 때 제한된 수문자료로 인해 수문모형의 매개변수를 추정하는데 어려움이 따르며 추정된 결과에 신뢰성을 부여하기 위해서 필수적으로 불확실성 분석이 필요하다 하겠다. 이러한 관점에서 본 연구에서는 국내외에서 주로 이용되고 있는 NWS-PC 강우-유출 모형을 대상으로 보다 진보된 매개변수 추정과 불확실성 분석이 가능한 Bayesian Markov Chain Monte Carlo 기법과 결합하여 국내 소양강댐 유역 일유입량 모의에 적용하였다. 실측 일유입량 자료를 대상으로 모형의 검정과정을 수행하였으며 NWS-PC 모형의 총 13개의 매개변수에 대한 사후분포를 추정하여 유출수문곡선의 불확실성 구간을 추정하였다. 검정 및 검증 모두에서 Bayesian Markov Chain Monte Carlo 기법이 모형의 적합성 측면에서 기존 방법론과 비교해보면 다소 우수하거나 비슷한 결과를 나타내었다. 실제로 유역에 발생하는 유출은 다양한 요인에 따라 변화될 수 있으며 이러한 점에서 Bayesian 방법은 강우-유출 관계에서 발생하는 이러한 불확실성을 매개변수의 불확실성으로 인지함으로서 우리가 예상치 못한 유출 사상에 대한 형태를 고려할 수 있는 장점이 있다. 따라서 댐 설계와 같은 대규모 수공 구조물 설계 시에 이러한 불확실성이 접목된 강우-유출 분석이 이루어진다면 보다 합리적인 방법으로 홍수 위험도 분석이 가능하며 더욱이 댐 규모 결정에 있어서 신뢰성 있는 의사 결정 수단을 제공할 수 있을 것으로 사료된다.

Bayesian 기법을 활용한 Neyman-Scott Rectangular Pulse 모형의 불확실성 분석 (Uncertainty Analysis of Neyman-Scott Rectangular Pulse Model(NSRPM) Based on Bayesian Modelling)

  • 김장경;반우식;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.79-79
    • /
    • 2017
  • 강우 자료는 수공구조물 설계목적에 따라 다양한 시공간적 범주가 필요하다. 그러나 시간단위 이하 시계열 강우자료는 미계측 유역 및 관측연한 등의 제약으로 연속적인 시계열을 확보하는데 어려움이 있다. 이러한 점에서 포아송분포 기반 강우발생모형은 강우시계열의 통계적 특성을 나타내는 5개 매개변수로 다양한 시간 범주의 연속강우시계열을 생성할 수 있다는 장점이 있다. 강우발생모의 핵심은 과거자료의 통계특성을 효과적으로 복원할 수 있어야 하며, 다양한 기상학적 특성들 또한 적절하게 모의될 수 있어야 한다는 점이다. 즉, 다음과 같은 기준으로 모의적합성을 평가할 수 있다. 첫째, 지속기간별 관측시계열과 모의시계열의 통계적 유사성을 평가하고, 둘째, 확률분포를 따르는 각 매개변수의 사후분포를 제시하여 불확실성을 정량화하고, 셋째, 추정된 매개변수의 물리적 범위의 적정성 검토가 필요하다. 본 연구에서는 강우발생모형으로 널리 알려진 Neyman-Scott Rectangular Pulse(NSRP) 모형과 Bayesian 모형을 연계한 Bayesian NSRP 모형 개발을 통해 강우관측소 전지점에 대한 매개변수 지도를 제시하고자 한다. 본 연구결과는 임의 유역에 대한 강우발생 시나리오를 제공하여, 다양한 형태의 유출결과를 도출할 수 있으며, 무엇보다 유출결과를 확률적으로 평가할 수 있다는 장점이 있다.

  • PDF

SOFR 기간 데이터에 대한 동적 넬슨-시겔 이자율 곡선의 베이지안 접근법 (A Bayesian approach for dynamic Nelson-Siegel yield curve modeling on SOFR term rate data)

  • 임성호;황범석
    • 응용통계연구
    • /
    • 제36권4호
    • /
    • pp.349-360
    • /
    • 2023
  • 동적 넬슨-시겔 모형은 채권과 같은 기간 구조를 갖고 있는 금융상품의 이자율 곡선모형에서 널리 사용되고 있다. 본 연구에서는 동적 넬슨-시겔 모형을 상태 공간 모형의 관점에서 설명하고 해당 모형에 적용할 수 있는 베이지안 접근법에 대해 알아보고자 한다. 그리고 SOFR 기간 데이터를 베이지안 동적 넬슨-시겔 모형에 적용하여 그 성능을 확인하고 바시첵 모형, 빈도주의 접근법을 활용한 동적 넬슨-시겔 모형, 2요인 베이지안 동적 넬슨-시겔 모형과 같은 다른 경쟁 모형들과 성능을 비교해보고자 한다. 우리는 베이지안 동적 넬슨-시겔 모형이 SOFR 기간 데이터에 대해서 다른 모형들보다 우수한 성능을 보여준다는 것을 확인할 수 있었다.

집중호우사상의 월별 발생특성 모의를 위한 확률분포 개발 (Development of probability distribution for simulation of monthly characteristics of torrential rainfall events)

  • 김상욱;김형배
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.246-246
    • /
    • 2016
  • 본 연구에서는 최근 기후변화로 인한 집중호우의 발생횟수의 경향을 확률적으로 분석함에 있어 1개월 동안 80 mm/day 이상의 강우사상을 집중호우로 정의하여, 대구 및 부산 강우관측소로부터 수집된 384개월 동안의 집중호우를 분석하였다. 집중호우 월별 발생횟수와 같은 형식의 자료의 확률적 분석은 대개 Poisson 분포 (POI)가 사용되나 자료에 포함된 0자료의 과잉은 확률분포를 왜곡시키는 문제를 발생시킨다. 본 연구에서는 이 문제를 개선하기 위하여 개발된 일반화 Poisson 확률분포 (GPD), 0-과잉 Poisson 확률분포 (ZIP), 0-과잉 일반화 Poisson 확률분포 (ZIGP), Bayesian 0-과잉 일반화 Poisson 확률분포 (Bayesian ZIGP)를 집중호우 자료에 적용하고, 5개 모형의 특성을 비교분석하였으며, Bayesian ZIGP 모형의 구축에 있어서는 정보적 사전분포를 사용함으로써 모형의 정확도를 개선하였다. 분석결과 분석하고자 하는 자료에 0이 과다하게 포함되어 있는 경우 POI 및 GPD 분포는 관측결과와는 다른 결과를 제시하여 적절한 모형으로 고려되지 못함을 알 수 있었다. 5가지 모형 중 정보적 사전분포를 탑재한 Bayesian ZIGP 모형이 가장 관측 자료와 유사한 결과를 도출하였으나 모형의 구축에 수반되는 실용적인 측면을 고려하면 ZIP 모형도 충분히 사용될 수 있는 모형으로 추천되었다.

  • PDF

집중호우사상의 발생횟수 분석을 위한 확률분포의 비교 (Comparison of probability distributions to analyze the number of occurrence of torrential rainfall events)

  • 김상욱;김형배
    • 한국수자원학회논문집
    • /
    • 제49권6호
    • /
    • pp.481-493
    • /
    • 2016
  • 본 연구에서는 최근 기후변화로 인한 집중호우의 발생횟수의 경향을 확률적으로 분석함에 있어 1개월 동안 80 mm/day 이상의 강우사상을 집중호우로 정의하여, 대구 및 부산 강우관측소로부터 수집된 384개월 동안의 집중호우를 분석하였다. 집중호우 월별 발생횟수와 같은 형식의 자료의 확률적 분석은 대개 Poisson 분포 (POI)가 사용되나 자료에 포함된 0자료의 과잉은 확률분포를 왜곡시키는 문제를 발생시킨다. 본 연구에서는 이 문제를 개선하기 위하여 개발된 일반화 Poisson 확률분포 (GPD), 0-과잉 Poisson 확률분포 (ZIP), 0-과잉 일반화 Poisson 확률분포 (ZIGP), Bayesian 0-과잉 일반화 Poisson 확률분포 (Bayesian ZIGP)를 집중호우 자료에 적용하고, 5개 모형의 특성을 비교분석하였으며, Bayesian ZIGP 모형의 구축에 있어서는 정보적 사전분포를 사용함으로써 모형의 정확도를 개선하였다. 분석결과 분석하고자 하는 자료에 0이 과다하게 포함되어 있는 경우 POI 및 GPD 분포는 관측결과와는 다른 결과를 제시하여 적절한 모형으로 고려되지 못함을 알 수 있었다. 5가지 모형 중 정보적 사전분포를 탑재한 Bayesian ZIGP 모형이 가장 관측 자료와 유사한 결과를 도출하였으나 모형의 구축에 수반되는 실용적인 측면을 고려하면 ZIP 모형도 충분히 사용될 수 있는 모형으로 추천되었다.

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

Bayesian Network 기반 소규모 저수지의 수문학적 위험도 분석 모형 개발 (A Development of Hydrologic Risk Analysis Model for Small Reservoirs Based on Bayesian Network)

  • 김진국;김진영;권덕순;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.105-105
    • /
    • 2017
  • 최근 우리나라에서는 국지성호우로 인해 발생하는 돌발홍수에 방어하지 못하는 소규모 저수지에 대한 붕괴사고가 빈발하고 있다. 붕괴된 저수지를 살펴보면, 대체적으로 규모가 작아 체계적인 안전관리가 이루어지지 않거나 경과연수가 50년 이상인 필댐(fill dam) 형식으로 축조된 노후저수지로서 갑작스러운 홍수를 대응하는데 있어 매우 취약한 상태이다. 체계적으로 운영되는 대형댐에 비해 축조기간이 오래된 소규모 저수지의 경우, 저수지에 대한 수문학적 정보가 거의 없거나 미계측되어 보수보강이 필요한 저수지를 선정하거나 정량적인 위험도를 분석하는데 매우 어려운 실정이다. 이러한 이유로 본 연구에서는 노후된 소규모 저수지에 대한 수문학적 파괴인자들을 선정하여 Bayesian Network기반의 소규모 저수지 위험도 분석 모형을 구축하였다. 구축된 모형을 기준으로 고려될 수 있는 다양한 위험인자 및 이들 인자간의 연관성을 평가하였으며, 각각의 노드에 파괴인자를 노드로 할당하여 소규모 저수지의 위험도를 분석하였다. Bayesian Network기법의 도입으로 불확실한 상황을 확률로 표시하고, 복잡한 추론을 정량화된 노드의 관계로 단순화시켜 노드의 연결 관계로 표현하였다. 본 연구에서 제안된 모형은 노후된 소규모 저수지의 수문학적 위험도를 정량으로 분석하는 모형으로서 활용성이 높을 것으로 기대된다.

  • PDF