• 제목/요약/키워드: Bayesian model

검색결과 1,312건 처리시간 0.032초

영 과잉 순서적 프로빗 모형을 이용한 한국인의 음주자료에 대한 베이지안 분석 (Bayesian Analysis of Korean Alcohol Consumption Data Using a Zero-Inflated Ordered Probit Model)

  • 오만숙;오현탁;박세미
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.363-376
    • /
    • 2012
  • 순서적 다항 반응변수의 경우 종종 과도하게 많은 수의 관측치가 0 범주에서 발생하는 영 과잉 특성을 지닌다. 이러한 영 과잉 자료에서 0범주를 발생시키는 요인이 여러 개 존재할 때 일반적인 순서적 프로빗 모형은 자료를 설명함에 있어서 한계를 지닌다. 본 논문에서는 영 과잉 특성을 반영한 이 단계 영 과잉 순서적 프로빗 모형의 베이지안 분석기법을 제시하고 이를 2008년도 통계청에서 조사한 한국인의 음주소비 자료에 적용시킨다. 첫 번째 단계에서는 음주소비가 하나도 없다고 답한 0 범주에 속하는 비음주자들을 신념 또는 영구적 건강상의 문제 등으로 상황에 관계없이 음주를 하지 않는 절대적 비음주자(genuine non-drinker, non-participant)와 현재 소비가 없지만 상황에 따라 음주자가 될 가능성이 있는 잠재적 음주자(zero consumption potential drinker)로 구분하는 프로빗 모형을 적용시켜 분석한다. 두 번째 단계에서는 잠재적 음주자와 1 이상의 범주에 속하는 실제적 음주자를 합하여 음주자 집단으로 보고 이에 대하여 순서적 프로빗 모형을 적용하여 분석한다. 분석결과, 비음주자 중 약 30%가 절대적 비음주자로 음주자료가 일반적 순서적 자료에 비하여 뚜렷한 영 과잉 특성을 가짐을 알 수 있었다. 각 변수의 한계효과를 분석함으로써 같은 설명변수가 절대적 비음주자와 잠재적 음주자에 미치는 영향이 서로 반대로 나타날 수 있음을 발견하였고, 따라서 한국인의 음주자료에 대하여 제안된 영 과잉 순서적 프로빗 모형이 유용함을 보여주었다.

벡터자기회귀(VAR) 모형을 이용한 지하수위와 하천수위의 추계학적 모의기법 개발 (A development of stochastic simulation model based on vector autoregressive model (VAR) for groundwater and river water stages)

  • 권윤정;원창희;최병한;권현한
    • 한국수자원학회논문집
    • /
    • 제55권12호
    • /
    • pp.1137-1147
    • /
    • 2022
  • 하천수위와 지하수위는 수문학적 순환과정에서 나타나는 수문학적 요소로 상호 연관성이 높으며 이러한 수문학적 요소에 대해 확률적 시뮬레이션을 독립적으로 수행하는 경우 상호 관련 정보손실과 같은 문제가 발생할 수 있다. 하천수위와 지하수위는 수문학적·농업적 가뭄을 평가하는 중요한 지표로 활용되지만 하천수위의 경우 건기 중에는 정확한 관측을 얻기가 매우 어려우며, 지하수위의 경우 데이터 기간이 상대적으로 짧아 이를 활용한 가뭄지수 사용이 제한적이다. 이와 관련하여 손실 없이 자료를 최대한 이용하기 위해 본 연구는 각 변수의 시간 의존성을 고려하는 동시에 상호 연관된 변수의 시간 의존성을 고려하는 벡터자기회 모형VAR)을 구성했다. 하천수위와 지하수위 사이의 자기 상관 및 상관관계를 확인하고, 정보 손실을 최소화하는 하천수위 및 지하수위를 예측할 수 있는지 여부를 결정하기 위해 벡터 자기 회귀 모델의 최적 순서 결정과 매개변수를 결정하였다. 또한, 두 변수 간의 상관관계를 반영하지 않는 자기회귀모형(AR)을 구축하고 모의에 대한 DIC와 상관계수를 VAR 모형과 비교하여 VAR 모형 더 적합함을 보이고 하천수위와 지하수위의 간의 상호관계성을 효과적으로 반영함을 확인하였다.

베이지안 확률통계와 GIS를 연계한 기후변화 도시홍수 리스크 평가: 서울시 서초구를 대상으로 (Urban Flood Risk Assessment Considering Climate Change Using Bayesian Probability Statistics and GIS: A Case Study from Seocho-Gu, Seoul)

  • 이상혁;강정은;박창석
    • 한국지리정보학회지
    • /
    • 제19권4호
    • /
    • pp.36-51
    • /
    • 2016
  • 본 연구는 기후변화에 따른 도시홍수 리스크 평가를 위해 베이지안 확률통계 모형과 GIS를 연계 활용하였다. 리스크는 재난발생가능성과 영향 크기의 곱으로 평가될 수 있다. 본 연구는 베이지안 모델을 기반으로 침수발생가능성을 추정하였고, 기후변화 시나리오 정보를 반영하여 미래 침수발생가능성도 평가하였다. 침수로 발생할 수 있는 영향은 인명피해와 재산피해의 측면에서 살펴보았다. 서울시 서초구를 대상으로 분석한 결과, 현재 침수발생가능성은 하천에 인접하고, 주변지역보다 고도가 낮으며 불투수면 밀집지역인 서초동, 반포동 일대가 높게 나타났다. 미래 침수발생가능성 추정결과, 2050년의 위험지역 면적이 2030년보다 1.3배 증가하는 것으로 나타났다. 추정된 발생가능성을 활용한 리스크 평가 결과, 인명피해 리스크는 일반 및 고층 주거지역을 중심으로 높은 리스크를 보인 반면, 재산피해는 상업지역을 중심으로 리스크가 높게 나타났다. 2050년의 재산피해 리스크는 2030년의 재산피해 리스크보다 약 6.6% 증가하는 것으로 평가되었다. 본 연구에서 제안된 도시홍수 리스크 평가 기법은 상세한 공간결과 값의 제공으로 지역맞춤형 재해저감 전략을 위한 중요한 의사결정 자료로 활용될 수 있을 것으로 기대한다.

선별적 데이터 학습 기반의 베이지안 네트워크를 이용한 단기차량속도 예측 (A Short-Term Vehicle Speed Prediction using Bayesian Network Based Selective Data Learning)

  • 박성호;유영중;문상호;김영호
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2779-2784
    • /
    • 2015
  • 정확한 교통정보의 예측은 출발지로부터 목적지까지의 최적경로를 제공할 수 있으며, 이로 인해 시간과 비용의 절감 효과를 얻을 수 있다. 본 논문에서는 다양한 교통정보 예측 방법 중 확률 모델을 기반으로 교통정보를 예측하는 베이지안 네트워크 방법을 이용한다. 기존 연구에서는 베이지안 네트워크 예측 방법이 모든 시간대에서의 데이터를 학습에 사용하는 것과는 달리, 본 논문에서는 예측하고자 하는 시간대와 동일한 요일과 시간에 해당하는 데이터만을 선별적으로 학습에 사용한다. 서로 다른 두 가지 학습방법에 따른 예측 결과의 정확도는 일반적으로 많이 사용되는 MAPE(Mean Absolute Percentage Error)로 검증하였으며, 서울 시내 14개의 링크 구간에 대해 실험을 진행하였다. 실험결과는 본 논문에서 제안한 방법이 모든 시간대의 데이터를 학습에 사용한 방법에 비해 MAPE의 관점에서 더 높은 정확도를 가진 교통 예측 값을 계산할 수 있음을 보여준다.

Gibbs Sampler를 이용한 돼지 주요 경제형질의 유전모수 추정 (Estimation of Genetic Parameters via Gibbs Sampler using Animal Model for Economic Traits in Pigs)

  • 조규호;김명직;김인철;전광주
    • Journal of Animal Science and Technology
    • /
    • 제50권1호
    • /
    • pp.19-26
    • /
    • 2008
  • 본 연구는 1998년부터 2006년까지 축산과학원에서 능력검정을 실시한 Duroc종 산육능력 검정자료 3,526두와 혈통자료 3,910두의 자료를 이용하여 30kg시 일당증체량, 90kg시 일당증체량, 평균 등지방두께, 90kg 도달일령 및 사료요구율에 대한 유전모수를 추정하기 위하여 실시하였다. 검정기록을 바탕으로 유전모수의 추정은 단형질 및 다형질 혼합모형을 이용하여 Gibbs sampling을 이용한 Bayesian 방법을 이용하였다. 듀록 종의 산육능력 검정자료를 바탕으로 분산분석을 실시한 결과 모든 조사형질에 대하여 성별, 연도, 계절에 있어서 고도의 유의성을 보였으며, 단형질 Bayesian 방법에 의해 추정한 Post-gibbs 후의 30kg 도달시 일당증체량, 30kg~90kg 도달시 일당증체량, 등지방두께, 90kg 도달일령 및 사료요구율의 유전력은 각각 0.43, 0.49, 0.31, 0.48 및 0.62로 추정되었다. 또한 다형질 Bayesian 방법에 의해 추정한 형질간 유전상관은 30kg 도달시 일당증체량과 30kg~90kg 도달시 일당증체량, 등지방두께, 90kg 도달일령, 사료요구율에서는 각각 -0.02, -0.13, -0.55 및 -0.15로 추정되었으며, 30kg~90kg 도달시 일당증체량과 등지방두께, 90kg 도달일령, 사료요구율간의 유전상관은 각각 0.16, -0.73, -0.32로 추정되었고, 등지방두께와 90kg 도달일령, 사료요구율에서는 각각 0.01 및 -0.08로 추정되었으며, 90kg 도달일령과 사료요구율간의 유전상관은 0.23으로 추정되었다.

절점기준에 따른 강우빈도 변화 및 종관기후학적 분석 (Analysis of Changes in Rainfall Frequency Under Different Thresholds and Its Synoptic Pattern)

  • 김태정;권현한
    • 대한토목학회논문집
    • /
    • 제36권5호
    • /
    • pp.791-803
    • /
    • 2016
  • 최근 기상변동성이 증가함에 따라 지난 30년 동안 극한강우의 발생 빈도는 점차 증가하고 있다. 우리나라는 지리적으로 단시간에 매우 높은 강우강도를 유발하는 강우사상이 빈번하게 발생하여 홍수사상이 유발되기 쉽다. 본 연구에서는 장기간의 강우자료를 활용하여 극치강우사상의 발생을 고려한 강우빈도해석을 수행하였다. 이를 위해 극치강우사상을 분석하는데 있어 서로 다른 절점기준을 사용하여 극치강우의 발생횟수를 반영한 포아송-GPD 강우빈도해석 기법을 개발하였다. 빈도해석을 수행함에 있어서 확률분포 매개변수의 불확실성을 보다 정량적으로 산정할 수 있는 Bayesian 기법을 적용하였으며, 또한 각각의 절점기준에 따라서 분류된 강우사상의 종관기후학적 분석을 수행하였다. 연구결과 우리나라의 극치강우 발생이 증가하는 지점에서 기존의 Gumbel 분포를 통한 확률강우량보다 상향된 결과를 도출하였다. 이는 포아송-GPD 모형이 치수안정성 측면에서 유리한 모형으로 판단된다. 또한 동중국해 지역의 저기압 특성과 북태평양 고기압 특성이 우리나라 극치강우현상에 주로 영향을 미치는 것을 확인하였다.

피라미드 구조와 베이지안 접근법을 이용한 Markove Random Field의 효율적 모델링 (Efficient Methodology in Markov Random Field Modeling : Multiresolution Structure and Bayesian Approach in Parameter Estimation)

  • 정명희;홍의석
    • 대한원격탐사학회지
    • /
    • 제15권2호
    • /
    • pp.147-158
    • /
    • 1999
  • 지표면에 대한 다양한 정보를 제공해 주는 원격탐사기법은 수 십년 동안 우리의 환경을 관찰하고 이해하는데 중요한 역할을 해왔다. 이러한 원격탐사 자료를 이용하는데 다양한 디지털 영상처리기법이 도입되어 자료에서 관찰되는 여러 가지 특성을 모형화하고 처리하는데 매우 유용하게 활용되어져 왔다. 화소들 간의 공간적 관계를 고려하는 Markov Random Field (MRF) 모형은 텍스처 모델링이나 영상분할 및 분류와 같은 여러 분야에서 많이 이용되는 모형으로 이것에 기초한 다양한 알고리즘이 발표되었다. 보통 원격탐사 자료는 그 크기가 매우 크고 시간적 간격을 두고 변화를 관측해 가는 경우에는 분석해야할 자료의 양이 매우 방대하다. 이러한 자료를 처리하는데 걸리는 시간은 처리해야할 자료의 양과는 비선형적 관계에 있다. 본 논문에서는 MRF를 이용하여 원격탐사 자료를 처리할 때 걸리는 시간을 단축하기 위한 방법론이 연구되었다. 이를 위해 논리적 구조로 영상을 피라미드형태로 감소하는 크기로 분석하는 multiresolution 구조가 고려되었는데 이는 연상의 거시적 특징과 미세한 특징을 효율적으로 분석할 수 있는 방법을 제공해 준다. 영상의 크기가 커질수록 파라미터 추정 또한 복잡하고 많은 시간을 요하게 된다. 본 논문에서는 이를 위해 Bayesian 방법을 이용하여 원격탐사 영상과 같은 크기가 큰 영상의 MRF 모형의 파라미터를 효율적으로 추정할 수 있는 방법에 제안되어 있다.

고장수목 기반 베이지안 네트워크를 이용한 가스 플랜트 시스템의 확률론적 안전성 평가 (Probabilistic Safety Assessment of Gas Plant Using Fault Tree-based Bayesian Network)

  • 이세혁;문창욱;박상기;조정래;송준호
    • 한국전산구조공학회논문집
    • /
    • 제36권4호
    • /
    • pp.273-282
    • /
    • 2023
  • 원자력발전소 지진 확률론적 안전성 평가인 PSA(Probabilistic Safety Assessment)는 오랜 기간에 걸쳐 확고히 구축되어 왔다. 반면에 다양한 공정 기반의 산업시설물의 경우 화재, 폭발, 확산(유출) 재난에 대해 주로 연구되어 왔으며, 지진에 대해서는 상대적으로 연구가 미미하였다. 하지만, 플랜트 설계 당시와 달리 해당 부지가 지진 영향권에 들어갈 경우 지진 PSA 수행은 필수적이다. 지진 PSA를 수행하기 위해서는 확률론적 지진 재해도 해석(Probabilistic Seismic Hazard Analysis), 사건수목 해석(Event Tree Analysis), 고장수목 해석(Fault Tree Analysis), 취약도 곡선 등을 필요로 한다. 원자력 발전소의 경우 노심 손상 방지라는 최우선 목표에 따라 많은 사고 시나리오 분석을 통해 사건수목이 구축되었지만, 산업시설물의 경우 공정의 다양성과 최우선 손상 방지 핵심설비의 부재로 인해 일반적인 사건수목 구축이 어렵다. 따라서, 본 연구에서는 산업시설물 지진 PSA를 수행하기 위해 고장수목을 바탕으로 확률론적 시각도구인 베이지안 네트워크(Bayesian Network, BN)로 변환하여 리스크를 평가하는 방법을 제안한다. 제안된 방법을 이용하여 임의로 생성된 가스플랜트 Plot Plan에 대해 최종 BN을 구축하고, 다양한 사건 경우에 대한 효용성있는 의사결정과정을 보임으로써 그 우수성을 확인하였다.

베이지안 네트워크를 이용한 단기 교통정보 예측모델 (A Short-Term Traffic Information Prediction Model Using Bayesian Network)

  • 유영중;조미경
    • 한국정보통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.765-773
    • /
    • 2009
  • 최근의 텔레매틱스 교통정보제공서비스는 지능형 교통시스템의 구축을 통한 실시간 교통정보 수집이 가능해짐에 따라 다양해지고 있다. 본 논문에서는 고품질의 다양한 교통정보제공을 위해 필요한 미래시간에 대한 단기 교통정보 예측 모델을 제안하고 개발하였다. 단기 예측 모델은 현재로부터 가까운 미래의 교통 상황을 예측하기 위한 교통 모델로 본 연구에서 제안한 예측 모델은 각 도로에 대하여 5분 이후부터 1시간 이전까지의 미래시간에 대한 차량 평균 속도를 예측 결과로 준다. 본 연구에서 제안한 예측 모델은 베이지안 네트워크에 기반을 두고 있으며 각 도로의 미래시간 교통상황에 영향을 줄 수 있는 요인들을 분석하여 베이지안 네트워크의 원인노드로 설정하였다. 설계된 베이지안 네트워크에 대하여 실시간 교통정보데이터를 이용하여 가우시안 혼합 분포를 가정한 베이지안 네트워크의 결합 확률 밀도 함수를 EM(Expectation Maximization) 알고리즘으로 구하여 미래시간의 교통정보를 예측하였다. 예측 모델의 정확도 검증을 위해 실시간 교통데이터로 다양한 실험을 수행하였다. 실험결과 제안된 모델은 현재 시간으로부터 10분 이후, 30분 이후, 60분 이후 예측 오차로 각각 4.5, 4.8, 5.2의 RMSE(Root Mean Square Error) 값을 주었다.

강우 및 강우-유출 모형의 불확실성을 고려한 홍수빈도곡선 유도 (Derivation of Flood Frequency Curve with Uncertainty of Rainfall and Rainfall-Runoff Model)

  • 권현한;김장경;박세훈
    • 한국수자원학회논문집
    • /
    • 제46권1호
    • /
    • pp.59-71
    • /
    • 2013
  • 신뢰성 있는 홍수빈도해석을 수행하기 위해서는 충분한 홍수량 및 강우자료가 필요하다. 강우자료의 경우 우리나라 대부분 지역에서 30년 이상의 극치자료가 활용이 가능한 반면 홍수량 자료는 상대적으로 충분한 자료가 확보되지 않아 신뢰성 있는 빈도해석이 어려운 실정이다. 이에 따라 강우모의 기법에 근거한 홍수빈도곡선 유도방안연구가 몇몇 연구에서 제안된 바 있으나, 기본적으로 입력된 강우의 빈도와 홍수의 빈도가 동일하다고 가정함으로 인하여 발생하는 불확실성이 상당부분 내포되어 있다. 이러한 점에서 본 연구의 목적은 강우모의기법과 불확실성 분석이 고려된 홍수빈도곡선 유도방법을 개발하는 것으로 홍수빈도곡선을 유도하는데 있어서의 핵심은 미래에 발생 가능한 극치강수량을 효과적으로 재현할 수 있는 강수량 모의발생 기법과 강우-유출관계의 불확실성 분석에 있다. 본 연구에서는 극치강수량 모의를 위해 불연속 Kernel Pareto 분포를이용한 다지점 강수모의기법과 Bayesian HEC-1 (BHEC-1) 모형을 연계하여 본연구의 대상유역인 대청댐 유역의 강우-유출 관계의 불확실성을 고려한 홍수빈도곡선을 개발하고 모형의 적합성을 평가하였다. 최종적으로 기존 홍수빈도결정방법과 비교를 통해서 모형의 적합성을 확인하였다.