• 제목/요약/키워드: Bayesian 다중회귀분석

검색결과 15건 처리시간 0.029초

Bayesian 다중회귀분석을 이용한 저수량(Low flow) 지역빈도분석 (Regional Low Flow Frequency Analysis Using Bayesian Multiple Regression)

  • 김상욱;이길성;성진영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.169-173
    • /
    • 2008
  • 본 연구는 저수량 지역 빈도분석(regional low flow frequency analysis)을 수행하기 위하여 일반최소자승법(ordinary least squares method)을 이용한 Bayesian 다중회귀분석을 적용하였으며, 불확실성측면에서의 효과를 탐색하기 위하여 Bayesian 다중회귀분석에 의한 추정치와 t 분포를 이용하여 산정한 일반 다중회귀분석의 추정치의 신뢰구간을 비교분석하였다. 각 재현기간별 비교결과를 보면 t 분포를 이용하여 산정된 평균 추정치와 Bayesian 다중회귀분석에 의한 평균 추정치는 크게 다르지 않았다. 그러나 불확실성 측면에서 평가해볼 때 신뢰구간의 상한추정치와 하한추정치의 차이는 Bayesian 다중회귀분석을 사용한 경우가 기존 방법을 사용한 경우보다 훨씬 작은 것으로 나타났으며, 이로부터 저수량(low flow) 지역 빈도분석을 수행하는 경우 Bayesian 다중회귀분석이 일반 회귀분석보다 불확실성을 표현하는데 있어서 우수하다는 결과를 얻을 수 있었다. 또한 낙동강 유역에 2개의 미계측 유역을 선정하고 구축된 Bayesian 다중회귀모형을 적용하여 불확실성을 포함한 미계측 유역에서의 저수량(low flow)을 추정하였으며 이와 같은 방법이 미계측 유역에서의 저수(low flow) 특성을 나타내는 데 있어서 효과적일 수 있음을 입증하였다.

  • PDF

Bayesian 다중회귀분석을 이용한 저수량(Low flow) 지역 빈도분석 (Regional Low Flow Frequency Analysis Using Bayesian Multiple Regression)

  • 김상욱;이길성
    • 한국수자원학회논문집
    • /
    • 제41권3호
    • /
    • pp.325-340
    • /
    • 2008
  • 본 연구는 저수량 지역 빈도분석(regional low flow frequency analysis)을 수행하기 위하여 일반최소자승법(ordinary least squares method)을 이용한 Bayesian 다중회귀분석을 적용하였으며, 불확실성측면에서의 효과를 탐색하기 위하여 Bayesian 다중회귀분석에 의한 추정치와 t 분포를 이용하여 산정한 일반 다중회귀분석의 추정치의 신뢰구간을 비교분석하였다. 각 재현기간별 비교결과를 보면 t 분포를 이용하여 산정된 평균 추정치와 Bayesian 다중회귀분석에 의한 평균 추정치는 크게 다르지 않았다. 그러나 불확실성 측면에서 평가해볼 때 신뢰구간의 상한추정치와 하한추정치의 차이는 Bayesian 다중회귀분석을 사용한 경우가 기존 방법을 사용한 경우보다 훨씬 작은 것으로 나타났으며, 이로부터 저수량(low flow) 지역 빈도분석을 수행하는 경우 Bayesian 다중회귀분석이 일반 회귀분석보다 불확실성을 표현하는데 있어서 우수하다는 결과를 얻을 수 있었다. 또한 낙동강 유역에 2개의 미계측 유역을 선정하고 구축된 Bayesian 다중회귀모형을 적용하여 불확실성을 포함한 미계측 유역에서의 저수량(low flow)을 추정하였으며 이와 같은 방법이 미계측 유역에서의 저수(low flow) 특성을 나타내는 데 있어서 효과적일 수 있음을 입증하였다.

연속 강우-유출모형의 매개변수 지역화에 관한 연구 (A Study on Regionalization of Parameters of Continuous Rainfall-Runoff Model)

  • 정가인;김태정;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.182-182
    • /
    • 2015
  • 우리나라에서는 강우관측시스템의 지역적 불균형으로 상대적으로 소규모 저수지의 경우 미계측유역의 특성을 가지며, 신뢰성 있는 강우량, 유출량, 증발량 자료가 매우 부족한 실정이다. 다목적댐 유역과 같은 계측유역의 경우 상류유역의 유입량 자료의 확보가 용이하지만 대부분의 유역의 경우 계측장비가 부족하여 신뢰성이 확보된 유입량 자료를 얻는데 많은 어려움이 있다. 본 연구에서는 미계측유역의 유입량 산정을 위하여 계측유역을 대상으로 강우-유출 모형의 매개변수를 산정하였으며, 산정된 매개변수를 유역특성인자와의 상관성을 토대로 다중선형회귀분석기법(multiple linear regression, MLR)을 적용하여 지역화(regionalization)를 위한 회귀식을 도출하였다. 이를 위해 양질의 유량자료가 확보된 K-water 17개 댐 유역을 대상으로 매개변수를 산정하였으며 이 중 2개의 댐 유역을 미계측유역으로 간주하여 개발된 모형을 검증하였다. 대부분의 통계 지표에서 우수한 모의능력을 확인하였으며, 본 연구를 통하여 개발된 지역화 기법을 미계측유역에 활용한다면 보다 정량적이고 효율적인 수자원 계획이 가능할 것으로 판단된다. 향후 연구로는 불확실성을 고려한 Bayesian GLM 모형을 이용한 지역화기법을 개발하여 매개변수의 불확실성까지 고려할 수 있는 방안을 모색하고자 한다.

  • PDF

유역특성인자를 활용한 Sacramento 장기유출모형의 매개변수 지역화 기법 연구 (A Study on Regionalization of Parameters for Sacramento Continuous Rainfall-Runoff Model Using Watershed Characteristics)

  • 김태정;정가인;김기영;권현한
    • 한국수자원학회논문집
    • /
    • 제48권10호
    • /
    • pp.793-806
    • /
    • 2015
  • 미계측유역의 유출량 모의는 수문학 분야에서 필수적인 사항이다. 강우-유출 모형을 이용하여 신뢰성 있는 유출량을 모의하기 위한 핵심사항은 강우-유출 모형의 매개변수를 추정하는 것이다. 하지만 현재 우리나라는 불충분한 수문자료로 인해 매개변수 추정에 어려움이 존재한다. 본 연구의 목표는 불확실성 반영을 위한 Bayesian 통계기법 기반의 강우-유출 모형의 매개변수를 지역화 하는 것이다. 그 방법은 다음과 같다. 첫째, 본 연구는 세계적으로 널리 사용되고 있는 Sacramento 강우-유출 모형에 Bayesian Markov Chain Monte Carlo 기법을 연계한 Bayesian Sacramento 강우-유출 모형을 사용하여 계측유역을 대상으로 13개 매개변수를 최적화하고 각 매개변수의 사후분포를 도출하였다. 둘째, 매개변수와 유역특성인자 사이에 회귀특성을 얻기 위해 다중선형회귀분석을 적용하여 유역특성을 고려한 지역화 매개변수를 결정하였다. 다중회귀분석을 통하여 산정된 지역화 매개변수를 계측유역에 전이하여 유출량을 모의 후 통계적 효율기준인 N-S계수, 일치계수 및 상관계수를 사용하여 지역화 매개변수 검증을 수행하였다.

내재된 인자회귀모형의 베이지안 분석법 (Bayesian analysis of latent factor regression model)

  • 경민정
    • 응용통계연구
    • /
    • 제33권4호
    • /
    • pp.365-377
    • /
    • 2020
  • 선형모형에서 두개 이상의 설명변수들 사이에 존재하는 다중공선성 문제를 변수들 간에 내재되어 있는 공통의 구조인 인자를 구성하고, 인자들을 회귀변수로 사용하여 해결하는 인자회귀모형에 대하여 논의한다. 무한개로 가정 가능한 내재된 인자 중 유의미한 인자적재행렬을 구성하기 위하여 벌점모수의 값이 큰 LASSO 사전분포를 적용하는 베이지안 추정법을 사용한다. 결정된 인자적재행렬과 다른 모수들의 추정값을 각 설명변수의 선형모수로 역변환 하여, 새로운 관측값에 대한 예측 모형으로도 사용한다. 제안한 방법을 제품 서비스 관리 자료에 적용하여 정해진 인자의 개수에 대한 인자가 일반적인 공통인자회귀모형과 동일한 결과를 나타냄을 확인하였고, 일반적인 공통인자회귀모형과 비교를 위해 계산한 평균 제곱 오차값이 더 작다는 것을 알 수 있었다.

베이지안 다중분위회귀분석모형 개발 및 온도상승에 따른 미래 확률강수량 전망 (Development of Bayesian Multiple Quantile Regression model and Estimation fo Future Design Rainfall with Increased Temperature)

  • 오랑치맥 솜야;김진국;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.22-22
    • /
    • 2019
  • 최근 전 세계적으로 급증하는 기후변화의 영향으로 인해 강우량 증가에 따른 이상홍수 발생 및 댐 여유고 부족 등 다양한 위험인자가 노출되고 있다. 이러한 예상치 못한 이상홍수는 실제 거주하고 있는 사람들을 위협할 수 있으며, 하천 범람으로 인해 2차 3차 피해가 일어날 가능성이 존재하고 있다. 이에 다양한 자연재해로부터 인명 및 재산 피해를 방지 및 저감하기 위한 목적으로 다양한 수공구조물이 존재하며, 수자원 관리계획 수립의 목적에 따라 다양한 강수량이 활용되고 있다. 특히, 지구온난화에 따른 기후변화 영향을 고려한 연최대 강수량 및 확률강수량 산정이 필요한 시점이며, 온도변화에 따른 증기압 계산식인 Clausius-Clapeyron 관계에 따르면 대기 온도가 $1^{\circ}C$ 상승할 때 대기수분량이 6~7% 증가하여 평균 온도상승에 따라 극치강수량 발생 잠재력이 향상 될 것으로 전망되고 있다. 본 연구에서는 온도상승에 따른 극치강수량의 변화를 베이지안 다중분위회귀분석모형을 통해 산정하여 CORDEX 온도자료 기반의 미래 극치강수량을 전망하였다. 본 연구결과 100년 이상 빈도의 강수량은 온도상승에 따라 급격히 증가하는 추세를 확인하였으며, 2100년까지 온도상승을 고려한 최대 극치강수량은 1500mm를 넘을 가능성을 확인하였다.

  • PDF

다중대체와 재현자료 작성 (Multiple imputation and synthetic data)

  • 김정연;박민정
    • 응용통계연구
    • /
    • 제32권1호
    • /
    • pp.83-97
    • /
    • 2019
  • 사회가 발전함에 따라 이용자의 다양한 분석 요구에 대응하기 위해 개인 단위로 구성된 마이크로데이터 제공이 증가했다. 나아가 센서스, 행정자료와 같은 전수자료를 마이크로데이터 형태로 제공받아 연구하고자 하는 요구 역시 커지고 있다. 정책결정, 학술목적 등을 위한 마이크로데이터 분석은 가치 창출 측면에서 대단히 바람직하다. 하지만 자료 유용성이 확보된 마이크로데이터 제공은 개인정보가 노출될 가능성이라는 위험을 가질 수 밖에 없다. 이에, 자료의 유용성을 확보하면서 개인정보보호를 보장할 수 있는 여러 방법들이 고려되어 왔다. 이러한 방법 중 하나로 재현자료(synthetic data)를 생성해서 활용하는 방법이 연구되어 왔다. 본 논문은 재현자료 생성과 관련된 방법론 및 주의사항을 소개하여, 재현자료의 이해를 도모하고자 한다. 이를 위해 재현자료 작성에 필수적인 다중대체, 베이지안 예측 모형 및 베이지안 붓스트랩 등의 개념들을 먼저 설명하고, 완전 재현자료 및 부분 재현자료에 대해 살펴본다. 특히, 재현자료 작성을 심도 깊이 이해하기 위해 순차회귀 다중대체(sequential regression multivariate imputation)를 이용해 경시적(longitudinal) 자료를 재현자료로 작성하는 구체적 사례를 살펴본다.

다중 Logistic 회귀분석을 통한 침수지역의 확률적 도출 (The probabilistic estimation of inundation region using a multiple logistic regression analysis)

  • 정민규;김진국;오랑치맥 솜야;권현한
    • 한국수자원학회논문집
    • /
    • 제53권2호
    • /
    • pp.121-129
    • /
    • 2020
  • 도시화로 인한 불투수층 증가와 하천 주변 개발은 홍수 시 위험에 노출되는 재해요인의 증가뿐 아니라 피해의 파급을 발생시켜 홍수 관리 측면에서 어려움을 낳는다. 홍수 방재대책을 위해서는 도시지역에 분포하는 다양한 지표면 공간특성을 반영하여 침수가 예상되는 지역에 대한 파악이 우선시되어야 한다. 본 연구에서는 도시하천의 홍수 위험지역을 대상으로 확률적 홍수위험 평가가 수행되었다. 홍수와 관련된 지형적 영향요인인 고도, 경사, 유출곡선지수, 하천까지 거리를 예측변수로 하여 하천 주변 침수 예상지역을 설명하기 위해 모형의 학습데이터로 100년 빈도 홍수위험 지도가 사용되었다. 연구 대상 지역은 격자로 변환하여 Bayesian Logistic 회귀분석을 수행하여 각 격자별로 홍수영향요인이 침수 여부를 설명하는 모형을 구축하였다. 최종적으로 모형을 통해 대상 지역 전체에 대하여 침수위험도를 확률적으로 제시하였다.

한계와 이상치가 있는 결측치의 로버스트 다중대체 방법 (Robust multiple imputation method for missings with boundary and outliers)

  • 박유성;오도영;권태연
    • 응용통계연구
    • /
    • 제32권6호
    • /
    • pp.889-898
    • /
    • 2019
  • 항목 무응답(item missing)이 발생한 설문조사에서 결측이 포함된 변수에 이상치(outlier)의 존재와 다른 설문문항 항목과의 논리적 한계(boundary) 조건들이 유의미하다면 결측치 대체문제는 매우 복잡해진다. 한계가 있는 결측값들을 포함한 변수에 이상치가 존재하는 경우, 기존의 회귀분석에 근거한 결측치 대체방법은 편향된 대체값 그리고 한계를 만족하지 않은 대체값을 제시할 가능성이 있다. 이에 본 논문은 회귀모형에 기반을 두고 결측치들을 대체를 함에 있어 이상치와 논리적 한계조건이 자료에 존재하는 경우, 다양한 로버스트 회귀모형과 다중대체 방법의 조합을 통해 해결점을 모색하고자 한다. 이를 위해 이들 방법들의 최적의 조합을 다양한 시나리오별로 모의실험을 통하여 찾아보고 이에 대하여 논의하였다.

일반계 고등학생 사교육비 지출에 대한 베이지안 분위회귀모형 분석 (Bayesian quantile regression analysis of private education expenses for high scool students in Korea)

  • 오현숙
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1457-1469
    • /
    • 2017
  • 일반계 고등학생의 사교육비 지출은 대학입시와 맞물려 최근 더욱 증가하고 있는 동시에 가구소득 수준, 지역 등에 따라 양극화되고 있다. 기존의 사교육비 연구는 주로 다중회귀모형을 토대로 최소자승법을 이용하였으나 자료가 최소자승법의 기본가정인 정규성과 등분산성을 만족하지 않으면 분석결과의 신뢰성에 대한 문제가 발생된다. 본 연구는 2015년도 사교육실태조사자료에 대하여 정규성과 등분산성이 성립되지 않음을 확인하고 이를 통제할 수 있는 베이지안 분위회귀모형을 적합한 후 깁스 샘플링 방법을 이용하여 사교육비 지출규모 수준 (분위수)에 따라 영향요인들을 분석하였다. 분석결과 학생의 성별, 부모의 나이, 방과후 학교 참여시간과 비용은 사교육비 지출규모에 의미있는 영향을 주지 못하였다. 가구소득은 사교육비 지출규모의 모든 수준에서 동일하게 영향을 주는 요인으로 파악되었다. 그 외, 거주지역, 총사교육시간, 학생의 성적, 부모의 교육정도, 가구의 경제활동주체, 방과후 학교 참여여부, EBS 교재비용은 사교육비 지출 규모의 수준에 따라 다르게 영향을 주었다.