• Title/Summary/Keyword: 확률적 회귀모형

Search Result 184, Processing Time 0.028 seconds

Logistic regression analysis for Critical Rainfall Estimation (한계강우량 산정을 위한 로지스틱 회귀분석)

  • Lee, Changhyun;Lee, Kangwon;Keum, Hojun;Kim, Byunghyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.232-232
    • /
    • 2022
  • 1차원 관망해석모형과 2차원 지표면범람 해석모형을 이용한 도시지역의 실시간 홍수예·경보시스템 구축은 모형의 모의에 많은 시간이 소요되므로 한계가 있다. 또한, 연구유역에서 시나리오 강우에 대해 침수를 유발시키는 한계강우량을 1-2차원 모형의 시행착오법을 적용한 반복적인 수행을 통해 산정하는 것은 비효율적인 방법이다. 따라서, 본 연구에서는 이에 대한 해결책으로 로지스틱 회귀를 이용하여 배수분구별 침수 발생기준 강우량을 산정하고자 한다. 침수 발생 한계강우량 산정을 배수분구 단위로 제시하기 위하여 로지스틱 회귀분석을 이용하였다. 풍수해저감종합계획(2015)과 침수흔적도를 이용하여 배수분구 별 침수이력에 대한 데이터베이스를 구축하고, 이를 1-2차원 수리해석을 통한 침수심과 함께 로지스틱 회귀모형에 학습하였다. 지속시간 1시간, 10mm 강우부터 500년 빈도의 Huff 3분위 시나리오 17개를 사용하여 확률강우량을 산정하였고, 이를 1-2차원 수리해석을 위한 입력자료로 사용하였다. EPA-SWMM을 통한 1차원 도시유출해석과 FLO-2D를 통한 2차원 침수해석에서 20cm 이상의 침수심이 발생하거나 지상관측자료, 침수흔적도 및 풍수해저감종합계획에서 실제 침수가 발생했을 경우를 1, 그렇지 않은 경우를 0으로 하여 데이터베이스를 구축하여 로지스틱 회귀모형에 학습시켜 침수 발생 한계강우량을 산정하였다. 로지스틱 회귀분석을 통해 서울시 지역의 배수분구별 한계강우량을 산정할 수 있으며, 지속적으로 관측되는 강우 및 침수 발생 유무 자료를 추가함으로써 산정된 침수 한계강우량을 상회하는 강우 사상이 나타났을 시에 침수 발생 유무를 확인하여 본 연구에서 제안한 방법에 대해 검증이 가능할 것으로 보인다.

  • PDF

확률회귀모형을 이용한 고속도로의 사고요인 분석

  • Lee, Gi-Yeong;Lee, Yong-Taek
    • 도로교통
    • /
    • s.94
    • /
    • pp.51-64
    • /
    • 2003
  • 본 연구는 사고요인과 사고모형의 문헌고찰을 통해 고속도로를 주행하는 버스와 화물차의 사고모형을 개발하고 그 적용방안에 대해 고찰하고자 수행되었다. 고속도로 사고 중 대형차로 인한 차량당 사고율은 승용차보다 월등히 높아 사고의 심각성을 나타내고 있으며, 따라서 이에 대한 별도의 검토가 필요한 시점에 와 있다. 특히 본 연구에 활용된 자료는 비집계된 사상자수로 구간자료를 집합화함으로써 발생하는 문제점을 해소할 수 있다. 모형의 분석기법으로 국내의 경우, 대부분 단순회귀식으로 사고모형을 개발, 적용하여 왔으나 사고수와 사상자수의 특성상 이산적 확률변수로 해석하여 포아송분포와 음이항분포로 적용하는 것이 바람직하다. 따라서 본 연구에서는 버스와 화물차의 사고유형별로 적합한 사고 모형을 개발하여 이로 인한 인사사고 요인에 대한 영향을 분석하고 그 적용방안을 제시하였다. 이러한 연구는 도로설계, 운영, 교통법규, 교통행정 등의 분야에서 거시적인 정책적 방향성을 제시하리라 판단된다. 특히 본 연구는 고속도로 운영주체인 한국도로공사의 고속도로사고조서를 바탕으로 사고유형별 사고모형을 개발, 적용한 것으로 고속도로의 안정성 향상을 위한 제반 정책 수립에 기초자료로 활용될 것으로 기대된다.

  • PDF

Model selection for unstable AR process via the adaptive LASSO (비정상 자기회귀모형에서의 벌점화 추정 기법에 대한 연구)

  • Na, Okyoung
    • The Korean Journal of Applied Statistics
    • /
    • v.32 no.6
    • /
    • pp.909-922
    • /
    • 2019
  • In this paper, we study the adaptive least absolute shrinkage and selection operator (LASSO) for the unstable autoregressive (AR) model. To identify the existence of the unit root, we apply the adaptive LASSO to the augmented Dickey-Fuller regression model, not the original AR model. We illustrate our method with simulations and a real data analysis. Simulation results show that the adaptive LASSO obtained by minimizing the Bayesian information criterion selects the order of the autoregressive model as well as the degree of differencing with high accuracy.

Estimation of Occurrence Probability of Socioeconomic Damage Caused by Meteorological Drought Using Categorical Data Analysis (범주형 자료 분석을 활용한 사회경제적 가뭄 피해 발생확률 산정 : 충청북도의 적용사례를 중심으로)

  • Yu, Ji Soo;Yoo, Jiyoung;Kim, Min-ji;Kim, Tae-Woong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.348-348
    • /
    • 2021
  • 가뭄 연구의 궁극적 목표는 가뭄 발생의 메커니즘에 대한 이해를 높이고, 예측기술을 향상시켜 선제적 대응이 가능하도록 하는 것이다. 일반적으로 가뭄분석에 활용되는 가뭄지표는 연속형 변수로 간주하여 확률모형을 구축하지만, 가뭄상태와 가뭄피해 자료는 순서형 및 이산형 변수이므로 범주형 자료 분석 기법을 적용하는 것이 더 적절하다. 따라서 본 연구에서는 기상학적 가뭄과 피해발생 사이의 관계를 규명하기 위해 범주형 자료 분석 방법 중 로그선형(log-linear) 모형과 로지스틱(logistic) 회귀모형을 활용하였다. 가뭄피해 예측을 위한 가뭄 피해 정보를 수집하는 것은 매우 어려운 일이다. 가뭄의 영향으로 인해 발생할 수 있는 피해의 종류가 다양하며, 여러 분야의 이해관계자가 받아들이는 가뭄의 피해 양상이 다르기 때문이다. 본 연구에서는 국가가뭄정보포털(drought.go.kr)에서 충청북도의 가뭄피해현황 자료를 수집하였다. 30년(1991~2020년)동안 238개 읍면동 중 34개 행정구역에서 총 272건의 가뭄피해가 발생한 것으로 확인되었다. 표준강수지수(SPI)를 이용하여 분석된 지역별 연평균 가뭄발생횟수는 약 8.44회이며, 가뭄이 가장 많이 발생한 해는 2001년(평균 가뭄발생 18.7회)이었다. 강수의 부족으로 인해 발생하는 기상학적 가뭄이 사회경제적 피해를 야기하는 수문학적 가뭄으로 전이되기까지 몇 주에서 몇 달까지 시간이 소요된다. 이러한 관계를 파악하기 위해 가뭄피해 발생 여부를 예측변수, 가뭄피해 발생 이전의 가뭄상태를 설명변수로 설정하여 기상학적 가뭄 발생에 따른 가뭄피해 발생 확률을 산정하였다. 그 결과 가뭄피해 발생 당시의 가뭄상태보다 그 이전에 연속된 가뭄상태가 있을 경우 가뭄피해 발생 확률이 약 2.5배 상승하는 것으로 나타났다.

  • PDF

The probabilistic estimation of inundation region using a multiple logistic regression analysis (다중 Logistic 회귀분석을 통한 침수지역의 확률적 도출)

  • Jung, Minkyu;Kim, Jin-Guk;Uranchimeg, Sumiya;Kwon, Hyun-Han
    • Journal of Korea Water Resources Association
    • /
    • v.53 no.2
    • /
    • pp.121-129
    • /
    • 2020
  • The increase of impervious surface and development along the river due to urbanization not only causes an increase in the number of associated flood risk factors but also exacerbates flood damage, leading to difficulties in flood management. Flood control measures should be prioritized based on various geographical information in urban areas. In this study, a probabilistic flood hazard assessment was applied to flood-prone areas near an urban river. Flood hazard maps were alternatively considered and used to describe the expected inundation areas for a given set of predictors such as elevation, slope, runoff curve number, and distance to river. This study proposes a Bayesian logistic regression-based flood risk model that aims to provide a probabilistic risk metric such as population-at-risk (PAR). Finally, the logistic regression model demonstrates the probabilistic flood hazard maps for the entire area.

비매개변수적 Kernel 가중함수의 수문학적 응용

  • 문영일
    • Water for future
    • /
    • v.33 no.5
    • /
    • pp.49-55
    • /
    • 2000
  • 전통적인 매개변수적 목적함수 추정방법은 관측자료의 모든 영역에 걸쳐 선형 또는 지수함수 형태의 가정을 기본으로 매개변수를 추정하는 반면 비매개 변수적 Kernel 가중함수를 이용한 방법은 목적함수의 형태에 대한 가정이 필요 없이 관심 있는 임의의 추정지점에서 이웃하는 자료를 이용하여 목적함수를 국지적으로 근사하는 방법이다. 추계학적 수문학의 전형적인 문제인 "목적함수의 가정"에 의해 발생되는 문제를 줄이려는 노력의 일환으로 비매개변수적 Kernel 가중함수를 이용하는 방법에 연구되었고, 본 지면에서는 Kernel 가중함수를 이용한 비매개변수적 확률밀도함수의 기본이론과 빈도해석, 회귀모형 및 비동질성 천이확률 등의 수문학적 응용에 대하여 살펴보았다.

  • PDF

Development of Pedestrian Fatality Model using Bayesian-Based Neural Network (베이지안 신경망을 이용한 보행자 사망확률모형 개발)

  • O, Cheol;Gang, Yeon-Su;Kim, Beom-Il
    • Journal of Korean Society of Transportation
    • /
    • v.24 no.2 s.88
    • /
    • pp.139-145
    • /
    • 2006
  • This paper develops pedestrian fatality models capable of producing the probability of pedestrian fatality in collision between vehicles and pedestrians. Probabilistic neural network (PNN) and binary logistic regression (BLR) ave employed in modeling pedestrian fatality pedestrian age, vehicle type, and collision speed obtained from reconstructing collected accidents are used as independent variables in fatality models. One of the nice features of this study is that an iterative sampling technique is used to construct various training and test datasets for the purpose of better performance comparison Statistical comparison considering the variation of model Performances is conducted. The results show that the PNN-based fatality model outperforms the BLR-based model. The models developed in this study that allow us to predict the pedestrian fatality would be useful tools for supporting the derivation of various safety Policies and technologies to enhance Pedestrian safety.

Nonparametric Bayesian Statistical Models in Biomedical Research (생물/보건/의학 연구를 위한 비모수 베이지안 통계모형)

  • Noh, Heesang;Park, Jinsu;Sim, Gyuseok;Yu, Jae-Eun;Chung, Yeonseung
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.6
    • /
    • pp.867-889
    • /
    • 2014
  • Nonparametric Bayesian (np Bayes) statistical models are popularly used in a variety of research areas because of their flexibility and computational convenience. This paper reviews the np Bayes models focusing on biomedical research applications. We review key probability models for np Bayes inference while illustrating how each of the models is used to answer different types of research questions using biomedical examples. The examples are chosen to highlight the problems that are challenging for standard parametric inference but can be solved using nonparametric inference. We discuss np Bayes inference in four topics: (1) density estimation, (2) clustering, (3) random effects distribution, and (4) regression.

Probabilistic Runoff Analysis using Ensemble Technoque with Localization Method (앙상블 기반 지역화 기법을 이용한 확률론적 유출량 분석)

  • Lee, Han-Yong;Jang, Suk-Hwan;Lee, Jae-Kyoung;Jo, Jun-Won
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.207-207
    • /
    • 2019
  • 최근 우리나라는 지역 특성 및 기후변화의 영향으로 인해 수문학적 요소의 변동성이 커지고 수자원의 지속적인 관리에 있어 유출량은 중요한 문제로 여겨지고 있다. 특히 일부 소하천 또는 접경지역과 같은 미계측유역은 수문학적 요소에 대한 자료가 부족하고 수문모형의 초기치 설정과 과거 유출량 자료를 통하여 최적화한 매개변수를 결정해야하므로 장기유출분석이 어렵다. 본 연구의 적용유역으로 미계측유역인 임진강상류 유역에 대한 유출량 추정을 위해 계측 유역의 자료를 활용하여 모형의 매개변수 등을 추정하는 지역화 기법인 다중선형회귀분석과 공간근접분석을 활용하여 유출량을 산정 및 검증하였다. 또한, 확률론적 예측이 가능한 앙상블 기법 적용을 통한 유출량 예측을 하였고, 이를 예측 정확성 평가지표를 통해 효율성 검토를 수행하여 미계측유역의 유출량에 대해 확률론적 예측을 수행하였다. 대표적 지역화 기법의 적용성을 검토한 결과, 계측유역을 통해 다중선형회귀분석과 공간근접분석을 abcd 모형에 적용하였다. 모의유출량을 산정하고 실측 유출량과 비교 분석 결과 모의정확성이 높게 분석되었다. 이와 같은 검증 결과를 토대로 미계측유역의 유출량을 추정하였다. 또한, 지역화 기법을 앙상블 기법에 적용하여 확률론적 유출량 예측의 효율성을 검토하였다. 적용유역과 같은 지류를 포함하고 있는 임진강하류 유역을 대상으로 수행하였다. 검증기간(2013년~2017년) 동안의 월 예측 유출량 앙상블 생성을 위해 과거 강우량와 증발량(1988년~2012년) 자료를 사용하였으며, 지역화 기법을 적용한 abcd 모형을 이용하였다. 예측 유출량의 정확성 평가를 실시하였으며, 정확성이 비교적 높게 분석되었다. 이와 같은 결과를 토대로 미계측유역의 확률론적 유출량을 예측하였다. 따라서, 대표적 지역화 기법을 앙상블 기법에 적용하여 확률론적 유출량을 예측할 경우 보다 정확한 유출량 예측이 가능하다.

  • PDF

An Idea, Strategy of Congestion Pricing for Differentiated Services and Forecasting Probability of Access using Logistic Regression Model (차등서비스를 위한 혼잡요금부과의 타당성 검토와 로지스틱 회귀모형을 이용한 인터넷 접속 확률 예측)

  • Ji Seonsu
    • Journal of Korea Society of Industrial Information Systems
    • /
    • v.10 no.1
    • /
    • pp.9-15
    • /
    • 2005
  • Congestion control is an important research area in computer network. In this paper, I provided strategy of congestion pricing with differentiated services. And, suggested forecasting model of access that considered differentiated pricing, delay time, satisfaction using logistic regression. In a forecasting model of access with logistic regression technique, it is shown that coefficient of determination using suggested model is $70.7\%$.

  • PDF