• Title/Summary/Keyword: 회귀분석 방법

Search Result 3,648, Processing Time 0.038 seconds

수량화 분석과 AHP를 이용한 산사태 예측모형 개발

  • Nam, Eun-Mi;Jun, Kyoung-Ho;Yu, Hyu-Kyong;Na, Jong-Hwa
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2009.05a
    • /
    • pp.114-119
    • /
    • 2009
  • 본 논문에서는 수량화 방법과 AHP(Analytic Hierarchy Process) 기법을 사용하여 산사태 발생에 대한 통계적 예측모형을 구축하는데 목적이 있다. 수량화(Quantification) 방법은 질적변수에 수량을 부여하는 통계적 방법으로, 기 조사된 자료에 기반하여 분석을 수행하는 방법이다. 본 논문에서는 서구의 다변량분석 기법인 정준상관분석의 결과를 토대로 수량화 과정을 구체적으로 제안한다. 데이터에 기반한 수량화 방법과는 달리 AHP(Analytic Hierarchy Process) 기법은 일종의 다기준 의사결정을 위해 사용되는 기법으로, 설문자료에 기반한 분석법이다. 실제자료에 대한 분석으로 산사태 발생여부를 측정한 자료(한국지질자원연구원 제공)와 전문가 설문을 통해 수집된 자료를 이용하였다. 이들 자료에 대해 수량화 분석과 AHP분석을 통해 산사태 발생여부를 예측할 수 있는 두 종류의 평가표와 함께 로지스틱 회귀를 통한 통계적 예측모형을 개발하였으며, 두 모형간의 성능비교와 안정성 평가를 수행하였다.

  • PDF

Logistic regression analysis for Critical Rainfall Estimation (한계강우량 산정을 위한 로지스틱 회귀분석)

  • Lee, Changhyun;Lee, Kangwon;Keum, Hojun;Kim, Byunghyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.232-232
    • /
    • 2022
  • 1차원 관망해석모형과 2차원 지표면범람 해석모형을 이용한 도시지역의 실시간 홍수예·경보시스템 구축은 모형의 모의에 많은 시간이 소요되므로 한계가 있다. 또한, 연구유역에서 시나리오 강우에 대해 침수를 유발시키는 한계강우량을 1-2차원 모형의 시행착오법을 적용한 반복적인 수행을 통해 산정하는 것은 비효율적인 방법이다. 따라서, 본 연구에서는 이에 대한 해결책으로 로지스틱 회귀를 이용하여 배수분구별 침수 발생기준 강우량을 산정하고자 한다. 침수 발생 한계강우량 산정을 배수분구 단위로 제시하기 위하여 로지스틱 회귀분석을 이용하였다. 풍수해저감종합계획(2015)과 침수흔적도를 이용하여 배수분구 별 침수이력에 대한 데이터베이스를 구축하고, 이를 1-2차원 수리해석을 통한 침수심과 함께 로지스틱 회귀모형에 학습하였다. 지속시간 1시간, 10mm 강우부터 500년 빈도의 Huff 3분위 시나리오 17개를 사용하여 확률강우량을 산정하였고, 이를 1-2차원 수리해석을 위한 입력자료로 사용하였다. EPA-SWMM을 통한 1차원 도시유출해석과 FLO-2D를 통한 2차원 침수해석에서 20cm 이상의 침수심이 발생하거나 지상관측자료, 침수흔적도 및 풍수해저감종합계획에서 실제 침수가 발생했을 경우를 1, 그렇지 않은 경우를 0으로 하여 데이터베이스를 구축하여 로지스틱 회귀모형에 학습시켜 침수 발생 한계강우량을 산정하였다. 로지스틱 회귀분석을 통해 서울시 지역의 배수분구별 한계강우량을 산정할 수 있으며, 지속적으로 관측되는 강우 및 침수 발생 유무 자료를 추가함으로써 산정된 침수 한계강우량을 상회하는 강우 사상이 나타났을 시에 침수 발생 유무를 확인하여 본 연구에서 제안한 방법에 대해 검증이 가능할 것으로 보인다.

  • PDF

A Comparative Study on the Genetic Algorithm and Regression Analysis in Urban Population Surface Modeling (도시인구분포모형 개발을 위한 GA모형과 회귀모형의 적합성 비교연구)

  • Choei, Nae-Young
    • Spatial Information Research
    • /
    • v.18 no.5
    • /
    • pp.107-117
    • /
    • 2010
  • Taking the East-Hwasung area as the case, this study first builds gridded population data based on the municipal population survey raw data, and then measures, by way of GIS tools, the major urban spatial variables that are thought to influence the composition of the regional population. For the purpose of comparison, the urban models based on the Genetic Algorithm technique and the regression technique are constructed using the same input variables. The findings indicate that the GA output performed better in differentiating the effective variables among the pilot model variables, and predicted as much consistent and meaningful coefficient estimates for the explanatory variables as the regression models. The study results indicate that GA technique could be a very useful and supplementary research tool in understanding the urban phenomena.

A Study on Improving Estimation of Recurrence Rate of Public Water -Jungnangcheon Watershed- (생활용수 회귀수량 산정방법의 개선연구 -중랑천 유역을 대상으로-)

  • Jung, Chung Gil;Ahn, So Ra;Joh, Hyung Kyung;Kim, Seong Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.509-509
    • /
    • 2015
  • 물 수요관리측면에 대한 정책을 수립하기 위해서는 현재 또는 장래에 대한 용수수급의 정확한 이해를 필요로 한다. 이를 위해서는 용수 수요량 및 공급량뿐만 아니라 여러 산정요소를 필요로 하는데, 그 중 회귀수량은 물이 이용되고 다시 하천으로 회귀되어 이용될 가능성이 있는 수량으로 정의되며, 용수수급 및 용수절약 측면에서 회귀 수량은 중요한 요소라 할 수 있다. 회귀수량 조사는 유역조사 사업 이래, 10년간 생?공용수를 중심으로 미시적, 거시적으로 조사를 시행하였으나, 측정 자료의 신뢰도, 조사방법 및 지점선정 등의 문제로 인하여 조사 성과의 활용성이 매우 낮은 실정이다. 수자원장기종합계획등에서는 수자원관련 계획 수립시 생?공용수의 회귀율을 65 %로 적용하고 있으나, 이는 1970년대 말의 사회적 여건 및 경제적 상황이 반연된 결과로 현재 상황에 적용되기 곤란하다. 따라서, 현재 실정에 맞는 회귀율 산정은 반드시 필요하게 된다. 본 연구에서는 기존 생활용수 회귀수량 산정 연구 한계를 보완하고 유역조사 시행을 위한 개선된 회귀수량을 산정하고자 한다. 본 연구는 서울시 중랑물재생센터 처리구역을 기반으로 중랑천유역을 시험유역으로 선정하였다. 기존 회귀수량 산정방법을 개선하기 위해 시험유역 회귀수량 산정을 위한 가용 자료 분석 및 용수흐름 네트워크 공간분석을 추가로 진행하였다. 가용자료로 시험 유역내 상수공급자료(정수장 공급량, 상수계통도, 유수 및 누수율), 하수처리자료(하수처리구역도, 하수처리계통도, 유입량 및 방류량) 및 기상자료(기상청 지점 및 AWS 강우자료)를 구축하였고 각각의 상수계통도 및 하수처리계통도로부터 용수 흐름 네트워크망을 구축하였다. 상수공급자료로부터 상수계통도 공급지역을 구분하여 월별 유수율에 따른 월별 실 공급량을 산정하였다. 하수처리자료로부터 시험유역에서의 월별하수처리 유입량 및 방류량을 산정하였다. 최종적으로 회귀율(하수처리 방류량/실 공급량)을 산정한 결과 연평균 회귀율은 각각 93.97 %(2011년), 95.02%(2012년)로 과잉 추정 되었으며 7 ~ 9월의 회귀율은 110 ~ 120 %로 유입량을 초과하였다. 이는, 하수처리로 유입되는 유입량의 하수관거는 합류식으로 구축되어 7 ~ 9월에 많은 양의 강우량이 우수관을 통해 하수처리장으로 이송되어 생활용수 이외에 자연적인 공급량으로 인한 것으로 분석되었다. 따라서, 월별 회귀율 산정을 위해서는 불투수층에서의 면적강우량(mm)을 유입량(m3/s)으로 환산된 값을 고려하여 회귀율을 재산정하였다. 그 결과 연평균 회귀율은 각각 78.27 %(2011년), 77.58 %(2012년)로 나타났다.각각의 월별 회귀율도 매우 유사하게 나타났으며 과거 관용적으로 사용된 65 % 회귀율보다 약 12 ~ 13%로 증가하였으며 이는, 하수처리시설 구축 및 처리효율의 증가와 상수처리시설의 관로시설의 개량으로 인한 유수율 및 누수율 감소로 회귀율이 증가한 것으로 판단된다.

  • PDF

Uncertainty Analysis of Stage-Discharge Curve Based on Bayesian Regression Model Coupled with Change-Point Analysis (Bayesian 회귀분석과 변동점 분석을 이용한 수위-유량 관계곡선 불확실성 분석)

  • Kwon, Hyun-Han;Kim, Jang-Gyeong
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.364-364
    • /
    • 2012
  • 수자원 연구의 주요 목적인 효과적인 홍수 및 가뭄관리를 하기 위해서는 그 연구의 기초가 되는 자료를 관측하고 정도(accuracy, 精度)를 향상시키는 연구 또한 매우 중요한 부분이라고 볼 수 있다. 이러한 점에서 수위-유량측정의 경우, 관측자의 숙련도와 계측기 오차에 따라 관측값에 미치는 영향이 큰 특징을 갖고 있어 유량측정의 정확성을 높이고자 진보된 계측기의 개발 및 분석 방법에 관한 연구는 꾸준히 진행되고 있다. 일반적으로 유량을 추정하기 위해서 특정 단면에서의 수위를 측정하여 이를 수위-유량 관계곡선을 통해서 유량으로 환산하고, 수위-유량 관계를 측정한 후 이를 회귀분석 방법으로 내삽 및 외삽을 실시하여 유량을 측정하게 된다. 그러나 수위-유량 관계곡선에서 저수위와 고수위를 하나의 곡선식으로 하게 되는 경우 정도가 낮아지게 되므로 많은 경우에 있어서 저수위, 고수위를 각각의 곡선으로 구하여 사용하고 있다. 문제는 이러한 경우 정량적으로 변곡점을 구하기보다는 경험적으로 저수위와 고수위를 구분하고 있으며, 수위-유량관계를 회귀식에 의해서 추정하게 되므로 이에 대한 불확실성이 발생하게 된다. 따라서 본 연구에서는 불확실성을 정량화시키기 위한 방법으로 Bayesian MCMC 기법을 활용하며 수위-유량 관계곡선식의 매개변수들의 사후분포를 추정하여 매개변수의 최적화 및 불확실성을 평가하였다. 앞서 언급되었듯이 저수위 및 고수위로 분리하여 수위-유량 곡선식을 도출하고 있으나 저수위 및 고수위를 분리하는 기준이 경험적이기 때문에 신뢰성이 저해되는 문제점이 발생한다. 본 연구에서는 수위-유량 곡선식의 매개변수들을 최적화 하는 동시에 Poisson 분포 기반의 변동점 분석이 연동되어 저수위 및 고수위를 분리할 수 있는 Bayesian 기반 통합 수위-유량 곡선 해석 방법을 개발하고자 한다.

  • PDF

Trend Analysis of Extreme Precipitation Using Quantile Regression (Quantile 회귀분석을 이용한 극대강수량 자료의 경향성 분석)

  • So, Byung-Jin;Kwon, Hyun-Han;An, Jung-Hee
    • Journal of Korea Water Resources Association
    • /
    • v.45 no.8
    • /
    • pp.815-826
    • /
    • 2012
  • The underestimating trend using existing ordinary regression (OR) based trend analysis has been a well-known problem. The existing OR method based on least squares approximate the conditional mean of the response variable given certain values of the time t, and the usual assumption of the OR method is normality, that is the distribution of data are not dissimilar form a normal distribution. In this regard, this study proposed a quantile regression that aims at estimating either the conditional median or other quantiles of the response variable. This study assess trend in annual daily maximum rainfall series over 64 weather stations through both in OR and QR approach. The QR method indicates that 47 stations out of 67 weather stations are a strong upward trend at 5% significance level while OR method identifies a significant trend only at 13 stations. This is mainly because the OR method is estimating the condition mean of the response variable. Unlike the OR method, the QR method allows us flexibly to detect the trends since the OR is designed to estimate conditional quantiles of the response variable. The proposed QR method can be effectively applied to estimate hydrologic trend for either non-normal data or skewed data.

Binary regression model using skewed generalized t distributions (기운 일반화 t 분포를 이용한 이진 데이터 회귀 분석)

  • Kim, Mijeong
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.5
    • /
    • pp.775-791
    • /
    • 2017
  • We frequently encounter binary data in real life. Logistic, Probit, Cauchit, Complementary log-log models are often used for binary data analysis. In order to analyze binary data, Liu (2004) proposed a Robit model, in which the inverse of cdf of the Student's t distribution is used as a link function. Kim et al. (2008) also proposed a generalized t-link model to make the binary regression model more flexible. The more flexible skewed distributions allow more flexible link functions in generalized linear models. In the sense, we propose a binary data regression model using skewed generalized t distributions introduced in Theodossiou (1998). We implement R code of the proposed models using the glm function included in R base and R sgt package. We also analyze Pima Indian data using the proposed model in R.

The Changing Point Analysis of Annual Maximum Rainfall

  • Sung, Jang-Hyun;Kang, Hyun-Suk;Park, Su-Hee;Cho, Chun-Ho;Kim, Young-Oh
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.22-22
    • /
    • 2011
  • 기존의 빈도해석(frequency analysis) 방법은 자료의 정상성(stationarity)을 가정하고 있다. 즉, 자료 분포가 기상에 영향을 받는 정도가 통계적으로 유의하지 않다는 것을 의미하는데 최근의 관측값들은 주기를 나타내거나 증가, 감소하는 경향을 자주 보이고 있고 이는 정상성에 대한 가정이 더 이상 유효하지 않음을 의미한다. 본 연구는 최근 증가경향이 두드러지게 나타나고 있는 관측 연최대 일강우량을 대상으로 증가 변동점(changing point)을 탐색하였다. 이를 위하여 Barry and Hartigan이 1999년에 제안한 BCP (Bayesian Change Point) 방법을 우리나라 전체 강우 관측지점에 적용하였다. 적용 결과, 2000년대를 기준으로 이전의 관측값과 통계적 특성이 다른 관측값들이 많이 발생하는 것을 알 수 있었다. 향후, 매개변수와 시간의 회귀분석(regression analysis)으로 확률분포형의 미래 매개변수를 구하는 비정상성 빈도해석 방법 적용시, BCP 결과로 얻은 변동점을 바탕으로 회귀분석의 구간을 적절하게 선택한다면 계산된 결과의 신뢰성이 더욱 향상되리라 본다.

  • PDF

패널무응답의 가중수정 방법

  • 신민웅;윤연옥
    • Proceedings of the Korean Association for Survey Research Conference
    • /
    • 2002.06a
    • /
    • pp.157-162
    • /
    • 2002
  • 패널 무응답자(panel nonrespondent)란 처음 조사에서는 응답을 하였으나 나중 조사에서는 응답을 하지 않은 사람을 의미한다. 패널조사에서는 앞 단계에서의 응답으로부터 뒷 단계의 무응답에 대한 정보를 얻을 수 있다. 무응답에 대한 수정 방법은 어떤 보조 변수들을 선택하고, 그 변수들이 수정하는 데 어떻게 사용하는 가를 결정하는 것이다. 우리는 가중 수정을 패널 무응답자에 대해서만 생각한다. 이러한 가중은 패널 무응답자에 대하여 보상하기 위하여 패널 무응답의 가중값을 수정한다. 종속 변수로서 패널응답 상태(status)는 로지스틱 회귀분석으로 패널 무응답에 대한 모형을 선택하는 방법이다. 로지스틱 회귀분석에서 패널무응답과 상관이 있는 변수들은 패널무응답 편향을 감소시키기 위하여 가중 수정에서 사용하기 위한 변수들이다.

  • PDF

Study on Accident Prediction Models in Urban Railway Casualty Accidents Using Logistic Regression Analysis Model (로지스틱회귀분석 모델을 활용한 도시철도 사상사고 사고예측모형 개발에 대한 연구)

  • Jin, Soo-Bong;Lee, Jong-Woo
    • Journal of the Korean Society for Railway
    • /
    • v.20 no.4
    • /
    • pp.482-490
    • /
    • 2017
  • This study is a railway accident investigation statistic study with the purpose of prediction and classification of accident severity. Linear regression models have some difficulties in classifying accident severity, but a logistic regression model can be used to overcome the weaknesses of linear regression models. The logistic regression model is applied to escalator (E/S) accidents in all stations on 5~8 lines of the Seoul Metro, using data mining techniques such as logistic regression analysis. The forecasting variables of E/S accidents in urban railway stations are considered, such as passenger age, drinking, overall situation, behavior, and handrail grip. In the overall accuracy analysis, the logistic regression accuracy is explained 76.7%. According to the results of this analysis, it has been confirmed that the accuracy and the level of significance of the logistic regression analysis make it a useful data mining technique to establish an accident severity prediction model for urban railway casualty accidents.