• Title/Summary/Keyword: 다중 회귀모형

Search Result 705, Processing Time 0.04 seconds

Comparison of Data-based Real-Time Flood Forecasting Model (자료기반 실시간 홍수예측 모형의 비교·검토)

  • Choi, Hyun Gu;Han, Kun Yeun;Roh, Hong Sik;Park, Se Jin
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.33 no.5
    • /
    • pp.1809-1827
    • /
    • 2013
  • Recently we need to take various measures to prepare for extreme flood that occur due to climate change. It is important that establish flood forecasting system to prepare flood over non-structure measures. The objective of this study is to develop superior real-time flood forecasting model by comparing the Neuro-fuzzy model and the multiple linear regression model. The Neuro-fuzzy model and the multiple linear regression model are established using same input data and applied for various flood events in Nakdong basin. The results show that the Neuro-fuzzy model can carry out flood forecasting results more accurately than the multiple linear regression model. This study can contribute to the establishment of a high accuracy flood information system that secure lead time in Nakdong basin.

Regional Low Flow Frequency Analysis Using Bayesian Multiple Regression (Bayesian 다중회귀분석을 이용한 저수량(Low flow) 지역빈도분석)

  • Kim, Sang-Ug;Lee, Kil-Seong;Sung, Jin-Young
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.169-173
    • /
    • 2008
  • 본 연구는 저수량 지역 빈도분석(regional low flow frequency analysis)을 수행하기 위하여 일반최소자승법(ordinary least squares method)을 이용한 Bayesian 다중회귀분석을 적용하였으며, 불확실성측면에서의 효과를 탐색하기 위하여 Bayesian 다중회귀분석에 의한 추정치와 t 분포를 이용하여 산정한 일반 다중회귀분석의 추정치의 신뢰구간을 비교분석하였다. 각 재현기간별 비교결과를 보면 t 분포를 이용하여 산정된 평균 추정치와 Bayesian 다중회귀분석에 의한 평균 추정치는 크게 다르지 않았다. 그러나 불확실성 측면에서 평가해볼 때 신뢰구간의 상한추정치와 하한추정치의 차이는 Bayesian 다중회귀분석을 사용한 경우가 기존 방법을 사용한 경우보다 훨씬 작은 것으로 나타났으며, 이로부터 저수량(low flow) 지역 빈도분석을 수행하는 경우 Bayesian 다중회귀분석이 일반 회귀분석보다 불확실성을 표현하는데 있어서 우수하다는 결과를 얻을 수 있었다. 또한 낙동강 유역에 2개의 미계측 유역을 선정하고 구축된 Bayesian 다중회귀모형을 적용하여 불확실성을 포함한 미계측 유역에서의 저수량(low flow)을 추정하였으며 이와 같은 방법이 미계측 유역에서의 저수(low flow) 특성을 나타내는 데 있어서 효과적일 수 있음을 입증하였다.

  • PDF

On Testing the First-order Autocorrelation of the Error Term in a Regression Model via Multiple Bayes Factor (다중 베이즈요인에 의한 회귀모형 오차항의 자기상관 검정)

  • 한성실;김혜중
    • The Korean Journal of Applied Statistics
    • /
    • v.12 no.2
    • /
    • pp.605-619
    • /
    • 1999
  • 본 논문은 회귀분석에서 오차항의 1차 자기상관 존재 여부 및 그 값을 검정하는 방법을 베이지안 접근법으로 제안하였다. 이 방법은 모수공간의 다중분할로 인해 얻어진 여러 가설들에 대한 다중결정문제를 다중 베이즈요인에 관한 이론과 일반화 Savage-Dickey 밀도비를 이용한 사후확률 추정법을 합성하여 개발되었다. 이 방법은 기존의 검정법들에서 가능한 검정 뿐 아니라 이들이 해결할 수 없는 자기상관에 대한 다중결정문제에도 사용이 가능한데 그 효용성이 있다. 모의실험을 통하여 제안된 검정법의 유효성을 평가하였다.

  • PDF

Application of multiple linear regression and artificial neural network models to forecast long-term precipitation in the Geum River basin (다중회귀모형과 인공신경망모형을 이용한 금강권역 강수량 장기예측)

  • Kim, Chul-Gyum;Lee, Jeongwoo;Lee, Jeong Eun;Kim, Hyeonjun
    • Journal of Korea Water Resources Association
    • /
    • v.55 no.10
    • /
    • pp.723-736
    • /
    • 2022
  • In this study, monthly precipitation forecasting models that can predict up to 12 months in advance were constructed for the Geum River basin, and two statistical techniques, multiple linear regression (MLR) and artificial neural network (ANN), were applied to the model construction. As predictor candidates, a total of 47 climate indices were used, including 39 global climate patterns provided by the National Oceanic and Atmospheric Administration (NOAA) and 8 meteorological factors for the basin. Forecast models were constructed by using climate indices with high correlation by analyzing the teleconnection between the monthly precipitation and each climate index for the past 40 years based on the forecast month. In the goodness-of-fit test results for the average value of forecasts of each month for 1991 to 2021, the MLR models showed -3.3 to -0.1% for the percent bias (PBIAS), 0.45 to 0.50 for the Nash-Sutcliffe efficiency (NSE), and 0.69 to 0.70 for the Pearson correlation coefficient (r), whereas, the ANN models showed PBIAS -5.0~+0.5%, NSE 0.35~0.47, and r 0.64~0.70. The mean values predicted by the MLR models were found to be closer to the observation than the ANN models. The probability of including observations within the forecast range for each month was 57.5 to 83.6% (average 72.9%) for the MLR models, and 71.5 to 88.7% (average 81.1%) for the ANN models, indicating that the ANN models showed better results. The tercile probability by month was 25.9 to 41.9% (average 34.6%) for the MLR models, and 30.3 to 39.1% (average 34.7%) for the ANN models. Both models showed long-term predictability of monthly precipitation with an average of 33.3% or more in tercile probability. In conclusion, the difference in predictability between the two models was found to be relatively small. However, when judging from the hit rate for the prediction range or the tercile probability, the monthly deviation for predictability was found to be relatively small for the ANN models.

Multivariate Analysis for Clinicians (임상의를 위한 다변량 분석의 실제)

  • Oh, Joo Han;Chung, Seok Won
    • Clinics in Shoulder and Elbow
    • /
    • v.16 no.1
    • /
    • pp.63-72
    • /
    • 2013
  • In medical research, multivariate analysis, especially multiple regression analysis, is used to analyze the influence of multiple variables on the result. Multiple regression analysis should include variables in the model and the problem of multi-collinearity as there are many variables as well as the basic assumption of regression analysis. The multiple regression model is expressed as the coefficient of determination, $R^2$ and the influence of independent variables on result as a regression coefficient, ${\beta}$. Multiple regression analysis can be divided into multiple linear regression analysis, multiple logistic regression analysis, and Cox regression analysis according to the type of dependent variables (continuous variable, categorical variable (binary logit), and state variable, respectively), and the influence of variables on the result is evaluated by regression coefficient${\beta}$, odds ratio, and hazard ratio, respectively. The knowledge of multivariate analysis enables clinicians to analyze the result accurately and to design the further research efficiently.

Comments on the regression coefficients (다중회귀에서 회귀계수 추정량의 특성)

  • Kahng, Myung-Wook
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.4
    • /
    • pp.589-597
    • /
    • 2021
  • In simple and multiple regression, there is a difference in the meaning of regression coefficients, and not only are the estimates of regression coefficients different, but they also have different signs. Understanding the relative contribution of explanatory variables in a regression model is an important part of regression analysis. In a standardized regression model, the regression coefficient can be interpreted as the change in the response variable with respect to the standard deviation when the explanatory variable increases by the standard deviation in a situation where the values of the explanatory variables other than the corresponding explanatory variable are fixed. However, the size of the standardized regression coefficient is not a proper measure of the relative importance of each explanatory variable. In this paper, the estimator of the regression coefficient in multiple regression is expressed as a function of the correlation coefficient and the coefficient of determination. Furthermore, it is considered in terms of the effect of an additional explanatory variable and additional increase in the coefficient of determination. We also explore the relationship between estimates of regression coefficients and correlation coefficients in various plots. These results are specifically applied when there are two explanatory variables.

On the analysis of multistate survival data using Cox's regression model (Cox 회귀모형을 이용한 다중상태의 생존자료분석에 관한 연구)

  • Sung Chil Yeo
    • The Korean Journal of Applied Statistics
    • /
    • v.7 no.2
    • /
    • pp.53-77
    • /
    • 1994
  • In a certain stochastic process, Cox's regression model is used to analyze multistate survival data. From this model, the regression parameter vectors, survival functions, and the probability of being in response function are estimated based on multistate Cox's partial likelihood and nonparametric likelihood methods. The asymptotic properties of these estimators are described informally through the counting process approach. An example is given to likelihood the results in this paper.

  • PDF

A Study of Multiple Linear Regression Model for Schedule Prediction Method about Ship Production Planning (선박 생산계획에 대한 일정 예측방법의 다중선형회귀분석 모형연구)

  • Kang, Tae-Wook;Ock, Young-Sock
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2016.05a
    • /
    • pp.351-352
    • /
    • 2016
  • 조선소의 생산계획 담당자가 기존 실적 정보를 이용하여 관심 대상인 미래의 생산계획 상황을 보다 쉽게 예측하여 생산계획의 적중률을 높일 수 있도록 할 예정이다. 2006년에서 2016년의 S조선사의 2차 데이터를 이용하여 요인 분석을 하고 다중회귀분석 모형을 설계하여 활용하는 프로세스를 설계한다. 사례 연구를 통해 연구 모형이 적절한지를 검증할 계획이다.

  • PDF

Estimation of Spatio-temporal soil moisture and drought index based on MODIS multi-satellite images (MODIS 다중 위성영상 기반의 토양수분 및 가뭄지수 산정연구)

  • Chung, Jeehun;Kim, Juyeon;Kim, Hyeongseok;Jeong, Daeun;Kim, Seongjoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.446-446
    • /
    • 2022
  • 본 연구에서는 MODIS(MODerate resolution Imaging Spectroradiometer) 다중 위성영상을 기반으로 전국 시공간 토양수분 및 토양수분 기반의 가뭄지수 SWDI(Soil Water Deficit Index)를 산정하였다. 시공간 토양수분의 산정을 위해 입력자료로 MODIS 위성의 지표면온도(Land Surface Temperature, LST), 증발산 및 식생(Enhanced Vegetation Index, EVI; Fraction of Photosynthetically Active Radiation, FPAR; Leaf Area Index, LAI; Normalized Difference Vegetation Index, NDVI) 관련 산출물 자료와 지상 관측자료인 일 단위 강수량 자료를 구축하였다. MODIS 위성영상은 산출물별로 제공되는 QC(Quality Control) 영상을 활용해 보정을 수행하였고, 공간 강수량 자료는 기상청에서 제공하는 전국 92개 지점의 종관기상관측자료를 구축하여 공간보간기법인 역거리가중법을 적용해 생성하였다. 실측 토양수분은 농촌진흥청에서 제공하는 76개 지점의 토양 깊이 10 cm에 설치된 TDR(Time Domain Reflectomerty) 센서에서 측정된 토양수분 자료를 활용하였으며, 토양수분 모의 시 토양 속성을 고려하기 위해 국립농업과학원에서 제공하는 토양도를 구축하여 활용하였다. 토양수분 산정 모형은 다중선형회귀모형(Multiple Linear Regression Model, MLRM)을 활용하였으며, 계절 및 토성에 따른 회귀식을 산정하였다. 회귀식 기반의 토양수분과 토성별 포장용수량 및 영구위조점 값을 이용하여 SWDI를 산정하고, 실제 가뭄 발생 시기 및 지역과의 비교하고자 한다.

  • PDF

Flood risk assessment by multiple regression using hourly precipitation (시강우량 자료 다중회귀분석에 의한 홍수위험 평가)

  • Park, Chang Eon;Kim, Chan Woo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.264-264
    • /
    • 2016
  • 홍수위험의 정도를 표시하기 위한 연구는 다양한 방법으로 진행되어 왔으나, 많은 지역에 수리 및 수문모형을 적용하여 홍수위험을 평가하기에는 매개변수 보정이나 모형의 검정에 한계가 있을 수밖에 없다. 특히, 많은 지역에 대하여 행정구역별로 홍수위험을 평가한다던지, 기후변화에 따른 홍수위험 변화양상을 평가하기 위하여는 더욱 그러하다. 이에 본 연구에서는 기존의 수위관측소에서 관측되어진 유량 자료를 적극 활용하여 시강우량과의 다중회귀분석을 통하여 첨두유량을 예측할 수 있는 회귀방정식을 구축하고 홍수위험을 평가할 수 있도록 시도하였다. 홍수피해는 하천의 유량 증가가 가장 직접적인 원인이 될 수 있으며, 비교적 하천정비가 잘 이루어진 우리나라의 경우는 하천정비 시 설정한 계획홍수량과 호우에 따라 발생되는 첨두유량을 비교하여 홍수피해 발생여부를 판단할 수 있을 것이다. 하천의 첨두유량 값은 복잡한 유역특성이나 수문특성에 의하여 결정되지만, 결국은 시간별 순간 최대강우량의 조합에 의하여 크게 좌우 되는 것으로 판단된다. 본 연구에서는 수도권의 일부 행정구역별 대표 수위관측소를 정하고, 각 지점의 최근 10년 동안의 하천유량 관측자료를 이용하여 단일 호우사상의 1시간, 2시간, 3시간, 5시간, 10시간, 1일, 2일, 3일, 5일, 10일 순간최대강우량과 첨두유량 사이의 다중회귀분석을 실시하여 유의한 통계값을 보이는 자료끼리 회귀방정식을 구성하도록 하였다. 다중회귀분석은 각 하천 지점별로 해당 하천의 수리특성이 일정하게 유지되어진 기간 동안만을 선정하여 분석하였으며, 유량자료 가운데 각 지점에서 관심수위 이상으로 유량이 크게 증가하였던 호우사상만을 사용하였다. 회귀분석 결과, 매우 의미 있는 회귀방정식의 도출이 가능하였는데, 의정부시 신곡교의 경우는 1시간, 10시간, 1일 강우량으로부터, 광주시 경안교 지점의 경우는 3시간, 1일, 10일 강우량으로부터, 양평군 흑천교 지점의 경우는 10시간, 3일 강우량으로부터 각각 첨두유량을 예측할 수 있는 회귀방정식이 높은 유의성을 보이는 것으로 나타나, 유역면적이나 도달시간 등의 유역특성을 어느 정도 반영하고 있는 회귀방정식이 도출된 것으로 판단되었다. 이와 같은 회귀방정식에 의하여 예상되어지는 시간별 강우량 자료를 적용하면 첨두유량을 예측할 수 있으며, 이를 기존 계획홍수량과 비교하여 홍수위험 정도를 적절하게 평가할 수 있을 것으로 판단된다.

  • PDF