• Title/Summary/Keyword: 다중 선형회귀분석

Search Result 357, Processing Time 0.036 seconds

Forecasting Monthly Agricultural Reservoir Storage and Estimation of Reservoir Drought Index (RDI) Using Meteorological Data Based Multiple Linear Regression Analysis (기상자료기반 다중선형회귀분석에 의한 농업용 저수지 월단위 저수율 예측 및 저수지 가뭄지수(RDI) 추정)

  • LEE, Ji-Wan;KIM, Jin-Uk;JUNG, Chung-Gil;KIM, Seong-Joon
    • Journal of the Korean Association of Geographic Information Studies
    • /
    • v.21 no.3
    • /
    • pp.19-34
    • /
    • 2018
  • The purpose of this study is to estimate monthly agricultural reservoir storage with multiple linear regression model(MLRM) based on reservoir storage and meteorological data. The regression model was developed using 15 years(2002 to 2016) of 3,067 reservoirs by KRC(Korea Rural Community) and 63 meteorological stations by KMA (Korean Meteorological Administration), and the MLRM showed the determination coefficient($R^2$) of 0.51~0.95. The MLRM was applied to 9 selected reservoirs among the whole reservoirs and validated with $R^2$ of 0.44~0.81. The ROC(Receiver Operating Characteristics) analysis of Reservoir Drought Index(RDI) classified by comparing the present reservoir storage with normal year(1976~2005 average) reservoir storage showed average value of 0.64 for 2 years(2015~2016) with the highest value of 0.70 for winter period, lowest value of 0.58 for summer period. If 1 to 3 months weather forecasting data such as Glosea5 produced by KMA are applied, the predicted monthly reservoir storage from the MLRM can be a useful information for agricultural drought pre-preparation.

Estimation of Maximum Fresh Snow Depth using Regression Analysis (회귀분석을 이용한 최심신적설 추정식 개발)

  • Park, Heeseong;Chung, Gunhui
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.205-205
    • /
    • 2016
  • 우리나라의 겨울철 자연재해 중 대설에 의한 피해가 발생하는 빈도가 증가하고 있는 가운데 그 피해를 예측하고 대비하기 위한 연구들이 다수 진행되고 있다. 강설은 일단위로 측정하며, 매일 새롭게 내린 강설의 양인 최심신적설과 기존에 녹지 않고 쌓여 있던 깊이까지를 고려한 최심적설로 구분된다. 우리나라의 경우에는 갑작스럽게 내린 폭설에 의한 피해가 대부분이므로 최심신적설량을 예측하는 것이 매우 중요하다. 이에 본 연구에서는 다중회귀분석을 이용해 우리나라의 최심신적설량을 추정하기 위한 식을 개발하였다. 다중회귀분석을 위한 독립변수로는 해당 일에 예측된 강수량, 일평균기온, 일최고기온, 일최저기온을 사용하였으며, 강수량과 일평균기온의 상호작용을 고려할 수 있도록 모형을 구성하였다. 모형의 개발에는 전국 74개 기상관측소의 최심신적설 자료를 관측소 단위로 전체 자료의 2/3을 무작위로 추출하여 이용하였으며, 추출되지 않고 남은 1/3의 자료를 이용해 모형에 대한 검증을 실시하였다. 그 결과 상호작용항이 포함되지 않은 다중선형회귀모형에 비해 상호작용을 고려한 다중회귀모형의 예측력이 훨씬 우수하게 나타났다. 강수량과 기온이 정확하게 예측된다면 개발된 추정식을 이용해 간편하게 최심신적설량을 예측할 수 있어, 폭설에 대한 대비에 활용할 수 있을 것으로 판단된다.

  • PDF

Improving Polynomial Regression Using Principal Components Regression With the Example of the Numerical Inversion of Probability Generating Function (주성분회귀분석을 활용한 다항회귀분석 성능개선: PGF 수치역변환 사례를 중심으로)

  • Yang, Won Seok;Park, Hyun-Min
    • The Journal of the Korea Contents Association
    • /
    • v.15 no.1
    • /
    • pp.475-481
    • /
    • 2015
  • We use polynomial regression instead of linear regression if there is a nonlinear relation between a dependent variable and independent variables in a regression analysis. The performance of polynomial regression, however, may deteriorate because of the correlation caused by the power terms of independent variables. We present a polynomial regression model for the numerical inversion of PGF and show that polynomial regression results in the deterioration of the estimation of the coefficients. We apply principal components regression to the polynomial regression model and show that principal components regression dramatically improves the performance of the parameter estimation.

Development of Regression Models Resolving High-Dimensional Data and Multicollinearity Problem for Heavy Rain Damage Data (호우피해자료에서의 고차원 자료 및 다중공선성 문제를 해소한 회귀모형 개발)

  • Kim, Jeonghwan;Park, Jihyun;Choi, Changhyun;Kim, Hung Soo
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.38 no.6
    • /
    • pp.801-808
    • /
    • 2018
  • The learning of the linear regression model is stable on the assumption that the sample size is sufficiently larger than the number of explanatory variables and there is no serious multicollinearity between explanatory variables. In this study, we investigated the difficulty of model learning when the assumption was violated by analyzing a real heavy rain damage data and we proposed to use a principal component regression model or a ridge regression model after integrating data to overcome the difficulty. We evaluated the predictive performance of the proposed models by using the test data independent from the training data, and confirmed that the proposed methods showed better predictive performances than the linear regression model.

Comparison of Different Multiple Linear Regression Models for Real-time Flood Stage Forecasting (실시간 수위 예측을 위한 다중선형회귀 모형의 비교)

  • Choi, Seung Yong;Han, Kun Yeun;Kim, Byung Hyun
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.32 no.1B
    • /
    • pp.9-20
    • /
    • 2012
  • Recently to overcome limitations of conceptual, hydrological and physics based models for flood stage forecasting, multiple linear regression model as one of data-driven models have been widely adopted for forecasting flood streamflow(stage). The objectives of this study are to compare performance of different multiple linear regression models according to regression coefficient estimation methods and determine most effective multiple linear regression flood stage forecasting models. To do this, the time scale was determined through the autocorrelation analysis of input data and different flood stage forecasting models developed using regression coefficient estimation methods such as LS(least square), WLS(weighted least square), SPW(stepwise) was applied to flood events in Jungrang stream. To evaluate performance of established models, fours statistical indices were used, namely; Root mean square error(RMSE), Nash Sutcliffe efficiency coefficient (NSEC), mean absolute error (MAE), adjusted coefficient of determination($R^{*2}$). The results show that the flood stage forecasting model using SPW(stepwise) parameter estimation can carry out the river flood stage prediction better in comparison with others, and the flood stage forecasting model using LS(least square) parameter estimation is also found to be slightly better than the flood stage forecasting model using WLS(weighted least square) parameter estimation.

Prediction of the Water Level of the Tidal River using Artificial Neural Networks and Stationary Wavelets Transform (인공신경망과 정상 웨이블렛 변환을 활용한 감조하천 수위 예측)

  • Lee, Jeongha;Hwang, SeokHwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2021.06a
    • /
    • pp.357-357
    • /
    • 2021
  • 홍수로 인한 침수피해 발생을 최소화하기 위해 정확한 하천의 수위 예측과 리드타임 확보가 매우 중요하다. 특히 조석현상의 영향을 받는 감조하천의 경우 기존의 물리적 수문모형의 적용이 제한되어 하천수위 예측의 정확도가 떨어지기도 한다. 따라서 본 연구에서는 이러한 감조하천 수위 예측의 정확도를 높이기 위해 조석현상을 분리하고 인공신경망을 활용하는 하이브리드 모델을 제안 하였으며 다중 선형회귀분석과 비교 분석하였다. 감조하천에 위치한 교량의 수위데이터에서 Stationary Wavelet Transform으로 조석현상을 분리하였으며, 이외의 수위에 영향을 주는 time series data와 인공신경망(ANN)을 활용하여 1시간, 2시간, 3시간 후의 수위를 예측하였다. 하이브리드 모델은 96% 이상의 정확도를 보였으며 다중 선형회귀 분석과 비교하여도 높은 정확성을 보여주었다.

  • PDF

A Study of Multiple Linear Regression Model for Schedule Prediction Method about Ship Production Planning (선박 생산계획에 대한 일정 예측방법의 다중선형회귀분석 모형연구)

  • Kang, Tae-Wook;Ock, Young-Sock
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2016.05a
    • /
    • pp.351-352
    • /
    • 2016
  • 조선소의 생산계획 담당자가 기존 실적 정보를 이용하여 관심 대상인 미래의 생산계획 상황을 보다 쉽게 예측하여 생산계획의 적중률을 높일 수 있도록 할 예정이다. 2006년에서 2016년의 S조선사의 2차 데이터를 이용하여 요인 분석을 하고 다중회귀분석 모형을 설계하여 활용하는 프로세스를 설계한다. 사례 연구를 통해 연구 모형이 적절한지를 검증할 계획이다.

  • PDF

Characteristics and Models of the Side-swipe Accident in the Case of Cheongju 4-legged Signalized Intersections (4지 신호교차로의 측면접촉사고 특성 및 사고모형 - 청주시를 사례로 -)

  • Park, Sang-Hyuk;Kim, Tae-Young;Park, Byung-Ho
    • International Journal of Highway Engineering
    • /
    • v.11 no.4
    • /
    • pp.41-47
    • /
    • 2009
  • This study deals with the side-swipe accidents of 4-legged signalized intersections in Cheongju. The objectives are to analyze the characteristics of the accidents and to develop the related models. In pursuing the above, this study gives particular emphasis to finding the appropriate methodology to modelling. The main results are as follows. First, injuries were analyzed to be twice than property-only accidents in the side-swipe accidents. The accidents were evaluated to occur more in inside-intersection. Also, the accidents were analyzed to be almost the auto-related accidents and to be occurred by the unsafely-driving activity. Second, multiple linear regression models were evaluated to be more statistically significant than multiple non-linear. The most fitted models were analyzed to be the models with the number of accidents as the dependent variable. The factors of side-swipe accidents analyzed in this study were ADT, area of intersection, right-turn-only-lane, number of pedestrian crossings, limited speed of main road, maximum grade and number of signal phase.

  • PDF

An Analysis Study for Optimal Uptake of Nutrient Solution Based on Multiple Linear Regression Model in Strawberry Hydroponic Environments (딸기 수경 재배 환경에서의 다중 선형 회귀 모델 기반의 양액 적정 흡수량 분석 연구)

  • Lim, Jong-Hyun;Lee, Myeong-Bae;Cho, Hyun-Wook;Shin, Chang-Sun;Park, Chang-Woo;Cho, Yong-Yun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.578-580
    • /
    • 2019
  • 우리 나라의 딸기 수경재배 면적은 2002년 5ha로 시작해서, 2007년에는 84ha, 2012년에는 317ha, 2017년에 1,575ha로 매년 30% 이상 급속하게 성장하고 있다. 이런 경향은 수경재배가 토양재배보다 작업이 용이하여 노동시간이 절약되며, 수량을 더 많이 생산할 수 있기 때문이다. 하지만, 공급양액을 배액으로 흘려버리는 비순환식 수경재배 방식이 증가 하면서 환경오염을 유발시킬 뿐만 아니라 수경재배 운영비용의 증가를 가져오고 있다. 본 논문은 작물 생장에 최적화된 양액공급을 위해 상관관계 분석 및 다중 선형 회귀 모델 기반의 딸기 수경재배 환경에서의 최적 양액 흡수량을 분석하고 추정해 보았다. 분석 결과, 수경재배 환경정보(일사량, 온도, 습도, CO2 등)를 대상으로 일사량 및 온도가 습도 및 CO2에 비해 딸기재배를 위한 양액 흡수량에 더 큰 영향을 주는 것으로 분석되었고, 다중 선형 회귀 모델을 통한 회귀식의 R-Square값은 0.358으로 나타났다.

Hadi와 Simonoff의 다중이상점 식별방법의 개선과 여러 다중이상점 식별방법의 효율성 비교

  • 유종영;김현철
    • Communications for Statistical Applications and Methods
    • /
    • v.3 no.3
    • /
    • pp.11-23
    • /
    • 1996
  • 본 연구에서는 선형회귀분석에서 Hadi와 Simonoff의 다중이상점 식별방법을 수정하여 새로운 알고리즘을 제시하였다. Hadi와 Simonoff의 알고리즘 첫 단계에서 이상점일 가능성이 없는 점들의 집합을 추출할 때 가장효과와 편승효과에 영향을 받을 수 있음으로, 이 첫 단계를 수정하였다. 우리는 잔차가 일정한 분산을 갖는 정규분포에 다르다는 가정하에서 잔차의 신뢰구간을 생각하고, 이 구간안에서 잔차의 MAD가 최소인 새로운 모형을 탐색하고, 이를 이상점일 가능성이 없는 점들의 집합을 추출하는데 일용하는 새로운 알로리즘을 제시하였다. 제시된 방법은 실제자료에서 다른 방법에 비해 효율적으로 이상점을 식별할 수 있었다.

  • PDF