• Title/Summary/Keyword: 다중선형회귀

Search Result 416, Processing Time 0.029 seconds

Comparison of Data-based Real-Time Flood Forecasting Model (자료기반 실시간 홍수예측 모형의 비교·검토)

  • Choi, Hyun Gu;Han, Kun Yeun;Roh, Hong Sik;Park, Se Jin
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.33 no.5
    • /
    • pp.1809-1827
    • /
    • 2013
  • Recently we need to take various measures to prepare for extreme flood that occur due to climate change. It is important that establish flood forecasting system to prepare flood over non-structure measures. The objective of this study is to develop superior real-time flood forecasting model by comparing the Neuro-fuzzy model and the multiple linear regression model. The Neuro-fuzzy model and the multiple linear regression model are established using same input data and applied for various flood events in Nakdong basin. The results show that the Neuro-fuzzy model can carry out flood forecasting results more accurately than the multiple linear regression model. This study can contribute to the establishment of a high accuracy flood information system that secure lead time in Nakdong basin.

Development of Regression Models Resolving High-Dimensional Data and Multicollinearity Problem for Heavy Rain Damage Data (호우피해자료에서의 고차원 자료 및 다중공선성 문제를 해소한 회귀모형 개발)

  • Kim, Jeonghwan;Park, Jihyun;Choi, Changhyun;Kim, Hung Soo
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.38 no.6
    • /
    • pp.801-808
    • /
    • 2018
  • The learning of the linear regression model is stable on the assumption that the sample size is sufficiently larger than the number of explanatory variables and there is no serious multicollinearity between explanatory variables. In this study, we investigated the difficulty of model learning when the assumption was violated by analyzing a real heavy rain damage data and we proposed to use a principal component regression model or a ridge regression model after integrating data to overcome the difficulty. We evaluated the predictive performance of the proposed models by using the test data independent from the training data, and confirmed that the proposed methods showed better predictive performances than the linear regression model.

A study of Predicting International Gasoline Prices based on Multiple Linear Regression with Economic Indicators (경제지표를 활용한 다중선형회귀 모델 기반 국제 휘발유 가격 예측)

  • Myeongeun Han;Jiyeon Kim;Hyunhee Lee;Sein Kim;Minseo Park
    • The Journal of the Convergence on Culture Technology
    • /
    • v.10 no.1
    • /
    • pp.159-164
    • /
    • 2024
  • The domestic petroleum market is highly sensitive to changes in international oil prices. So, it is important to identify and respond to those changes. In particular, it is necessary to clearly understand the factors causing the price fluctuations of gasoline, which exhibits high consumption. International gasoline prices are influenced by global factors such as gasoline supplies, geopolitical events, and fluctuations in the U.S. dollar. However, previous studies have only focused on gasoline supplies. In this study, we explore the causal relationship between economic indicators and international gasoline prices using various machine learning-based regression models. First, we collect data on various global economic indicators. Second, we perform data preprocessing. Third, we model using Multiple linear regression, Ridge regression, and Lasso(Least Absolute Shrinkage and Selection Operator) regression. The multiple linear regression model showed the highest accuracy at 96.73% in test sets. As a result, Our Multiple linear regression model showed the highest accuracy at 96.73% in test sets. We will expect that our proposed model will be helpful for domestic economic stability and energy policy decisions.

Autocovariance based estimation in the linear regression model (선형회귀 모형에서 자기공분산 기반 추정)

  • Park, Cheol-Yong
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.5
    • /
    • pp.839-847
    • /
    • 2011
  • In this study, we derive an estimator based on autocovariance for the regression coefficients vector in the multiple linear regression model. This method is suggested by Park (2009), and although this method does not seem to be intuitively attractive, this estimator is unbiased for the regression coefficients vector. When the vectors of exploratory variables satisfy some regularity conditions, under mild conditions which are satisfied when errors are from autoregressive and moving average models, this estimator has asymptotically the same distribution as the least squares estimator and also converges in probability to the regression coefficients vector. Finally we provide a simulation study that the forementioned theoretical results hold for small sample cases.

Comparison of Linear and Nonlinear Regressions and Elements Analysis for Wind Speed Prediction (풍속 예측을 위한 선형회귀분석과 비선형회귀분석 기법의 비교 및 인자분석)

  • Kim, Dongyeon;Seo, Kisung
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.25 no.5
    • /
    • pp.477-482
    • /
    • 2015
  • Linear regressions and evolutionary nonlinear regression based compensation techniques for the short-range prediction of wind speed are investigated. Development of an efficient MOS(Model Output Statistics) is necessary to correct systematic errors of the model, but a linear regression based MOS is hard to manage an irregular nature of weather prediction. In order to solve the problem, a nonlinear and symbolic regression method using GP(Genetic Programming) is suggested for a development of MOS for wind speed prediction. The proposed method is compared to various linear regression methods for prediction of wind speed. Also, statistical analysis of distribution for UM elements for each method is executed. experiments are performed for KLAPS(Korea Local Analysis and Prediction System) re-analysis data from 2007 to 2013 year for Jeju Island and Busan area in South Korea.

Analysis on the delay time of groundwater recharge in Jeju region (제주지역 지하수 함양 지체시간 분석)

  • Jung, Il-Moon;Na, Han-Na
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.433-433
    • /
    • 2012
  • 제주지역의 지하수 함양 지체시간을 분석하기 위해 18개 지점의 지하수 관측자료를 기초로 강수-지하수위 자료를 강수사상별로 분류하여 분석하였다. 지하수 함양에 결정적인 영향을 주는 인자로 지하수위의 대수층 두께와 지점의 투수계수를 설정하였다. 대체로 고도가 낮은 지역에서는 지하수 함양 지체가 짧았으나 고도가 높아질 수록 대수층 두께도 증가하여 지하수 함양지체시간은 길게 나타났다. 하지만 대수층 두께만으로 지체시간이 결정되는 것은 아니며 이에 투수계수 자료를 함께 분석해야만 타당한 결과를 얻을 수 있을 것으로 판단하여 대수층 두께와 지점 투수계수를 변수로 두고 관측된 지하수 함양지체시간과의 관계를 다중선형회귀분석을 통해 구하였다. 다중상관계수는 0.9정도로 높게 나타났으며, 대수층 두께에 대한 통계학적 유의성도 적합하게 나타났다. 이와 같이 결정된 회귀식은 향후 지하수 함양지체시간의 공간분포를 결정함에 있어 활용이 가능하며 분포형 수문모형과 연계시킬 경우 통합모델링에 적절하게 반영될 수 있을 것으로 판단된다.

  • PDF

Estimation of Spatio-temporal soil moisture and drought index based on MODIS multi-satellite images (MODIS 다중 위성영상 기반의 토양수분 및 가뭄지수 산정연구)

  • Chung, Jeehun;Kim, Juyeon;Kim, Hyeongseok;Jeong, Daeun;Kim, Seongjoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.446-446
    • /
    • 2022
  • 본 연구에서는 MODIS(MODerate resolution Imaging Spectroradiometer) 다중 위성영상을 기반으로 전국 시공간 토양수분 및 토양수분 기반의 가뭄지수 SWDI(Soil Water Deficit Index)를 산정하였다. 시공간 토양수분의 산정을 위해 입력자료로 MODIS 위성의 지표면온도(Land Surface Temperature, LST), 증발산 및 식생(Enhanced Vegetation Index, EVI; Fraction of Photosynthetically Active Radiation, FPAR; Leaf Area Index, LAI; Normalized Difference Vegetation Index, NDVI) 관련 산출물 자료와 지상 관측자료인 일 단위 강수량 자료를 구축하였다. MODIS 위성영상은 산출물별로 제공되는 QC(Quality Control) 영상을 활용해 보정을 수행하였고, 공간 강수량 자료는 기상청에서 제공하는 전국 92개 지점의 종관기상관측자료를 구축하여 공간보간기법인 역거리가중법을 적용해 생성하였다. 실측 토양수분은 농촌진흥청에서 제공하는 76개 지점의 토양 깊이 10 cm에 설치된 TDR(Time Domain Reflectomerty) 센서에서 측정된 토양수분 자료를 활용하였으며, 토양수분 모의 시 토양 속성을 고려하기 위해 국립농업과학원에서 제공하는 토양도를 구축하여 활용하였다. 토양수분 산정 모형은 다중선형회귀모형(Multiple Linear Regression Model, MLRM)을 활용하였으며, 계절 및 토성에 따른 회귀식을 산정하였다. 회귀식 기반의 토양수분과 토성별 포장용수량 및 영구위조점 값을 이용하여 SWDI를 산정하고, 실제 가뭄 발생 시기 및 지역과의 비교하고자 한다.

  • PDF

Bias Correction of AMSR2 Soil Moisture Data Using a Multiple Regression Method (다중회귀모형을 이용한 AMSR2 토양수분의 정량적 개선)

  • Kim, Myojeong;Kim, Gwangseob
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.514-514
    • /
    • 2015
  • 홍수 예측의 개선에 있어 정확한 공간 토양수분 정보는 필수적이다. 위성관측을 활용한 토양수분관측이 이루어지고 있으나 실제적 토양수분 상태와 정량적 차이가 크므로 편이보정을 통한 정량적 개선과정이 요구되는 실정이다. 따라서, 본 연구에서는 위성에서 관측한 AMSR2 토양수분과 지상관측 토양수분자료 및 다중회귀모형를 이용하여 토양수분자료를 정량적로 개선하였다. 공간 해상도가 10 km인 AMSR2 토양수분을 1 km로 상세화한 우리나라 전역의 토양수분 자료와 수자원관리종합정보시스템(WAMIS)에서 제공하는 강우관측소 556개 지점에서 관측한 강우자료, 후처리한 MODIS LST 자료, 증발산량 및 식생지수를 사용하였다. 2012년 7월부터 2013년까지 기상청 농업기상관측관서에서 관측하는 지점 중 사용 가능한 6개 토양수분관측소 자료에 대해 토양군별회귀계수를 산정하였다. 토양군별 다중회귀모형을 이용하여 편이보정한 토양수분자료는 전반적으로 과소추정되는 AMSR2 토양수분의 단점을 개선하여 위성관측 토양수분자료의 활용성을 개선하였다(Fig. 1).

  • PDF

Parameter Estimation for Multiple Linear Regession Model by OLS and Stepwise (OLS 및 변수선택법에 의한 다중선형회귀모형 매개변수 산정)

  • Kim, Kyung-Tak;Kim, Joo-Hun;Park, Jung-Sool
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.1161-1165
    • /
    • 2006
  • 본 연구는 OLS 및 변수선택법에 의해 통계학적 모형의 매개변수를 산정하여 모형의 적용성을 입증하고 하천 주요지점에 대한 홍수위 예측을 통해 홍수예보 및 예측 업무에 기여코자하는데 연구목적이 있다. 다중선형회귀모형을 구성하기 위한 독립변수는 예보지점의 수위/유출량 자료와 상류지점의 수위/유출량 자료, 그리고 유역의 선행 평균강우량 등의 자료를 독립변수로 하여 통계학적 홍수예측을 위한 다중선형 회귀모형을 각각 구성하여 적합성 여부를 판단하였다. 매개변수 산정은 OLS(Ordinary least square root method)와 변수선택(Stepwise)방법에 의해 산정하였으며, 중랑천 유역의 2002년부터 2005년까지의 수문사상 16개를 선정하여 모형에 적용한 결과 두 매개변수 산정방법 모두 30분에서 90분 예측은 상대적으로 정확한 결과를 나타내었으며, OLS 및 변수선택법에 의한 매개변수 산정결과 변수선택법에 의한 방법이 OLS 방법보다는 상관성이나 효율지수면에서 조금 더 정확한 값을 나타내고 있으나 독립변수의 일관성을 감안한다면 변수선택법보다는 OLS방법에 의한 매개변수 산정이 타당할 것으로 사료된다. 기존의 홍수예보 업무에 활용되고 있는 수문학적 홍수예측 모형인 저류함수법의 여러 매개변수 조정에 의한 홍수위 예측 방법보다는 비교적 간단한 통계적 방법에 의한 홍수위 예측 방법으로 홍수예보의 선행시간 확보가 필수적인 중랑천과 같이 유역면적이 작은 중소하천에서의 홍수예보 업무에 효과적으로 이용 가능할 것으로 사료된다.

  • PDF

A comparison study of multiple linear quantile regression using non-crossing constraints (비교차 제약식을 이용한 다중 선형 분위수 회귀모형에 관한 비교연구)

  • Bang, Sungwan;Shin, Seung Jun
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.5
    • /
    • pp.773-786
    • /
    • 2016
  • Multiple quantile regression that simultaneously estimate several conditional quantiles of response given covariates can provide a comprehensive information about the relationship between the response and covariates. Some quantile estimates can cross if conditional quantiles are separately estimated; however, this violates the definition of the quantile. To tackle this issue, multiple quantile regression with non-crossing constraints have been developed. In this paper, we carry out a comparison study on several popular methods for non-crossing multiple linear quantile regression to provide practical guidance on its application.