• Title/Summary/Keyword: 다중선형 회귀모형

Search Result 135, Processing Time 0.028 seconds

Hydrologic Variable Prediction Using Nonlinear Ensemble Model (비선형 앙상블 모형을 이용한 수문량 예측)

  • Kwon, Hyun-Han;Kim, Min-Ji;Kim, Jang-Kyung;Na, Bong-Gil
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.359-359
    • /
    • 2011
  • 기존 수자원계획에 있어서 수문량 예측은 매우 제한적으로 활용되고 있는 실정으로서 최근 기후변화 및 이상기후로 기인하는 기상학적 불확실성 증가에 대해서 효과적으로 대응 하기가 어렵다. 본 연구에서는 기상인자를 활용한 수문변량 예측기법을 개발하고자 하며 국내에 수문자료가 충분한 지역에 대해서 모형의 적합성과 타당성을 평가하고자 한다. 대부분의 수문변량은 해수면온도, 해수면기압, 바람장 등 Large Scale의 기상학적 특성과 연관성을 가지고 있으며 선행시간을 가지고 수문순환에 영향을 주고 있다. 수문변량과 기상학적 변량사이에는 일반적으로 비선형 관계를 가지고 있는 것으로 알려지고 있으며 이러한 비선형 관계를 효과적으로 예측하기 위해서 본 연구에서는 비선형 예측모형을 개발 하고자 한다. 최근 비선형 예측모형에서 불확실성을 고려한 모형에 대한 연구가 활발히 진행되고 있으며 특히, 다중 모형을 사용한 Ensemble 개념의 예측모형 도입이 이루어지고 있다. 본 연구에서는 국내 다목적댐 유입량 및 강수량에 대해서 최적 기상변량을 도출하고 이를 활용한 비선형 Ensemble 예측모형을 개발하였다. 일반적인 선형 회귀분석 모형에 비해 기상현상과 수문현상에 비선형성을 효과적으로 재현할 수 있는 장점을 확인할 수 있었으며 이와 더불어 예측결과에 대한 불확실성을 제공함으로서 신뢰성 있는 수자원 계획을 위한 기초자료로서 활용이 가능할 것으로 판단된다.

  • PDF

Non-linear regression model considering all association thresholds for decision of association rule numbers (기본적인 연관평가기준 전부를 고려한 비선형 회귀모형에 의한 연관성 규칙 수의 결정)

  • Park, Hee Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.24 no.2
    • /
    • pp.267-275
    • /
    • 2013
  • Among data mining techniques, the association rule is the most recently developed technique, and it finds the relevance between two items in a large database. And it is directly applied in the field because it clearly quantifies the relationship between two or more items. When we determine whether an association rule is meaningful, we utilize interestingness measures such as support, confidence, and lift. Interestingness measures are meaningful in that it shows the causes for pruning uninteresting rules statistically or logically. But the criteria of these measures are chosen by experiences, and the number of useful rules is hard to estimate. If too many rules are generated, we cannot effectively extract the useful rules.In this paper, we designed a variety of non-linear regression equations considering all association thresholds between the number of rules and three interestingness measures. And then we diagnosed multi-collinearity and autocorrelation problems, and used analysis of variance results and adjusted coefficients of determination for the best model through numerical experiments.

Estimating the Total Precipitation Amount with Simulated Precipitation for Ungauged Stations in Jeju Island (미계측 관측 강수 자료 생성을 통한 제주도 지역의 수문총량 추정)

  • Kim, Nam-Won;Um, Myoung-Jin;Chung, Il-Moon;Heo, Jun-Haeng
    • Journal of Korea Water Resources Association
    • /
    • v.45 no.9
    • /
    • pp.875-885
    • /
    • 2012
  • In this study, the total precipitation amount in Jeju Island was estimated with the simulated precipitation for ungauged stations missing precipitation data using the spatial precipitation analysis. The missing data were generated through the modified multiple linear regression in this study, and the analysis of spatial precipitation was conducted with the PRISM(Parameter-elevation Regression on Independent Slope Model). The generated data with modified multiple linear regression model have similar pattern with original data. Thus, the model in this study shows good applicability to estimate the missing data. The difference of annual average precipitation between Case 1 (original data) and Case 2 (modified data) appears very small ratio which is about 1.5%. However, the difference of annual average precipitation according to elevation shows the large ratio up to 37.4%. As the results, the method of estimating missing data in this study would be useful to calculate the total precipitation amount at the low station density area and the places with the high spatial variation of precipitation.

Abnormal air temperature prediction of South Korea using multiple linear regression model and Terra/Aqua MODIS LST (다중 선형회귀모형과 Terra/Aqua MODIS 지표면온도를 활용한 우리나라 이상기온 예측)

  • Chung, Jeehun;Lee, Yonggwan;Lee, Jiwan;Kim, Seongjoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.139-139
    • /
    • 2019
  • 지구 온난화 및 기후변화로 인해 비롯된 전 지구적인 기온 상승은 가뭄, 폭염, 한파 등의 이상 기후 현상을 야기하여 인류의 생존을 위협하는 환경 문제로 대두되고 있다. 이와 같은 기후변화 및 이상기후 현상을 이해하고 파악하기 위해서는 정확하고 상세한 기온 정보가 필수적이다. 우리나라는 기상청에서 전국 590개소의 기상관측장비로 기온 정보를 생산하고 있지만 산림이 약 70%를 차지하는 복잡한 지형을 가지고 있어 지상관측밀도의 공간적 제약이 발생해 상세하고 균일한 기온 정보 생산에 제약이 있다. 이러한 단점을 극복하기 위해 본 연구에서는 위성으로 측정한 지표면 온도(Land Surface Temperature, LST) 자료와 다중선형회귀모형(Multiple Linear Regression Model)을 활용해 두 자료간의 상관관계를 파악하고 지상기온을 예측하고자 한다. 위성자료로 Terra 및 Aqua MODIS 위성의 1000m 공간해상도를 가진 일별 LST자료 MOD11A1, MYD11A1의 Daytime 자료를 각각 2000년부터 2018년까지 총 19년의 기간에 대해 구축하였으며, 전국 92개의 기상청 관측소로부터 최고, 최저 기온 자료를 동 기간에 대해 구축하였다. LST를 이용한 이상기온 예측 알고리즘은 python을 이용해 구현하였으며 예측 결과는 실제 기온 자료를 통해 검증하였다. 또한, 예측 기온 자료의 연대별, 순별(상, 중, 하순) 분석을 실시하고, 2018년 극한 폭염 및 한파(2017년 12월~2018년 2월)의 예측 가능성을 검토하여 연구 결과에 대한 다양한 활용방안을 제시하고자 한다.

  • PDF

A study on Prediction of Simulator Sickness in Driving Simulation (자동차 모의운전환경에서 Simulator Sickness의 예측에 관한 연구)

  • 김도희
    • Proceedings of the Korea Society for Simulation Conference
    • /
    • 1998.10a
    • /
    • pp.170-173
    • /
    • 1998
  • 본 연구에서는 시뮬레이터나 그와 유사한 가상현실환경(Virtual Reality Environment ; VRE)에서 일어날 수 있는 Simulator Sickness가 어떤 사람들에게 쉽게 발생하는지를 예측하기 위하여 다중선형회귀(Multiple linear regression) 방정식으로 예측회귀모형을 제시하였다. 이 회귀모형에서의 종속변수는 김도희 외(1998)에 의해 개발된 RSSQ의 종합점수이고, 독립변수는 실제운전경력에 1을 더한 값에 나이를 곱한 값, 과거 멀미를 경험한 정도, 1주일 평균 동화상 시간, 현재의 건강상태로 되어져 있다. 이 회귀모형의 R2값은 약 0.52로 Kolasinski(1996)의 모델보다 설명력이 18% 증가하였고, 부수적인 별도의 실험을 하지 않고도 간단한 개인 신상에 관한 간단한 자료만으로도 훨씬 좋은 결과를 예측할 수 있게 되었다. 따라서 시뮬레이터나 가상현실에서 일어나는 Simulator Sickness가 어떠한 사람에게 걸리기가 쉬운지를 쉽게 예측할 수 있게 되었고, 이러한 사람들에게는 시뮬레이터나 가상현실의 이용을 자제시키거나 주의를 주어 특별관리 함으로써 시뮬레이터나 가상현실을 운영하는데 많은 도움을 줄 수 있을 것이다.

  • PDF

A Study on the Factors Affecting the Arson (방화 발생에 영향을 미치는 요인에 관한 연구)

  • Kim, Young-Chul;Bak, Woo-Sung;Lee, Su-Kyung
    • Fire Science and Engineering
    • /
    • v.28 no.2
    • /
    • pp.69-75
    • /
    • 2014
  • This study derives the factors which affect the occurrence of arson from statistical data (population, economic, and social factors) by multiple regression analysis. Multiple regression analysis applies to 4 forms of functions, linear functions, semi-log functions, inverse log functions, and dual log functions. Also analysis respectively functions by using the stepwise progress which considered selection and deletion of the independent variable factors by each steps. In order to solve a problem of multiple regression analysis, autocorrelation and multicollinearity, Variance Inflation Factor (VIF) and the Durbin-Watson coefficient were considered. Through the analysis, the optimal model was determined by adjusted Rsquared which means statistical significance used determination, Adjusted R-squared of linear function is scored 0.935 (93.5%), the highest of the 4 forms of function, and so linear function is the optimal model in this study. Then interpretation to the optimal model is conducted. As a result of the analysis, the factors affecting the arson were resulted in lines, the incidence of crime (0.829), the general divorce rate (0.151), the financial autonomy rate (0.149), and the consumer price index (0.099).

A Study of Applications of Sequential Biplots in Multiresponse Data (다중반응치 자료에 대한 순차적 BIPLOT활용에 대한 연구)

  • 장대흥
    • The Korean Journal of Applied Statistics
    • /
    • v.11 no.2
    • /
    • pp.451-459
    • /
    • 1998
  • The analysis of data from a multiresponse experiment requires careful consideration of the multivariate nature of the data. In a multiresponse sitation, the optimization problem is more complex than in the single response case. The biplot is a graphical tool which make the analyst to understand the correlation of the response variables, the relation of the response variables arid the explanatory variables and the relative importance of the explanatory variables. In case of good fitting of the first order model, we can draw the biplot with the first order experimental design. Otherwise, we can make the biplot with the second order experimental design by adding other experimental points.

  • PDF

A Study on Regionalization of Parameters of Continuous Rainfall-Runoff Model (연속 강우-유출모형의 매개변수 지역화에 관한 연구)

  • Jeong, Ga-In;Kim, Tae-Jeong;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.182-182
    • /
    • 2015
  • 우리나라에서는 강우관측시스템의 지역적 불균형으로 상대적으로 소규모 저수지의 경우 미계측유역의 특성을 가지며, 신뢰성 있는 강우량, 유출량, 증발량 자료가 매우 부족한 실정이다. 다목적댐 유역과 같은 계측유역의 경우 상류유역의 유입량 자료의 확보가 용이하지만 대부분의 유역의 경우 계측장비가 부족하여 신뢰성이 확보된 유입량 자료를 얻는데 많은 어려움이 있다. 본 연구에서는 미계측유역의 유입량 산정을 위하여 계측유역을 대상으로 강우-유출 모형의 매개변수를 산정하였으며, 산정된 매개변수를 유역특성인자와의 상관성을 토대로 다중선형회귀분석기법(multiple linear regression, MLR)을 적용하여 지역화(regionalization)를 위한 회귀식을 도출하였다. 이를 위해 양질의 유량자료가 확보된 K-water 17개 댐 유역을 대상으로 매개변수를 산정하였으며 이 중 2개의 댐 유역을 미계측유역으로 간주하여 개발된 모형을 검증하였다. 대부분의 통계 지표에서 우수한 모의능력을 확인하였으며, 본 연구를 통하여 개발된 지역화 기법을 미계측유역에 활용한다면 보다 정량적이고 효율적인 수자원 계획이 가능할 것으로 판단된다. 향후 연구로는 불확실성을 고려한 Bayesian GLM 모형을 이용한 지역화기법을 개발하여 매개변수의 불확실성까지 고려할 수 있는 방안을 모색하고자 한다.

  • PDF

Testing for a multiple change point residual variance in regression model (잔차 분산을 이용한 선형회귀모형의 다중전환점 검정)

  • Lee, In-Suk;Kim, Jong-Tae;Lee, Kum-Ja
    • Journal of the Korean Data and Information Science Society
    • /
    • v.12 no.1
    • /
    • pp.27-40
    • /
    • 2001
  • The purpose of this study is to test a multiple change point in the regression model with the passage of time, using the estimated residual variance figure suggested by Gasser, Sroka and Jennen - Steinmez (GSJS). As a result of the simulation, it is showed that there is a jump change of the estimated residual variance figure at that time of change point. The way to analyse a intuitive multiple change point through graphics is more effective and accurate than any other existing ways.

  • PDF

Statistical Prediction of Used Tablet PC Transaction Price among Consumers (소비자 사이의 중고 태블릿PC 거래 가격의 통계적 예측)

  • Younghee Go;Sohyung Kim;Yujin Chung
    • Journal of Industrial Convergence
    • /
    • v.20 no.12
    • /
    • pp.179-186
    • /
    • 2022
  • This study aims to develop a predictive model to suggest a used sales price to sellers and buyers when trading used tablet PCs. For model development, we analyzed the real used tablet PC transaction data and additionally collected detailed product information. We developed several predictive models and selected the best predictive model among them. Specifically, we considered a multiple linear regression model using the used sales price as a dependent variable and other variables in the integrated data as independent variables, a multiple linear regression model including interactions, and the models from stepwise variable selection in each model. The model with the best predictive performance was finally selected through cross-validation. Through this study, we can predict the sales price of used tablet PCs and suggest appropriate used sales prices to sellers and buyers.