• 제목/요약/키워드: Multiple Linear Regression Model

검색결과 625건 처리시간 0.027초

TIME SERIES PREDICTION USING INCREMENTAL REGRESSION

  • Kim, Sung-Hyun;Lee, Yong-Mi;Jin, Long;Chai, Duck-Jin;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.635-638
    • /
    • 2006
  • Regression of conventional prediction techniques in data mining uses the model which is generated from the training step. This model is applied to new input data without any change. If this model is applied directly to time series, the rate of prediction accuracy will be decreased. This paper proposes an incremental regression for time series prediction like typhoon track prediction. This technique considers the characteristic of time series which may be changed over time. It is composed of two steps. The first step executes a fractional process for applying input data to the regression model. The second step updates the model by using its information as new data. Additionally, the model is maintained by only recent data in a queue. This approach has the following two advantages. It maintains the minimum information of the model by using a matrix, so space complexity is reduced. Moreover, it prevents the increment of error rate by updating the model over time. Accuracy rate of the proposed method is measured by RME(Relative Mean Error) and RMSE(Root Mean Square Error). The results of typhoon track prediction experiment are performed by the proposed technique IMLR(Incremental Multiple Linear Regression) is more efficient than those of MLR(Multiple Linear Regression) and SVR(Support Vector Regression).

  • PDF

3지 신호교차로의 교통사고 발생모형 - 청주시를 사례로 - (Traffic Accident Models of 3-Legged Signalized Intersections in the Case of Cheongju)

  • 박병호;한상욱;김태영
    • 한국안전학회지
    • /
    • 제24권2호
    • /
    • pp.94-99
    • /
    • 2009
  • This study deals with the traffic accidents at the 3-legged signalized intersections in Cheongu. The goals are to analyze the geometric, traffic and operational conditions of intersections and to develop a various functional forms that predict the accidents. The models are developed through the correlation analysis, the multiple linear, the multiple nonlinear, Poisson and negative binomial regression analysis. In this study, two multiple linear, two multiple nonlinear and two negative binomial regression models were calibrated. These models were all analyzed to be statistically significant. All the models include 2 common variables(traffic volume and lane width) and model-specific variables. These variables are, therefore, evaluated to be critical to the accident reduction of Cheongju.

비선형 회귀 분석을 이용한 부유식 해양 구조물의 중량 추정 모델 연구 (A Study on the Weight Estimation Model of Floating Offshore Structures using the Non-linear Regression Analysis)

  • 서성호;노명일;신현경
    • 대한조선학회논문집
    • /
    • 제51권6호
    • /
    • pp.530-538
    • /
    • 2014
  • The weight estimation of floating offshore structures such as FPSO, TLP, semi-Submersibles, Floating Offshore Wind Turbines etc. in the preliminary design, is one of important measures of both construction cost and basic performance. Through both literature investigation and internet search, the weight data of floating offshore structures such as FPSO and TLP was collected. In this study, the weight estimation model was suggested for FPSO. The weight estimation model using non-linear regression analysis was established by fixing independent variables based on this data and the multiple regression analysis was introduced into the weight estimation model. Its reliability was within 4% of error rate.

다중선형회귀모델 기반 고출력 직렬 배터리 팩의 전압 불균형 추정 (Multiple linear regression model-based voltage imbalance estimation for high-power series battery pack)

  • 김승우;이평연;한동호;김종훈
    • 전기전자학회논문지
    • /
    • 제23권1호
    • /
    • pp.1-8
    • /
    • 2019
  • 본 논문에서는 18650 원통형 NCA 리튬이온 배터리로 구성된 고출력 직렬 배터리로 다양한 C-rate의 전기적 특성을 테스트한다. 테스트를 통해 추출한 14S1P 배터리 팩의 방전 용량 데이터와 4S1P 배터리 팩의 EV cycle 데이터를 통해 C-rate의 변화에 따른 전기적 특성을 분석한다. 분석을 통해 얻은 데이터를 기반으로 C-rate에 따른 방전용량 실험의 셀 간 전압 편차와 EV cycle 실험의 셀 간 전압 편차를 다중선형회귀 모델로 추정하여 선형적인 특징을 가진 데이터와 비선형적인 특징을 가진 데이터에 대한 각각의 추정성능을 검증한다. 모델의 추정성능을 검증하기 위해 추정 데이터와 실제 데이터의 RMSE를 구해 알고리즘의 정확성을 평가한다. 논문의 결과는 14S1P 배터리 팩의 방전 용량의 셀 간 전압 불균형과 4S1P 배터리 팩의 EV cycle의 셀 간 전압 불균형 중 선형적인 데이터인 방전 용량의 셀 간 불균형 데이터의 추정 성능이 더 뛰어난 것을 검증하는데 기여한다.

한국 프로스포츠 선수들의 연봉에 대한 다변량적 분석 (A Multivariate Analysis of Korean Professional Players Salary)

  • 송종우
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.441-453
    • /
    • 2008
  • 프로스포츠 선수들의 연봉은 선수들의 개인 성적과 팀에 대한 기여도 등으로 결정된다는 가정하에 프로농구와 프로야구 선수들의 전년도 성적으로 다음해 연봉을 예측 분석하였다. 분석에 있어서 data visualization 기법을 통해 변수사이의 관계, 이상점 발견, 모형진단등을 하였다. 다중선형회귀 모형(Multiple Linear Regression)과 트리모형(Regression Tree)을 이용해서 자료를 분석하고 모델간 비교를 했으며, Cross-Validation을 이용해서 최적모델을 선택하였다. 특히, 자동으로 변수선택을 하는 stepwise regression방법을 그냥 사용하기보다는 먼저 설명변수들 사이의 관계나 설명변수와 반응변수 사이의 관계등을 조사하고 나서 이를 통해 선택된 변수들을 가지고 stepwise regression과 regression tree 방법론을 이용해서 적절한 변수 및 최종 모형을 선택하였다. 분석결과, 프로농구의 경우에는 경기당 득점, 어시스트, 자유투 성공수, 경력 등이 중요한 변수였고, 프로야구 투수의 경우에는 경력, 9이닝 당 삼진 수, 방어율, 피홈런 수 등이 중요한 변수였고, 프로야구 타자의 경우에는 경력, 안타 수, FA(자유계약)유무 여부 등이 중요한 변수였다.

다중선형 회귀모형과 천리안 지면온도를 활용한 토양수분 산정 연구 (Estimation of Soil Moisture Using Multiple Linear Regression Model and COMS Land Surface Temperature Data)

  • 이용관;정충길;조영현;김성준
    • 한국농공학회논문집
    • /
    • 제59권1호
    • /
    • pp.11-20
    • /
    • 2017
  • This study is to estimate the spatial soil moisture using multiple linear regression model (MLRM) and 15 minutes interval Land Surface Temperature (LST) data of Communication, Ocean and Meteorological Satellite (COMS). For the modeling, the input data of COMS LST, Terra MODIS Normalized Difference Vegetation Index (NDVI), daily rainfall and sunshine hour were considered and prepared. Using the observed soil moisture data at 9 stations of Automated Agriculture Observing System (AAOS) from January 2013 to May 2015, the MLRMs were developed by twelve scenarios of input components combination. The model results showed that the correlation between observed and modelled soil moisture increased when using antecedent rainfalls before the soil moisture simulation day. In addition, the correlation increased more when the model coefficients were evaluated by seasonal base. This was from the reverse correlation between MODIS NDVI and soil moisture in spring and autumn season.

실시간 수위 예측을 위한 다중선형회귀 모형의 비교 (Comparison of Different Multiple Linear Regression Models for Real-time Flood Stage Forecasting)

  • 최승용;한건연;김병현
    • 대한토목학회논문집
    • /
    • 제32권1B호
    • /
    • pp.9-20
    • /
    • 2012
  • 최근 수위 예측을 위한 개념적 기반, 수문학적, 물리적 기반 모형 등의 단점을 극복하고자 홍수예측을 위해 자료지향형 모형 중의 하나인 다중선형회귀 모형이 널리 도입되고 있다. 본 연구의 목적은 이러한 다중선형회귀 모형의 서로 다른 회귀계수 선정 방법에 따른 홍수예측 성능을 비교 검토하고 이를 통해 적절한 다중회귀 홍수예측 모형을 구축하는 것이다. 이를 위해 입력자료의 자기상관분석을 통해 독립변수의 시간 규모를 결정한 후 최소 자승법, 가중 최소 자승법, 단계별 선택법의 각기 다른 회귀계수 산정 방법을 이용한 홍수예측 모형을 구축하고 중랑천 유역의 다양한 홍수사상에 대해 적용하였다. 구축된 모형들의 성능을 평가하기 위해 평균제곱근오차, Nash-Suttcliffe 효율계수, 평균절대오차, 수정 결정계수와 같이 4개의 통계지표들을 사용하였다. 모의결과 단계별 선택법을 이용한 다중선형회귀 홍수예측 모형이 가장 정확한 예측 결과를 보였고, 최소자승법을 이용한 홍수예측 모형이 가중 최소자승법을 이용한 홍수예측 모형보다 좀 더 나은 예측 결과를 나타냈다.

공동주택의 건물외부조건과 에너지비용과의 관계분석 (Relation between the Building Exterior Conditions and Energy Costs in the Running period of the Apartment Housing)

  • 이강희;류승훈;이은택
    • KIEAE Journal
    • /
    • 제9권1호
    • /
    • pp.107-113
    • /
    • 2009
  • The energy cost is resulted from the energy use. Its sources are divided into some types and depended on the building use or energy-use type. The energy cost should be affected by the amount of the energy use. The cost could be calculated to consider various factors such as the insulation, heating type, building shape and others. But it can not consider all of the affect factors to the energy cost and need to categorize the factors to the condition for estimating the cost. In this paper, it aimed at providing the estimation model in linear equation and multiple linear regression, utilizing the building exterior condition and management characteristics in apartment housing. Its survey are conducted in two parts of management characteristics and building exterior condition. The correlation analysis is conducted to get rid of the multicolinearity among the inputted factors. The number of linear equation model is 11 and includes the 1st, 2nd and 3rd equation function, power function and others. Among these, it suggested the 2nd and 3rd function and power function in terms of the statistics. In multiple linear regression model, the building volume and management area are inputted to the estimation.

Robust inference for linear regression model based on weighted least squares

  • 박진표
    • Journal of the Korean Data and Information Science Society
    • /
    • 제13권2호
    • /
    • pp.271-284
    • /
    • 2002
  • In this paper we consider the robust inference for the parameter of linear regression model based on weighted least squares. First we consider the sequential test of multiple outliers. Next we suggest the way to assign a weight to each observation $(x_i,\;y_i)$ and recommend the robust inference for linear model. Finally, to check the performance of confidence interval for the slope using proposed method, we conducted a Monte Carlo simulation and presented some numerical results and examples.

  • PDF

Clustering Observations for Detecting Multiple Outliers in Regression Models

  • Seo, Han-Son;Yoon, Min
    • 응용통계연구
    • /
    • 제25권3호
    • /
    • pp.503-512
    • /
    • 2012
  • Detecting outliers in a linear regression model eventually fails when similar observations are classified differently in a sequential process. In such circumstances, identifying clusters and applying certain methods to the clustered data can prevent a failure to detect outliers and is computationally efficient due to the reduction of data. In this paper, we suggest to implement a clustering procedure for this purpose and provide examples that illustrate the suggested procedure applied to the Hadi-Simonoff (1993) method, reverse Hadi-Simonoff method, and Gentleman-Wilk (1975) method.