• 제목/요약/키워드: Multiple linear Regression

검색결과 1,741건 처리시간 0.031초

Robust inference for linear regression model based on weighted least squares

  • 박진표
    • Journal of the Korean Data and Information Science Society
    • /
    • 제13권2호
    • /
    • pp.271-284
    • /
    • 2002
  • In this paper we consider the robust inference for the parameter of linear regression model based on weighted least squares. First we consider the sequential test of multiple outliers. Next we suggest the way to assign a weight to each observation $(x_i,\;y_i)$ and recommend the robust inference for linear model. Finally, to check the performance of confidence interval for the slope using proposed method, we conducted a Monte Carlo simulation and presented some numerical results and examples.

  • PDF

TIME SERIES PREDICTION USING INCREMENTAL REGRESSION

  • Kim, Sung-Hyun;Lee, Yong-Mi;Jin, Long;Chai, Duck-Jin;Ryu, Keun-Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 Proceedings of ISRS 2006 PORSEC Volume II
    • /
    • pp.635-638
    • /
    • 2006
  • Regression of conventional prediction techniques in data mining uses the model which is generated from the training step. This model is applied to new input data without any change. If this model is applied directly to time series, the rate of prediction accuracy will be decreased. This paper proposes an incremental regression for time series prediction like typhoon track prediction. This technique considers the characteristic of time series which may be changed over time. It is composed of two steps. The first step executes a fractional process for applying input data to the regression model. The second step updates the model by using its information as new data. Additionally, the model is maintained by only recent data in a queue. This approach has the following two advantages. It maintains the minimum information of the model by using a matrix, so space complexity is reduced. Moreover, it prevents the increment of error rate by updating the model over time. Accuracy rate of the proposed method is measured by RME(Relative Mean Error) and RMSE(Root Mean Square Error). The results of typhoon track prediction experiment are performed by the proposed technique IMLR(Incremental Multiple Linear Regression) is more efficient than those of MLR(Multiple Linear Regression) and SVR(Support Vector Regression).

  • PDF

선형계획법을 이용한 회귀분석 결과의 비교 연구 (A Comparative Study of the Results of the Regression Analysis by Linear Programming)

  • 김광수;정지안;이진규
    • 품질경영학회지
    • /
    • 제21권1호
    • /
    • pp.161-170
    • /
    • 1993
  • This study attempts to present the linear regression analysis that involves more than one regressor variable, because regression analysis is the most widely used statistical technique for describing, predicting and estimating the relationships between given data. The model of multiple linear regression may be solved directly by the two linear programming methods, i.e., to minimize the sum of the absolute deviation (MSD) and to minimize the maximum deviation(MMD). In addition, some results was compared to each techniques for accuracy and tested to the validity of statistical meaning.

  • PDF

기계학습 기반의 가스폭발위험범위 예측모델에 관한 연구 (A Study on Predictive Models based on the Machine Learning for Evaluating the Extent of Hazardous Zone of Explosive Gases)

  • 정용재;이창준
    • Korean Chemical Engineering Research
    • /
    • 제58권2호
    • /
    • pp.248-256
    • /
    • 2020
  • 본 연구에서는 폭발위험장소의 방폭설비 설치를 위해 필요한 가스폭발위험범위 예측모델 개발을 수행하였다. 이를 위해 12개의 가연성가스에 대한 1,200개의 폭발위험범위 데이터를 생성하였다. 가스폭발위험범위를 출력변수로 설정하였고 데이터 생성과정에서 필요한 12개의 변수를 입력변수로 설정하였다. 다중 회귀, 주성분 회귀, 인공신경망 기법을 이용해 예측모델을 개발하였다. 각각 모델의 예측 성능을 비교한 결과, 평균절대퍼센트오차(MAPE)는 각각 44.2%, 49.3%, 5.7%이고 평균제곱근오차(RMSE)는 1.389 m, 1.602 m, 0.203 m로 나타났다. 결과를 통해 인공신경망이 가장 우수한 성능을 보여주었고 가스폭발위험범위 예측을 위한 최적 모델이라는 것을 확인하였다.

Prediction of lightweight concrete strength by categorized regression, MLR and ANN

  • Tavakkol, S.;Alapour, F.;Kazemian, A.;Hasaninejad, A.;Ghanbari, A.;Ramezanianpour, A.A.
    • Computers and Concrete
    • /
    • 제12권2호
    • /
    • pp.151-167
    • /
    • 2013
  • Prediction of concrete properties is an important issue for structural engineers and different methods are developed for this purpose. Most of these methods are based on experimental data and use measured data for parameter estimation. Three typical methods of output estimation are Categorized Linear Regression (CLR), Multiple Linear Regression (MLR) and Artificial Neural Networks (ANN). In this paper a statistical cleansing method based on CLR is introduced. Afterwards, MLR and ANN approaches are also employed to predict the compressive strength of structural lightweight aggregate concrete. The valid input domain is briefly discussed. Finally the results of three prediction methods are compared to determine the most efficient method. The results indicate that despite higher accuracy of ANN, there are some limitations for the method. These limitations include high sensitivity of method to its valid input domain and selection criteria for determining the most efficient network.

Bayesian inference for an ordered multiple linear regression with skew normal errors

  • Jeong, Jeongmun;Chung, Younshik
    • Communications for Statistical Applications and Methods
    • /
    • 제27권2호
    • /
    • pp.189-199
    • /
    • 2020
  • This paper studies a Bayesian ordered multiple linear regression model with skew normal error. It is reasonable that the kind of inherent information available in an applied regression requires some constraints on the coefficients to be estimated. In addition, the assumption of normality of the errors is sometimes not appropriate in the real data. Therefore, to explain such situations more flexibly, we use the skew-normal distribution given by Sahu et al. (The Canadian Journal of Statistics, 31, 129-150, 2003) for error-terms including normal distribution. For Bayesian methodology, the Markov chain Monte Carlo method is employed to resolve complicated integration problems. Also, under the improper priors, the propriety of the associated posterior density is shown. Our Bayesian proposed model is applied to NZAPB's apple data. For model comparison between the skew normal error model and the normal error model, we use the Bayes factor and deviance information criterion given by Spiegelhalter et al. (Journal of the Royal Statistical Society Series B (Statistical Methodology), 64, 583-639, 2002). We also consider the problem of detecting an influential point concerning skewness using Bayes factors. Finally, concluding remarks are discussed.

방화 발생에 영향을 미치는 요인에 관한 연구 (A Study on the Factors Affecting the Arson)

  • 김영철;박우성;이수경
    • 한국화재소방학회논문지
    • /
    • 제28권2호
    • /
    • pp.69-75
    • /
    • 2014
  • 본 연구에서는 방화발생에 영향을 미치는 요인을 도출하기 위하여 발생건수를 종속변수로 하고 경제 인구 사회적 요인을 독립변수로 하는 다중회귀분석을 실시하였다. 다중회귀분석은 선형함수, 준로그함수, 역준로그함수, 이중로그함수 4가지 함수형태에 대해 적용하였으며, 각 단계별로 변수의 선택과 제외를 고려하는 단계적선택 방식을 적용하였다. 다중공선성 문제와 자기상관 문제를 해결하기 위하여 분산확대지수(VIF)와 Durbin-Watson 계수 이용하였으며, 4가지 함수모형에 대하여 수정된 R 제곱(설명력) 값이 0.935 (93.5%)로 가장 값이 높고 통계적으로 유의한 선형함수모형을 최적의 모형으로 결정하고 모형에 대한 해석을 진행하였다. 선형함수모형 결과 방화발생에 영향을 미치는 요인은 범죄발생건수(0.829), 일반이혼율(0.151), 재정자주도(0.149), 소비자물가상승률(0.099) 순으로 도출되었다.

다중선형회귀모형에 의한 지표면 광대역 방출율 산출 (Calculation of Surface Broadband Emissivity by Multiple Linear Regression Model)

  • 조은수;이규태;정현석;김부요;조일성
    • 한국지구과학회지
    • /
    • 제38권4호
    • /
    • pp.269-282
    • /
    • 2017
  • 이 연구에서는 Earth Observing System Terra 위성에 탑재된 Moderate Resolution Imaging Spectroradiometer (MODIS) 협대역 방출율(채널 29, 30, 31) 자료와 다중선형회귀모형을 이용하여 지표면 광대역 방출율을 추정하였다. 다중선형회귀모형 도출 및 검증을 위한 분광 방출율 자료는 MODIS University of California, Santa Barbara와 Advanced Spaceborne Thermal Emission and Reflection Radiometer spectral library의 307종(토양 123종, 식생 32종, 물 19종, 인위적 재료 43종, 바위 90종)을 사용하였다. 도출된 다중선형회귀모형의 결정계수($R^2$)는 0.95 (p<.001)로 높게 나타났고 또한 이 모형 결과와 이론적 광대역 방출율 값의 평균제곱근오차(Root Mean Square Error)는 0.0070이었다. 그리고 이 연구 결과에 따라 계산된 지표면 광대역 방출율을 선행 연구 Wang et al. (2005)의 결과와 비교하였다. 그 결과 아시아, 아프리카, 오세아니아 지역에서 이 연구와 Wang et al. (2005)의 결과에 대한 1월 평균 지표면 광대역방출율의 평균제곱근오차는 0.0054이었고 최소와 최대 편차는 각각 0.0027과 0.0067이었으며 이러한 통계 값은 8월에도 유사하였다. 이 연구에서 다중선형회귀모형에 의하여 계산한 지표면 광대역 방출율은 Wang et al. (2005)의 값과 큰 차이가 없이 비교적 정확하게 산출되었으나 산출 정확성 향상을 위해서는 토지피복특성에 따른 차별화된 회귀모형 적용 필요성이 제기된다.

시계열 데이터 예측을 위한 점진적인 회귀분석 모델 (An Incremental Regression Model for Time Series Data Prediction)

  • 김성현;이용미;김룡;서성보;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.23-26
    • /
    • 2006
  • 기존의 데이터 마이닝 예측 기법 중 회귀분석은 학습 단계에서 생성된 모델을 변경 없이 새로운 데이터에 적용하였다. 그러나 시계열 데이터에 모델 변경 없이 동일하게 적용하면 시간이 지남에 따라 정확도가 낮아지는 단점이 있다. 따라서 이 논문에서는 시간에 따라 변화하는 시계열데이터의 특성을 고려하여 점진적으로 회귀 모델을 갱신하는 기법을 제안한다. 이 기법은 입력되는 모든 데이터를 회귀 모델에 적용하여 점진적으로 모델을 갱신한다. 제안된 기법의 타당성은 RME(Relative Mean Error)와 RMSE(Root Mean Square Error)를 이용하여 측정하였다. 정확도 측정 실험 결과 제안 기법인 IMQR(Incremental Multiple Quadratic Regression) 기법이 MLR(Multiple Linear Regression), MQR(Multiple Quadratic Regression), SVR(Support Vector Regression) 기법에 비해 RME 가 평균 2%, RMSE 가 평균 0.02 정도 우수한 결과를 얻었다.

  • PDF

운량과 일조시간에 의한 태양자원 예측 (Solar Radiation Estimation Using Cloud Cover and Hours of Bright Sunshine)

  • 조덕기;윤창열;김광득;강용혁
    • 한국태양에너지학회:학술대회논문집
    • /
    • 한국태양에너지학회 2012년도 춘계학술발표대회 논문집
    • /
    • pp.126-129
    • /
    • 2012
  • In this work a new correlation has been made to predict the solar radiation for 16 different areas over Korea by estimating the regression coefficients taking into account cloud hours of bright sunshine. Particularly, the multiple linear regression model proposed shows reliable results for estimating the global radiation on a horizontal surface with monthly average deviation of -0.26 to +0.53% and each station annual average deviation of -1.61 to +1.7% from measured values.

  • PDF