• 제목/요약/키워드: Multiple regression model

검색결과 2,531건 처리시간 0.025초

태풍타입별 피해 분석 및 다중회귀분석을 활용한 태풍피해예측모델 개발 연구 (Typhoon Path and Prediction Model Development for Building Damage Ratio Using Multiple Regression Analysis)

  • 양성필;손기영;이경훈;김지명
    • 한국건축시공학회지
    • /
    • 제16권5호
    • /
    • pp.437-445
    • /
    • 2016
  • 태풍은 인류에 큰 피해를 주는 재난재해로 몇몇 선진국에서는 태풍으로 인한 건축물 피해액 사전예측 모델에 관한 연구가 진행되고 있다. 국내에서도 해외 연구를 토대로 국내에 적용시키는 연구가 진행되었지만, 태풍의 특성이나 크기 등이 차이가 나므로 국내에 적합한 모델이 필요한 실정이다. 또한, 국내의 연구는 태풍의 특성, 지역적 특성만을 고려하여 진행 하였으나, 태풍은 복합재해로서 태풍의 특성, 지리적 특성만이 아닌 태풍의 진로, 건설환경, 등 다양한 요인을 고려하여야한다. 이에 본 연구에서는 국내에 영향을 미친 태풍을 7가지 타입으로 분류하여 건물피해액 영향인자를 도출하고, 회귀분석을 실시하여 태풍 타입별 건물피해율 예측모델을 개발 목적으로 한다. 이는 선진국의 자연재해 예측모델들과 같이 국내의 상황에 맞는 태풍에 따른 피해를 예측하기 위한 모델 개발을 위한 자료로 활용 될 것이다.

Optimum Model for Analyzing Lifetime Profitability of Holstein Cows

  • Shadparvar, A.A.;Nikbin, S.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제21권6호
    • /
    • pp.769-775
    • /
    • 2008
  • This study was on the relative net income (RNI) for 18,286 Iranian Holstein cows from 799 herds, with first freshening between 1991 and 2000. Two kinds of production system, which differed mainly in milk pricing system and feed cost, were considered. Four different models adopted from the literature were examined to find the optimum model. They differed by the cost of rearing and growth after first calving and they needed different amounts of economic data at the farm level. Results showed that four measures of RNI were highly correlated (>0.96) and could be used equally to measure lifetime profitability of cows. Therefore, in herds without a regular system for recording economic and management data, use of the simplest model is recommended. Multiple regression analysis revealed that RNI was affected by age at first freshening, milk yield and days of productive life (DPL), regardless of production system, and a similar breeding goal could be defined for the two systems. Multiple regression analysis of RNI showed that in order to obtain an unbiased estimate of economic value for DPL, the per day milk yield, not total lifetime milk yield, should be included in the regression model along with DPL. Regression analysis suggested that it is possible to predict RNI using information on age at first freshening along with the length of first lactation and per day milk yield with a coefficient of determination ranging from 0.44 to 0.47.

Simultaneous outlier detection and variable selection via difference-based regression model and stochastic search variable selection

  • Park, Jong Suk;Park, Chun Gun;Lee, Kyeong Eun
    • Communications for Statistical Applications and Methods
    • /
    • 제26권2호
    • /
    • pp.149-161
    • /
    • 2019
  • In this article, we suggest the following approaches to simultaneous variable selection and outlier detection. First, we determine possible candidates for outliers using properties of an intercept estimator in a difference-based regression model, and the information of outliers is reflected in the multiple regression model adding mean shift parameters. Second, we select the best model from the model including the outlier candidates as predictors using stochastic search variable selection. Finally, we evaluate our method using simulations and real data analysis to yield promising results. In addition, we need to develop our method to make robust estimates. We will also to the nonparametric regression model for simultaneous outlier detection and variable selection.

시계열 데이터 예측을 위한 점진적인 회귀분석 모델 (An Incremental Regression Model for Time Series Data Prediction)

  • 김성현;이용미;김룡;서성보;류근호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.23-26
    • /
    • 2006
  • 기존의 데이터 마이닝 예측 기법 중 회귀분석은 학습 단계에서 생성된 모델을 변경 없이 새로운 데이터에 적용하였다. 그러나 시계열 데이터에 모델 변경 없이 동일하게 적용하면 시간이 지남에 따라 정확도가 낮아지는 단점이 있다. 따라서 이 논문에서는 시간에 따라 변화하는 시계열데이터의 특성을 고려하여 점진적으로 회귀 모델을 갱신하는 기법을 제안한다. 이 기법은 입력되는 모든 데이터를 회귀 모델에 적용하여 점진적으로 모델을 갱신한다. 제안된 기법의 타당성은 RME(Relative Mean Error)와 RMSE(Root Mean Square Error)를 이용하여 측정하였다. 정확도 측정 실험 결과 제안 기법인 IMQR(Incremental Multiple Quadratic Regression) 기법이 MLR(Multiple Linear Regression), MQR(Multiple Quadratic Regression), SVR(Support Vector Regression) 기법에 비해 RME 가 평균 2%, RMSE 가 평균 0.02 정도 우수한 결과를 얻었다.

  • PDF

경제지표를 활용한 다중선형회귀 모델 기반 국제 휘발유 가격 예측 (A study of Predicting International Gasoline Prices based on Multiple Linear Regression with Economic Indicators)

  • 한명은;김지연;이현희;김세인;박민서
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.159-164
    • /
    • 2024
  • 국내 석유 시장은 국제 석유 가격의 변동에 매우 민감하기 때문에 그 변동성에 대한 파악과 대처가 중요하다. 특히, 높은 소비량을 보이는 휘발유의 가격이 어떠한 요인에 인해 변화하는지 명확하게 파악하는 것이 필요하다. 국제 휘발유 가격은 휘발유 수급, 지정학적 사건, 미국 달러화 가치 변동 등 글로벌 요인에 영향을 받는다. 그러나 기존의 연구들은 휘발유의 수급에만 초점에 맞추어 진행하였다는 한계가 존재한다. 본 연구에서는 다양한 머신러닝 기반의 회귀 모델을 활용하여 거시적 경제지표와 국제 휘발유 가격 간의 인과관계를 탐색한다. 첫째, 다양한 세계 경제지표 데이터를 수집한다. 둘째, 데이터 전처리를 진행한다. 셋째, 다중선형회귀, Ridge 회귀, Lasso(Least Absolute Shrinkage and Selection Operator) 회귀 모델을 활용하여 모델링한다. 실험 결과, 테스트 데이터 셋에서 다중선형회귀 모델이 가장 높은 정확도(97.3%)를 보였다. 우리는 국제 휘발유 가격의 예측은 국내 경제 안정성과 에너지 정책 결정에 도움이 될 수 있을 것으로 기대한다.

Development of the Algorithm for Optimizing Wavelength Selection in Multiple Linear Regression

  • Hoeil Chung
    • Near Infrared Analysis
    • /
    • 제1권1호
    • /
    • pp.1-7
    • /
    • 2000
  • A convenient algorithm for optimizing wavelength selection in multiple linear regression (MLR) has been developed. MOP (MLP Optimization Program) has been developed to test all possible MLR calibration models in a given spectral range and finally find an optimal MLR model with external validation capability. MOP generates all calibration models from all possible combinations of wavelength, and simultaneously calculates SEC (Standard Error of Calibration) and SEV (Standard Error of Validation) by predicting samples in a validation data set. Finally, with determined SEC and SEV, it calculates another parameter called SAD (Sum of SEC, SEV, and Absolute Difference between SEC and SEV: sum(SEC+SEV+Abs(SEC-SEV)). SAD is an useful parameter to find an optimal calibration model without over-fitting by simultaneously evaluating SEC, SEV, and difference of error between calibration and validation. The calibration model corresponding to the smallest SAD value is chosen as an optimum because the errors in both calibration and validation are minimal as well as similar in scale. To evaluate the capability of MOP, the determination of benzene content in unleaded gasoline has been examined. MOP successfully found the optimal calibration model and showed the better calibration and independent prediction performance compared to conventional MLR calibration.

다중선형회귀모델을 이용한 움직임 추정방법 (Motion estimation method using multiple linear regression model)

  • 김학수;임원택;이재철;이규원;박규택
    • 전자공학회논문지S
    • /
    • 제34S권10호
    • /
    • pp.98-103
    • /
    • 1997
  • Given the small bit allocation for motion information in very low bit-rate coding, motion estimation using the block matching algorithm(BMA) fails to maintain an acceptable level of prediction errors. The reson is that the motion model, or spatial transformation, assumed in block matching cannot approximate the motion in the real world precisely with a small number of parameters. In order to overcome the drawback of the conventional block matching algorithm, several triangle-based methods which utilize triangular patches insead of blocks have been proposed. To estimate the motions of image sequences, these methods usually have been based on the combination of optical flow equation, affine transform, and iteration. But the compuataional cost of these methods is expensive. This paper presents a fast motion estimation algorithm using a multiple linear regression model to solve the defects of the BMA and the triange-based methods. After describing the basic 2-D triangle-based method, the details of the proposed multiple linear regression model are presented along with the motion estimation results from one standard video sequence, representative of MPEG-4 class A data. The simulationresuls show that in the proposed method, the average PSNR is improved about 1.24 dB in comparison with the BMA method, and the computational cost is reduced about 25% in comparison with the 2-D triangle-based method.

  • PDF

Development of a Multiple Linear Regression Model to Analyze Traffic Volume Error Factors in Radar Detectors

  • Kim, Do Hoon;Kim, Eung Cheol
    • 한국측량학회지
    • /
    • 제39권5호
    • /
    • pp.253-263
    • /
    • 2021
  • Traffic data collected using advanced equipment are highly valuable for traffic planning and efficient road operation. However, there is a problem regarding the reliability of the analysis results due to equipment defects, errors in the data aggregation process, and missing data. Unlike other detectors installed for each vehicle lane, radar detectors can yield different error types because they detect all traffic volume in multilane two-way roads via a single installation external to the roadway. For the traffic data of a radar detector to be representative of reliable data, the error factors of the radar detector must be analyzed. This study presents a field survey of variables that may cause errors in traffic volume collection by targeting the points where radar detectors are installed. Video traffic data are used to determine the errors in traffic measured by a radar detector. This study establishes three types of radar detector traffic errors, i.e., artificial, mechanical, and complex errors. Among these types, it is difficult to determine the cause of the errors due to several complex factors. To solve this problem, this study developed a radar detector traffic volume error analysis model using a multiple linear regression model. The results indicate that the characteristics of the detector, road facilities, geometry, and other traffic environment factors affect errors in traffic volume detection.

A New Deletion Criterion of Principal Components Regression with Orientations of the Parameters

  • Lee, Won-Woo
    • Journal of the Korean Statistical Society
    • /
    • 제16권2호
    • /
    • pp.55-70
    • /
    • 1987
  • The principal components regression is one of the substitues for least squares method when there exists multicollinearity in the multiple linear regression model. It is observed graphically that the performance of the principal components regression is strongly dependent upon the values of the parameters. Accordingly, a new deletion criterion which determines proper principal components to be deleted from the analysis is developed and its usefulness is checked by simulations.

  • PDF

GWR을 이용한 센서스 기반 도시범죄 특성 분석 및 예측모델 구축 (Construction of Urban Crime Prediction Model based on Census Using GWR)

  • 유영우;백태경
    • 한국지리정보학회지
    • /
    • 제20권4호
    • /
    • pp.65-76
    • /
    • 2017
  • 본 연구는 범죄와 환경과의 관계가 밀접한 영향을 미친다는 전제하에 범죄억제를 위한 정책수립 및 설계를 위한 대안마련의 사전단계로 범죄위험지역 분석과 요인, 공간적 특성이 반영된 예측모델을 제시하는 것을 주요 목적으로 수행하였다. 연구의 분석결과, H구 전체 지역에 범죄가 균등하게 분포하였을 경우와 대비하여 약 1/4 수준으로 범죄발생지역은 군집성을 나타내고 있었으며 주로 H 해수욕장 배후 상업지역에서 특정범죄(강간, 절도, 폭력)는 강한 핫스팟을 나타내었다. 결과적으로 독립변수와 종속변수의 공간적 상관관계를 고려하는 지리가중회귀모형을 이용함으로써 보다 효과적으로 적용할 수 있음을 알 수 있었다. 이러한 결과는 다중선형회귀 모형의 결과에서와 같이 연구지역 내 폐공가수가 종속변수와 단순히 부적의 관계를 가지는 것이 아니라, 지역에 따라 종속변수에 서로 다른 영향을 미치는 것을 알 수 있다.