• 제목/요약/키워드: Regressions Model

검색결과 158건 처리시간 0.024초

선형회귀에서 변수선택, 변수변환과 이상치 탐지의 동시적 수행을 위한 절차 (A procedure for simultaneous variable selection, variable transformation and outlier identification in linear regression)

  • 서한손;윤민
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.1-10
    • /
    • 2020
  • 본 연구에서는 선형회귀모형에서 이상치와 변수변환을 고려한 변수선택 알고리즘을 다룬다. 제안된 방법은 잠재적 이상치를 탐지하여 제거한 후 변수변환 추정을 위해 최소 절사 제곱 추정법을 적용하며 가능한 모든 회귀모형을 비교하여 최종적으로 변수를 선택한다. 정확한 변수 선택과 추정된 모델의 적합도의 맥락에서 방법의 효율성을 보여주기 위해 실제 데이터 분석 및 시뮬레이션 결과가 제시된다.

Case studies: Statistical analysis of contributions of vitamins and phytochemicals to antioxidant activities in plant-based multivitamins through generalized partially double-index model

  • Yoo, Jae Keun;Kwon, Oran
    • Communications for Statistical Applications and Methods
    • /
    • 제23권3호
    • /
    • pp.251-258
    • /
    • 2016
  • It is important to verify the identity of plant-based multivitamins prepared with a natural-concept and popular for daily consumption because they are easily purchased in markets with imperfect information. For this study, a generalized partially double-index model (GPDIM) was employed as a main statistical method to identify the contribution of vitamins and phytochemicals to antioxidant potentials using data on antioxidant capacities and chemical fingerprinting. A bootstrapping approach via sufficient dimension reduction is adopted to estimate the two unknown coefficient vectors in the GPDIM. Fifth order polynomial regressions are fitted to measure the contributions of vitamins and phytochemicals after estimating the coefficient vectors with the two double indices.

Using Machine Learning Algorithms for Housing Price Prediction: The Case of Islamabad Housing Data

  • Imran, Imran;Zaman, Umar;Waqar, Muhammad;Zaman, Atif
    • Soft Computing and Machine Intelligence
    • /
    • 제1권1호
    • /
    • pp.11-23
    • /
    • 2021
  • House price prediction is a significant financial decision for individuals working in the housing market as well as for potential buyers. From investment to buying a house for residence, a person investing in the housing market is interested in the potential gain. This paper presents machine learning algorithms to develop intelligent regressions models for House price prediction. The proposed research methodology consists of four stages, namely Data Collection, Pre Processing the data collected and transforming it to the best format, developing intelligent models using machine learning algorithms, training, testing, and validating the model on house prices of the housing market in the Capital, Islamabad. The data used for model validation and testing is the asking price from online property stores, which provide a reasonable estimate of the city housing market. The prediction model can significantly assist in the prediction of future housing prices in Pakistan. The regression results are encouraging and give promising directions for future prediction work on the collected dataset.

남한 강수량 분포 추정을 위한 PRISM 매개변수 및 수치표고모형 최적화 (Optimization of PRISM Parameters and Digital Elevation Model Resolution for Estimating the Spatial Distribution of Precipitation in South Korea)

  • 박종철;정일원;장희준;김만규
    • 한국지리정보학회지
    • /
    • 제15권3호
    • /
    • pp.36-51
    • /
    • 2012
  • 생태환경모델링, 수문모델링, 기후변화 영향평가 등 다양한 분야에서 정규 격자 형태의 기후자료에 대한 요구가 증가하고 있다. PRISM(Precipitation-Elevation Regressions on Independent Slopes Model)은 다양한 격자형태의 기후자료 생산방법 중 고지대의 강수량 추정에 유용한 방법이다. 그러나 국내에서는 이 모델의 매개변수 및 모델에 사용되는 수치표고모형의 공간해상도 최적화에 대한 논의가 충분하지 않았다. 이에 본 연구에서는 PRISM을 개발하였다. 그리고 SCE-UA(Shuffled Complex Evolution-University of Arizona) 기법을 이용하여 2000-2005년 1km 공간해상도의 남한 연평균 강수 격자자료를 생산하는 데 필요한 PRISM 매개변수 최적값 및 DEM의 적정 공간해상도를 추정하였다. 아울러 매개변수와 수치표고모형에 대한 PRISM의 민감도 분석을 수행하였다. 그 결과 PRISM 모델에서 관측소 최대 탐색반경(67km)과 최소반경(31km), 지형고도-강수량의 선형회귀식 산정에 필요한 최소 관측소 개수(4개), 수치표고모형의 적정 공간해상도($1{\times}1km$) 등을 결정하였다. 그리고 PRISM 모의 결과가 수치표고모형의 공간해상도에 매우 민감하다는 것을 확인하였다. 본 연구결과는 PRISM 기법을 국내에 적용할 때 정확도를 향상시키는데 기여할 것으로 기대된다.

Development of Productivity-based Estimating Tool for Fuel Use and Emissions from Earthwork Construction Activities

  • Hajji, Apif M.;Lewis, Michael Phil
    • Journal of Construction Engineering and Project Management
    • /
    • 제3권2호
    • /
    • pp.58-65
    • /
    • 2013
  • Earthwork activities are typically performed by heavy duty diesel (HDD) construction equipment that consumes large quantities of diesel fuel use and emits large quantities of pollutants, including nitrogen oxides (NOx), particulate matters (PM), hydrocarbon (HC), carbon monoxide (CO), and carbon dioxide ($CO_2$). This paper presents the framework for a model that can be used to estimate the production rate, activity duration, total fuel use, and total pollutants emissions for earthwork activities. A case study and sensitivity analysis for an excavator performing excavations are presented. The tool is developed by combining the multiple linear regressions (MLR) approach for modeling the productivity with the EPA's NONROAD model. The excavator data from RSMeans Heavy Construction Data were selected to build the productivity model, and emission factors of all type of pollutants from NONROAD model were used to estimate the total fuel use and emissions. The MLR model for the productivity rate can explain 92% of the variability in the data. Based on the model, the fuel use and emissions of excavator increase as the trench depth increase, but as the bucket size increase, the fuel use and emissions decrease.

MLR 및 SVR 기반 선형과 비선형회귀분석의 비교 - 풍속 예측 보정 (Comparison of MLR and SVR Based Linear and Nonlinear Regressions - Compensation for Wind Speed Prediction)

  • 김준봉;오승철;서기성
    • 전기학회논문지
    • /
    • 제65권5호
    • /
    • pp.851-856
    • /
    • 2016
  • Wind speed is heavily fluctuated and quite local than other weather elements. It is difficult to improve the accuracy of prediction only in a numerical prediction model. An MOS (Model Output Statistics) technique is used to correct the systematic errors of the model using a statistical data analysis. The Most of previous MOS has used a linear regression model for weather prediction, but it is hard to manage an irregular nature of prediction of wind speed. In order to solve the problem, a nonlinear regression method using SVR (Support Vector Regression) is introduced for a development of MOS for wind speed prediction. Experiments are performed for KLAPS (Korea Local Analysis and Prediction System) re-analysis data from 2007 to 2013 year for Jeju Island and Busan area in South Korea. The MLR and SVR based linear and nonlinear methods are compared to each other for prediction accuracy of wind speed. Also, the comparison experiments are executed for the variation in the number of UM elements.

A Study on the Development of Fuzzy Linear Regression I

  • Kim, Hakyun
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제4권
    • /
    • pp.27-39
    • /
    • 1995
  • This study tests the fuzzy linear regression model to see if there is a performance difference between it and the classical linear regression model. These results show that FLR was better as f forecasting technique when compared with CLR. Another important find in the test of the two different regression methods is that they generate two different predicted P/E ratios from expected value test, variance test and error test of two different regressions, though we can not see a significant difference between two regression models doing test in error measurements (GMRAE, MAPE, MSE, MAD). So, in this financial setting we can conclude that FLR is not superior to CLR, comparing and testing between the t재 different regression models. However, FLR is better than CLR in the error measurements.

  • PDF

미계측 유역의 일단위 강수량 추정을 위한 PRISM 최적화 (Optimization of PRISM Model for Gridded Daily Precipitation in Ungaged Watershed over South Korea)

  • 김용탁;오랑치맥 솜야;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.83-83
    • /
    • 2020
  • 지속되고 있는 기후변화의 영향으로 발생하는 기상현상들이 사회적 문제로 대두되고 있으며, 기후변화에 따른 국지적 극한 사상에 대한 전망은 수자원 활용 계획을 수립하고 대응하는 데 있어 필수적인 요소로 인식되고 있다. 이에 기후, 수문, 지리, 생태 및 환경 등의 다양한 영역에서 신뢰할 수 있는 공간적 강수량의 요구가 증가하고 있지만 지형의 약 70%가 산악 지형인 우리나라의 경우 기존의 일반적 공간보간 기법인 IDW 및 크리깅 방법은 고도가 높은 지역의 기상인자를 추정하는 데 한계가 있는 것으로 평가 받고 있다. 프리즘(Precipitation-Elevation Regressions on Independent Slopes Model, PRISM) 기법은 지형적 특성을 고려한 격자형태의 기상인자를 생산할 수 있는 유용한 방법으로서 미계측 유역에 대한 신뢰할 수 있는 일 단위 강수량 추정을 위하여 SCE-UA (Shuffled Complex Evolution-University of Arizona) 기법을 활용하여 최적화 하였다. 본 연구결과는 PRISM 기법의 국내 적용 시 정확도 향상에 기여할 것으로 기대된다.

  • PDF

PRISM-KNU의 개발과 남한 월강수량 분포도 작성 (PRISM-KNU Development and Monthly Precipitation Mapping in South Korea)

  • 박종철;김만규
    • 한국지리정보학회지
    • /
    • 제19권2호
    • /
    • pp.27-46
    • /
    • 2016
  • 본 연구는 월강수량의 내삽을 위해 PRISM-KNU(Parameter-elevation Regressions on Independent Slopes Model-Kongju National University)를 개발하였다. PRISM-KNU의 특징은 강수량과 지형고도 사이의 선형관계의 공식에서 기울기의 허용 범위를 지형 기복량을 토대로 조절하는 것이다. 이 모델의 매개변수 값은 최적화 기법에 의해 결정하였고, 그 결과를 2000~2014년, 공간 해상도 $1{\times}1km$의 남한 강수량 자료를 생산하는데 적용하였다. 연구 결과에서 모의 효율, Kling-Gupta Efficiency는 총 모의 사례의 86%에서 0.7 이상이었다. 또한 Modified Korean PRISM에 의해 생산된 기존의 강수량 자료에서는 공간적 패턴에 급격한 변화가 나타나는 반면 PRISM-KNU에 의해 생산된 자료에서는 그와 같은 현상이 나타나지 않았다. 본 연구는 PRISM-KNU가 타당하게 개발되었다는 것을 확인하였고, 연구 결과는 또한 그 모델에 의해 생산된 자료의 공간적 일관성이 Modified Korean PRISM의 자료에 비해 향상 되었다는 것을 보여주었다. PRISM-KNU와 그 모델의 산출물은 다양한 연구에 활용될 것으로 기대된다.

Assessment of Wind Power Prediction Using Hybrid Method and Comparison with Different Models

  • Eissa, Mohammed;Yu, Jilai;Wang, Songyan;Liu, Peng
    • Journal of Electrical Engineering and Technology
    • /
    • 제13권3호
    • /
    • pp.1089-1098
    • /
    • 2018
  • This study aims at developing and applying a hybrid model to the wind power prediction (WPP). The hybrid model for a very-short-term WPP (VSTWPP) is achieved through analytical data, multiple linear regressions and least square methods (MLR&LS). The data used in our hybrid model are based on the historical records of wind power from an offshore region. In this model, the WPP is achieved in four steps: 1) transforming historical data into ratios; 2) predicting the wind power using the ratios; 3) predicting rectification ratios by the total wind power; 4) predicting the wind power using the proposed rectification method. The proposed method includes one-step and multi-step predictions. The WPP is tested by applying different models, such as the autoregressive moving average (ARMA), support vector machine (SVM), and artificial neural network (ANN). The results of all these models confirmed the validity of the proposed hybrid model in terms of error as well as its effectiveness. Furthermore, forecasting errors are compared to depict a highly variable WPP, and the correlations between the actual and predicted wind powers are shown. Simulations are carried out to definitely prove the feasibility and excellent performance of the proposed method for the VSTWPP versus that of the SVM, ANN and ARMA models.