• Title/Summary/Keyword: 다중회귀

Search Result 3,967, Processing Time 0.032 seconds

Predicting a Queue Length Using a Deep Learning Model at Signalized Intersections (딥러닝 모형을 이용한 신호교차로 대기행렬길이 예측)

  • Na, Da-Hyuk;Lee, Sang-Soo;Cho, Keun-Min;Kim, Ho-Yeon
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.20 no.6
    • /
    • pp.26-36
    • /
    • 2021
  • In this study, a deep learning model for predicting the queue length was developed using the information collected from the image detector. Then, a multiple regression analysis model, a statistical technique, was derived and compared using two indices of mean absolute error(MAE) and root mean square error(RMSE). From the results of multiple regression analysis, time, day of the week, occupancy, and bus traffic were found to be statistically significant variables. Occupancy showed the most strong impact on the queue length among the variables. For the optimal deep learning model, 4 hidden layers and 6 lookback were determined, and MAE and RMSE were 6.34 and 8.99. As a result of evaluating the two models, the MAE of the multiple regression model and the deep learning model were 13.65 and 6.44, respectively, and the RMSE were 19.10 and 9.11, respectively. The deep learning model reduced the MAE by 52.8% and the RMSE by 52.3% compared to the multiple regression model.

특허분석을 활용한 항해 시스템 기술예측

  • Park, Eun-Ju;Jeong, Jung-Sik
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2015.07a
    • /
    • pp.50-52
    • /
    • 2015
  • 특허는 기술에 대한 광범위한 정보를 포함하고 있다. 기존의 기술예측은 정량적분석으로 시도되었지만 특허분석을 활용하여 정성적분석을 실시하였다. 특허분석을 시행하기 위하여 R 프로그램을 이용하여 주성분분석과 다중선형회귀분석을 실행하였다. 주성분분석과 다중선형회귀분석을 통하여 키워드를 추출하고 추출된 키워드를 통해 기술예측을 실시한다.

  • PDF

다중회귀를 이용한 대구시 주거지역의 오존농도 예측

  • Lee, Jeong-Hwan;Choe, Seong-U;Choe, Hyeok
    • Proceedings of the Korean Environmental Sciences Society Conference
    • /
    • 2006.11a
    • /
    • pp.117-118
    • /
    • 2006
  • 본 연구에서는 2001년부터 2005년까지의 최근 5년간의 대구시 보건환경연구원의 대기질 자동측정망 자료와 대구기상대의 기상자료를 이용하여 다중회귀분석을 통하여 대구시 주거 지역의 오존농도를 예측하였다. 대구시 주거지역의 고농도 오존은 측정소별로 대명동은 총 327회 중 153회(46.79%), 신암동은 총 310회 중 143회(46.13%), 만촌동은 총 262회 중 140회(53.44%)로 기온과 일사량이 증가하는 5, 6월에 주로 많이 발생하였다. 다중회귀분석 결과 각 측정소별로 수정된 $R^2$는 각각 0.611, 0.655, 0.624으로 양호한 회귀 모형을 나타내었다.

  • PDF

On Testing the First-order Autocorrelation of the Error Term in a Regression Model via Multiple Bayes Factor (다중 베이즈요인에 의한 회귀모형 오차항의 자기상관 검정)

  • 한성실;김혜중
    • The Korean Journal of Applied Statistics
    • /
    • v.12 no.2
    • /
    • pp.605-619
    • /
    • 1999
  • 본 논문은 회귀분석에서 오차항의 1차 자기상관 존재 여부 및 그 값을 검정하는 방법을 베이지안 접근법으로 제안하였다. 이 방법은 모수공간의 다중분할로 인해 얻어진 여러 가설들에 대한 다중결정문제를 다중 베이즈요인에 관한 이론과 일반화 Savage-Dickey 밀도비를 이용한 사후확률 추정법을 합성하여 개발되었다. 이 방법은 기존의 검정법들에서 가능한 검정 뿐 아니라 이들이 해결할 수 없는 자기상관에 대한 다중결정문제에도 사용이 가능한데 그 효용성이 있다. 모의실험을 통하여 제안된 검정법의 유효성을 평가하였다.

  • PDF

First-time estimation of HCHO column in major cities over Asia using multiple regression with satellite data (위성자료와 다중회귀분석법을 이용한 아시아 주요도시의 포름알데하이드 칼럼농도 추정연구)

  • Choi, Wonei;Hong, Hyunkee;Park, Junsung;Lee, Hanlim
    • Korean Journal of Remote Sensing
    • /
    • v.31 no.6
    • /
    • pp.523-530
    • /
    • 2015
  • A Multiple Regression Method (MRM) is used for the first time with Ozone Monitoring Instrument (OMI) and Moderate Resolution Imaging Spectroradiometer (MODIS) data to estimate formaldehyde (HCHO) Vertical Column Density (VCD). For a 3.5-year period from January 2005 through July 2008, HCHO VCD estimation is investigated in cities over Asia in two categorized areas: (1) Major cities in Northeast Asia (Beijing, Seoul, and Tokyo), (2) Major cities in Southeast Asia (New Delhi, Dhaka, and Bangkok). In the Major cities in Northeast Asia, there are good agreements between HCHO estimated by the multiple linear regression method ($HCHO_{MRM}$) and HCHO measured by OMI ($HCHO_{OMI}$) (0.78 < $R^2$ < 0.82). However, in Major cities in Southeast Asia, there were poor agreements between $HCHO_{OMI}$ and $HCHO_{MRM}$ (0.24 < $R^2$ < 0.39). In addition, an unbiased assessment of the MRM performance using modeling and validation groups shows that the performance of the MRM based on separate modeling and validation groups is comparable to that using all the data for deriving Multiple Regression Equations (MREs). This study demonstrates that MRM can be an alternative tool for HCHO estimation in certain areas over Asia.

Comparison of Regression Coefficient Significance Test for Temporal Distribution by Multiple Regression Analysis Method (다중회귀분석 방법에 따른 시간분포 회귀식의 회귀계수 유의성 검정 비교)

  • Lee, Sung Ho;Lee, Jae Joon;Park, Jin Hee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.205-205
    • /
    • 2019
  • 우리나라에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로, 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해 있는 구간을 선택하여 그 구간의 위치에 따라 분위를 정하는 방법이다. 현재 실무에서는 Huff의 분위별 곡선에 대한 회귀식은 지속기간 전반에 걸쳐 정확도가 높은 이유로 6차식을 적용하고 있으나, 통계 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있으며, 통계적 유의수준에 기초하여 회귀계수를 결정하여야 하므로 유의성 검정 방법을 통한 검정결과를 비교할 필요가 있다. 따라서 본 연구에서는 다중회귀분석 방법에 따른 회귀계수 유의성 검정결과 비교를 위하여 구미지역의 무차원 누가우량 백분율을 이용한 시간분포 회귀식을 이용하여 유의성 검정 방법인 분산분석 방법(Analysis of Variance)과 변수선택 방법(Backward Selection)의 검정 결과를 도출 및 비교하였다. 통계프로그램인 프로그래밍 R을 이용하여 변수선택 방법 중 후방제거법 함수를 이용하여 최종 회귀식을 도출하고 또한 7차 회귀식을 분산분석을 이용한 후방제거법으로 회귀계수를 제거하는 방법으로 최종 회귀식을 산정하였다. 분산분석을 이용한 후방제거법의 유의성 검정결과는 프로그래밍 R을 이용한 후방제거법의 결과와 동일한 것으로 분석되었다. 일반적으로 설계강우량의 시간분포를 위한 방법으로 사용되고 있는 Huff의 4분위 방법의 시간분포 회귀식은 회귀계수의 유의성 검정이 이루어지고 있지 않으므로 본 연구결과를 통해 설계강우량 시간분포 회귀식의 유의성 검정방법 제시 및 결과도출과정을 통해 시간분포 회귀식 산정기법으로 활용할 수 있을 것으로 사료된다.

  • PDF

Procedure for the Selection of Principal Components in Principal Components Regression (주성분회귀분석에서 주성분선정을 위한 새로운 방법)

  • Kim, Bu-Yong;Shin, Myung-Hee
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.5
    • /
    • pp.967-975
    • /
    • 2010
  • Since the least squares estimation is not appropriate when multicollinearity exists among the regressors of the linear regression model, the principal components regression is used to deal with the multicollinearity problem. This article suggests a new procedure for the selection of suitable principal components. The procedure is based on the condition index instead of the eigenvalue. The principal components corresponding to the indices are removed from the model if any condition indices are larger than the upper limit of the cutoff value. On the other hand, the corresponding principal components are included if any condition indices are smaller than the lower limit. The forward inclusion method is employed to select proper principal components if any condition indices are between the upper limit and the lower limit. The limits are obtained from the linear model which is constructed on the basis of the conjoint analysis. The procedure is evaluated by Monte Carlo simulation in terms of the mean square error of estimator. The simulation results indicate that the proposed procedure is superior to the existing methods.

Estimation of seasonal rainfall based on multiple regression analysis using ASOS data of Korea Meteorological Administration (기상청 ASOS 자료를 활용한 다중회귀분석 기반의 계절 강수량 예측)

  • Kim, Chul-gyum;Lee, Jeongwoo;Lee, Jeong Eun;Kim, Nam-won;Kim, Hyeonjun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.310-310
    • /
    • 2019
  • 본 연구에서는 기상청 ASOS(종관기상관측장비) 자료와 통계적 기반의 다중회귀분석모형을 이용하여 경안천 유역에 대한 봄철 강수량(3~5월 누적강수량)의 예측성을 평가하였다. 예측대상기간은 2006~2018년이며 예측인자로서 전국 96개 지점의 ASOS 자료 중 35개 기상요소에 대한 월 자료를 활용하였다. 전망기간(1~12개월)에 따라 강수량 기준 최소 1개월에서 최대 24개월까지의 지체시간을 고려하여 1~24개월 선행 ASOS 기상자료와 강수량 사이의 상관성을 분석하였다. 예측대상년도를 기준으로 과거 40년간의 자료를 이용하여 상관성 분석을 수행하였으며, 상관성이 높은 상위 30개 기상인자를 조합하여 다중회귀분석모형의 예측인자(독립변수)로 활용하였다. 예측대상년도와 전망기간에 따라 최적의 예측인자를 조합하고, 교차검증을 통하여 각각 4,000개의 다중회귀모형을 도출하여 예측범위를 산출하였다. 다중회귀모형에 의한 예측범위를 분석한 결과, 2013년 자료까지는 예측범위가 관측값을 잘 포함하고 예측값의 평균이나 중간값이 관측값과 유사하게 나타난 반면, 2014년부터는 전망기간에 따라 관측값과 예측범위의 차이가 크게 나타나는 경우도 있었다. 예측치의 중간값을 기준으로 3분위(평년 이상, 평년 수준, 평년 이하) 적중률을 분석하면, 2006~2013년에 대해서는 58.3%인 반면, 2014~2018년에 대해서는 11.2% 수준으로 나타났다.

  • PDF

A study on the properties of sensitivity analysis in principal component regression and latent root regression (주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구)

  • Shin, Jae-Kyoung;Chang, Duk-Joon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.2
    • /
    • pp.321-328
    • /
    • 2009
  • In regression analysis, the ordinary least squares estimates of regression coefficients become poor, when the correlations among predictor variables are high. This phenomenon, which is called multicollinearity, causes serious problems in actual data analysis. To overcome this multicollinearity, many methods have been proposed. Ridge regression, shrinkage estimators and methods based on principal component analysis (PCA) such as principal component regression (PCR) and latent root regression (LRR). In the last decade, many statisticians discussed sensitivity analysis (SA) in ordinary multiple regression and same topic in PCR, LRR and logistic principal component regression (LPCR). In those methods PCA plays important role. Many statisticians discussed SA in PCA and related multivariate methods. We introduce the method of PCR and LRR. We also introduce the methods of SA in PCR and LRR, and discuss the properties of SA in PCR and LRR.

  • PDF

Development and Validation of Multiple Regression Models for the Prediction of Effluent Concentration in a Sewage Treatment Process (하수처리장 방류수 수질예측을 위한 다중회귀분석 모델 개발 및 검증)

  • Min, Sang-Yun;Lee, Seung-Pil;Kim, Jin-Sik;Park, Jong-Un;Kim, Man-Soo
    • Journal of Korean Society of Environmental Engineers
    • /
    • v.34 no.5
    • /
    • pp.312-315
    • /
    • 2012
  • In this study, the model which can predict the quality of effluent has been implemented through multiple regression analysis to use operation data of a sewage treatment plant, to which a media process is applied. Multiple regression analysis were carried out by cases according to variable selection method, removal of outliers and log transformation of variables, with using data of one year of 2011. By reviewing the results of predictable models, the accuracy of prediction for $COD_{Mn}$ of treated water of secondary clarifiers was over 0.87 and for T-N was over 0.81. Using this model, it is expected to set the range of operating conditions that do not exceed the standards of effluent quality. In conclusion, the proper guidance on the effluent quality and energy costs within the operating range is expected to be provided to operators.