• Title/Summary/Keyword: 회귀 방법

Search Result 4,260, Processing Time 0.038 seconds

Comparison of Regression Coefficient Significance Test for Temporal Distribution by Multiple Regression Analysis Method (다중회귀분석 방법에 따른 시간분포 회귀식의 회귀계수 유의성 검정 비교)

  • Lee, Sung Ho;Lee, Jae Joon;Park, Jin Hee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.205-205
    • /
    • 2019
  • 우리나라에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로, 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해 있는 구간을 선택하여 그 구간의 위치에 따라 분위를 정하는 방법이다. 현재 실무에서는 Huff의 분위별 곡선에 대한 회귀식은 지속기간 전반에 걸쳐 정확도가 높은 이유로 6차식을 적용하고 있으나, 통계 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있으며, 통계적 유의수준에 기초하여 회귀계수를 결정하여야 하므로 유의성 검정 방법을 통한 검정결과를 비교할 필요가 있다. 따라서 본 연구에서는 다중회귀분석 방법에 따른 회귀계수 유의성 검정결과 비교를 위하여 구미지역의 무차원 누가우량 백분율을 이용한 시간분포 회귀식을 이용하여 유의성 검정 방법인 분산분석 방법(Analysis of Variance)과 변수선택 방법(Backward Selection)의 검정 결과를 도출 및 비교하였다. 통계프로그램인 프로그래밍 R을 이용하여 변수선택 방법 중 후방제거법 함수를 이용하여 최종 회귀식을 도출하고 또한 7차 회귀식을 분산분석을 이용한 후방제거법으로 회귀계수를 제거하는 방법으로 최종 회귀식을 산정하였다. 분산분석을 이용한 후방제거법의 유의성 검정결과는 프로그래밍 R을 이용한 후방제거법의 결과와 동일한 것으로 분석되었다. 일반적으로 설계강우량의 시간분포를 위한 방법으로 사용되고 있는 Huff의 4분위 방법의 시간분포 회귀식은 회귀계수의 유의성 검정이 이루어지고 있지 않으므로 본 연구결과를 통해 설계강우량 시간분포 회귀식의 유의성 검정방법 제시 및 결과도출과정을 통해 시간분포 회귀식 산정기법으로 활용할 수 있을 것으로 사료된다.

  • PDF

An Estimation of Regression Equation for Temporal Distribution of Design Rainfall Using Variable Selection Method (변수선택 방법을 이용한 설계강우량 시간분포 회귀식의 산정)

  • Lee, Sung Ho;Lee, Jae Joon;Park, Jin Hee;Rhee, Dong Sop
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.169-169
    • /
    • 2018
  • 국내에서는 유량자료의 부족으로 수공구조물을 설계하기 위한 기초자료로서 설계강우량을 활용하고 있다. 따라서 설계강우량의 산정 및 시간분포가 중요한 요인으로 작용하고 있으며, 국내에서는 설계강우량 시간분포를 위한 방법으로 Huff의 4분위 방법을 사용하는 것이 일반적이다. 실무에서는 확률강우량도 개선 및 보완연구(Ministry of Land, Transport and Maritime Affairs, 2011)에서 제시한 관측소별 Huff의 무차원 누가우량 백분율을 이용하여 Huff의 4분위 방법 중 3분위의 자료를 이용하여 시간분포 회귀식을 산정하고 있으며, 회귀식의 차수는 전반적으로 결정계수가 높은 6차식을 사용하고 있다. 회귀식의 경우 고차식으로 갈수록 결정계수가 높아지는 것은 당연하지만 4차 이상의 회귀식에서는 결정계수의 차이가 미미하므로 6차식을 사용하는 것이 합리적이라고 할 수 없다. 따라서 본 연구에서는 통계적 유의수준에 기초하여 Huff 4분위 방법의 시간분포 회귀식에 대한 유의성 검정을 실시하여 회귀계수에 대한 통계적 검증을 실시하고 변수선택 방법인 전방선택법(Forward Selection)을 이용하여 유의하지 않은 회귀계수들을 제외하면서 가장 좋은 변수들로 구성된 간결한 설계강우량 시간분포 회귀식을 산정하고자 한다. 또한 산정된 회귀식과 기존 확률강우량도 개선 및 보완연구(Ministry of Land, Transport and Maritime Affairs, 2011)에서 제시한 회귀식과 비교하여 변수선택 방법인 전방 선택법(Forward Selection)을 이용하여 산정된 회귀식의 적합성을 검증하고자 한다.

  • PDF

공변량을 갖는 패널자기회귀 과정에 대한 베이즈추정

  • 신민웅;신기일
    • Communications for Statistical Applications and Methods
    • /
    • v.1 no.1
    • /
    • pp.94-101
    • /
    • 1994
  • 본 논문은 패널(panel) 자기회귀 모형에서 자기회귀 계수의 추정을 베이지안 방법으로 접근하였는데, 이 때 특별히 Gibbs Sampling 방법을 이용하여 사후분포를 계산하였다. 또한 모의 실험을 통하여 자기회귀계수를 Gibbs Sampling 방법으로 추정한 베이지안 추정치가 non-Bayesian 방법으로 구한 추정치보다 더 우월함을 보였다.

  • PDF

Bootstrapping Composite Quantile Regression (복합 분위수 회귀에 대한 붓스트랩 방법의 응용)

  • Seo, Kang-Min;Bang, Sung-Wan;Jhun, Myoung-Shic
    • The Korean Journal of Applied Statistics
    • /
    • v.25 no.2
    • /
    • pp.341-350
    • /
    • 2012
  • Composite quantile regression model is considered for iid error case. Since the regression coefficients are the same across different quantiles, composite quantile regression can be used to combine the strength across multiple quantile regression models. For the composite quantile regression, bootstrap method is examined for statistical inference including the selection of the number of quantiles and confidence intervals for the regression coefficients. Feasibility of the bootstrap method is demonstrated through a simulation study.

A study on the properties of sensitivity analysis in principal component regression and latent root regression (주성분회귀와 고유값회귀에 대한 감도분석의 성질에 대한 연구)

  • Shin, Jae-Kyoung;Chang, Duk-Joon
    • Journal of the Korean Data and Information Science Society
    • /
    • v.20 no.2
    • /
    • pp.321-328
    • /
    • 2009
  • In regression analysis, the ordinary least squares estimates of regression coefficients become poor, when the correlations among predictor variables are high. This phenomenon, which is called multicollinearity, causes serious problems in actual data analysis. To overcome this multicollinearity, many methods have been proposed. Ridge regression, shrinkage estimators and methods based on principal component analysis (PCA) such as principal component regression (PCR) and latent root regression (LRR). In the last decade, many statisticians discussed sensitivity analysis (SA) in ordinary multiple regression and same topic in PCR, LRR and logistic principal component regression (LPCR). In those methods PCA plays important role. Many statisticians discussed SA in PCA and related multivariate methods. We introduce the method of PCR and LRR. We also introduce the methods of SA in PCR and LRR, and discuss the properties of SA in PCR and LRR.

  • PDF

Fast robust variable selection using VIF regression in large datasets (대형 데이터에서 VIF회귀를 이용한 신속 강건 변수선택법)

  • Seo, Han Son
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.4
    • /
    • pp.463-473
    • /
    • 2018
  • Variable selection algorithms for linear regression models of large data are considered. Many algorithms are proposed focusing on the speed and the robustness of algorithms. Among them variance inflation factor (VIF) regression is fast and accurate due to the use of a streamwise regression approach. But a VIF regression is susceptible to outliers because it estimates a model by a least-square method. A robust criterion using a weighted estimator has been proposed for the robustness of algorithm; in addition, a robust VIF regression has also been proposed for the same purpose. In this article a fast and robust variable selection method is suggested via a VIF regression with detecting and removing potential outliers. A simulation study and an analysis of a dataset are conducted to compare the suggested method with other methods.

Identifying Influencing Factors of Soldiers' Depression using Multiple Regression and CART (다중회귀와 회귀나무를 활용한 군인 우울 요인 분석)

  • Woo, Chung Hee;PARK, JU YOUNG;Lee, Yujeong
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2013.05a
    • /
    • pp.171-172
    • /
    • 2013
  • 우울은 군대 내 발생되는 극단적인 사고 중 하나인 자살의 주요 원인으로 제시되어 왔다. 본 연구는 군인들의 우울, 불안 및 자아존중감의 수준을 파악하고, 우울의 영향요인을 탐색하고 이들을 예측하는데 주로 사용해 왔던 다중회귀분석 방법과 효과적인 의사결정방법으로 알려진 회귀나무모형의 효과성을 비교해보고자 하였다. 방법: 횡단적 조사연구이며, 우울측정에는 CES-D, 불안측정은 SAI, 자아존중감은 Rosenberg(1965)의 도구를 사용하였다. 연구대상자는 강원도 전방 부대 근무 중인 군인이며, 534부가 회수되었다. SPSS/WIN 18.0을 이용하여 위계적 다중회귀분석과 회귀나무모형을 실시하였다. 결과: 대상자들의 우울, 불안 및 자아존중감의 정도는 각각 $10.7({\pm}9.8)$, $38.5({\pm}10.2)$$31.7({\pm}5.2)$이었다. 대상자의 23.6%(126명)가 경한 우울을 나타내었다. 다중회귀분석에 의한 우울 영향요인은 불안, 자아존중감과 복무기간이었으며, 우울에 대하여 62.0%의 설명력을 가지고 있었다. 또한 회귀나무모형에서는 높은 불안과 불안이 다소 낮더라도 전역 후 진로가 불확실한 집단이 우울 위험군일 것으로 예측되었다. 결론: 본 연구 대상자들의 우울의 주요 영향요인은 불안으로 나타났다. 군대 내에서 적용할 수 있는 불안 조절 방법 개발이 필요할 것으로 보인다. 또한 일부 요인에서 차이가 있어, 반복 연구가 필요하지만, 주요 변인인 불안을 예측했다는 점에서 보면 다중회귀분석과 회귀나무모형은 군인들의 우울을 예측에 유용한 방법으로 보인다.

  • PDF

Shrinkage Structure of Ridge Partial Least Squares Regression

  • Kim, Jong-Duk
    • Journal of the Korean Data and Information Science Society
    • /
    • v.18 no.2
    • /
    • pp.327-344
    • /
    • 2007
  • Ridge partial least squares regression (RPLS) is a regression method which can be obtained by combining ridge regression and partial least squares regression and is intended to provide better predictive ability and less sensitive to overfitting. In this paper, explicit expressions for the shrinkage factor of RPLS are developed. The structure of the shrinkage factor is explored and compared with those of other biased regression methods, such as ridge regression, principal component regression, ridge principal component regression, and partial least squares regression using a near infrared data set.

  • PDF

Prediction of Daily Maximum Ozone Concentration using Multi-Regression (중회귀 모형을 이용한 일최고 오존 농도 예측성 검토에 관한 연구)

  • 김영은;조석연
    • Proceedings of the Korea Air Pollution Research Association Conference
    • /
    • 1999.10a
    • /
    • pp.203-204
    • /
    • 1999
  • 대기질의 통계예측모형은 주로 오존 농도 예측에 사용된다. 통계예측 방법은 중회귀 모형, 신경망 모형, Fuzzy 논리 모형 등이 있다. 중회귀 모형은 종래 통계분석 방법으로 예전부터 많이 사용되고 있는 방법인 반면에 신경망 모형과 Fuzzy 논리 모형은 최근에 개발되어 적용가능성을 검토 중인 방법이다. 국내외 연구결과에 의하면 각 방법에 의한 고농도 오존 예측성은 크게 다르지 않았다. 국내에서는 중회귀 모형과 신경망 모형이 적용되었는데, 상관계수는 0.6-0.7저도로 보고되었다.(중략)

  • PDF

Comparison of estimation methods for expectile regression (평률 회귀분석을 위한 추정 방법의 비교)

  • Kim, Jong Min;Kang, Kee-Hoon
    • The Korean Journal of Applied Statistics
    • /
    • v.31 no.3
    • /
    • pp.343-352
    • /
    • 2018
  • We can use quantile regression and expectile regression analysis to estimate trends in extreme regions as well as the average trends of response variables in given explanatory variables. In this paper, we compare the performance between the parametric and nonparametric methods for expectile regression. We introduce each estimation method and analyze through various simulations and the application to real data. The nonparametric model showed better results if the model is complex and difficult to deduce the relationship between variables. The use of nonparametric methods can be recommended in terms of the difficulty of assuming a parametric model in expectile regression.