• Title/Summary/Keyword: 선형회귀

Search Result 1,828, Processing Time 0.038 seconds

Autocovariance based estimation in the linear regression model (선형회귀 모형에서 자기공분산 기반 추정)

  • Park, Cheol-Yong
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.5
    • /
    • pp.839-847
    • /
    • 2011
  • In this study, we derive an estimator based on autocovariance for the regression coefficients vector in the multiple linear regression model. This method is suggested by Park (2009), and although this method does not seem to be intuitively attractive, this estimator is unbiased for the regression coefficients vector. When the vectors of exploratory variables satisfy some regularity conditions, under mild conditions which are satisfied when errors are from autoregressive and moving average models, this estimator has asymptotically the same distribution as the least squares estimator and also converges in probability to the regression coefficients vector. Finally we provide a simulation study that the forementioned theoretical results hold for small sample cases.

Projection Pursuit Regression for Binary Responses using Simulated Annealing (모의 담금질을 이용한 이진반응변수 사용추적회귀)

  • 박종선
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.2
    • /
    • pp.321-332
    • /
    • 2001
  • 본 논문에서는 반응변수가 두 가지의 값을 갖는 회귀분석에 적용할 수 있는 사영추적회귀를 고려하였다. 회귀모형에 필요한 설명변수들의 선형결합이 하나이고 연결함수의 형태를 사전에 알지 못한다는 가정하에서 모의담금질 기법을 이용하여 모형에 필요한 선형결합을 찾는 알고리즘을 제시하였다. 이진 반응변수의 경우에는 평활모수의 값에 따라 잔차이탈도함수의 반응표면이 단봉의 형태를 갖지 않는 경우가 있어 비동질적 마코프체인을 이용한 모의담금질 기법을 적용하면 효율적으로 선형결합을 탐색할 수 있다.

  • PDF

유전자 알고리즘을 이용한 비모수 회귀분석

  • 김병도;노상규
    • Proceedings of the Korea Database Society Conference
    • /
    • 1998.09a
    • /
    • pp.584-594
    • /
    • 1998
  • 선형회귀분석은 가장 널리 사용되는 데이터 분석기법이지만 독립변수와 종속변수간의 관계가 선형이라고 가정하기 때문에 문제점을 가지고 있다. 비모수 회귀분석(Nonparametric Regression)은 선형회귀분석의 문제점을 극복할 수 있는 방법으로 변수간의 관계의 형태를 미리 가정하지 않고 데이터에 의해 결정하는 방법이다. 본 연구에서는 유전자 알고리즘을 비모수 회귀분석법 중의 하나인 Regressoin Splines에 적용하였다. 인위적 데이터를 이용한 평가 결과 유전자 알고리즘은 다양한 상황에서 매우 우수한 것으로 나타났다.

  • PDF

깁스표본기법을 이용한 설명변수 선택문제에서 사전분포의 설정-선형회귀모형을 중심으로-

  • 박종선;남궁평;한숙영
    • Communications for Statistical Applications and Methods
    • /
    • v.4 no.2
    • /
    • pp.333-343
    • /
    • 1997
  • 선형회귀분석에서 변수의 선택문제는 최적의 모형을 찾는데 아주 중요한 부분을 차지한다. George와 McCulloch(1993)는 계층적 베이즈 모형과 깁스표본법을 이용하여 선형회귀모형에서 변수를 선택하는 문제를 고려하였다. 이 논문에서는 George와 McCulloch의 모형을 바탕으로 각각의 설명변수가 모형에 포함될 사전확률을 객관적인 기준에 의하여 결정하는 문제를 고려하여 보았다.

  • PDF

Flood risk index optimization using multiple linear regression (다중선형회귀를 이용한 홍수위험지수 최적화)

  • Kim, Myojeong;Kim, Gwangseob
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.283-283
    • /
    • 2016
  • 기후변화의 지역적 영향으로 호우의 강도와 빈도가 증가하고 있는 상황에서 수재해 대응을 위하여 다양한 기술들이 필요하며 특히 홍수 취약성에 대한 분석과 평가가 선행되어야 한다. 본 연구에서는 기존의 PSR(Pressure-State-Response) 모형과 DPSIR(Driving force-Pressure-StateImpact-Response 모형을 다중선형회귀 기법을 사용하여 최적화하였다(Fig. 1). 대상기간은 2008년부터 2013년까지이며, mod 1에서는 연도별로 다중선형회귀기법을 사용하여 최적 가중치를 산정하였고, mod 2에서는 대상기간(2008 ~ 2013) 전체에 대해 다중선형회귀기법을 사용하여 최적 가중치를 산정하는 방법을 적용하였다.

  • PDF

Nonstationary Frequency Analysis at Seoul Using a Power Model (Power 모형을 이용한 서울지점 비정상성 빈도해석)

  • Lee, Gi-Chun;Kim, Gwang-Seob;Choi, Kyu-Hyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.461-461
    • /
    • 2012
  • 본 연구는 서울 지점의 목표연도(2040, 2070, 2100년)별 재현기간에 따른 확률강수량을 산정하기 위해 지속시간 24시간에 대한 연 최대 강수량 자료를 구축하여 비정상성 빈도해석을 수행하였다. 연 최대강수량 자료를 이용해 초기 20년을 기준으로 1년씩 추가한 연 최대 강수량 누적 자료를 구축한 후, 누적 기간별 자료의 평균, 위치매개변수, 축척매개변수를 산정하였다. Gumbel 분포를 이용해 비정상성 빈도해석을 실시하였으며, 각 매개변수의 경우 확률가중모멘트법을 이용해 산정하였다. 산정된 누적평균 강수량과 연도와의 선형회귀분석을 실시한 방법뿐만 아니라 서울 지점이 속한 한강유역의 전 지점들을 이용한 유역의 누적평균 강수량 자료에 대하여 연도와의 Logsitic 회귀분석 및 Power Model을 이용해 서울 지점의 목표연도별 누적평균 강수량을 산정하였고 이를 통해 목표연도별 위치매개변수 및 축척매개변수를 구해 목표연도별 재현기간에 따른 확률강수량을 산정하였다. 선형회귀분석을 이용한 비정상성 빈도해석의 경우, 목표연도가 증가함에 따라 선형적인 증가에 의해 매우 높은 누적평균 강수량이 나타나 확률강수량의 경우에도 정상성임을 가정한 확률강수량에 비해 매우 높게 나타나 타당한 확률강수량이라 함에 한계가 있음을 보였다. 유역의 평균거동과 Logistic 회귀분석을 실시하여 확률강수량을 산정하였을 때에는, 선형 회귀분석에 비해 정상성임을 가정한 확률강수량보다 크게 증가하지 않고 비교적 안정적인 증가가 나타났다. 하지만 Logistic 회귀분석을 이용한 누적평균 강수량 산정에 있어서 목표연도 2040년에 도달하기 전에 미리 수렴하는 형태를 보여 모든 목표연도의 확률강수량이 동일한 값을 가지는 한계가 나타났다. 한강 유역의 평균거동과 Power Model을 이용한 비정상성 빈도해석의 경우, 선형회귀분석 및 Logistic 회귀분석을 통한 비정상성 빈도해석에서 나타난 문제점을 보완할 수 있는 확률강수량이 나타남을 보였다.

  • PDF

Estimation of nonlinear GARCH-M model (비선형 평균 일반화 이분산 자기회귀모형의 추정)

  • Shim, Joo-Yong;Lee, Jang-Taek
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.5
    • /
    • pp.831-839
    • /
    • 2010
  • Least squares support vector machine (LS-SVM) is a kernel trick gaining a lot of popularities in the regression and classification problems. We use LS-SVM to propose a iterative algorithm for a nonlinear generalized autoregressive conditional heteroscedasticity model in the mean (GARCH-M) model to estimate the mean and the conditional volatility of stock market returns. The proposed method combines a weighted LS-SVM for the mean and unweighted LS-SVM for the conditional volatility. In this paper, we show that nonlinear GARCH-M models have a higher performance than the linear GARCH model and the linear GARCH-M model via real data estimations.

Unified Approach to Coefficient of Determination $R^2$ Using Likelihood Distancd (우도거리에 의한 결정계수 $R^2$에의한 통합적 접근)

  • 허명회;이종한;정진환
    • The Korean Journal of Applied Statistics
    • /
    • v.4 no.2
    • /
    • pp.117-127
    • /
    • 1991
  • Coefficient of determination $R^2$ is most frequently used descriptive measure in practical use of linear regression analysis. But there have been controversies on defining this measure in the cases of linear regression without the intercept, weighted linear regression and robust linear regression. Several authors such as Kvalseth(1985) and Willet and Singer(1988) proposed many variations of $R^2$ to meet the situations. However, theire measures are not satisfactory due to the lack of a universal principle. In this study, we propose a unfied approach to defining the coefficient of determination $R^2$ using the concept of likelihood distance. This new measure is in good accordance with typical $R^2$ in linear regression and, moreover, can be applied to nonlinear regression models and generalized linear models such as logit and log-linear models.

  • PDF

Sustained Vowel Modeling using Nonlinear Autoregressive Method based on Least Squares-Support Vector Regression (최소 제곱 서포트 벡터 회귀 기반 비선형 자귀회귀 방법을 이용한 지속 모음 모델링)

  • Jang, Seung-Jin;Kim, Hyo-Min;Park, Young-Choel;Choi, Hong-Shik;Yoon, Young-Ro
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.17 no.7
    • /
    • pp.957-963
    • /
    • 2007
  • In this paper, Nonlinear Autoregressive (NAR) method based on Least Square-Support Vector Regression (LS-SVR) is introduced and tested for nonlinear sustained vowel modeling. In the database of total 43 sustained vowel of Benign Vocal Fold Lesions having aperiodic waveform, this nonlinear synthesizer near perfectly reproduced chaotic sustained vowels, and also conserved the naturalness of sound such as jitter, compared to Linear Predictive Coding does not keep these naturalness. However, the results of some phonation are quite different from the original sounds. These results are assumed that single-band model can not afford to control and decompose the high frequency components. Therefore multi-band model with wavelet filterbank is adopted for substituting single band model. As a results, multi-band model results in improved stability. Finally, nonlinear sustained vowel modeling using NAR based on LS-SVR can successfully reconstruct synthesized sounds nearly similar to original voiced sounds.