• 제목/요약/키워드: Regression estimator

검색결과 313건 처리시간 0.023초

On a Transformation Technique for Nonparametric Regression

  • Kim, Woochul;Park, Byeong U.
    • Journal of the Korean Statistical Society
    • /
    • 제25권2호
    • /
    • pp.217-233
    • /
    • 1996
  • This paper gives a rigorous proof of an asymptotic result about bias and variance for a transformation-based nonparametric regression estimator proposed by Park et al (1995).

  • PDF

편향 보정 비형태추정량에 관한 연구 (A bias adjusted ratio-type estimator)

  • 오정택;신기일
    • 응용통계연구
    • /
    • 제31권3호
    • /
    • pp.397-408
    • /
    • 2018
  • 표본조사에서는 정확한 모수 추정을 위한 다양한 방법이 개발되었으며 이 중에서 보조정보를 이용한 비추정량 또는 회귀추정량이 흔히 사용된다. 최근 많은 연구가 진행되고 있는 비형태추정량(ratio type estimator)은 비추정량의 단점을 보완하여 추정의 정확성을 향상시키는 것으로 알려져 있다. 그러나 비형태추정량은 편향이 있는 것으로 알려져 있어 이를 해결하기 위한 연구가 활발히 진행되고 있다. 이에 본 연구에서는 편향을 제거하기 위해 비형태추정량에 새로운 모수를 추가한 일반화 비형태추정량(generalized ratio-type estimator)을 제안하였다. 또한 사업체조사와 같이 등분산성을 만족하지 않는 자료에서 추정의 정확성 향상을 위해 모형의 오차에 포함된 분산 모수를 추정하고 제안된 추정량을 적용하는 방법을 제안하였다. 또한 모의실험을 통해 일반화 비형태추정량은 기존의 비추정량에 비해 매우 우수한 결과를 주는 것을 확인하였다.

Jensen's Alpha Estimation Models in Capital Asset Pricing Model

  • Phuoc, Le Tan
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제5권3호
    • /
    • pp.19-29
    • /
    • 2018
  • This research examined the alternatives of Jensen's alpha (α) estimation models in the Capital Asset Pricing Model, discussed by Treynor (1961), Sharpe (1964), and Lintner (1965), using the robust maximum likelihood type m-estimator (MM estimator) and Bayes estimator with conjugate prior. According to finance literature and practices, alpha has often been estimated using ordinary least square (OLS) regression method and monthly return data set. A sample of 50 securities is randomly selected from the list of the S&P 500 index. Their daily and monthly returns were collected over a period of the last five years. This research showed that the robust MM estimator performed well better than the OLS and Bayes estimators in terms of efficiency. The Bayes estimator did not perform better than the OLS estimator as expected. Interestingly, we also found that daily return data set would give more accurate alpha estimation than monthly return data set in all three MM, OLS, and Bayes estimators. We also proposed an alternative market efficiency test with the hypothesis testing Ho: α = 0 and was able to prove the S&P 500 index is efficient, but not perfect. More important, those findings above are checked with and validated by Jackknife resampling results.

다변량 선형회귀모형의 벌점화 최소거리추정에 관한 연구 (Penalized least distance estimator in the multivariate regression model)

  • 신정민;강종경;방성완
    • 응용통계연구
    • /
    • 제37권1호
    • /
    • pp.1-12
    • /
    • 2024
  • 동일한 설명변수 집합에 여러 개의 반응 변수들이 종속되어 있는 경우를 많은 실제 자료에서 볼 수 있다. 특히, 여러 개의 반응변수가 서로 상관관계를 가지고 있으면 각각의 반응변수에 대한 개별적인 분석보다는 반응변수들 사이의 상관관계를 고려한 동시 추정(simultaneous estimation)이 매우 효과적이다. 이러한 다변량 회귀분석에서 최소거리추정량(least distance estimator; LDE)은 반응변수들간의 상관관계를 모형 적합 과정에 반영하여 다차원 유클리드 공간에서 각 훈련 개체와 추정값 사이의 거리를 최소화하도록 회귀계수들을 동시에 추정한다. 뿐만 아니라 최소거리추정량은 이상치에 대한 강건성을 제공한다. 본 논문에서는 다변량 선형 회귀분석에서의 최소거리추정법에 대해 살펴보고, 나아가 효율적인 변수선택을 위한 벌점화 최소거리추정량을 제시하였다. 본 연구에서 제안하는 adaptive group LASSO 벌점항을 적용한 AGLDE 기법은 반응변수들간의 상관관계를 모형 적합에 반영함과 동시에 설명변수의 중요도에 따라 효율적으로 변수선택을 수행할 수 있다. 제안 방법의 유용성은 모의실험과 실제 자료 분석을 통해 확인하였다.

표본조사에서 일반회귀 추정량의 활용 (General Regression Estimators in Survey Sampling)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제5권2호
    • /
    • pp.49-70
    • /
    • 2004
  • 표본조사에서 사용 가능한 보조변수가 있는 경우에 추정의 효율을 높이기 위하여 보조변수를 활용하는 방법이 다각적으로 개발되어 왔다. 이 논문은 보조변수를 효과적으로 이용하는 방법 중의 하나인 일반회귀추정량에 대한 개괄적인 고찰이다. 일반회귀추정량의 출현부터 분산추정법의 제안까지 이론전개 과정을 살펴보았으며, 보정추정량 및 QR추정량과의 관련성을 통하여 일반회귀추정량의 성질을 알아보았다. 특히 분산추정에서 통상적인 설계기반 분산추정량이 가지는 조건부 성질의 약점을 보완하기 위하여 가중잔차기법을 사용하는 과정을 살펴보았다. 층화표집이나 집략표집과 같은 복합설계에서 활용할 수 있는 일반회귀추정량의 형태를 소개하였고, 마지막으로 일반회귀추정량의 장단점, 그리고 향후 이론적인 발전방향 및 실용적인 발전방향을 언급하였다.

  • PDF

Theil방법을 이용한 퍼지회귀모형 (Fuzzy Theil regression Model)

  • 윤진희;이우주;최승회
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.366-370
    • /
    • 2013
  • 설명변수와 반응변수 사이의 통계적 관계를 설명하기 위해 사용되는 회귀모형을 분석하는 방법을 회귀분석이라 한다. 본 논문에서는 독립변수와 종속변수에 대한 퍼지관계를 표현하는 퍼지회귀모형를 추정하기 위하여 이상치에 민감하지 않은 로버스트한 추정량인 Theil방법을 소개한다. Theil방법은 설명변수와 반응변수의 ${\alpha}$-수준집합의 각 성분으로 구성된 집합에서 선택한 임의의 두 쌍 자료로부터 계산된 변화율의 중위수를 두 변수에 대한 변화량의 추정량으로 간주한다. 본 논문에서 제안된 Theil방법이 최소자승법을 이용하여 추정된 퍼지회귀모형보다 더 정확할 수 있음을 예제를 통하여 확인한다.

농촌유역의 비점원오염부하 산정을 위한 LOADEST 모델의 적용성 평가 (Evaluation of LOADEST Model Applicability for NPS Pollutant loads Estimation from Agricultural Watershed)

  • 신민환;서지연;최용훈;김종건;신동석;이열재;정명숙;임경재;최중대
    • 한국물환경학회지
    • /
    • 제25권2호
    • /
    • pp.212-220
    • /
    • 2009
  • In many studies, the Numeric Integration (NI) method has been widely used to calculate pollutant loads from the watershed because it is easy to apply. However, there have been many needs for more accurate pollutant loads estimation method with the restricted number of water quality samples. However, the ESTIMATOR model does not allow the users to define the regression model to explain the measured flow and water quality relationship, indicating the ESTIMATOR model is not flexible. The LOADEST model allows the user to choose the model type from 11 predefined general forms of regression equations. Annual loads of T-N and T-P with the LOADEST model were 0.70 times and 0.84 times of those by NI method, respectively. The coefficient of determination ($R^2$) of the LOADEST regression for the T-N and T-P were 0.92 and 0.72, respectively. This indicates that the load estimation regression model with the LOADEST for the study watershed explains the relationship between the observed flow and water quality data well reasonably well. Based on these findings, we suggest that the LOADEST model estimated regression equation could be used to estimate pollutant loads using the measured flow data for the study watershed.

Semi-supervised regression based on support vector machine

  • Seok, Kyungha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권2호
    • /
    • pp.447-454
    • /
    • 2014
  • In many practical machine learning and data mining applications, unlabeled training examples are readily available but labeled ones are fairly expensive to obtain. Therefore semi-supervised learning algorithms have attracted much attentions. However, previous research mainly focuses on classication problems. In this paper, a semi-supervised regression method based on support vector regression (SVR) formulation that is proposed. The estimator is easily obtained via the dual formulation of the optimization problem. The experimental results with simulated and real data suggest superior performance of the our proposed method compared with standard SVR.

로버스트주성분회귀에서 최적의 주성분선정을 위한 기준 (A Criterion for the Selection of Principal Components in the Robust Principal Component Regression)

  • 김부용
    • Communications for Statistical Applications and Methods
    • /
    • 제18권6호
    • /
    • pp.761-770
    • /
    • 2011
  • 회귀모형에 연관성이 높은 설명변수들이 포함되면 다중공선성의 문제가 야기되며, 동시에 자료에 회귀 이상점들이 포함되면 최소자승추정량에 바탕을 둔 제반 통계적 추론은 심각한 결함을 갖게 된다. 이러한 현상들은 데이터마이닝 분야에서 많이 볼 수 있는데, 본 논문에서는 두 가지 문제를 동시에 해결하기 위한 방안으로서 로버스트주성분회귀를 제안하였다. 특히 최적의 주성분을 선정하기 위한 새로운 기준을 개발하였는데, 설명변수들의 표본공분산 대신에 MVE-추정량을 기반으로 하였으며, 고유치가 아니라 상태지수의 크기에 바탕을 둔 선정기준을 제안하였다. 그리고 주성분모형에서의 추정을 위하여 회귀이상점에 대해 로버스트한 LTS-추정을 도입하였다. 제안된 선정기준이 기존의 기준들보다 다중공선성과 이상점이 유발하는 문제들을 잘 해결할 수 있음을 모의실험을 통하여 확인하였다.

CONFLICT AMONG THE SHRINKAGE ESTIMATORS INDUCED BY W, LR AND LM TESTS UNDER A STUDENT'S t REGRESSION MODEL

  • Kibria, B.M.-Golam
    • Journal of the Korean Statistical Society
    • /
    • 제33권4호
    • /
    • pp.411-433
    • /
    • 2004
  • The shrinkage preliminary test ridge regression estimators (SPTRRE) based on Wald (W), Likelihood Ratio (LR) and Lagrangian Multiplier (LM) tests for estimating the regression parameters of the multiple linear regression model with multivariate Student's t error distribution are considered in this paper. The quadratic biases and risks of the proposed estimators are compared under both null and alternative hypotheses. It is observed that there is conflict among the three estimators with respect to their risks because of certain inequalities that exist among the test statistics. In the neighborhood of the restriction, the SPTRRE based on LM test has the smallest risk followed by the estimators based on LR and W tests. However, the SPTRRE based on W test performs the best followed by the LR and LM based estimators when the parameters move away from the subspace of the restrictions. Some tables for the maximum and minimum guaranteed efficiency of the proposed estimators have been given, which allow us to determine the optimum level of significance corresponding to the optimum estimator among proposed estimators. It is evident that in the choice of the smallest significance level to yield the best estimator the SPTRRE based on Wald test dominates the other two estimators.