• 제목/요약/키워드: non-parametric regression model

검색결과 38건 처리시간 0.02초

ASYMPTOTIC NORMALITY OF ESTIMATOR IN NON-PARAMETRIC MODEL UNDER CENSORED SAMPLES

  • Niu, Si-Li;Li, Qlan-Ru
    • 대한수학회지
    • /
    • 제44권3호
    • /
    • pp.525-539
    • /
    • 2007
  • Consider the regression model $Y_i=g(x_i)+e_i\;for\;i=1,\;2,\;{\ldots},\;n$, where: (1) $x_i$ are fixed design points, (2) $e_i$ are independent random errors with mean zero, (3) g($\cdot$) is unknown regression function defined on [0, 1]. Under $Y_i$ are censored randomly, we discuss the asymptotic normality of the weighted kernel estimators of g when the censored distribution function is known or unknown.

단독주택가격 추정을 위한 기계학습 모형의 응용 (Application of machine learning models for estimating house price)

  • 이창로;박기호
    • 대한지리학회지
    • /
    • 제51권2호
    • /
    • pp.219-233
    • /
    • 2016
  • 수리 또는 계량적 모형을 사용하는 사회과학연구에서 분석의 초점은 종속변수와 설명변수의 관계를 밝히는 것, 즉 설명 중심의 모형(explanatory modeling)이 지금까지 주류를 이루었다. 반면 예측(prediction) 능력 제고에 초점을 맞춘 분석은 드물었다. 본 연구에서는 이론 및 가설을 검증하거나 변수 간의 관계를 밝히는 설명 중심의 모형이 아니라 신규 관찰치에 대한 예측 오차를 줄이는, 예측 중심의 비모수 모형(non-parametric model)을 검토하였다. 서울시 강남구를 사례지역으로 선정한 후, 2011년부터 2014년까지 신고된 단독주택 실거래가를 기초자료로 하여 주택가격을 추정하였다. 적용한 비모수 모형은 기계학습 분야에서 제시된 일반가산모형(generalized additive model), 랜덤 포리스트, MARS(multivariate adaptive regression splines), SVM(support vector machines) 등이며 비교적 최근에 개발된 MARS나 SVM의 예측력이 뛰어남을 확인할 수 있었다. 마지막으로 이러한 비모수 모형에 공간적 자기상관성을 추가적으로 반영한 결과, 모형의 가격 예측력이 보다 개선되었음을 알 수 있었다. 본 연구를 계기로 그간 모수 모형에 집중되었던 부동산 가격추정 방법론이 비모수 모형으로 확대 및 다양화되기를 기대한다.

  • PDF

Note on response dimension reduction for multivariate regression

  • Yoo, Jae Keun
    • Communications for Statistical Applications and Methods
    • /
    • 제26권5호
    • /
    • pp.519-526
    • /
    • 2019
  • Response dimension reduction in a sufficient dimension reduction (SDR) context has been widely ignored until Yoo and Cook (Computational Statistics and Data Analysis, 53, 334-343, 2008) founded theories for it and developed an estimation approach. Recent research in SDR shows that a semi-parametric approach can outperform conventional non-parametric SDR methods. Yoo (Statistics: A Journal of Theoretical and Applied Statistics, 52, 409-425, 2018) developed a semi-parametric approach for response reduction in Yoo and Cook (2008) context, and Yoo (Journal of the Korean Statistical Society, 2019) completes the semi-parametric approach by proposing an unstructured method. This paper theoretically discusses and provides insightful remarks on three versions of semi-parametric approaches that can be useful for statistical practitioners. It is also possible to avoid numerical instability by presenting the results for an orthogonal transformation of the response variables.

The Rank Transform Method in Nonparametric Fuzzy Regression Model

  • Choi, Seung-Hoe;Lee, Myung-Sook
    • Journal of the Korean Data and Information Science Society
    • /
    • 제15권3호
    • /
    • pp.617-624
    • /
    • 2004
  • In this article the fuzzy number rank and the fuzzy rank transformation method are introduced in order to analyse the non-parametric fuzzy regression model which cannot be described as a specific functional form such as the crisp data and fuzzy data as a independent and dependent variables respectively. The effectiveness of fuzzy rank transformation methods is compared with other methods through the numerical examples.

  • PDF

상관계수 가중법을 이용한 커널회귀 방법 (Kernel Regression with Correlation Coefficient Weighted Distance)

  • 신호철;박문규;이재용;류석진
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년 학술대회 논문집 정보 및 제어부문
    • /
    • pp.588-590
    • /
    • 2006
  • Recently, many on-line approaches to instrument channel surveillance (drift monitoring and fault detection) have been reported worldwide. On-line monitoring (OLM) method evaluates instrument channel performance by assessing its consistency with other plant indications through parametric or non-parametric models. The heart of an OLM system is the model giving an estimate of the true process parameter value against individual measurements. This model gives process parameter estimate calculated as a function of other plant measurements which can be used to identify small sensor drifts that would require the sensor to be manually calibrated or replaced. This paper describes an improvement of auto-associative kernel regression by introducing a correlation coefficient weighting on kernel distances. The prediction performance of the developed method is compared with conventional auto-associative kernel regression.

  • PDF

Finite-Sample, Small-Dispersion Asymptotic Optimality of the Non-Linear Least Squares Estimator

  • So, Beong-Soo
    • Journal of the Korean Statistical Society
    • /
    • 제24권2호
    • /
    • pp.303-312
    • /
    • 1995
  • We consider the following type of general semi-parametric non-linear regression model : $y_i = f_i(\theta) + \epsilon_i, i=1, \cdots, n$ where ${f_i(\cdot)}$ represents the set of non-linear functions of the unknown parameter vector $\theta' = (\theta_1, \cdots, \theta_p)$ and ${\epsilon_i}$ represents the set of measurement errors with unknown distribution. Under suitable finite-sample, small-dispersion asymptotic framework, we derive a general lower bound for the asymptotic mean squared error (AMSE) matrix of the Gauss-consistent estimator of $\theta$. We then prove the fundamental result that the general non-linear least squares estimator (NLSE) is an optimal estimator within the class of all regular Gauss-consistent estimators irrespective of the type of the distribution of the measurement errors.

  • PDF

Efficient Prediction in the Semi-parametric Non-linear Mixed effect Model

  • So, Beong-Soo
    • Journal of the Korean Statistical Society
    • /
    • 제28권2호
    • /
    • pp.225-234
    • /
    • 1999
  • We consider the following semi-parametric non-linear mixed effect regression model : y\ulcorner=f($\chi$\ulcorner;$\beta$)+$\sigma$$\mu$($\chi$\ulcorner)+$\sigma$$\varepsilon$\ulcorner,i=1,…,n,y*=f($\chi$;$\beta$)+$\sigma$$\mu$($\chi$) where y'=(y\ulcorner,…,y\ulcorner) is a vector of n observations, y* is an unobserved new random variable of interest, f($\chi$;$\beta$) represents fixed effect of known functional form containing unknown parameter vector $\beta$\ulcorner=($\beta$$_1$,…,$\beta$\ulcorner), $\mu$($\chi$) is a random function of mean zero and the known covariance function r(.,.), $\varepsilon$'=($\varepsilon$$_1$,…,$\varepsilon$\ulcorner) is the set of uncorrelated measurement errors with zero mean and unit variance and $\sigma$ is an unknown dispersion(scale) parameter. On the basis of finite-sample, small-dispersion asymptotic framework, we derive an absolute lower bound for the asymptotic mean squared errors of prediction(AMSEP) of the regular-consistent non-linear predictors of the new random variable of interest y*. Then we construct an optimal predictor of y* which attains the lower bound irrespective of types of distributions of random effect $\mu$(.) and measurement errors $\varepsilon$.

  • PDF

비모수 검정을 활용한 자동차 기업의 상대적 경영 효율성 평가 (The Evaluation of Relative Management Efficiency of Automobile Companies Using Non-parametric Approach)

  • 하귀룡;최석봉
    • 지식경영연구
    • /
    • 제15권2호
    • /
    • pp.147-164
    • /
    • 2014
  • This paper investigated the efficiency of automobile firms by using several non-parametric approaches. First, using Data Envelopment Analysis (DEA), the paper has investigated the critical factors that determine the relative efficiency of management performance in automobile companies. Second, we examined how the firm size impact on the difference of this efficiency by using Kruskl-Wallis Test. Third, by using Mann-whitney test, we also investigated the difference of the efficiency accoss existence of technological innovation activity. Finally, the paper explored the relationship between technological innovation and management efficiency by using logistic regression model. The findings of this study provided practical information for inefficient automobile firms to find benchmarking firms and strategic position to improve their efficiency. The result also provided theoretical and methodological implications for those who explore factors affecting management efficiencies. Future research directions with the limitation of the study are discussed.

  • PDF

선형 응답률 모형에서 초모집단 모형의 비모수적 함수 추정을 이용한 무응답 편향 보정 추정 (Bias corrected non-response estimation using nonparametric function estimation of super population model)

  • 심주용;신기일
    • 응용통계연구
    • /
    • 제34권6호
    • /
    • pp.923-936
    • /
    • 2021
  • 표본조사에서는 다수의 무응답이 발생하며 이를 적절히 처리하는 다양한 방법이 개발되었다. 특히 무응답이 관심변수에 영향을 받고 이로 인해 발생한 편향은 추정의 정확성을 크게 떨어뜨리며 무응답 처리를 어렵게 한다. 최근 Chung과 Shin (2017, 2020)은 알려진 모수적 초모집단 모형과 응답률 모형을 이용하여 추정의 정확성을 향상한 추정량을 제안하였다. 본 연구에서는 초모집단 모형의 형태를 일반화하여 비모수적 함수 형태를 설정한 후 이를 기반으로 얻어진 편향을 적절히 처리한 편향 보정 평균추정량을 제안하였다. 모의실험을 통해 본 연구에서 제안한 방법의 우수성을 확인하였다.

수위-유량곡선을 위한 비매개 변수적 Kernel 회귀모형 (Nonparametic Kernel Regression model for Rating curve)

  • 문영일;조성진;전시영
    • 한국수자원학회논문집
    • /
    • 제36권6호
    • /
    • pp.1025-1033
    • /
    • 2003
  • 수공구조물의 설계를 비롯하여, 수자원 분야의 기술적 설계의 기초는 수문자료의 처리와 분석에 중심을 두고 있다고 할 수 있다. 수문 자료의 분석방법 중 가장 보편적이면서도 중요한 방법은 자료들의 관계를 도식적으로 규명하는 회귀분석이다. 수위-유량 관계곡선과 같은 수문 자료에 대한 기존의 매개변수적 회귀모형이 갖는 단점은 자료의 특성에 따라, 복수의 회귀식이 산정되거나 동일자료에 대해서도 서로 다른 회귀식이 산정됨으로써 신뢰할 수 있는 회귀곡선을 만들기가 어렵다는 것이다. 이에 비해 주어진 자료에 의해 도출되는 kernel 회귀모형은 자료의 특성과 경향성을 적절히 표현해 줄 수 있는 방법이다. 본 논문에서는 비매개변수적 방법인 kernel 회귀모형을 분석하고, kernel 회귀모형의 중요 인자인 bandwidth의 선택 방법에 따른 kernel 회귀모형의 특성에 대해 비교 분석하였다.