• 제목/요약/키워드: Quantile regression

검색결과 200건 처리시간 0.032초

다변량 분위수 회귀나무 모형에 대한 연구 (Multivariate quantile regression tree)

  • 김재오;조형준;방성완
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.533-545
    • /
    • 2017
  • 분위수 회귀모형은 반응변수의 조건부 분포에 대하여 포괄적이고 유용한 통계적 정보를 제공한다. 그러나 많은 실제 자료는 설명변수와 반응변수가 비선형의 관계를 갖고 있어 전통적인 선형 분위수 회귀모형은 왜곡되고 잘못된 결과를 초래할 수 있다. 또한 자료의 복잡성이 증가하여 반응변수가 여러개인 다변량 자료의 분석에 대한 보다 정확한 예측과 더불어 풍부한 해석에 대한 요구가 증가하고 있다. 이러한 이유로 본 연구에서는 다변량 분위수 회귀나무 모형을 제안하였다. 본 연구에서는 기존의 다변량 회귀나무 모형의 분할변수 선택 알고리즘의 문제점을 지적하고 향상된 분할변수 선택 알고리즘을 제안하였다. 제안한 알고리즘은 합리적인 계산시간으로 적용 가능하며 분할변수 선택에서 편향 발생의 문제를 갖지 않는 동시에 기존 방법보다 더 정확하게 분할변수를 선택할 수 있있다. 본 연구에서는 모의실험과 실증 예제를 통해 제안한 방법의 우수한 성능과 유용성을 확인하였다.

Support Vector Quantile Regression Using Asymmetric e-Insensitive Loss Function

  • Shim, Joo-Yong;Seok, Kyung-Ha;Hwang, Chang-Ha;Cho, Dae-Hyeon
    • Communications for Statistical Applications and Methods
    • /
    • 제18권2호
    • /
    • pp.165-170
    • /
    • 2011
  • Support vector quantile regression(SVQR) is capable of providing a good description of the linear and nonlinear relationships among random variables. In this paper we propose a sparse SVQR to overcome a limitation of SVQR, nonsparsity. The asymmetric e-insensitive loss function is used to efficiently provide sparsity. The experimental results are presented to illustrate the performance of the proposed method by comparing it with nonsparse SVQR.

소지역 추정을 위한 M-분위수 커널회귀 (M-quantile kernel regression for small area estimation)

  • 심주용;황창하
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권4호
    • /
    • pp.749-756
    • /
    • 2012
  • 소지역 추정을 위해 널리 사용되고 있는 방법 중 하나는 선형혼합효과모형이다. 그러나 종속변수와 독립변수 사이의 관계가 비선형일 때 이 모형은 소지역 관련 모수에 대해 편의된 추정값을 초래한다. 본 논문에서는 M-분위수 커널회귀를 사용하여 소지역의 평균을 추정하는 방법을 제안한다. 그리고 모의실험을 통하여 서포트벡터분위수회귀와 성능을 비교함으로써 제안된 방법의 우수성을 보인다.

Support vector quantile regression ensemble with bagging

  • Shim, Jooyong;Hwang, Changha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권3호
    • /
    • pp.677-684
    • /
    • 2014
  • Support vector quantile regression (SVQR) is capable of providing more complete description of the linear and nonlinear relationships among random variables. To improve the estimation performance of SVQR we propose to use SVQR ensemble with bagging (bootstrap aggregating), in which SVQRs are trained independently using the training data sets sampled randomly via a bootstrap method. Then, they are aggregated to obtain the estimator of the quantile regression function using the penalized objective function composed of check functions. Experimental results are then presented, which illustrate the performance of SVQR ensemble with bagging.

Quantile-regression-based 지역빈도해석 기법 (Quantile Regression-based regional frequency analysis techniques)

  • 강수빈;오랑치맥 솜야;문장원;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.404-404
    • /
    • 2022
  • 효율적인 수자원 관리를 위해 빈도해석을 통한 수문 자료의 통계적 특성을 고려하여 정확한 확률강수량을 산정해야 한다. 지점빈도해석은 지점 자료만을 이용하여 확률강수량을 산정하기 때문에 정확도를 높이기 위해서는 자료 확충이 필요하지만, 지점별로 활용할 수 있는 자료가 제한적이며 지점마다 변동성이 크다. 지역빈도해석은 수문기상학적으로 동질한 주변 지점들의 자료를 모두 포함해서 빈도해석을 수행함으로써 지역에 대한 통합 결과를 제시하고 자료에 대한 신뢰성 확보가 가능하다. 일반적으로 빈도해석은 자료에 적합한 확률분포 기반으로 수행되지만 확률분포 선정과정에 따라 결과는 상이하다. 본 연구에서는 지역빈도해석에서 확률강수량 산정방법으로 Quantile Regression(QR)을 적용하였다. QR 기반의 빈도해석은 확률분포 아니라 자료 자체로 확률강수량을 산정하여 기존의 확률분포 기반의 빈도해석에서 발생했던 불확실성을 개선하였다. 또는, 확률강수량의 시간에 따른 변동성도 고려되어 바정상성 빈도해석도 가능하다. 최종적으로 본 연구에서 소개된 지역빈도해석 결과와 기존의 지역빈도해석 결과 비교 검증하였다.

  • PDF

분위회귀분석법을 이용한 노인 고혈압 환자의 자가간호에 따른 분위별 영향 요인 (Predictors of Self-care Behaviors among Elderly with Hypertension using Quantile Regression Method)

  • 이은주;박은아
    • 성인간호학회지
    • /
    • 제27권3호
    • /
    • pp.273-282
    • /
    • 2015
  • Purpose: The objective of this study was to identify the predictors of self-care behaviors among elderly patients with hypertension using quantile regression method. Methods: A total of 253 elderly patients diagnosed with hypertension was recruited via 3 different medical clinics for the study. The quantile regression and a liner regression was conducted using Stata 12.0 program by analyzing predictors of self-care behaviors. Results: In the ordinary least square, self-efficacy, period of disease, and education level explained 42% of the variance in self-care activities. In the quantile regression, affecting predictors of self-care behaviors were self-efficacy for all quantiles, the period of disease for from 60% quantile to 90% quantile, education level for 20%, 30%, and 50% quantiles, economic status for 10%, 50%, and 60% quantiles, age for 10%, 70% quantiles, fatigue for 10% quantile, knowledge about hypertension for 10% and 20% quantiles, and depression for 30% and 40% quantiles. Conclusion: The affecting predictors of self-care behaviors among elderly with hypertension were different from the level of self-care behaviors. These results indicated the significance in assessing predictors according to the level of self-care behaviors when clinical nurses examine the patients' health behaviors and plan any intervention strategies. Specially, education level and knowledge about hypertension were the significant predictors of self-care activities for low quantiles. Clinical nurses may promote self-care activities of the given population though health education programs.

베이즈 정보 기준을 활용한 분할-정복 벌점화 분위수 회귀 (Model selection via Bayesian information criterion for divide-and-conquer penalized quantile regression)

  • 강종경;한석원;방성완
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.217-227
    • /
    • 2022
  • 분위수 회귀 모형은 변수에 숨겨진 복잡한 정보를 살펴보기 위한 효율적인 도구를 제공하는 장점을 바탕으로 많은 분야에서 널리 사용되고 있다. 그러나 현대의 대용량-고차원 데이터는 계산 시간 및 저장공간의 제한으로 인해 분위수 회귀 모형의 추정을 매우 어렵게 만든다. 분할-정복은 전체 데이터를 계산이 용이한 여러개의 부분집합으로 나눈 다음 각 분할에서의 요약 통계량만을 이용하여 전체 데이터의 추정량을 재구성하는 기법이다. 본 연구에서는 분할-정복 기법을 벌점화 분위수 회귀에 적용하고 베이즈 정보기준을 활용하여 변수를 선택하는 방법에 관하여 연구하였다. 제안 방법은 분할 수를 적절하게 선택하였을 때, 전체 데이터로 계산한 일반적인 분위수 회귀 추정량만큼 변수 선택의 측면에서 일관된 결과를 제공하면서 계산 속도의 측면에서 효율적이다. 이러한 제안된 방법의 장점은 시뮬레이션 데이터 및 실제 데이터 분석을 통해 확인하였다.

Bayesian quantile regression analysis of Korean Jeonse deposit

  • Nam, Eun Jung;Lee, Eun Kyung;Oh, Man-Suk
    • Communications for Statistical Applications and Methods
    • /
    • 제25권5호
    • /
    • pp.489-499
    • /
    • 2018
  • Jeonse is a unique property rental system in Korea in which a tenant pays a part of the price of a leased property as a fixed amount security deposit and gets back the entire deposit when the tenant moves out at the end of the tenancy. Jeonse deposit is very important in the Korean real estate market since it is directly related to the residential property sales price and it is a key indicator to predict future real estate market trend. Jeonse deposit data shows a skewed and heteroscedastic distribution and the commonly used mean regression model may be inappropriate for the analysis of Jeonse deposit data. In this paper, we apply a Bayesian quantile regression model to analyze Jeonse deposit data, which is non-parametric and does not require any distributional assumptions. Analysis results show that the quantile regression coefficients of most explanatory variables change dramatically for different quantiles. The regression coefficients of some variables have different signs for different quantiles, implying that even the same variable may affect the Jeonse deposit in the opposite direction depending on the amount of deposit.

Robust extreme quantile estimation for Pareto-type tails through an exponential regression model

  • Richard Minkah;Tertius de Wet;Abhik Ghosh;Haitham M. Yousof
    • Communications for Statistical Applications and Methods
    • /
    • 제30권6호
    • /
    • pp.531-550
    • /
    • 2023
  • The estimation of extreme quantiles is one of the main objectives of statistics of extremes (which deals with the estimation of rare events). In this paper, a robust estimator of extreme quantile of a heavy-tailed distribution is considered. The estimator is obtained through the minimum density power divergence criterion on an exponential regression model. The proposed estimator was compared with two estimators of extreme quantiles in the literature in a simulation study. The results show that the proposed estimator is stable to the choice of the number of top order statistics and show lesser bias and mean square error compared to the existing extreme quantile estimators. Practical application of the proposed estimator is illustrated with data from the pedochemical and insurance industries.

Nonlinear Regression Quantile Estimators

  • Park, Seung-Hoe;Kim, Hae kyung;Park, Kyung-Ok
    • Journal of the Korean Statistical Society
    • /
    • 제30권4호
    • /
    • pp.551-561
    • /
    • 2001
  • This paper deals with the asymptotic properties for statistical inferences of the parameters in nonlinear regression models. As an optimal criterion for robust estimators of the regression parameters, the regression quantile method is proposed. This paper defines the regression quintile estimators in the nonlinear models and provides simple and practical sufficient conditions for the asymptotic normality of the proposed estimators when the parameter space is compact. The efficiency of the proposed estimator is especially well compared with least squares estimator, least absolute deviation estimator under asymmetric error distribution.

  • PDF