• 제목/요약/키워드: multiple quantile regression

검색결과 28건 처리시간 0.022초

비교차 제약식을 이용한 다중 선형 분위수 회귀모형에 관한 비교연구 (A comparison study of multiple linear quantile regression using non-crossing constraints)

  • 방성완;신승준
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.773-786
    • /
    • 2016
  • 분위수 회귀는 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 그러나 여러 개의 분위수 함수를 개별적으로 추정하게 되면 이들이 서로 교차할 가능성이 있으며, 이러한 분위수 함수의 교차(quantile crossing) 현상 분위수의 이론적 기본 특성에 위배된다. 본 논문에서는 다중 비교차 분위수 함수의 추정의 대표적인 방법들의 특성을 적합식과 계산 알고리즘의 측면에서 살펴보고, 모의실험과 실제 자료 분석을 통해 그 성능을 비교하였다.

Restricted support vector quantile regression without crossing

  • Shim, Joo-Yong;Lee, Jang-Taek
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권6호
    • /
    • pp.1319-1325
    • /
    • 2010
  • Quantile regression provides a more complete statistical analysis of the stochastic relationships among random variables. Sometimes quantile functions estimated at different orders can cross each other. We propose a new non-crossing quantile regression method applying support vector median regression to restricted regression quantile, restricted support vector quantile regression. The proposed method provides a satisfying solution to estimating non-crossing quantile functions when multiple quantiles for high dimensional data are needed. We also present the model selection method that employs cross validation techniques for choosing the parameters which aect the performance of the proposed method. One real example and a simulated example are provided to show the usefulness of the proposed method.

Wage Determinants Analysis by Quantile Regression Tree

  • Chang, Young-Jae
    • Communications for Statistical Applications and Methods
    • /
    • 제19권2호
    • /
    • pp.293-301
    • /
    • 2012
  • Quantile regression proposed by Koenker and Bassett (1978) is a statistical technique that estimates conditional quantiles. The advantage of using quantile regression is the robustness in response to large outliers compared to ordinary least squares(OLS) regression. A regression tree approach has been applied to OLS problems to fit flexible models. Loh (2002) proposed the GUIDE algorithm that has a negligible selection bias and relatively low computational cost. Quantile regression can be regarded as an analogue of OLS, therefore it can also be applied to GUIDE regression tree method. Chaudhuri and Loh (2002) proposed a nonparametric quantile regression method that blends key features of piecewise polynomial quantile regression and tree-structured regression based on adaptive recursive partitioning. Lee and Lee (2006) investigated wage determinants in the Korean labor market using the Korean Labor and Income Panel Study(KLIPS). Following Lee and Lee, we fit three kinds of quantile regression tree models to KLIPS data with respect to the quantiles, 0.05, 0.2, 0.5, 0.8, and 0.95. Among the three models, multiple linear piecewise quantile regression model forms the shortest tree structure, while the piecewise constant quantile regression model has a deeper tree structure with more terminal nodes in general. Age, gender, marriage status, and education seem to be the determinants of the wage level throughout the quantiles; in addition, education experience appears as the important determinant of the wage level in the highly paid group.

커널 제약식을 이용한 다중 비교차 분위수 함수의 순차적 추정법 (Stepwise Estimation for Multiple Non-Crossing Quantile Regression using Kernel Constraints)

  • 방성완;전명식;조형준
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.915-922
    • /
    • 2013
  • 분위수 회귀는 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 그러나 여러 개의 분위수 함수를 개별적으로 추정하게 되면 이들이 서로 교차할 가능성이 있으며, 이러한 분위수 함수의 교차(quantile crossing) 현상 분위수의 이론적 기본 특성에 위배된다. 본 논문에서는 다중 비교차 분위수 함수의 추정을 위해 커널 계수에 제약식을 부여하는 순차적 추정법을 제안하였으며, 모의실험을 통해 제안한 방법론의 효율적인 성능과 유용성을 확인하였다.

Regression Quantile Estimations on Censored Survival Data

  • 심주용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제13권2호
    • /
    • pp.31-38
    • /
    • 2002
  • In the case of multiple survival times which might be censored at each covariate vector, we study the regression quantile estimations in this paper. The estimations are based on the empirical distribution functions of the censored times and the sample quantiles of the observed survival times at each covariate vector and the weighted least square method is applied for the estimation of the regression quantile. The estimators are shown to be asymptotically normally distributed under some regularity conditions.

  • PDF

통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석 (Analysis of AI interview data using unified non-crossing multiple quantile regression tree model)

  • 김재오;방성완
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.753-762
    • /
    • 2020
  • 본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 결과를 기대할 수 있고, 하나의 통합된 나무모형을 제시하여 우수한 해석력이 있다. 본 연구에서는 통합 비교차 다중 분위수회귀나무 모형을 활용하여 육군 AI 면접체계의 결과와 기존 인사자료간 관계를 충분히 탐색하여 의미있는 다양한 결과를 도출하였다.

복합 분위수 회귀에 대한 붓스트랩 방법의 응용 (Bootstrapping Composite Quantile Regression)

  • 서강민;방성완;전명식
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.341-350
    • /
    • 2012
  • 선형 회귀모형에서 오차항들이 서로 독립이고 동일한 분포를 따른다고 가정할 경우, (회귀계수의 강건한 추정을 위하여) 모든 분위수 함수의 회귀계수가 동일한 값을 갖는다는 사실에 근거한 복합 분위수 회귀(composite quantile regression) 방법을 고려할 수 있다. 본 논문에서는 복합 분위수 회귀에서 사용되는 분위수의 개수를 선택하기 위해 붓스트랩 방법의 가능성을 검토하였다. 또한, 분위수 회귀와 복합 분위수 회귀의 성능을 비교하기 위해 붓스트랩 방법을 이용하여 신뢰구간을 구축하고, 이들의 포함확률과 평균길이를 비교하였다. 이러한 모의실험을 통하여 복합 분위수 회귀의 우월성과 통계적 추론에 있어서 붓스트랩 방법의 유용성을 확인하였다.

Factors Related to Regional Variation in the High-risk Drinking Rate in Korea: Using Quantile Regression

  • Kim, Eun-Su;Nam, Hae-Sung
    • Journal of Preventive Medicine and Public Health
    • /
    • 제54권2호
    • /
    • pp.145-152
    • /
    • 2021
  • Objectives: This study aimed to identify regional differences in the high-risk drinking rate among yearly alcohol users in Korea and to identify relevant regional factors for each quintile using quantile regression. Methods: Data from 227 counties surveyed by the 2017 Korean Community Health Survey (KCHS) were analyzed. The analysis dataset included secondary data extracted from the Korean Statistical Information Service and data from the KCHS. To identify regional factors related to the high-risk drinking rate among yearly alcohol users, quantile regression was conducted by dividing the data into 10%, 30%, 50%, 70%, and 90% quantiles, and multiple linear regression was also performed. Results: The current smoking rate, perceived stress rate, crude divorce rate, and financial independence rate, as well as one's social network, were related to the high-risk drinking rate among yearly alcohol users. The quantile regression revealed that the perceived stress rate was related to all quantiles except for the 90% quantile, and the financial independence rate was related to the 50% to 90% quantiles. The crude divorce rate was related to the high-risk drinking rate among yearly alcohol users in all quantiles. Conclusions: The findings of this study suggest that local health programs for high-risk drinking are needed in areas with high local stress and high crude divorce rates.

Factors Affecting Clinical Competence in Dental Hygiene Students

  • Lee, Hyun-Ok;Kim, Sun-Mi
    • 치위생과학회지
    • /
    • 제19권4호
    • /
    • pp.271-278
    • /
    • 2019
  • Background: This study aimed to examine the factors that influence clinical performance of dental hygiene students to provide useful data for developing strategies to improve clinical competence. Methods: The effects of variables on clinical competence by quantile level were analyzed using quantile regression analysis in 247 dental hygiene students. Quantile regression and multiple regression analyses were conducted using the Stata 11.0 program to analyze predictors of clinical competence. Results: The clinical competence score of dental hygiene students was 42.69±5.90, the satisfaction of clinical practice was 49.90±7.44, the clinical practice stress was 50.62±7.37, and the professional self-concept was 31.68±4.41. Empathy was the highest at 50.87±4.93. Multiple regression analysis showed that school year, stress from clinical training, satisfaction with clinical training, professional self-concept, and empathy had significant impact on clinical competence. Quantile regression analysis showed that the effects varied depending on the clinical competence level. School year and professional self-concept had a significant positive effect, regardless of the clinical competence level, while empathy had a significant positive effect at the top 10% (Q90) of the clinical competence level. Satisfaction with clinical practice affected clinical competence at Q25, Q50, and Q90. Stress from clinical practice had significant effects at Q25, Q50, and Q90 (p<0.05). Conclusion: According to the study results, different factors affected clinical competence according to the quantile of clinical competence. This study provides valuable implications for designing clinical competence enhancement programs and strategies. In addition, objective indicators for considering factors that may affect the clinical competence, such as academic competence and satisfaction of practice hospitals, are expected to require detailed analysis and measures.

다변량 분위수 회귀나무 모형에 대한 연구 (Multivariate quantile regression tree)

  • 김재오;조형준;방성완
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.533-545
    • /
    • 2017
  • 분위수 회귀모형은 반응변수의 조건부 분포에 대하여 포괄적이고 유용한 통계적 정보를 제공한다. 그러나 많은 실제 자료는 설명변수와 반응변수가 비선형의 관계를 갖고 있어 전통적인 선형 분위수 회귀모형은 왜곡되고 잘못된 결과를 초래할 수 있다. 또한 자료의 복잡성이 증가하여 반응변수가 여러개인 다변량 자료의 분석에 대한 보다 정확한 예측과 더불어 풍부한 해석에 대한 요구가 증가하고 있다. 이러한 이유로 본 연구에서는 다변량 분위수 회귀나무 모형을 제안하였다. 본 연구에서는 기존의 다변량 회귀나무 모형의 분할변수 선택 알고리즘의 문제점을 지적하고 향상된 분할변수 선택 알고리즘을 제안하였다. 제안한 알고리즘은 합리적인 계산시간으로 적용 가능하며 분할변수 선택에서 편향 발생의 문제를 갖지 않는 동시에 기존 방법보다 더 정확하게 분할변수를 선택할 수 있있다. 본 연구에서는 모의실험과 실증 예제를 통해 제안한 방법의 우수한 성능과 유용성을 확인하였다.