• 제목/요약/키워드: Quantile regression

검색결과 200건 처리시간 0.033초

Factors Related to Regional Variation in the High-risk Drinking Rate in Korea: Using Quantile Regression

  • Kim, Eun-Su;Nam, Hae-Sung
    • Journal of Preventive Medicine and Public Health
    • /
    • 제54권2호
    • /
    • pp.145-152
    • /
    • 2021
  • Objectives: This study aimed to identify regional differences in the high-risk drinking rate among yearly alcohol users in Korea and to identify relevant regional factors for each quintile using quantile regression. Methods: Data from 227 counties surveyed by the 2017 Korean Community Health Survey (KCHS) were analyzed. The analysis dataset included secondary data extracted from the Korean Statistical Information Service and data from the KCHS. To identify regional factors related to the high-risk drinking rate among yearly alcohol users, quantile regression was conducted by dividing the data into 10%, 30%, 50%, 70%, and 90% quantiles, and multiple linear regression was also performed. Results: The current smoking rate, perceived stress rate, crude divorce rate, and financial independence rate, as well as one's social network, were related to the high-risk drinking rate among yearly alcohol users. The quantile regression revealed that the perceived stress rate was related to all quantiles except for the 90% quantile, and the financial independence rate was related to the 50% to 90% quantiles. The crude divorce rate was related to the high-risk drinking rate among yearly alcohol users in all quantiles. Conclusions: The findings of this study suggest that local health programs for high-risk drinking are needed in areas with high local stress and high crude divorce rates.

분위회귀모형을 이용한 고객만족도 요인의 영향력 비교 (Influence Comparison of Customer Satisfaction Factor using Quantile Regression Model)

  • 김성윤;김용태;이상준
    • 디지털융복합연구
    • /
    • 제13권6호
    • /
    • pp.125-132
    • /
    • 2015
  • 고객만족도조사에서 가중치를 어떠한 방법으로 산정할 것인지는 여러 가지 논점이 제기되고 있는 상황이다. 이에 본 연구는 최소제곱 회귀모형과 분위회귀모형의 회귀계수를 비교하여 분위별 만족도의 가중치가 어떻게 다른지 살펴보고, 분위별 회귀계수의 영향력 차이를 파악하기 위해 부트스트랩 검증을 실시하였다. 공개 소프트웨어인 R(Quantreg 패키지)을 이용하여 분석한 결과, 분위에 따라 만족도 요인의 영향력 크기는 차이가 있는 것으로 나타났고, 각 분위별 회귀계수는 통계적으로 유의한 차이가 있는 것으로 나타났다. 따라서 평균적인 집단의 특성을 제시하는 최소제곱 회귀모형보다 만족수준에 따른 고객집단 별로 만족요인의 영향력을 제시하는 분위회귀모형을 이용하는 것이 고객만족도를 위한 계량적 융합정책 설계에 기여를 할 것이다.

분위수 회귀나무를 이용한 변수선택 방법 연구 (Variable selection with quantile regression tree)

  • 장영재
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1095-1106
    • /
    • 2016
  • Koenker 등 (1978)에 의해 제안 된 분위수 회귀분석법은 독립변수들이 주어졌을 때, 종속변수의 조건부 분위수에 초점을 맞추어 독립변수들과 종속변수의 해당 특정 분위수와의 관계를 분석하는 방법이다. 선형프로그래밍법 등을 이용한 분위수 회귀의 추정 과정을 생각해 볼 때, 고차원 대용량 자료의 경우에는 모형 적합에 어려움을 겪을 수 밖에 없다. 따라서 분위수 회귀의 문제에 있어서도 차원 축소의 문제, 조금 더 폭을 좁혀 생각해보면 변수선택의 문제를 통해 의사 결정에 영향을 미치는 주요 요인들을 파악하거나 적절한 규모의 모형을 적합하는 과정이 중요하다고 할 수 있다. 본 논문에서는 분위수 회귀의 변수선택의 문제를 보다 직관적이고 간단하게 해결하기 위한 방법으로서 회귀나무 모형을 응용하여 한국야구위원회에 등록된 선수들의 연봉과 기록 데이터를 분석해 보았다. 분석 결과, 각 분위수 별로 소수의 주요 변수가 선택되어 차원축소의 효과를 얻을 수 있었다. 또한 해당 분위수별로 선택된 변수도 해석상 의미 있는 것으로 평가할 수 있었다.

통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석 (Analysis of AI interview data using unified non-crossing multiple quantile regression tree model)

  • 김재오;방성완
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.753-762
    • /
    • 2020
  • 본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 결과를 기대할 수 있고, 하나의 통합된 나무모형을 제시하여 우수한 해석력이 있다. 본 연구에서는 통합 비교차 다중 분위수회귀나무 모형을 활용하여 육군 AI 면접체계의 결과와 기존 인사자료간 관계를 충분히 탐색하여 의미있는 다양한 결과를 도출하였다.

Bayesian Semi-Parametric Regression for Quantile Residual Lifetime

  • Park, Taeyoung;Bae, Wonho
    • Communications for Statistical Applications and Methods
    • /
    • 제21권4호
    • /
    • pp.285-296
    • /
    • 2014
  • The quantile residual life function has been effectively used to interpret results from the analysis of the proportional hazards model for censored survival data; however, the quantile residual life function is not always estimable with currently available semi-parametric regression methods in the presence of heavy censoring. A parametric regression approach may circumvent the difficulty of heavy censoring, but parametric assumptions on a baseline hazard function can cause a potential bias. This article proposes a Bayesian semi-parametric regression approach for inference on an unknown baseline hazard function while adjusting for available covariates. We consider a model-based approach but the proposed method does not suffer from strong parametric assumptions, enjoying a closed-form specification of the parametric regression approach without sacrificing the flexibility of the semi-parametric regression approach. The proposed method is applied to simulated data and heavily censored survival data to estimate various quantile residual lifetimes and adjust for important prognostic factors.

분위회귀를 이용한 한반도 연안 해면 고도의 장주기 선형 추세 분석 (Analysis of Long-term Linear Trends of the Sea Surface Height Along the Korean Coast based on Quantile Regression)

  • 임병준;장유순
    • 한국해양학회지:바다
    • /
    • 제23권2호
    • /
    • pp.63-75
    • /
    • 2018
  • 본 연구에서는 분위회귀를 이용하여 1993~2016년 동안의 한반도 조위 자료의 장주기 선형 추세를 분석하였다. 일반 선형회귀(OLS: Ordinary Least Square)와 50% 중간 분위 회귀 결과를 비교했을 때 특히 황해에서 약 2~3 mm/year의 회귀 결과의 차이를 발견하였으며, 이는 극한 값 변화에 기인함을 확인할 수 있었다. 또한 해역별로 하위(1%) 분위와 중간(50%) 분위, 상위(99%) 분위의 값이 모두 다르게 나타났다. 황해의 대부분 지역에서는 상위 분위와 하위 분위가 모두 증가하는 경향을 나타냈으나, 유의미한 "상향 발산형" 회귀 결과를 보였다. 이는 상위 분위가 중간 분위에 비해 유의미하게 크게 나타나는 경향을 의미한다. 대한민국 남해안에서는 상위 분위가 하위 분위보다 더 작은 증가 값을 가지는 "상향 수렴형" 회귀 결과가 특징적으로 나타났다. 이러한 경향은 조화 분석을 통해 알려진 조석 분조들을 제거한 결과에서는 없어지는 것을 확인하였다. 그러므로 분위 회귀의 지역적 특성은 조석 세기의 장주기 변동과 연관이 있다고 추측된다.

커널 제약식을 이용한 다중 비교차 분위수 함수의 순차적 추정법 (Stepwise Estimation for Multiple Non-Crossing Quantile Regression using Kernel Constraints)

  • 방성완;전명식;조형준
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.915-922
    • /
    • 2013
  • 분위수 회귀는 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 그러나 여러 개의 분위수 함수를 개별적으로 추정하게 되면 이들이 서로 교차할 가능성이 있으며, 이러한 분위수 함수의 교차(quantile crossing) 현상 분위수의 이론적 기본 특성에 위배된다. 본 논문에서는 다중 비교차 분위수 함수의 추정을 위해 커널 계수에 제약식을 부여하는 순차적 추정법을 제안하였으며, 모의실험을 통해 제안한 방법론의 효율적인 성능과 유용성을 확인하였다.

한국의 세대 간 경제적 이동성 - 분위수회귀분석을 중심으로 - (Intergenerational economic mobility in Korea using a quantile regression analysis)

  • ;정기호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.715-725
    • /
    • 2014
  • 본 연구는 분위수회귀분석을 이용하여 한국의 세대 간 경제적 이동성을 분석한다. 분석에는 1998년부터 2008년까지의 한국노동패널조사 (KLIPS) 자료가 이용되었다. 분석결과, (1) 부모 소득영향력은 자녀소득의 조건부분포의 하위 분위수에서는 상대적으로 작고 상위 분위수로 갈수록 더 커지는 것으로 나타났다. 이것은 자녀소득 분포의 상위분위수로 갈수록 세대 간 경제적 이동성은 떨어지며 가구별 경제적 신분이 세대에 걸쳐 고착될 가능성이 높아지는 것을 의미한다. (2) 한편 교육효과를 제어하면 이러한 부모 소득 영향력은 감소하였다. (3) 대학교육 효과는 소득분포의 상위 분위수로 갈수록 더 높아져서 자녀의 대학교육이 세대 간에 소득이 이전되는 중요한 통로인 것으로 나타났다. (4) 마지막으로 분위수회귀분석결과로부터 자녀소득의 조건부분포를 비모수적으로 추정하고 추정된 곡선 그림을 이용하여 추가적인 시각적 특징들을 도출하였다.

우리나라 가뭄특성과 기상인자간의 저빈도 특성 분석 (Characterization of low frequency between Droughts and Meteorological factor in Korea)

  • 소병진;권현한
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.418-418
    • /
    • 2012
  • 현재 전 세계적으로 온실가스 농도 증가로 호우나 가뭄, 대설 등 지역에 따라 서로 상반되는 변화를 가져올 수 있다고 경고되고 있으며, 우리나라에서도 남해안지역과 경기북부지역에서 호우빈도가 증가하는 반면, 충정도 내륙지역과 경상북도에서는 호우빈도가 감소하고 5일 누적 강수량 또한 감소하여, 해당지역에서 가뭄이 발생할 경우 심화될 가능성이 높아진다고 보고된 바 있다. 기후변화 시나리오에 분석결과에서도 우리나라의 경우 평균적으로 강우일수는 작아지며, 강우강도는 커지는 결과들이 도출되었다. 이러한 결과들은 가뭄의 발생가능성이 높아지고 있음을 보여주고 있다. 본 연구에서는 우리나라에서 발생된 가뭄의 특성을 분석하고 가뭄의 특성과 기상인자간의 관계를 Quantile regression 분석을 통해 살펴보고자 한다. 가뭄의 특성과 기상인자(엘니뇨, 강수량 등)의 관계에 있어서 기상인자들의 평균을 이용하는 일반적인 회귀분석은 전체 데이터의 영향에 따른 가뭄특성인자와의 관계를 보여준다. 하지만 강수량과 가뭄과의 관계에서와 같이 강수량의 극값보다는 적은 강수량 혹은 무강우일수가 가뭄과 밀접한 관련을 보여준다. 이러한 점에서 이상치들에 영향을 배재할 수 있는 Quantile regression을 사용하여 Quantile에 따른 기상인자와 가뭄특성과의 관계를 규명하고 평가해 보고자 한다. 본 연구에서 적용한 Quantile Regression 기법은 회귀계수의 추정에 있어서 회귀인자의 신뢰성을 아래와 같은 Quantile-회귀계수 그래프를 통해 분석할 수 있으며, 로버스트 통계량의 특징인 분산이 적은 안정적인 추정량을 확보할 수 있는 장점을 갖는다. 아래식은 Quantile regression의 회귀계수 추정식을 나타낸다. $$arg\;in\;{n\\\;p(y_i-f(x_i,\;z_i,\;{\cdots}))\\ =1}$$ 여기서, $y_i$는 가뭄특성값을 $x_i$, $z_i$, $\cdots$는 기상인자를 나타낸다. $$p(y-q)={{\beta}(y-q)\;y{\geq_-}q \\ (1-{\beta})(q-y)\;y<q}$$ ${\beta}$는 quantile을 나타내며 0< ${\beta}$ <1범위를 갖는다.

  • PDF

Support vector quantile regression for longitudinal data

  • Hwang, Chang-Ha
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권2호
    • /
    • pp.309-316
    • /
    • 2010
  • Support vector quantile regression (SVQR) is capable of providing more complete description of the linear and nonlinear relationships among response and input variables. In this paper we propose a weighted SVQR for the longitudinal data. Furthermore, we introduce the generalized approximate cross validation function to select the hyperparameters which affect the performance of SVQR. Experimental results are the presented, which illustrate the performance of the proposed SVQR.