• 제목/요약/키워드: 조건부 분위수

검색결과 11건 처리시간 0.02초

대용량 자료의 분석을 위한 분할정복 커널 분위수 회귀모형 (Divide and conquer kernel quantile regression for massive dataset)

  • 방성완;김재오
    • 응용통계연구
    • /
    • 제33권5호
    • /
    • pp.569-578
    • /
    • 2020
  • 분위수 회귀모형은 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 특히 커널 분위수 회귀모형은 비선형 관계식을 고려하기 위하여 양정치 커널함수(kernel function)에 의해 만들어지는 재생 커널 힐버트 공간(reproducing kernel Hilbert space)에서 비선형 조건부 분위수 함수를 추정한다. 그러나 KQR은 이차계획법으로 공식화되어 많은 계산비용을 필요로 하므로 컴퓨터 메모리 능력의 제한으로 대용량 자료의 분석은 불가능하다. 이러한 문제점을 해결하기 위하여 본 논문에서는 분할정복(divide and conquer) 알고리즘을 활용한 KQR 추정법(DC-KQR)을 제안한다. DC-KQR은 먼저 전체 훈련자료를 몇 개의 부분집합으로 무작위로 분할(divide)한 후, 각각의 부분집합에 대하여 KQR 분위수 함수를 추정하고 이들의 산술 평균을 이용하여 최종적인 추정량으로 통합(conquer)하는 기법이다. 본 논문에서는 모의실험과 실제자료 분석을 통해 제안한 DC-KQR의 효율적인 성능과 활용 가능성을 확인하였다.

조건부 분위수의 중도절단을 고려한 비모수적 추정 (Nonparametric estimation of conditional quantile with censored data)

  • 김은영;최혜미
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권2호
    • /
    • pp.211-222
    • /
    • 2013
  • 중도절단된 자료가 있을 경우 조건부 분위수함수를 비모수적으로 추정하는 문제에 대하여 다루고 있다. 역함수에 근거한 방법인 Yu와 Jones (1998)에 의해 제안된 중복커널기법 추정량과 Lee 등(2006)의 국소로지스틱기법 추정량을 중도절단된 자료가 있는 경우로 수정하여 새롭게 제안하고, 이들을 기존의 Koenker와 Bassett (1978)의 점검함수에 근거한 커널평활 추정량들과 모의실험을 통해 비교해 보았다. 모의실험을 통하여 역함수에 근거한 추정량들은 조건부 분포가 대칭인 모형에서, 점검함수기법 추정량들은 한쪽으로 치우친 분포인 경우에 조건부 분위수를 대체로 더 잘 추정하고 있음을 알 수 있었다.

비교차 제약식을 이용한 다중 선형 분위수 회귀모형에 관한 비교연구 (A comparison study of multiple linear quantile regression using non-crossing constraints)

  • 방성완;신승준
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.773-786
    • /
    • 2016
  • 분위수 회귀는 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 그러나 여러 개의 분위수 함수를 개별적으로 추정하게 되면 이들이 서로 교차할 가능성이 있으며, 이러한 분위수 함수의 교차(quantile crossing) 현상 분위수의 이론적 기본 특성에 위배된다. 본 논문에서는 다중 비교차 분위수 함수의 추정의 대표적인 방법들의 특성을 적합식과 계산 알고리즘의 측면에서 살펴보고, 모의실험과 실제 자료 분석을 통해 그 성능을 비교하였다.

커널 제약식을 이용한 다중 비교차 분위수 함수의 순차적 추정법 (Stepwise Estimation for Multiple Non-Crossing Quantile Regression using Kernel Constraints)

  • 방성완;전명식;조형준
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.915-922
    • /
    • 2013
  • 분위수 회귀는 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 그러나 여러 개의 분위수 함수를 개별적으로 추정하게 되면 이들이 서로 교차할 가능성이 있으며, 이러한 분위수 함수의 교차(quantile crossing) 현상 분위수의 이론적 기본 특성에 위배된다. 본 논문에서는 다중 비교차 분위수 함수의 추정을 위해 커널 계수에 제약식을 부여하는 순차적 추정법을 제안하였으며, 모의실험을 통해 제안한 방법론의 효율적인 성능과 유용성을 확인하였다.

벌점화 분위수 회귀나무모형에 대한 연구 (Penalized quantile regression tree)

  • 김재오;조형준;방성완
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1361-1371
    • /
    • 2016
  • 분위수 회귀모형은 설명변수가 반응변수의 조건부 분위수 함수에 어떻게 관계되는지 탐색함으로서 많은 유용한 정보를 제공한다. 그러나 설명변수와 반응변수가 비선형 관계를 갖는다면 선형형태를 가정하는 전통적인 분위수 회귀모형은 적합하지 않다. 또한 고차원 자료 또는 설명변수간 상관관계가 높은 자료에 대해서 변수선택의 방법이 필요하다. 이러한 이유로 본 연구에서는 벌점화 분위수 회귀나무모형을 제안하였다. 한편 제안한 방법의 분할규칙은 과도한 계산시간과 분할변수 선택편향 문제를 극복한 잔차 분석을 기반으로 하였다. 본 연구에서는 모의실험과 실증 예제를 통해 제안한 방법의 우수한 성능과 유용성을 확인하였다.

분위수 회귀나무를 이용한 변수선택 방법 연구 (Variable selection with quantile regression tree)

  • 장영재
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1095-1106
    • /
    • 2016
  • Koenker 등 (1978)에 의해 제안 된 분위수 회귀분석법은 독립변수들이 주어졌을 때, 종속변수의 조건부 분위수에 초점을 맞추어 독립변수들과 종속변수의 해당 특정 분위수와의 관계를 분석하는 방법이다. 선형프로그래밍법 등을 이용한 분위수 회귀의 추정 과정을 생각해 볼 때, 고차원 대용량 자료의 경우에는 모형 적합에 어려움을 겪을 수 밖에 없다. 따라서 분위수 회귀의 문제에 있어서도 차원 축소의 문제, 조금 더 폭을 좁혀 생각해보면 변수선택의 문제를 통해 의사 결정에 영향을 미치는 주요 요인들을 파악하거나 적절한 규모의 모형을 적합하는 과정이 중요하다고 할 수 있다. 본 논문에서는 분위수 회귀의 변수선택의 문제를 보다 직관적이고 간단하게 해결하기 위한 방법으로서 회귀나무 모형을 응용하여 한국야구위원회에 등록된 선수들의 연봉과 기록 데이터를 분석해 보았다. 분석 결과, 각 분위수 별로 소수의 주요 변수가 선택되어 차원축소의 효과를 얻을 수 있었다. 또한 해당 분위수별로 선택된 변수도 해석상 의미 있는 것으로 평가할 수 있었다.

다변량 분위수 회귀나무 모형에 대한 연구 (Multivariate quantile regression tree)

  • 김재오;조형준;방성완
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.533-545
    • /
    • 2017
  • 분위수 회귀모형은 반응변수의 조건부 분포에 대하여 포괄적이고 유용한 통계적 정보를 제공한다. 그러나 많은 실제 자료는 설명변수와 반응변수가 비선형의 관계를 갖고 있어 전통적인 선형 분위수 회귀모형은 왜곡되고 잘못된 결과를 초래할 수 있다. 또한 자료의 복잡성이 증가하여 반응변수가 여러개인 다변량 자료의 분석에 대한 보다 정확한 예측과 더불어 풍부한 해석에 대한 요구가 증가하고 있다. 이러한 이유로 본 연구에서는 다변량 분위수 회귀나무 모형을 제안하였다. 본 연구에서는 기존의 다변량 회귀나무 모형의 분할변수 선택 알고리즘의 문제점을 지적하고 향상된 분할변수 선택 알고리즘을 제안하였다. 제안한 알고리즘은 합리적인 계산시간으로 적용 가능하며 분할변수 선택에서 편향 발생의 문제를 갖지 않는 동시에 기존 방법보다 더 정확하게 분할변수를 선택할 수 있있다. 본 연구에서는 모의실험과 실증 예제를 통해 제안한 방법의 우수한 성능과 유용성을 확인하였다.

신도시 택지개발사업지역에서 토지가격 결정요인에 관한 연구 (A Study on the Determinants of Land Price in a New Town)

  • 정태윤
    • 부동산연구
    • /
    • 제28권1호
    • /
    • pp.79-90
    • /
    • 2018
  • 본 연구는 주택지의 가격결정모형을 추정하여 신도시 주거용 토지의 가격 결정요인 알아보고자 하였다. 이를 위해서 경상남도 김해시 장유신도시 지역에서 택지개발사업으로 조성된 주택지 1,000여 필지의 실거래 가격자료를 대상으로 헤도닉 특성이 주택지 가격에 미치는 영향을 GLS 분석방법과 분위수 회귀분석방법을 이용하여 분석하였다. 본 연구는 주택지 가격과 그 오차가 정규분포를 가질 때 조건부 평균을 추정하는 GLS 추정결과와 비교하기 위해 주택지 가격이 대칭적이지 않고 정규분포를 가지지 아니할 때 조건부 분위수별 추정을 위해 분위수 회귀분석 모형을 사용하였다. 그 결과 가격 분위수별로 해당 특성이 미치는 영향의 차이를 확인할 수 있었다. 경과 연수변수는 음의 영향을 보였지만 일정기간을 경과하면 다시 양의 영향을 보이는 것으로 나타났으며, 그 반전기간은 고가주택지 분위수에서 좀 더 높은 값을 보였다. 신도시 주택지 중에서 점포 겸용택지의 긍정적인 영향이 가장 크게 나타났으며, 주택지의 수요자는 도로에 한면만 접한 토지보다 두면이상 접한 각지의 토지, 부정형토지보다는 사각형의 토지를 선호하는 것으로 나타났다. 각지는 주택지의 일조권 개선에 긍정적이며, 인접대지 경계로부터의 이격거리로 인한 건축면적의 감소가 적기 때문에 이 같은 결과를 보인 것으로 판단된다. 점포겸용택지 변수는 저가 주택용 토지에서 더 큰 영향을 미치는 것으로 나타났다. 이는 저가의 주거용 토지가 대부분 임대형 주택 건부지로 사용되는 경향이 많아 자가 거주용 주택 건부지와 다른 특성을 가지기 때문으로 보인다. 주거용 토지가격은 가격 수준에 따라 다른 특성을 지니며, 담보가지의 평가와 부동산 정책의 입안에 있어서 이를 고려하여야 할 것으로 보인다.

다변량 조건부 꼬리 기대값 (Multivariate conditional tail expectations)

  • 홍종선;김태우
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1201-1212
    • /
    • 2016
  • 시장위험 관리를 위한 Value at Risk(VaR)는 금융기관들이 선호하는 기법이지만, 투자가 실패한 경우에 손실금액에 대하여는 설명할 수 없다는 문제점이 있다. VaR의 한계를 보완하는 대안적인 위험측정도구인 Conditional Tail Expectation(CTE)는 VaR를 초과하는 조건부 기대값으로 정의된다. 포트폴리오에 대한 CTE를 추정하는 실제금융시장에서는. 일반적으로는 다변량 손실률을 일변량 분포로 변환하여 VaR을 추정하고 CTE를 구하지만, 본 연구에서는 다차원 분위벡터를 이용하여 다변량 CTE들을 제안한다. 그리고 일변량 CTE들의 관계를 확장하여 다변량 CTE들의 관계식을 유도하였다. 다양한 분산-공분산행렬을 갖는 이변량과 삼변량의 정규분포로부터 다변량 CTE들을 구하고 CTE들의 관계식을 구현하면서 고차원 분포로의 확장 가능성을 설명하였다. 이변량과 삼변량의 실증 예제를 통해 제안한 이론을 탐색하고, 기존의 CTE와 비교하였다. 다변량 변수들의 분산-공분산행렬과 다변량 분위벡터를 사용한 다변량 CTE가 일변량으로 변환하여 구한 CTE보다 작은 값을 갖는 것을 발견하였다. 그러므로 본 연구에서 제안한 다변량 CTE는 보다 적은 위험성을 나타내는 추정량이며, 포트폴리오를 구성하는 여러 기업을 동시에 고려하는 분산 투자 전략을 세우는 경우에 이런 다변량 CTE를 사용하는 적극적인 투자가 가능하다는 장점이 있다.

한국의 세대 간 경제적 이동성 - 분위수회귀분석을 중심으로 - (Intergenerational economic mobility in Korea using a quantile regression analysis)

  • ;정기호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.715-725
    • /
    • 2014
  • 본 연구는 분위수회귀분석을 이용하여 한국의 세대 간 경제적 이동성을 분석한다. 분석에는 1998년부터 2008년까지의 한국노동패널조사 (KLIPS) 자료가 이용되었다. 분석결과, (1) 부모 소득영향력은 자녀소득의 조건부분포의 하위 분위수에서는 상대적으로 작고 상위 분위수로 갈수록 더 커지는 것으로 나타났다. 이것은 자녀소득 분포의 상위분위수로 갈수록 세대 간 경제적 이동성은 떨어지며 가구별 경제적 신분이 세대에 걸쳐 고착될 가능성이 높아지는 것을 의미한다. (2) 한편 교육효과를 제어하면 이러한 부모 소득 영향력은 감소하였다. (3) 대학교육 효과는 소득분포의 상위 분위수로 갈수록 더 높아져서 자녀의 대학교육이 세대 간에 소득이 이전되는 중요한 통로인 것으로 나타났다. (4) 마지막으로 분위수회귀분석결과로부터 자녀소득의 조건부분포를 비모수적으로 추정하고 추정된 곡선 그림을 이용하여 추가적인 시각적 특징들을 도출하였다.