• 제목/요약/키워드: 분위회귀모형

검색결과 45건 처리시간 0.032초

분위수 회귀나무를 이용한 변수선택 방법 연구 (Variable selection with quantile regression tree)

  • 장영재
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.1095-1106
    • /
    • 2016
  • Koenker 등 (1978)에 의해 제안 된 분위수 회귀분석법은 독립변수들이 주어졌을 때, 종속변수의 조건부 분위수에 초점을 맞추어 독립변수들과 종속변수의 해당 특정 분위수와의 관계를 분석하는 방법이다. 선형프로그래밍법 등을 이용한 분위수 회귀의 추정 과정을 생각해 볼 때, 고차원 대용량 자료의 경우에는 모형 적합에 어려움을 겪을 수 밖에 없다. 따라서 분위수 회귀의 문제에 있어서도 차원 축소의 문제, 조금 더 폭을 좁혀 생각해보면 변수선택의 문제를 통해 의사 결정에 영향을 미치는 주요 요인들을 파악하거나 적절한 규모의 모형을 적합하는 과정이 중요하다고 할 수 있다. 본 논문에서는 분위수 회귀의 변수선택의 문제를 보다 직관적이고 간단하게 해결하기 위한 방법으로서 회귀나무 모형을 응용하여 한국야구위원회에 등록된 선수들의 연봉과 기록 데이터를 분석해 보았다. 분석 결과, 각 분위수 별로 소수의 주요 변수가 선택되어 차원축소의 효과를 얻을 수 있었다. 또한 해당 분위수별로 선택된 변수도 해석상 의미 있는 것으로 평가할 수 있었다.

국내 재벌기업들의 수익성관련 분위회귀모형 상 재무적 결정요인 분석 (Investigations on the Financial Determinants of Profitability for Korean Chaebol Firms by applying Conditional Quantile Regression (CQR) Model)

  • 김한준
    • 한국콘텐츠학회논문지
    • /
    • 제14권12호
    • /
    • pp.973-988
    • /
    • 2014
  • 본 연구는 국내 자본시장에서의 최근 주요 관심이슈 중 하나인 국제금융위기 이후 재벌그룹 소속 계열사들의 수익성 분포 편향가능성과 관련된, 동 지표에 대한 재무적 결정요인의 분석이다. 연구대상으로 공정거래위원회에서 규정한 대규모기업집단과 유사한 의미인 국내 재벌그룹 중심의 소속 계열사들이며 특히, 시장가치 산정을 위하여 유가증권시장과 코스닥시장에 상장된 기업들로만 구성된다. 또한, 동 연구기간은 국제금융위기 이후의 기간인 2009년부터 2012년 사이로 선정되었다. 관련 분석을 위하여 2가지 가설들이 설정되었으며, 전자는 분위회귀모형을 이용한 각 해당 비율 구간별 재벌 계열사들의 수익성 결정요인들을 각각 판명하여 비교분석하는 것이며, 후자는 5가지의 요인들로 구성된 '확장적' 듀퐁공식을 기준으로, 프로빗 모형분석을 이용한 표본기업들의 재무적 차별요인들을 분석하는 것이다. 도출된 결과와 관련하여, 수익성에 대한 재무적 결정요인으로서 부채비율, 비유동자산회전율, 외국인지분율, 그리고 주식거래시장의 구분 등이 통계적인 유의성을 나타냈으며, 두번째 가설검정 결과는 자기자본수익률에 영향을 미치는 요인들로서, 자기자본(시장가치 기준) 대비 매출액 비율과 부채비율 등이 재벌소속 기업들의 금융위기 시점과 최근까지의 변화되는 재무적 특성으로 판명되었다. 또한, 현재 정책적인 측면에서 기업들의 사내유보금에 축소에 대한 논리와 관련하여 본 연구에서는 기업의 유보금과 수익성 증대의 상관관계에서 통계적 비유의성을 보였다.

지역의 교육환경이 사교육비 지출에 미치는 영향에 관한 연구 (The Effects of Regional Education Environment on the Private Education Expenditure of the Households)

  • 박선영;마강래
    • 지역연구
    • /
    • 제31권3호
    • /
    • pp.3-17
    • /
    • 2015
  • 본 연구는 가구의 사교육비 지출에 있어서 공간적 맥락이 중요하게 다루어져야하며, 사교육비에 관한 정책을 위해서는 지역의 교육환경과 여건을 고려해야 할 필요가 있음을 실증하고자 하였다. 이를 위해 분위회귀모형(quantile regression model)을 이용하여 사교육비 지출이 높은 계층에 영향을 주는 '지역 교육열 요인'의 영향력이, 상대적으로 사교육비 지출이 낮은 계층과는 매우 다르다는 가설을 검증하였다. 분석 결과, 수도권 거주여부가 사교육비 증가액에 미치는 영향력은 사교육비 지출 분위가 높을수록 크게 나타나는 것으로 분석되었다. 또한, 지역의 교육열의 심화에 따른 추가적 교육비 지출은, 기존에도 많이 지출하고 있던 계층에서 더욱 크게 증가고 있음을 알 수 있었다. 지역적 영향력에 관한 이러한 두 가지 결과는, 지역의 경쟁적 환경이 사교육비 지출에 매우 큰 영향을 줄 수 있음을 의미하고 있다.

패널 분위수회귀 모형을 사용한 우리나라 지방 상수도 생활용수 수요의 가격탄력성 추정 (Estimating Price Elasticity of Residential Water Demand in Korea Using Panel Quatile Model)

  • 김형건
    • 자원ㆍ환경경제연구
    • /
    • 제27권1호
    • /
    • pp.195-214
    • /
    • 2018
  • 우리나라에서도 최근 잦아진 가뭄으로 물 부족에 대한 경각심이 높아졌다. 특히, 2015년의 가뭄은 경제적으로 큰 피해를 야기하였고 적극적인 물 수요 관리의 필요성을 부각시킨 계기가 되었다. 경제학적 측면에서 수요관리 정책을 설계하기 위해 선행되어야 될 점 중 하나는 신뢰성 있는 가격탄력성의 추정이다. 그러므로 본 연구에서는 기존 국내 선행연구들에 비해 강건한 생활용수 수요의 가격탄력성을 추정하고자 한다. 이를 위해 2010년도에서 2013년도까지 지방 상수도 공급지역 161개의 자료를 패널 분위수회귀모형을 사용해 추정하였고 이를 패널자료 회귀모형의 결과와 비교 분석하였다. 분석 결과, 생활용수 수요의 가격탄력성은 -0.156에서 -0.189 사이의 값을 갖는 것으로 추정되었다. 또한 본 연구에서는 조건부 평균 회귀를 사용하는 경우 왼쪽꼬리가 길고 오른쪽 분포가 두꺼운 우리나라 생활용수 수요량 분포의 특징으로 수요량이 많은 지역들의 성향이 추정결과에 상대적으로 크게 반영된다는 점을 확인하였다.

자녀유무별 여성임금격차(Family gap) : 소득분위에 따른 비교연구 (Family Gaps Across the Wages Distribution in Korea)

  • 허수연
    • 사회복지연구
    • /
    • 제43권2호
    • /
    • pp.345-366
    • /
    • 2012
  • 본 연구는 소득계층에 따른 '자녀유무별 여성임금격차(Family gap)'의 크기를 비교하는 것을 목적으로 한다. 2008년 한국노동패널의 조사자료를 활용하여 헤크만 2단계 추정법(Heckman's two stage estimation) 모형을 통해 분석대상 여성의 경제활동참가 선택을 결정하는 조건부 기댓값을 통제한 후, 소득분위에 따른 자녀양육의 영향력을 파악하기 위해 분위회귀분석(Quantile regression) 방법을 사용하였다. 분석결과 저소득계층(10분위)과 고소득계층(90분위)을 제외한 모든 소득분위에서 자녀를 한 명 양육하는 경우 자녀가 없는 경우에 비해 시간당임금이 낮아지는 결과, 즉 Family gap이 발견되었다. 또한 모든 소득계층에서 둘 이상의 자녀를 양육하는 경우 자녀가 없는 경우에 비해 시간당임금이 낮아지는 Family gap이 발견되었다. Family gap은 자녀가 하나 있는 경우와 둘 이상 있는 경우 모두 소득계층 25분위에서 가장 크게 나타났다. 이러한 연구결과를 바탕으로 자녀양육으로 인한 여성의 노동시장 불평등과 여성 간(間)의 불평등 완화를 위한 보편적인 가족정책의 확대에 대해 논의하였다.

도시가계의 10분위별 외식비 지출행태 분석 (An Analysis of Eating Out Expenditure Behavior of Urban Households by Decile Group)

  • 최문용;모수원;이광배
    • 한국산학기술학회논문지
    • /
    • 제16권11호
    • /
    • pp.7820-7830
    • /
    • 2015
  • 우리나라 도시근로자의 가계소득과 외식비는 함께 증가하고 있으나, 시간이 경과와 더불어 가계소득에 비해 외식비 증가율이 크게 둔화되고 있을 뿐만 아니라 가계소득에서 외식비가 차지하는 비율도 감소하고 있다. 이러한 외식비 지출패턴의 변화는 소득계층에 따라서도 달라 외식비가 가계소득에서 차지하는 비중은 2005년 이후 감소하나 10분위의 외식비 비중이 가장 낮고 1분위의 비중이 가장 높다는 것과, 외식비 비중의 표준편차도 소득계층이 높을수록 작고 소득계층이 낮을수록 크다는 것을 보인다. 외식비모형에 회귀분석을 적용하여 소득계수가 모두 유의하며 소득분위가 높을수록 계수의 크기가 작다는 것과 외환위기는 1분위와 10분위를 제외하고 음의 부호로 유의하다는 것을 밝힌다. 1분위와 2분위에서는 계절에 따른 외식비 변화가 없으며, 소득계층이 높을수록 계절에 따른 외식이 분명해진다는 것도 제시한다. 시간이 흐름에 따른 외식비 패턴의 변화를 살펴보기 위하여 전향적 이동회귀를 실시하여 단순 추정에 따른 것보다 훨씬 빠른 속도로 외식비의 소득탄력성 감소가 이루어지고 있다는 것을 밝힌다. 외식비를 분산분해하여 소득수준이 낮은 계층에서는 소득이 중요한 변수이나 소득수준이 높은 계층에서는 소득 이외의 요인들이 외식비에 많은 영향을 미친다는 것을 보인다.

한계강우량 산정을 위한 로지스틱 회귀분석 (Logistic regression analysis for Critical Rainfall Estimation)

  • 이창현;이강원;금호준;김병현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.232-232
    • /
    • 2022
  • 1차원 관망해석모형과 2차원 지표면범람 해석모형을 이용한 도시지역의 실시간 홍수예·경보시스템 구축은 모형의 모의에 많은 시간이 소요되므로 한계가 있다. 또한, 연구유역에서 시나리오 강우에 대해 침수를 유발시키는 한계강우량을 1-2차원 모형의 시행착오법을 적용한 반복적인 수행을 통해 산정하는 것은 비효율적인 방법이다. 따라서, 본 연구에서는 이에 대한 해결책으로 로지스틱 회귀를 이용하여 배수분구별 침수 발생기준 강우량을 산정하고자 한다. 침수 발생 한계강우량 산정을 배수분구 단위로 제시하기 위하여 로지스틱 회귀분석을 이용하였다. 풍수해저감종합계획(2015)과 침수흔적도를 이용하여 배수분구 별 침수이력에 대한 데이터베이스를 구축하고, 이를 1-2차원 수리해석을 통한 침수심과 함께 로지스틱 회귀모형에 학습하였다. 지속시간 1시간, 10mm 강우부터 500년 빈도의 Huff 3분위 시나리오 17개를 사용하여 확률강우량을 산정하였고, 이를 1-2차원 수리해석을 위한 입력자료로 사용하였다. EPA-SWMM을 통한 1차원 도시유출해석과 FLO-2D를 통한 2차원 침수해석에서 20cm 이상의 침수심이 발생하거나 지상관측자료, 침수흔적도 및 풍수해저감종합계획에서 실제 침수가 발생했을 경우를 1, 그렇지 않은 경우를 0으로 하여 데이터베이스를 구축하여 로지스틱 회귀모형에 학습시켜 침수 발생 한계강우량을 산정하였다. 로지스틱 회귀분석을 통해 서울시 지역의 배수분구별 한계강우량을 산정할 수 있으며, 지속적으로 관측되는 강우 및 침수 발생 유무 자료를 추가함으로써 산정된 침수 한계강우량을 상회하는 강우 사상이 나타났을 시에 침수 발생 유무를 확인하여 본 연구에서 제안한 방법에 대해 검증이 가능할 것으로 보인다.

  • PDF

다중회귀모형과 인공신경망모형을 이용한 금강권역 강수량 장기예측 (Application of multiple linear regression and artificial neural network models to forecast long-term precipitation in the Geum River basin)

  • 김철겸;이정우;이정은;김현준
    • 한국수자원학회논문집
    • /
    • 제55권10호
    • /
    • pp.723-736
    • /
    • 2022
  • 본 연구에서는 금강권역을 대상으로 최대 12개월까지 선행예측이 가능한 월 강수량 예측모형을 구축하였으며, 예측모형 구축에는 다중회귀분석과 인공신경망의 두 가지 통계적 기법을 적용하였다. 예측인자 후보로 NOAA에서 제공하는 글로벌 기후패턴 39종과 금강권역에 대한 기상인자 8종 등 총 47종의 기후지수를 활용하였다. 예측대상월을 기준으로 과거 40년간의 월 강수량과 기후지수와의 지연상관성 분석을 통해 상관도가 높은 기후지수를 예측인자로 활용하여 다중회귀모형 및 인공신경망 모형을 구축하였다. 1991~2021년에 대해 매월 예측결과의 평균값과 관측값과의 적합도를 분석한 결과, 다중회귀모형은 PBIAS -3.3~-0.1%, NSE 0.45~0.50, r 0.69~0.70으로 분석되었으며, 인공신경망모형은 PBIAS -5.0~+0.5%, NSE 0.35~0.47, r 0.64~0.70로, 다중회귀모형에 의해 도출된 예측치의 평균값이 인공신경망모형보다 관측치에 좀 더 근접한 것으로 나타났다. 각 월의 예측범위 안에 관측치가 포함될 확률을 분석한 결과에서는 다중회귀모형이 57.5~83.6%(평균 72.9%), 인공신경망모형의 경우에는 71.5~88.7%(평균 81.1%)로 인공신경망모형 결과가 우수한 것으로 나타났다. 3분위 예측확률을 비교한 결과는 다중회귀모형의 경우에는 25.9~41.9%(평균 34.6%), 인공신경망모형은 30.3~39.1%(평균 34.7%)로 비슷하며, 두 모형 모두 평균 33.3% 이상으로 월 강수량에 대한 장기예측성을 확인 할 수 있었다. 이상과 같이 두 모형의 예측성 차이는 비교적 크지 않은 것으로 나타났으나, 예측범위에 대한 적중률이나 3분위 예측확률로부터 판단할 때 예측성에 대한 월별 편차는 인공신경망모형의 결과가 상대적으로 작게 나타났다.

비홍수량 산정 방법의 개발 (Development of an Estimation Method for Specific Flood)

  • 정종호;박정훈;윤용남
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2005년도 학술발표회 논문집
    • /
    • pp.230-239
    • /
    • 2005
  • 유역특성을 충분히 고려한 비홍수량 산정 공식을 유도하여 개략적인 홍수량 산정 및 홍수량 범위 예측 등을 가능하게 하는 것의 실무적 필요성이 대두되고 있다. 이에 따라 홍수량 산정의 주요 입력인자 조건을 설정하고 이들 조합에 의한 홍수량 산정 결과를 회귀분석함으로써 유역특성을 충분히 고려하고 일종의 지역빈도해석 개념의 비홍수량 산정 공식을 제시하고자 한다. 이를 위하여 유역형상은 타원형, 강우량은 50년빈도 전국평균 확률강우량, 강우분포는 Huff 방법의 전국평균 4분위, CN은 80, 유입시간은 10분, 평균유속은 3.0m/sec의 조건을 기준조합으로 채택하고, 홍수량 산정 모형은 Clark 단위도법 및 Sabol 공식을 적용하여 기준조합의 비홍수량 회귀식을 유도한 다음, 각종 인자들의 변화에 따른 비홍수량의 변화를 추가로 고려할 수 있는 회귀 식을 제시하였다.

  • PDF

복합 분위수 회귀에 대한 붓스트랩 방법의 응용 (Bootstrapping Composite Quantile Regression)

  • 서강민;방성완;전명식
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.341-350
    • /
    • 2012
  • 선형 회귀모형에서 오차항들이 서로 독립이고 동일한 분포를 따른다고 가정할 경우, (회귀계수의 강건한 추정을 위하여) 모든 분위수 함수의 회귀계수가 동일한 값을 갖는다는 사실에 근거한 복합 분위수 회귀(composite quantile regression) 방법을 고려할 수 있다. 본 논문에서는 복합 분위수 회귀에서 사용되는 분위수의 개수를 선택하기 위해 붓스트랩 방법의 가능성을 검토하였다. 또한, 분위수 회귀와 복합 분위수 회귀의 성능을 비교하기 위해 붓스트랩 방법을 이용하여 신뢰구간을 구축하고, 이들의 포함확률과 평균길이를 비교하였다. 이러한 모의실험을 통하여 복합 분위수 회귀의 우월성과 통계적 추론에 있어서 붓스트랩 방법의 유용성을 확인하였다.