• 제목/요약/키워드: Quantile regression

검색결과 200건 처리시간 0.029초

A concise overview of principal support vector machines and its generalization

  • Jungmin Shin;Seung Jun Shin
    • Communications for Statistical Applications and Methods
    • /
    • 제31권2호
    • /
    • pp.235-246
    • /
    • 2024
  • In high-dimensional data analysis, sufficient dimension reduction (SDR) has been considered as an attractive tool for reducing the dimensionality of predictors while preserving regression information. The principal support vector machine (PSVM) (Li et al., 2011) offers a unified approach for both linear and nonlinear SDR. This article comprehensively explores a variety of SDR methods based on the PSVM, which we call principal machines (PM) for SDR. The PM achieves SDR by solving a sequence of convex optimizations akin to popular supervised learning methods, such as the support vector machine, logistic regression, and quantile regression, to name a few. This makes the PM straightforward to handle and extend in both theoretical and computational aspects, as we will see throughout this article.

패널 분위수회귀 모형을 사용한 우리나라 지방 상수도 생활용수 수요의 가격탄력성 추정 (Estimating Price Elasticity of Residential Water Demand in Korea Using Panel Quatile Model)

  • 김형건
    • 자원ㆍ환경경제연구
    • /
    • 제27권1호
    • /
    • pp.195-214
    • /
    • 2018
  • 우리나라에서도 최근 잦아진 가뭄으로 물 부족에 대한 경각심이 높아졌다. 특히, 2015년의 가뭄은 경제적으로 큰 피해를 야기하였고 적극적인 물 수요 관리의 필요성을 부각시킨 계기가 되었다. 경제학적 측면에서 수요관리 정책을 설계하기 위해 선행되어야 될 점 중 하나는 신뢰성 있는 가격탄력성의 추정이다. 그러므로 본 연구에서는 기존 국내 선행연구들에 비해 강건한 생활용수 수요의 가격탄력성을 추정하고자 한다. 이를 위해 2010년도에서 2013년도까지 지방 상수도 공급지역 161개의 자료를 패널 분위수회귀모형을 사용해 추정하였고 이를 패널자료 회귀모형의 결과와 비교 분석하였다. 분석 결과, 생활용수 수요의 가격탄력성은 -0.156에서 -0.189 사이의 값을 갖는 것으로 추정되었다. 또한 본 연구에서는 조건부 평균 회귀를 사용하는 경우 왼쪽꼬리가 길고 오른쪽 분포가 두꺼운 우리나라 생활용수 수요량 분포의 특징으로 수요량이 많은 지역들의 성향이 추정결과에 상대적으로 크게 반영된다는 점을 확인하였다.

분위수 부스팅을 이용한 미세먼지 농도 예측 (Particulate Matter Prediction using Quantile Boosting)

  • 권준현;임예지;오희석
    • 응용통계연구
    • /
    • 제28권1호
    • /
    • pp.83-92
    • /
    • 2015
  • 고농도 미세먼지($PM_{10}$)에 노출되는 것은 호흡기 질환 뿐만 아니라 피부, 안구, 심혈관계 질환 등을 야기한다. 따라서 미세먼지 농도를 정확히 예측하는 방법을 개발하는 것은 국민건강과도 깊은 관련이 있다. 현재 국립환경과학원에서는 미세먼지 농도가 높은 "나쁜날씨"를 예측하기 위해 의사결정나무 모형을 사용하고 있다. 그러나 모형 자체의 불안정성은 차치하더라도 의사결정나무는 전체 데이터의 9%밖에 차지하지 않는 "나쁜날씨"를 예측하기에 적합하지 못하다. 본 논문에서는 국립환경과학원에서 사용하는 모형의 부정확성과 부적절성을 제시하는 한편, 분위수 손실 함수를 적용한 새로운 모형의 유용성을 제시한다. 그리고 새로운 모형의 성능을 여러 ${\tau}$ 값에 대해 평가하고 비교를 통해 기존 모형 교체의 타당성을 보인다.

Chinese Corporate Leverage Determinants

  • Ferrarini, Benno;Hinojales, Marthe;Scaramozzino, Pasquale
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제4권1호
    • /
    • pp.5-18
    • /
    • 2017
  • Total debt in the People's Republic of China surged to nearly 290% as a ratio to GDP by the second quarter of 2016, mostly on account of non-financial corporate debt. The outpouring of credit to stem the impact of the global financial crisis accentuated industrial overcapacity in traditional sectors, such as steel, cement, and energy, while feeding asset bubbles in the property, equity and bond markets. At the Chinese corporate level, this has translated into weakened fundamentals and a fall in industrial profits, particularly of SOEs. As debtors struggle to service interest payments, non-performing loans (NPLs) have been on the rise. This paper assesses the financial fragility of the Chinese economy by looking at risk factors in the non-financial sector. We apply quantile regressions to a dataset containing all Chinese listed companies in Standard & Poor's IQ Capital database. We find higher sensitivity over time of corporate leverage to some of its key determinants, particularly for firms at the upper margin of the distribution. In particular, profitability increasingly acts as a curb on corporate leverage. At a time of falling profitability across the Chinese non-financial corporate sector, this eases the brake on leverage and may contribute to its continuing increase.

한반도 극한 기온의 선형 및 비선형 변화 경향 (Linear and Nonlinear Trends of Extreme Temperatures in Korea)

  • 김상욱;송강현;김서연;손석우
    • 대기
    • /
    • 제24권3호
    • /
    • pp.379-390
    • /
    • 2014
  • This study explores the long-term trends of surface air temperatures in 11 KMA stations over the period of 1960~2012. Both linear and nonlinear trends are examined for the $95^{th}$, $50^{th}$, and $5^{th}$ percentiles of daily maximum ($T_{max}$) and minimum temperatures ($T_{min}$) by using quantile regression method. It is found that in most stations linear trends of $T_{max}$ and $T_{min}$ are generally stronger in winter than in summer, and warming trend of the $5^{th}$ percentile temperature (cold extreme) is stronger than that of the $95^{th}$ percentile temperature (warm extreme) in both seasons. The nonlinear trends, which are evaluated by the second order polynomial fitting, show a strong nonlinearity in winter. Specifically, winter temperatures have increased until 2000s but slightly decreased afterward in all percentiles. This contrasts with the $95^{th}$ and $50^{th}$ percentiles of summer $T_{min}$ that show a decreasing trend until 1980s then an increasing trend. While this result is consistent with a seasonal dependence of the recent global warming hiatus, most of the nonlinear trends are statistically insignificant, making a quantitative attribution of nonlinear temperature trends challenging.

사면파괴 유형별 강우 한계선 설정 (Landslide Triggering Rainfall Threshold Based on Landslide Type)

  • 이지성;김윤태;송영갑;장대흥
    • 한국지반공학회논문집
    • /
    • 제30권12호
    • /
    • pp.5-14
    • /
    • 2014
  • 국내 대부분의 사면파괴는 6월~9월에 발생하며, 이러한 사면파괴는 사회적으로 큰 손실을 유발한다. 사면파괴의 주요 원인은 강우강도(Intensity, I)와 강우기간(Duration, D)이다. 본 연구에서는 강우강도-기간(I-D)을 고려한 사면파괴 유발 강우 한계선(rainfall threshold)을 제안하였다. 본 연구를 위해서 국립재난안전연구원과 다양한 보고서 및 매체 그리고 현장조사를 통해서 1999년부터 2012년까지 풍화토 지반에서 유발된 255개 재해이력 자료를 수집하였다. 그리고 기상청의 강우자료를 바탕으로 사면파괴가 발생한 시점의 전 후의 시간에 대한 강우량 데이터를 수집하였다. 수집된 재해이력과 강우량 데이터베이스를 바탕으로 사면파괴를 유형별(토석류, 얕은 사면파괴 등)로 분류하고, 통계적 기법인 분위수 회귀분석을 이용하여 강우강도 및 기간을 분석함으로써 강우 한계선을 제안하였다. 뿐만 아니라 2013년의 재해이력 자료를 통해 제안된 한계선의 검증을 수행하였다. 또한 국외의 한계선과 제안된 한계선을 비교 분석하였다. 본 연구에서 제안된 강우 한계선은 산사태 예 경보시스템을 구축할 때 기초자료로 사용될 수 있다고 판단된다.

셀룰라 이동통신 채널에서 비선형 등화기를 이용한 최적의 데이터 복원 (Optimization of Data Recovery using Non-Linear Equalizer in Cellular Mobile Channel)

  • 최상호;호광춘;김영권
    • 전기전자학회논문지
    • /
    • 제5권1호
    • /
    • pp.1-7
    • /
    • 2001
  • 본 논문에서 역 방향 링크 채널에 대해 비 선형 등화기를 이용하여 CDMA 셀룰라 시스템을 연구하였다. 일반적으로 무선 통신에서 불확실한 채널 특성 때문에 Observable 들의 확률분포는 유한 세트의 파라미터로 규정될 수 없다. 대신에 training 샘플에 기반을 둔 Quantile과 Vector Quantizer를 사용함으로서 유한 수의 disjoint된 영역으로 m차 샘플 공간으로 분할하였다. 제안된 알고리듬은 RMSA 알고리즘에 의해 예측된 Quantile와 조건부 분할 모멘트에 따른 regression function의 부분적인 근사에 근간을 두고 있다. 본 논문의 등화기와 검출기는 잡음 분포의 Variation에 민감하지 않다는 관점에서 상당히 강한 특성을 보여 준다. 주요 아이디어는 Robust equalizer와 Robust partition detector가 어떤 환경의 무선 채널 하에서도 partition되지 않은 Observation space의 일반적인 등화기 보다 Observation의 등 확률로 분할된 부 공간에서 더 낳은 성능을 보여 준다. 또한 이런 개념을 CDMA 시스템에 적용하여 BER 성능을 분석하였다.

  • PDF

문화예술분야 전문인력에 대한 유리천장효과 분석: J산업과 R산업 중심으로 (Glass ceiling in arts and culture professionals: Between J and R industries)

  • 전종섭;허식
    • 문화경제연구
    • /
    • 제21권2호
    • /
    • pp.3-28
    • /
    • 2018
  • 본 연구의 목적은 RIF 무조건 분위회귀에 Oaxaca-Blinder 분해기법을 적용한 분위회귀임금분해를 통해 문화예술분야에 유리천장 현상이 존재하는지를 규명하는 것이다. 문화예술전문인력들이 종사하는 산업의 특성을 고려하여 "문화콘텐츠" 분야(대분류 J산업) 전문인력과"순수예술" 분야(대분류 R산업) 전문인력으로 구분하였고, 분석을 위해 "고용형태별 임금근로조사" 자료에서 2009년부터 2016년까지의 풀링자료를 이용하였다. 주요결과를 요약하면 다음과 같다. 첫째, OLS 임금분해 결과 순수예술 전문인력의 임금격차의 크기는 문화콘텐츠전문인력에 비해 낮게 나타났으나 이를 구성하는 차별부분의 비중은 오히려 더 크게 나타났다. 둘째, 분위회귀 임금분해 결과에서는 문화예술영역의 전문인력에 대한 유리천장효과가 서로 상이한 것으로 나타났다. 문화콘텐츠 전문인력에서는 중위부분 이후로 임금소득의 상위분위로 이동함에 따라 꾸준히 차별부분이 증가하는 지속적인 유리천장효과가 관찰되었고, 순수예술 전문인력에서는 70분위까지 감소하던 차별부분이 80분위와 90분위에서 급격히 상승하여 제한적인 유리천장효과가 고위영역에 집중되는 것이 관찰되었다.

조건부 합성기법과 MODIS LST를 활용한 토양수분 다중분위회귀모형 산정 연구 (A Study on Estimation of Soil Moisture Multiple Quantile Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data)

  • 정충길;이지완;이용관;김세훈;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.23-23
    • /
    • 2018
  • 본 연구에서는 다중분위회귀분석모형(Multiple Quantile Regression Model, MQRM)과 MODIS(MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상관측지점에서 관측한 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중분위회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 71개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중분위회귀분석 모형은 LST 인자를 중심으로 각각의 분위(0.05, 0.25, 0.5, 0.75, 0.95)에 해당되는 값의 회귀식을 NDVI, 강수 입력자료를 독립인자로서 조합하여 계절 및 토성에 따른 총 80개의 회귀식을 산정하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.70 (철원), 0.90 (춘천), 0.85 (수원), 0.65 (서산), 0.78 (청주), 0.82 (전주), 0.62 (순천), 0.63 (진주), 0.78 (보성)로 높은 상관성을 보였다. 본 연구에서는 다중분위회귀 모형의 성능을 검증하기 위해 기존의 다중선형회귀모형의 결과와 비교하여 크게 개선됨을 나타냈다.

  • PDF

분위 회귀 분석을 이용한 비디오로부터의 3차원 인체 복원 (3D Human Reconstruction from Video using Quantile Regression)

  • 한지수;박인규
    • 방송공학회논문지
    • /
    • 제24권2호
    • /
    • pp.264-272
    • /
    • 2019
  • 본 논문은 비디오로부터 추출한 프레임으로부터 3차원 인체 형상과 자세 복원을 수행하고 이를 시간 축에서 자연스럽고 부드러운 움직임을 나타내도록 보정하는 기법을 제안한다. 제안하는 기법은 우선 비디오로부터 추출한 개별 프레임으로부터 convolutional neural network을 이용하여 관절의 위치와 인체의 윤곽을 추정한다. 인체의 형상 및 자세는 매개변수 기반의 3차원 변형가능 모델(morphable model)을 2차원 영상으로 투영후 정합하여 최적의 매개변수 값을 추정한다. 이 때 각 프레임에 대한 복원이 개별적으로 수행되면 시간 축에서 자세의 연속성과 체형의 일관성이 보장되지 못하고 올바르지 못한 복원 결과가 나타난다. 제안하는 기법은 이러한 문제점을 보완하기 위하여 각 프레임으로부터 복원된 3차원 변형가능 모델의 주성분 매개변수의 분석 및 보간을 수행한다. 실험결과 3차원 인체 복원에 오류가 발생한 프레임에 대해 이전과 이후 프레임들 사이의 관계를 통해 오류가 보정되어 개선된 복원 결과를 얻을 수 있음을 보인다.