• 제목/요약/키워드: 분위수

검색결과 82건 처리시간 0.021초

일반화 서포트벡터 분위수회귀에 대한 연구 (Generalized Support Vector Quantile Regression)

  • 이동주;최수진
    • 산업경영시스템학회지
    • /
    • 제43권4호
    • /
    • pp.107-115
    • /
    • 2020
  • Support vector regression (SVR) is devised to solve the regression problem by utilizing the excellent predictive power of Support Vector Machine. In particular, the ⲉ-insensitive loss function, which is a loss function often used in SVR, is a function thatdoes not generate penalties if the difference between the actual value and the estimated regression curve is within ⲉ. In most studies, the ⲉ-insensitive loss function is used symmetrically, and it is of interest to determine the value of ⲉ. In SVQR (Support Vector Quantile Regression), the asymmetry of the width of ⲉ and the slope of the penalty was controlled using the parameter p. However, the slope of the penalty is fixed according to the p value that determines the asymmetry of ⲉ. In this study, a new ε-insensitive loss function with p1 and p2 parameters was proposed. A new asymmetric SVR called GSVQR (Generalized Support Vector Quantile Regression) based on the new ε-insensitive loss function can control the asymmetry of the width of ⲉ and the slope of the penalty using the parameters p1 and p2, respectively. Moreover, the figures show that the asymmetry of the width of ⲉ and the slope of the penalty is controlled. Finally, through an experiment on a function, the accuracy of the existing symmetric Soft Margin, asymmetric SVQR, and asymmetric GSVQR was examined, and the characteristics of each were shown through figures.

다변량 정규분포에서 대안적인 VaR의 특성 (Properties of alternative VaR for multivariate normal distributions)

  • 홍종선;이기쁨
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1453-1463
    • /
    • 2016
  • 가장 선호하는 금융위험 측정 방법은 통계적으로 최대손실금액을 추정하는 VaR (Value at Risk)이다. 포트폴리오를 구성하는 여러 산업에 대한 VaR (Value at Risk)는 분산공분산 행렬과 특정한 포트폴리오가 포함되어 변환된 일변량 위험을 이용하여 추정한다. Hong 등 (2016)은 다변량 분위벡터를 바탕으로 Vector at Risk를 정의하였으며, 특정한 포트폴리오가 설정되면 Vector at Risk 중의 한 점을 최적의 VaR 즉, 대안적인 VaR (AVaR)로 제안하였다. 본 연구에서는 다변량 정규분포에 대하여 AVaR의 특성을 탐색한다. 여러 종류의 분산공분산 행렬과 다양한 포트폴리오 가중값 벡터인 경우의 이변량과 삼변량의 정규분포를 따르는 모의실험 자료와 실증예제를 이용하여 대안적인 최대손실금액인 AVaR을 구하고 VaR과 비교 분석한다. 다변량 분위벡터를 이용한 AVaR는 VaR보다 작게 추정함을 발견하였으며, 이런 특징과 함께 AVaR의 특성을 토론한다.

모의실험을 기반으로 지수형 응답률 보정을 위한 세부 층 결정에 관한 연구 (A study on the determination of substrata using the information of exponential response rate by simulation studies)

  • 민주원;신기일
    • 응용통계연구
    • /
    • 제31권5호
    • /
    • pp.621-636
    • /
    • 2018
  • 정보적 표본설계 기법을 적용하여 무응답의 영향을 줄이기 위한 연구가 진행되고 있다. 특히 초모집단모형(super population model)에 포함된 오차의 분포가 정규분포를 따르고 응답률이 지수함수를 따를 때 지수형 응답률 정보를 모수추정에 사용함으로써 추정의 정확성이 향상되는 것으로 알려져 있다. 최근 Chung과 Shin (2017)은 정보적 표본설계의 가중치를 구하기 위해 세부 층을 등간격으로 나누는 방법을 고려하였으며 세부 층의 개수가 추정의 정확성에 영향을 주는 것을 확인하였다. 이에 본 연구에서는 주어진 표본 규모에 따른 최적의 세부 층 개수와 최적의 층 경계를 구하기 위해 등간격, 분위수, LH 알고리즘을 이용하여 층을 나누는 방법을 살펴보았으며 모의실험을 통하여 각 방법의 결과를 비교하였다. 또한 다양한 형태의 보조변수 분포를 이용하여 실무에서 사용할 수 있는 세부 층 경계와 세부 층 개수를 정하는 기준을 제안하였다.

RC 부재 휨 실험에 의한 GFRP 보강근의 이음길이 제안 (Splice Length of GFRP Rebars Based on Flexural Tests of Unconfined RC Members)

  • 최동욱;천성철;하상수
    • 콘크리트학회논문집
    • /
    • 제21권1호
    • /
    • pp.65-74
    • /
    • 2009
  • 이형철근의 부식이 우려되는 경우, GFRP 보강근의 사용이 사용될 수 있다. 이 연구에서는 GFRP 보강근으로 보강된 총 36개 보 및 일방향 슬래브의 휨 실험을 수행하였다. 4종의 GFRP 보강근을 실험에 사용하였고, 보강근 직경은 13 mm이었다. 대부분의 실험체의 보강근은 중앙부에서 겹침이음되었다. 모든 보 및 슬래브는 4점재하 되었으므로, 이음부는 균일한 모멘트를 받도록 계획하였다. 실험변수는 이음길이, 피복두께 및 보강근 간격이었다. 보수적으로 부착강도를 평가하기 위하여 이음부에는 스터럽을 사용하지 않았다. 실험결과 보강근과 콘크리트 간 발생한 부착응력을 비선형 단면해석을 통하여 결정하였다. 2변수 선형 회귀분석을 사용하여 평균부착강도의 예측식을 유도하였다. 5% 분위수 개념을 사용하여 이음길이 설계식을 제안하였다. 이 연구의 결과로 이론적인 이음길이 설계식이 제안되었으며 결과를 ACI 440 정착설계식과 비교하였다.

한국의 세대 간 경제적 이동성 - 분위수회귀분석을 중심으로 - (Intergenerational economic mobility in Korea using a quantile regression analysis)

  • ;정기호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권4호
    • /
    • pp.715-725
    • /
    • 2014
  • 본 연구는 분위수회귀분석을 이용하여 한국의 세대 간 경제적 이동성을 분석한다. 분석에는 1998년부터 2008년까지의 한국노동패널조사 (KLIPS) 자료가 이용되었다. 분석결과, (1) 부모 소득영향력은 자녀소득의 조건부분포의 하위 분위수에서는 상대적으로 작고 상위 분위수로 갈수록 더 커지는 것으로 나타났다. 이것은 자녀소득 분포의 상위분위수로 갈수록 세대 간 경제적 이동성은 떨어지며 가구별 경제적 신분이 세대에 걸쳐 고착될 가능성이 높아지는 것을 의미한다. (2) 한편 교육효과를 제어하면 이러한 부모 소득 영향력은 감소하였다. (3) 대학교육 효과는 소득분포의 상위 분위수로 갈수록 더 높아져서 자녀의 대학교육이 세대 간에 소득이 이전되는 중요한 통로인 것으로 나타났다. (4) 마지막으로 분위수회귀분석결과로부터 자녀소득의 조건부분포를 비모수적으로 추정하고 추정된 곡선 그림을 이용하여 추가적인 시각적 특징들을 도출하였다.

가중 포트폴리오에서의 CTE (CTE with weighted portfolios)

  • 홍종선;신동식;김재영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.119-130
    • /
    • 2017
  • 다변량 분포에서의 VaR (Value at Risk)와 CTE (Conditional Tail Expectation)에 관한 많은 연구문헌에서는 특정한 포트폴리오 구성비를 이용하여 일변량 분포로 변환하여 추정하였다. 다변량 분포에서 분위수에 관한 많은 연구가 존재한다. 그러나 분위수가 유일하게 존재하지 않으므로, VaR와 CTE의 추정에 어려움이 있다. 본 연구에서는 다변량 분위 벡터를 이용한 대안적인 VaR와 통합적인 다변량 CTE의 연구를 확장하여, 여러 종류의 포트폴리오로 구성된 다양한 비율 조합에 따른 가중 CTE 벡터들을 제안한다. 일변량에 대한 CTE 관계식을 다차원의 관계식으로 확장하고, 일변량의 관계식과의 특징과 차이점에 대하여 토론한다. 정규분포로부터 추출한 자료와 실증 예제를 통하여 본 연구에서 제안한 가중 CTE를 탐색하면서 가중 CTE의 활용성과 장점을 유도한다.

사면파괴 유형별 강우 한계선 설정 (Landslide Triggering Rainfall Threshold Based on Landslide Type)

  • 이지성;김윤태;송영갑;장대흥
    • 한국지반공학회논문집
    • /
    • 제30권12호
    • /
    • pp.5-14
    • /
    • 2014
  • 국내 대부분의 사면파괴는 6월~9월에 발생하며, 이러한 사면파괴는 사회적으로 큰 손실을 유발한다. 사면파괴의 주요 원인은 강우강도(Intensity, I)와 강우기간(Duration, D)이다. 본 연구에서는 강우강도-기간(I-D)을 고려한 사면파괴 유발 강우 한계선(rainfall threshold)을 제안하였다. 본 연구를 위해서 국립재난안전연구원과 다양한 보고서 및 매체 그리고 현장조사를 통해서 1999년부터 2012년까지 풍화토 지반에서 유발된 255개 재해이력 자료를 수집하였다. 그리고 기상청의 강우자료를 바탕으로 사면파괴가 발생한 시점의 전 후의 시간에 대한 강우량 데이터를 수집하였다. 수집된 재해이력과 강우량 데이터베이스를 바탕으로 사면파괴를 유형별(토석류, 얕은 사면파괴 등)로 분류하고, 통계적 기법인 분위수 회귀분석을 이용하여 강우강도 및 기간을 분석함으로써 강우 한계선을 제안하였다. 뿐만 아니라 2013년의 재해이력 자료를 통해 제안된 한계선의 검증을 수행하였다. 또한 국외의 한계선과 제안된 한계선을 비교 분석하였다. 본 연구에서 제안된 강우 한계선은 산사태 예 경보시스템을 구축할 때 기초자료로 사용될 수 있다고 판단된다.

역가우스분포에 대한 적합도 평가를 위한 그래프 방법 (A Graphical Method to Assess Goodness-of-Fit for Inverse Gaussian Distribution)

  • 최병진
    • 응용통계연구
    • /
    • 제26권1호
    • /
    • pp.37-47
    • /
    • 2013
  • Q-Q 플롯은 자료에 대한 분포적 가정을 평가하기 위해서 사용되는 편리하고 효과적인 그래프 방법이다. Q-Q 플롯은 자료의 분포와 이론적 분포를 비교하기 위한 확률플롯으로 자료에서의 분위수와 이에 대응하는 이론적 분위수를 각각 수직축과 수평축으로 해서 그린 산점도의 형태를 취한다. 본 논문에서는 확률변수 X가 위치모수 ${\mu}$와 척도수 ${\lambda}$를 가지는 역가우스분포를 따르면, 변환된 확률변수 $Y={\mid}\sqrt{\lambda}(X-{\mu})/{\mu}\sqrt{X}{\mid}$는 평균이 0이고 분산이 1인 표준반접정규분포를 하게 되는 분포적 결과를 활용하여 역가우스분포 Q-Q 플롯의 구축방법을 소개한다. 역가우스분포와 다른 분포를 따르는 자료를 대상으로 그린 Q-Q 플롯에서 나타나는 점들의 형태를 알아보고자 모의실험을 수행하고 그 결과를 제시한다. 실제 자료에 대한 사례분석을 통해 제안한 Q-Q 플롯의 유용성을 보인다.

회귀나무 모형을 이용한 패널데이터 분석 (Panel data analysis with regression trees)

  • 장영재
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1253-1262
    • /
    • 2014
  • 회귀나무 (regression tree)는 독립변수로 이루어진 공간을 재귀적으로 분할하고 해당 영역에서 종속변수의 최선의 예측값을 찾고자 하는 비모수적 방법론이다. 회귀나무 모형이 제안된 이래 로지스틱 회귀나무모형이나 분위수 회귀나무모형과 같이 유연하고 다양한 모형적합을 위한 연구가 진행되어 왔다. 최근에 들어서는 Sela와 Simonoff (2012)의 RE-EM 알고리즘, Loh와 Zheng (2013)의 GUIDE 등 패널데이터와 관련하여 진일보한 나무모형 알고리즘도 제안되었다. 본 논문에서는 각 알고리즘을 소개하고 특징을 살펴보는 한편, 실험 데이터를 생성하여 평균제곱오차 (mean squared error)를 바탕으로 예측력을 비교하였다. 분석결과, RE-EM 알고리즘의 예측력이 상대적으로 우수하게 나타났다. 이 알고리즘을 통해 기업경기실사지수 업종별 패널자료를 분석한 결과 최근의 업황에 가장 큰 영향을 미치는 요소는 매출 실적으로 나타났으며 매출 상위 그룹의 경우 비제조업이 제조업에 비해 업황에 대한 판단이 긍정적인 것으로 나타났다.

패널 분위수회귀 모형을 사용한 우리나라 지방 상수도 생활용수 수요의 가격탄력성 추정 (Estimating Price Elasticity of Residential Water Demand in Korea Using Panel Quatile Model)

  • 김형건
    • 자원ㆍ환경경제연구
    • /
    • 제27권1호
    • /
    • pp.195-214
    • /
    • 2018
  • 우리나라에서도 최근 잦아진 가뭄으로 물 부족에 대한 경각심이 높아졌다. 특히, 2015년의 가뭄은 경제적으로 큰 피해를 야기하였고 적극적인 물 수요 관리의 필요성을 부각시킨 계기가 되었다. 경제학적 측면에서 수요관리 정책을 설계하기 위해 선행되어야 될 점 중 하나는 신뢰성 있는 가격탄력성의 추정이다. 그러므로 본 연구에서는 기존 국내 선행연구들에 비해 강건한 생활용수 수요의 가격탄력성을 추정하고자 한다. 이를 위해 2010년도에서 2013년도까지 지방 상수도 공급지역 161개의 자료를 패널 분위수회귀모형을 사용해 추정하였고 이를 패널자료 회귀모형의 결과와 비교 분석하였다. 분석 결과, 생활용수 수요의 가격탄력성은 -0.156에서 -0.189 사이의 값을 갖는 것으로 추정되었다. 또한 본 연구에서는 조건부 평균 회귀를 사용하는 경우 왼쪽꼬리가 길고 오른쪽 분포가 두꺼운 우리나라 생활용수 수요량 분포의 특징으로 수요량이 많은 지역들의 성향이 추정결과에 상대적으로 크게 반영된다는 점을 확인하였다.