• 제목/요약/키워드: Generalized Pareto distribution

검색결과 63건 처리시간 0.026초

On Efficient Estimation of the Extreme Value Index with Good Finite-Sample Performance

  • Yun, Seokhoon
    • Journal of the Korean Statistical Society
    • /
    • 제28권1호
    • /
    • pp.57-72
    • /
    • 1999
  • Falk(1994) showed that the asymptotic efficiency of the Pickands estimator of the extreme value index $\beta$ can considerably be improved by a simple convex combination. In this paper we propose an alternative estimator of $\beta$ which is as asymptotically efficient as the optimal convex combination of the Pickands estimators but has a better finite-sample performance. We prove consistency and asymptotic normality of the proposed estimator. Monte Carlo simulations are conducted to compare the finite-sample performances of the proposed estimator and the optimal convex combination estimator.

  • PDF

우리나라의 연 강수량, 계절 강수량 및 월 강수량의 확률분포형 결정 (The Determination of Probability Distributions of Annual, Seasonal and Monthly Precipitation in Korea)

  • 김동엽;이상호;홍영주;이은재;임상준
    • 한국농림기상학회지
    • /
    • 제12권2호
    • /
    • pp.83-94
    • /
    • 2010
  • 본 연구의 목적은 우리나라의 연 강수량, 계절 강수 량 그리고 월 강수량의 최적 확률분포형을 선정하는 것이다. 이를 위해서 전국 32개의 강우 관측소에서 얻은 자료에 대하여 L-모멘트 비 다이어그램과 평균가중거리 값을 이용하여 각 강수량별 최적 확률분포를 산정하였으며, 최종적으로 선정된 최적 확률분포형을 관측 지점별로 적합도 검정을 실시하였다. 그 결과, 연강수량에서는 3변수 Weibull 분포(W3), 봄과 가을에는 3변수 대수정규분포(LN3), 여름과 겨울에는 일반화된 극치분포(GEV)가 관측값에 가장 잘 적합하는 것으로 나타났다. 또한, 월 강수량에서는 1월은 LN3, 2월과 7월은 W3, 3월은 2변수 Weibull 분포(W2), 4월, 9월, 10월, 11월은 일반화된 Pareto 분포(GPA), 5월과 6월은 GEV, 그리고 8월과 12월은 log-Pearson type III 분포(LP3)가 가장 잘 적합하였다. 하지만, 최적 확률분포형의 지점별 적합도 검정의 결과, 1월, 4월, 9월, 10월, 11월의 GPA와 LN3에 대한 기각율이 확률 분포의 매개변수 추정에서의 오류와 상대적으로 높은 AWD 값으로 인하여 매우 높게 나타났다. 한편, 23개 관측소의 자료를 추가하여 분석해본 결과 기존의 32개 의 관측소 자료를 이용한 것과 큰 차이를 나타내지 않았다. 종합적으로 보다 적합한 확률분포형을 선정하기 위해서는 더 장기간의 표본자료를 이용한 추가적인 연구가 필요할 것으로 판단된다.

Burr XII 모형을 이용한 우리나라 극한 강우자료 빈도해석 (Frequency Analyses for Extreme Rainfall Data using the Burr XII Distribution)

  • 서정호;신주영;정영훈;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.335-335
    • /
    • 2018
  • 최근 이상기후현상으로 지구상의 여러 지역에서 극치 수문 사상의 발생 빈도와 강도가 날로 증가하고 있는 추세이다. 이에 대해 수공구조물의 설계를 위한 극치강우사상의 빈도해석에 있어서 적절한 확률분포모형의 적용은 매우 중요하다. 이에 수문통계분야에서는 generalized extreme value(GEV), generalized logistic(GLO), Gumbel(GUM) 모형과 같은 극치 분포를 이용한 수문통계적 특성에 대한 접근이 주로 이루어지고 있다. 하지만 우리나라 강우 사상의 경우 GEV 분포와 GUM 분포가 비교적 적합한 것으로 알려져 있지만 하나의 형상매개변수를 가지고 있어 분포 모형이 표현할 수 있는 통계적 특성에 한계를 가지고 있다. 기존의 GEV나 GUM분포로는 적절히 재현되지 않는 자료들을 분석하기 위해서 두 개의 형상매개변수를 가지는 분포형에 대한 연구가 진행되고 있다. 이에 본 연구에서는 두 개의 형상매개변수를 가지는 Burr XII 분포형의 우리나라 극한 강우자료에 대한 적용성을 평가하였다. Burr XII 분포형은 gamma나 exponential 분포 모형처럼 양의 확률변수만을 가지고, Cauchy나 Pareto 분포 모형처럼 두꺼운 꼬리(heavy-tailed distribution) 형상을 나타내기 때문에 비교적 큰 확률변수가 빈번히 나타나는 극치사상에도 적합한 것으로 알려져 있다. 이를 위해 Burr XII 분포 모형을 이용하여 우리나라 강우자료에 대해 지점빈도해석 및 지역빈도해석을 수행하고 우리나라 강우자료에 비교적 적합하다고 알려진 분포인 GEV, GLO, GUM 분포형을 통해 산정된 결과와 비교하였다.

  • PDF

Copula 함수를 이용한 호우사상의 빈도해석 산정 (Estimation of storm events frequency analysis using copula function)

  • 안희진;이문영;김시연;전설;안영민;정동화;박대룡
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.200-200
    • /
    • 2022
  • 본 연구에서는 총 강우량과 강우강도을 고려한 이변수 분석으로 연최대 호우사상을 선별하고, 두 변수를 Copula 함수로 결합하여 최적의 모델조합을 찾는 확률호우사상 산정 방법론을 제시하였다. 국내 69개 관측소의 2020년까지의 관측 자료를 대상으로 1mm 이하의 강우는 제거한 뒤, IETD(Inter-Event Time Definition) 12시간을 기준으로 강우자료를 독립적인 호우사상으로 분리하였다. 호우사상의 여러 특성 중 양의 상관관계를 갖는 총 강우량과 강우강도를 변수로 선택해 이변수 지수분포에 대입하였고, 각 지점의 연최대 호우사상 시계열을 생성하였다. 2변수 지수분포의 매개변수는 전체 기간과 연도별로 나누어 추정해 본 결과 연도별 변동성이 큰 것을 확인해 연도별 추정 방식을 선택하였다. 연최대 강우사상 시계열의 총 강우량과 강우강도는 극한 강우에 적용하는 확률분포형 중 Lognarmal, Gamma, Gumbel, GEV(Generalized Extreme Value), GPD(Generalized Pareto Distribution) 5가지를 사용하여 각각 CDF(Cumulative distribution Function) 값을 추정하였다. 계산된 CDF 값은 3가지 Copula 모형으로 결합해 joint CDF 값을 산출하였다. 총 75개의 모델조합 중 최적 모델을 찾기 위해 CVM(Cramer-von-Mises) 적합도 검정을 시행하였다. CVM의 통계량 Sn 값이 가장 작은 모델조합을 해당 지점의 최적 모델조합으로 선정하였다.

  • PDF

경험모의기법을 이용한 한반도 주변 해역에서의 극치해면 분석 (Extreme Sea Level Analysis in Coastal Waters around Korean Peninsula Using Empirical Simulation Technique)

  • 서경덕;양영철;전기천;이동영
    • 한국해안·해양공학회논문집
    • /
    • 제21권3호
    • /
    • pp.254-265
    • /
    • 2009
  • 해양 및 해안의 구조물 설계 시 극치해면 연구가 필수적이다. 본 논문에서는 한반도 주변의 무역항과 연안항 총 52개 항에서 수치모의 된 폭풍해일 자료를 연최대치 시계열 방법, 부분 시계열 방법, 경험모의기법을 이용하여 빈도분석을 수행한 후 비교하였다. 연최대치 시계열 방법과 부분 시계열 방법에서 매개변수 추정을 위해 최우도법을 사용하였다. 분포는 Generalized Pareto 분포를 사용하였고 적합성은 5% 유의수준으로 $\chi^2$ 및 K-S 검정을 수행하였다. 또한, 경험모의기법에 조석을 추가하여 극치해면을 산정하였으며 정 등(2008)이 제시한 극치 해면과 비슷한 값을 나타내었다.

Application of deterministic models for obtaining groundwater level distributions through outlier analysis

  • Dae-Hong Min;Saheed Mayowa Taiwo;Junghee Park;Sewon Kim;Hyung-Koo Yoon
    • Geomechanics and Engineering
    • /
    • 제35권5호
    • /
    • pp.499-509
    • /
    • 2023
  • The objective of this study is to perform outlier analysis to obtain the distribution of groundwater levels through the best model. The groundwater levels are measured in 10, 25 and 30 piezometers in Seoul, Daejeon and Suncheon in South Korea. Fifty-eight empirical distribution functions were applied to determine a suitable fit for the measured groundwater levels. The best fitted models based on the measured values are determined as the Generalized Pareto distribution, the Johnson SB distribution and the Normal distribution for Seoul, Daejeon and Suncheon, respectively; the reliability is estimated through the Anderson-Darling method. In this study, to choose the appropriate confidence interval, the relationship between the amount of outlier data and the confidence level is demonstrated, and then the 95% is selected at a reasonable confidence level. The best model shows a smaller error ratio than the GEV while the Mahalanobis distance and outlier labelling methods results are compared and validated. The outlier labelling and Mahalanobis distance based on median shown higher validated error ratios compared to their mean equivalent suggesting, the methods sensitivity to data structure.

국제현물원유가의 일일 상승 및 하락율의 극단값 분석 (Analysis of Extreme Values of Daily Percentage Increases and Decreases in Crude Oil Spot Prices)

  • 윤석훈
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.835-844
    • /
    • 2010
  • 극단값 통계 분석의 도구로는 전통적인 연간 최대값 방법과 현대적인 분계점 방법, 그리고 분계점 방법을 개선한 변형체 등으로 분류할 수 있다. 연간 최대값 방법은 시계열자료의 연간 최대값들에 대하여 일반화극단값분포를 적합시키는 것이고, 분계점 방법은 충분히 큰 하나의 분계점을 넘어서는 초과값들의 초과여분들에 대하여 일반화파레토분포를 적합시키는 것이다. 분계점 방법의 한 변형체로서 본 논문에서는 분계점 방법에 추가적으로 초과값들의 전체 개수가 포아송분포를 따른다고 가정하는 포아송-GPD 방법을 다루고, 이를 1988.01.04부터 2009.12.31까지 수집된 서부텍사스산중질유의 현물가격 자료로부터 계산된 일일 상승율과 일일 하락율에 적용한다. 이에 따르면 일일 상승율과 일일 하락율의 분포는 정규분포와 달리 두터운 꼬리를 갖는 분포로 나타났는데, 이는 오늘날의 많은 금융 자료분석에서 나타나는 일반적인 현상과 잘 부합하는 것이다.

Peacks over threshold를 이용한 Value at Risk: 모수추정 방법론의 비교 (Value at Risk with Peaks over Threshold: Comparison Study of Parameter Estimation)

  • 강민정;김지연;송종우;송성주
    • 응용통계연구
    • /
    • 제26권3호
    • /
    • pp.483-494
    • /
    • 2013
  • 국제적인 금융위기가 연달아 발생하면서, 금융리스크관리의 중요성이 어느 때보다 더 커지고 있다. 금융리스크관리의 주요 현안 가운데 하나는 리스크를 어떻게 측정할 것인가이며, 가장 널리 사용되고 있는 방법이 Value at Risk(VaR)이다. 금융자료가 최근 시장에서처럼 두꺼운 꼬리를 갖는 분포를 보일 때, 우리는 극단치 이론을 이용하여 VaR를 측정하는 방법을 고려할 수 있다. 이 논문에서는 꼬리가 매우 두꺼운 분포를 갖는 자료를 적합시킬 때 많이 사용되는 Peaks over Threshold(POT)를 이용하여 VaR를 측정하는 방법을 연구하였다. POT를 이용하기 위해서는 우선 일반화 파레토 분포(GPD)의 모수를 추정해야 하는데, 여기서 우리는 KOSPI 5분 자료를 이용하여 추정된 VaR의 성능을 살펴봄으로써 세 가지 다른 모수추정 방법을 비교하였다. 또한, Normal Inverse Gaussian(NIG) 분포에서 자료를 생성하여 두 가지 다른 모수추정 방법을 비교하기도 하였다. 이러한 비교를 통하여 KOSPI 수익률 자료의 첨도가 매우 큰 경우에는 최근 제안된 모수추정 방법들이 최대가능도 추정법에 비해 월등히 나은 성능을 보임을 알 수 있었고, 모의실험 자료에서도 같은 결과를 확인하였다.

주식수익률의 VaR와 ES 추정: GARCH 모형과 GPD를 이용한 방법을 중심으로 (Estimation of VaR and Expected Shortfall for Stock Returns)

  • 김지현;박화영
    • 응용통계연구
    • /
    • 제23권4호
    • /
    • pp.651-668
    • /
    • 2010
  • 금융 포트폴리오의 두 위험측도인 VaR와 ES에 대한 여러 추정방법을 1일 후와 10일 후의 경우로 나누어 각각 비교하였다. 2008년 미국발 세계 금융위기 기간을 포함한 KOSPI 자료와 해외 5개국의 종합주가지수 자료를 이용하여 실증적으로 비교하였다. 손실 분포의 두터운 꼬리와 조건부 이분산성을 동시에 고려하는 방법을 중심으로 여러 방법을 추가적으로 고려하였고, 국내 자료에 어떤 방법이 적절하며 종합적인 성능은 어떤가를 살펴보았다.

꼬리가 두꺼운 분포의 고분위수에 대한 신뢰구간 (Confidence Intervals for High Quantiles of Heavy-Tailed Distributions)

  • 김지현
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.461-473
    • /
    • 2014
  • 꼬리가 두꺼운 분포의 고분위수에 대한 신뢰구간을 연구하였다. 통계량의 극한 분포에 근거한 점근적 방법과 붓스트랩 방법을 같이 고려하였다. 이 두 방법에 모수적, 비모수적, 준모수적 기법을 각각 적용할 수 있는데, 전체 11가지 신뢰구간의 성능을 실제신뢰수준과 길이로 비교하였다. 모의실험 결과 준모수적이면서 점근적인 신뢰구간과 축량을 이용하는 준모수적 붓스트랩 신뢰구간이 실제신뢰수준의 기준에서 안정된 성능을 보인다는 것을 알 수 있었다.