• 제목/요약/키워드: GPD (generalized Pareto distribution)

검색결과 19건 처리시간 0.027초

한국지역 집중호우에 대한 반환주기의 베이지안 모형 분석 (A Bayesian Analysis of Return Level for Extreme Precipitation in Korea)

  • 이정진;김남희;권혜지;김용구
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.947-958
    • /
    • 2014
  • 집중호우의 특성을 이해하는 것은 수문관리 및 재해방재 등에서 매우 중요하다. 특히 반환주기는 이러한 집중호우의 특성을 나타내는 측정치로 자주 사용된다. 본 논문에서는 베이지안 계층적 모형을 이용하여 강우의 반환주기에 대한 공간구조를 분석하였다. 먼저 국내 62개 지점에서 측정한 강우 강도을 기초로 하여 연간 일일 최대강우량과 특정한 수준을 초과하는 강우량에 대해서 generalized extreme value(GEV)와 generalized Pareto distribution(GPD)를 각각 가정하여 추정하였다. 집중호우 반환주기에 대한 공간구조는 이 GEV 분포와 GPD 분포의 모수에 공간구조를 가지는 다변량 정규분포를 이용하여 설명하였다. 제안된 모형을 국내 76개 지역에서 39년간 측정된 일별 강우량 관측자료에 적용하였다.

GPD 모형 산정을 위한 부분시계열 자료의 임계값 산정방법 비교 (Comparison of Methods of Selecting the Threshold of Partial Duration Series for GPD Model)

  • 엄명진;조원철;허준행
    • 한국수자원학회논문집
    • /
    • 제41권5호
    • /
    • pp.527-544
    • /
    • 2008
  • GPD 모형은 수문학 극치확률량 해석에 주로 적용되어 왔다. 극치 통계의 주목적은 드문 사상의 예측이며, 주요 문제점으로는 임계값 또는 임계값 초과치들에 대한 정확한 산정방법이 없어 그 추정이 매우 어렵다는 것이다. 본 연구에서는 임계값 또는 임계값 초과치들을 산정하기 위하여 4가지 방법을 적용하였다. 그 비교를 위하여 GPD 모형에 적용하여 7개의 지속시간(1, 2, 3, 6, 12, 18 및 24시간)과 10개의 재현기간(2, 3, 5, 10, 20, 30, 50, 70, 80 및 100년)에 대한 매개변수 및 Quantile을 추정하였다. 3변수 GPD의 매개변수 및 Quantile을 추정하기 위하여 MOM, ML과 PWM을 적용하였다. 적합도를 추정하기 위하여 K-S, CVM 및 A-D 검정을 수행하였고 Monte Carlo 실험으로 상대 제곱근오차를 산정하였다. 이러한 방법들을 이용하여 임계값 산정방법들을 비교하여 최적화된 방법을 추정하였다.

시간에 따라 변화하는 로그-정규분포와 파레토 합성 분포의 모형 추정 (Time-varying modeling of the composite LN-GPD)

  • 박소진;백창룡
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.109-122
    • /
    • 2018
  • 임계값을 기준으로 그 보다 작은 값은 로그정규분포(lognormal distribution; LN)를, 큰 값은 일반화파레토분포(generalized Pareto distribution; GPD)를 따르는 합성 분포를 LN-GPD 합성분포라 한다. Scollnik (2007)은 LN-GPD 합성분포가 로그정규분포와 GPD를 합성 시킴으로써 자료의 손실 없이 꼬리가 두꺼운 분포에서 좋은 적합력을 가진다고 밝혔다. 본 논문에서는 시간에 따라 변하는 LN-GPD 평균모형을 다루었으며 방법론으로는 국소 다항최대우도법을 기반으로 추정하는 방법에 대해서 연구하였다. 시간에 따라 변하는 분포를 추정함으로써 자료에 대한 훨씬 자세한 이해가 가능하며 이는 곧 상담원 배치나 자원배분과 같은 운영관리에 큰 도움을 줄 수 있다. 본 연구는 GPD 분포만을 고려한 Beirlant와 Goegebeur (2004)를 확장하여 절삭한 로그정규분포를 추가하여 자료의 손실 없이 자료의 특징을 살펴볼 수 있다는데도 의의가 있다. 모의실험을 통해 제안한 방법론의 적절함을 살펴 보았고 실증 자료 분석으로 이스라엘 은행의 콜센터 서비스 시간에 대해 분석하여 상담원 배치와 관련된 흥미로운 결과를 찾을 수 있었다.

일반화 파레토 분포에서 임계치 결정에 대한 대안적 연구 (An Alternative Study of the Determination of the Threshold for the Generalized Pareto Distribution)

  • 윤정연;조재범;정병철
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.931-939
    • /
    • 2011
  • 일반적으로 일반화 파레토 분포(Generalized Pareto Distribution; GPD)에서 임계치를 결정하는 방법으로는 MEF-그래프나 Hill-그래프를 통한 주관적인 판단을 이용한다는 약점이 존재한다. 본 연구에서는 이와 같은 기존 방법의 약점을 해결하기 위하여 GPD에서 임계치를 결정하는 방법으로 로버스트 추정량을 이용하는 새로운 접근 방법을 제안하였다. 더불어 1987년 1월 5일부터 2009년 8월 3일까지 공시된 KOSPI지수의 일별수익률의 손실부분에 해당하는 왼쪽꼬리부분을 이용하여 실증분석을 실시하였다. 실증분석은 기존의 그래프를 이용한 임계치 결정방법과 본 연구에서 제안한 방법에서 계산된 VaR이 어떤 차이가 존재하는가를 알아보는 방법으로 실시되었다. 분석결과 본 논문에서 제안한 임계치 결정방법에 의하여 계산된 VaR값들은 기존 방법의 VaR과 큰 차이를 보이지 않았다. 아울러 본 연구에서 제안한 임계치 결정방법의 안정성을 파악한 결과 기존 방법과 큰 차이를 보이지 않았다. 이와 같은 결과들을 토대로 본 연구에서 제안한 로버스트 추정량을 이용한 임계치 결정방법은 기존의 그래프를 이용한 주관적인 임계치 결정방법에 대한 대안적인 방법으로 충분히 고려될 수 있을 것으로 생각된다.

Extreme Value Analysis of Statistically Independent Stochastic Variables

  • Choi, Yongho;Yeon, Seong Mo;Kim, Hyunjoe;Lee, Dongyeon
    • 한국해양공학회지
    • /
    • 제33권3호
    • /
    • pp.222-228
    • /
    • 2019
  • An extreme value analysis (EVA) is essential to obtain a design value for highly nonlinear variables such as long-term environmental data for wind and waves, and slamming or sloshing impact pressures. According to the extreme value theory (EVT), the extreme value distribution is derived by multiplying the initial cumulative distribution functions for independent and identically distributed (IID) random variables. However, in the position mooring of DNVGL, the sampled global maxima of the mooring line tension are assumed to be IID stochastic variables without checking their independence. The ITTC Recommended Procedures and Guidelines for Sloshing Model Tests never deal with the independence of the sampling data. Hence, a design value estimated without the IID check would be under- or over-estimated because of considering observations far away from a Weibull or generalized Pareto distribution (GPD) as outliers. In this study, the IID sampling data are first checked in an EVA. With no IID random variables, an automatic resampling scheme is recommended using the block maxima approach for a generalized extreme value (GEV) distribution and peaks-over-threshold (POT) approach for a GPD. A partial autocorrelation function (PACF) is used to check the IID variables. In this study, only one 5 h sample of sloshing test results was used for a feasibility study of the resampling IID variables approach. Based on this study, the resampling IID variables may reduce the number of outliers, and the statistically more appropriate design value could be achieved with independent samples.

GPD 기반의 유전자 알고리즘을 이용한 포트폴리오 최적화 (Finding optimal portfolio based on genetic algorithm with generalized Pareto distribution)

  • 김현돈;김현태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권6호
    • /
    • pp.1479-1494
    • /
    • 2015
  • 최적의 포트폴리오를 선택하기 위한 연구는 평균-분산모형을 시작으로 다양하게 진행되어 왔다. 과거에는 위험자산의 확률분포가 정규분포를 따른다고 가정하여, 투자자가 보유한 위험자산의 분산이 최소화되고 기대수익률이 최대가 되도록 포트폴리오를 구성하도록 하였다. 그러나 실제 위험자산의 분포에는 극단적인 사건들이 많이 발생하기 때문에 정규분포보다 훨씬 꼬리부분이 두꺼우며, 또한 왼쪽꼬리와 오른쪽꼬리가 대칭적이지도 않은 것으로 밝혀졌다. 이에 본 논문에서는 위험자산의 확률분포를 극단치 이론에서 널리 사용되는 일반화 파레토분포 (GPD)로 모형화하였고 체계적인 위험의 추정을 위하여 VaR를 이용하는 한편, 최적의 포트폴리오의 탐색을 위해서는 유전자 알고리즘을 사용하였다. 제안 방법의 적정성을 확인하기 위해 국내 증시에서 최적 포트폴리오를 탐색해 보았으며, 그 결과 GPD로 투자자산의 위험을 추정하였을 때 가장 좋은 결과를 얻을 수 있었다.

POT방법론을 이용한 자동차보험 손해율 추정 (Estimation of Car Insurance Loss Ratio Using the Peaks over Threshold Method)

  • 김수영;송종우
    • 응용통계연구
    • /
    • 제25권1호
    • /
    • pp.101-114
    • /
    • 2012
  • 자동차보험의 손해율이란 지급보험금의 수입보험료에 대한 비율을 의미한다. 손해율이 매우 큰 값을 갖는 대형손실이 일어나는 경우에는 보험회사의 재무적인 부분에 큰 악영향을 미치게 된다. 따라서 보험회사가 이에 대비할 수 있도록 하기 위하여 손해율의 극단 분위수(extreme quantile)를 추정하는 것은 매우 중요한 일이다. 다른 종류의 보험 관련 데이터와 같이 손해율의 분포는 오른쪽으로 긴 꼬리를 갖는 두꺼운 꼬리분포(heavy-tailed distribution)를 갖는다. 이런 자료에서 극단 분위수룰 추정하기 위하여 가장 많이 사용되는 방법론은 POT(Peaks over threshold)와 Hill 추정(Hill estimation)이다. 본 논문에서는 일반화파레토분포(generalized Pareto distribution; GPD)의 다양한 모수추정방법론의 성능을 모의실험과 실제 손해율 데이터를 사용하여 비교, 분석하였다. 또한 Hill 추정치를 사용하여 극단 분위수를 추정하였다. 그 결과 대부분의 경우에 POT 방법론이 Hill 추정치를 이용한 방법보다 정확한 분위수를 추정하였고, 모수추정방법론 중에서는 MLE, Zhang, NLS-2 방법론이 가장 좋은 결과를 보여주었다.

정확한 신뢰성 해석을 위한 아카이케 정보척도 기반 일반화파레토 분포의 임계점 추정 (Threshold Estimation of Generalized Pareto Distribution Based on Akaike Information Criterion for Accurate Reliability Analysis)

  • 강승훈;임우철;조수길;박상현;이민욱;최종수;홍섭;이태희
    • 대한기계학회논문집A
    • /
    • 제39권2호
    • /
    • pp.163-168
    • /
    • 2015
  • 공학분야의 신뢰성 해석은 점점 더 높은 신뢰도 영역에 대한 확률밀도함수의 예측을 요구한다. 따라서 높은 신뢰도를 정확하게 해석하기 위해 분포의 꼬리부분을 정확하게 표현해야 한다. 최근 들어 꼬리부분에 대한 표본만을 이용해 꼬리 모형을 생성하여 신뢰도를 추정할 수 있는 방법인 일반화파레토 분포에 대한 연구가 활발히 진행되고 있다. 하지만 기존의 연구에서는 부정확한 임계점 추정으로 꼬리부분에서 신뢰도의 정확도가 떨어진다. 따라서 본 논문에서는 아카이케 정보척도를 이용하여 임계점을 정확하고 강건하게 추정하고 이를 통해 꼬리 모형의 정확도를 향상시키는 아카이케 정보척도 기반 일반 화파레토 분포 기법을 제안한다. 또한 제안하는 기법을 이용한 신뢰성 해석을 수행하여 정확도가 향상된 신뢰성 해석 결과를 도출하였다.

GPD 모형 및 선형회귀분석을 이용한 산악형 강수 해석 (Orographic Precipitation Analysis with GPD Model and Linear Regression)

  • 엄명진;윤혜선;조원철;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2008년도 학술발표회 논문집
    • /
    • pp.1053-1057
    • /
    • 2008
  • 본 연구에서는 산악형 강수 해석을 위해 제주도내 강우관측 자료를 이용하여 확률강우량 산정 및 고도와의 선형회귀분석을 수행하였다. 제주도내 강우관측 자료는 기상관서 4개소 및 AWS(Automatic Weather System, 자동기상관측소) 13개소의 자료를 활용하였다. 확률강우량 산정시 AWS 강우관측 자료는 AMS(Annual Maximum Series, 연 최대치 계열) 모형을 적용하기에는 자료기간이 충분하지 않으므로 짧은 자료기간에 적합한 PDS(Partial Duration Series, 부분 기간치 계열) 모형을 적용하였다. 따라서 본 연구에서는 PDS의 대표적인 분포형인 GPD(Generalized Pareto Distribution)를 적용하여 지속시간별 확률강우량을 산정하였다. 산정된 지속시간별 확률강우량과 고도와의 관계를 확인하기 위하여 선형회귀분석을 수행하였다. 회귀분석 결과 확률강우량은 고도가 증가함에 따라 선형적으로 증가하였다. 또한, 재현기간이 길어질수록 고도에 따른 확률강우량 증가율도 증가하였다. 다만, 재현기간과 관계없이 지속시간이 짧을 경우 확률강우량과 고도와의 선형 관계는 약해지는 것으로 나타났다.

  • PDF

국제현물원유가의 일일 상승 및 하락율의 극단값 분석 (Analysis of Extreme Values of Daily Percentage Increases and Decreases in Crude Oil Spot Prices)

  • 윤석훈
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.835-844
    • /
    • 2010
  • 극단값 통계 분석의 도구로는 전통적인 연간 최대값 방법과 현대적인 분계점 방법, 그리고 분계점 방법을 개선한 변형체 등으로 분류할 수 있다. 연간 최대값 방법은 시계열자료의 연간 최대값들에 대하여 일반화극단값분포를 적합시키는 것이고, 분계점 방법은 충분히 큰 하나의 분계점을 넘어서는 초과값들의 초과여분들에 대하여 일반화파레토분포를 적합시키는 것이다. 분계점 방법의 한 변형체로서 본 논문에서는 분계점 방법에 추가적으로 초과값들의 전체 개수가 포아송분포를 따른다고 가정하는 포아송-GPD 방법을 다루고, 이를 1988.01.04부터 2009.12.31까지 수집된 서부텍사스산중질유의 현물가격 자료로부터 계산된 일일 상승율과 일일 하락율에 적용한다. 이에 따르면 일일 상승율과 일일 하락율의 분포는 정규분포와 달리 두터운 꼬리를 갖는 분포로 나타났는데, 이는 오늘날의 많은 금융 자료분석에서 나타나는 일반적인 현상과 잘 부합하는 것이다.