• 제목/요약/키워드: Generalized Pareto distribution

검색결과 64건 처리시간 0.022초

Extreme value modeling of structural load effects with non-identical distribution using clustering

  • Zhou, Junyong;Ruan, Xin;Shi, Xuefei;Pan, Chudong
    • Structural Engineering and Mechanics
    • /
    • 제74권1호
    • /
    • pp.55-67
    • /
    • 2020
  • The common practice to predict the characteristic structural load effects (LEs) in long reference periods is to employ the extreme value theory (EVT) for building limit distributions. However, most applications ignore that LEs are driven by multiple loading events and thus do not have the identical distribution, a prerequisite for EVT. In this study, we propose the composite extreme value modeling approach using clustering to (a) cluster initial blended samples into finite identical distributed subsamples using the finite mixture model, expectation-maximization algorithm, and the Akaike information criterion; (b) combine limit distributions of subsamples into a composite prediction equation using the generalized Pareto distribution based on a joint threshold. The proposed approach was validated both through numerical examples with known solutions and engineering applications of bridge traffic LEs on a long-span bridge. The results indicate that a joint threshold largely benefits the composite extreme value modeling, many appropriate tail approaching models can be used, and the equation form is simply the sum of the weighted models. In numerical examples, the proposed approach using clustering generated accurate extrema prediction of any reference period compared with the known solutions, whereas the common practice of employing EVT without clustering on the mixture data showed large deviations. Real-world bridge traffic LEs are driven by multi-events and present multipeak distributions, and the proposed approach is more capable of capturing the tendency of tailed LEs than the conventional approach. The proposed approach is expected to have wide applications to general problems such as samples that are driven by multiple events and that do not have the identical distribution.

관측년수변화를 고려한 설계강우량 산정 (Estimation of Design Rainfall Considering the Change of the Number of Years for Observed Data)

  • 류경식;이순혁;황만하;이상진
    • 한국농공학회:학술대회논문집
    • /
    • 한국농공학회 2005년도 학술발표논문집
    • /
    • pp.284-287
    • /
    • 2005
  • The objective of this study is to check into variation trends of design rainfall according to change of the number of years for observed data. To make comparative study of the relation between design rainfall and recorded year, this study was used maximum rainfall for 24-hr consecutive duration at Gangneung, Seoul, Incheon, Chupungnyeong, Pohang, Daegu, Jeonju, Ulsan, Gwangju, Busan, Mokpo and Yeosu rainfall stations. The tests for Independence, Homogeneity and detection of outliers were used Wald-Wolfowitz's test, Mann-Whitney's test and Grubbs and Beck test respectively. To select appopriate distribution, the distribution of genaralized pareto(GPA), generalized extreme value(GEV), generalized logistic(GLO), lognormal and pearson type 3 distribution is judged by L-moment ratio diagram and Kolmogorov-Smirnov (K-S) test. Design rainfall was estimated by at-site frequency analysis using L-moments and Generalized extreme value(GEV) distribution according to change of the number of years for observed data. Through the comparative analysis for design rainfall induced by L-moments and GEV distribution, relationship between design rainfall and recorded year is provided.

  • PDF

시간에 따라 변화하는 로그-정규분포와 파레토 합성 분포의 모형 추정 (Time-varying modeling of the composite LN-GPD)

  • 박소진;백창룡
    • 응용통계연구
    • /
    • 제31권1호
    • /
    • pp.109-122
    • /
    • 2018
  • 임계값을 기준으로 그 보다 작은 값은 로그정규분포(lognormal distribution; LN)를, 큰 값은 일반화파레토분포(generalized Pareto distribution; GPD)를 따르는 합성 분포를 LN-GPD 합성분포라 한다. Scollnik (2007)은 LN-GPD 합성분포가 로그정규분포와 GPD를 합성 시킴으로써 자료의 손실 없이 꼬리가 두꺼운 분포에서 좋은 적합력을 가진다고 밝혔다. 본 논문에서는 시간에 따라 변하는 LN-GPD 평균모형을 다루었으며 방법론으로는 국소 다항최대우도법을 기반으로 추정하는 방법에 대해서 연구하였다. 시간에 따라 변하는 분포를 추정함으로써 자료에 대한 훨씬 자세한 이해가 가능하며 이는 곧 상담원 배치나 자원배분과 같은 운영관리에 큰 도움을 줄 수 있다. 본 연구는 GPD 분포만을 고려한 Beirlant와 Goegebeur (2004)를 확장하여 절삭한 로그정규분포를 추가하여 자료의 손실 없이 자료의 특징을 살펴볼 수 있다는데도 의의가 있다. 모의실험을 통해 제안한 방법론의 적절함을 살펴 보았고 실증 자료 분석으로 이스라엘 은행의 콜센터 서비스 시간에 대해 분석하여 상담원 배치와 관련된 흥미로운 결과를 찾을 수 있었다.

확률가중모멘트의 차수 변화에 따른 홍수량 변동 특성 분석 (Analysis on Characteristics of Variation in Flood Flow by Changing Order of Probability Weighted Moments)

  • 맹승진;황주하
    • 한국산학기술학회논문지
    • /
    • 제10권5호
    • /
    • pp.1009-1019
    • /
    • 2009
  • 본 연구에서는 우리나라 수위관측소들 중에서 관측 유량이 검증된 총 19개 유역을 선정하고 관측된 홍수량을 사용하여 적정 설계홍수량을 유도함으로써 우리나라의 설계홍수량 특성을 분석하였다. 대상유역별로 관측개시 년도에서부터 분석 시작년을 기준으로 1년씩 증가 시키는 점진적 구성 방식으로 연최대홍수량에 대한 빈도분석을 실시하기 위해, 변동특성을 이동평균법에 의해 분석하였다. 19개 대상유역에 대한 연최대홍수량 계열 구성기간별로 기본통치를 산정하고 독립성, 동질성 및 Outiler 검정을 실시하였다. Gumbel, Generalized Extreme Value, Generalized Logistic 및 Generalized Pareto 분포의 적합도 검정을 LH-모멘트비도와 Kolmogorov-Smirnov 검정에 의해 수행하였다. 적정 확률분포로 선정된 GEV 분포의 매개변수를 확률가중모멘트의 치수 변화에 의한 L, L1, L2, L3 및 L4-모멘트법에 의해 추정하고 대상유역 및 연최대홍수량 계열 구성 기간별 설계홍수량을 유도하였다. 본 연구에서 사용한 변동률 분석에 따라 최근 지구온난화에 따른 우리나라 기후 변화를 고려한 적절한 수리구조물의 설계 조건변경시기는 2002년 전후로 하여야 할 것이다.

정확한 신뢰성 해석을 위한 아카이케 정보척도 기반 일반화파레토 분포의 임계점 추정 (Threshold Estimation of Generalized Pareto Distribution Based on Akaike Information Criterion for Accurate Reliability Analysis)

  • 강승훈;임우철;조수길;박상현;이민욱;최종수;홍섭;이태희
    • 대한기계학회논문집A
    • /
    • 제39권2호
    • /
    • pp.163-168
    • /
    • 2015
  • 공학분야의 신뢰성 해석은 점점 더 높은 신뢰도 영역에 대한 확률밀도함수의 예측을 요구한다. 따라서 높은 신뢰도를 정확하게 해석하기 위해 분포의 꼬리부분을 정확하게 표현해야 한다. 최근 들어 꼬리부분에 대한 표본만을 이용해 꼬리 모형을 생성하여 신뢰도를 추정할 수 있는 방법인 일반화파레토 분포에 대한 연구가 활발히 진행되고 있다. 하지만 기존의 연구에서는 부정확한 임계점 추정으로 꼬리부분에서 신뢰도의 정확도가 떨어진다. 따라서 본 논문에서는 아카이케 정보척도를 이용하여 임계점을 정확하고 강건하게 추정하고 이를 통해 꼬리 모형의 정확도를 향상시키는 아카이케 정보척도 기반 일반 화파레토 분포 기법을 제안한다. 또한 제안하는 기법을 이용한 신뢰성 해석을 수행하여 정확도가 향상된 신뢰성 해석 결과를 도출하였다.

균일분포의 파레토 최적해 생성을 위한 다목적 최적화 진화 알고리즘 (Evolutionary Multi-Objective Optimization Algorithms for Uniform Distributed Pareto Optimal Solutions)

  • 장수현;윤병주
    • 정보처리학회논문지B
    • /
    • 제11B권7호
    • /
    • pp.841-848
    • /
    • 2004
  • 진화 알고리즘은 여러 개의 상충하는 목적을 갖는 다목적 최적화 문제를 해결하기에 적합한 방법이다. 특히, 파레토 지배관계에 기초하여 개체의 적합도를 평가하는 파레토 기반 진화알고리즘들은 그 성능에 있어서 비교적 우수한 평가를 받고 있다. 그러나 일반화된 다목적 최적화 진화알고리즘은 복잡한 문제들에서 찾아진 해들의 분포가 전체 파레토 경계면에 대하여 균일하지 못하고 특정 지역에서 집중적으로 해를 생성하는 문제점을 가지고 있다. 본 논문에서 우리는 이러한 문제점을 보완하기 위한 다목적 최적화 진화알고리즘을 제안한다. 제안한 알고리즘은 현재까지 찾아진 최적해들 중 특정 지역에 관중되지 않은 해를 우수 종자로 복제 연산에 참여시킨다. 따라서 특별한 지역탐색 기법을 사용하지 않아도 종자가 되는 개체 주위에 새로운 개체를 생성할 확률이 높기 때문에 지역탐색의 효과를 가질 수 있고, 비교적 고른 분포의 파레토 최적 해를 생성한 수 있다. 5개의 테스트 함수에 대한 실험 결과, 제안한 알고리즘은 모든 문제에서 전체 파레토 경계면에 균일한 분포의 해들을 생성할 수 있었으며, 많은 지역해를 가지는 문제를 제외한 모든 문제에서 NSGA-II보다 우수한 수렴 결과를 보였다.

빈도분석에 의한 저수지 유입량 산정 (Estimation of Reservoir Inflow Using Frequency Analysis)

  • 맹승진;황주하;시강
    • 한국농공학회논문집
    • /
    • 제51권3호
    • /
    • pp.53-62
    • /
    • 2009
  • This study was carried out to select optimal probability distribution based on design accumulated monthly mean inflow from the viewpoint of drought by Gamma (GAM), Generalized extreme value (GEV), Generalized logistic (GLO), Generalized normal (GNO), Generalized pareto (GPA), Gumbel (GUM), Normal (NOR), Pearson type 3 (PT3), Wakeby (WAK) and Kappa (KAP) distributions for the observed accumulative monthly mean inflow of Chungjudam. L-moment ratio was calculated using observed accumulative monthly mean inflow. Parameters of 10 probability distributions were estimated by the method of L-moments with the observed accumulated monthly mean inflow. Design accumulated monthly mean inflows obtained by the method of L-moments using different methods for plotting positions formulas in the 10 probability distributions were compared by relative mean error (RME) and relative absolute error (RAE) respectively. It has shown that the design accumulative monthly mean inflow derived by the method of L-moments using Weibull plotting position formula in WAK and KAP distributions were much closer to those of the observed accumulative monthly mean inflow in comparison with those obtained by the method of L-moment with the different formulas for plotting positions in other distributions from the viewpoint of RME and RAE.

우리나라 연최대강우량의 지형학적 특성 및 이에 근거한 최적확률밀도함수의 산정 (Geographical Impact on the Annual Maximum Rainfall in Korean Peninsula and Determination of the Optimal Probability Density Function)

  • 남윤수;김동균
    • 한국습지학회지
    • /
    • 제17권3호
    • /
    • pp.251-263
    • /
    • 2015
  • 본 연구에서는 L-moment ratio diagram 기법과 지형정보시스템(GIS)을 동시에 활용하여 우리나라의 지속기간별 연 최대강우량의 최적확률밀도함수를 판별하는 새로운 기법을 제안하고, 결과 도출과정에 있어 발견된 연최대강우량의 통계값의 흥미로운 지형학적 특성을 살펴보았다. 이를 위하여 우리나라 기상청에서 운영하는 67개의 강우관측지점에서 관측된 강우자료의 연최대강우량을 1시간, 3시간, 6시간, 12시간, 24시간 누적시간에 대하여 산출하고, L-moment ratio diagram 기법을 활용하여 이들에 대한 최적확률밀도함수를 구한 후, 이를 관측지점에 해당하는 티센 다각형에 다른 색상으로 표현하여 그 공간적 분포를 살펴보았다. 또한, 각 후보 확률밀도함수의 적합도에 대한 지도를 작성하였다. 본 연구의 결과를 요약하면 다음과 같다: (1) 강우의 극한값의 특성을 대표할 수 있는 통계값인 L-skewness와 L-kurtosis는 뚜렷한 공간적 경향을 띠고 있다. 특히 산맥을 포함한 우리나라의 지형적 특성에 큰 영향을 받았다. 이는 발생빈도가 높고 강도가 낮은 평상시의 강우사상뿐 만 아니라, 연최대강우량 또한 지형의 영향을 크게 받는다는 것을 의미한다; (2) 우리나라의 산악지역에서는 연최대강우량의 통계적 특성에 대한 고도의 영향이 비산악지역보다 더 크며, 고도가 높은 지역일수록 발생 빈도가 낮고 강도가 강한 강우사상이 더 자주 발생하며, 강우의 누적기간이 증가할수록 이러한 경향은 작아졌다; (3) 우리나라의 연최대강우량을 가장 잘 대변할 수 있는 확률밀도함수는 Generalized Extreme Value (GEV) 분포와 Generalized Logistic (GLO) 분포이다. 단, 남해안의 중앙지역에 대해서는 Generalized Pareto (GPA) 분포가 가장 적합한 것으로 나타났다.

L-모멘트법에 의한 극치강우의 빈도분석 (Frequency Analysis of Extreme Rainfall by L-Moments)

  • 맹승진;이순혁;김병준
    • 한국농공학회:학술대회논문집
    • /
    • 한국농공학회 2002년도 학술발표회 발표논문집
    • /
    • pp.225-228
    • /
    • 2002
  • This research seeks to derive the design rainfalls through the L-moment with the test of homogeneity, independence and outlier of data on annual maximum daily rainfall in 38 Korean rainfall stations. To select the fit appropriate distribution of annual maximum daily rainfall data according to rainfall stations, applied were Generalized Extreme Value (GEV), Generalized Logistic (GLO) and Generalized Pareto (GPA) probability distributions were applied. and their aptness was judged Dusing an L-moment ratio diagram and the Kolmogorov-Smirnov (K-S) test, the aptitude was judged of applied distributions such as GEV, GLO and GPA. The GEV and GLO distributions were selected as the appropriate distributions. Their parameters were estimated Targetingfrom the observed and simulated annual maximum daily rainfalls and using Monte Carlo techniques, the parameters of GEV and GLO selected as suitable distributions were estimated and. dDesign rainfallss were then derived, using the L-moment. Appropriate design rainfalls were suggested by doing a comparative analysis of design rainfall from the GEV and GLO distributions according to rainfall stations.

  • PDF

GPD 기반의 유전자 알고리즘을 이용한 포트폴리오 최적화 (Finding optimal portfolio based on genetic algorithm with generalized Pareto distribution)

  • 김현돈;김현태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권6호
    • /
    • pp.1479-1494
    • /
    • 2015
  • 최적의 포트폴리오를 선택하기 위한 연구는 평균-분산모형을 시작으로 다양하게 진행되어 왔다. 과거에는 위험자산의 확률분포가 정규분포를 따른다고 가정하여, 투자자가 보유한 위험자산의 분산이 최소화되고 기대수익률이 최대가 되도록 포트폴리오를 구성하도록 하였다. 그러나 실제 위험자산의 분포에는 극단적인 사건들이 많이 발생하기 때문에 정규분포보다 훨씬 꼬리부분이 두꺼우며, 또한 왼쪽꼬리와 오른쪽꼬리가 대칭적이지도 않은 것으로 밝혀졌다. 이에 본 논문에서는 위험자산의 확률분포를 극단치 이론에서 널리 사용되는 일반화 파레토분포 (GPD)로 모형화하였고 체계적인 위험의 추정을 위하여 VaR를 이용하는 한편, 최적의 포트폴리오의 탐색을 위해서는 유전자 알고리즘을 사용하였다. 제안 방법의 적정성을 확인하기 위해 국내 증시에서 최적 포트폴리오를 탐색해 보았으며, 그 결과 GPD로 투자자산의 위험을 추정하였을 때 가장 좋은 결과를 얻을 수 있었다.