• 제목/요약/키워드: extreme statistics

검색결과 231건 처리시간 0.029초

Regional flood frequency analysis of extreme rainfall in Thailand, based on L-moments

  • Thanawan Prahadchai;Piyapatr Busababodhin;Jeong-Soo Park
    • Communications for Statistical Applications and Methods
    • /
    • 제31권1호
    • /
    • pp.37-53
    • /
    • 2024
  • In this study, flood records from 79 sites across Thailand were analyzed to estimate flood indices using the regional frequency analysis based on the L-moments method. Observation sites were grouped into homogeneous regions using k-means and Ward's clustering techniques. Among various distributions evaluated, the generalized extreme value distribution emerged as the most appropriate for certain regions. Regional growth curves were subsequently established for each delineated region. Furthermore, 20- and 100-year return values were derived to illustrate the recurrence intervals of maximum rainfall across Thailand. The predicted return values tend to increase at each site, which is associated with growth curves that could describe an increasing long-term predictive pattern. The findings of this study hold significant implications for water management strategies and the design of flood mitigation structures in the country.

A data-adaptive maximum penalized likelihood estimation for the generalized extreme value distribution

  • Lee, Youngsaeng;Shin, Yonggwan;Park, Jeong-Soo
    • Communications for Statistical Applications and Methods
    • /
    • 제24권5호
    • /
    • pp.493-505
    • /
    • 2017
  • Maximum likelihood estimation (MLE) of the generalized extreme value distribution (GEVD) is known to sometimes over-estimate the positive value of the shape parameter for the small sample size. The maximum penalized likelihood estimation (MPLE) with Beta penalty function was proposed by some researchers to overcome this problem. But the determination of the hyperparameters (HP) in Beta penalty function is still an issue. This paper presents some data adaptive methods to select the HP of Beta penalty function in the MPLE framework. The idea is to let the data tell us what HP to use. For given data, the optimal HP is obtained from the minimum distance between the MLE and MPLE. A bootstrap-based method is also proposed. These methods are compared with existing approaches. The performance evaluation experiments for GEVD by Monte Carlo simulation show that the proposed methods work well for bias and mean squared error. The methods are applied to Blackstone river data and Korean heavy rainfall data to show better performance over MLE, the method of L-moments estimator, and existing MPLEs.

한국 최대 전력량 예측을 위한 통계모형 (Statistical Modeling for Forecasting Maximum Electricity Demand in Korea)

  • 윤상후;이영생;박정수
    • Communications for Statistical Applications and Methods
    • /
    • 제16권1호
    • /
    • pp.127-135
    • /
    • 2009
  • 한국의 경제규모가 꾸준히 커감에 따라 가정, 건물, 공장 등에서 필요로 하는 전력량이 지속적으로 증가하고 있다. 전력공급의 안정화를 위해서는 최대전력량보다 전력공급능력이 높아야 한다. 월별 최대전력량을 잘 설명할 수 있는 통계모형을 찾기 위해 Winters 모형, 분해 시계열모형, ARMA 모형, 설명 변수를 통해 추세성분과 계절성분을 교정한 모형을 살펴보았다. 모형의 예측력 비교 기준으로 모형적합으로부터 구한 RMSE와 MAPE가 사용되었다. 여름철 최대전력량을 예측하기 위해 평균기온과 열대야 일수를 설명 변수로 갖는 시계열 모형이 가장 우수하였다. 아울러 외부요인을 갖는 극단분포 모형을 이용한 분석을 시도하였다.

포트폴리오 VaR 측정을 위한 EVT-GARCH-코퓰러 모형의 성과분석 (Performance analysis of EVT-GARCH-Copula models for estimating portfolio Value at Risk)

  • 이상훈;여성칠
    • 응용통계연구
    • /
    • 제29권4호
    • /
    • pp.753-771
    • /
    • 2016
  • 금융기관의 위험관리를 위한 중요한 도구로서 현재 VaR가 널리 사용되고 있다. 본 논문에서는 코퓰러 함수들을 이용하여 극단치이론과 GARCH 모형을 결합한 일변량분포로부터 구축한 다변량분포들을 바탕으로 코스피, 다우존스, 상하이 그리고 니케이 지수들로 구성된 포트폴리오의 VaR 추정과 그 성과에 관해 논의하였다. 사후검증 결과 전체적으로 볼 때 가우시안, t, 클레이톤, 프랭크 코퓰러를 사용한 t-분포의 오차항을 가진 변동성 모형들이 포트폴리오 VaR의 측정에 적합한 모형들로 나타났으며, 특히 프랭크 코퓰러의 경우에 가장 우수한 성과를 나타내었다.

익스트림 스포츠 참여자의 여가지지가 여가제약과 생활만족에 미치는 영향 (Effect of Leisure Support and Leisure Constraints on Life Satisfaction of Extreme Sports Participants)

  • 안병욱
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제9권2호
    • /
    • pp.737-744
    • /
    • 2019
  • 연구는 한국의 익스트림 스포츠 참여자들의 여가지지가 여가제약과 생활만족에 미치는 영향을 분석하였다. 본 연구의 대상자는 서울, 인천, 경기, 충청도에 거주하는 성인남녀 368명으로 편의표본추출법을 사용하여 모집하였다. 본 연구의 목적을 규명하기 위하여 SPSS 18.0과 AMOS 18.0 프로그램을 사용하여 빈도분석, 신뢰도 분석, 확인적 요인분석, 상관관계 분석, 구조방정식모형 분석 등을 사용하였다. 위와 같은 연구 과정을 거쳐 다음과 같은 연구결과를 도출하였다. 첫째, 익스트림 스포츠참여자의 여가지지는 여가제약에 영향을 미치지 않았다. 둘째, 익스트림 스포츠 참여자의 여가지지는 생활만족에 영향을 미쳤다. 셋째, 익스트림 스포츠 참여자의 여가제약은 생활만족에 영향을 미치지 않았다. 스포츠 활동과 같은 여가활동은 참여자들에게 높은 만족을 주고 있다는 것을 다시 확인할 수 있었다. 특히 참여자들의 여가지지는 생활만족과 밀접한 관계가 있음을 밝혀졌다. 따라서 익스트림 스포츠 활동에 대한 장점을 적극적으로 홍보하여 지속적인 참여를 유도할 필요가 있다.

국제현물원유가의 일일 상승 및 하락율의 극단값 분석 (Analysis of Extreme Values of Daily Percentage Increases and Decreases in Crude Oil Spot Prices)

  • 윤석훈
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.835-844
    • /
    • 2010
  • 극단값 통계 분석의 도구로는 전통적인 연간 최대값 방법과 현대적인 분계점 방법, 그리고 분계점 방법을 개선한 변형체 등으로 분류할 수 있다. 연간 최대값 방법은 시계열자료의 연간 최대값들에 대하여 일반화극단값분포를 적합시키는 것이고, 분계점 방법은 충분히 큰 하나의 분계점을 넘어서는 초과값들의 초과여분들에 대하여 일반화파레토분포를 적합시키는 것이다. 분계점 방법의 한 변형체로서 본 논문에서는 분계점 방법에 추가적으로 초과값들의 전체 개수가 포아송분포를 따른다고 가정하는 포아송-GPD 방법을 다루고, 이를 1988.01.04부터 2009.12.31까지 수집된 서부텍사스산중질유의 현물가격 자료로부터 계산된 일일 상승율과 일일 하락율에 적용한다. 이에 따르면 일일 상승율과 일일 하락율의 분포는 정규분포와 달리 두터운 꼬리를 갖는 분포로 나타났는데, 이는 오늘날의 많은 금융 자료분석에서 나타나는 일반적인 현상과 잘 부합하는 것이다.

일일 최고기온의 변화에 대한 추정 (Estimation for the Change of Daily Maxima Temperature)

  • 고왕경
    • 응용통계연구
    • /
    • 제20권1호
    • /
    • pp.1-9
    • /
    • 2007
  • 한국의 네 개 도시(서울, 대구, 춘천, 영천)의 일일 최고기온을 모형화하여, 이에 적합한 분포를 제안하고 분포의 적합성을 여러 가지 방법에 의하여 검토하였다. 제안된 분포는 극단간 분포의 일종이며, 적합성 검토는 카이제곱 적합도 검정, Q-Q plot,확률 그림과 5000번의 모의실험을 통하여 허용한계를 구하였다 그 결과 제안된 극단간 분포(Extreme Value Distribution)가 일일 최고기온을 잘 설명하고 있음을 확인할 수 있었다. 논문에서 나타난 실제 데이터의 그림은 서울의 1월과 6월을 중심으로 하였고, 대상지역의 2006년과 100년 후 2105년의 평균기온과, 제 안된 극단값 분포에 의해 95% 신뢰구간하에서 일일 최고기온의 평균 상한값을 예측하였다.

혼합 조건부 종추출모형을 이용한 여름철 한국지역 극한기온의 위치별 밀도함수 추정 (Density estimation of summer extreme temperature over South Korea using mixtures of conditional autoregressive species sampling model)

  • 조성일;이재용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1155-1168
    • /
    • 2016
  • 기상 자료의 경우 한 지역의 기후가 인접지역의 기후와 비슷한 양상을 띄고 각 지역의 확률 밀도 함수 (probability density function)가 잘 알려진 확률 모형을 따르지 않는다는 것이 알려져 있다. 본 논문에서는 이러한 특성을 고려하여 이상 기후 현상이 뚜렷히 나타나는 여름철 평균 극한 기온(extreme temperature)의 확률 밀도 함수를 추정하고자 한다. 이를 위하여 공간적 상관관계 (spatial correlation)를 고려하는 비모수 베이지안 (nonparametric Bayesian) 모형인 조건부 자기회귀 종추출 혼합모형 (mixtures of conditional autoregression species sampling model)을 이용하였다. 자료는 이스트앵글리아 대학교 (University of East Anglia)에서 제공하는 전 지구의 최대 기온과 최소 기온자료 중 우리나라에 해당하는 지역의 자료를 사용하였다.

코스피 지수 자료의 베이지안 극단값 분석 (A Bayesian Extreme Value Analysis of KOSPI Data)

  • 윤석훈
    • 응용통계연구
    • /
    • 제24권5호
    • /
    • pp.833-845
    • /
    • 2011
  • 본 논문에서는 1998.01.03부터 2011.08.31까지 수집된 코스피 지수 자료로부터 계산된 일별 로그수익률과 일별 로그손실률에 대한 극단값 통계분석을 수행하였다. 사용된 극단값 통계분석 모형은 포아송-GPD 모형이고 모수의 추정과 극단분위수의 추정은 최대가능도 방법을 적용하였다. 본 논문에서는 또한 포아송-GPD 모형에 추가적으로 모수의 무정보사전분포를 가정한 베이지안 방법을 고려하였다. 여기서는 마르코프 연쇄 몬테칼로 방법을 적용하여 모수와 극단분위수를 추정하였다. 분석 결과 최대가능도 방법과 베이지안 방법에서 모두, 로그수익률 분포의 오른쪽 꼬리는 정규분포보다 짧은 반면, 로그손실률 분포의 오른쪽 꼬리는 정규분포보다 두텁다는 결론이 얻어졌다. 극단값 분석에서 베이지안 방법을 사용할 때의 장점은 정칙조건이 만족되지 않는 경우에도 최대가능도추정량의 전통적 점근 성질을 걱정할 필요가 없고 예측의 경우에는 모수의 불확실성과 미래 관측치의 불확실성이 모두 반영되는 효과가 있다는 것이다.

고해상도 소기후모형을 이용한 국내 167개 시·군별 이상기상 발생빈도 자료 (Extreme Weather Frequency Data over 167 Si-gun of S. Korea with High-resolution Topo-climatology Model)

  • 조세라;심교문;박주현;김용석;허지나
    • 한국농림기상학회지
    • /
    • 제22권3호
    • /
    • pp.164-170
    • /
    • 2020
  • 기상조건은 농업에 영향을 미치는 주요 환경요인이며, 특히 이상기상의 발생은 작물의 성장 및 작황에 큰 영향을 미친다. 그러므로 이상기상으로 인한 농업적 피해를 줄이기 위해 관측을 바탕으로 한 이상기상의 발생 빈도 분석 및 통계자료가 필요하다. 본 연구에서는 30m 및 270m 해상도의 고해상도 소기후 모형을 통해 상세화된 3종의 주요 기상변수(기온, 강수, 일사량)를 이용해, 남한의 167개 시·군의 1981년부터 2019년 동안 발생한 이상기상 발생에 대한 통계자료를 소개하였다. 소기후 모형을 통해 추정된 167개 시·군 이상기상 현상 발생 특징은 기상청의 종관 기상 관측자료와 비교해 보았을 때 전국적인 분포 및 변화 경향을 잘 반영하는 것으로 나타났다. 또한, 기상청 종관 기상 관측 시스템에서 관측하지 못하는 지역의 기상까지 반영한 고해상도의 자료를 활용하였으므로 해당 시·군의 이상기상을 더욱 현실적으로 나타내었다. 본 연구에서 소개하는 시·군별 이상기상 통계자료는 농업 부문의 기상재해 취약성 평가 및 피해 저감을 위한 정책 기초자료로 활용될 수 있을 것으로 생각된다.