• 제목/요약/키워드: 일반화 극단분포

검색결과 14건 처리시간 0.02초

일반화 극단 분포를 이용한 강우량 예측 (Prediction of extreme rainfall with a generalized extreme value distribution)

  • 성용규;손중권
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권4호
    • /
    • pp.857-865
    • /
    • 2013
  • 집중 호우로 인한 피해가 증가하면서 다양한 기법들을 이용하여 강우량 예측에 대한 관심이 높아졌다. 최근에는 극단분포를 활용하여 강우량을 예측하려는 시도가 늘고 있다. 본 연구에서는 일반화 극단 분포를 활용하여 실제 서울시의 1973년부터 2010년까지 7월달의 사후예측분포를 생성하고, 수치적인 계산을 위해서 MCMC (Markov chain Monte Carlo)알고리즘을 활용하였다. 이 연구를 통해서 사후예측분포의 점추정값들을 비교하였고 2011년 7월달의 자료와 비교해 봤을 때 집중 호우의 확률이 증가한 것을 알 수 있었다.

조선시대 역사지진자료를 이용한 경주와 포항의 최근 지진규모 예측 (Prediction of recent earthquake magnitudes of Gyeongju and Pohang using historical earthquake data of the Chosun Dynasty)

  • 김준철;권숙희;장대흥;이근우;김영석;하일도
    • 응용통계연구
    • /
    • 제35권1호
    • /
    • pp.119-129
    • /
    • 2022
  • 본 논문에서는 최근 경주와 포항에서 심각한 피해를 주며 발생한 지진의 규모를 과거자료에 근거한 통계적 분석방법을 통해 예측하고자 한다. 이를 위해, 조선시대 역사지진 자료중에서 연단위 밀집도가 상대적으로 높은 1392~1771년의 5년 블록 최대 규모 자료를 이용하였다. 이 자료를 기반으로 일반화 극단값(generalized extreme value) 확률분포에 기초한 극단값 이론을 이용하여 조선시대 재현기간별 지진 규모 예측 및 분석을 제시하고자 한다. 일반화 극단값 분포의 모수추정을 위해 최대가능도추정법(maximum likelihood estimation, MLE)과 L-적률추정법(L-moments estimation, LME)을 사용한다. 특히 본 논문에서는 일반화 극단값 분포가 이러한 역사지진 자료에 대한 적절한 분석 모형이 될 수 있음을 적합도 검정(goodness-of-fit test)을 통해 보인다.

극단값 분포 추정을 위한 모수적 비모수적 방법 (Parametric nonparametric methods for estimating extreme value distribution)

  • 우승현;강기훈
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.531-536
    • /
    • 2022
  • 본 논문은 꼬리가 두꺼운 분포의 꼬리부분에 대한 분포를 추정할 경우 모수적 방법과 비모수적 방법의 성능에 대해 비교하였다. 모수적 방법으로는 일반화 극단값 분포와 일반화 파레토 분포를 이용하였고, 비모수적 방법은 커널형 확률밀도함수 추정방법을 적용하였다. 두 접근법의 비교를 위해 2014년부터 2018년까지 서울시 관측소별 일일 미세먼지 공공데이터를 이용하여 블록 최댓값 모형과 분계점 초과치 모형을 적용하여 함수 추정한 결과를 함께 보이고 2년, 5년, 10년의 재현수준을 통해 고농도의 미세먼지가 일어날 지역을 예측하였다.

지진 재현수준 예측에 대한 로그-로지스틱 분포와 일반화 극단값 분포의 비교 (Comparison of log-logistic and generalized extreme value distributions for predicted return level of earthquake)

  • 고낙경;하일도;장대흥
    • 응용통계연구
    • /
    • 제33권1호
    • /
    • pp.107-114
    • /
    • 2020
  • 자연 재해로부터 관측되는 자료를 대상으로 재현 수준 예측 등과 같은 자료 분석을 위해 일반화 극단값 분포(generalized extreme value)가 자주 사용되어 왔다. 표본 수가 충분히 큰 경우 연속적인 블록 최댓값들은 점근적으로 일반화 극단값 분포를 따른다. 하지만 소표본인 경우 이러한 사실은 성립되지 않을 수도 있다. 본 논문에서는 이러한 문제점을 해결하기 위해 모형 적합도 검정 및 모형 선택을 통해 로그-로지스틱(log-logistic) 분포의 사용을 제안한다. 하나의 예증으로서 중국 지진 자료를 대상으로 하여 로그-로지스틱 분포를 이용하여 재현 기간별 재현 수준 예측 및 신뢰구간을 제시한다.

국제현물원유가의 일일 상승 및 하락율의 극단값 분석 (Analysis of Extreme Values of Daily Percentage Increases and Decreases in Crude Oil Spot Prices)

  • 윤석훈
    • 응용통계연구
    • /
    • 제23권5호
    • /
    • pp.835-844
    • /
    • 2010
  • 극단값 통계 분석의 도구로는 전통적인 연간 최대값 방법과 현대적인 분계점 방법, 그리고 분계점 방법을 개선한 변형체 등으로 분류할 수 있다. 연간 최대값 방법은 시계열자료의 연간 최대값들에 대하여 일반화극단값분포를 적합시키는 것이고, 분계점 방법은 충분히 큰 하나의 분계점을 넘어서는 초과값들의 초과여분들에 대하여 일반화파레토분포를 적합시키는 것이다. 분계점 방법의 한 변형체로서 본 논문에서는 분계점 방법에 추가적으로 초과값들의 전체 개수가 포아송분포를 따른다고 가정하는 포아송-GPD 방법을 다루고, 이를 1988.01.04부터 2009.12.31까지 수집된 서부텍사스산중질유의 현물가격 자료로부터 계산된 일일 상승율과 일일 하락율에 적용한다. 이에 따르면 일일 상승율과 일일 하락율의 분포는 정규분포와 달리 두터운 꼬리를 갖는 분포로 나타났는데, 이는 오늘날의 많은 금융 자료분석에서 나타나는 일반적인 현상과 잘 부합하는 것이다.

POT방법론을 이용한 자동차보험 손해율 추정 (Estimation of Car Insurance Loss Ratio Using the Peaks over Threshold Method)

  • 김수영;송종우
    • 응용통계연구
    • /
    • 제25권1호
    • /
    • pp.101-114
    • /
    • 2012
  • 자동차보험의 손해율이란 지급보험금의 수입보험료에 대한 비율을 의미한다. 손해율이 매우 큰 값을 갖는 대형손실이 일어나는 경우에는 보험회사의 재무적인 부분에 큰 악영향을 미치게 된다. 따라서 보험회사가 이에 대비할 수 있도록 하기 위하여 손해율의 극단 분위수(extreme quantile)를 추정하는 것은 매우 중요한 일이다. 다른 종류의 보험 관련 데이터와 같이 손해율의 분포는 오른쪽으로 긴 꼬리를 갖는 두꺼운 꼬리분포(heavy-tailed distribution)를 갖는다. 이런 자료에서 극단 분위수룰 추정하기 위하여 가장 많이 사용되는 방법론은 POT(Peaks over threshold)와 Hill 추정(Hill estimation)이다. 본 논문에서는 일반화파레토분포(generalized Pareto distribution; GPD)의 다양한 모수추정방법론의 성능을 모의실험과 실제 손해율 데이터를 사용하여 비교, 분석하였다. 또한 Hill 추정치를 사용하여 극단 분위수를 추정하였다. 그 결과 대부분의 경우에 POT 방법론이 Hill 추정치를 이용한 방법보다 정확한 분위수를 추정하였고, 모수추정방법론 중에서는 MLE, Zhang, NLS-2 방법론이 가장 좋은 결과를 보여주었다.

원/달러 환율 투자 손실률에 대한 극단분위수 추정 (Extreme Quantile Estimation of Losses in KRW/USD Exchange Rate)

  • 윤석훈
    • Communications for Statistical Applications and Methods
    • /
    • 제16권5호
    • /
    • pp.803-812
    • /
    • 2009
  • 금융자료에 극단값이론을 적용하는 것은 위험관리에서 중요한 최신 통계기법 중의 하나라고 할 수 있다. 극단값분석에서 전통적으로 사용해 오던 연간 최대값방법은 시계열자료의 연간 최대값들에 대하여 일반화 극단값분포를 적합시키는 것이고, 최근 대안으로 널리 사용되고 있는 분계점 방법은 시계열자료 중 충분히 큰 하나의 분계점을 넘어서는 초과값들에 대하여 일반화파레토분포를 적합시키는 것이다. 그러나, 보다 실질적인 방법은 분계점을 넘어서는 초과값들을 하나의 점과정으로 해석하는 것인데, 즉 초과값들의 초과시점과 초과여분을 점근적으로 비동질 포아송과정을 갖는 하나의 2차원 점과정으로 간주하는 것이다. 본 논문에서는 이러한 2차원 비동질 포아송과정 모형을 1982.1.4부터 2008.12.31까지 수집된 원/달러 환율 시계열자료로부터 계산된 일별 환율투자손실률, 즉 일별 로그 손실률에 적용한다. 여기서 주된 관심은 10년 혹은 50년에 한번 정도 발생하는 대형 손실률 수준과 같은 극단분위수를 어떻게 추정하느냐 하는 것이다.

태풍이 일 최대강수량에 미치는 영향 평가 (Evaluation of the impact of typhoon on daily maximum precipitation)

  • 양미연;윤상후
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1415-1425
    • /
    • 2017
  • 태풍은 강한 바람과 폭우를 동반하며 매년 한반도에 인명과 재산피해의 원인이 된다. 국내에서 발생한 자연재해 피해에서 태풍이 차지하는 비중이 높다. 태풍의 많은 피해는 폭우에 의해 발생하므로 태풍이 일 최대강수량에 미치는 영향을 정량적으로 살펴볼 필요가 있다. 일 최대강수량은 극치자료로 일반적으로 일반화극단치분포를 따른다. 연구자료로 1976년부터 2016년까지 한반도에 설치된 60개 종관기상관측장비에서 수집된 일강수량, 최대풍속, 평균풍속 자료가 사용되었다. 태풍이 온 기간을 제외한 일강우량 자료와 태풍이 온 기간을 포함한 일강우량 자료로 구분하여 일반화극단치모형에 적합시켰다. 모수추정방법으로 최우추정법과 L-적률추정법이 이용되었다. K-S검정과 $Cram{\acute{e}}r$ von Mises검정을 통해 모형의 적합도를 검정하였다. 추정된 모수를 기반으로 25년, 50년, 100년, 200년 재현수준을 계산하였다. 태풍기간 포함유무에 따른 재현수준을 비교한 결과 태풍은 강릉 인근의 동해안과 울산과 완도 인근의 남해안의 일 최대강수량에 영향을 미친다.

한국 최대 전력량 예측을 위한 통계모형 (Statistical Modeling for Forecasting Maximum Electricity Demand in Korea)

  • 윤상후;이영생;박정수
    • Communications for Statistical Applications and Methods
    • /
    • 제16권1호
    • /
    • pp.127-135
    • /
    • 2009
  • 한국의 경제규모가 꾸준히 커감에 따라 가정, 건물, 공장 등에서 필요로 하는 전력량이 지속적으로 증가하고 있다. 전력공급의 안정화를 위해서는 최대전력량보다 전력공급능력이 높아야 한다. 월별 최대전력량을 잘 설명할 수 있는 통계모형을 찾기 위해 Winters 모형, 분해 시계열모형, ARMA 모형, 설명 변수를 통해 추세성분과 계절성분을 교정한 모형을 살펴보았다. 모형의 예측력 비교 기준으로 모형적합으로부터 구한 RMSE와 MAPE가 사용되었다. 여름철 최대전력량을 예측하기 위해 평균기온과 열대야 일수를 설명 변수로 갖는 시계열 모형이 가장 우수하였다. 아울러 외부요인을 갖는 극단분포 모형을 이용한 분석을 시도하였다.

일반화 극단치분포를 이용한 일 최대 교통사고 분석 (An Analysis of Daily Maximum Traffic Accident Using Generalized Extreme Value Distribution)

  • 김준석;김대성;윤상후
    • 디지털융복합연구
    • /
    • 제18권10호
    • /
    • pp.33-39
    • /
    • 2020
  • 대형 교통사고는 많은 인명피해를 동반한다. 교통사고를 효율적으로 대처하기 위해선 하루 동안 발생할 수 있는 최대 교통사고 수와 사망자 수, 중상자 수가 정량적으로 제시되어야 한다. 본 연구는 교통사고분석시스템에서 제공하는 2005년부터 2018년까지 전국에서 발생한 일 최대 교통사고 수, 사망자 수, 중상자 수 자료를 사용하여 15년, 30년, 50년에 한 번 발생할 수 있는 최대값을 제시하고자 한다. 지역별 교통사고의 특성을 살펴보기 위해 수도권, 충청권, 경북권, 호남권, 경남권으로 구분하여 일반화극단치분포(GEV분포)에 적합시켰다. GEV분포의 모수는 L-적률추정법으로 추정하였고, Anderson Darling 검정과 Cramer-von Mises 검정으로 분포의 적합성을 확인하였다. 분석결과 50년에 한 번 발생할 수 있는 일 최대 교통사고 수는 수도권 401건, 경남권 168건, 경북권 455건, 충청권 136건, 호남권 205건이다. 인구수와 자동차 등록수가 많은 수도권에 비해 경북권은 면적이 넓고 산지지형이 많으며 산업공단으로 인한 물류이동이 많아 교통사고 수가 상대적으로 높게 나타났다.