• Title/Summary/Keyword: 확률 분포

Search Result 2,394, Processing Time 0.039 seconds

An Approach for the Estimation of Mixture Distribution Parameters Using EM Algorithm (복합확률분포의 파라메타 추정을 위한 EM 알고리즘의 적용 연구)

  • Daeyoung Shim;SangGu Kim
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.22 no.4
    • /
    • pp.35-47
    • /
    • 2023
  • Various single probability distributions have been used to represent time headway distributions. However, it has often been difficult to explain the time headway distribution as a single probability distribution on site. This study used the EM algorithm, which is one of the maximum likelihood estimations, for the parameters of combined mixture distributions with a certain relationship between two normal distributions for the time headway of vehicles. The time headway distribution of vehicle arrival is difficult to represent well with previously known single probability distributions. But as a result of this analysis, it can be represented by estimating the parameters of the mixture probability distribution using the EM algorithm. The result of a goodness-of-fit test was statistically significant at a significance level of 1%, which proves the reliability of parameter estimation of the mixture probability distribution using the EM algorithm.

Analysis of torrential rainfall characteristics using 'zero-inflated models' ('0-과잉 모형'을 이용한 집중호우의 발생특성 분석)

  • Kim, Sang Ug
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.453-453
    • /
    • 2017
  • 본 연구에서는 최근 기후변화로 인한 집중호우의 발생횟수의 경향을 확률적으로 분석함에 있어 1개월 동안 80 mm/day 이상의 강우사상을 집중호우로 정의하여, 대구 및 부산 강우관측소로부터 수집된 384개월 동안의 집중호우를 분석하였다. 집중호우 월별 발생횟수와 같은 형식의 자료의 확률적 분석은 대개 Poisson 분포 (POI)가 사용되나 자료에 포함된 0자료의 과잉은 확률분포를 왜곡시키는 문제를 발생시킨다. 본 연구에서는 이 문제를 개선하기 위하여 개발된 일반화 Poisson 확률분포 (GPD), 0-과잉 Poisson 확률분포 (ZIP), 0-과잉 일반화 Poisson 확률분포 (ZIGP), Bayesian 0-과잉 일반화 Poisson 확률분포 (Bayesian ZIGP)를 집중호우 자료에 적용하고, 5개 모형의 특성을 비교분석하였으며, Bayesian ZIGP 모형의 구축에 있어서는 정보적 사전분포를 사용함으로써 모형의 정확도를 개선하였다. 분석결과 분석하고자 하는 자료에 0이 과다하게 포함되어 있는 경우 POI 및 GPD 분포는 관측결과와는 다른 결과를 제시하여 적절한 모형으로 고려되지 못함을 알 수 있었다. 5가지 모형 중 정보적 사전분포를 탑재한 Bayesian ZIGP 모형이 가장 관측 자료와 유사한 결과를 도출하였으나 모형의 구축에 수반되는 실용적인 측면을 고려하면 ZIP 모형도 충분히 사용될 수 있는 모형으로 추천되었다.

  • PDF

Development of probability distribution for simulation of monthly characteristics of torrential rainfall events (집중호우사상의 월별 발생특성 모의를 위한 확률분포 개발)

  • Kim, Sang Ug;Kim, Hyeong Bae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.246-246
    • /
    • 2016
  • 본 연구에서는 최근 기후변화로 인한 집중호우의 발생횟수의 경향을 확률적으로 분석함에 있어 1개월 동안 80 mm/day 이상의 강우사상을 집중호우로 정의하여, 대구 및 부산 강우관측소로부터 수집된 384개월 동안의 집중호우를 분석하였다. 집중호우 월별 발생횟수와 같은 형식의 자료의 확률적 분석은 대개 Poisson 분포 (POI)가 사용되나 자료에 포함된 0자료의 과잉은 확률분포를 왜곡시키는 문제를 발생시킨다. 본 연구에서는 이 문제를 개선하기 위하여 개발된 일반화 Poisson 확률분포 (GPD), 0-과잉 Poisson 확률분포 (ZIP), 0-과잉 일반화 Poisson 확률분포 (ZIGP), Bayesian 0-과잉 일반화 Poisson 확률분포 (Bayesian ZIGP)를 집중호우 자료에 적용하고, 5개 모형의 특성을 비교분석하였으며, Bayesian ZIGP 모형의 구축에 있어서는 정보적 사전분포를 사용함으로써 모형의 정확도를 개선하였다. 분석결과 분석하고자 하는 자료에 0이 과다하게 포함되어 있는 경우 POI 및 GPD 분포는 관측결과와는 다른 결과를 제시하여 적절한 모형으로 고려되지 못함을 알 수 있었다. 5가지 모형 중 정보적 사전분포를 탑재한 Bayesian ZIGP 모형이 가장 관측 자료와 유사한 결과를 도출하였으나 모형의 구축에 수반되는 실용적인 측면을 고려하면 ZIP 모형도 충분히 사용될 수 있는 모형으로 추천되었다.

  • PDF

The Role of the Cauchy Probability Distribution in a Continuous Taboo Search (연속형 타부 탐색에서 코시 확률 분포의 역할)

  • Lee, Chang-Yong;Lee, Dong-Ju
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.8
    • /
    • pp.591-598
    • /
    • 2010
  • In this study, we propose a new method for generating candidate solutions based on the Cauchy probability distribution in order to complement the shortcoming of the solutions generated by the normal distribution. The Cauchy probability distribution has infinite mean and variance, and it has rather large probability in the tail region relative to the normal distribution. Thus, the Cauchy distribution can yield higher probabilities of generating candidate solutions of large-varied variables, which in turn has an advantage of searching wider area of variable space. In order to compare and analyze the performance of the proposed method against the conventional method, we carried out an experiment using benchmarking problems of real valued function. From the result of the experiment, we found that the proposed method based on the Cauchy distribution outperformed the conventional one for all benchmarking problems, and verified its superiority by the statistical hypothesis test.

Noninformative Priors for the Ratio of Parameters in Inverse Gaussian Distribution (INVERSE GAUSSIAN분포의 모수비에 대한 무정보적 사전분포에 대한 연구)

  • 강상길;김달호;이우동
    • The Korean Journal of Applied Statistics
    • /
    • v.17 no.1
    • /
    • pp.49-60
    • /
    • 2004
  • In this paper, when the observations are distributed as inverse gaussian, we developed the noninformative priors for ratio of the parameters of inverse gaussian distribution. We developed the first order matching prior and proved that the second order matching prior does not exist. It turns out that one-at-a-time reference prior satisfies a first order matching criterion. Some simulation study is performed.

Estimation of Low-flow by Power Distribution (Power Distribution을 이용한 저수지 하천유량 추정)

  • Kim, Sang-Ug;Son, Min-Woo;Hong, Il-Pyo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2006.05a
    • /
    • pp.697-700
    • /
    • 2006
  • 저수시 하천유량(Low Streamflow)의 추정은 하천의 수질관리, 용수공급계획, 댐 방류계획등의 수자원관리에 있어서 매우 중요한 부분이다. 이러한 중요성에 따라 Vogel과 Kroll (1989)은 저수시 하천유량을 추정하기 위한 여러 가지 확률분포함수를 제안하였다. 가장 흔히 제안되어지는 이변수 확률분포(Two-Parameter Distribution)로는 Lognormal 분포와 Weibull 분포가 있으며 이와 더불어 Three-Parameter Lognormal, Three-Parameter Weibull, Log Person Type Ⅲ 분포도 널리 사용되어진다. 그러나 이러한 여러 가지 확률 분포함수 중에서 가장 적절한 확률분포의 선택은 저수시 하천유량의 물리적인 측면과는 상관없이 주로 적합도(Gooness of Fit)에 기인된 통계치에 의해서만 결정되기도 하는데 이러한 경우 잘못된 가정을 받아들이는 확률이 높아짐에 따라 추정결과의 신뢰성(Reliability)을 감소시킬 수 있다. 이러한 문제점을 극복하기 위해서 Onoz와 Bayazit (2001)는 Recession Curve를 지수함수로 가정하고 최대 갈수 기간의 길이(Maximum Dry Period Length)의 확률에 대한 이론적인 결과치들을 사용하여 Weibull 분포의 특정한 경우에 해당되어지는 Power 분포를 유도하였으며 유도된 Power 분포의 매개변수를 추정하기 위하여 L-Moment 방법을 사용하였다. 또한 Onoz와 Bayazit (2001) 작은 유출량에서 확률분포와 잘 맞지 않는 경우 작은 유출량값에 작은 가중치를 부여하여 확률분포에 대한 영향을 줄이는 방법인 LL-Moment 방법을 제안하였다. 본 연구에서는 낙동강 유역의 1번부터 5번 소유역에 대해 SSARR 모형을 이용하여 모의한 유출량을 이용하여 Weibull 분포, L-Moment방법에 의해 추정된 매개변수를 사용한 Power 분포, LL-Moment 방법에 의해 추정된 매개변수를 사용한 Power 분포를 적용하였으며 이들 분포의 적합도를 PPCC Test를 사용하여 평가해봄으로써 낙동강 유역에서의 저수시의 유출량 추정에 대한 Power 분포의 적용성을 판단해 보았다.

  • PDF

A Study on Estimation of Design Rainfall and Uncertainty Analysis Based on Bayesian GEV Distribution (Bayesian GEV분포를 이용한 확률강우량 추정 및 불확실성 평가)

  • Kwon, Hyun-Han;Kim, Jin-Young
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.366-366
    • /
    • 2012
  • 확률강우량은 하천설계, 수자원설계 및 계획을 위한 기초자료로 활용되며 최근 이상기후 및 기후변화로 인한 극치강우의 빈도 및 양적 증가로 인한 확률강우량 산정의 불확실성 분석에 대한 관심이 크게 증가하고 있다. 수문빈도 해석에 있어서 대부분 지역이 50년 이하의 수문자료가 이용되고 있으며 수문설계에서 요구되는 50년 이상의 확률강수량 추정시에는 상당한 불확실성을 내포하고 있다. 이러한 점에서 본 연구에서는 자료연수에 따른 Sampling Error와 분포형의 매개변수의 불확실성을 고려한 해석모형을 구축하고자 한다. 빈도해석에서 매개변수를 추정하기 위해서는 일반적으로 모멘트법, 최우도법, 확률가중모멘트법이 이용되고 있으나 사용되는 분포형에 따라서 통계학적으로 불확실성 구간을 정량화하는 과정이 난해할 뿐만 아니라 극치 수문자료가 Thick-Tailed분포의 특성을 가짐에도 불구하고 신뢰구간 산정시 정규분포로 가정하는 등 기존 해석 방법에는 많은 문제점을 내포하고 있다. 본 연구에서는 이러한 매개변수의 불확실성 평가에 있어서 우수한 해석능력을 발휘하는 Bayesian기법을 도입하여 분포형의 매개변수를 추정하고 매개변수 추정과 관련된 불확실성을 평가하고자 한다. 이와 별개로 자료연한에 따른 Sampling Error를 추정하기 위해서 Bootstrapping 기반의 해석모형을 구축하고자 하며 최종적으로 빈도해석시에 나타나는 불확실성을 종합적으로 검토하였다. 빈도해석을 위한 확률분포형으로 GEV(generalized extreme value)분포를 이용하였으며 Gibbs 샘플러를 활용한 Bayesian Markov Chain Monte Carlo 모의를 기본 해석모형으로 활용하였다.

  • PDF

Analysis of Standardized Precipitation Index Considering the Rainfall Characteristics in Korea (우리나라의 강우특성을 고려한 표준강수지수 분석)

  • Kim, Sooyoung;Shin, Ju-Young;Seo, Jungho;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.349-349
    • /
    • 2017
  • 표준강수지수(Standardized precipitation index, SPI)는 가장 널리 사용되고 있는 가뭄지수로, 우리나라 뿐만 아니라 세계기상기구(World Meteorological Organization)에서도 추천하고 있는 대표적인 기상학적 가뭄 지수라고 할 수 있다. 현재 표준강수지수는 2변수 gamma 분포를 적용하여 강수 부족 상황을 지수화하여 나타내고 있는데, 일부 연구에서는 다른 확률분포형의 적용하기도 하였다(Guttman, 1999; Lloyd-Hughes and Saunders, 2002; Stagge et al., 2015). 우리나라에서는 유원희(2000)에 의해 Pearson type 3, 2변수 gamma, generalized logistic, GEV, 3변수 log-normal 분포에 따른 SPI 산정 결과를 비교한 연구가 수행되었는데, SPI 산정에는 분포형별 차이가 뚜렷하지 않다는 결론을 얻었다. 그러나 이때 금강유역 내 지점에 국한하여 적용하였고, 분포형별 적합도 검정을 수행하지 않고 SPI 산정결과만을 비교하여 우리나라에 일반적으로 적용하기에는 어려움이 있다. 따라서 본 연구에서는 우리나라의 강우특성을 반영할 수 있도록 다양한 확률분포형을 고려하여 표준강수지수를 분석하고자 한다. 이를 위해 관측기간이 30년 이상인 기상관측소의 월단위 강우자료를 구축하고, 월단위 강우자료에 다양한 확률분포형을 적용하고자 한다. 이때 적용하는 확률분포형은 2변수 gamma, Gumbel, normal 분포이다. 적정 확률분포형 선정을 위해 적합도 검정을 수행하고자 한다. 또한 각 분포형별로 산정된 표준강수지수를 기존 표준강수지수와 비교검토하고자 한다.

  • PDF

Application of Jackknife Method for Determination of Representative Probability Distribution of Annual Maximum Rainfall (연최대강우량의 대표확률분포형 결정을 위한 Jackknife기법의 적용)

  • Lee, Jae-Joon;Lee, Sang-Won;Kwak, Chang-Jae
    • Journal of Korea Water Resources Association
    • /
    • v.42 no.10
    • /
    • pp.857-866
    • /
    • 2009
  • In this study, basic data is consisted annual maximum rainfall at 56 stations that has the rainfall records more than 30years in Korea. The 14 probability distributions which has been widely used in hydrologic frequency analysis are applied to the basic data. The method of moments, method of maximum likelihood and probability weighted moments method are used to estimate the parameters. And 4-tests (chi-square test, Kolmogorov-Smirnov test, Cramer von Mises test, probability plot correlation coefficient (PPCC) test) are used to determine the goodness of fit of probability distributions. This study emphasizes the necessity for considering the variability of the estimate of T-year event in hydrologic frequency analysis and proposes a framework for evaluating probability distribution models. The variability (or estimation error) of T-year event is used as a criterion for model evaluation as well as three goodness of fit criteria (SLSC, MLL, and AIC) in the framework. The Jackknife method plays a important role in estimating the variability. For the annual maxima of rainfall at 56 stations, the Gumble distribution is regarded as the best one among probability distribution models with two or three parameters.

Use of Probability Distribution of Speed derived from Positioning Data (위치 데이터에서 유도된 속도의 확률분포)

  • On, Kyoung-Woon;Lee, Jun-Seok;Song, Ha Yoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1092-1095
    • /
    • 2013
  • 오늘날 모바일 스마트 기기의 발전은 위치기반의 새로운 기술을 이끌었다. 현재 위치 데이터를 사용하는 많은 응용프로그램들이 소개되었고, 또한 널리 사용되고 있다. 하지만 아직 이러한 위치 데이터들은 환경적인 요소 등으로 인해 오류가 많다. 우리는 이전 연구에서 위치 데이터의 오류 검출 및 교정 알고리즘을 제안하였다. 또 다른 연구에선 인간의 이동속도가 어떠한 확률분포모델을 따르는지 연구하였다. 그리하여 본 논문에서는 인간의 이동속도의 분포로서 적합하다고 판명된 확률분포모델 중 Lognormal 분포, Gamma 분포, Weibull분포를 선택하여 위치데이터 오류 검출 및 교정 알고리즘에 적용하기 위한 확률분포 계산을 제안한다. 그 중 일부는 계산의 복잡도를 낮추기 위해 확률분포표를 제공할 것이다.