• Title/Summary/Keyword: 확률분포

Search Result 2,398, Processing Time 0.032 seconds

커널 판별분석의 오분류확률에 대한 붓스트랩 조정

  • 백장선
    • Communications for Statistical Applications and Methods
    • /
    • v.2 no.2
    • /
    • pp.249-265
    • /
    • 1995
  • 본 논문에서는 확률분포가 알려져 있지 않은 두 모집단 중 어느 하나로 새로운 관측치를 분류할 때 오분류확률이 분석자에 의해 사전에 정해진 수준에 부합할 수 있도록 커널 판별함수의 임계치를 결정하였다. 정해진 오분류확률을 만족시키기 위한 판별함수의 임계치는 붓스트랩(bootstrap)기법을 판별 함수에 적용시켜 계산된다. 본 논문에서 제시도된 방법은 모집단에 대한 모수적 가정이 없으므로 어느 분포에도 적용가능하며, 모집단이 정규분포, 대수정규분포, 이산형과 연속형 변수가 혼합된 분포의 경우 모의실험을 통하여 그 성능에 대한 검증을 하였다.

  • PDF

Noninformative Priors for the Ratio of Parameters in Inverse Gaussian Distribution (INVERSE GAUSSIAN분포의 모수비에 대한 무정보적 사전분포에 대한 연구)

  • 강상길;김달호;이우동
    • The Korean Journal of Applied Statistics
    • /
    • v.17 no.1
    • /
    • pp.49-60
    • /
    • 2004
  • In this paper, when the observations are distributed as inverse gaussian, we developed the noninformative priors for ratio of the parameters of inverse gaussian distribution. We developed the first order matching prior and proved that the second order matching prior does not exist. It turns out that one-at-a-time reference prior satisfies a first order matching criterion. Some simulation study is performed.

Characteristics of Heavy Vehicles Using Expressway Networks Based on Weigh-in-motion Data (WIM 데이터를 이용한 고속도로 중차량 특성 분석)

  • Gil, Heungbae;Kang, Sang Gyu
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.33 no.5
    • /
    • pp.1731-1740
    • /
    • 2013
  • The design life and durability of the bridges are strongly affected by the Gross Vehicle Weight(GVW) of heavyweight trucks. The Weigh-In-Motion(WIM) systems are typically used to collect information on truck total weight and speed. The statistical analysis of the GVW measured using High Speed WIM systems showed that most of heavy vehicles were from Vehicle Type 7, 10, and 12. The analysis was also carried out to determine goodness of fit with theoretical probability distributions. The normal distribution was shown to best describe the overall distribution of GVW. The top 10% of the GVW appeared to best fit by the Weibull 3 probability distribution.

선박접안속도 실측값의 확률분포특성에 관한 연구

  • Lee, Sang-Won;Jo, Jang-Won;Jo, Ik-Sun
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2018.11a
    • /
    • pp.320-322
    • /
    • 2018
  • 선박이 부두의 계류시설에 접촉할 때 발생하는 접안에너지는 해당선박의 접안속도에 가장 큰 영향을 받는다. 접안속도가 과다할 경우 부두에 접촉하는 사고로까지 이어질 수 있으므로 각각의 부두 특성에 맞는 적절한 접안속도를 설계하는 것이 중요하다. 선박접안속도의 경우, 일반적으로 대수정규분포를 따른다고 가정하고 있으나 국내에서는 이에 대한 검증이나 연구가 없어 해외의 사례를 바탕으로 설계접안 속도를 설정하고 있는 상황이다. 이에 본 연구에서는 부두의 선박접안속도를 설계하기 위한 통계학적인 접근으로 접안속도의 실측데이터를 토대로 그 빈도수를 히스토그램으로 표현하여 각각의 확률분포도와 비교 분석하고, 확률분포에 대한 검정법으로 K-S (Kolmogorov-Smirnov Test) 검정, A-D(Anderson-Darling) 검정, Q-Q(Quantile-Quantile) Plot 등을 이용하여 접안속도 분포에 적합한 확률분포도를 확인하였다. 분석 결과, 선박접안속도의 빈도분포는 일반적으로 알려진 대수정규분포 뿐만 아니라 Weibull 분포와 적합한 형태를 보이는 것을 알 수 있었다. 추가적으로 본 연구에서는 초과확률 개념에서의 접안속도의 예측치를 구하여 구해진 1/1000, 1/10000의 접안속도 예측치를 설계접안속도의 참고자료로 제안하고자 한다.

  • PDF

A Study on the Selection of Optimum Probability Distribution for Rainfall Frequency Analysis (강우빈도해석 시 최적분포형 선정에 관한 연구)

  • Choi, Hong-Geun;Kim, Jin-Young;Kwon, Young-Jun;Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.412-412
    • /
    • 2017
  • 강우빈도해석을 위해서는 확률분포선정이 우선적으로 이루어져야 한다. 우리나라에서는 사용상의 편리상, 기존 해석결과와의 연속성 등을 이유로 Gumbel 확률분포가 가장 일반적으로 활용되고 있다. 그러나, 분포형 선정에 따른 확률강수량의 차이가 크게 발생한다는 점에서 단순히 해석상의 편리성을 기준으로 분포형 선정이 이루어지는 것은 바람직하지 않다. 특히, 우리나라에서 강우빈도해석 시 분포형 선정은 형식적인 수준에 그치고 있으며, 주로 KS검정, 검정 등 적합도 검정을 통해 고려된 분포형의 통계적 유의성만을 평가하고 있다. 그러나, 최적 분포형 선정이라는 관점에서 이러한 유의성 검정보다는 정량적인 지표를 기준으로 확률분포형 선정이 이루어지는 것이 적합할 것으로 판단된다. 즉, 자료의 설명력이 가장 우수한 분포를 정량적 지표를 기준으로 추정하는 것이 수문통계학적으로 적합성을 갖는다. 이러한 점에서 본 연구에서는 우도함수, BIC 및 AIC를 기준으로 우리나라 주요 강수지점에서 대해서 최적 분포형을 선정하고, 기존 Gumbel 분포를 기준으로 산정된 확률강수량과의 양적차이를 평가해보고자 한다.

  • PDF

A Study on Estimation of Design Rainfall and Uncertainty Analysis Based on Bayesian GEV Distribution (Bayesian GEV분포를 이용한 확률강우량 추정 및 불확실성 평가)

  • Kwon, Hyun-Han;Kim, Jin-Young
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.366-366
    • /
    • 2012
  • 확률강우량은 하천설계, 수자원설계 및 계획을 위한 기초자료로 활용되며 최근 이상기후 및 기후변화로 인한 극치강우의 빈도 및 양적 증가로 인한 확률강우량 산정의 불확실성 분석에 대한 관심이 크게 증가하고 있다. 수문빈도 해석에 있어서 대부분 지역이 50년 이하의 수문자료가 이용되고 있으며 수문설계에서 요구되는 50년 이상의 확률강수량 추정시에는 상당한 불확실성을 내포하고 있다. 이러한 점에서 본 연구에서는 자료연수에 따른 Sampling Error와 분포형의 매개변수의 불확실성을 고려한 해석모형을 구축하고자 한다. 빈도해석에서 매개변수를 추정하기 위해서는 일반적으로 모멘트법, 최우도법, 확률가중모멘트법이 이용되고 있으나 사용되는 분포형에 따라서 통계학적으로 불확실성 구간을 정량화하는 과정이 난해할 뿐만 아니라 극치 수문자료가 Thick-Tailed분포의 특성을 가짐에도 불구하고 신뢰구간 산정시 정규분포로 가정하는 등 기존 해석 방법에는 많은 문제점을 내포하고 있다. 본 연구에서는 이러한 매개변수의 불확실성 평가에 있어서 우수한 해석능력을 발휘하는 Bayesian기법을 도입하여 분포형의 매개변수를 추정하고 매개변수 추정과 관련된 불확실성을 평가하고자 한다. 이와 별개로 자료연한에 따른 Sampling Error를 추정하기 위해서 Bootstrapping 기반의 해석모형을 구축하고자 하며 최종적으로 빈도해석시에 나타나는 불확실성을 종합적으로 검토하였다. 빈도해석을 위한 확률분포형으로 GEV(generalized extreme value)분포를 이용하였으며 Gibbs 샘플러를 활용한 Bayesian Markov Chain Monte Carlo 모의를 기본 해석모형으로 활용하였다.

  • PDF

Analysis of Standardized Precipitation Index Considering the Rainfall Characteristics in Korea (우리나라의 강우특성을 고려한 표준강수지수 분석)

  • Kim, Sooyoung;Shin, Ju-Young;Seo, Jungho;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.349-349
    • /
    • 2017
  • 표준강수지수(Standardized precipitation index, SPI)는 가장 널리 사용되고 있는 가뭄지수로, 우리나라 뿐만 아니라 세계기상기구(World Meteorological Organization)에서도 추천하고 있는 대표적인 기상학적 가뭄 지수라고 할 수 있다. 현재 표준강수지수는 2변수 gamma 분포를 적용하여 강수 부족 상황을 지수화하여 나타내고 있는데, 일부 연구에서는 다른 확률분포형의 적용하기도 하였다(Guttman, 1999; Lloyd-Hughes and Saunders, 2002; Stagge et al., 2015). 우리나라에서는 유원희(2000)에 의해 Pearson type 3, 2변수 gamma, generalized logistic, GEV, 3변수 log-normal 분포에 따른 SPI 산정 결과를 비교한 연구가 수행되었는데, SPI 산정에는 분포형별 차이가 뚜렷하지 않다는 결론을 얻었다. 그러나 이때 금강유역 내 지점에 국한하여 적용하였고, 분포형별 적합도 검정을 수행하지 않고 SPI 산정결과만을 비교하여 우리나라에 일반적으로 적용하기에는 어려움이 있다. 따라서 본 연구에서는 우리나라의 강우특성을 반영할 수 있도록 다양한 확률분포형을 고려하여 표준강수지수를 분석하고자 한다. 이를 위해 관측기간이 30년 이상인 기상관측소의 월단위 강우자료를 구축하고, 월단위 강우자료에 다양한 확률분포형을 적용하고자 한다. 이때 적용하는 확률분포형은 2변수 gamma, Gumbel, normal 분포이다. 적정 확률분포형 선정을 위해 적합도 검정을 수행하고자 한다. 또한 각 분포형별로 산정된 표준강수지수를 기존 표준강수지수와 비교검토하고자 한다.

  • PDF

Application of Jackknife Method for Determination of Representative Probability Distribution of Annual Maximum Rainfall (연최대강우량의 대표확률분포형 결정을 위한 Jackknife기법의 적용)

  • Lee, Jae-Joon;Lee, Sang-Won;Kwak, Chang-Jae
    • Journal of Korea Water Resources Association
    • /
    • v.42 no.10
    • /
    • pp.857-866
    • /
    • 2009
  • In this study, basic data is consisted annual maximum rainfall at 56 stations that has the rainfall records more than 30years in Korea. The 14 probability distributions which has been widely used in hydrologic frequency analysis are applied to the basic data. The method of moments, method of maximum likelihood and probability weighted moments method are used to estimate the parameters. And 4-tests (chi-square test, Kolmogorov-Smirnov test, Cramer von Mises test, probability plot correlation coefficient (PPCC) test) are used to determine the goodness of fit of probability distributions. This study emphasizes the necessity for considering the variability of the estimate of T-year event in hydrologic frequency analysis and proposes a framework for evaluating probability distribution models. The variability (or estimation error) of T-year event is used as a criterion for model evaluation as well as three goodness of fit criteria (SLSC, MLL, and AIC) in the framework. The Jackknife method plays a important role in estimating the variability. For the annual maxima of rainfall at 56 stations, the Gumble distribution is regarded as the best one among probability distribution models with two or three parameters.

Mixed distributions and Laten Process over Nonstationary Rainfall/Flood Frequency Estimates over South Korea: The Role of Large Scale Climate Pattern (혼합 분포와 은닉 과정 모의를 통한 비정상성 강우/빈도 빈도해석: 전지구 기상학적 변동성의 역할)

  • Kwon, Hyun-Han
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.8-8
    • /
    • 2018
  • 전통적인 빈도해석은 정상성 가정을 기초로 단일 확률분포를 강우 및 홍수량 자료에 적용하는 과정을 통해 확률수문량을 추정하는 것을 목적으로 하고 있다. 그러나 전지구적인 기상학적 변동성 및 기후변화로 기인하는 극치수문량의 발생 빈도 및 양적 크기의 변화는 확률통계학적 관점에서 서로 다른 분포특성을 가지게 된다. 대표적인 기상변동성인 엘니뇨가 발생하는 경우 지역에 따라 홍수 및 가뭄이 발생 발생하게 되며, 이러한 극치수문량은 일반적으로 나타나는 홍수 및 가뭄의 분포특성과는 상이한 경우가 많다. 즉, 2개 이상의 확률분포 특성이 혼재된 혼합분포의 특성을 가지는 경우가 나타내게 되며 이를 고려한 빈도해석 기법의 개발 및 적용이 필요하다. 혼합분포를 활용한 빈도해석에서 가장 중요한 사항 중에 하나는 개별 분포에 적용되는 가중치를 추정하는 것으로서 통계학적 관점에서 자료의 특성에 근거하여 내재되어 있는 은닉상태(latent process)를 추정하는 과정과 유사하다. 이와 더불어 앞서 언급된 기상학적 변동성을 빈도해석에 반영하기 위한 비정상성 해석기법의 개발 및 적용도 필요하다. 본 연구에서는 혼합분포를 활용한 비정상성빈도해석모형을 개발하는데 목적이 있으며 개별매개변수의 동적거동 뿐만 아니라 가중치에 대한 시간적인 종속성도 고려할 수 있는 모형으로 동적모형으로 다양한 실험적 해석이 가능하다. 본 연구에서는 개발된 모형을 기반으로 엘니뇨와 같은 기상변동성에 따른 강우 및 홍수빈도해석 측면에서 은닉상태에 변화, 이로 인한 확률분포의 특성 및 설계수문량의 동적변동성을 평가하고자 한다.

  • PDF

Parameters Estimation of Probability Distributions Using Meta-Heuristic Algorithms (Meta-Heuristic Algorithms를 이용한 확률분포의 매개변수 추정)

  • Yoon, Suk-Min;Lee, Tae-Sam;Kang, Myung-Gook;Jeong, Chang-Sam
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.464-464
    • /
    • 2012
  • 수문분야에 있어서 빈도해석의 목적은 특정 재현기간에 대한 발생 가능한 수문량의 규모를 파악하는데 있으며, 빈도해석의 정확도는 적합한 확률분포모형의 선택과 매개변수 추정방법에 의존하게 된다. 일반적으로 각 확률분포모형의 특성을 대표하는 매개변수를 추정하기 위해서는 모멘트 방법, 확률가중 모멘트 방법, 최대우도법 등을 이용하게 된다. 모멘트 방법에 의한 매개변수 추정은 해를 구하기 위한 과정이 단순한 반면, 비대칭형의 왜곡된 분포를 갖는 자료들에 대해서는 부정확한 결과를 나타내게 된다. 확률가중 모멘트 방법은 표본의 크기가 작거나 왜곡된 자료일 경우에도 비교적 안정적인 결과를 제공하는 반면, 확률 가중치가 정수로만 제한되는 단점을 갖고 있다. 그리고 대수 우도함수를 이용하여 매개변수를 추정하게 되는 최우도법은 가장 효율적인 매개변수 추정치를 얻을 수 있는 것으로 알려져 있으나, 비선형 연립방정식으로 표현되는 해를 구하기 위해서는 Newton-Raphson 방법을 사용하는 등 절차가 복잡하며, 때로는 수렴이 되지 않아 해룰 구하지 못하는 경우가 발생되게 된다. 이에 반해, 최근의 Genetic Algorithm, Ant Colony Optimization 및 Simulated Annealing과 같은 Meta-Heuristic Algorithm들은 복잡합 공학적 최적화 문제 있어서 효율적인 대안으로 주목받고 있으며, Hassanzadeh et al.(2011)에 의해 수문학적 빈도해석을 위한 매개변수 추정에 있어서도 그 적용성이 검증된바 있다. 본 연구의 목적은 연 최대강수 자료의 빈도해석에 적용되는 확률분포모형들의 매개변수 추정을 위해 Meta-Heuristic Algorithm을 적용하고자 함에 있다. 따라서 본 연구에서는 매개변수 추정을 위한 방법으로 Genetic Algorithm 및 Harmony Search를 적용하였고, 그 결과를 최우도법에 의한 결과와 비교하였다. GEV 분포를 이용하여 Simulation Test를 수행한 결과 Genetic Algorithm을 이용하여 추정된 매개변수들은 최우도법에 의한 결과들과 비교적 유사한 분포를 나타내었으나 과도한 계산시간이 요구되는 것으로 나타났다. 하지만 Harmony Search를 이용하여 추정된 매개변수들은 최우도법에 의한 결과들과 유사한 분포를 나타내었을 뿐만 아니라 계산시간 또한 매우 짧은 것으로 나타났다. 또한 국내 74개소의 강우관측소 자료와 Gamma, Log-normal, GEV 및 Gumbel 분포를 이용한 실증연구에 있어서도 Harmony Search를 이용한 매개변수 추정은 효율적인 매개 변수 추정치를 제공하는 것으로 나타났다.

  • PDF