• 제목/요약/키워드: 확률 분포

검색결과 2,398건 처리시간 0.032초

복합확률분포의 파라메타 추정을 위한 EM 알고리즘의 적용 연구 (An Approach for the Estimation of Mixture Distribution Parameters Using EM Algorithm)

  • 심대영;김상구
    • 한국ITS학회 논문지
    • /
    • 제22권4호
    • /
    • pp.35-47
    • /
    • 2023
  • 그동안 차두시간분포를 나타내는 확률분포로 음지수분포, Erlang 분포, 정규분포 등 다양한 단일확률분포들이 사용되어져 왔다. 그러나, 실제 도로에서 차두시간분포의 조사결과는 단일확률분포로서 설명하기 어려운 경우가 있었다. 본 연구는 차량의 차두시간에 대해 두 개의 정규분포가 일정한 관련성을 가지고 결합된 복합확률분포의 파라메타에 대해 최우추정법 중 하나인 EM 알고리즘을 이용하여 추정하는 접근방법을 시도하였다. 이에 대한 분석결과 기존에 알려진 단일확률분포로서 잘 설명되기 어려웠던 차량도착 차두시간 분포를 EM 알고리즘을 이용하여 복합확률분포의 파라메타를 추정하여 설명하였다. χ2 test 적합도 검정결과, 유의수준 1%에서 통계학적으로 유의성이 확보되어 EM 알고리즘을 이용한 복합확률분포의 파라메타 추정의 신뢰성이 입증되는 것으로 분석되었다.

'0-과잉 모형'을 이용한 집중호우의 발생특성 분석 (Analysis of torrential rainfall characteristics using 'zero-inflated models')

  • 김상욱
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.453-453
    • /
    • 2017
  • 본 연구에서는 최근 기후변화로 인한 집중호우의 발생횟수의 경향을 확률적으로 분석함에 있어 1개월 동안 80 mm/day 이상의 강우사상을 집중호우로 정의하여, 대구 및 부산 강우관측소로부터 수집된 384개월 동안의 집중호우를 분석하였다. 집중호우 월별 발생횟수와 같은 형식의 자료의 확률적 분석은 대개 Poisson 분포 (POI)가 사용되나 자료에 포함된 0자료의 과잉은 확률분포를 왜곡시키는 문제를 발생시킨다. 본 연구에서는 이 문제를 개선하기 위하여 개발된 일반화 Poisson 확률분포 (GPD), 0-과잉 Poisson 확률분포 (ZIP), 0-과잉 일반화 Poisson 확률분포 (ZIGP), Bayesian 0-과잉 일반화 Poisson 확률분포 (Bayesian ZIGP)를 집중호우 자료에 적용하고, 5개 모형의 특성을 비교분석하였으며, Bayesian ZIGP 모형의 구축에 있어서는 정보적 사전분포를 사용함으로써 모형의 정확도를 개선하였다. 분석결과 분석하고자 하는 자료에 0이 과다하게 포함되어 있는 경우 POI 및 GPD 분포는 관측결과와는 다른 결과를 제시하여 적절한 모형으로 고려되지 못함을 알 수 있었다. 5가지 모형 중 정보적 사전분포를 탑재한 Bayesian ZIGP 모형이 가장 관측 자료와 유사한 결과를 도출하였으나 모형의 구축에 수반되는 실용적인 측면을 고려하면 ZIP 모형도 충분히 사용될 수 있는 모형으로 추천되었다.

  • PDF

집중호우사상의 월별 발생특성 모의를 위한 확률분포 개발 (Development of probability distribution for simulation of monthly characteristics of torrential rainfall events)

  • 김상욱;김형배
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.246-246
    • /
    • 2016
  • 본 연구에서는 최근 기후변화로 인한 집중호우의 발생횟수의 경향을 확률적으로 분석함에 있어 1개월 동안 80 mm/day 이상의 강우사상을 집중호우로 정의하여, 대구 및 부산 강우관측소로부터 수집된 384개월 동안의 집중호우를 분석하였다. 집중호우 월별 발생횟수와 같은 형식의 자료의 확률적 분석은 대개 Poisson 분포 (POI)가 사용되나 자료에 포함된 0자료의 과잉은 확률분포를 왜곡시키는 문제를 발생시킨다. 본 연구에서는 이 문제를 개선하기 위하여 개발된 일반화 Poisson 확률분포 (GPD), 0-과잉 Poisson 확률분포 (ZIP), 0-과잉 일반화 Poisson 확률분포 (ZIGP), Bayesian 0-과잉 일반화 Poisson 확률분포 (Bayesian ZIGP)를 집중호우 자료에 적용하고, 5개 모형의 특성을 비교분석하였으며, Bayesian ZIGP 모형의 구축에 있어서는 정보적 사전분포를 사용함으로써 모형의 정확도를 개선하였다. 분석결과 분석하고자 하는 자료에 0이 과다하게 포함되어 있는 경우 POI 및 GPD 분포는 관측결과와는 다른 결과를 제시하여 적절한 모형으로 고려되지 못함을 알 수 있었다. 5가지 모형 중 정보적 사전분포를 탑재한 Bayesian ZIGP 모형이 가장 관측 자료와 유사한 결과를 도출하였으나 모형의 구축에 수반되는 실용적인 측면을 고려하면 ZIP 모형도 충분히 사용될 수 있는 모형으로 추천되었다.

  • PDF

연속형 타부 탐색에서 코시 확률 분포의 역할 (The Role of the Cauchy Probability Distribution in a Continuous Taboo Search)

  • 이창용;이동주
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권8호
    • /
    • pp.591-598
    • /
    • 2010
  • 본 논문에서는 연속형 최적화 문제를 위한 타부 탐색에서 후보 해를 생성하기 위해 사용되는 정규 분포의 단점을 보완하기 위하여 코시 확률 분포에 기초한 후보 해 생성 방법을 제안하였다. 코시 확률 분포는 평균 및 분산 등이 무한대인 확률 분포이며, 분포의 꼬리 부분의 확률이 정규 분포에 비하여 상대적으로 크다. 따라서 코시 분포를 사용하면 변수의 변화가 큰 후보 해가 생성될 확률이 높기 때문에 보다 넓은 변수 공간을 탐색할 수 있는 장점이 있다. 코시 확률 분포를 사용한 타부 탐색의 성능을 기존의 정규 분포를 사용한 방법과 비교 분석하기 위하여 실변수 함수로 구성된 벤치마킹 문제에 적용하여 실험을 실행하였다. 실험 결과를 통해 볼 때, 실험에 사용한 모든 함수에 대하여 코시 분포를 사용한 방법이 보다 나은 결과를 나타냈으며, 또한 통계적 가설 검정을 통하여 코시 확률 분포의 우수성을 입증하였다.

INVERSE GAUSSIAN분포의 모수비에 대한 무정보적 사전분포에 대한 연구 (Noninformative Priors for the Ratio of Parameters in Inverse Gaussian Distribution)

  • 강상길;김달호;이우동
    • 응용통계연구
    • /
    • 제17권1호
    • /
    • pp.49-60
    • /
    • 2004
  • 이 논문의 목적은 역 가우스 분포의 모수비가 관심의 대상일 때, 그 모수비에 대한 무정보적 사전분포를 구하는데 있다. 특별히, 모수비에 대한 확률대응사전분포와 기준 사전분포를 제안하였다. 먼저, 관심의 대상이 되는 모수에 대해 모수 직교화 변환을 구하고, 모수 직교화 변환을 이용하여 확률대응사전분포와 기준사전분포를 구하였다. 특히 확률대응사전분포의 일치차수는 1차임을 보였으며 2차 확률대응사전분포는 존재하지 않음을 보였다. 또한 제안된 사전분포에 의해 유도된 사후분포는 적절 분포임을 증명하였다. 모의 실험을 통하여 확률대응사전분포와 기준사전분포를 비교했으며, 실제자료를 이용하여 분석하는 예를 보였다.

Power Distribution을 이용한 저수지 하천유량 추정 (Estimation of Low-flow by Power Distribution)

  • 김상욱;손민우;홍일표
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.697-700
    • /
    • 2006
  • 저수시 하천유량(Low Streamflow)의 추정은 하천의 수질관리, 용수공급계획, 댐 방류계획등의 수자원관리에 있어서 매우 중요한 부분이다. 이러한 중요성에 따라 Vogel과 Kroll (1989)은 저수시 하천유량을 추정하기 위한 여러 가지 확률분포함수를 제안하였다. 가장 흔히 제안되어지는 이변수 확률분포(Two-Parameter Distribution)로는 Lognormal 분포와 Weibull 분포가 있으며 이와 더불어 Three-Parameter Lognormal, Three-Parameter Weibull, Log Person Type Ⅲ 분포도 널리 사용되어진다. 그러나 이러한 여러 가지 확률 분포함수 중에서 가장 적절한 확률분포의 선택은 저수시 하천유량의 물리적인 측면과는 상관없이 주로 적합도(Gooness of Fit)에 기인된 통계치에 의해서만 결정되기도 하는데 이러한 경우 잘못된 가정을 받아들이는 확률이 높아짐에 따라 추정결과의 신뢰성(Reliability)을 감소시킬 수 있다. 이러한 문제점을 극복하기 위해서 Onoz와 Bayazit (2001)는 Recession Curve를 지수함수로 가정하고 최대 갈수 기간의 길이(Maximum Dry Period Length)의 확률에 대한 이론적인 결과치들을 사용하여 Weibull 분포의 특정한 경우에 해당되어지는 Power 분포를 유도하였으며 유도된 Power 분포의 매개변수를 추정하기 위하여 L-Moment 방법을 사용하였다. 또한 Onoz와 Bayazit (2001) 작은 유출량에서 확률분포와 잘 맞지 않는 경우 작은 유출량값에 작은 가중치를 부여하여 확률분포에 대한 영향을 줄이는 방법인 LL-Moment 방법을 제안하였다. 본 연구에서는 낙동강 유역의 1번부터 5번 소유역에 대해 SSARR 모형을 이용하여 모의한 유출량을 이용하여 Weibull 분포, L-Moment방법에 의해 추정된 매개변수를 사용한 Power 분포, LL-Moment 방법에 의해 추정된 매개변수를 사용한 Power 분포를 적용하였으며 이들 분포의 적합도를 PPCC Test를 사용하여 평가해봄으로써 낙동강 유역에서의 저수시의 유출량 추정에 대한 Power 분포의 적용성을 판단해 보았다.

  • PDF

Bayesian GEV분포를 이용한 확률강우량 추정 및 불확실성 평가 (A Study on Estimation of Design Rainfall and Uncertainty Analysis Based on Bayesian GEV Distribution)

  • 권현한;김진영
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.366-366
    • /
    • 2012
  • 확률강우량은 하천설계, 수자원설계 및 계획을 위한 기초자료로 활용되며 최근 이상기후 및 기후변화로 인한 극치강우의 빈도 및 양적 증가로 인한 확률강우량 산정의 불확실성 분석에 대한 관심이 크게 증가하고 있다. 수문빈도 해석에 있어서 대부분 지역이 50년 이하의 수문자료가 이용되고 있으며 수문설계에서 요구되는 50년 이상의 확률강수량 추정시에는 상당한 불확실성을 내포하고 있다. 이러한 점에서 본 연구에서는 자료연수에 따른 Sampling Error와 분포형의 매개변수의 불확실성을 고려한 해석모형을 구축하고자 한다. 빈도해석에서 매개변수를 추정하기 위해서는 일반적으로 모멘트법, 최우도법, 확률가중모멘트법이 이용되고 있으나 사용되는 분포형에 따라서 통계학적으로 불확실성 구간을 정량화하는 과정이 난해할 뿐만 아니라 극치 수문자료가 Thick-Tailed분포의 특성을 가짐에도 불구하고 신뢰구간 산정시 정규분포로 가정하는 등 기존 해석 방법에는 많은 문제점을 내포하고 있다. 본 연구에서는 이러한 매개변수의 불확실성 평가에 있어서 우수한 해석능력을 발휘하는 Bayesian기법을 도입하여 분포형의 매개변수를 추정하고 매개변수 추정과 관련된 불확실성을 평가하고자 한다. 이와 별개로 자료연한에 따른 Sampling Error를 추정하기 위해서 Bootstrapping 기반의 해석모형을 구축하고자 하며 최종적으로 빈도해석시에 나타나는 불확실성을 종합적으로 검토하였다. 빈도해석을 위한 확률분포형으로 GEV(generalized extreme value)분포를 이용하였으며 Gibbs 샘플러를 활용한 Bayesian Markov Chain Monte Carlo 모의를 기본 해석모형으로 활용하였다.

  • PDF

우리나라의 강우특성을 고려한 표준강수지수 분석 (Analysis of Standardized Precipitation Index Considering the Rainfall Characteristics in Korea)

  • 김수영;신주영;서정호;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.349-349
    • /
    • 2017
  • 표준강수지수(Standardized precipitation index, SPI)는 가장 널리 사용되고 있는 가뭄지수로, 우리나라 뿐만 아니라 세계기상기구(World Meteorological Organization)에서도 추천하고 있는 대표적인 기상학적 가뭄 지수라고 할 수 있다. 현재 표준강수지수는 2변수 gamma 분포를 적용하여 강수 부족 상황을 지수화하여 나타내고 있는데, 일부 연구에서는 다른 확률분포형의 적용하기도 하였다(Guttman, 1999; Lloyd-Hughes and Saunders, 2002; Stagge et al., 2015). 우리나라에서는 유원희(2000)에 의해 Pearson type 3, 2변수 gamma, generalized logistic, GEV, 3변수 log-normal 분포에 따른 SPI 산정 결과를 비교한 연구가 수행되었는데, SPI 산정에는 분포형별 차이가 뚜렷하지 않다는 결론을 얻었다. 그러나 이때 금강유역 내 지점에 국한하여 적용하였고, 분포형별 적합도 검정을 수행하지 않고 SPI 산정결과만을 비교하여 우리나라에 일반적으로 적용하기에는 어려움이 있다. 따라서 본 연구에서는 우리나라의 강우특성을 반영할 수 있도록 다양한 확률분포형을 고려하여 표준강수지수를 분석하고자 한다. 이를 위해 관측기간이 30년 이상인 기상관측소의 월단위 강우자료를 구축하고, 월단위 강우자료에 다양한 확률분포형을 적용하고자 한다. 이때 적용하는 확률분포형은 2변수 gamma, Gumbel, normal 분포이다. 적정 확률분포형 선정을 위해 적합도 검정을 수행하고자 한다. 또한 각 분포형별로 산정된 표준강수지수를 기존 표준강수지수와 비교검토하고자 한다.

  • PDF

연최대강우량의 대표확률분포형 결정을 위한 Jackknife기법의 적용 (Application of Jackknife Method for Determination of Representative Probability Distribution of Annual Maximum Rainfall)

  • 이재준;이상원;곽창재
    • 한국수자원학회논문집
    • /
    • 제42권10호
    • /
    • pp.857-866
    • /
    • 2009
  • 본 연구에서는 전국의 30년 이상의 강우관측기록을 보유하고 있는 기상청 산하 56개 강우관측소의 연 최대치 강우자료들로부터 확률분포형에 대하여 모멘트법, 최우추정법, 확률가중모멘트법을 이용하여 모수를 추정하고, 그 모수의 범위와 확률변수의 범위에 대한 적정성을 알아보았다. 적정성이 있는 모수를 대상으로 적합도 검정법인 x$^2$-검정, K-S검정, Cramer von Mises (CVM)검정, Probability Plot Correlation Coefficient (PPCC) 검정을 실시한 결과 중, 최근 연구에서 많이 이용되고 있고 표본자료의 크기가 작거나 왜곡된 자료일 경우에도 비교적 안정적인 결과를 얻을 수 있는 확률가중모멘트법과 상관계수에 의한 검정인 PPCC검정을 통과한 분포형을 우선적으로 적합도 평가 대상 분포형으로 선정하였다. 선정된 분포형을 대상으로 적합도 평가기준인 SLSC, MLL, AIC를 적용하여 적합도 평가를 실시하여 대표확률분포형 후보군을 추출하였다. 대표확률분포형 후보군으로 선정된 확률분포형에 대하여 resampling방법인 Jackknife기법을 적용하여 변동성을 파악하고, 변동성이 가장 작게 나타난 분포형을 그 지점의 대표확률분포형으로 결정하였다. 본 논문에서는 분석 결과의 분량을 감안하여 대표적으로 서울, 강릉, 대구, 전주, 부산 지점에 대해 작성하였으며, 확률강우량의 변동성이 가장 작은 확률분포형을 56개 지점의 각 지점 대표확률분포형으로 제시하였으며, Gumbel 분포(GUM)의 선정 비율이 지속기간 12시간, 24시간에 대해 각각 41 %, 32 %로 가장 높게 나타났다. 본 연구에서는 적합도 평가를 함에 있어서 객관적 정량화가 가능한 세 가지 기준과 Jackknife기법을 이용한 새로운 확률분포형 선정의 가능성을 제시하였다.

위치 데이터에서 유도된 속도의 확률분포 (Use of Probability Distribution of Speed derived from Positioning Data)

  • 온경운;이준석;송하윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1092-1095
    • /
    • 2013
  • 오늘날 모바일 스마트 기기의 발전은 위치기반의 새로운 기술을 이끌었다. 현재 위치 데이터를 사용하는 많은 응용프로그램들이 소개되었고, 또한 널리 사용되고 있다. 하지만 아직 이러한 위치 데이터들은 환경적인 요소 등으로 인해 오류가 많다. 우리는 이전 연구에서 위치 데이터의 오류 검출 및 교정 알고리즘을 제안하였다. 또 다른 연구에선 인간의 이동속도가 어떠한 확률분포모델을 따르는지 연구하였다. 그리하여 본 논문에서는 인간의 이동속도의 분포로서 적합하다고 판명된 확률분포모델 중 Lognormal 분포, Gamma 분포, Weibull분포를 선택하여 위치데이터 오류 검출 및 교정 알고리즘에 적용하기 위한 확률분포 계산을 제안한다. 그 중 일부는 계산의 복잡도를 낮추기 위해 확률분포표를 제공할 것이다.