• Title/Summary/Keyword: 조건부 분포

Search Result 138, Processing Time 0.029 seconds

Non-stationary Frequency Analysis with Climate Variability using Conditional Generalized Extreme Value Distribution (기후변동을 고려한 조건부 GEV 분포를 이용한 비정상성 빈도분석)

  • Kim, Byung-Sik;Lee, Jung-Ki;Kim, Hung-Soo;Lee, Jin-Won
    • Journal of Wetlands Research
    • /
    • v.13 no.3
    • /
    • pp.499-514
    • /
    • 2011
  • An underlying assumption of traditional hydrologic frequency analysis is that climate, and hence the frequency of hydrologic events, is stationary, or unchanging over time. Under stationary conditions, the distribution of the variable of interest is invariant to temporal translation. Water resources infrastructure planning and design, such as dams, levees, canals, bridges, and culverts, relies on an understanding of past conditions and projection of future conditions. But, Water managers have always known our world is inherently non-stationary, and they routinely deal with this in management and planning. The aim of this paper is to give a brief introduction to non-stationary extreme value analysis methods. In this paper, a non-stationary hydrologic frequency analysis approach is introduced in order to determine probability rainfall consider changing climate. The non-stationary statistical approach is based on the conditional Generalized Extreme Value(GEV) distribution and Maximum Likelihood parameter estimation. This method are applied to the annual maximum 24 hours-rainfall. The results show that the non-stationary GEV approach is suitable for determining probability rainfall for changing climate, sucha sa trend, Moreover, Non-stationary frequency analyzed using SOI(Southern Oscillation Index) of ENSO(El Nino Southern Oscillation).

Geostatistical Simulation of Compositional Data Using Multiple Data Transformations (다중 자료 변환을 이용한 구성 자료의 지구통계학적 시뮬레이션)

  • Park, No-Wook
    • Journal of the Korean earth science society
    • /
    • v.35 no.1
    • /
    • pp.69-87
    • /
    • 2014
  • This paper suggests a conditional simulation framework based on multiple data transformations for geostatistical simulation of compositional data. First, log-ratio transformation is applied to original compositional data in order to apply conventional statistical methodologies. As for the next transformations that follow, minimum/maximum autocorrelation factors (MAF) and indicator transformations are sequentially applied. MAF transformation is applied to generate independent new variables and as a result, an independent simulation of individual variables can be applied. Indicator transformation is also applied to non-parametric conditional cumulative distribution function modeling of variables that do not follow multi-Gaussian random function models. Finally, inverse transformations are applied in the reverse order of those transformations that are applied. A case study with surface sediment compositions in tidal flats is carried out to illustrate the applicability of the presented simulation framework. All simulation results satisfied the constraints of compositional data and reproduced well the statistical characteristics of the sample data. Through surface sediment classification based on multiple simulation results of compositions, the probabilistic evaluation of classification results was possible, an evaluation unavailable in a conventional kriging approach. Therefore, it is expected that the presented simulation framework can be effectively applied to geostatistical simulation of various compositional data.

An Alternative Parametric Estimation of Sample Selection Model: An Application to Car Ownership and Car Expense (비정규분포를 이용한 표본선택 모형 추정: 자동차 보유와 유지비용에 관한 실증분석)

  • Choi, Phil-Sun;Min, In-Sik
    • Communications for Statistical Applications and Methods
    • /
    • v.19 no.3
    • /
    • pp.345-358
    • /
    • 2012
  • In a parametric sample selection model, the distribution assumption is critical to obtain consistent estimates. Conventionally, the normality assumption has been adopted for both error terms in selection and main equations of the model. The normality assumption, however, may excessively restrict the true underlying distribution of the model. This study introduces the $S_U$-normal distribution into the error distribution of a sample selection model. The $S_U$-normal distribution can accommodate a wide range of skewness and kurtosis compared to the normal distribution. It also includes the normal distribution as a limiting distribution. Moreover, the $S_U$-normal distribution can be easily extended to multivariate dimensions. We provide the log-likelihood function and expected value formula based on a bivariate $S_U$-normal distribution in a sample selection model. The results of simulations indicate the $S_U$-normal model outperforms the normal model for the consistency of estimators. As an empirical application, we provide the sample selection model for car ownership and a car expense relationship.

우리나라 채권수익률(債券收益率)의 이분산성(異分散性)에 관한 연구

  • Jang, Guk-Hyeon;Lee, Jin
    • The Korean Journal of Financial Management
    • /
    • v.13 no.1
    • /
    • pp.203-220
    • /
    • 1996
  • 본 연구에서는 우리나라 채권시장의 변동성 분석과 추정을 위하여 Markov-Switching ARCH (SWARCH)모형과 GMM모형 및 I-GARCH모형을 적용하였다. 관측된 자료는 1993년 1월에서부터 1996년 4월까지의 주별 91일물 양도성 예금증서 수익률이다. 본 연구에서 채권 수익률 분산과정의 추정을 위해 사용하는 SWARCH 모형은 경제나 채권시장의 국면전환으로 말미암아 채권수익률의 변동성이 이질적인 분포에서 오는 경우 서로 다른 분산 국면의 확률적 식별이 가능할 뿐만 아니라 지속성이 GARCH모형보다 작아서 조건부 변동성의 예측력이 뛰어난 모형으로 알려져 있다. 또한 SWARCH모형은 베이즈이론에 의한 확률의 개념으로 국면전환을 추정하기 때문에 주관적인 국면전환시점의 판단이 불필요하다는 장점을 가진다 여러 가지 모형들의 추정결과 I-GARCH 모형과 SWARCH 모형등이 우리나라 단기 채권수익률의 조건부 변동성을 비교적 잘 설명해 내는 것으로 나타났으며 우리나라 단기 채권시장은 1993년 6월부터 1993년 12월초까지, 1994년 7월경부터 1995년 5월경까지 비교적 높은 변동성을 유지하였으며 그후로는 변동성이 등락을 계속하는 것으로 추정되었다. 본 연구의 결과 아직은 태동단계에 머물러 있는 한국 채권시장의 시계열적 특성을 체계적으로 문서화하고 정교하고 다양한 최근 계량기법을 체계적으로 정리하고 응용하여 시장 참가자들의 기회비용과 시행착오의 기간을 단축시키는데 도움을 줄 수 있을 것으로 기대된다.

  • PDF

Analysis of Total Crime Count Data Based on Spatial Association Structure (공간적 연관구조를 고려한 총범죄 자료 분석)

  • Choi, Jung-Soon;Park, Man-Sik;Won, Yu-Bok;Kim, Hag-Yeol;Heo, Tae-Young
    • The Korean Journal of Applied Statistics
    • /
    • v.23 no.2
    • /
    • pp.335-344
    • /
    • 2010
  • Reliability of the estimation is usually damaged in the situation where a linear regression model without spatial dependencies is employed to the spatial data analysis. In this study, we considered the conditional autoregressive model in order to construct spatial association structures and estimate the parameters via the Bayesian approaches. Finally, we compared the performances of the models with spatial effects and the ones without spatial effects. We analyzed the yearly total crime count data measured from each of 25 districts in Seoul, South Korea in 2007.

Reynolds Shear Stress Distribution in Turbulent Channel Flows (난류 채널 유동 내부의 레이놀즈 전단 응력 분포)

  • Kim, Kyoung-Youn
    • Transactions of the Korean Society of Mechanical Engineers B
    • /
    • v.36 no.8
    • /
    • pp.829-837
    • /
    • 2012
  • Direct numerical simulations were carried out for turbulent channel flows with $Re_{\tau}$ = 180, 395 and 590 to investigate the turbulent flow structure related to the Reynolds shear stress. By examining the probability density function, the second quadrant (Q2) events with the largest contribution to the mean Reynolds shear stress were identified. The change in the inclination angle of Q2 events varies with wall units in $y^+<50$ and with the channel half height in y/h > 0.5. Conditionally averaged flow fields for the Q2 event show that the flow structures associated with Reynolds shear stress are a quasi-streamwise vortex in the buffer layer and a hairpin-shaped vortex in the outer layer. Three-dimensional visualization of the distribution of high Reynolds shear stress reveals that the organization of hairpin vortices in the outer layer having a size of 1.5~3 h is associated with large-scale motions with high Reynolds shear stress in the outer layer.

Variability Analysis of Design Flood Considering Uncertainty of Rainfall-Runoff Model and Climate Change (기후변화 영향과 강우-유출 모형의 불확실성을 고려한 설계홍수량 변동성 분석)

  • Kwon, Hyun-Han;Kim, Jang-Gyeong;Lee, Jong-Seok
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.365-365
    • /
    • 2012
  • 이수 및 치수를 위한 수공구조물 설계 및 하천기본계획 수립의 요점은 설계홍수량의 산정에 있으며, 통계적으로 유의성을 가지는 설계홍수량을 산정하기 위해서는 일반적으로 30년 이상 관측된 홍수자료가 요구된다. 우리나라의 경우 대부분의 유역이 미계측 유역이거나 관측년수가 비교적 작은 경우가 많으므로, 상대적으로 자료 연한이 긴 강우자료를 빈도분석한 후 이를 강우-유출 모형에 입력하여 확률홍수량을 추정하는 간접적인 방법이 주로 이용되며 사용된 강우의 빈도가 홍수의 빈도와 동일하다는 가정을 기본으로 한다. 그러나 동일한 강우량이 발생하더라도 강우의 강도, 지속시간, 유역의 선행함수조건 등과 같은 유역 특성에 따라 유출의 특성은 현저히 다르게 나타나며 결국 이러한 특성은 입력자료, 강우-유출 모형, 기후변동성 등과 같은 불확실성 요소로 인식될 수 있다. 따라서 본 연구에서는 이러한 불확실성을 고려할 수 있는 강우-유출 모의기법을 개발하여 이를 통해 홍수빈도곡선을 유도할 수 있는 방법론을 제시하고자 한다. 불확실성 분석을 위해 기존 HEC-1 강우-유출 모형에서 Bayesian MCMC 기법을 적용하여 매개변수들의 사후분포를 추정하여 매개변수들의 최적화 및 불확실성 분석을 수행하였다. 마지막으로 기후변화 영향을 통합한 홍수빈도곡선을 유도하기 위해서 극치강수를 모의하는 것이 필요하며, 본 연구에서는 극치값 재현에 있어서 우수한 성능을 발휘하는 Kernel-Pareto Piecewise분포 기반의 강우모의발생 기법을 적용하여 HEC-1모형과 연동되도록 모형을 개발하였다. 본 연구에서 제안하는 방법론은 기존 홍수빈도곡선 유도 방법에서 불확실성을 분석하기 위해 모든 변수들을 독립사상으로 간주하고 Monte Carlo Simulation을 수행함으로서 매개변수들간의 상호연관성, 상관성, 조건부 확률들을 고려할 수 없었던 점을 Bayesian 모형을 통해 매개변수들간의 조건부 확률을 고려한 매개변수의 사후분포 도출을 가능하게 하여 보다 현실적인 강우-유출 관계 도출이 가능하고 불확실성 구간이 자연적으로 도출됨으로서 향후, 신뢰성 있는 수자원 계획수립에 유용한 자료로 활용이 가능할 것으로 판단된다.

  • PDF

Comparison of Laplace and Double Pareto Penalty: LASSO and Elastic Net (라플라스와 이중 파레토 벌점의 비교: LASSO와 Elastic Net)

  • Kyung, Minjung
    • The Korean Journal of Applied Statistics
    • /
    • v.27 no.6
    • /
    • pp.975-989
    • /
    • 2014
  • Lasso (Tibshirani, 1996) and Elastic Net (Zou and Hastie, 2005) have been widely used in various fields for simultaneous variable selection and coefficient estimation. Bayesian methods using a conditional Laplace and a double Pareto prior specification have been discussed in the form of hierarchical specification. Full conditional posterior distributions with each priors have been derived. We compare the performance of Bayesian lassos with Laplace prior and the performance with double Pareto prior using simulations. We also apply the proposed Bayesian hierarchical models to real data sets to predict the collapse of governments in Asia.

Evolutionary Learning of Hypernetwork Classifiers Based on Sequential Bayesian Sampling for High-dimensional Data (고차 데이터 분류를 위한 순차적 베이지안 샘플링을 기반으로 한 하이퍼네트워크 모델의 진화적 학습 기법)

  • Ha, Jung-Woo;Kim, Soo-Jin;Zhang, Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.336-338
    • /
    • 2012
  • 본 연구에서는 고차 데이터 분류를 위해 순차적 베이지만 샘플링 기반의 진화연산 기법을 이용한 하이퍼네트워크 모델의 학습 알고리즘을 제시한다. 제시하는 방법에서는 모델의 조건부 확률의 사후(posterior) 분포를 최대화하도록 학습이 진행된다. 이를 위해 사전(prior) 분포를 문제와 관련된 사전지식(prior knowledge) 및 모델 복잡도(model complexity)로 정의하고, 측정된 모델의 분류성능을 우도(likelihood)로 사 용하며, 측정된 사전분포와 우도를 이용하여 모델의 적합도(fitness)를 정의한다. 이를 통해 하이퍼네트워크 모델은 고차원 데이터를 효율적으로 학습 가능할 뿐이 아니라 모델의 학습시간 및 분류성능이 개선될 수 있다. 또한 학습 시에 파라미터로 주어지던 하이퍼에지의 구성 및 모델의 크기가 학습과정 중에 적응적으로 결정될 수 있다. 제안하는 학습방법의 검증을 위해 본 논문에서는 약 25,000개의 유전자 발현정보 데이터셋에 대한 분류문제에 모델을 적용한다. 실험 결과를 통해 제시하는 방법이 기존 하이퍼네트워크 학습 방법 뿐 아니라 다른 모델들에 비해 우수한 분류 성능을 보여주는 것을 확인할 수 있다. 또한 다양한 실험을 통해 사전분포로 사용된 사전지식이 모델 학습에 끼치는 영향을 분석한다.

Log-density Ratio with Two Predictors in a Logistic Regression Model (로지스틱 회귀모형에서 이변량 정규분포에 근거한 로그-밀도비)

  • Kahng, Myung Wook;Yoon, Jae Eun
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.1
    • /
    • pp.141-149
    • /
    • 2013
  • We present methods for studying the log-density ratio that enables the selection of the predictors and the form to be included in the logistic regression model. Under bivariate normal distributional assumptions, we investigate the form of the log-density ratio as a function of two predictors. If two covariance matrices are equal, then the crossproduct and quadratic terms are not needed. If the variables are uncorrelated, we do not need the crossproduct terms, but we still need the linear and quadratic terms. We also explore other conditions in which the crossproduct and quadratic terms are not needed in the logistic regression model.