• Title/Summary/Keyword: 혼합정규분포모형

Search Result 34, Processing Time 0.021 seconds

Robust Bayesian meta analysis (로버스트 베이지안 메타분석)

  • Choi, Seong-Mi;Kim, Dal-Ho;Shin, Im-Hee;Kim, Ho-Gak;Kim, Sang-Gyung
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.3
    • /
    • pp.459-466
    • /
    • 2011
  • This article addresses robust Bayesian modeling for meta analysis which derives general conclusion by combining independently performed individual studies. Specifically, we propose hierarchical Bayesian models with unknown variances for meta analysis under priors which are scale mixtures of normal, and thus have tail heavier than that of the normal. For the numerical analysis, we use the Gibbs sampler for calculating Bayesian estimators and illustrate the proposed methods using actual data.

ROC Curve Fitting with Normal Mixtures (정규혼합분포를 이용한 ROC 분석)

  • Hong, Chong-Sun;Lee, Won-Yong
    • The Korean Journal of Applied Statistics
    • /
    • v.24 no.2
    • /
    • pp.269-278
    • /
    • 2011
  • There are many researches that have considered the distribution functions and appropriate covariates corresponding to the scores in order to improve the accuracy of a diagnostic test, including the ROC curve that is represented with the relations of the sensitivity and the specificity. The ROC analysis was used by the regression model including some covariates under the assumptions that its distribution function is known or estimable. In this work, we consider a general situation that both the distribution function and the elects of covariates are unknown. For the ROC analysis, the mixtures of normal distributions are used to estimate the distribution function fitted to the credit evaluation data that is consisted of the score random variable and two sub-populations of parameters. The AUC measure is explored to compare with the nonparametric and empirical ROC curve. We conclude that the method using normal mixtures is fitted to the classical one better than other methods.

Development of Truck Axle Load Distribution Model using WIM Data (WIM 자료를 활용한 화물차 축하중 분포 모형 개발)

  • Lee, Dong Seok;Oh, Ju Sam
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.26 no.5D
    • /
    • pp.821-829
    • /
    • 2006
  • Traffic load comprise primary input to pavement design causing pavement damage. therefore it should be proceeded suitable traffic load distribution modeling for pavement design and analysis. Traffic load have been represented by equivalent single axle loads (ESALs) which convert mixed traffic stream into one value for design purposes. But there are some limit to apply ESALs to other roads because it is empirical value developed as part of the original AASHO(American Association of State Highway Officials) road test. There have been many efforts to solve these problems. Several leading country have implemented M-E(Mechanistic-Empirical) design procedures based on mechanical concept. As a result, they established traffic load quantification method using load distribution model known as Axle Load Spectra. This paper details Axle Load Spectra and presents axle load distribution model based on normal mixture distribution function using truck load data collected by WIM system installed in national highway. Axle load spectra and axle load distribution model presented in this paper could be useful for basic data when making traffic load quantification plan for pavement design, overweight vehicle permit plan and pavement maintenance cost plan.

Classification accuracy measures with minimum error rate for normal mixture (정규혼합분포에서 최소오류의 분류정확도 측도)

  • Hong, C.S.;Lin, Meihua;Hong, S.W.;Kim, G.C.
    • Journal of the Korean Data and Information Science Society
    • /
    • v.22 no.4
    • /
    • pp.619-630
    • /
    • 2011
  • In order to estimate an appropriate threshold and evaluate its performance for the data mixed with two different distributions, nine kinds of well-known classification accuracy measures such as MVD, Youden's index, the closest-to- (0,1) criterion, the amended closest-to- (0,1) criterion, SSS, symmetry point, accuracy area, TA, TR are clustered into five categories on the basis of their characters. In credit evaluation study, it is assumed that the score random variable follows normal mixture distributions of the default and non-default states. For various normal mixtures, optimal cut-off points for classification measures belong to each category are obtained and type I and II error rates corresponding to these cut-off points are calculated. Then we explore the cases when these error rates are minimized. If normal mixtures might be estimated for these kinds of real data, we could make use of results of this study to select the best classification accuracy measure which has the minimum error rate.

Modeling sharply peaked asymmetric multi-modal circular data using wrapped Laplace mixture (겹친라플라스 혼합분포를 통한 첨 다봉형 비대칭 원형자료의 모형화)

  • Na, Jong-Hwa;Jang, Young-Mi
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.5
    • /
    • pp.863-871
    • /
    • 2010
  • Until now, many studies related circular data are carried out, but the focuses are mainly on mildly peaked symmetric or asymmetric cases. In this paper we studied a modeling process for sharply peaked asymmetric circular data. By using wrapped Laplace, which was firstly introduced by Jammalamadaka and Kozbowski (2003), and its mixture distributions, we considered the model fitting problem of multi-modal circular data as well as unimodal one. In particular we suggested EM algorithm to find ML estimates of the mixture of wrapped Laplace distributions. Simulation results showed that the suggested EM algorithm is very accurate and useful.

A mixed model for repeated split-plot data (반복측정의 분할구 자료에 대한 혼합모형)

  • Choi, Jae-Sung
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.1
    • /
    • pp.1-9
    • /
    • 2010
  • This paper suggests a mixed-effects model for analyzing split-plot data when there is a repeated measures factor that affects on the response variable. Covariance structures are discussed among the observations because of the assumption of a repeated measures factor as one of explanatory variables. As a plausible covariance structure, compound symmetric covariance structure is assumed for analyzing data. The restricted maximum likelihood (REML)method is used for estimating fixed effects in the model.

Optimal Criterion of Classification Accuracy Measures for Normal Mixture (정규혼합에서 분류정확도 측도들의 최적기준)

  • Yoo, Hyun-Sang;Hong, Chong-Sun
    • Communications for Statistical Applications and Methods
    • /
    • v.18 no.3
    • /
    • pp.343-355
    • /
    • 2011
  • For a data with the assumption of the mixture distribution, it is important to find an appropriate threshold and evaluate its performance. The relationship is found of well-known nine classification accuracy measures such as MVD, Youden's index, the closest-to-(0, 1) criterion, the amended closest-to-(0, 1) criterion, SSS, symmetry point, accuracy area, TA, TR. Then some conditions of these measures are categorized into seven groups. Under the normal mixture assumption, we calculate thresholds based on these measures and obtain the corresponding type I and II errors. We could explore that which classification measure has minimum type I and II errors for estimated mixture distribution to understand the strength and weakness of these classification measures.

Analysis of Spatial Correlation Structure Using Minutely Rainfall Data (분단위 강우자료를 이용한 공간상관구조 분석)

  • Park, Chang-Yeol;Kim, Kyoung-Jun;Hwang, Jung-Ho;Jun, Kyung-Soo;Yoo, Chul-Sang
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2008.05a
    • /
    • pp.790-794
    • /
    • 2008
  • 본 연구에서는 국내 분단위 강우자료(MMR)를 이용하여 시간해상도에 따른 강우의 공간상관구조 특성을 검토하였다. 이러한 특성을 파악하기 위해 이변량 혼합분포를 이용하여 강우를 모형화한 후 정규분포와 대수 정규분포를 고려하여 시간해상도별로 공간상관함수를 유도하고 그 변동특성을 파악하였다. 또한 분단위 강우 자료를 호우 발생 특성별(태풍, 장마, 대류성 강우)로 분류하여 이에 대한 공간상관함수를 각각 유도하였다. 이때 시간해상도를 고려하기 위한 대상 집성시간은 1, 2, 3, 5, 10, 30, 60분이고, 대상지점은 중부지역의 27개 우량관측소 지점을 이용하였다. 그 적용 결과 분단위 강우자료의 경우 무강우 자료의 영향이 상대적으로 매우 크게 나타나는 것을 확인할 수 있었다. 공간상관거리는 적용 분포형, 호우 발생 특성에 따라 차이가 있지만 1분의 경우 약 $9{\sim}15km$, 60분의 경우 약 $21{\sim}53km$인 것으로 파악되었다. 또한 강우의 집성시간이 길어질수록 공간상관특성이 상대적으로 뚜렷하게 나타나고 공간상관거리가 길어짐을 확인하였다. 본 연구의 결과는 분단위 강우자료의 관측소 밀도가 시단위 강우자료 관측소에 비해 상대적으로 매우 적음을 나타내며, 분단위 강우자료를 이용하여 지점빈도해석과 같은 공간적인 특성을 분석할 경우 적절한 개선방안이 제시되어야함을 의미하는 것이기도 하다.

  • PDF

On the Variations of Spatial Correlation Structure of Rainfall (강우공간상관구조의 변동 특성)

  • Kim, Kyoung-Jun;Yoo, Chul-Sang
    • Journal of Korea Water Resources Association
    • /
    • v.40 no.12
    • /
    • pp.943-956
    • /
    • 2007
  • Among various statistics, the spatial correlation function, that is "correlogram", is frequently used to evaluate or design the rain gauge network and to model the rainfall field. The spatial correlation structure of rainfall has the significant variation due to many factors. Thus, the variation of spatial correlation structure of rainfall causes serious problems when deciding the spatial correlation function of rainfall within the basin. In this study, the spatial rainfall structure was modeled using bivariate mixed distributions to derive monthly spatial correlograms, based on Gaussian and lognormal distributions. This study derived the correlograms using hourly data of 28 rain gauge stations in the Keum river basin. From the results, we concluded as following; (1) Among three cases (Case A, Case B, Case C) considered, the Case A(+,+) seems to be the most relevant as it is not distorted much by zero measurements. (2) The spatial correlograms based on the lognormal distribution, which is theoretically as well as practically adequate, is better than that based on the Gaussian distribution. (3) The spatial correlation in July exponentially decrease more obviously than those in other months. (4) The spatial correlograms should be derived considering the temporal resolution(hourly, daily, etc) of interest.

Demand analysis on new Mobile Telecommunication Terminal using Conjoint analysis and Mixed logit (컨조인트 분석과 혼합 로짓 모형을 이용한 차세대 무선 이동 통신 단말기의 수요 분석)

  • 김연배;이정동;고대영
    • Proceedings of the Korea Technology Innovation Society Conference
    • /
    • 2003.11a
    • /
    • pp.67-85
    • /
    • 2003
  • 본 논문에서는 최근 통신 산업에서 중요한 쟁점으로 떠오르고 있는 단말기 무선이동 통신 단말기의 발전 방향을 소비자 선호에 기반하여 살펴보았다. 소비자 선호 정보를 얻기 위하여 컨조인트(conjoint) 분석 방법이 사용되었다. 컨조인트 방법은 가상의 대안들에 대한 응답자의 진술 선호에 기반을 두기 때문에 미래의 무선 이동통신 단말기에 대해 분석하는데 적합한 방법이다. 컨조인트 방법을 위한 설문은 대한민국 서울에서 445 명의 성인남녀를 대상으로 행해졌다. 소비자의 이질적인 선호를 알기 위해 혼합 로짓(mixed legit) 모형을 사용하였다. 추정은 최근 새로운 시뮬레이션 기법으로 떠오르고 있는 베이지안(Bayesian) 방법을 이용하였다. 선호의 분포 가정으로 기존의 일관적인 정규 분포 가정과 달리 가격 계수를 위하여 로그 정규(lognormal) 분포, 하이퀄리티 인터넷 특성과 PC 프로그램 호환 가능 여부의 계수들에 대해서 잘린 정규(censored normal) 분포를 가정 하였다. 추정 결과 무선 이동 통신 단말기의 각 속성들에 대한 응답자들간 선호가 크게 차이 나는 것을 알 수 있었다. 화면 크기의 경우에는 대부분의 소비자들이 현재 일반적인 핸드폰보다는 큰 화면을 선호한다는 것과 휴대성을 상당히 고려한다는 것을 간접적으로 알 수 있었다. 또한, 소비자들이 무선 이동 통신 단말기가 휴대 인터넷과 PC 프로그램 호환이 가능한지 여부에는 대부분 무관심하다는 것을 알 수 있었다. 본 논문의 결과는 차세대 무선 이동 통신 단말기의 속성 조합 시 고려해야 할 점과 휴대 인터넷 서비스의 방향에 대해 시사점을 줄 수 있을 것이다.각 73.44±0.87%, 72.88±0.25%의 함량이였다. 운동사육시간이 길어질수록 운동사육구에서는 수분함량이 운동5일째에는 73.56±0.22%였으며, 운동 20일에는 75.88±0.94%로 초기수분함량보다는 3%정도 증가하였다. 반면, 비운동사육구에서는 큰 변화를 나타내고 있지 않았다(p<0.05). 운동과 비운동시킨 참돔의 지질 함량의 변화는 운동시킨 참돔은 운동으로 인한 에너지 소비로 인하여 함량이 유의적으로 감소했으며(r=-0.35), 비운동사육구에서는 절식으로 인하여 지질함량이 감소하였다(r=-0.38). 파괴강도와 가장 밀접한 영향을 가지는 콜라겐은 운동과 비운동 모두 사육기간동안 큰 변화는 보이지 않았다. 초기의 파괴강도값은 1.45±0.02kg(운동사육구), 1.36±0.18kg(비운동사육구)이였으며 사육기간동안 운동사육구는 파괴강도값이 증가한 반면, 비운동수조에서는 참돔의 파괴강도는 사육기간동안 큰 유의차가 없었다. 각 성분간의 상관도를 살펴보면, 수분함량과 파괴강도는 상관성을 가졌으며, 지질함량과 파괴강도도 같은 경향은 나타내었다. 운동기간동안의 파괴강도와 콜라겐 사이에는 상관성의 거의 없었다. 이는 운동기간에 따른 파괴강도의 증가가 콜라겐의 함량의 증가보다는 지질함량의 감소와 수분함량의 증가와 같은 성분과의 상관성이 크다고 판단된다. 다음으로는, 운동횟수에 의한 영향으로써 운동시간을 1일 6시간으로 설정하여, 운동횟수를 결정하기 위하여 오전, 오후에 각 3시간씩 운동시키는 방법과 오전부터 6시간동안 운동시키는 두 방법을 이용하여 품질을 비교하였다. 각 조건에 따라 운동시킨 참돔의 수분함량을 나타낸 것으로, 2회(오전

  • PDF