• 제목/요약/키워드: Overdispersion

검색결과 49건 처리시간 0.024초

모형 선택에서의 수정된 AIC 사용에 대하여 (Using the corrected Akaike's information criterion for model selection)

  • 송은정;원성호;이우주
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.119-133
    • /
    • 2017
  • 이미 corrected Akaike's information criterion(AICc)가 AIC에 비해 우수한 이론적 성질을 가진 것으로 알려져 있으나, 현재 실제 자료분석에서 최적의 예측 모형을 선택하기 위해 가장 널리 사용되는 정보기준은 여전히 Akaike's information criterion(AIC)이다. 이것은 AICc를 사용함으로써 실제 우리가 어떠한 종류의 이점을 얻을 수 있는가에 대해 논의하고 있는 연구가 부족해서이다. 우리는 이 논문에서 수치 연구를 통해 AIC와 AICc의 성능을 비교하고 AICc 의 사용이 가져오는 장점에 대해 확인을 할 것이다. 또한, 포아송 또는 이항 분포 자료 분석에서 과대산포(overdispersion) 현상이 나타난 경우 사용하는 quasi Akaike's information criterion(QAIC)와 corrected quasi Akaike's information criterion(QAICc) 성능에 대해서도 시뮬레이션을 통해 비교해보고자 한다.

Effects on Regression Estimates under Misspecified Generalized Linear Mixed Models for Counts Data

  • Jeong, Kwang Mo
    • 응용통계연구
    • /
    • 제25권6호
    • /
    • pp.1037-1047
    • /
    • 2012
  • The generalized linear mixed model(GLMM) is widely used in fitting categorical responses of clustered data. In the numerical approximation of likelihood function the normality is assumed for the random effects distribution; subsequently, the commercial statistical packages also routinely fit GLMM under this normality assumption. We may also encounter departures from the distributional assumption on the response variable. It would be interesting to investigate the impact on the estimates of parameters under misspecification of distributions; however, there has been limited researche on these topics. We study the sensitivity or robustness of the maximum likelihood estimators(MLEs) of GLMM for counts data when the true underlying distribution is normal, gamma, exponential, and a mixture of two normal distributions. We also consider the effects on the MLEs when we fit Poisson-normal GLMM whereas the outcomes are generated from the negative binomial distribution with overdispersion. Through a small scale Monte Carlo study we check the empirical coverage probabilities of parameters and biases of MLEs of GLMM.

Negative binomial loglinear mixed models with general random effects covariance matrix

  • Sung, Youkyung;Lee, Keunbaik
    • Communications for Statistical Applications and Methods
    • /
    • 제25권1호
    • /
    • pp.61-70
    • /
    • 2018
  • Modeling of the random effects covariance matrix in generalized linear mixed models (GLMMs) is an issue in analysis of longitudinal categorical data because the covariance matrix can be high-dimensional and its estimate must satisfy positive-definiteness. To satisfy these constraints, we consider the autoregressive and moving average Cholesky decomposition (ARMACD) to model the covariance matrix. The ARMACD creates a more flexible decomposition of the covariance matrix that provides generalized autoregressive parameters, generalized moving average parameters, and innovation variances. In this paper, we analyze longitudinal count data with overdispersion using GLMMs. We propose negative binomial loglinear mixed models to analyze longitudinal count data and we also present modeling of the random effects covariance matrix using the ARMACD. Epilepsy data are analyzed using our proposed model.

Estimating Parameters in Overdispersed Binary Data

  • Lee, Sunho
    • Communications for Statistical Applications and Methods
    • /
    • 제7권1호
    • /
    • pp.269-276
    • /
    • 2000
  • there are several methods available for estimating parameters in overdispersed binary response data with the litter effect. Simulations are performed to compare methods for estimating an overall mean and an overdispersion parameter using moments a maximum likelihood under a beta-binomial distribution a maximum quasi-likelihood and a maximum extended quasi-likelihood.

  • PDF

도시부 4지 신호교차로 유턴 사고모형 개발 (Development of the U-turn Accident Model at 4-Legged Signalized Intersections in Urban Areas)

  • 강종호;김경환;하만복;김성문
    • 한국도로학회논문집
    • /
    • 제16권2호
    • /
    • pp.119-129
    • /
    • 2014
  • PURPOSES : The purpose of this study is to develop the U-turn accident model at 4-legged signalized intersections in urban areas. METHODS : In order to analyze the characteristics of the accidents which are associated with U-turn operation at 4-legged signalized intersections in urban areas and develop an U-turn accident model by regression analysis, the tests of overdispersion and zero-inflation are conducted about the dependent variables of number of accidents and EPDO (Equivalent Property Damage Only). RESULTS : As their results, the Poisson model fits best for number of accident and the ZIP (Zero Inflated Poisson) fits best for EPOD, the variables of conflict traffic, width of opposing road, traffic passing speed are adopted as independent variable for both models. The variables of number of bus berths and rate of U-turn signal time at which the U-turn is permitted are adopted as independent variable only for EPDO. CONCLUSIONS : These study results suggest that U-turn would be permitted at the intersection where the width of opposing road is wider than 11.9 meters, the passing vehicle speed is not high and U-turn operation is not hindered by the buses stopping at bus stops.

딥러닝을 이용한 다변량, 비선형, 과분산 모델링의 개선: 자동차 연료소모량 예측 (Improvement of Multivariable, Nonlinear, and Overdispersion Modeling with Deep Learning: A Case Study on Prediction of Vehicle Fuel Consumption Rate)

  • 한대석;유인균;이수형
    • 한국도로학회논문집
    • /
    • 제19권4호
    • /
    • pp.1-7
    • /
    • 2017
  • PURPOSES : This study aims to improve complex modeling of multivariable, nonlinear, and overdispersion data with an artificial neural network that has been a problem in the civil and transport sectors. METHODS: Deep learning, which is a technique employing artificial neural networks, was applied for developing a large bus fuel consumption model as a case study. Estimation characteristics and accuracy were compared with the results of conventional multiple regression modeling. RESULTS : The deep learning model remarkably improved estimation accuracy of regression modeling, from R-sq. 18.76% to 72.22%. In addition, it was very flexible in reflecting large variance and complex relationships between dependent and independent variables. CONCLUSIONS : Deep learning could be a new alternative that solves general problems inherent in conventional statistical methods and it is highly promising in planning and optimizing issues in the civil and transport sectors. Extended applications to other fields, such as pavement management, structure safety, operation of intelligent transport systems, and traffic noise estimation are highly recommended.

시공간구조를 가지는 확률적 강우 모형 (Multi-Site Stochastic Weather Generator for Daily Rainfall in Korea)

  • 곽민정;김용구
    • 응용통계연구
    • /
    • 제27권3호
    • /
    • pp.475-485
    • /
    • 2014
  • 일반화 선형모형(GLM)에 기초한 확률적 날씨 발생기(Stochastic weather generator)는 일일 날씨를 생성하는데 가장 일반적으로 사용되는 방법인다. 본 논문에서는 다층구조를 이용하여 기존의 GLM weather generator에 공간구조를 소개하였다. 계절별 총강우량의 overdispersion 현상을 효과적으로 제거하기 위해서 smoothing된 계절별 총강우량을 모형에 포함하였고 공간구조를 소개하기 위해서 Stochastic weather generator의 모형계수에 공간구조를 가지는 다변량 정규분포를 가정하였다. 그리고 제안된 공간구조를 가지는 GLM weather generator 모형을 우리나라 76개 지역에서 39년간 측정된 일별 강우량 관측자료에 적용하였다.

사고유형에 따른 청주시 4지 신호교차로 교통사고모형 (Traffic Accident Models of Cheongju Four-Legged Signalized Intersections by Accident Type)

  • 박병호;한상욱;김태영;김원호
    • 대한교통학회지
    • /
    • 제26권5호
    • /
    • pp.153-162
    • /
    • 2008
  • 본 연구는 청주시 4지 신호교차로를 대상으로 한 교통사고를 다루고 있다. 연구의 목적은 143개 교차로 사고자료를 이용하여 사고유형별 특성을 비교분석하고 모형을 개발에 있다. 이를 위해 본 연구에서는 정면충돌, 후미추돌, 측면직각, 접촉, 차로변경접촉 등의 모형을 개발하는데 중점을 두고 있다. 분석된 주요결과를 요약하면 다음과 같다. 첫째 가산자료모형 설정을 위해 과산포 검정을 한 결과 음이항 회귀모형이 선정되었다. 둘째, 통계적으로 설명력이 높은 5개의 음이항 모형이 개발되었다. 셋째, 공통변수(ADT)와 특정변수를 활용하여 모형의 차이가 비교 분석되었다.

포아송으로부터 부의 이항분포로의 이탈에 대한 검정통계량의 확장 (On the Extension of Test Statistics for Detecting Negative Binomial Departures from the Poisson Assumption)

  • 이선호
    • Journal of the Korean Statistical Society
    • /
    • 제22권2호
    • /
    • pp.171-190
    • /
    • 1993
  • 포아송분포로부터 부의 이항분포로의 이탈을 검색하는 통계량들이 자료의 형태에 따라 여러가지 제시되었다. 그런데 대립가설인 부의 이항분포의 모수화 방법에 따라 분산과 평균의 구조가 변하고 국소 최적 검정 통계량도 달라진다는 것이 알려졌다. 본 논문에서는 대립가설을 일반적인 포아송 혼합분포로까지 확장시키고, 일반적인 형태의 분산과 평균의 구조에도 검정 가능한 새로운 통계량 L을 소개하고 있다. 또한 L 통계량은 포아송 분포로부터 부의 이항분포로의 이탈을 다루는 기존의 여러 통계량들의 일반화된 형태임을 보였다. 점근적 상대효율과 모의 실험을 통하여 L 통계량과 기존의 통계량들을 비교한 결과 분산과 평균사이의 구조에 상관없이 L 통계량이 우수한 것임을 입증하였다.

  • PDF

국내 회전교차로의 추돌사고 모형 개발 (Developing Rear-End Collision Models of Roundabouts in Korea)

  • 박병호;백태헌
    • 한국안전학회지
    • /
    • 제29권6호
    • /
    • pp.151-157
    • /
    • 2014
  • This study deals with the rear-end collision at roundabouts. The purpose of this study is to develop the accident models of rear-end collision in Korea. In pursuing the above, this study gives particular attention to developing the appropriate models using Poisson, negative binomial model, ZAM, multiple linear and nonlinear regression models, and statistical analysis tools. The main results are as follows. First, the Vuong statistics and overdispersion parameters indicate that ZIP is the most appropriate model among count data models. Second, RMSE, MPB, MAD and correlation coefficient tests show that the multiple nonlinear model is the most suitable to the rear-end collision data. Finally, such the independent variables as traffic volume, ratio of heavy vehicle, number of circulatory roadway lane, number of crosswalk and stop line are adopted in the optimal model.