• 제목/요약/키워드: overdispersion in Poisson models

검색결과 18건 처리시간 0.021초

Effects of Overdispersion on Testing for Serial Dependence in the Time Series of Counts Data

  • Kim, Hee-Young;Park, You-Sung
    • Communications for Statistical Applications and Methods
    • /
    • 제17권6호
    • /
    • pp.829-843
    • /
    • 2010
  • To test for the serial dependence in time series of counts data, Jung and Tremayne (2003) evaluated the size and power of several tests under the class of INARMA models based on binomial thinning operations for Poisson marginal distributions. The overdispersion phenomenon(i.e., a variance greater than the expectation) is common in the real world. Overdispersed count data can be modeled by using alternative thinning operations such as random coefficient thinning, iterated thinning, and quasi-binomial thinning. Such thinning operations can lead to time series models of counts with negative binomial or generalized Poisson marginal distributions. This paper examines whether the test statistics used by Jung and Tremayne (2003) on serial dependence in time series of counts data are affected by overdispersion.

가산자료(count data)의 과산포 검색: 일반화 과정 (Overdispersion in count data - a review)

  • 김병수;오경주;박철용
    • 응용통계연구
    • /
    • 제8권2호
    • /
    • pp.147-161
    • /
    • 1995
  • 생검실험에서는 다산을 통해 번식하는 쥐와 같은 설치류 동물들을 실험대상으로 하여 이항분포나 포아송분포 하에서 가산자료(count data)를 많이 생성한다. 다산을 통해 태어난 동물들을 독립적인 실험대상으로 간주하여 자료분석을 하면, 同腹仔 효과로 인해 기존의 평균과 분산사이의 관계를 벗어나는 과산포현상이 종종 나타난다. 이러한 현상을 무시했을 때 모수추정치에 대한 분산을 과소추정하고, 이로 인하여 가설검정에서 낮은 검정력을 갖게 된다. 이러한 문제점을 해결하기 위하여 최근 10년간 과산포현상을 검색하는 통계량들과 과산포를 반영하는 모형들이 제시되었는데, 이를 개관하고 이러한 절차들의 일반화 과정을 자료 유형별로 비교분석한다.

  • PDF

자연휴양지 방문편익 추정모형의 비교 연구 - 영산강 하구를 대상으로 (A Comparative Study on Estimation Models for the Value of Access to a Natural Recreation Site: Focusing on the Estuary Area of Yeongsan River)

  • 신영철
    • 자원ㆍ환경경제연구
    • /
    • 제21권4호
    • /
    • pp.981-998
    • /
    • 2012
  • 이 논문에서는 영산강 하구 방문객을 대상으로 하여 자연휴양지의 수요함수를 추정하여 방문 편익을 도출하기 위해 카운트 자료 모형(count data model)을 적용하였다. 여행지 방문객 자료의 속성을 고려할 때, 포와송 모형의 경우 평균과 분산이 동일하다는 제약적 가정에 의한 과도분산(overdispersion) 속성의 왜곡과 더불어 자료의 1에서 절단 속성을 고려하지 않는 경우의 왜곡이 문제가 된다. 실증 분석 결과에 따르면 방문객 자료의 속성은 반영하는 절단 음이항(truncated negative binomial) 모형이 고려한 모형 중에서 최적이고, 그 모형에 의해 도출된 영산강 하구 1회 방문 편익(즉, 소비자 잉여)는 전라권 거주자들의 경우 89,350원이며, 비전라권 거주자의 경우는 432,526원으로 전라권 거주자의 4.8배 수준이었다. 또한 과도분산의 속성을 반영하지 못하는 포와송 모형으로부터 추정된 영산강 하구의 방문 편익(소비자 잉여)은 과소평가되며, 절단의 속성을 고려하지 못하는 경우의 모형으로부터 추정된 영산강 하구의 방문 편익은 과대평가되는 경향도 확인할 수 있었다. 그러므로 단일 휴양지 방문객에 대한 자료로부터 여행수요 함수 및 방문 편익을 추정하기 위해서는 절단 음이항 회귀모형이 적용되어야 한다.

  • PDF

국내 회전교차로의 추돌사고 모형 개발 (Developing Rear-End Collision Models of Roundabouts in Korea)

  • 박병호;백태헌
    • 한국안전학회지
    • /
    • 제29권6호
    • /
    • pp.151-157
    • /
    • 2014
  • This study deals with the rear-end collision at roundabouts. The purpose of this study is to develop the accident models of rear-end collision in Korea. In pursuing the above, this study gives particular attention to developing the appropriate models using Poisson, negative binomial model, ZAM, multiple linear and nonlinear regression models, and statistical analysis tools. The main results are as follows. First, the Vuong statistics and overdispersion parameters indicate that ZIP is the most appropriate model among count data models. Second, RMSE, MPB, MAD and correlation coefficient tests show that the multiple nonlinear model is the most suitable to the rear-end collision data. Finally, such the independent variables as traffic volume, ratio of heavy vehicle, number of circulatory roadway lane, number of crosswalk and stop line are adopted in the optimal model.

포아송으로부터 부의 이항분포로의 이탈에 대한 검정통계량의 확장 (On the Extension of Test Statistics for Detecting Negative Binomial Departures from the Poisson Assumption)

  • 이선호
    • Journal of the Korean Statistical Society
    • /
    • 제22권2호
    • /
    • pp.171-190
    • /
    • 1993
  • 포아송분포로부터 부의 이항분포로의 이탈을 검색하는 통계량들이 자료의 형태에 따라 여러가지 제시되었다. 그런데 대립가설인 부의 이항분포의 모수화 방법에 따라 분산과 평균의 구조가 변하고 국소 최적 검정 통계량도 달라진다는 것이 알려졌다. 본 논문에서는 대립가설을 일반적인 포아송 혼합분포로까지 확장시키고, 일반적인 형태의 분산과 평균의 구조에도 검정 가능한 새로운 통계량 L을 소개하고 있다. 또한 L 통계량은 포아송 분포로부터 부의 이항분포로의 이탈을 다루는 기존의 여러 통계량들의 일반화된 형태임을 보였다. 점근적 상대효율과 모의 실험을 통하여 L 통계량과 기존의 통계량들을 비교한 결과 분산과 평균사이의 구조에 상관없이 L 통계량이 우수한 것임을 입증하였다.

  • PDF

유어낚시인구의 사회경제학적 특성과 출조빈도함수의 추정에 관한 연구 (A Study on the Socio-economic Characteristics of the Angler Population and the Estimation of A Fishing Frequency Function)

  • 박철형
    • 수산경영론집
    • /
    • 제36권1호
    • /
    • pp.81-101
    • /
    • 2005
  • This article is to estimate the fishing frequency function in Korean recreational fishery with respect to socio-economic characteristics of anglers. First, the study described the characteristics of the entire angler population on the view points of 9 socio-economic variables. And then, the study divided the total angler population into three groups of in-land, sea, and mixed angler populations in order to investigate the differences in their characteristics. The study could confirm the existence of differences in regions, size of regions, and educational levels between the in - land and the sea angler populations by testing heterogeneity in the frequency table. The fishing frequency function is estimated using Poisson regression model in order to accomodate the count data(non-negative discrete random variable) aspects of the fishing frequency. However, the model specification error is found due to overdispersion of data. The model exhibits the lack of goodness of fit. The negative binomial regression model is adopted to cure the overdispersion of the data as an alternative estimation methodology. Finally, the study can confirm overdispersion does not exist in the model any more and the goodness of fit improved significantly to the reasonable level. The results of estimation of fishing frequency population modeled by the negative binomial regression models are following. The three variables of region, sex, and education have effects on the decision making process of fishing frequency in the case of in-land recreation fishery. On the other hand, the three variables of sex, age, and marriage status do the same job in the case of sea angler population. Among the left-over variables, both income and use of Internet variables now affect on the process in mixed angler population. Finally, the results of whole angler population show that all of the previous variables are proven to be statistically significant due to the summation of data with all three sub-groups of angler population.

  • PDF

도시부 4지 신호교차로 유턴 사고모형 개발 (Development of the U-turn Accident Model at 4-Legged Signalized Intersections in Urban Areas)

  • 강종호;김경환;하만복;김성문
    • 한국도로학회논문집
    • /
    • 제16권2호
    • /
    • pp.119-129
    • /
    • 2014
  • PURPOSES : The purpose of this study is to develop the U-turn accident model at 4-legged signalized intersections in urban areas. METHODS : In order to analyze the characteristics of the accidents which are associated with U-turn operation at 4-legged signalized intersections in urban areas and develop an U-turn accident model by regression analysis, the tests of overdispersion and zero-inflation are conducted about the dependent variables of number of accidents and EPDO (Equivalent Property Damage Only). RESULTS : As their results, the Poisson model fits best for number of accident and the ZIP (Zero Inflated Poisson) fits best for EPOD, the variables of conflict traffic, width of opposing road, traffic passing speed are adopted as independent variable for both models. The variables of number of bus berths and rate of U-turn signal time at which the U-turn is permitted are adopted as independent variable only for EPDO. CONCLUSIONS : These study results suggest that U-turn would be permitted at the intersection where the width of opposing road is wider than 11.9 meters, the passing vehicle speed is not high and U-turn operation is not hindered by the buses stopping at bus stops.

여행비용모형 분석을 통한 유어(遊漁)활동의 경제적 가치 추정 -미국 멕시코만 Red Grouper 유어부문을 대상으로 - (A Study on the Evaluation of Economic Value of the Gulf of Mexico Recreational Red Grouper Fishery)

  • 김도훈
    • 수산경영론집
    • /
    • 제36권2호
    • /
    • pp.121-134
    • /
    • 2005
  • In order to evaluate the effectiveness of management measures and to provide policy suggestions for the allocation of total allowable catch between recreational and commercial sectors, the economic value of red grouper recreational fishery in the United States Gulf of Mexico was estimated using a Travel Cost Method(TCM), Due to the characteristic of count data, a Poisson model(PM) and a Negative binomial model(NBM) were used in the TCM. Results of models showed that the NBM was statistically more suitable than the PM since the overdispersion problem occurred in the PM. Results also indicated all signs of the estimated parameters were as expected and were significant, except for a Boat parameter in both models. Based on the results of NBM, the total economic value of the recreational red grouper fishery was estimated to be $\$698.6$ and the value per trip was $\$179.5$. In addition, the total changes in expected consumer surplus due to changes in catch rates was $ \$42.3$.

  • PDF

Effects on Regression Estimates under Misspecified Generalized Linear Mixed Models for Counts Data

  • Jeong, Kwang Mo
    • 응용통계연구
    • /
    • 제25권6호
    • /
    • pp.1037-1047
    • /
    • 2012
  • The generalized linear mixed model(GLMM) is widely used in fitting categorical responses of clustered data. In the numerical approximation of likelihood function the normality is assumed for the random effects distribution; subsequently, the commercial statistical packages also routinely fit GLMM under this normality assumption. We may also encounter departures from the distributional assumption on the response variable. It would be interesting to investigate the impact on the estimates of parameters under misspecification of distributions; however, there has been limited researche on these topics. We study the sensitivity or robustness of the maximum likelihood estimators(MLEs) of GLMM for counts data when the true underlying distribution is normal, gamma, exponential, and a mixture of two normal distributions. We also consider the effects on the MLEs when we fit Poisson-normal GLMM whereas the outcomes are generated from the negative binomial distribution with overdispersion. Through a small scale Monte Carlo study we check the empirical coverage probabilities of parameters and biases of MLEs of GLMM.

모형 선택에서의 수정된 AIC 사용에 대하여 (Using the corrected Akaike's information criterion for model selection)

  • 송은정;원성호;이우주
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.119-133
    • /
    • 2017
  • 이미 corrected Akaike's information criterion(AICc)가 AIC에 비해 우수한 이론적 성질을 가진 것으로 알려져 있으나, 현재 실제 자료분석에서 최적의 예측 모형을 선택하기 위해 가장 널리 사용되는 정보기준은 여전히 Akaike's information criterion(AIC)이다. 이것은 AICc를 사용함으로써 실제 우리가 어떠한 종류의 이점을 얻을 수 있는가에 대해 논의하고 있는 연구가 부족해서이다. 우리는 이 논문에서 수치 연구를 통해 AIC와 AICc의 성능을 비교하고 AICc 의 사용이 가져오는 장점에 대해 확인을 할 것이다. 또한, 포아송 또는 이항 분포 자료 분석에서 과대산포(overdispersion) 현상이 나타난 경우 사용하는 quasi Akaike's information criterion(QAIC)와 corrected quasi Akaike's information criterion(QAICc) 성능에 대해서도 시뮬레이션을 통해 비교해보고자 한다.