• 제목/요약/키워드: Overdispersion

검색결과 48건 처리시간 0.021초

Sensory Difference Testing: The Problem of Overdispersion and the Use of Beta Binomial Statistical Analysis

  • Lee, Hye-Seong;O'Mahony, Michael
    • Food Science and Biotechnology
    • /
    • 제15권4호
    • /
    • pp.494-498
    • /
    • 2006
  • An increase in variance (overdispersion) can occur when a binomial statistical analysis is applied to sensory difference test data in which replicate sensory evaluations (tastings) and multiple evaluators (judges) are combined to increase the sample size. Such a practice can cause extensive Type I errors, leading to serious misinterpretations of the data, especially when traditional simple binomial analysis is applied. Alternatively, the use of beta binomial analysis will circumvent the problem of overdispersion. This brief review discusses the uses and computation methodology of beta binomial analysis and in practice evidence for the occurrence of overdispersion.

가산자료(count data)의 과산포 검색: 일반화 과정 (Overdispersion in count data - a review)

  • 김병수;오경주;박철용
    • 응용통계연구
    • /
    • 제8권2호
    • /
    • pp.147-161
    • /
    • 1995
  • 생검실험에서는 다산을 통해 번식하는 쥐와 같은 설치류 동물들을 실험대상으로 하여 이항분포나 포아송분포 하에서 가산자료(count data)를 많이 생성한다. 다산을 통해 태어난 동물들을 독립적인 실험대상으로 간주하여 자료분석을 하면, 同腹仔 효과로 인해 기존의 평균과 분산사이의 관계를 벗어나는 과산포현상이 종종 나타난다. 이러한 현상을 무시했을 때 모수추정치에 대한 분산을 과소추정하고, 이로 인하여 가설검정에서 낮은 검정력을 갖게 된다. 이러한 문제점을 해결하기 위하여 최근 10년간 과산포현상을 검색하는 통계량들과 과산포를 반영하는 모형들이 제시되었는데, 이를 개관하고 이러한 절차들의 일반화 과정을 자료 유형별로 비교분석한다.

  • PDF

Score Tests for Overdispersion

  • Kim, Choong-Rak;Jeong, Mee-Seon;Yang, Mee-Yeong
    • Journal of the Korean Statistical Society
    • /
    • 제23권1호
    • /
    • pp.207-216
    • /
    • 1994
  • Count data are often overdispersed, and an appropriate test for the existence of the overdispersion is necessary. In this paper we derive a score test based on the extended quasi-likelihood and the pseudolikelihood after adjusting to the Bartlett factor. Also, we compare it with Levene (1960)'s F-type test suggested by Ganio and Schafer (1992).

  • PDF

Modelling Count Responses with Overdispersion

  • Jeong, Kwang Mo
    • Communications for Statistical Applications and Methods
    • /
    • 제19권6호
    • /
    • pp.761-770
    • /
    • 2012
  • We frequently encounter outcomes of count that have extra variation. This paper considers several alternative models for overdispersed count responses such as a quasi-Poisson model, zero-inflated Poisson model and a negative binomial model with a special focus on a generalized linear mixed model. We also explain various goodness-of-fit criteria by discussing their appropriateness of applicability and cautions on misuses according to the patterns of response categories. The overdispersion models for counts data have been explained through two examples with different response patterns.

Effects of Overdispersion on Testing for Serial Dependence in the Time Series of Counts Data

  • Kim, Hee-Young;Park, You-Sung
    • Communications for Statistical Applications and Methods
    • /
    • 제17권6호
    • /
    • pp.829-843
    • /
    • 2010
  • To test for the serial dependence in time series of counts data, Jung and Tremayne (2003) evaluated the size and power of several tests under the class of INARMA models based on binomial thinning operations for Poisson marginal distributions. The overdispersion phenomenon(i.e., a variance greater than the expectation) is common in the real world. Overdispersed count data can be modeled by using alternative thinning operations such as random coefficient thinning, iterated thinning, and quasi-binomial thinning. Such thinning operations can lead to time series models of counts with negative binomial or generalized Poisson marginal distributions. This paper examines whether the test statistics used by Jung and Tremayne (2003) on serial dependence in time series of counts data are affected by overdispersion.

베타-이항모형을 이용한 과산포 공정용 p 관리도의 개발 (Development of a p Control Chart for Overdispersed Process with Beta-Binomial Model)

  • 배봉수;서순근
    • 품질경영학회지
    • /
    • 제45권2호
    • /
    • pp.209-225
    • /
    • 2017
  • Purpose: Since traditional p chart is unable to deal with the variation of attribute data, this paper proposes a new attribute control chart for nonconforming proportions incorporating overdispersion with a beta-binomial model. Methods: Statistical theories for control chart developed under the beta-binomial model and a new approach using this control chart are presented Results: False alarm probabilities of p chart with the beta-binomial model are evaluated and demerits of p chart under overdispersion are discussed from three examples. Hence a concrete procedure for the proposed control chart is provided and illustrated with examples Conclusion: The proposed chart is more useful than traditional p chart, individual chart to treat observed proportions nonconforming as variable data and Laney p' chart.

자연휴양지 방문편익 추정모형의 비교 연구 - 영산강 하구를 대상으로 (A Comparative Study on Estimation Models for the Value of Access to a Natural Recreation Site: Focusing on the Estuary Area of Yeongsan River)

  • 신영철
    • 자원ㆍ환경경제연구
    • /
    • 제21권4호
    • /
    • pp.981-998
    • /
    • 2012
  • 이 논문에서는 영산강 하구 방문객을 대상으로 하여 자연휴양지의 수요함수를 추정하여 방문 편익을 도출하기 위해 카운트 자료 모형(count data model)을 적용하였다. 여행지 방문객 자료의 속성을 고려할 때, 포와송 모형의 경우 평균과 분산이 동일하다는 제약적 가정에 의한 과도분산(overdispersion) 속성의 왜곡과 더불어 자료의 1에서 절단 속성을 고려하지 않는 경우의 왜곡이 문제가 된다. 실증 분석 결과에 따르면 방문객 자료의 속성은 반영하는 절단 음이항(truncated negative binomial) 모형이 고려한 모형 중에서 최적이고, 그 모형에 의해 도출된 영산강 하구 1회 방문 편익(즉, 소비자 잉여)는 전라권 거주자들의 경우 89,350원이며, 비전라권 거주자의 경우는 432,526원으로 전라권 거주자의 4.8배 수준이었다. 또한 과도분산의 속성을 반영하지 못하는 포와송 모형으로부터 추정된 영산강 하구의 방문 편익(소비자 잉여)은 과소평가되며, 절단의 속성을 고려하지 못하는 경우의 모형으로부터 추정된 영산강 하구의 방문 편익은 과대평가되는 경향도 확인할 수 있었다. 그러므로 단일 휴양지 방문객에 대한 자료로부터 여행수요 함수 및 방문 편익을 추정하기 위해서는 절단 음이항 회귀모형이 적용되어야 한다.

  • PDF

제로팽창 모형을 이용한 보험데이터 분석 (A Zero-Inated Model for Insurance Data)

  • 최종후;고인미;전수영
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.485-494
    • /
    • 2011
  • 계수(Count) 데이터는 반응변수가 음이 아닌 계수로, 자동차 사고건수나 지진이 일어난 횟수, 보험처리 발생건수 등을 말한다. 이런 경우에는 주로 포아송 회귀모형을 사용하지만, 평균과 분산이 동일한 경우만 이용될 수 있다는 제약이 따른다. 실증적 자료에서는 그룹 간 이질성으로 인해 분산이 매우 큰 과대산포(Overdispersion) 현상을 볼 수 있는데, 이를 무시할 경우 회귀계수나 표준오차가 편의되는 현상이 발생한다. 보험은 보장성 개념이 강하기 때문에 실제로 보험처리가 발생하지 않는 경우가 많아, 보험처리 건수에 '0'값이 있을 수 있다. 본 논문에서는 '0'값이 많은 자료의 분석을 위해 제로팽창 모형(Zero-Inflated Model)을 고려하고, 여러 모형들의 효율성을 실증자료를 통하여 비교하였다. 실증 자료 분석 결과, 과대산포와 제로팽창 현상이 존재하는 자료에서 제로팽창 음이항 모형(Zero-Inflated Negative Binomial Regression Model)이 가장 효율적인 모형임을 보여 주었다.

유어낚시인구의 사회경제학적 특성과 출조빈도함수의 추정에 관한 연구 (A Study on the Socio-economic Characteristics of the Angler Population and the Estimation of A Fishing Frequency Function)

  • 박철형
    • 수산경영론집
    • /
    • 제36권1호
    • /
    • pp.81-101
    • /
    • 2005
  • This article is to estimate the fishing frequency function in Korean recreational fishery with respect to socio-economic characteristics of anglers. First, the study described the characteristics of the entire angler population on the view points of 9 socio-economic variables. And then, the study divided the total angler population into three groups of in-land, sea, and mixed angler populations in order to investigate the differences in their characteristics. The study could confirm the existence of differences in regions, size of regions, and educational levels between the in - land and the sea angler populations by testing heterogeneity in the frequency table. The fishing frequency function is estimated using Poisson regression model in order to accomodate the count data(non-negative discrete random variable) aspects of the fishing frequency. However, the model specification error is found due to overdispersion of data. The model exhibits the lack of goodness of fit. The negative binomial regression model is adopted to cure the overdispersion of the data as an alternative estimation methodology. Finally, the study can confirm overdispersion does not exist in the model any more and the goodness of fit improved significantly to the reasonable level. The results of estimation of fishing frequency population modeled by the negative binomial regression models are following. The three variables of region, sex, and education have effects on the decision making process of fishing frequency in the case of in-land recreation fishery. On the other hand, the three variables of sex, age, and marriage status do the same job in the case of sea angler population. Among the left-over variables, both income and use of Internet variables now affect on the process in mixed angler population. Finally, the results of whole angler population show that all of the previous variables are proven to be statistically significant due to the summation of data with all three sub-groups of angler population.

  • PDF

이변량 음이항 모형에서 붓스트랩 방법을 이용한 과대산포에 대한 검정 (Testing for Overdispersion in a Bivariate Negative Binomial Distribution Using Bootstrap Method)

  • 전명식;정병철
    • 응용통계연구
    • /
    • 제21권2호
    • /
    • pp.341-353
    • /
    • 2008
  • 본 연구에서는 이변량 음이항 분포에서 과대산포와 "내재적 상"의 존재유무에 대한 가설검정 문제를 다루었다. 과대산포에 대한 스코어 검정의 표준정규분포 근사는 명목 유의수준을 과소추정한 반면 "내재적 상"에 대한 스코어 검정은 명목유의수준을 과대 추정하고 있음을 보였다. 본 연구에서는 이와 같은 스코어 검정의 표준정규분포 근사의 문제점을 해결하기 위하여 붓스트랩 방법을 제안하였다. 스코어 검정에 대한 붓스트랩 방법은 두 검정에서 명목유의수준을 제대로 유지하고 검정력도 높게 나타나 스코어 검정의 표준정규분포 근사에 존재하는 문제를 해결하는 효율적인 대안으로 판단된다.