• 제목/요약/키워드: Poisson count data

검색결과 83건 처리시간 0.036초

Hierarchical Bayes Analysis of Longitudinal Poisson Count Data

  • 김달호;신임희;최인순
    • Journal of the Korean Data and Information Science Society
    • /
    • 제13권2호
    • /
    • pp.227-234
    • /
    • 2002
  • In this paper, we consider hierarchical Bayes generalized linear models for the analysis of longitudinal count data. Specifically we introduce the hierarchical Bayes random effects models. We discuss implementation of the Bayes procedures via Markov chain Monte Carlo (MCMC) integration techniques. The hierarchical Baye method is illustrated with a real dataset and is compared with other statistical methods.

  • PDF

조건부 포아송 및 음이항 분포를 이용한 영-과잉 INGARCH 자료 분석 (Zero-Inflated INGARCH Using Conditional Poisson and Negative Binomial: Data Application)

  • 윤재은;황선영
    • 응용통계연구
    • /
    • 제28권3호
    • /
    • pp.583-592
    • /
    • 2015
  • 영-과잉(zero-inflation) 현상은 최근 계수(count) 시계열 분석의 주요토픽으로 다루어지고 있다. 본 논문에서는 영-과잉 계수 시계열의 변동성을 연구하고 있다. 기존의 정수형 모형인 INGARCH(integer valued GRACH) 모형에 조건부 포아송 및 조건부 음이항 분포를 사용하여 변동성에 영-과잉 현상을 추가하였다. 모수 추정 방법으로 EM알고리즘을 사용하였으며 국내 콜레라 발생건수에 적용시켜 보았다.

스킨스쿠버 해양어촌관광의 경제적 가치 추정: 제주도를 대상으로 (Estimating the Economic Value of Skin Scuba Marine Tourism: Focused on Jeju Island)

  • 강석규
    • 수산경영론집
    • /
    • 제47권1호
    • /
    • pp.21-29
    • /
    • 2016
  • The purpose of this study is to estimate the economic value of skin scuba marine tourism activity in Jeju Island. The economic value is estimated as consumer surplus using count data models including the truncated Poisson model and the truncated negative binominal distribution model. This study collects the effective 369 questionnaires from skin scuba marine tourists through three times in Jeju Island. The truncated Poisson model was statistically more suitable and valid than other models. The truncated Poisson model was applied to estimate consumer surplus as economic value from skin scuba in Jeju Island. A consumer surplus value per trip was estimated as about 4,081,633 won. The annual economic value from skin scuba marine tourism activity was estimated as 8,428,571 won in Jeju Island. Consequently, skin scuba marine tourism activity has a very large economic value in Jeju Island.

Application of discrete Weibull regression model with multiple imputation

  • Yoo, Hanna
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.325-336
    • /
    • 2019
  • In this article we extend the discrete Weibull regression model in the presence of missing data. Discrete Weibull regression models can be adapted to various type of dispersion data however, it is not widely used. Recently Yoo (Journal of the Korean Data and Information Science Society, 30, 11-22, 2019) adapted the discrete Weibull regression model using single imputation. We extend their studies by using multiple imputation also with several various settings and compare the results. The purpose of this study is to address the merit of using multiple imputation in the presence of missing data in discrete count data. We analyzed the seventh Korean National Health and Nutrition Examination Survey (KNHANES VII), from 2016 to assess the factors influencing the variable, 1 month hospital stay, and we compared the results using discrete Weibull regression model with those of Poisson, negative Binomial and zero-inflated Poisson regression models, which are widely used in count data analyses. The results showed that the discrete Weibull regression model using multiple imputation provided the best fit. We also performed simulation studies to show the accuracy of the discrete Weibull regression using multiple imputation given both under- and over-dispersed distribution, as well as varying missing rates and sample size. Sensitivity analysis showed the influence of mis-specification and the robustness of the discrete Weibull model. Using imputation with discrete Weibull regression to analyze discrete data will increase explanatory power and is widely applicable to various types of dispersion data with a unified model.

제로팽창 모형을 이용한 보험데이터 분석 (A Zero-Inated Model for Insurance Data)

  • 최종후;고인미;전수영
    • 응용통계연구
    • /
    • 제24권3호
    • /
    • pp.485-494
    • /
    • 2011
  • 계수(Count) 데이터는 반응변수가 음이 아닌 계수로, 자동차 사고건수나 지진이 일어난 횟수, 보험처리 발생건수 등을 말한다. 이런 경우에는 주로 포아송 회귀모형을 사용하지만, 평균과 분산이 동일한 경우만 이용될 수 있다는 제약이 따른다. 실증적 자료에서는 그룹 간 이질성으로 인해 분산이 매우 큰 과대산포(Overdispersion) 현상을 볼 수 있는데, 이를 무시할 경우 회귀계수나 표준오차가 편의되는 현상이 발생한다. 보험은 보장성 개념이 강하기 때문에 실제로 보험처리가 발생하지 않는 경우가 많아, 보험처리 건수에 '0'값이 있을 수 있다. 본 논문에서는 '0'값이 많은 자료의 분석을 위해 제로팽창 모형(Zero-Inflated Model)을 고려하고, 여러 모형들의 효율성을 실증자료를 통하여 비교하였다. 실증 자료 분석 결과, 과대산포와 제로팽창 현상이 존재하는 자료에서 제로팽창 음이항 모형(Zero-Inflated Negative Binomial Regression Model)이 가장 효율적인 모형임을 보여 주었다.

영과잉 경시적 가산자료 분석을 위한 허들모형 (Hurdle Model for Longitudinal Zero-Inflated Count Data Analysis)

  • 진익태;이근백
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.923-932
    • /
    • 2014
  • 허들모형은 영이 과잉 가산자료를 분석하기 위해서 사용되어 왔다. 이 모형은 이산부분을 위한 로짓모형과 절삭된 가산부분을 위한 절삭된 포아송모형의 혼합모형이다. 이 논문에서 우리는 경시적 영과잉 가산자료를 분석하기 위해서 수정된 콜레스키 분해을 이용하여 일반적인 이분산성을 가지는 변량효과 공분산행렬을 제안한다. 수정된 콜레스키 분해는 변량효과 공분산행렬을 일반화자기상관 모수와 혁신분산모수로 분리되면, 이러한 모수들은 베이지안 일반화 선형모형을 통해 추정된다. 그리고 실제 자료분석을 통하여 설명한다.

ZIP 공정을 관리하는 GLR 관리도 (A GLR Chart for Monitoring a Zero-Inflated Poisson Process)

  • 최미림;이재헌
    • 응용통계연구
    • /
    • 제27권2호
    • /
    • pp.345-355
    • /
    • 2014
  • 단위 영역의 결점수는 일반적으로 Poisson 분포를 가정한다. 이 Poisson 분포의 확장된 형태로 ZIP(zero-inflated Poisson) 분포를 고려할 수 있는데, 이 모형은 데이터에 0이 많이 관측되는 경우 잘 적합된다고 알려져 있다. 이 논문에서는 ZIP 분포를 따르는 공정을 관리하는 GLR(generalized likelihood ratio) 관리도 절차를 제안하고 있다. 또한 제안된 GLR 관리도의 효율을 기존에 제안된 CUSUM 관리도들과 비교하였다. 그 결과 제안된 GLR 관리도는 모수의 다양한 변화에 대해 효율이 좋거나 또는 효율이 크게 떨어지지 않았고, 특히 CUSUM 관리도에서 모수가 미리 설정한 방향과 다르게 변화했을 때 효율이 크게 나빠지는 문제를 해결할 수 있는 대안이라는 결론을 얻을 수 있었다.

NHPP모형에 기초한 고장 수 자료의 분석 (Analysis of Failutr Count Data Based on NHPP Models)

  • 김성희;정향숙;김영순;박중양
    • 한국정보처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.395-400
    • /
    • 1997
  • 소프트웨어 신뢰도는 소프트웨어의 중요한 품질 특성 중의 하나이며, 소프트웨어 신뢰도 성장 모형은 테스트 단계동안 신뢰도를 평가하고 신뢰도가 성장하는 양상을 파악 할 수 있는 도구이다. 그러므로 테스트 단계동안 수집된 고장 자료는 적절한 소프트웨어 신뢰도 모형에 의거해 계속적으로 분석된다. 비등질 포아송 과정 모형이 적절한 소프트웨어 신뢰도 성장 모형인 경우 고장 수 자료를 분석하기 위해서 포아송 희귀 모형을 세우고 모수들은 가장 최소 자승법으로 추정하는 것이 가능하며, 이렇게 구한 가장 최소 자승 추정량은 최우 추정량과 동일한 성질을 가짐을 보일 수 있다. 이 분석 방법을 대형 시스템으로부터 수집된 실제 자료를 분석하는데 적용한다.

  • PDF

자연휴양지 방문편익 추정모형의 비교 연구 - 영산강 하구를 대상으로 (A Comparative Study on Estimation Models for the Value of Access to a Natural Recreation Site: Focusing on the Estuary Area of Yeongsan River)

  • 신영철
    • 자원ㆍ환경경제연구
    • /
    • 제21권4호
    • /
    • pp.981-998
    • /
    • 2012
  • 이 논문에서는 영산강 하구 방문객을 대상으로 하여 자연휴양지의 수요함수를 추정하여 방문 편익을 도출하기 위해 카운트 자료 모형(count data model)을 적용하였다. 여행지 방문객 자료의 속성을 고려할 때, 포와송 모형의 경우 평균과 분산이 동일하다는 제약적 가정에 의한 과도분산(overdispersion) 속성의 왜곡과 더불어 자료의 1에서 절단 속성을 고려하지 않는 경우의 왜곡이 문제가 된다. 실증 분석 결과에 따르면 방문객 자료의 속성은 반영하는 절단 음이항(truncated negative binomial) 모형이 고려한 모형 중에서 최적이고, 그 모형에 의해 도출된 영산강 하구 1회 방문 편익(즉, 소비자 잉여)는 전라권 거주자들의 경우 89,350원이며, 비전라권 거주자의 경우는 432,526원으로 전라권 거주자의 4.8배 수준이었다. 또한 과도분산의 속성을 반영하지 못하는 포와송 모형으로부터 추정된 영산강 하구의 방문 편익(소비자 잉여)은 과소평가되며, 절단의 속성을 고려하지 못하는 경우의 모형으로부터 추정된 영산강 하구의 방문 편익은 과대평가되는 경향도 확인할 수 있었다. 그러므로 단일 휴양지 방문객에 대한 자료로부터 여행수요 함수 및 방문 편익을 추정하기 위해서는 절단 음이항 회귀모형이 적용되어야 한다.

  • PDF

Poisson GLR 관리도 (Poisson GLR Control Charts)

  • 이재헌;박종태
    • 응용통계연구
    • /
    • 제27권5호
    • /
    • pp.787-796
    • /
    • 2014
  • Poisson 분포를 따르는 결점수를 관측하여 공정을 관리할 때 표본 크기를 동일하게 유지하기가 힘든 경우가 많다. 이 논문은 표본 크기가 동일하지 않은 경우 Poisson 공정모수의 변화를 탐지하는 GLR(generalized likelihood ratio) 관리도 절차를 제안하고 있다. 또한 제안된 GLR 관리도의 효율을 모의실험을 통하여 기존에 연구된 CUSUM 관리도들과 비교하였다. 모의실험 결과, 제안된 GLR 관리도는 공정모수의 다양한 변화에 대해 효율이 대체적으로 양호했으며, CUSUM 관리도에서 실제 공정모수의 변화값이 미리 지정한 값과 차이가 많이 날 경우 CUSUM 관리도에 비해 효율이 월등히 좋음을 알 수 있었다.