• 제목/요약/키워드: Zero-Inflated Negative Binomial Model

검색결과 37건 처리시간 0.021초

원인균별 식중독 발생 건수 예측 (Prediction of the Number of Food Poisoning Occurrences by Microbes)

  • 여인권
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.923-932
    • /
    • 2013
  • 이 논문에서는 우리나라에서 발생하는 원인균별 식중독 발생건수를 예측하는 방법을 제안한다. 우리나라에서 보고되는 주별 식중독 발생 건수를 원인균로 나누면 자료에 많은 0의 관측값이 포함되어 있으며 식중독 발생 간에 종속성을 가진다. 이 현상을 모형화하기 위해 이 논문에서는 전체 식중독 건수를 자기회귀모형으로 예측하고 원인균별 식중독 발생 확률을 다범주 로짓모형으로 추정한다. 예측된 식중독 건수와 추정된 원인균별 식중독 발생 확률을 곱하여 원인균별 식중독 발생건수를 예측한다. 제안된 방법의 타당성을 확인하기 위해 평균제곱오차와 평균절대편차를 이용하여 제안 방법과 영과잉모형을 비교해 본다.

K-리그에서 축구 골의 분포 (Soccer goal distributions in K-league)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1231-1239
    • /
    • 2014
  • 본 연구에서는 1983년부터 2012년까지의 한국프로축구 K-리그 전 경기 결과를 이용하여 홈 경기와 원정 경기에서의 골의 분포를 분석하였다. 고려된 확률분포는 포아송분포, 음이항분포, 극단치분포 및 영과잉 포아송분포이며, 카이제곱분포를 이용한 적합도검정을 수행하였다. 그 결과 홈경기는 포아송분포, 원정경기는 영과잉 포아송분포가 골의 분포를 위한 최적 적합분포로 간주되며 홈경기와 원정경기 골의 수는 서로 약한 정도의 상관관계가 있는 것으로 나타났다.

경유지를 고려한 서울시 공공자전거 통행발생량 추정 모형 개발 (Estimating Travel Frequency of Public Bikes in Seoul Considering Intermediate Stops)

  • 박종한;고준호
    • 한국ITS학회 논문지
    • /
    • 제22권3호
    • /
    • pp.1-19
    • /
    • 2023
  • 최근 탄소중립의 대안으로 떠오르고 있는 자전거의 통행행태를 파악하기 위하여 경유지를 고려한 통행발생량을 추정하고자 하였다. 서울시 공공자전거인 '따릉이'의 GPS 주행궤적 데이터를 이용하여 통행에서의 중간 경유지인 체류 지점을 파악하고, 인구, 토지이용, 물리적인 특성을 반영한 통행발생량 모형을 분석하였다. 맵매칭과 체류 지점 탐지 알고리즘을 이용하여 체류 지점을 추정한 결과, 전체 통행의 약 12.1%에서 체류 지점이 나타났다. 체류가 발생한 통행은 비체류에 비해 평균 이용거리와 이용시간이 더 길며, 체류 지점이 집중되는 시간대는 오전 첨두시와 오후 첨두시 사이의 비첨두시인 것으로 나타났다. 시각화 분석에 따르면 공원 및 레저 시설, 업무시설에서 주로 체류 지점이 나타났다. 체류 지점을 고려하기 위하여 기존의 대여소 기반이 아닌 육각격자를 분석단위로 설정하였으며, 영과잉 음이항(Zero-Inflated Negative Binomial, ZINB) 모형을 이용하여 체류 지점을 고려한 통행발생량을 추정하였다. 분석결과, 자전거전용도로 및 자전거·보행자겸용도로(분리형)와 같이 자전거 이용자의 안전이 확보된 자전거 인프라에서 통행발생량 및 체류 지점에서 발생한 통행이 많은 것으로 나타났다. 또한 공공자전거는 대중교통의 접근수단으로서 퍼스트&라스트 마일 수단의 역할을 하며, 생활중심지와 고용중심지에서 통행발생량이 커지는 것으로 나타났다. 이러한 분석 결과를 토대로 자전거 인프라의 추가 확충 계획 시 이용자의 안전시설 및 공간 확보가 우선돼야 하며, 대중교통과 연계한 자전거 인프라 시설 보급방안의 수립이 필요한 것으로 보인다.

발명자 네트워크의 공간적 결정요인 분석 (An Analysis of Spatial Determinants of Inventor Networks in Korea)

  • 정준호
    • 한국경제지리학회지
    • /
    • 제19권1호
    • /
    • pp.1-17
    • /
    • 2016
  • 본 논문은 내국인 특허출원 자료에서 복수 발명자들의 주소지들을 파악하고 가산자료의 특성을 통제할 수 있는 영과잉 음이항 회귀모형을 사용하여 230개 시군구 간 발명자 네트워크의 공간구조와 그것의 결정요인을 분석한다. 발명자 네트워크의 공간적 연계에 영향을 미치는 몇 가지 요인들이 확인된다. 이출지역이 민간 R&D, 고등교육수준, 인구규모, 특허 생산성 등과 같은 R&D 관련 지역 특수적 자산들을 많이 보유하면 동태적인 수요효과를 통해 공간적 연계는 다른 지역으로 확대된다. 그리고 물리적 거리뿐만 아니라 기술적 거리에서도 거리조락현상이 나타난다. 이입지역이 R&D 관련 지역 특수적 자산을 많이 보유하면 유사한 논리로 공간적 연계에서 정(+)의 효과가 발생한다.

  • PDF

Modeling clustered count data with discrete weibull regression model

  • Yoo, Hanna
    • Communications for Statistical Applications and Methods
    • /
    • 제29권4호
    • /
    • pp.413-420
    • /
    • 2022
  • In this study we adapt discrete weibull regression model for clustered count data. Discrete weibull regression model has an attractive feature that it can handle both under and over dispersion data. We analyzed the eighth Korean National Health and Nutrition Examination Survey (KNHANES VIII) from 2019 to assess the factors influencing the 1 month outpatient stay in 17 different regions. We compared the results using clustered discrete Weibull regression model with those of Poisson, negative binomial, generalized Poisson and Conway-maxwell Poisson regression models, which are widely used in count data analyses. The results show that the clustered discrete Weibull regression model using random intercept model gives the best fit. Simulation study is also held to investigate the performance of the clustered discrete weibull model under various dispersion setting and zero inflated probabilities. In this paper it is shown that using a random effect with discrete Weibull regression can flexibly model count data with various dispersion without the risk of making wrong assumptions about the data dispersion.

Threshold-asymmetric volatility models for integer-valued time series

  • Kim, Deok Ryun;Yoon, Jae Eun;Hwang, Sun Young
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.295-304
    • /
    • 2019
  • This article deals with threshold-asymmetric volatility models for over-dispersed and zero-inflated time series of count data. We introduce various threshold integer-valued autoregressive conditional heteroscedasticity (ARCH) models as incorporating over-dispersion and zero-inflation via conditional Poisson and negative binomial distributions. EM-algorithm is used to estimate parameters. The cholera data from Kolkata in India from 2006 to 2011 is analyzed as a real application. In order to construct the threshold-variable, both local constant mean which is time-varying and grand mean are adopted. It is noted via a data application that threshold model as an asymmetric version is useful in modelling count time series volatility.

교대근무 간호사의 혈액과 체액 노출 사고 예측 요인과 감염예방행위의 매개효과: 영과잉 가산 자료 분석방법을 적용하여 (Predictors of Blood and Body Fluid Exposure and Mediating Effects of Infection Prevention Behavior in Shift-Working Nurses: Application of Analysis Method for Zero-Inflated Count Data)

  • 류재금;최스미
    • 대한간호학회지
    • /
    • 제50권5호
    • /
    • pp.658-670
    • /
    • 2020
  • Purpose: This study aimed to identify the predictors of blood and body fluid exposure (BBFE) in multifaceted individual (sleep disturbance and fatigue), occupational (occupational stress), and organizational (hospital safety climate) factors, as well as infection prevention behavior. We also aimed to test the mediating effect of infection prevention behavior in relation to multifaceted factors and the frequency of BBFE. Methods: This study was based on a secondary data analysis, using data of 246 nurses from the Shift Work Nurses' Health and Turnover study. Based on the characteristics of zero-inflated and over-dispersed count data of frequencies of BBFE, the data were analyzed to calculate zero-inflated negative binomial regression within a generalized linear model and to test the mediating effect using SPSS 25.0, Stata 14.1, and PROCESS macro. Results: We found that the frequency of BBFE increased in subjects with disturbed sleep (IRR = 1.87, p = .049), and the probability of non-BBFE increased in subjects showing higher infection prevention behavior (IRR = 15.05, p = .006) and a hospital safety climate (IRR = 28.46, p = .018). We also found that infection prevention behavior had mediating effects on the occupational stress-BBFE and hospital safety climate-BBFE relationships. Conclusion: Sleep disturbance is an important risk factor related to frequency of BBFE, whereas preventive factors are infection prevention behavior and hospital safety climate. We suggest individual and systemic efforts to improve sleep, occupational stress, and hospital safety climate to prevent BBFE occurrence.

ZAM을 이용한 국내 회전교차로 오토바이 사고모형 (Motorcycle Accident Model at Roundabout in Korea using ZAM)

  • 박병호;임진강;나희
    • 한국안전학회지
    • /
    • 제29권3호
    • /
    • pp.107-113
    • /
    • 2014
  • The goal of this study is to develop the accident models of motorcycle at roundabouts. In the pursuing the above, this study gives particular attentions to developing the appropriate models using ZAM. The main results are as follows. First, the evaluation of various developed models by the Vuong statistic and over-dispersion parameter shows that ZINB is analyzed to be optimal among Poisson, NB, ZIP(zero-inflated Poisson) and ZINB regression models. Second, the traffic volume, width of central island and width of approach are evaluated to be important variables to the accidents. Finally, the common variables that affect to the accident are selected to be traffic volume and width of approach. This study might be expected to give some implications to the accident research on the roundabout by motorcycle.

고령운전자 운전 및 신체특성을 반영한 교통사고 분석 연구 (Analysis of Elderly Drivers' Accident Models Considering Operations and Physical Characteristics)

  • 임삼진;박준태;김영일;김태호
    • 대한교통학회지
    • /
    • 제30권6호
    • /
    • pp.37-46
    • /
    • 2012
  • 65세 이상 고령운전자의 경우 지난 10년 새 교통사고건수는 3만 7,000건에서 27만 4,000건으로 무려 640.5% 증가되었다. 이는 전체사고에서 차지하는 비율이 1.2%에서 3.1배 증가한 3.7%를 차지하고 있는 것으로 교통안전 관련기관에서는 여러 대책을 강구하고 있다. 무엇보다 고령운전자의 행동특성 및 신체특성에 대한 심층연구를 통해 안전대책과 연계하는 방안이 중요하다 할 수 있다. 본 연구에서는 고령운전자의 행동특성을 측정할 수 있는 운전자 적성검사(Driving Aptitude) 항목과 교통사고 자료를 토대로 고령운전자 운전특성과 사고특성을 연결한 실증연구를 수행하였다. 영향모형 개발을 위해 활용한 방법론은 영과잉 회귀모형을 적용하였고, ZIP 회귀모형과 ZINB 회귀모형에 대하여 베이지안 추론을 이용한 사고예측 모형을 선택하였다. AAE분석결과 ZIP 회귀모형이 적합하며, 3가지 변수속도예측, 주의전환, 인지능력이 고령자사고와 영향관계에 있음을 확인할 수 있었다.

Application of discrete Weibull regression model with multiple imputation

  • Yoo, Hanna
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.325-336
    • /
    • 2019
  • In this article we extend the discrete Weibull regression model in the presence of missing data. Discrete Weibull regression models can be adapted to various type of dispersion data however, it is not widely used. Recently Yoo (Journal of the Korean Data and Information Science Society, 30, 11-22, 2019) adapted the discrete Weibull regression model using single imputation. We extend their studies by using multiple imputation also with several various settings and compare the results. The purpose of this study is to address the merit of using multiple imputation in the presence of missing data in discrete count data. We analyzed the seventh Korean National Health and Nutrition Examination Survey (KNHANES VII), from 2016 to assess the factors influencing the variable, 1 month hospital stay, and we compared the results using discrete Weibull regression model with those of Poisson, negative Binomial and zero-inflated Poisson regression models, which are widely used in count data analyses. The results showed that the discrete Weibull regression model using multiple imputation provided the best fit. We also performed simulation studies to show the accuracy of the discrete Weibull regression using multiple imputation given both under- and over-dispersed distribution, as well as varying missing rates and sample size. Sensitivity analysis showed the influence of mis-specification and the robustness of the discrete Weibull model. Using imputation with discrete Weibull regression to analyze discrete data will increase explanatory power and is widely applicable to various types of dispersion data with a unified model.