• 제목/요약/키워드: Zero-Inflated Negative Binomial

검색결과 46건 처리시간 0.031초

식중독 발생 건수에 대한 계층 시계열 예측 (Forecasting hierarchical time series for foodborne disease outbreaks)

  • 여인권
    • 응용통계연구
    • /
    • 제37권4호
    • /
    • pp.499 -508
    • /
    • 2024
  • 이 연구에서는 식중독 발생건수를 원인물질별로 나눈 자료와 합한 자료를 별개로 분석하여 예측값을 유도한 후 계층구조를 만족하도록 하는 계층 시계열 예측에 대해 알아본다. 원인물질별 식중독 방생건수는 영과잉 포아송 회귀모형과 음이항 회귀모형으로 분석하고 합한 식중독 발생건수 포아송 회귀모형과 음이항 회귀모형으로 분석한다. 계층 시계열 예측을 위해 최적결합 중 하나인 Wickramasuriya 등 (2019)의 MinT 추정이 사용되었다. 계층조정 과정에서 발생한 음의 예측값은 0으로 수정하고 나머지 최하위 변수에 가중치를 곱해 계층구조를 만족시킨다. 실증분석 결과를 보면 원인물질별 예측에서는 계층조정을 한 결과와 하지 않은 결과에 차이가 거의 없었으나 주요, 기타 및 전체에 대한 예측에서는 계층조정 한 결과가 대체로 우수한 것으로 나타났다. 중요한 것은 계층조정을 하지 않으면 최하위 변수의 예측빈도가 주요나 기타의 예측빈도 보다 큰 경우도 발생하지만 제안된 방법을 적용하면 계층구조를 이루는 예측값을 얻을 수 있다.

K-리그에서 축구 골의 분포 (Soccer goal distributions in K-league)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1231-1239
    • /
    • 2014
  • 본 연구에서는 1983년부터 2012년까지의 한국프로축구 K-리그 전 경기 결과를 이용하여 홈 경기와 원정 경기에서의 골의 분포를 분석하였다. 고려된 확률분포는 포아송분포, 음이항분포, 극단치분포 및 영과잉 포아송분포이며, 카이제곱분포를 이용한 적합도검정을 수행하였다. 그 결과 홈경기는 포아송분포, 원정경기는 영과잉 포아송분포가 골의 분포를 위한 최적 적합분포로 간주되며 홈경기와 원정경기 골의 수는 서로 약한 정도의 상관관계가 있는 것으로 나타났다.

영-과잉 회귀모형을 활용한 폭염자료분석 (Heat-Wave Data Analysis based on the Zero-Inflated Regression Models)

  • 김성태;박만식
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2829-2840
    • /
    • 2018
  • 음이 아닌(non-negative) 측정값을 가지는 확률변수에 있어서, 영(0)이 과도하게 측정되는 자료를 반연속형(semi-continuous) 자료와 영-과잉(zero-inflated) 자료로 구분한다. 이러한 자료에서는 특정 확률 분포(probability distribution) 하에서의 확률보다 훨씬 큰 확률로 0을 관측하게 되는데, 연속형(continuous) 확률분포를 고려하는 경우에는 반연속형으로, 이산형(discrete) 확률분포를 고려하는 경우에는 영-과잉이라고 한다. 본 연구에서는 경계값(0)의 측정 여부에 관한 모형과 0보다 큰 확률변수에 대한 확률분포를 활용한 모형 등 두 개의 부문으로 이루어진 모형, 즉 2-부문 모형(two-part model)을 소개하고자 한다. 특히, 이산형 확률분포 중 포아송 분포와 음이항 분포를 고려한 영-과잉 회귀모형(regression model)을 설명하고 그 특성을 파악하고자 한다. 실증연구에서는 이러한 영-과잉 회귀모형을 활용하여 지난 10년(2009년부터 2018년) 간 한국의 여름철(6-8월) 폭염주의보(heat-wave advisory) 및 폭염경보(heat-wave warning) 발생일수를 적합하였다. 또한 공간예측기법 중 하나인 범용크리깅(universal kriging)을 이용하여 적합결과를 바탕으로 한 폭염 발생일수에 대한 예측지도를 작성하였다.

경유지를 고려한 서울시 공공자전거 통행발생량 추정 모형 개발 (Estimating Travel Frequency of Public Bikes in Seoul Considering Intermediate Stops)

  • 박종한;고준호
    • 한국ITS학회 논문지
    • /
    • 제22권3호
    • /
    • pp.1-19
    • /
    • 2023
  • 최근 탄소중립의 대안으로 떠오르고 있는 자전거의 통행행태를 파악하기 위하여 경유지를 고려한 통행발생량을 추정하고자 하였다. 서울시 공공자전거인 '따릉이'의 GPS 주행궤적 데이터를 이용하여 통행에서의 중간 경유지인 체류 지점을 파악하고, 인구, 토지이용, 물리적인 특성을 반영한 통행발생량 모형을 분석하였다. 맵매칭과 체류 지점 탐지 알고리즘을 이용하여 체류 지점을 추정한 결과, 전체 통행의 약 12.1%에서 체류 지점이 나타났다. 체류가 발생한 통행은 비체류에 비해 평균 이용거리와 이용시간이 더 길며, 체류 지점이 집중되는 시간대는 오전 첨두시와 오후 첨두시 사이의 비첨두시인 것으로 나타났다. 시각화 분석에 따르면 공원 및 레저 시설, 업무시설에서 주로 체류 지점이 나타났다. 체류 지점을 고려하기 위하여 기존의 대여소 기반이 아닌 육각격자를 분석단위로 설정하였으며, 영과잉 음이항(Zero-Inflated Negative Binomial, ZINB) 모형을 이용하여 체류 지점을 고려한 통행발생량을 추정하였다. 분석결과, 자전거전용도로 및 자전거·보행자겸용도로(분리형)와 같이 자전거 이용자의 안전이 확보된 자전거 인프라에서 통행발생량 및 체류 지점에서 발생한 통행이 많은 것으로 나타났다. 또한 공공자전거는 대중교통의 접근수단으로서 퍼스트&라스트 마일 수단의 역할을 하며, 생활중심지와 고용중심지에서 통행발생량이 커지는 것으로 나타났다. 이러한 분석 결과를 토대로 자전거 인프라의 추가 확충 계획 시 이용자의 안전시설 및 공간 확보가 우선돼야 하며, 대중교통과 연계한 자전거 인프라 시설 보급방안의 수립이 필요한 것으로 보인다.

원인균별 식중독 발생 건수 예측 (Prediction of the Number of Food Poisoning Occurrences by Microbes)

  • 여인권
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.923-932
    • /
    • 2013
  • 이 논문에서는 우리나라에서 발생하는 원인균별 식중독 발생건수를 예측하는 방법을 제안한다. 우리나라에서 보고되는 주별 식중독 발생 건수를 원인균로 나누면 자료에 많은 0의 관측값이 포함되어 있으며 식중독 발생 간에 종속성을 가진다. 이 현상을 모형화하기 위해 이 논문에서는 전체 식중독 건수를 자기회귀모형으로 예측하고 원인균별 식중독 발생 확률을 다범주 로짓모형으로 추정한다. 예측된 식중독 건수와 추정된 원인균별 식중독 발생 확률을 곱하여 원인균별 식중독 발생건수를 예측한다. 제안된 방법의 타당성을 확인하기 위해 평균제곱오차와 평균절대편차를 이용하여 제안 방법과 영과잉모형을 비교해 본다.

발명자 네트워크의 공간적 결정요인 분석 (An Analysis of Spatial Determinants of Inventor Networks in Korea)

  • 정준호
    • 한국경제지리학회지
    • /
    • 제19권1호
    • /
    • pp.1-17
    • /
    • 2016
  • 본 논문은 내국인 특허출원 자료에서 복수 발명자들의 주소지들을 파악하고 가산자료의 특성을 통제할 수 있는 영과잉 음이항 회귀모형을 사용하여 230개 시군구 간 발명자 네트워크의 공간구조와 그것의 결정요인을 분석한다. 발명자 네트워크의 공간적 연계에 영향을 미치는 몇 가지 요인들이 확인된다. 이출지역이 민간 R&D, 고등교육수준, 인구규모, 특허 생산성 등과 같은 R&D 관련 지역 특수적 자산들을 많이 보유하면 동태적인 수요효과를 통해 공간적 연계는 다른 지역으로 확대된다. 그리고 물리적 거리뿐만 아니라 기술적 거리에서도 거리조락현상이 나타난다. 이입지역이 R&D 관련 지역 특수적 자산을 많이 보유하면 유사한 논리로 공간적 연계에서 정(+)의 효과가 발생한다.

  • PDF

교대근무 간호사의 혈액과 체액 노출 사고 예측 요인과 감염예방행위의 매개효과: 영과잉 가산 자료 분석방법을 적용하여 (Predictors of Blood and Body Fluid Exposure and Mediating Effects of Infection Prevention Behavior in Shift-Working Nurses: Application of Analysis Method for Zero-Inflated Count Data)

  • 류재금;최스미
    • 대한간호학회지
    • /
    • 제50권5호
    • /
    • pp.658-670
    • /
    • 2020
  • Purpose: This study aimed to identify the predictors of blood and body fluid exposure (BBFE) in multifaceted individual (sleep disturbance and fatigue), occupational (occupational stress), and organizational (hospital safety climate) factors, as well as infection prevention behavior. We also aimed to test the mediating effect of infection prevention behavior in relation to multifaceted factors and the frequency of BBFE. Methods: This study was based on a secondary data analysis, using data of 246 nurses from the Shift Work Nurses' Health and Turnover study. Based on the characteristics of zero-inflated and over-dispersed count data of frequencies of BBFE, the data were analyzed to calculate zero-inflated negative binomial regression within a generalized linear model and to test the mediating effect using SPSS 25.0, Stata 14.1, and PROCESS macro. Results: We found that the frequency of BBFE increased in subjects with disturbed sleep (IRR = 1.87, p = .049), and the probability of non-BBFE increased in subjects showing higher infection prevention behavior (IRR = 15.05, p = .006) and a hospital safety climate (IRR = 28.46, p = .018). We also found that infection prevention behavior had mediating effects on the occupational stress-BBFE and hospital safety climate-BBFE relationships. Conclusion: Sleep disturbance is an important risk factor related to frequency of BBFE, whereas preventive factors are infection prevention behavior and hospital safety climate. We suggest individual and systemic efforts to improve sleep, occupational stress, and hospital safety climate to prevent BBFE occurrence.

Threshold-asymmetric volatility models for integer-valued time series

  • Kim, Deok Ryun;Yoon, Jae Eun;Hwang, Sun Young
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.295-304
    • /
    • 2019
  • This article deals with threshold-asymmetric volatility models for over-dispersed and zero-inflated time series of count data. We introduce various threshold integer-valued autoregressive conditional heteroscedasticity (ARCH) models as incorporating over-dispersion and zero-inflation via conditional Poisson and negative binomial distributions. EM-algorithm is used to estimate parameters. The cholera data from Kolkata in India from 2006 to 2011 is analyzed as a real application. In order to construct the threshold-variable, both local constant mean which is time-varying and grand mean are adopted. It is noted via a data application that threshold model as an asymmetric version is useful in modelling count time series volatility.

Technology Innovation in Korean Manufacturing Firms: Intra-Firm Knowledge Diffusion and Market Strategy in Patent Production

  • Hong, Chang-Soo;Jung, Jin-Hwa
    • Asian Journal of Innovation and Policy
    • /
    • 제1권1호
    • /
    • pp.50-70
    • /
    • 2012
  • This paper analyzes the factors that determine technology innovation in Korean manufacturing firms, focusing on the role of intra-firm knowledge diffusion and market strategy in patent production. For empirical analysis, zero-inflated negative binomial (ZINB) regression is applied to the 2009 Human Capital Corporate Panel data. The empirical findings confirm the critical role of intra-firm knowledge-sharing processes in technology innovation; firms with a market-leading strategy oriented to new product development also tend to be prolific in patent production.

ZAM을 이용한 국내 회전교차로 오토바이 사고모형 (Motorcycle Accident Model at Roundabout in Korea using ZAM)

  • 박병호;임진강;나희
    • 한국안전학회지
    • /
    • 제29권3호
    • /
    • pp.107-113
    • /
    • 2014
  • The goal of this study is to develop the accident models of motorcycle at roundabouts. In the pursuing the above, this study gives particular attentions to developing the appropriate models using ZAM. The main results are as follows. First, the evaluation of various developed models by the Vuong statistic and over-dispersion parameter shows that ZINB is analyzed to be optimal among Poisson, NB, ZIP(zero-inflated Poisson) and ZINB regression models. Second, the traffic volume, width of central island and width of approach are evaluated to be important variables to the accidents. Finally, the common variables that affect to the accident are selected to be traffic volume and width of approach. This study might be expected to give some implications to the accident research on the roundabout by motorcycle.