• 제목/요약/키워드: Zero inflated data

검색결과 71건 처리시간 0.03초

어가의 고용량 결정요인 분석 (An Analysis on the Determinants of Employed Labour Quantity in the Fishing Industry)

  • 김태현;박철형;남종오
    • 자원ㆍ환경경제연구
    • /
    • 제27권3호
    • /
    • pp.545-567
    • /
    • 2018
  • 본 연구는 포아송모형, 음이항모형, 영과잉 포아송모형, 영과잉 음이항모형을 이용하여 어가의 고용량 결정요인을 분석하고, 개별모형 간 고용량 결정요인을 비교 분석한다. 이들 모형의 추정에 사용된 자료는 통계청에서 제공하는 2010년과 2015년의 농림어업총조사 마이크로 데이터이며, 이들 자료를 풀링(Pooling)하여 고용량 결정요인과 그 변화분에 대해 추정한다. 분석모형의 선정 결과, 과대 산포 경향을 갖고 있으면서 자가 노동 및 가족 경영으로 고용을 대체하고 있는 수산업의 특성을 모형에 동시에 반영하고 있는 영과잉 음이항모형이 선정되었다. 또한 2010년 대비 2015년 고용량 결정요인의 변화분을 분석해 본 결과, 어선을 보유한 어가와 판매금액이 많은 어가는 고용량 감소에 유의한 영향을 미치는 것으로 나타난 반면, 어가의 종사경력은 길수록 고용량 증가에 유의한 영향을 미치는 것으로 나타났다. 결론적으로 자본화된 어가와 고령화의 가속화가 수산업의 어가 고용량 수 변화에 유의한 영향을 미친 것으로 나타났다.

영과잉 음이항 회귀모형을 적용한 농촌지역 성인 신체활동의 지역사회환경 요인 분석 (Neighborhood Environment Associated with Physical Activity among Rural Adults: Applying Zero-Inflated Negative Binominal Regression Modeling)

  • 김봉정
    • 한국보건간호학회지
    • /
    • 제29권3호
    • /
    • pp.488-502
    • /
    • 2015
  • Purpose: This study was conducted to determine the neighborhood environmental factors associated with physical activity among adults living in rural communities. Methods: A cross-sectional descriptive survey was conducted with a convenience sample of 201 adults living in three Ri in Y-city, Gyeonggi-do. Data were collected from face-to-face interview by trained interviewers and were analyzed using a zero-inflated negative binominal regression model. Results: Participants reported engaged in moderate or vigorous physical activity was 76.1%; 10.5% of participants reported that they met moderate physical activity recommendations and 14.5% of participants reported that they met vigorous physical activity recommendations. Zero-inflated negative binominal regression analysis showed association of increasing days of physical activity with social cohesion (${\beta}=.130$, p=.005), social network (${\beta}=-.096$, p=.003), and safety for crime (${\beta}=-.151$, p=.036), and no days of physical activity was associated with no attainment of education and marginally associated with increasing BMI. Conclusion: Neighborhood environmental factors including social cohesion, social network, and crime for safety were significantly associated with physical activity of rural adults. Community health nurses should expand an approach for individual behavior change to incorporate rural adults' specific neighborhood environmental factors into physical activity interventions.

교대근무 간호사의 혈액과 체액 노출 사고 예측 요인과 감염예방행위의 매개효과: 영과잉 가산 자료 분석방법을 적용하여 (Predictors of Blood and Body Fluid Exposure and Mediating Effects of Infection Prevention Behavior in Shift-Working Nurses: Application of Analysis Method for Zero-Inflated Count Data)

  • 류재금;최스미
    • 대한간호학회지
    • /
    • 제50권5호
    • /
    • pp.658-670
    • /
    • 2020
  • Purpose: This study aimed to identify the predictors of blood and body fluid exposure (BBFE) in multifaceted individual (sleep disturbance and fatigue), occupational (occupational stress), and organizational (hospital safety climate) factors, as well as infection prevention behavior. We also aimed to test the mediating effect of infection prevention behavior in relation to multifaceted factors and the frequency of BBFE. Methods: This study was based on a secondary data analysis, using data of 246 nurses from the Shift Work Nurses' Health and Turnover study. Based on the characteristics of zero-inflated and over-dispersed count data of frequencies of BBFE, the data were analyzed to calculate zero-inflated negative binomial regression within a generalized linear model and to test the mediating effect using SPSS 25.0, Stata 14.1, and PROCESS macro. Results: We found that the frequency of BBFE increased in subjects with disturbed sleep (IRR = 1.87, p = .049), and the probability of non-BBFE increased in subjects showing higher infection prevention behavior (IRR = 15.05, p = .006) and a hospital safety climate (IRR = 28.46, p = .018). We also found that infection prevention behavior had mediating effects on the occupational stress-BBFE and hospital safety climate-BBFE relationships. Conclusion: Sleep disturbance is an important risk factor related to frequency of BBFE, whereas preventive factors are infection prevention behavior and hospital safety climate. We suggest individual and systemic efforts to improve sleep, occupational stress, and hospital safety climate to prevent BBFE occurrence.

변화시점이 있는 영과잉-포아송모형에서 돌출대립가설에 대한 우도비검정 (Likelihood Ratio Test for the Epidemic Alternatives on the Zero-Inflated Poisson Model)

  • 김경무
    • Journal of the Korean Data and Information Science Society
    • /
    • 제9권2호
    • /
    • pp.247-253
    • /
    • 1998
  • 영과잉-포아송모형에서 변화시점이 있는 경우, 돌출대립가설에 대한 우도비검정을 이용하여 변화시점의 유 무를 알아보았다. 변화시점에 대한 추정은 최소제곱법을 이용하였고 이를 최우추정법을 이용하기 위한 초기치로 활용하였다. 또한 대립가설에 대한 몇가지 흥미있는 모수들을 적률법을 이용하여 추정하였다. 모의실험을 통하여 이들 추정 량을 비교하였고 결과 변화시점에 대한 추정은 최소제곱법보다는 최우추정법이 바람직하게 나타났고 흥미있는 몇가지 모수들에 대해서는 최우추정량이 적률추정량보다 우수하게 나타났다.

  • PDF

국내 회전교차로의 추돌사고 모형 개발 (Developing Rear-End Collision Models of Roundabouts in Korea)

  • 박병호;백태헌
    • 한국안전학회지
    • /
    • 제29권6호
    • /
    • pp.151-157
    • /
    • 2014
  • This study deals with the rear-end collision at roundabouts. The purpose of this study is to develop the accident models of rear-end collision in Korea. In pursuing the above, this study gives particular attention to developing the appropriate models using Poisson, negative binomial model, ZAM, multiple linear and nonlinear regression models, and statistical analysis tools. The main results are as follows. First, the Vuong statistics and overdispersion parameters indicate that ZIP is the most appropriate model among count data models. Second, RMSE, MPB, MAD and correlation coefficient tests show that the multiple nonlinear model is the most suitable to the rear-end collision data. Finally, such the independent variables as traffic volume, ratio of heavy vehicle, number of circulatory roadway lane, number of crosswalk and stop line are adopted in the optimal model.

영과잉 회귀모형을 이용한 광고노출분포 추정 (Estimation of Advertising Exposure Distribution by Zero-inflation Regression Models)

  • 이동희
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2841-2852
    • /
    • 2018
  • 이 논문에서는 광고분야 매체기획에서 필요한 노출분포 추정과 관련하여 영과잉 분포를 이용한 회귀모형 방법에 대해 살펴보고자 한다. 노출분포란 광고를 반복하여 게재할 때마다 노출되는 청중들의 비율을 나타낸 것이다. 이와 같은 노출분포는 광고효과를 수량적으로 측정하기 위한 각종 지표들을 산출하는데 필요한 기초 정보를 제공한다는 점에서 매우 중요한 역할을 한다. 특히 최근 다양한 매체의 확산으로 인한 광고 단가의 인하로 인하여 과거에 비해 특정 광고의 게재 혹은 방영빈도는 크게 늘어난 상태이나 노출빈도는 상대적으로 줄어들고 있는 상황이다. 이러한 상황에서 해당 매체를 접하지 않는, 즉 구조적으로 광고에 노출되지 않는 개인들이 늘어가고 있다. 이제까지 광고의 노출분포 추정을 위해 사용해 왔던 베타이항분포 등은 이러한 상황에 적합하지 않을 수 있는데, 본 연구에서는 영과잉 회귀모형을 이용한 광고노출분포모형을 제안하고, 실제 사례를 통한 비교연구를 수행하였다.

A Bayesian cure rate model with dispersion induced by discrete frailty

  • Cancho, Vicente G.;Zavaleta, Katherine E.C.;Macera, Marcia A.C.;Suzuki, Adriano K.;Louzada, Francisco
    • Communications for Statistical Applications and Methods
    • /
    • 제25권5호
    • /
    • pp.471-488
    • /
    • 2018
  • In this paper, we propose extending proportional hazards frailty models to allow a discrete distribution for the frailty variable. Having zero frailty can be interpreted as being immune or cured. Thus, we develop a new survival model induced by discrete frailty with zero-inflated power series distribution, which can account for overdispersion. This proposal also allows for a realistic description of non-risk individuals, since individuals cured due to intrinsic factors (immunes) are modeled by a deterministic fraction of zero-risk while those cured due to an intervention are modeled by a random fraction. We put the proposed model in a Bayesian framework and use a Markov chain Monte Carlo algorithm for the computation of posterior distribution. A simulation study is conducted to assess the proposed model and the computation algorithm. We also discuss model selection based on pseudo-Bayes factors as well as developing case influence diagnostics for the joint posterior distribution through ${\psi}-divergence$ measures. The motivating cutaneous melanoma data is analyzed for illustration purposes.

이변량 포아송분포를 이용한 K-리그 골 점수의 예측 (Prediction of K-league soccer scores using bivariate Poisson distributions)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1221-1229
    • /
    • 2014
  • 30년 동안의 K-리그 자료를 득점과 실점이 서로 상관이 있다는 가정과 R 패키지를 사용하여 12개의 서로 다른 이변량 포아송모형에 적합시켰다. 그 결과 AIC와 BIC 판정기준 아래에서 공변량 효과가 상수인 이변량 포아송모형이 가장 타당하며, 영과잉 및 대각확대 모형은 필요하지 않은 것으로 나타났다. 제안된 모형은 홈경기의 효과, 팀별 공격능력과 수비능력 및 적합도를 구하는 데 사용될 수 있다.

도시부 4지 신호교차로 유턴 사고모형 개발 (Development of the U-turn Accident Model at 4-Legged Signalized Intersections in Urban Areas)

  • 강종호;김경환;하만복;김성문
    • 한국도로학회논문집
    • /
    • 제16권2호
    • /
    • pp.119-129
    • /
    • 2014
  • PURPOSES : The purpose of this study is to develop the U-turn accident model at 4-legged signalized intersections in urban areas. METHODS : In order to analyze the characteristics of the accidents which are associated with U-turn operation at 4-legged signalized intersections in urban areas and develop an U-turn accident model by regression analysis, the tests of overdispersion and zero-inflation are conducted about the dependent variables of number of accidents and EPDO (Equivalent Property Damage Only). RESULTS : As their results, the Poisson model fits best for number of accident and the ZIP (Zero Inflated Poisson) fits best for EPOD, the variables of conflict traffic, width of opposing road, traffic passing speed are adopted as independent variable for both models. The variables of number of bus berths and rate of U-turn signal time at which the U-turn is permitted are adopted as independent variable only for EPDO. CONCLUSIONS : These study results suggest that U-turn would be permitted at the intersection where the width of opposing road is wider than 11.9 meters, the passing vehicle speed is not high and U-turn operation is not hindered by the buses stopping at bus stops.

원인균별 식중독 발생 건수 예측 (Prediction of the Number of Food Poisoning Occurrences by Microbes)

  • 여인권
    • 응용통계연구
    • /
    • 제26권6호
    • /
    • pp.923-932
    • /
    • 2013
  • 이 논문에서는 우리나라에서 발생하는 원인균별 식중독 발생건수를 예측하는 방법을 제안한다. 우리나라에서 보고되는 주별 식중독 발생 건수를 원인균로 나누면 자료에 많은 0의 관측값이 포함되어 있으며 식중독 발생 간에 종속성을 가진다. 이 현상을 모형화하기 위해 이 논문에서는 전체 식중독 건수를 자기회귀모형으로 예측하고 원인균별 식중독 발생 확률을 다범주 로짓모형으로 추정한다. 예측된 식중독 건수와 추정된 원인균별 식중독 발생 확률을 곱하여 원인균별 식중독 발생건수를 예측한다. 제안된 방법의 타당성을 확인하기 위해 평균제곱오차와 평균절대편차를 이용하여 제안 방법과 영과잉모형을 비교해 본다.