• 제목/요약/키워드: Poisson and Negative Binomial Regression Model

검색결과 55건 처리시간 0.022초

Analysis of Food Poisoning via Zero Inflation Models

  • Jung, Hwan-Sik;Kim, Byung-Jip;Cho, Sin-Sup;Yeo, In-Kwon
    • 응용통계연구
    • /
    • 제25권5호
    • /
    • pp.859-864
    • /
    • 2012
  • Poisson regression and negative binomial regression are usually used to analyze counting data; however, these models are unsuitable for fit zero-inflated data that contain unexpected zero-valued observations. In this paper, we review the zero-inflated regression in which Bernoulli process and the counting process are hierarchically mixed. It is known that zero-inflated regression can efficiently model the over-dispersion problem. Vuong statistic is employed to compare performances of the zero-inflated models with other standard models.

지역별 회전교차로 사고모형 개발 및 논의 (Development of Roundabout Accident Models by Region)

  • 손슬기;박병호
    • 한국도로학회논문집
    • /
    • 제20권2호
    • /
    • pp.67-74
    • /
    • 2018
  • PURPOSES : The goal of this study is the development of roundabout accident models for urban and non-urban areas. METHODS : This study performed a comparative analysis of the regional factors affecting accidents. Traffic accident data were collected for the period 2010~2014 from the TAAS data set of the Road Traffic Authority. To develop the roundabout accident models, the Poisson and negative binomial regression models were used. A total of 25 explanatory variables such as geometry, and traffic volume were used. RESULTS : The key findings are as follows: First, it was found that the null hypotheses that the number of accidents is the same should be rejected. Second, three Poisson regression accident models, which are statistically significant (${\rho}^2$ of 0.154 and 0.385) were developed. Third, it was noted that although the common variable of the three models (models I~III) is the number of entry lanes, the specific variables are entry lane width, roundabout sign, number of circulatory roadways, splitter island, number of exit lanes, exit lane width, number of approach roads, and truck apron. CONCLUSIONS : The results of this study can provide suggestive countermeasures for decreasing the number of roundabout accidents.

중소기업 청년인턴 이직횟수 결정요인 분석 (The study on the determinants of the number of job changes)

  • 박성익;류장수;김종한;조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.387-397
    • /
    • 2015
  • 본 연구에서는 청년인턴 DB와 고용보험 DB를 사용하여 중소기업 청년인턴의 이직횟수에 영향을 미치는 요인을 분석하였다. 이직횟수는 음수가 아닌 정수 값만 가지는 계수 데이터 (count data)이므로 일반적인 선형회귀모형을 적용하는 것은 문제가 있다. 따라서 계수 데이터에 적합한 회귀모형으로 포아송 회귀모형, 영과잉 포아송 회귀모형, 음이항 회귀모형, 영과잉 음이항 회귀모형 등 4개의 회귀모형을 적용하였다. 분석결과 최적모형으로 영과잉 음이항 회귀모형이 선택되었다. 주요 분석결과를 정리하면 다음과 같다. 첫째, 통제집단 (비인턴집단)에 비해서 처리집단 (인턴집단)이 통계적으로 유의하게 이직경험이 낮게 나타났다. 둘째, 연령이 작을수록 통계적으로 유의하게 이직경험이 낮게 나타났다. 셋째, 여자에 비해서 남자가 유의하게 이직횟수가 높게 나타났다. 마지막으로 기업규모가 클수록 이직횟수가 유의하게 감소하는 것으로 나타났다.

유어낚시인구의 사회경제학적 특성과 출조빈도함수의 추정에 관한 연구 (A Study on the Socio-economic Characteristics of the Angler Population and the Estimation of A Fishing Frequency Function)

  • 박철형
    • 수산경영론집
    • /
    • 제36권1호
    • /
    • pp.81-101
    • /
    • 2005
  • This article is to estimate the fishing frequency function in Korean recreational fishery with respect to socio-economic characteristics of anglers. First, the study described the characteristics of the entire angler population on the view points of 9 socio-economic variables. And then, the study divided the total angler population into three groups of in-land, sea, and mixed angler populations in order to investigate the differences in their characteristics. The study could confirm the existence of differences in regions, size of regions, and educational levels between the in - land and the sea angler populations by testing heterogeneity in the frequency table. The fishing frequency function is estimated using Poisson regression model in order to accomodate the count data(non-negative discrete random variable) aspects of the fishing frequency. However, the model specification error is found due to overdispersion of data. The model exhibits the lack of goodness of fit. The negative binomial regression model is adopted to cure the overdispersion of the data as an alternative estimation methodology. Finally, the study can confirm overdispersion does not exist in the model any more and the goodness of fit improved significantly to the reasonable level. The results of estimation of fishing frequency population modeled by the negative binomial regression models are following. The three variables of region, sex, and education have effects on the decision making process of fishing frequency in the case of in-land recreation fishery. On the other hand, the three variables of sex, age, and marriage status do the same job in the case of sea angler population. Among the left-over variables, both income and use of Internet variables now affect on the process in mixed angler population. Finally, the results of whole angler population show that all of the previous variables are proven to be statistically significant due to the summation of data with all three sub-groups of angler population.

  • PDF

청주.청원 지방부 신호교차로의 후미추돌 사고모형 (Rear-end Accident Models of Rural Area Signalized Intersections in the Cases of Cheongju and Cheongwon)

  • 박병호;인병철
    • 한국도로학회논문집
    • /
    • 제11권2호
    • /
    • pp.151-158
    • /
    • 2009
  • 본 연구는 지방부에서의 후미추돌사고를 다루고 있다. 이 연구의 목적은 신호교차로의 후미주돌 사고특성을 분석하고 청주 청원에 대한사고모형을 개발하는 것이다. 이를 위해, 이 연구에서는 도시부와 지방부의 특성을 비교하는데 중점을 두고 있다. 이 연구에서 사용된 종속변수는 사고건수와 EFDO(equivalent property damage only)이며, 독립변수는 교통량과 기하구조 요소들로 이루어졌다. 주요 연구결과는 다음과 같다. 첫째, 사고건수를 종속변수로 이용한 포아송 회귀모형과 EFDO를 종속변수로 이용한 음이항 회귀모형이 통계적으로 적합한 것으로 분석된다. 둘째, 포아송 회귀분석 결과 나타난 독립변수들은 중차량비, 교통량 합계 그리고 차량 유출입구 합계이며 음이항 회귀분석으로 나타난 요인은 주도로 폭, 교통량 합계 그리고 중차량비로 분석된다. 마지막으로, 지방부에서의 특정 독립변수는 주도로 폭과 중차량비 그리고 차량 유출입구 합계이다.

  • PDF

Modeling clustered count data with discrete weibull regression model

  • Yoo, Hanna
    • Communications for Statistical Applications and Methods
    • /
    • 제29권4호
    • /
    • pp.413-420
    • /
    • 2022
  • In this study we adapt discrete weibull regression model for clustered count data. Discrete weibull regression model has an attractive feature that it can handle both under and over dispersion data. We analyzed the eighth Korean National Health and Nutrition Examination Survey (KNHANES VIII) from 2019 to assess the factors influencing the 1 month outpatient stay in 17 different regions. We compared the results using clustered discrete Weibull regression model with those of Poisson, negative binomial, generalized Poisson and Conway-maxwell Poisson regression models, which are widely used in count data analyses. The results show that the clustered discrete Weibull regression model using random intercept model gives the best fit. Simulation study is also held to investigate the performance of the clustered discrete weibull model under various dispersion setting and zero inflated probabilities. In this paper it is shown that using a random effect with discrete Weibull regression can flexibly model count data with various dispersion without the risk of making wrong assumptions about the data dispersion.

영과잉 음이항회귀 모형을 이용한 보험설계사들의 이직횟수 적합 (Fit of the number of insurance solicitor's turnovers using zero-inflated negative binomial regression)

  • 전희주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1087-1097
    • /
    • 2017
  • 본 연구는 계수자료 (count data)를 반응변수로 갖는 포아송회귀 모형, 음이항회귀 모형, 영과잉 포아송회귀 모형, 영과잉 음이항회귀 모형의 4 모형의 비교를 통해 보험 설계사들의 이직횟수 적합을 위한 최적모형을 찾고자 한다. 보험설계사 이직횟수의 분산이 평균보다 큰 과대산포가 존재하고 0인 경우의 비중이 높을 경우에 영과잉 음이항회귀 모형을 적합하는 것이 타당함을 보여주고 보험 설계사들의 이직횟수에 영향을 주는 요인을 규명하고자 한다. 로그우도값, AIC, SBC 등을 고려하여 보험설계사 이직횟수 적합을 최적의 모형은 영과잉 이항모형과 음이항회귀모형의 결합인 영과잉 음이항 모형이 선택되었다. 영과잉 이항모형에 포함된 변수로는 성별, 총 보험설계사 근무연월, 교차모집 설계사 등록, 보유고객 수, 소속회사 유형이었고, 음이항회귀 모형에 포함된 변수로는 직무만족, 조직몰입, 채널경영만족, 총 보험설계사 근무연월, 현 직장에서 근무연월, 소속회사 유형이었다. 영과잉 음이항회귀 모형의 적합결과, 이직횟수에 유의한 영향을 주는 요인으로는 현 직장에서 근무연월, 총 보험설계사 근무연월, 소속회사 유형, 채널경영만족, 직무만족 순으로 나타났다.

토빗모형을 이용한 교차로 보행자 사고모형 개발 (Developing the Pedestrian Accident Models of Intersections using Tobit Model)

  • 이승주;임진강;박병호
    • 한국안전학회지
    • /
    • 제29권5호
    • /
    • pp.154-159
    • /
    • 2014
  • This study deals with the pedestrian accidents of intersections in case of Cheongju. The objective is to develop the pedestrian accident models using Tobit regression model. In pursuing the above, the pedestrian accident data from 2007 to 2011 were collected from TAAS data set of Road Traffic Authority. To analyze the accident, Poisson, negative binomial and Tobit regression models were utilized in this study. The dependent variable were the number of accident by intersection. Independent variables are traffic volume, intersection geometric structure and the transportation facility. The main results were as follows. First, Tobit model was judged to be more appropriate model than other models. Also, these models were analyzed to be statistically significant. Second, such the main variables related to accidents as traffic volume, pedestrian volume, number of traffic island, crossing length and the pedestrian countdown signal systems were adopted in the above model.

포아송 및 음이항 회귀분석을 이용한 해상운임 결정요인이 해운선사의 블랭크 세일링에 미치는 영향 분석 연구 (A Study on Impact of Factors Influencing Maritime Freight Rates Using Poisson and Negative Binomial Regression Analysis on Blank Sailings of Shipping Companies)

  • 류원형;남형식
    • 한국항해항만학회지
    • /
    • 제48권1호
    • /
    • pp.62-77
    • /
    • 2024
  • 해상운송 산업에서는 공급과 수요의 불균형이 지속적으로 증가하면서 세계 주요 해운선사들이 해운 시황에 따른 선복량을 탄력적으로 조절하기 위해 블랭크 세일링을 주요 수단으로 사용하고 있다. 일반적으로 블랭크 세일링은 중국의 춘절 기간에 맞추어 많이 실시되어 왔지만, 2020년부터 시작된 글로벌 팬데믹과 미국·중국 간 무역 전쟁 등과 같은 특수한 상황으로 인해 최근 해운선사들은 기존 대비 큰 규모의 블랭크 세일링을 실시하였다. 이러한 블랭크 세일링은 화물 운송 지연에 직접적 영향을 미치기 때문에 기업과 소비자의 측면에서 부정적인 영향을 초래할 수 있다. 따라서 본 연구는 이에 선제적으로 대응하기 위해 포아송 회귀모형과 음이항 회귀모형을 활용하여 해상운임 결정요인이 해운선사의 블랭크 세일링에 미치는 영향력을 분석하였다. 분석 결과, 포아송 회귀분석의 2M의 경우 유의한 변수로 글로벌 컨테이너 해상물동량, 컨테이너 선복량, 컨테이너선 해체량, 컨테이너선 신조선가지수, OECD 인플레이션을 도출하였고, 음이항 회귀분석의 Ocean Alliance의 경우 글로벌 컨테이너 해상물동량과 컨테이너선 발주량을, THE Alliance의 경우 컨테이너선 선복량과 금리를, Non-Alliance의 경우 국제유가, 글로벌 공급망 압력지수, 컨테이너선 선복량, OECD 인플레이션을, Total Alliance의 경우 컨테이너선 선복량과 금리를 유의한 변수로 도출할 수 있었다.

영과잉 회귀모형에 대한 베이지안 분석 (Bayesian Analysis for the Zero-inflated Regression Models)

  • 장학진;강윤회;이수범;김성욱
    • 응용통계연구
    • /
    • 제21권4호
    • /
    • pp.603-613
    • /
    • 2008
  • 셀 수 있는 이산 자료 중에서 일반적인 모형에 비하여 영의 빈도가 과도하게 많이 관측되는 자료가 있다. 이러한 경우에 포아송 또는 음이항회귀모형과 같은 일반적인 회귀모형에 의한 분석은 적절하지 못하다. 본 논문에서는 영과잉 포아송회귀모형과 영과잉 음이항회귀모형에 대하여 베이지안 분석을 하였다. 또한, 마코브 연쇄 몬테카롤로 방법으로 계산한 베이즈 요인을 이용하여 모형선택을 하였다. 실제 교통사고 자료를 분석하여 이론적인 결과들을 뒷받침하였다.