• 제목/요약/키워드: Negative Binomial Regression

검색결과 162건 처리시간 0.029초

서로 다른 산포를 허용하는 이변량 영과잉 음이항 회귀모형 (Bivariate Zero-Inflated Negative Binomial Regression Model with Heterogeneous Dispersions)

  • 김동석;정슬기;이동희
    • Communications for Statistical Applications and Methods
    • /
    • 제18권5호
    • /
    • pp.571-579
    • /
    • 2011
  • 본 연구에서는 두 반응 변수에 서로 다른 산포를 허용하는 새로운 이변량 영과잉 음이항 회귀모형을 제안하고, Deb과 Trivedi (1997)에 나타난 헬스케어 자료를 이용하여 두 반응변수가 갖는 서로 다른 산포도를 무시한 Wang (2003)이 제안한 이변량 영과잉 음이항 회귀모형과의 효율성을 로그우도와 AIC의 관점에서 비교 하였다. 모형적합결과, 본 연구에서 제안한 모형이 모형선택기준 관점에서 기존모형에 비하여 월등히 우수한 결과를 보여주었다.

기계학습을 활용한 데이터 기반 경찰신고건수 예측 (The Data-based Prediction of Police Calls Using Machine Learning)

  • 최재훈
    • 한국빅데이터학회지
    • /
    • 제3권2호
    • /
    • pp.101-112
    • /
    • 2018
  • 본 연구는 기계학습의 하나인 신경망 분석과 음이항 회귀분석을 활용하여 경찰신고건수를 예측하고자 2016년 6월부터 2017년 5월까지 충남지방경찰청에 접수된 112신고 데이터를 이용하여 예측모델을 개발하였다. 모델을 개발하기 위해 경찰신고건수에 영향을 줄 수 있는 시간, 휴일, 휴일 전날, 계절, 기온, 강수량, 풍속, 관할면적, 인구, 외국인 수, 단독주택비율, 기타주택비율 변수 등을 활용하였다. 변수의 종류에 따라 몇몇은 경찰신고건수와 양의 상관관계 또는 음의 상관관계가 확인되었다. 사용된 두 개의 방법론을 비교한바, 신경망분석의 예측 결과는 예측 값과 실제 값의 상관계수 0.7702, RMSE 2.557이고, 음이항 회귀분석은 상관계수 0.7158, RMSE 2.831으로 나타났다. 신경망분석은 해석가능성은 낮지만, 음이항 회귀분석에 비해 예측력이 뛰어나다는 것이 확인되었다. 향후 경찰관서에서 본 연구의 예측모델을 기초로 하여 최적의 경찰력 배치를 할 수 있을 것으로 기대된다.

기상상태에 따른 국내 원형교차로 사고모형 (Accident Models of Circular Intersections by Weather Condition in Korea)

  • 박병호;한수산
    • 한국안전학회지
    • /
    • 제27권6호
    • /
    • pp.178-184
    • /
    • 2012
  • This study deals with the traffic accidents by weather condition. The objectives are to comparatively analyze the characteristics, and to develop the models of traffic accidents by weather condition. In pursuing the above, this paper gives particular attentions to testing the differences between two groups, and developing the models(Poisson and negative binomial regression) using the data of domestic circular intersections. The main results are as follows. First, three Poisson models and one negative binomial models which were all statistically significant were developed using the number of accident and EPDO by the clear weather and other as the dependant variables. Second, the differences between two models were comparatively analyzed using the chosen variables. This paper might be expected to give some implications to traffic safety policy-making to reduce and prevent the traffic accidents in circular intersections.

영과잉 가산자료(Zero-inflated Count Data) 분석 방법을 이용한 지역사회 거주 노인의 노인학대 발생과 심각성에 미치는 위험요인 분석 (Risk Factors Influencing Probability and Severity of Elder Abuse in Community-dwelling Older Adults: Applying Zero-inflated Negative Binomial Modeling of Abuse Count Data)

  • 장미희;박창기
    • 대한간호학회지
    • /
    • 제42권6호
    • /
    • pp.819-832
    • /
    • 2012
  • Purpose: This study was conducted to identify risk factors that influence the probability and severity of elder abuse in community-dwelling older adults. Methods: This study was a cross-sectional descriptive study. Self-report questionnaires were used to collect data from community-dwelling Koreans, 65 and older (N=416). Logistic regression, negative binomial regression and zero-inflated negative binomial regression model for abuse count data were utilized to determine risk factors for elder abuse. Results: The rate of older adults who experienced any one category of abuse was 32.5%. By zero-inflated negative binomial regression analysis, the experience of verbal-psychological abuse was associated with marital status and family support, while the experience of physical abuse was associated with self-esteem, perceived economic stress and family support. Family support was found to be a salient risk factor of probability of abuse in both verbal-psychological and physical abuse. Self-esteem was found to be a salient risk factor of probability and severity of abuse in physical abuse alone. Conclusion: The findings suggest that tailored prevention and intervention considering both types of elder abuse and target populations might be beneficial for preventative efficiency of elder abuse.

Analysis of Food Poisoning via Zero Inflation Models

  • Jung, Hwan-Sik;Kim, Byung-Jip;Cho, Sin-Sup;Yeo, In-Kwon
    • 응용통계연구
    • /
    • 제25권5호
    • /
    • pp.859-864
    • /
    • 2012
  • Poisson regression and negative binomial regression are usually used to analyze counting data; however, these models are unsuitable for fit zero-inflated data that contain unexpected zero-valued observations. In this paper, we review the zero-inflated regression in which Bernoulli process and the counting process are hierarchically mixed. It is known that zero-inflated regression can efficiently model the over-dispersion problem. Vuong statistic is employed to compare performances of the zero-inflated models with other standard models.

음이항회귀식을 이용한 도로표지의 인지반응시간 추정모형 개발 (Development of Recognition and Reaction Time Prediction Model in Road Signs using Negative Binomial Regression)

  • 박형진;이기영;김정룡
    • 대한인간공학회지
    • /
    • 제25권4호
    • /
    • pp.23-33
    • /
    • 2006
  • The purpose of this study is to determine the economical standard of road signs by verifying the difference of driver's recognition and reaction time according to the space rate of letters on the road signs. For this reason, indoor simulations was conducted to confirm difference of recognition and reaction time on six sign-targets having different space rate. Also, a negative binomial regression model was used to find the main factors which could lower the rate of misreading. For this model, increasing of legibility of sign is not only simple enlargement of sign, but also suitable match of letters and sign. The result of this study is capable of verifying the importance of the space rate in road signs, and being utilized as a effective method to determine the standard of the road signs.

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

유어낚시인구의 사회경제학적 특성과 출조빈도함수의 추정에 관한 연구 (A Study on the Socio-economic Characteristics of the Angler Population and the Estimation of A Fishing Frequency Function)

  • 박철형
    • 수산경영론집
    • /
    • 제36권1호
    • /
    • pp.81-101
    • /
    • 2005
  • This article is to estimate the fishing frequency function in Korean recreational fishery with respect to socio-economic characteristics of anglers. First, the study described the characteristics of the entire angler population on the view points of 9 socio-economic variables. And then, the study divided the total angler population into three groups of in-land, sea, and mixed angler populations in order to investigate the differences in their characteristics. The study could confirm the existence of differences in regions, size of regions, and educational levels between the in - land and the sea angler populations by testing heterogeneity in the frequency table. The fishing frequency function is estimated using Poisson regression model in order to accomodate the count data(non-negative discrete random variable) aspects of the fishing frequency. However, the model specification error is found due to overdispersion of data. The model exhibits the lack of goodness of fit. The negative binomial regression model is adopted to cure the overdispersion of the data as an alternative estimation methodology. Finally, the study can confirm overdispersion does not exist in the model any more and the goodness of fit improved significantly to the reasonable level. The results of estimation of fishing frequency population modeled by the negative binomial regression models are following. The three variables of region, sex, and education have effects on the decision making process of fishing frequency in the case of in-land recreation fishery. On the other hand, the three variables of sex, age, and marriage status do the same job in the case of sea angler population. Among the left-over variables, both income and use of Internet variables now affect on the process in mixed angler population. Finally, the results of whole angler population show that all of the previous variables are proven to be statistically significant due to the summation of data with all three sub-groups of angler population.

  • PDF

중소기업 청년인턴 이직횟수 결정요인 분석 (The study on the determinants of the number of job changes)

  • 박성익;류장수;김종한;조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.387-397
    • /
    • 2015
  • 본 연구에서는 청년인턴 DB와 고용보험 DB를 사용하여 중소기업 청년인턴의 이직횟수에 영향을 미치는 요인을 분석하였다. 이직횟수는 음수가 아닌 정수 값만 가지는 계수 데이터 (count data)이므로 일반적인 선형회귀모형을 적용하는 것은 문제가 있다. 따라서 계수 데이터에 적합한 회귀모형으로 포아송 회귀모형, 영과잉 포아송 회귀모형, 음이항 회귀모형, 영과잉 음이항 회귀모형 등 4개의 회귀모형을 적용하였다. 분석결과 최적모형으로 영과잉 음이항 회귀모형이 선택되었다. 주요 분석결과를 정리하면 다음과 같다. 첫째, 통제집단 (비인턴집단)에 비해서 처리집단 (인턴집단)이 통계적으로 유의하게 이직경험이 낮게 나타났다. 둘째, 연령이 작을수록 통계적으로 유의하게 이직경험이 낮게 나타났다. 셋째, 여자에 비해서 남자가 유의하게 이직횟수가 높게 나타났다. 마지막으로 기업규모가 클수록 이직횟수가 유의하게 감소하는 것으로 나타났다.

포아송 및 음이항 회귀분석을 이용한 해상운임 결정요인이 해운선사의 블랭크 세일링에 미치는 영향 분석 연구 (A Study on Impact of Factors Influencing Maritime Freight Rates Using Poisson and Negative Binomial Regression Analysis on Blank Sailings of Shipping Companies)

  • 류원형;남형식
    • 한국항해항만학회지
    • /
    • 제48권1호
    • /
    • pp.62-77
    • /
    • 2024
  • 해상운송 산업에서는 공급과 수요의 불균형이 지속적으로 증가하면서 세계 주요 해운선사들이 해운 시황에 따른 선복량을 탄력적으로 조절하기 위해 블랭크 세일링을 주요 수단으로 사용하고 있다. 일반적으로 블랭크 세일링은 중국의 춘절 기간에 맞추어 많이 실시되어 왔지만, 2020년부터 시작된 글로벌 팬데믹과 미국·중국 간 무역 전쟁 등과 같은 특수한 상황으로 인해 최근 해운선사들은 기존 대비 큰 규모의 블랭크 세일링을 실시하였다. 이러한 블랭크 세일링은 화물 운송 지연에 직접적 영향을 미치기 때문에 기업과 소비자의 측면에서 부정적인 영향을 초래할 수 있다. 따라서 본 연구는 이에 선제적으로 대응하기 위해 포아송 회귀모형과 음이항 회귀모형을 활용하여 해상운임 결정요인이 해운선사의 블랭크 세일링에 미치는 영향력을 분석하였다. 분석 결과, 포아송 회귀분석의 2M의 경우 유의한 변수로 글로벌 컨테이너 해상물동량, 컨테이너 선복량, 컨테이너선 해체량, 컨테이너선 신조선가지수, OECD 인플레이션을 도출하였고, 음이항 회귀분석의 Ocean Alliance의 경우 글로벌 컨테이너 해상물동량과 컨테이너선 발주량을, THE Alliance의 경우 컨테이너선 선복량과 금리를, Non-Alliance의 경우 국제유가, 글로벌 공급망 압력지수, 컨테이너선 선복량, OECD 인플레이션을, Total Alliance의 경우 컨테이너선 선복량과 금리를 유의한 변수로 도출할 수 있었다.