• 제목/요약/키워드: Zero-Inflated

검색결과 79건 처리시간 0.022초

이변량 포아송분포를 이용한 K-리그 골 점수의 예측 (Prediction of K-league soccer scores using bivariate Poisson distributions)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1221-1229
    • /
    • 2014
  • 30년 동안의 K-리그 자료를 득점과 실점이 서로 상관이 있다는 가정과 R 패키지를 사용하여 12개의 서로 다른 이변량 포아송모형에 적합시켰다. 그 결과 AIC와 BIC 판정기준 아래에서 공변량 효과가 상수인 이변량 포아송모형이 가장 타당하며, 영과잉 및 대각확대 모형은 필요하지 않은 것으로 나타났다. 제안된 모형은 홈경기의 효과, 팀별 공격능력과 수비능력 및 적합도를 구하는 데 사용될 수 있다.

영과잉포아송회귀분석을 활용한 안정병동에 입원한 정신질환자의 공격행동 예측요인 (Predictors for Aggressive Behavior of Patients with Mental Illness in a Closed Psychiatric Ward using Zero-Inflated Poisson Regression: A Retrospective Study)

  • 김정호;신성희
    • 동서간호학연구지
    • /
    • 제28권2호
    • /
    • pp.160-169
    • /
    • 2022
  • Purpose: This study was conducted to identify predictors related to aggressive behavior of patients with mental illness admitted to a closed psychiatric ward. Methods: This study adopted a retrospective design which analyzed the hospital medical records of 363 patients with mental illness admitted to the psychiatric closed ward of a university hospital in Seoul, Korea. The collected data were analyzed using SPSS IBM 20.0 and STATA 12.0 SE. ZIP (Zero-Inflated Poisson) and count data analysis were used for the factor influencing the occurrence and frequency of aggressive behavior. Results: The results of ZIP model showed that the factors influencing non-probability of aggressive behavior were anxiety, non-adherence, and frustration. In addition, the factors influencing frequency of aggressive behavior were bipolar disorder and personality disorder trait. Conclusion: We found that bipolar disorder, frustration, and non-adherence are more likely to increase the likelihood of aggressive behavior in patients with mental illness. In particular, patients diagnosed with bipolar disorder were 1.95 times more likely to engage in repetitive aggressive behavior compared to those without a diagnose. However, since the results were different form previous studies, further studies on the traits of anxiety and personality disorders are needed.

중소기업 청년인턴 이직횟수 결정요인 분석 (The study on the determinants of the number of job changes)

  • 박성익;류장수;김종한;조장식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.387-397
    • /
    • 2015
  • 본 연구에서는 청년인턴 DB와 고용보험 DB를 사용하여 중소기업 청년인턴의 이직횟수에 영향을 미치는 요인을 분석하였다. 이직횟수는 음수가 아닌 정수 값만 가지는 계수 데이터 (count data)이므로 일반적인 선형회귀모형을 적용하는 것은 문제가 있다. 따라서 계수 데이터에 적합한 회귀모형으로 포아송 회귀모형, 영과잉 포아송 회귀모형, 음이항 회귀모형, 영과잉 음이항 회귀모형 등 4개의 회귀모형을 적용하였다. 분석결과 최적모형으로 영과잉 음이항 회귀모형이 선택되었다. 주요 분석결과를 정리하면 다음과 같다. 첫째, 통제집단 (비인턴집단)에 비해서 처리집단 (인턴집단)이 통계적으로 유의하게 이직경험이 낮게 나타났다. 둘째, 연령이 작을수록 통계적으로 유의하게 이직경험이 낮게 나타났다. 셋째, 여자에 비해서 남자가 유의하게 이직횟수가 높게 나타났다. 마지막으로 기업규모가 클수록 이직횟수가 유의하게 감소하는 것으로 나타났다.

혼합효과 영과잉 포아송 회귀모형을 이용한 대전광역시 코로나 발생 동향 분석 (Mixed-effects zero-inflated Poisson regression for analyzing the spread of COVID-19 in Daejeon)

  • 김광희;이은지
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.375-388
    • /
    • 2021
  • 본 연구는 대전광역시에서 나타난 확진자 증가 현상을 분석하여 COVID-19의 확산을 방지할 대책 마련에 도움이 되고자 계획되었다. 확진자 증가의 원인이 시민들의 잦은 이동과 장기간 지속한 사회적 거리두기로 인한 피로와 방심에 있다고 보고, 각 행정동의 주별 확진자 수를 반응변수로, 생활 속 거리두기로 전환된 시점으로부터 흐른 시간, 행정동의 버스 하차 인원을 설명변수로 하여 이들의 관계를 모형화하였다. 행정동별 확진자 수가 주 단위로 반복측정 되었고, 포아송분포로 기대되는 0보다 더 많은 0이 관측될 수 있기 때문에 혼합효과 영과잉 포아송 회귀모형을 적용하였다. 행정동의 성격에 따라 확진자 발생 동향이 다를 수 있어서서 서로 유사한 성격을 갖는 행정동을 군집화하여 이를 범주형 설명변수로 사용하였다. 또한 버스 하차 인원의 효과가 행정동의 성격에 따라 달라질 수 있다는 점을 고려하여 두 변수 간의 교호작용항을 포함하였고 상대적으로 번화한 행정동에서 그 효과가 유의한 것으로 나타났다 (유의수준=0.1). 모형 적합 결과 인구수의 증가와 번화한 행정동이라는 요인, 그리고 버스 하차 인원의 증가가 확진자 수의 증가와 중요한 연관 관계를 가진다는 것을 보였다. 한편, 추정된 모형에 따르면 인구수와 버스 하차량이 고정되었을 때 번화한 집단의 확진자 수가 그렇지 않은 집단에 비해 훨씬 적을 것으로 기대되었는데, 이는 코로나 고위험 지역에 대한 시 차원의 강력한 대응이 효과를 발휘한 것으로 해석할 수 있다.

지방부 다차로 도로구간에서의 사고 예측모형 개발 (대도시권 외곽 및 구릉지 특성의 도로구간 중심으로) (Development of a Accident Frequency Prediction Model at Rural Multi-Lane Highways)

  • 이동민;김도훈;성낙문
    • 대한교통학회지
    • /
    • 제27권4호
    • /
    • pp.207-215
    • /
    • 2009
  • 도로구간에서의 주행조건은 연속적인 도로축 상에서 구간별로 변하게 되고 이에 따라 도로에서의 교통사고는 도로 기하구조 변수뿐만 아니라 도로주변 환경변수, 교통조건 변수 그리고 기타 다양한 변수들에 의해서 발생하게 된다. 따라서 본 연구는 현장조사를 통해 얻어진 다양한 도로기하구조 요소를 고려하여 동질성을 갖춘 구간 분할 후에 도로를 구성하는 도로 기하구조, 교통조건, 도로주변 환경 그리고 기타 다양한 요소들을 복합적으로 반영하고자 한다. 이를 반영하기 위해 본 연구에서는 도로구간의 주행조건을 결정짓는 주요인들에 의해서 주행조건 동질구간을 결정하고, 각 동질구간에서의 도로 및 교통조건 등을 고려하여 사고예측 모형을 개발하였다. 모형 개발을 위해 사용된 자료는 대도시권 외곽과 평지 및 구릉지를 대표할 수 있는 수도권 외곽내에 지방부 도로구간과 전라북도 지방부 도로구간에서 수집되었다. 본 연구에서는 연속된 도로구간에서 사고건수가 "0"인 구간수가 매우 높게 나타나므로 이에 대한 과대 예측을 방지하기 위해 ZIP(Zero Inflated Poisson) 모형을 이용하였다. 사고예측모형 개발 결과 지방부 다차로 도로구간에서 교통사고에 영향을 미치는 변수로는 교통량과 도로구간 길이를 포함한 EXPO($365{\times}ADT{\times}Length{\times}Year/10^{-6}$), 곡선반경, 종단구배변화, 가드레일, 지형(산악지), 횡단보도개수, 버스정류장 개수가 지방부 다차로 도로구간에서의 차대차 사고에 영향을 미치는 주요 설명변수로 나타났다.

고령운전자 운전 및 신체특성을 반영한 교통사고 분석 연구 (Analysis of Elderly Drivers' Accident Models Considering Operations and Physical Characteristics)

  • 임삼진;박준태;김영일;김태호
    • 대한교통학회지
    • /
    • 제30권6호
    • /
    • pp.37-46
    • /
    • 2012
  • 65세 이상 고령운전자의 경우 지난 10년 새 교통사고건수는 3만 7,000건에서 27만 4,000건으로 무려 640.5% 증가되었다. 이는 전체사고에서 차지하는 비율이 1.2%에서 3.1배 증가한 3.7%를 차지하고 있는 것으로 교통안전 관련기관에서는 여러 대책을 강구하고 있다. 무엇보다 고령운전자의 행동특성 및 신체특성에 대한 심층연구를 통해 안전대책과 연계하는 방안이 중요하다 할 수 있다. 본 연구에서는 고령운전자의 행동특성을 측정할 수 있는 운전자 적성검사(Driving Aptitude) 항목과 교통사고 자료를 토대로 고령운전자 운전특성과 사고특성을 연결한 실증연구를 수행하였다. 영향모형 개발을 위해 활용한 방법론은 영과잉 회귀모형을 적용하였고, ZIP 회귀모형과 ZINB 회귀모형에 대하여 베이지안 추론을 이용한 사고예측 모형을 선택하였다. AAE분석결과 ZIP 회귀모형이 적합하며, 3가지 변수속도예측, 주의전환, 인지능력이 고령자사고와 영향관계에 있음을 확인할 수 있었다.

경유지를 고려한 서울시 공공자전거 통행발생량 추정 모형 개발 (Estimating Travel Frequency of Public Bikes in Seoul Considering Intermediate Stops)

  • 박종한;고준호
    • 한국ITS학회 논문지
    • /
    • 제22권3호
    • /
    • pp.1-19
    • /
    • 2023
  • 최근 탄소중립의 대안으로 떠오르고 있는 자전거의 통행행태를 파악하기 위하여 경유지를 고려한 통행발생량을 추정하고자 하였다. 서울시 공공자전거인 '따릉이'의 GPS 주행궤적 데이터를 이용하여 통행에서의 중간 경유지인 체류 지점을 파악하고, 인구, 토지이용, 물리적인 특성을 반영한 통행발생량 모형을 분석하였다. 맵매칭과 체류 지점 탐지 알고리즘을 이용하여 체류 지점을 추정한 결과, 전체 통행의 약 12.1%에서 체류 지점이 나타났다. 체류가 발생한 통행은 비체류에 비해 평균 이용거리와 이용시간이 더 길며, 체류 지점이 집중되는 시간대는 오전 첨두시와 오후 첨두시 사이의 비첨두시인 것으로 나타났다. 시각화 분석에 따르면 공원 및 레저 시설, 업무시설에서 주로 체류 지점이 나타났다. 체류 지점을 고려하기 위하여 기존의 대여소 기반이 아닌 육각격자를 분석단위로 설정하였으며, 영과잉 음이항(Zero-Inflated Negative Binomial, ZINB) 모형을 이용하여 체류 지점을 고려한 통행발생량을 추정하였다. 분석결과, 자전거전용도로 및 자전거·보행자겸용도로(분리형)와 같이 자전거 이용자의 안전이 확보된 자전거 인프라에서 통행발생량 및 체류 지점에서 발생한 통행이 많은 것으로 나타났다. 또한 공공자전거는 대중교통의 접근수단으로서 퍼스트&라스트 마일 수단의 역할을 하며, 생활중심지와 고용중심지에서 통행발생량이 커지는 것으로 나타났다. 이러한 분석 결과를 토대로 자전거 인프라의 추가 확충 계획 시 이용자의 안전시설 및 공간 확보가 우선돼야 하며, 대중교통과 연계한 자전거 인프라 시설 보급방안의 수립이 필요한 것으로 보인다.

Threshold-asymmetric volatility models for integer-valued time series

  • Kim, Deok Ryun;Yoon, Jae Eun;Hwang, Sun Young
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.295-304
    • /
    • 2019
  • This article deals with threshold-asymmetric volatility models for over-dispersed and zero-inflated time series of count data. We introduce various threshold integer-valued autoregressive conditional heteroscedasticity (ARCH) models as incorporating over-dispersion and zero-inflation via conditional Poisson and negative binomial distributions. EM-algorithm is used to estimate parameters. The cholera data from Kolkata in India from 2006 to 2011 is analyzed as a real application. In order to construct the threshold-variable, both local constant mean which is time-varying and grand mean are adopted. It is noted via a data application that threshold model as an asymmetric version is useful in modelling count time series volatility.

발명자 네트워크의 공간적 결정요인 분석 (An Analysis of Spatial Determinants of Inventor Networks in Korea)

  • 정준호
    • 한국경제지리학회지
    • /
    • 제19권1호
    • /
    • pp.1-17
    • /
    • 2016
  • 본 논문은 내국인 특허출원 자료에서 복수 발명자들의 주소지들을 파악하고 가산자료의 특성을 통제할 수 있는 영과잉 음이항 회귀모형을 사용하여 230개 시군구 간 발명자 네트워크의 공간구조와 그것의 결정요인을 분석한다. 발명자 네트워크의 공간적 연계에 영향을 미치는 몇 가지 요인들이 확인된다. 이출지역이 민간 R&D, 고등교육수준, 인구규모, 특허 생산성 등과 같은 R&D 관련 지역 특수적 자산들을 많이 보유하면 동태적인 수요효과를 통해 공간적 연계는 다른 지역으로 확대된다. 그리고 물리적 거리뿐만 아니라 기술적 거리에서도 거리조락현상이 나타난다. 이입지역이 R&D 관련 지역 특수적 자산을 많이 보유하면 유사한 논리로 공간적 연계에서 정(+)의 효과가 발생한다.

  • PDF

사업체노동력조사를 활용한 빈 일자리 수 추정에 대한 정합성 연구 (A Study of Consistency in Estimating the Number of Vacant Jobs Using the Labor Force Survey at Establishments)

  • 박승환
    • 아태비즈니스연구
    • /
    • 제13권3호
    • /
    • pp.329-341
    • /
    • 2022
  • Purpose - The purpose of this study was to investigate consistency in estimating the number of vacant jobs using the two business labor force survey with two different time points of survey. Design/methodology/approach - We studied the cause of the differences in estimating the number of vacant jobs between the monthly sample and the new sample in business labor force survey. Findings - To summarize our findings, As the size of the company increases, the number of vacant jobs in the company also increases, and the probability that the number of vacant jobs in the company is zero decreases. The monthly sample was assessed to have a higher likelihood that the number of vacant jobs in the company was zero and the number of vacant jobs was considerable compared to the local sample. Research implications or Originality - Because local survey sample companies tend to minimize the number of vacant jobs even when they reply under the same conditions, the estimation result of the number of vacant jobs in the current monthly survey differs significantly from the estimation result of the local survey. Divergent "degrees of knowledge of question items," survey methodologies, or investigators could be the causes of the various response trends.