• 제목/요약/키워드: Negative Binomial Regression Model

검색결과 113건 처리시간 0.023초

Forecasting of the COVID-19 pandemic situation of Korea

  • Goo, Taewan;Apio, Catherine;Heo, Gyujin;Lee, Doeun;Lee, Jong Hyeok;Lim, Jisun;Han, Kyulhee;Park, Taesung
    • Genomics & Informatics
    • /
    • 제19권1호
    • /
    • pp.11.1-11.8
    • /
    • 2021
  • For the novel coronavirus disease 2019 (COVID-19), predictive modeling, in the literature, uses broadly susceptible exposed infected recoverd (SEIR)/SIR, agent-based, curve-fitting models. Governments and legislative bodies rely on insights from prediction models to suggest new policies and to assess the effectiveness of enforced policies. Therefore, access to accurate outbreak prediction models is essential to obtain insights into the likely spread and consequences of infectious diseases. The objective of this study is to predict the future COVID-19 situation of Korea. Here, we employed 5 models for this analysis; SEIR, local linear regression (LLR), negative binomial (NB) regression, segment Poisson, deep-learning based long short-term memory models (LSTM) and tree based gradient boosting machine (GBM). After prediction, model performance comparison was evelauated using relative mean squared errors (RMSE) for two sets of train (January 20, 2020-December 31, 2020 and January 20, 2020-January 31, 2021) and testing data (January 1, 2021-February 28, 2021 and February 1, 2021-February 28, 2021) . Except for segmented Poisson model, the other models predicted a decline in the daily confirmed cases in the country for the coming future. RMSE values' comparison showed that LLR, GBM, SEIR, NB, and LSTM respectively, performed well in the forecasting of the pandemic situation of the country. A good understanding of the epidemic dynamics would greatly enhance the control and prevention of COVID-19 and other infectious diseases. Therefore, with increasing daily confirmed cases since this year, these results could help in the pandemic response by informing decisions about planning, resource allocation, and decision concerning social distancing policies.

온라인 리뷰의 감성과 독해 용이성이 리뷰 유용성에 미치는 영향: 가산형 리뷰 유용성 정보 활용 (The Effects of Sentiment and Readability on Useful Votes for Customer Reviews with Count Type Review Usefulness Index)

  • 루스 안젤리 크루즈;이홍주
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.43-61
    • /
    • 2016
  • 온라인 쇼핑몰의 상품에 대한 고객 리뷰는 구매자들의 구매 의사결정에 영향을 미치고 있으며 중요한 구전효과의 원천과 의사결정의 정보 원천의 역할을 하고 있다. 한 제품에 대한 리뷰가 무척 많기에 온라인 쇼핑몰들은 고객 리뷰 평가 방안을 도입하였고, 이를 통해 고객들에게 유용하리라고 판단되는 리뷰들을 걸러서 보여주거나 강조할 수 있게 되었다. 리뷰 평가 방안은 해당 리뷰가 도움이 되었는지 혹은 도움이 되지 않았는 지를 리뷰를 읽은 고객이 평가하게 하는 방안이다. Amazon.com은 고객 평가를 바탕으로 총 투표 수 중에서 유용하다는 투표 수의 비율을 리뷰 유용성 지표로 삼고 있으며, Yelp.com은 유용하다는 투표 수 자체를 유용성 지표로 삼고 있다. 본 연구는 고객 리뷰의 감성과 독해 용이성이 리뷰의 유용성에 미치는 영향을 파악하고자 한다. Amazon.com의 고객 리뷰 자료를 활용하여 비율형 유용성 지표를 종속변수로 하는 유사한 연구들이 수행되어 왔다. 본 연구에서는 Yelp.com의 리뷰 자료를 활용하여 가산형 리뷰 유용성 지표인 경우에도 동일한 효과가 존재하는지를 검토하고자 한다. Yelp.com의 음료와 음식 카테고리에 해당하는 업종에 대한 리뷰를 자료로 활용하였으며, 점포의 명성과 인기도 데이터를 파악할 수 있는 170,294개의 리뷰를 분석에 활용하였다. 분석결과는 리뷰의 긍정 정도는 유용 투표수를 늘리는데 음의 영향을 미쳤다. 평가가 긍정적인 리뷰에서는 음의 영향관계가 유의 하였으나, 평가가 부정적인 리뷰에서는 리뷰의 긍정 정도가 유용 투표 수에 미치는 영향은 유의하지 않았다. 독해 용이성은 리뷰가 읽기 어려울 수록 높은 값을 갖으며, 독해의 어려운 정도는 유용 투표수 획득에 음의 영향을 미쳤다. 독해 용이성은 긍정 리뷰, 부정 리뷰 관계없이 모두 음의 영향을 미치는 것으로 분석되었다. 이 결과는 유용 투표수가 0인 리뷰를 포함하여 영과잉 음이항 회귀분석을 수행한 경우와 유용 투표수가 0인 리뷰를 제외하고 음이항 회귀분석을 수행한 경우 모두 동일하게 파악되었다.

가산자료모형을 기초로 한 통행행태의 한계효과분석 (Marginal Effect Analysis of Travel Behavior by Count Data Model)

  • 장태연
    • 대한교통학회지
    • /
    • 제21권3호
    • /
    • pp.15-22
    • /
    • 2003
  • 교통수요예측의 통행발생단계에서 일반적으로 선형회귀모형이 활용되고 있다. 이러한 선형회귀모형은 여러가지 방법론적 한계성과 실용적 지속성을 가지지 못하는 경향을 보인다. 첫째, 종속변수로 이용되는 통행발생의 경우 비음정수(non-negative integer : 0, 1, 2 등)의 이산분포특징을 보이나, 선형회귀모형에서는 종속변수가 연속확률분포 인 정규분포의 특징을 가진 것으로 가정한다. 둘째, 모형이 자료측정에 적용되었을 때 음(-)의 결과를 산정 할 수 있으며, 독립변수의 증감에 따라 결과 값을 너무 높게 혹은 낮게 예측하는 경우가 있다 셋째, 예측된 값이 정상적인 범위 내에 있을 지라도 예측된 통행수만을 제시 할 뿐, 통행발생빈도에 대한 이산확률분포는 제공하지 않는다. 이같은 한계점을 극복하기 위해 주로 활용되어온 가산자료모형이 포와송모형이다. 그러나 포와송모형의 경우 자료의 평균과 분산이 동일하다는 가정하에 활용되고 있어 자료상에 과산포가 존재할 경우 오차를 과소평가 할 경향이 높아 모형의 신뢰성에 문제가 발생됨으로 기타 다른 가산자료모형의 적용을 고려해야한다. 연구에서는 과산포검정을 통해 통행발생빈도상에 과산포 존재를 밝혀내고 포와송모형의 부적합함을 제시하였으며 Vuong 검정을 통해 최적의 모형을 선정하였다. 선정된 모형을 대상으로 우도비검정과 Theil 부등계수에 의해 모형의 신뢰도와 정확성을 조사하였다. 최종적으로 가구의 사회경제적 속성의 변화에 따른 통행발생의 변화를 측정하기 위한 민감도 분석을 실시하였다.

HIV 감염인의 진단 후 치료 시작에 영향을 미치는 요인 (Factors Influencing the Initiation of Treatment after the Diagnosis of Korean Patients with HIV)

  • 심미소;김광숙;박창기
    • 지역사회간호학회지
    • /
    • 제29권3호
    • /
    • pp.279-289
    • /
    • 2018
  • Purpose: This study has been conducted to identify factors that influence the initiation of treatment after the diagnosis of Korean patients with HIV. Methods: A cross-sectional study design was used, and 290 patients with HIV from outpatient departments of 7 hospitals participated. Self-report questionnaires included items on the days from the primary diagnosis to the initiation of treatment, and the patients' demographic and disease related characteristics. Negative binomial regression model (NBR) was utilized to determine risk factors influencing the initiation of treatment after the diagnosis of the patients with HIV. Results: The skewness of days was 6.62, and the degree of asymmetry of distribution was severe. In NBR, patients who were in their 40s and 50s, female, unmarried and living with their family, jobless, in a middle or high level of economic status, and diagnosed before 2014 showed a higher risk of delayed treatment than patients who were younger, male, married and living with family, in a low level of economic status, and diagnosed in 2014 or afterwards. Conclusion: The findings suggest the necessity of intervention to promote HIV patients' early entry into treatment based on the participants' characteristics.

성인의 신체활동 정도가 의료이용에 미치는 영향 (Impact of Level of Physical Activity on Healthcare Utilization among Korean Adults)

  • 김지윤;박승미
    • 대한간호학회지
    • /
    • 제42권2호
    • /
    • pp.199-206
    • /
    • 2012
  • Purpose: This study was done to identify the impact of physical activity on healthcare utilization among Korean adults. Methods: Drawing from the 2008 Korean National Health and Nutrition Examination Survey (NHANES IV-2), data from 6,521 adults who completed the Health Interview and Health Behavior Surveys were analyzed. Association between physical activity and healthcare utilization was tested using the $X^2$-test. Multiple logistic regression analysis was used to calculate the odds ratios of using outpatient and inpatient healthcare for different levels of physical activity after adjusting for predisposing, enabling, and need factors. A generalized linear model applying a negative binomial distribution was used to determine how the level of physical activity was related to use of outpatient and inpatient healthcare. Results: Physically active participants were 16% less likely to use outpatient healthcare (OR, 0.84; 95% CI, 0.74-0.97) and 23% less likely to use inpatient healthcare (OR, 0.77; 95% CI, 0.63-0.93) than physically inactive participants. Levels of outpatient and inpatient healthcare use decreased as levels of physical activity increased, after adjusting for relevant factors. Conclusion: An independent association between being physically active and lower healthcare utilization was ascertained among Korean adults indicating a need to develop nursing intervention programs that encourage regular physical activity.

전방신호기가 교통사고에 미치는 영향 연구 (Impacts of Pre-signals on Traffic Crashes at 4-leg Signalized Intersections)

  • 김병은;이영인
    • 한국도로학회논문집
    • /
    • 제15권4호
    • /
    • pp.135-146
    • /
    • 2013
  • PURPOSES : This study aimed to analyze the impact the operation of pre-signals at 4-leg signalized intersections and present primary environmental factors of roads that need to be considered in the installation of pre-signals. METHODS : Shift of proportions safety effectiveness evaluation method which assesses shifts in proportions of target collision types to determine safety effectiveness was applied to analyze traffic crash by types. Also, Empirical Bayes before/after safety effectiveness evaluation method was adapted to analyze the impact pre-signal installation. Negative binomial regression was conducted to determine SPF(safety performance function). RESULTS : Pre-signals are effective in reducing the number of head on, right angle and sideswipe collisions and both the total number of personal injury crashes and severe crashes. Also, it is deemed that each factor used as an independent variable for the SPF model has strong correlation with the total number of personal injury crashes and severe crashes, and impacts general traffic crashes as a whole. CONCLUSIONS: This study suggests the following should be considered in pre-signal installation on intersections. 1) U-turns allowed in the front and rear 2) A high number of roads that connect to the intersection 3) Many right-turn traffic flows 4) Crosswalks installed in the front and rear 5) Insufficient left-turn lanes compared to left-turn traffic flows or no left-turn-only lane.

고령운전자 운전 및 신체특성을 반영한 교통사고 분석 연구 (Analysis of Elderly Drivers' Accident Models Considering Operations and Physical Characteristics)

  • 임삼진;박준태;김영일;김태호
    • 대한교통학회지
    • /
    • 제30권6호
    • /
    • pp.37-46
    • /
    • 2012
  • 65세 이상 고령운전자의 경우 지난 10년 새 교통사고건수는 3만 7,000건에서 27만 4,000건으로 무려 640.5% 증가되었다. 이는 전체사고에서 차지하는 비율이 1.2%에서 3.1배 증가한 3.7%를 차지하고 있는 것으로 교통안전 관련기관에서는 여러 대책을 강구하고 있다. 무엇보다 고령운전자의 행동특성 및 신체특성에 대한 심층연구를 통해 안전대책과 연계하는 방안이 중요하다 할 수 있다. 본 연구에서는 고령운전자의 행동특성을 측정할 수 있는 운전자 적성검사(Driving Aptitude) 항목과 교통사고 자료를 토대로 고령운전자 운전특성과 사고특성을 연결한 실증연구를 수행하였다. 영향모형 개발을 위해 활용한 방법론은 영과잉 회귀모형을 적용하였고, ZIP 회귀모형과 ZINB 회귀모형에 대하여 베이지안 추론을 이용한 사고예측 모형을 선택하였다. AAE분석결과 ZIP 회귀모형이 적합하며, 3가지 변수속도예측, 주의전환, 인지능력이 고령자사고와 영향관계에 있음을 확인할 수 있었다.

주거지역 가로환경 및 일상 걷기가 정신 건강에 미치는 영향 - 서울시 대상으로 - (Estimation of the Effects of Daily Walking Hours and Days on the Mental Health of Urban Residents - The Case in Seoul -)

  • 구본유;백승주;윤희연
    • 한국조경학회지
    • /
    • 제52권1호
    • /
    • pp.87-100
    • /
    • 2024
  • 본 연구는 도시민의 가로환경 이용을 매개로 하여 주거지역 가로환경 질이 도시민의 정신 건강에 미치는 영향을 밝히고자 하였다. 영과잉 음이항 회귀모형을 통해 보행 활동과 가로환경이 도시민의 우울 증세에 미치는 영향을 확인하였다. 연구 범위는 2017년 대한민국 서울특별시로 한정하였으며, 우울 유병 증세를 종속 변수, 가로환경 변수 및 보행 변수, 개인 특성을 독립 변수로 이용하였다. 나아가, 가로 녹지와 보행 빈도의 상호작용 효과를 살펴, 녹지에서 걷는 행위가 정신 건강에 미치는 상승효과를 분석하였다. 연구 결과, 가로 녹지 면적 비율이 높을수록 우울증세가 나타나지 않았다. 보행 빈도가 높을수록 우울 증세가 나타나지 않거나, 우울 증세가 존재할 경우에도 약하게 나타났다. 또한, 가로 녹지에서의 보행 빈도가 늘어날수록 우울 증세가 약하게 나타나는 상호작용 효과를 확인하였다. 시각적 복잡성은 낮을수록 우울 증세가 나타나지 않았다. 본 연구는 도시민의 정신 건강 문제를 지역사회차원에서 다루는 데에 기여하며, 가로 녹지와 보행 빈도의 시너지 효과를 발견함으로써 주거지역 가로 녹지 환경이 도시민 정신 건강 증진에 미치는 중요성을 강조하였다.

EB기법을 이용한 사고잦은 곳 개선사업 우선순위 판정기법 개발 (Development of Evaluation Model for Black Spot Improvement Priorities by using Emperical Bayes Method)

  • 정성봉;황보희;성낙문;이선하
    • 대한교통학회지
    • /
    • 제27권3호
    • /
    • pp.81-90
    • /
    • 2009
  • 도로 네트워크의 안전 관리는 기본적으로 교통안전 조사를 위한 사이트(교통사고 잦은 지점) 선정, 안전문제에 대한 진단, 잠재적 위험요소들에 대한 가능한 대안 선정, 주어진 예산 제약 하에 대안간의 우선순위 결정과 같은 순서로 이루어진다(Persaud, 2001). 효율적인 안전 조사를 위해 요구되는 지점(교통사고 잦은 지점) 선정에 대한 과정은 매우 중요하다. 이에, 본 연구는 인천시 4지 신호 교차로 중 교통사고 잦은 지점으로 선정된 지점의 3년간(2004~2006년) 사고 자료와 기하구조 자료를 이용하여 EB 기법 이용 시 필요한 사고예측모델을 개발하였다. 또한, 교통사고 잦은 지점을 선정하는데 있어 현재 우리나라에서 적용되고 있는 단순사고건수와 심각도를 고려하여 선정된 우선순위와 단순사고건수 대신 EB 기법을 이용하여 예측된 사고건수를 이용하여 선정된 우선순위 비교를 통해 기존 방법의 한계를 제시하고 합리적인 예측모형 개발 필요성을 보여주고자 하였다. 분석 결과, 총 사고건수 추정 시 기존의 사고 예측 방법인 비선형 회귀모형과 EB 기법의 결과 값 모두 예측력이 높은 것으로 나타났지만 지점별 사고건수 예측력을 함께 고려할 경우엔 EB 기법이 비선형 회귀 모형(포아송)의 결과보다 예측력이 좋은 것으로 나타났다. 또한, 도출된 우선순위 비교 결과 대부분의 지점의 우선순위는 크게 변동이 없었으나, 서해4거리 등 몇 개 지점의 개선우선순위에는 상당한 변동이 발생하는 것으로 나타났다. 이는 실제 사고건수를 이용할 경우 발생하는 RTM문제를 본 연구에서 제안한 기법을 사용할 경우 해결가능하다는 것을 시사한다.

도로 안전성 분석 모형에 관한 연구: 전라북도 국도 권역을 중심으로 (A Study on the Road Safety Analysis Model: Focused on National Highway Areas in Cheonbuk Province)

  • 임준범;김준기;이수범;김현진
    • 대한토목학회논문집
    • /
    • 제34권2호
    • /
    • pp.583-595
    • /
    • 2014
  • 현재 우리나라의 교통정책은 도로의 신설 확장은 지양하고, 도로의 선형 및 시설을 개량하여 안전성을 증대시키고, 친환경적이며 효율적으로 운영할 수 있는 방향으로 나아가고 있다. 이는 국가 도로사업 중 하나인 제2차 국도 5개년계획('06~'10)이 확장 53건(71%), 개량 22건(29%)인 반면, 제3차 국도 5개년계획('11~'15)은 확장 22건(30%), 개량 50건(70%)로 변화된 것으로 나타나고 있다. 이러한 시설개량위주의 도로사업을 좀 더 효과적으로 추진하기 위해서는 도로의 안전성을 객관적이고 과학적으로 판단하여 사업을 선정하고, 사업에 따른 안전성 향상에 대한 평가가 이루어져야 한다고 판단된다. 본 연구는 이러한 도로별 안전성 분석 및 평가를 위한 모형을 개발하는데 목적이 있다. 본 연구의 주요내용은 미국의 HSM (Highway Safety Manual)을 근간으로 하여 한국실정에 맞게 도로의 안전성을 분석하고 평가할 수 있는 모형을 개발하는 것이다. 모형 정립을 위한 데이터 구축은 전라북도 권역 5개 국도호선을 대상으로 기하구조 요인이 동일하다고 판단되는 구간을 동질성 구간으로 구분하였고, 구분된 1,452개 구간에 대하여 도로 기하구조, 시설물, 교통량, 기상상태, 토지이용 등의 대표값을 수집하였다. 수집된 자료는 교통사고와 각 도로요소의 상관관계 분석을 수행하여 어떠한 요인이 교통사고에 큰 영향을 미치는지 분석하였고, 이를 바탕으로 음이항회귀모형으로 사고모형을 정립하였다. 개발된 모형을 가지고 교통량과 도로구간연장을 이용하여 발생사고건수를 예측하는 안전성능함수와 도로기하구조 및 교통특성 등의 변화에 따라 사고빈도 변화를 결정하는 사고수정계수를 도출하였다.