• 제목/요약/키워드: negative binomial distribution

검색결과 82건 처리시간 0.03초

인터넷 이용자들의 웹사이트 재방문 빈도에 관한 실증적 연구 (An Empirical Study of Customer's Repeat Visit Frequency on the Internet)

  • 이석규
    • 마케팅과학연구
    • /
    • 제11권
    • /
    • pp.129-146
    • /
    • 2003
  • 본 연구는 소비자들의 선택모형에서 널리 사용된 NBD (Negative Binomial Distribution) 타입의 계랑적 모델 접근법이 온라인 상에서 소비자들이 특정한 기업의 웹사이트를 방문하는 행위를 설명하는데 적용될 수 있는지를 탐구한다. 본 연구에서는 다음의 두 가지 연구 주제를 다루고 있다. 첫째, 소비자들이 웹사이트를 반복하여 방문하는 행위의 빈도에 관한 분포를 확률적으로 규정하며, 둘째로는 그러한 소비자들의 반복된 이용빈도의 분포에 소비자들의 일반적인 인터넷 사용패턴과 인구 통계적인 변수들이 어떤 영향을 미치는지를 조사하고 있다. 일련의 실증적 분석을 통하여, 이 논문은 마케팅의 선택모형 (Choice Model)들에서 널리 사용된 NBD 타입의 모댈들이 인터넷상의 사이트 방문빈도 연구에도 잘 적용될 수 있음을 보여주고 있다. 그리고 이 연구는 이러한 소비자들의 이용빈도에 관한 모델개발이 온라인 기업의 당면문제에 어떠한 영향을 미치는 지를 설명한다. 특히 본 연구는 반복된 이용빈도와 소비자들의 일반적인 인터넷사용 특징 및 인구 통계적인 변수들과의 상호관계를 규명했다. 본 연구에서 제시된 모델들을 추정하고 검정하기 위해 800,000번의 방문 기록과 1000개 이상의 상이한 방문사이트 수로 구성된 웹 패널 데이터를 사용하여 실증분석을 연구에서 제시하는 모델을 개발하고 검증하였다.

  • PDF

영-과잉 회귀모형을 활용한 폭염자료분석 (Heat-Wave Data Analysis based on the Zero-Inflated Regression Models)

  • 김성태;박만식
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2829-2840
    • /
    • 2018
  • 음이 아닌(non-negative) 측정값을 가지는 확률변수에 있어서, 영(0)이 과도하게 측정되는 자료를 반연속형(semi-continuous) 자료와 영-과잉(zero-inflated) 자료로 구분한다. 이러한 자료에서는 특정 확률 분포(probability distribution) 하에서의 확률보다 훨씬 큰 확률로 0을 관측하게 되는데, 연속형(continuous) 확률분포를 고려하는 경우에는 반연속형으로, 이산형(discrete) 확률분포를 고려하는 경우에는 영-과잉이라고 한다. 본 연구에서는 경계값(0)의 측정 여부에 관한 모형과 0보다 큰 확률변수에 대한 확률분포를 활용한 모형 등 두 개의 부문으로 이루어진 모형, 즉 2-부문 모형(two-part model)을 소개하고자 한다. 특히, 이산형 확률분포 중 포아송 분포와 음이항 분포를 고려한 영-과잉 회귀모형(regression model)을 설명하고 그 특성을 파악하고자 한다. 실증연구에서는 이러한 영-과잉 회귀모형을 활용하여 지난 10년(2009년부터 2018년) 간 한국의 여름철(6-8월) 폭염주의보(heat-wave advisory) 및 폭염경보(heat-wave warning) 발생일수를 적합하였다. 또한 공간예측기법 중 하나인 범용크리깅(universal kriging)을 이용하여 적합결과를 바탕으로 한 폭염 발생일수에 대한 예측지도를 작성하였다.

HIV 감염인의 진단 후 치료 시작에 영향을 미치는 요인 (Factors Influencing the Initiation of Treatment after the Diagnosis of Korean Patients with HIV)

  • 심미소;김광숙;박창기
    • 지역사회간호학회지
    • /
    • 제29권3호
    • /
    • pp.279-289
    • /
    • 2018
  • Purpose: This study has been conducted to identify factors that influence the initiation of treatment after the diagnosis of Korean patients with HIV. Methods: A cross-sectional study design was used, and 290 patients with HIV from outpatient departments of 7 hospitals participated. Self-report questionnaires included items on the days from the primary diagnosis to the initiation of treatment, and the patients' demographic and disease related characteristics. Negative binomial regression model (NBR) was utilized to determine risk factors influencing the initiation of treatment after the diagnosis of the patients with HIV. Results: The skewness of days was 6.62, and the degree of asymmetry of distribution was severe. In NBR, patients who were in their 40s and 50s, female, unmarried and living with their family, jobless, in a middle or high level of economic status, and diagnosed before 2014 showed a higher risk of delayed treatment than patients who were younger, male, married and living with family, in a low level of economic status, and diagnosed in 2014 or afterwards. Conclusion: The findings suggest the necessity of intervention to promote HIV patients' early entry into treatment based on the participants' characteristics.

성인의 신체활동 정도가 의료이용에 미치는 영향 (Impact of Level of Physical Activity on Healthcare Utilization among Korean Adults)

  • 김지윤;박승미
    • 대한간호학회지
    • /
    • 제42권2호
    • /
    • pp.199-206
    • /
    • 2012
  • Purpose: This study was done to identify the impact of physical activity on healthcare utilization among Korean adults. Methods: Drawing from the 2008 Korean National Health and Nutrition Examination Survey (NHANES IV-2), data from 6,521 adults who completed the Health Interview and Health Behavior Surveys were analyzed. Association between physical activity and healthcare utilization was tested using the $X^2$-test. Multiple logistic regression analysis was used to calculate the odds ratios of using outpatient and inpatient healthcare for different levels of physical activity after adjusting for predisposing, enabling, and need factors. A generalized linear model applying a negative binomial distribution was used to determine how the level of physical activity was related to use of outpatient and inpatient healthcare. Results: Physically active participants were 16% less likely to use outpatient healthcare (OR, 0.84; 95% CI, 0.74-0.97) and 23% less likely to use inpatient healthcare (OR, 0.77; 95% CI, 0.63-0.93) than physically inactive participants. Levels of outpatient and inpatient healthcare use decreased as levels of physical activity increased, after adjusting for relevant factors. Conclusion: An independent association between being physically active and lower healthcare utilization was ascertained among Korean adults indicating a need to develop nursing intervention programs that encourage regular physical activity.

패밀리레스토랑 방문수요 결정요인 및 대체관계 분석 (Analysis on Determinant & Substitutive Relationship for Family Restaurant's Visit Demand)

  • 유창근;윤동환;이민석
    • 한국콘텐츠학회논문지
    • /
    • 제11권3호
    • /
    • pp.418-427
    • /
    • 2011
  • 본 연구는 국내의 4개의 주요한 패밀리레스토랑를 이용한 경험이 있는 고객을 대상으로 방문횟수에 따른 수요 결정요인과 레스토랑 간 대체성을 살펴보고자 하였다. 방문 수요 결정요인으로는 인구통계적 특성, 패밀리레스토랑 브랜드 이미지, 레스토랑 이용횟수의 비율에 따라 유의적인 영향관계를 보이고 있으며 또한 편상관분석을 통한 경쟁관계의 레스토랑의 대체성을 확인하였다. 이러한 결과는 레스토랑 방문횟수에 영향을 주는 결정요인을 파악함으로서 레스토랑의 마케팅방향을 설정하고 경쟁 레스토랑 간의 경쟁관계를 살펴봄으로서 레스토랑의 경쟁력을 키울 수 있는 계기를 마련하는데 도움을 줄 수 있다.

고속도로 평면선형상 사고빈도분포 추정을 통한 음이항회귀모형 개발 (기하구조요인을 중심으로) (Fitting Distribution of Accident Frequency of Freeway Horizontal Curve Sections & Development of Negative Binomial Regression Models)

  • 강민욱;도철웅;손봉수
    • 대한교통학회지
    • /
    • 제20권7호
    • /
    • pp.197-204
    • /
    • 2002
  • 교통사고예측 및 예방을 위해서는 실제적으로 도로설계과정에서 제어가 가능한 도로 기하구조요소에 대한 사고관계를 파악함이 타당하다. 즉, 도로의 설계자는 도로건설에 앞서 기하구조요소와 사고와의 관계를 현장자료를 통해 정확히 밝혀 도로설계에 반영해야 한다. 이를 위해, 교통사고의 빈도분포를 박히는 것은 가장 기본이 되는 일이며, 교통사고 예측모형개발에 선행되어야 한다. 일반적으로 교통사고건수의 경우 분산이 평균보다 큰 과분산(overdispersion)의 특징을 가지고 있어 음이항 분포를 따른다고 알려져 있다. 따라서 본 논문은 사고모형의 개발에 앞서, 사고발생지점에 대한 도로설계요소와 기타 잠재적인 사고발생 관련요인이 비교적 잘 파악되어있는 호남고속도로를 중심으로 평면 선형상 곡선부에 대하여 교통사고의 분포를 적합도 검정을 통해 알아보고자 하였다. 사고자료는 한국도로송사의 호남고속도로 5년(1996∼2000)간 자료를 분석에 맞게 정리하였으며, 강민욱과 송봉수(2002)에서 제시한 평면선형에 있어서의 구간분할법을 이용하여 배향곡선구간과 단일곡선구간에 대한 사고분석을 하였다. 적합도 분석결과, 예상대로 음이항분포가 사고건수를 설명하기에 가장 적합한 확률분포로 제시되었으며, 이를 통해 최우추정법을 이용한 음이항회귀모형을 개발하였다. 구간분할법을 적용한 음이항회귀모형의 경우, 기존의 확률회귀토형에 비하여 높은 결정계수를 갖았으며, 모형에서 적용된 기하구조요소로는 차량 노출계수, 곡선반경, 단위거리 당 편경사변화값 등이다.

Inward Technology Licensing, Financial Slack, and Internal Innovation in New Technology-Based Firms Located in Isolated Areas

  • JANG, Yongseok;HADLEY, Brandy;LEE, Woo Jin
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제6권2호
    • /
    • pp.173-181
    • /
    • 2019
  • The paper aims to evaluate the combination of strategies that influence the success of New Technology Based Firms (NTBFs) located in isolated areas with resource constraints. We utilize the Kauffman Firm Survey to construct a subset of 224 firms operating in primary metal manufacturing industries and who are located in non-thriving areas. We focus on the impact of technological strategy, in the form of Inward Technology Licensing (ITL), combined with financial strategy, in the form of increased financial slack. Using a negative binomial-specification technique to model these relations, we find that ITL positively impacts internal innovation in the firm and this relation is strengthened by the presence of greater financial slack. This positive impact of financial slack supports the behavioral theory of the firm rather than agency theory in that financial slack enables further innovation rather than stifling it. This research confirms the importance of resource acquisition, suggesting that entrepreneurs may utilize external sources of knowledge in an effort to build a favorable situation when facing the challenges of location. Finally, by presenting evidence showing the compatibility of a financial strategy with a knowledge strategy (ITL), this study emphasizes the importance to entrepreneurs of choosing the proper combination of varying strategies.

Application of discrete Weibull regression model with multiple imputation

  • Yoo, Hanna
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.325-336
    • /
    • 2019
  • In this article we extend the discrete Weibull regression model in the presence of missing data. Discrete Weibull regression models can be adapted to various type of dispersion data however, it is not widely used. Recently Yoo (Journal of the Korean Data and Information Science Society, 30, 11-22, 2019) adapted the discrete Weibull regression model using single imputation. We extend their studies by using multiple imputation also with several various settings and compare the results. The purpose of this study is to address the merit of using multiple imputation in the presence of missing data in discrete count data. We analyzed the seventh Korean National Health and Nutrition Examination Survey (KNHANES VII), from 2016 to assess the factors influencing the variable, 1 month hospital stay, and we compared the results using discrete Weibull regression model with those of Poisson, negative Binomial and zero-inflated Poisson regression models, which are widely used in count data analyses. The results showed that the discrete Weibull regression model using multiple imputation provided the best fit. We also performed simulation studies to show the accuracy of the discrete Weibull regression using multiple imputation given both under- and over-dispersed distribution, as well as varying missing rates and sample size. Sensitivity analysis showed the influence of mis-specification and the robustness of the discrete Weibull model. Using imputation with discrete Weibull regression to analyze discrete data will increase explanatory power and is widely applicable to various types of dispersion data with a unified model.

Human Mastadenovirus Infections and Meteorological Factors in Cheonan, Korea

  • Oh, Eun Ju;Park, Joowon;Kim, Jae Kyung
    • 한국미생물·생명공학회지
    • /
    • 제49권2호
    • /
    • pp.249-254
    • /
    • 2021
  • The study of the impact of weather on viral respiratory infections enables the assignment of causality to disease outbreaks caused by climatic factors. A better understanding of the seasonal distribution of viruses may facilitate the development of potential treatment approaches and effective preventive strategies for respiratory viral infections. We analyzed the incidence of human mastadenovirus infection using real-time reverse transcription polymerase chain reaction in 9,010 test samples obtained from Cheonan, South Korea, and simultaneously collected the weather data from January 1, 2012, to December 31, 2018. We used the data collected on the infection frequency to detect seasonal patterns of human mastadenovirus prevalence, which were directly compared with local weather data obtained over the same period. Descriptive statistical analysis, frequency analysis, t-test, and binomial logistic regression analysis were performed to examine the relationship between weather, particulate matter, and human mastadenovirus infections. Patients under 10 years of age showed the highest mastadenovirus infection rates (89.78%) at an average monthly temperature of 18.2℃. Moreover, we observed a negative correlation between human mastadenovirus infection and temperature, wind chill, and air pressure. The obtained results indicate that climatic factors affect the rate of human mastadenovirus infection. Therefore, it may be possible to predict the instance when preventive strategies would yield the most effective results.

유전자 프로그래밍을 이용한 고속도로 사고예측모형 (A Crash Prediction Model for Expressways Using Genetic Programming)

  • 곽호찬;김동규;고승영;이청원
    • 대한교통학회지
    • /
    • 제32권4호
    • /
    • pp.369-379
    • /
    • 2014
  • 전통적인 사고예측모형은 통계적 회귀분석에 주로 의존하였으나, 이는 자료 분포 및 함수 형태에 대한 가정에 따른 한계를 가지고 있다. 이에 따라 일부 연구는 신경망 등의 비모수적 기법을 모형 구축에 활용하였으나, 이는 독립변수와 종속변수 간의 직접적인 관계 규명이 어렵다는 한계가 있다. 유전자 프로그래밍 기법은 모형 개발에 특별한 가정이 필요없고, 사고요인 규명이 가능하다는 장점이 있다. 따라서 본 연구에서는 고속도로의 사고예측에 유전자 프로그래밍 기법을 적용함으로써 이러한 한계를 극복하고자 하였다. 이를 위하여 경부고속도로에서 최근 3년간(2010-2012년) 구득된 자료를 활용하였으며, 보다 세밀한 사고 특성 규명을 위해 고속도로 구간을 직선 구간과 곡선 구간으로 구분하였다. 사고 발생에 중요한 영향을 미치는 변수를 선택하기 위하여 랜덤 포레스트 기법을 이용하였으며, 최종 선택된 변수들을 활용하여 사고예측을 위한 유전자 프로그래밍 모형을 구축하였다. 구축된 모형의 예측 성능을 평가하기 위해 음이항 회귀모형과 비교해본 결과, 유전자 프로그래밍 모형의 예측 성능이 더 우수한 것으로 나타났다.