• 제목/요약/키워드: 포아송회귀

검색결과 91건 처리시간 0.019초

식중독 발생 예측모형 (Models for forecasting food poisoning occurrences)

  • 여인권
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권6호
    • /
    • pp.1117-1125
    • /
    • 2012
  • 식중독 발생에 대한 기존 연구에서는 기온과 습도와 같은 기후변수가 주된 설명변수로 취급되어 왔다. 이 논문에서는 주별 식중독 발생건수와 기후변수 간에 관계를 고찰하고 식중독 발생건수를 예측하기 위한 모형으로 포아송 회귀모형과 자기회귀이동평균모형을 비교한다. 비교결과 우리나라 식중독 발생은 시차를 두고 기후 변수에 영향을 많이 받고 있으나 식중독 발생 예측은 이들 변수보다 이전 시점의 식중독 발생 건수에 더 많이 영향을 받는 것으로 나타났으며 포아송 회귀모형은 예측의 관점에서 문제가 있음을 보였다.

0이 팽창된 포아송 회귀모형을 이용한 기부회수 자료의 재분석 (The Reanalysis of the Donation Data Using the Zero-Inflated Possion Regression)

  • 김인영;박태규;김병수
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.819-827
    • /
    • 2009
  • 김인영 등 (2006)은 두 개 포아송 분포의 혼합모형에 기초한 회귀모형으로써 2002년 (사)볼런티어 21에서 실시한 설문조사 자료를 분석하여 우리나라 개인들이 기부한 횟수에 영향을 미치는 유의적 변수들을 식별하였다. 본고에서는 김인영 등 (2006)에서도 언급하였듯이 기부횟수 0의 관찰 빈도와 예측 빈도간 차이가 유독 큰 점을 감안하여, 0이 팽창된 포아송(zero inflated Poisson: ZIP)을 기존의 두 개의 포아송 혼합분포에 추가하여 일종의 세 개 포아송 혼합분포 형태로 모집단 분포를 구성하며 동 모형의 회귀모형으로써 기부횟수 자료를 재분석하고자 한다. 회귀계수에 대한 추정은 두 단계 EM 알고리즘으로 이루어 졌고, 유의적 설명 변수의 검색은 김인영 등 (2006)과 같았으나 본 연구에서는 고정된 령(零)군의 비율을 0.201로 추정할 수 있었으며, 두 가지 유의적 설명변수인 소득과 자원봉사 중에서 자원봉사가 기부 횟수를 늘리는 안정적 도구 변수로써 작용할 수 있음을 보고하고 있다.

An application to Zero-Inflated Poisson Regression Model

  • Kim, Kyung-Moo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권1호
    • /
    • pp.45-53
    • /
    • 2003
  • The Zero-Inflated Poisson regression is a model for count data with exess zeros. When the reponse variables have excess zeros, it is not easy to apply the Poisson regression model. In this paper, we study and simulate the zero-inflated Poisson regression model. An real example was applied to this model. Regression parameters are estimated by using MLE's. We also compare the fitness of zero-inflated Poisson model with the Poisson regression and decision tree model.

  • PDF

영과잉 음이항회귀 모형을 이용한 보험설계사들의 이직횟수 적합 (Fit of the number of insurance solicitor's turnovers using zero-inflated negative binomial regression)

  • 전희주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1087-1097
    • /
    • 2017
  • 본 연구는 계수자료 (count data)를 반응변수로 갖는 포아송회귀 모형, 음이항회귀 모형, 영과잉 포아송회귀 모형, 영과잉 음이항회귀 모형의 4 모형의 비교를 통해 보험 설계사들의 이직횟수 적합을 위한 최적모형을 찾고자 한다. 보험설계사 이직횟수의 분산이 평균보다 큰 과대산포가 존재하고 0인 경우의 비중이 높을 경우에 영과잉 음이항회귀 모형을 적합하는 것이 타당함을 보여주고 보험 설계사들의 이직횟수에 영향을 주는 요인을 규명하고자 한다. 로그우도값, AIC, SBC 등을 고려하여 보험설계사 이직횟수 적합을 최적의 모형은 영과잉 이항모형과 음이항회귀모형의 결합인 영과잉 음이항 모형이 선택되었다. 영과잉 이항모형에 포함된 변수로는 성별, 총 보험설계사 근무연월, 교차모집 설계사 등록, 보유고객 수, 소속회사 유형이었고, 음이항회귀 모형에 포함된 변수로는 직무만족, 조직몰입, 채널경영만족, 총 보험설계사 근무연월, 현 직장에서 근무연월, 소속회사 유형이었다. 영과잉 음이항회귀 모형의 적합결과, 이직횟수에 유의한 영향을 주는 요인으로는 현 직장에서 근무연월, 총 보험설계사 근무연월, 소속회사 유형, 채널경영만족, 직무만족 순으로 나타났다.

포아송 반응을 갖는 로그 선형 회귀 모형에 대한 최우추정량과 모의실험 연구

  • 한정혜;조중재
    • Communications for Statistical Applications and Methods
    • /
    • 제2권1호
    • /
    • pp.22-31
    • /
    • 1995
  • 본 논문에서는 포아송 반응을 갖는 로그 선형 회귀 모형에 붙스트랩 방법을 이용하여, 여러가지 통계적 추론을 위한 유용한 확률적 결과들을 연구.소개하고, 모의실험을 통한 소표본 성질들을 다양하게 제시하고자 한다. 특히 로그 선형 회귀 모형에 대한 최우 추정량 $\hat{\beta_n}$ 및 정보행렬 I(${\beta}_0$)의 추정량들 $I_1(\hat{\beta_n}{\cdot}X)$$I_2(\hat{\beta_n}{\cdot}X)$에 대한 일치성 및 정규성등의 확률적 성질들, 그리고 붙스트랩 방법을 적용한 대표본 성질들과 관련하여 여러가지 모의실험 결과들을 분석.연구하였다.

  • PDF

포아송회귀 모형을 활용한 생명보험 설계사들의 이직 요인 분석 (The factors of insurance solicitor's turnovers of life insurance using Poisson regression)

  • 전희주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1337-1347
    • /
    • 2016
  • 본 연구는 생명보험사의 핵심 영업채널의 역할을 하고 있는 보험설계사들에 대한 설문을 바탕으로 보험설계사들의 이직횟수에 영향을 주는 요인을 찾고자 한다. 반응변수 이직횟수는 계수자료 (count data)이기에 일반화선형모형의 하나인 포아송회귀모형을 통해 분석된다. 현 조직에서의 보험설계사 근무경력은 보험설계사의 이직횟수에 직접적인 영향을 주는 변수로 본 연구모형에서는 통제변수로 설정되었다. 포아송회귀모형 적합결과, 보험설계사 이직의 횟수에 가장 큰 영향을 주는 요인은 현재 속한 회사 (대리점)으로 나타났으며, 다음으로 연령, 보험설계사로 입사하게 된 동기, 월평균 소득, 월평균 신계약건수, 최종학력 순으로 나타났다. 보험설계사가 현재의 속한 조직이 대형생보사이면 이직의 횟수가 가장 낮고, GA (general agent, 독립대리점) 소속이면 이직의 횟수가 높아지는 경향을 보이고 있다. 연령은 적을수록 이직의 횟수는 증가하고 연령이 많을수록 이직의 횟수는 작아짐을 보여주었다. 보험설계사로 입사하게 된 동기는 친구, 친척, 가족 등 지인의 추천과 동료FP, 소장, 지점장 등의 권유이면 이직의 횟수는 작게 나타났고 단순한 경제적 수입의 니즈와 능력과 적성이 부합의 자발적인 경우는 오히려 이직의 횟수는 높게 나타났다.

포아송 회귀분석을 이용한 해운선사의 블랭크 세일링 영향 분석 연구 (A study on the impact analysis of blank sailing in the shipping industry using poisson regression analysis)

  • 류원형;최봉근;김정훈;박신우;남형식
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2023년도 추계학술대회
    • /
    • pp.120-121
    • /
    • 2023
  • 최근에 해운산업의 수요와 공급이 지속적으로 일치하지 않으면서 불균형 현상이 이어지고 있다. 이에 따라 해운선사들은 선박의 공급량을 조절하기 위해 블랭크 세일링을 실시하며 수요와 공급의 균형을 맞추고 있다. 블랭크 세일링은 화물 운송을 지연시키는 부정적인 연쇄효과를 발생시키기 때문에 본 연구에서는 포아송 회귀분석을 이용하여

  • PDF

양적 확률화응답을 이용한 회귀추정에 관한 연구 (A Study on Randomized Response Regression Estimate from Quantitative Data)

  • 최경호
    • 응용통계연구
    • /
    • 제12권2호
    • /
    • pp.527-535
    • /
    • 1999
  • 양적 확률응답을 이용한 민감사안에 대한 평균이나 분석의 추정시 보조정보를 활용한 회귀추정법에 대해서 언급하고, 유도된 회귀추정량과 Greenberg et al.의 추정량 그리고 비추정량과의 비교의 통하여 회귀추정량이 효율적일 수 있는 조건을 찾았다. 또한 각 질문에 대한 응답의 분포가 포아송 분포인 경우 회귀추정량의 효율이 증대될 수 있는 조건에 대해서도 논하였다.

  • PDF

식중독 발생 건수에 대한 계층 시계열 예측 (Forecasting hierarchical time series for foodborne disease outbreaks)

  • 여인권
    • 응용통계연구
    • /
    • 제37권4호
    • /
    • pp.499 -508
    • /
    • 2024
  • 이 연구에서는 식중독 발생건수를 원인물질별로 나눈 자료와 합한 자료를 별개로 분석하여 예측값을 유도한 후 계층구조를 만족하도록 하는 계층 시계열 예측에 대해 알아본다. 원인물질별 식중독 방생건수는 영과잉 포아송 회귀모형과 음이항 회귀모형으로 분석하고 합한 식중독 발생건수 포아송 회귀모형과 음이항 회귀모형으로 분석한다. 계층 시계열 예측을 위해 최적결합 중 하나인 Wickramasuriya 등 (2019)의 MinT 추정이 사용되었다. 계층조정 과정에서 발생한 음의 예측값은 0으로 수정하고 나머지 최하위 변수에 가중치를 곱해 계층구조를 만족시킨다. 실증분석 결과를 보면 원인물질별 예측에서는 계층조정을 한 결과와 하지 않은 결과에 차이가 거의 없었으나 주요, 기타 및 전체에 대한 예측에서는 계층조정 한 결과가 대체로 우수한 것으로 나타났다. 중요한 것은 계층조정을 하지 않으면 최하위 변수의 예측빈도가 주요나 기타의 예측빈도 보다 큰 경우도 발생하지만 제안된 방법을 적용하면 계층구조를 이루는 예측값을 얻을 수 있다.

반복측정된 포아송 자료의 GEE 분석에서 산포모수의 역할에 관한 연구

  • 박태성;신민웅
    • Communications for Statistical Applications and Methods
    • /
    • 제2권2호
    • /
    • pp.155-165
    • /
    • 1995
  • 반복측정자료의 분석을 위해 제안된 Liang and Zeger(1986)의 회귀모형은 일반화추정식(generalized estimationg equations, GEE)을 이용하여 모형의 모수를 추정한다. 이 모형은 반복측정된 반응변수와 설명변수들과의 관계를 추정하는 것이 주된 목적이기 때문에 회귀모수는 중요한 모수로 간주되나 산포모수는 중요하지 않은 장애모수(nuisance parameters)로 간주된다. 일반적으로 GEE 분석에서 회귀모수의 추정량은 산포모수에 상관없이 일치적(consistent)으로 얻어진다고 알려져 있다. 그러나 본 논문에서는 포아송분포를 따르는 반복측정자료에 대한 사례연구와 모의 실험을 통해서 일반적으로 믿어져왔던 것과는 달리 GEE 방법이 산포모수에 민감하게 영향을 받고 있음을 보였다. 특히 산포모수의 값이 일정하지 않은 경우에는 GEE 방법이 산포모수에 민감 하게 영향을 받고 있음을 보였다. 특히 산포모수의 값이 일정하지 않은 경우에는 GEE 방법에서 밝혀진 회귀모수 추정량의 일치성에도 문제가 발생할 수 있음을 보였다.

  • PDF