• 제목/요약/키워드: 포아송의 혼합분포

검색결과 13건 처리시간 0.025초

0이 팽창된 포아송 회귀모형을 이용한 기부회수 자료의 재분석 (The Reanalysis of the Donation Data Using the Zero-Inflated Possion Regression)

  • 김인영;박태규;김병수
    • 응용통계연구
    • /
    • 제22권4호
    • /
    • pp.819-827
    • /
    • 2009
  • 김인영 등 (2006)은 두 개 포아송 분포의 혼합모형에 기초한 회귀모형으로써 2002년 (사)볼런티어 21에서 실시한 설문조사 자료를 분석하여 우리나라 개인들이 기부한 횟수에 영향을 미치는 유의적 변수들을 식별하였다. 본고에서는 김인영 등 (2006)에서도 언급하였듯이 기부횟수 0의 관찰 빈도와 예측 빈도간 차이가 유독 큰 점을 감안하여, 0이 팽창된 포아송(zero inflated Poisson: ZIP)을 기존의 두 개의 포아송 혼합분포에 추가하여 일종의 세 개 포아송 혼합분포 형태로 모집단 분포를 구성하며 동 모형의 회귀모형으로써 기부횟수 자료를 재분석하고자 한다. 회귀계수에 대한 추정은 두 단계 EM 알고리즘으로 이루어 졌고, 유의적 설명 변수의 검색은 김인영 등 (2006)과 같았으나 본 연구에서는 고정된 령(零)군의 비율을 0.201로 추정할 수 있었으며, 두 가지 유의적 설명변수인 소득과 자원봉사 중에서 자원봉사가 기부 횟수를 늘리는 안정적 도구 변수로써 작용할 수 있음을 보고하고 있다.

이변량 영과잉-포아송 분포의 적률 (Moments of the Bivariate Zero-Inflated Poisson Distributions)

  • 김경무;이성호;김종태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제9권1호
    • /
    • pp.47-56
    • /
    • 1998
  • 영과잉-포아송모형는 포아송분포와 베르누이 분포의 혼합모형으로 볼 수 있다. 최근 기술의 발달로 생산공정에서 불량품이 거의 나타나지 않는 경우가 많아 기존의 포아송 분포 보다 영과잉-포아송 분포가 많이 응용되어 진다. 일변량 영과잉-포아송 분포를 이변량 영과잉-포아송 분포로 확장하는 일은 다변량으로 확장하기 위한 전초작업으로 중요하다. 본 논문에서는 세가지 형태의 이변량 영과잉-포아송 분포를 제시하고 이들 분포의 적률을 구하여보았다. 또한 적률을 이용하여 세가지 분포를 비교하여 보았다.

  • PDF

포아송 분포의 혼합모형을 이용한 기부 횟수 자료 분석 (The Analysis of the Number of Donations Based on a Mixture of Poisson Regression Model)

  • 김인영;박수범;김병수;박태규
    • 응용통계연구
    • /
    • 제19권1호
    • /
    • pp.1-12
    • /
    • 2006
  • 본 논문에서는 2002년에 (사)볼런티어21에서 실시한 설문조사 자료를 이용하여 2001년에 우리나라 개인들이 기부한 횟수에 영향을 주는 유의한 변수들을 식별하였다. 기부횟수의 경험적 분포로 미루어 모집단은 기부를 적게 하는 집단과 많이 하는 집단으로 구성되며 따라서 모집단 분포를 두개 포아송 분포의 혼합분포로 모형화하였다. 이 모형에 기초하여 기부횟수에 영향을 미치는 변수들을 식별하였다. EM알고리즘을 이용하여 모수를 추정하고 2.5%와 97.5%에 기초한 백분위수 신뢰구간을 보완한 BCa(bias-corrected and accelerated) 신뢰구간을 계산하여 유의한 변수들을 찾았다. 연구결과 혼합 포아송 회귀모형에서는 기부횟수가 적은 집단("작은 군")과 기부횟수가 많은 집단("큰 군") 모두에서 소득과 자원봉사의 경험 유무(1:예, 0:아니오)가 기부횟수에 유의적으로 영향을 주는 변수로 밝혀졌다. 또한 두 변수 각각에서 회귀계수가 양수로 나타나 소득이 많을수록, 혹은 자원봉사의 경험이 있는 사람일수록 기부횟수가 증가하는 것을 알 수 있다. 그러나 소득과 자원봉사 변수의 회귀계수는 "작은 군"이 "큰 군"에 비해 더욱 크게 나타나고 있다. "작은 군"보다 "큰 군"의 사람들에게 기부가 생활화되어 있고, 따라서 소득과 자원봉사의 경험 유무가 기부횟수에 미치는 영향이 상대적으로 적은 것으로 파악된다.

포아송으로부터 부의 이항분포로의 이탈에 대한 검정통계량의 확장 (On the Extension of Test Statistics for Detecting Negative Binomial Departures from the Poisson Assumption)

  • 이선호
    • Journal of the Korean Statistical Society
    • /
    • 제22권2호
    • /
    • pp.171-190
    • /
    • 1993
  • 포아송분포로부터 부의 이항분포로의 이탈을 검색하는 통계량들이 자료의 형태에 따라 여러가지 제시되었다. 그런데 대립가설인 부의 이항분포의 모수화 방법에 따라 분산과 평균의 구조가 변하고 국소 최적 검정 통계량도 달라진다는 것이 알려졌다. 본 논문에서는 대립가설을 일반적인 포아송 혼합분포로까지 확장시키고, 일반적인 형태의 분산과 평균의 구조에도 검정 가능한 새로운 통계량 L을 소개하고 있다. 또한 L 통계량은 포아송 분포로부터 부의 이항분포로의 이탈을 다루는 기존의 여러 통계량들의 일반화된 형태임을 보였다. 점근적 상대효율과 모의 실험을 통하여 L 통계량과 기존의 통계량들을 비교한 결과 분산과 평균사이의 구조에 상관없이 L 통계량이 우수한 것임을 입증하였다.

  • PDF

이산분포 혼합의 단봉성이 성립하기 위한 조건 (Criterion of discrete unimodal mixtures)

  • 최대우
    • 응용통계연구
    • /
    • 제8권1호
    • /
    • pp.159-167
    • /
    • 1995
  • 지수족(exponential family)에 속하면서 어떤 특별한 형태를 따르는 이산분포는 그 분포함수가 정의된 정수에 대한 단봉적 순열이다. 본 논문에서 그러한 분포함수의 모수에 대한 혼합형이 어떤 조건하에서 항상 단봉적 순열을 유지하는가에 대하여 연구하였다. 그 예로써 이항분포와 포아송분포 각각에 대한 최대모수구간을 구하여, 그 모수 구간안에서의 혼합형은 항상 단봉적임을 보였다.

  • PDF

기록값 통계량에 기초한 무한고장 NHPP 소프트웨어 혼합 신뢰성장 모형에 관한 연구 (Infinite Failure NHPP Software Mixture Reliability Growth Model Base on Record Value Statistics)

  • 김희철;신현철;김경수
    • 융합보안논문지
    • /
    • 제7권3호
    • /
    • pp.51-60
    • /
    • 2007
  • 무한고장수를 가진 비동질적인 포아송 과정에 기초한 모형들에서 잔존 결함 1개당 고장 발생률은 일반적으로 상수, 혹은 단조증가 및 단조 감소 추세를 가지고 있다. 본 논문에서는 소프트웨어 신뢰성 모형인 지수분포모형과 어랑 분포 모형을 재조명하고 보다 현실적인 혼합분포모형을 제안 하였다. 고장 간격시간으로 구성된 자료를 이용한 모수추정 방법은 최우추정법과 일반적인 수치해석 방법인 이분법을 사용하여 모수 추정을 실시하고 효율적인 모형 선택은 편차자 승합(SSE) 및 콜모고로프 거리를 적용하여 모형들에 대한 효율성 입증방법을 설명하였다. 소프트웨어 고장 자료 분석에서는 41개의 고장 수를 가진 S27[12] 자료를 통하여 분석하였다. 이 자료들에서 지수분포 모형과 어랑분포 모형 및 혼합분포 모형의 비교를 위하여 산술적 및 라플라스 검정, 편의 검정 등을 이용하였다.

  • PDF

Estimation in Mixture of Shifted Poisson Distributions

  • Oh, Chang-Hyuck
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권4호
    • /
    • pp.1209-1217
    • /
    • 2006
  • For the mixture of shifted Poisson distributions, a method of parameter estimation is proposed. The range of the shifted parameters are estimated first and for each shifted parameter set EM algorithm is applied to estimate the other parameters of the distribution. Among the estimated parameter sets, one with minimum likelihood for given data is to be set as the final estimate. In simulation experiments, the suggested estimation method shows to have a good performance.

  • PDF

Estimation in Mixture of Shifted Poisson Distributions with Known Shift Parameters

  • Lee, Hyun-Jung;Oh, Chang-Hyuck
    • Journal of the Korean Data and Information Science Society
    • /
    • 제17권3호
    • /
    • pp.785-794
    • /
    • 2006
  • Suggested is an EM algorithm for estimation in mixture of shifted Poisson distributions with known shift parameters. For this type of mixture distribution, we have to utilize values of shift parameters to determine whether each of data belongs to some component distribution. We propose a method of estimating values of component information and then follow typical EM methodology. Simulation results show that the algorithm provides reasonable performance for the distribution.

  • PDF

광대역 ISDN의 트래픽 성능분석에 관한 연구 (A Study on the Performance Analysis of Broadband ISDN Traffic)

  • 구창회;박광채;이재호
    • 한국통신학회논문지
    • /
    • 제18권7호
    • /
    • pp.980-988
    • /
    • 1993
  • 본 논문에서는 멀티미디어 트래픽올 갖는 B-ISBN의 스위치/멀티플렉서 등에서 중요한 파라메타로 결정되는 버퍼 크기에 대한 트래픽의 성능을 분석하였다. 멀티미디어 트래픽은 포아송 분포 트래픽, 그리고 기하분포와 지수 분포의 ON 시간 주기 (버스트 분포)를 갖는 버 스트 트래픽이 혼합되는 트래픽으로 모델링 하였다. 멀티미디어 트래픽으로 모델링한 트래픽에 대해서 성능을 분석하고 양질의 서비스를 제공할 수 있는 셀손실률에 대한 버퍼의 크기를 제시 하였다. 시뮬레이션은 PC SIMSCRIPT II.5를 이용하였고 시뮬레이션 프로그램은 PREAMBLE, MAIN, INITIAL, ARRIVAL., DEPARTURE및 STOP·SIM의 모듈로 구성하였다. 특히 혼합된 트래픽의 시뮬레이션에서는 ARRIVAL모듈을 I, II로 나누고 셀을 각각의 모듈에서 독립적으로 발생시켜 시뮬레이션을 수행하였다. 시뮬레이션 모델링은 이벤트 스케줄링 (Event Scheduling) 방식을 적용하여 시행하였다.

  • PDF

혼합효과 영과잉 포아송 회귀모형을 이용한 대전광역시 코로나 발생 동향 분석 (Mixed-effects zero-inflated Poisson regression for analyzing the spread of COVID-19 in Daejeon)

  • 김광희;이은지
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.375-388
    • /
    • 2021
  • 본 연구는 대전광역시에서 나타난 확진자 증가 현상을 분석하여 COVID-19의 확산을 방지할 대책 마련에 도움이 되고자 계획되었다. 확진자 증가의 원인이 시민들의 잦은 이동과 장기간 지속한 사회적 거리두기로 인한 피로와 방심에 있다고 보고, 각 행정동의 주별 확진자 수를 반응변수로, 생활 속 거리두기로 전환된 시점으로부터 흐른 시간, 행정동의 버스 하차 인원을 설명변수로 하여 이들의 관계를 모형화하였다. 행정동별 확진자 수가 주 단위로 반복측정 되었고, 포아송분포로 기대되는 0보다 더 많은 0이 관측될 수 있기 때문에 혼합효과 영과잉 포아송 회귀모형을 적용하였다. 행정동의 성격에 따라 확진자 발생 동향이 다를 수 있어서서 서로 유사한 성격을 갖는 행정동을 군집화하여 이를 범주형 설명변수로 사용하였다. 또한 버스 하차 인원의 효과가 행정동의 성격에 따라 달라질 수 있다는 점을 고려하여 두 변수 간의 교호작용항을 포함하였고 상대적으로 번화한 행정동에서 그 효과가 유의한 것으로 나타났다 (유의수준=0.1). 모형 적합 결과 인구수의 증가와 번화한 행정동이라는 요인, 그리고 버스 하차 인원의 증가가 확진자 수의 증가와 중요한 연관 관계를 가진다는 것을 보였다. 한편, 추정된 모형에 따르면 인구수와 버스 하차량이 고정되었을 때 번화한 집단의 확진자 수가 그렇지 않은 집단에 비해 훨씬 적을 것으로 기대되었는데, 이는 코로나 고위험 지역에 대한 시 차원의 강력한 대응이 효과를 발휘한 것으로 해석할 수 있다.