• 제목/요약/키워드: 영과잉

검색결과 125건 처리시간 0.024초

영 과잉 포아송 모형에 대한 베이지안 방법 연구 (Bayesian Approaches to Zero Inflated Poisson Model)

  • 이지호;최태련;우윤성
    • 응용통계연구
    • /
    • 제24권4호
    • /
    • pp.677-693
    • /
    • 2011
  • 본 논문에서는 영 과잉 계수형 자료 분석을 위한 모형중의 하나인 영 과잉 포아송 모형의 베이지안 접근 방법에 대해서 연구한다. 구체적으로는 베이지안 영 과잉 포아송 모형의 적합을 위한 사후 표본을 추출하는데 있어서, 깁스 표집기(Gibbs sampler)를 이용하는 마르코프 연쇄 몬테칼로(MCMC) 방법과 역 베이즈공식(IBF)에 의한 표본추출 방법 두 가지를 고려한다. 이러한 두 가지 사후 표본 추출방법을 비교 설명하고, IBF를 통한 사후표본을 깁스 표집기 사후표본의 수렴성 여부를 확인하는 방식에 대해서도 소개한다. 이를 바탕으로 베이지안 영 과잉 포아송 모형을 Trajan이라는 사과 품종의 발아자료(Trajan data, Marin 등, 1993)에 적용하고 모수에 대한 사후추론을 실시하고 기존의 결과와 비교한다. 또한 주어진 자료에 대하여 영 과잉 포아송 모형이 적합한지에 대한 여부를 여러 가지 모형선택 기준을 통해서 살펴보고, 아울러 기존의 자료 분석 결과 (Rodrigues, 2003)를 보완하기 위하여 계층적 베이지안 모형과 같은 대안에 대해서도 논의해본다.

영 과잉 순서적 프로빗 모형을 이용한 한국인의 음주자료에 대한 베이지안 분석 (Bayesian Analysis of Korean Alcohol Consumption Data Using a Zero-Inflated Ordered Probit Model)

  • 오만숙;오현탁;박세미
    • 응용통계연구
    • /
    • 제25권2호
    • /
    • pp.363-376
    • /
    • 2012
  • 순서적 다항 반응변수의 경우 종종 과도하게 많은 수의 관측치가 0 범주에서 발생하는 영 과잉 특성을 지닌다. 이러한 영 과잉 자료에서 0범주를 발생시키는 요인이 여러 개 존재할 때 일반적인 순서적 프로빗 모형은 자료를 설명함에 있어서 한계를 지닌다. 본 논문에서는 영 과잉 특성을 반영한 이 단계 영 과잉 순서적 프로빗 모형의 베이지안 분석기법을 제시하고 이를 2008년도 통계청에서 조사한 한국인의 음주소비 자료에 적용시킨다. 첫 번째 단계에서는 음주소비가 하나도 없다고 답한 0 범주에 속하는 비음주자들을 신념 또는 영구적 건강상의 문제 등으로 상황에 관계없이 음주를 하지 않는 절대적 비음주자(genuine non-drinker, non-participant)와 현재 소비가 없지만 상황에 따라 음주자가 될 가능성이 있는 잠재적 음주자(zero consumption potential drinker)로 구분하는 프로빗 모형을 적용시켜 분석한다. 두 번째 단계에서는 잠재적 음주자와 1 이상의 범주에 속하는 실제적 음주자를 합하여 음주자 집단으로 보고 이에 대하여 순서적 프로빗 모형을 적용하여 분석한다. 분석결과, 비음주자 중 약 30%가 절대적 비음주자로 음주자료가 일반적 순서적 자료에 비하여 뚜렷한 영 과잉 특성을 가짐을 알 수 있었다. 각 변수의 한계효과를 분석함으로써 같은 설명변수가 절대적 비음주자와 잠재적 음주자에 미치는 영향이 서로 반대로 나타날 수 있음을 발견하였고, 따라서 한국인의 음주자료에 대하여 제안된 영 과잉 순서적 프로빗 모형이 유용함을 보여주었다.

변화시점이 있는 영과잉-포아송모형에서 돌출대립가설에 대한 우도비검정 (Likelihood Ratio Test for the Epidemic Alternatives on the Zero-Inflated Poisson Model)

  • 김경무
    • Journal of the Korean Data and Information Science Society
    • /
    • 제9권2호
    • /
    • pp.247-253
    • /
    • 1998
  • 영과잉-포아송모형에서 변화시점이 있는 경우, 돌출대립가설에 대한 우도비검정을 이용하여 변화시점의 유 무를 알아보았다. 변화시점에 대한 추정은 최소제곱법을 이용하였고 이를 최우추정법을 이용하기 위한 초기치로 활용하였다. 또한 대립가설에 대한 몇가지 흥미있는 모수들을 적률법을 이용하여 추정하였다. 모의실험을 통하여 이들 추정 량을 비교하였고 결과 변화시점에 대한 추정은 최소제곱법보다는 최우추정법이 바람직하게 나타났고 흥미있는 몇가지 모수들에 대해서는 최우추정량이 적률추정량보다 우수하게 나타났다.

  • PDF

영과잉 포아송 회귀모형에 대한 베이지안 추론: 구강위생 자료에의 적용 (Bayesian Analysis of a Zero-inflated Poisson Regression Model: An Application to Korean Oral Hygienic Data)

  • 임아경;오만숙
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.505-519
    • /
    • 2006
  • 셀 수 있는 이산 자료(discrete count data)에 대한 분석은 여러 분야에서 활용되고 있지만 영(zero)을 과도하게 포함하고 있는 영과잉 자료는 자료의 성격상 포아송 분포를 따르지 못할 때가 있어 분석에 어려움이 따른다. Zero-Inflated Poisson(ZIP)모형은 이런 어려움을 극복하기 위하여 영에 대한 점확률을 가지는 분포와 포아송 분포를 합성하여 과도한 영과 영이 아닌 자료를 설명하는 모형이다. 설명 변수가 존재할 때는 포아송 분포 부분에서 반응변수의 평균과 공변량사이에 로그선형 연결함수를 사용한 Zero-Inflated Poisson Regression(ZIPR)모형이 사용될 수 있다. 본 논문에서는 Markov Chain Monte Carlo 기법을 이용한 ZIPR모형의 베이지안 추론방법을 제안하고, 이를 실제 구강위생 자료에 적용하며 다른 모형들과 비교한다. 그 결과 베이지안 추론 방법을 적용한 영과잉 모형의 추정오차가 다른 모형들의 추정오차보다 작았고, 예측치가 더 정확했다는 점에서 우수함을 알 수 있었다.

영과잉 토빗모형을 이용한 한국 소득분포 자료의 베이지안 분석 (Bayesian analysis of Korean income data using zero-inflated Tobit model)

  • 황지수;김세완;오만숙
    • 응용통계연구
    • /
    • 제30권6호
    • /
    • pp.917-929
    • /
    • 2017
  • 한국노동패널조사에서 제공하는 2015년 한국 생산가능인구의 월평균 소득분포를 보면 0 관측치의 비율이 과도하게 높은 형태를 보여 기존의 소득분포에 주로 사용되는 토빗모형으로는 설명에 한계가 있다. 본 연구에서는 영과잉 특성을 반영하여 영과잉 토빗모형을 사용하여 한국인의 소득 자료를 분석한다. 영과잉 토빗모형은 2단계 모형으로 1단계에서는 소득이 0인 그룹을 두 그룹으로 나누는데, 첫 번째 그룹은 노동시장 참여의지가 없어 시장에 참여하지 않으므로 0이 관측되는 그룹(genuine zero)이고 두 번째 그룹은 노동시장 참여의지는 있으나 낮은 임금으로 인하여 절단되어 0이 관측되는 그룹(random zero)으로 가정하였다. 두 번째 random zero 그룹은 0 이상의 연속 자료와 결합하여 토빗모형을 적용한다. 1단계와 2단계 모형에 관심 있는 설명변수를 가진 회귀모형을 적용하여 노동시장 참여여부와 임금 수준에 영향을 미치는 요인을 알아본다. 마코브 체인 몬테칼로 기법을 사용하여 모수를 추정하고 기존의 토빗모형과 비교한 결과 영과잉 토빗모형이 0의 빈도추정과 모형 적합도 면에서 우수한 결과를 보였다. 분석결과 나이가 많을수록, 남자가 여자보다, 학력이 낮을수록, 노동시장에 참여할 가능성이 매우 유의하게 높으며, 사회경제적 지위가 높을수록 그리고 유보임금이 낮을수록 노동시장에 참여하지 않을 확률이 높은 것으로 나타났다. 임금수준을 보면, 남자가 여자보다, 학력이 높을수록, 기혼이 미혼 보다 매우 유의하게 더 높은 임금을 받는 것으로 나타났다.

An application to Multivariate Zero-Inflated Poisson Regression Model

  • Kim, Kyung-Moo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권2호
    • /
    • pp.177-186
    • /
    • 2003
  • The Zero-Inflated Poisson regression is a model for count data with exess zeros. When the correlated response variables are intrested, we have to extend the univariate zero-inflated regression model to multivariate model. In this paper, we study and simulate the multivariate zero-inflated regression model. A real example was applied to this model. Regression parameters are estimated by using MLE's. We also compare the fitness of multivariate zero-inflated Poisson regression model with the decision tree model.

  • PDF

An application to Zero-Inflated Poisson Regression Model

  • Kim, Kyung-Moo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제14권1호
    • /
    • pp.45-53
    • /
    • 2003
  • The Zero-Inflated Poisson regression is a model for count data with exess zeros. When the reponse variables have excess zeros, it is not easy to apply the Poisson regression model. In this paper, we study and simulate the zero-inflated Poisson regression model. An real example was applied to this model. Regression parameters are estimated by using MLE's. We also compare the fitness of zero-inflated Poisson model with the Poisson regression and decision tree model.

  • PDF

어가의 고용량 결정요인 분석 (An Analysis on the Determinants of Employed Labour Quantity in the Fishing Industry)

  • 김태현;박철형;남종오
    • 자원ㆍ환경경제연구
    • /
    • 제27권3호
    • /
    • pp.545-567
    • /
    • 2018
  • 본 연구는 포아송모형, 음이항모형, 영과잉 포아송모형, 영과잉 음이항모형을 이용하여 어가의 고용량 결정요인을 분석하고, 개별모형 간 고용량 결정요인을 비교 분석한다. 이들 모형의 추정에 사용된 자료는 통계청에서 제공하는 2010년과 2015년의 농림어업총조사 마이크로 데이터이며, 이들 자료를 풀링(Pooling)하여 고용량 결정요인과 그 변화분에 대해 추정한다. 분석모형의 선정 결과, 과대 산포 경향을 갖고 있으면서 자가 노동 및 가족 경영으로 고용을 대체하고 있는 수산업의 특성을 모형에 동시에 반영하고 있는 영과잉 음이항모형이 선정되었다. 또한 2010년 대비 2015년 고용량 결정요인의 변화분을 분석해 본 결과, 어선을 보유한 어가와 판매금액이 많은 어가는 고용량 감소에 유의한 영향을 미치는 것으로 나타난 반면, 어가의 종사경력은 길수록 고용량 증가에 유의한 영향을 미치는 것으로 나타났다. 결론적으로 자본화된 어가와 고령화의 가속화가 수산업의 어가 고용량 수 변화에 유의한 영향을 미친 것으로 나타났다.

영과잉 회귀모형을 이용한 광고노출분포 추정 (Estimation of Advertising Exposure Distribution by Zero-inflation Regression Models)

  • 이동희
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2841-2852
    • /
    • 2018
  • 이 논문에서는 광고분야 매체기획에서 필요한 노출분포 추정과 관련하여 영과잉 분포를 이용한 회귀모형 방법에 대해 살펴보고자 한다. 노출분포란 광고를 반복하여 게재할 때마다 노출되는 청중들의 비율을 나타낸 것이다. 이와 같은 노출분포는 광고효과를 수량적으로 측정하기 위한 각종 지표들을 산출하는데 필요한 기초 정보를 제공한다는 점에서 매우 중요한 역할을 한다. 특히 최근 다양한 매체의 확산으로 인한 광고 단가의 인하로 인하여 과거에 비해 특정 광고의 게재 혹은 방영빈도는 크게 늘어난 상태이나 노출빈도는 상대적으로 줄어들고 있는 상황이다. 이러한 상황에서 해당 매체를 접하지 않는, 즉 구조적으로 광고에 노출되지 않는 개인들이 늘어가고 있다. 이제까지 광고의 노출분포 추정을 위해 사용해 왔던 베타이항분포 등은 이러한 상황에 적합하지 않을 수 있는데, 본 연구에서는 영과잉 회귀모형을 이용한 광고노출분포모형을 제안하고, 실제 사례를 통한 비교연구를 수행하였다.

K-리그에서 축구 골의 분포 (Soccer goal distributions in K-league)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1231-1239
    • /
    • 2014
  • 본 연구에서는 1983년부터 2012년까지의 한국프로축구 K-리그 전 경기 결과를 이용하여 홈 경기와 원정 경기에서의 골의 분포를 분석하였다. 고려된 확률분포는 포아송분포, 음이항분포, 극단치분포 및 영과잉 포아송분포이며, 카이제곱분포를 이용한 적합도검정을 수행하였다. 그 결과 홈경기는 포아송분포, 원정경기는 영과잉 포아송분포가 골의 분포를 위한 최적 적합분포로 간주되며 홈경기와 원정경기 골의 수는 서로 약한 정도의 상관관계가 있는 것으로 나타났다.