• 제목/요약/키워드: 가산모형

검색결과 57건 처리시간 0.026초

영과잉 공간자료의 분석 (Zero In ated Poisson Model for Spatial Data)

  • 한준희;김창훈
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.231-239
    • /
    • 2015
  • 가산자료(counts data)를 적합 하는 경우 보통 포아송 모형이 가장 먼저 고려된다. 과산포 문제가 있을 경우도 유사 포아송(quasi Poisson) 모형이나 음이항(Negative binomial) 모형으로 대부분 설명이 가능하다. 하지만, 가산자료 중에는 포아송분포를 가정한 기대 빈도 이상으로 많은 0이 관측되는 자료가 있고 이를 영과잉(Zero inflated) 가산 자료라고 부른다. 영과잉 가산자료를 설명하기 위해 영과잉 포아송(ZIP) 모형이나 영과잉 음이항(ZINB) 모형을 이용할 수 있다. 더 나아가 영과잉 가산자료가 공간상관관계까지 있을 경우 영과잉 문제뿐만 아니라 유의할 수 있는 공간효과까지 고려해야하고 이를 위해 혼합효과모형(mixed effects model)이 고려 될 수 있다. 본 연구에서 사용된 2004년 기준 부산시 남성동별 갑상선암 발생자수 자료를 이용하여, 일반선형 포아송모형, 영과잉 포아송모형, 공간 영과잉 포아송모형을 적합하여 비교해보았다.

영과잉 경시적 가산자료 분석을 위한 허들모형 (Hurdle Model for Longitudinal Zero-Inflated Count Data Analysis)

  • 진익태;이근백
    • 응용통계연구
    • /
    • 제27권6호
    • /
    • pp.923-932
    • /
    • 2014
  • 허들모형은 영이 과잉 가산자료를 분석하기 위해서 사용되어 왔다. 이 모형은 이산부분을 위한 로짓모형과 절삭된 가산부분을 위한 절삭된 포아송모형의 혼합모형이다. 이 논문에서 우리는 경시적 영과잉 가산자료를 분석하기 위해서 수정된 콜레스키 분해을 이용하여 일반적인 이분산성을 가지는 변량효과 공분산행렬을 제안한다. 수정된 콜레스키 분해는 변량효과 공분산행렬을 일반화자기상관 모수와 혁신분산모수로 분리되면, 이러한 모수들은 베이지안 일반화 선형모형을 통해 추정된다. 그리고 실제 자료분석을 통하여 설명한다.

Random Parameter를 이용한 지방부 무신호교차로 교통사고 예측모형개발 (A Development of Traffic Accident Prediction Model at Rural Unsignalized Intersections Using Random Parameter)

  • 이규훈;오주택;박정순
    • 한국ITS학회 논문지
    • /
    • 제16권4호
    • /
    • pp.64-75
    • /
    • 2017
  • 기존의 고정모수를 이용한 가산모형은 관측되지 않은 이질성을 고려할 수 없으며, 계수값의 표준오차가 과소추정됨에 따라 과도한 t-값이 도출되어 모형의 신뢰성이 감소하게 된다. 또한 무신호교차로의 경우 자료 수집의 어려움과 정확한 분석과정의 통계적 한계로 신호교차로에 비해 연구가 미비한 실정이다. 본 연구에서는 Random Parameter를 이용한 가산모형을 구축하여 교통사고에 영향을 미치는 요인들을 분석하고자 하였으며, 지방부 무신호교차로를 대상으로 하여 기존 연구들과의 차별성을 두고자 하였다. 분석 결과, 총 7개의 변수가 유의한 변수로 나타났고, 이 중 2개의 변수(횡단보도 유무, 제한 속도)가 확률적 변수로 나타났다.

모의실험을 통한 가산위험모형에 대한 적합도검정법들의 비교

  • 김진흠
    • Communications for Statistical Applications and Methods
    • /
    • 제3권1호
    • /
    • pp.61-71
    • /
    • 1996
  • Kim and Song(1995)과 Kim and Lee(1996)는 하나의 이지공변량(binary covariate)을 갖는 가산위험모형(additive risk model)의 적합도검정법(goodness-of-fit test)을 제안했다. 전자는 모수의 가중추정량들의 차에 기초한 검정법이며 후자는 마팅게일잔차(martingale residual)에 기초한 검정법이다. 본 논문에서는 모의실험을 통하여 두 검정법을 비교하였다.

  • PDF

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

마팅게일잔차에 기초한 가산위험모형의 적합도검정법 (A goodness-of-fit test based on Martinale residuals for the additive risk model)

  • 김진흠;이승연
    • 응용통계연구
    • /
    • 제9권1호
    • /
    • pp.75-89
    • /
    • 1996
  • 본 논문에서는 하나의 이진공변량(binary covariate)을 갖는 가산위험모형(additive risk model)의 적합도를 검정하기 위한 검정법을 제안하였다. 제안된 검정법은 마팅게일잔차(martingale residual)에 기초한 Wei(1984)의 비례위험모형(proportional hazards model)의 적합도검정법을 가산위험모형으로 확장한 형태이다. 제안된 검정통계량의 점근성질을 유도하였고 실제자료에 적용하여 보았다.

  • PDF

가산자료모형을 이용한 서해 태안군 유어객의 편익추정 (Estimating the Economic Value of Recreation Sea Fishing in the Yellow Sea: An Application of Count Data Model)

  • 최종두
    • 자원ㆍ환경경제연구
    • /
    • 제23권2호
    • /
    • pp.331-347
    • /
    • 2014
  • 본 연구는 서해에 위치한 태안군을 방문하는 유어객의 방문 편익을 분석하기 위하여 개별여행비용법과 가산자료모형을 이용하여 수요모형을 추정하고 경제적 가치를 측정하였다. 여행객방문속성을 감안하여 분석모형으로 포아송모형(Poisson Model, PM), 음이항모형(Negative Binomial, NB), 절단된 포아송모형(Truncated Poisson Model, TPM), 절단된 음이항모형(Truncated Negative Binomial, TNB)을 분석에 이용하였다. 분석결과 추정계수들은 통계적으로 유의하게 나타났으며, 경제이론에도 부합되는 결과를 도출하였다. 과산포(overdispersion)현상은 발견되지 않았으며, 모형적합도검정을 통하여 절단된 포아송모형이 적정모형으로 선정되었다. 또한, 서해 태안군 해역내 유어활동의 경제적가치를 추정하기 위하여 유어객의 연평균 출조횟수와 최적모형으로 선정된 절단된포아송모형(TPM)으로 분석한 결과 1인 1회 출조당 경제적 가치는 254,453원이며, 1인당 연간 총 경제적 가치는 1,536,896원으로 도출되었다.

가산자료모형을 기초로 한 통행행태의 한계효과분석 (Marginal Effect Analysis of Travel Behavior by Count Data Model)

  • 장태연
    • 대한교통학회지
    • /
    • 제21권3호
    • /
    • pp.15-22
    • /
    • 2003
  • 교통수요예측의 통행발생단계에서 일반적으로 선형회귀모형이 활용되고 있다. 이러한 선형회귀모형은 여러가지 방법론적 한계성과 실용적 지속성을 가지지 못하는 경향을 보인다. 첫째, 종속변수로 이용되는 통행발생의 경우 비음정수(non-negative integer : 0, 1, 2 등)의 이산분포특징을 보이나, 선형회귀모형에서는 종속변수가 연속확률분포 인 정규분포의 특징을 가진 것으로 가정한다. 둘째, 모형이 자료측정에 적용되었을 때 음(-)의 결과를 산정 할 수 있으며, 독립변수의 증감에 따라 결과 값을 너무 높게 혹은 낮게 예측하는 경우가 있다 셋째, 예측된 값이 정상적인 범위 내에 있을 지라도 예측된 통행수만을 제시 할 뿐, 통행발생빈도에 대한 이산확률분포는 제공하지 않는다. 이같은 한계점을 극복하기 위해 주로 활용되어온 가산자료모형이 포와송모형이다. 그러나 포와송모형의 경우 자료의 평균과 분산이 동일하다는 가정하에 활용되고 있어 자료상에 과산포가 존재할 경우 오차를 과소평가 할 경향이 높아 모형의 신뢰성에 문제가 발생됨으로 기타 다른 가산자료모형의 적용을 고려해야한다. 연구에서는 과산포검정을 통해 통행발생빈도상에 과산포 존재를 밝혀내고 포와송모형의 부적합함을 제시하였으며 Vuong 검정을 통해 최적의 모형을 선정하였다. 선정된 모형을 대상으로 우도비검정과 Theil 부등계수에 의해 모형의 신뢰도와 정확성을 조사하였다. 최종적으로 가구의 사회경제적 속성의 변화에 따른 통행발생의 변화를 측정하기 위한 민감도 분석을 실시하였다.

경시적 영과잉 가산자료와 생존자료의 결합모형 (A joint modeling of longitudinal zero-inflated count data and time to event data)

  • 김동욱;천지훈
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1459-1473
    • /
    • 2016
  • 시간의 흐름에 따라 관측되는 경시적(longitudinal) 자료의 경우, 경시적 자료와 생존(survival) 자료가 종종 동시에 수집된다. 이 때 경시적 자료에서 발생하는 결측이 생존자료와의 연관성으로 인해 발생한 무시할 수 없는 결측(non-ignorable missing)이라면, 경시적 자료분석 방법만으로는 두 자료 간의 연관성을 고려하지 않아 독립변수에 대한 효과는 편향된 결과를 얻게 된다. 이러한 문제를 해결하기 위해서 결측의 원인이 생존시간과 연관되어 있으므로 생존모형을 고려하여 불편추정량을 얻기 위해 경시적 자료와 생존자료의 결합모형에 대한 연구가 이루어져 왔다. 본 논문은 경시적 자료의 형태가 영이 많이 존재하는 영과잉 가산자료(zero-inflated count data)와 생존자료의 결합모형을 연구하였다. 경시적 영과잉 가산자료와 생존자료는 각각 허들모형(hurdle model)과 비례위험모형(proportional hazards model)의 부 모형을 적용하였고, 두 부 모형들의 변량효과가 다변량 정규분포를 따른다는 가정을 통하여 결합하였다. 모수의 최우추정법으로 EM 알고리즘을 활용하였고, 추정된 표준오차를 계산하기 위해 프로파일 우도(profile likelihood)를 이용하였다. 최종적으로 모의실험을 통해 두 부 모형의 변량효과 간 상관관계가 존재하는 경우 결합모형이 개별적 모형보다 편의와 포함확률(coverage probability)의 측면에서 더 우수함을 보였다.

가산자료모형(Count Data Model)을 이용한 버스이용횟수추정에 관한 연구 (서울시 통근.통학자를 대상으로) (Count Data Model for The Estimation of Bus Ridership (Focusing on Commuters and Students in Seoul))

  • 문진수;김순관;임강원
    • 대한교통학회지
    • /
    • 제17권5호
    • /
    • pp.123-135
    • /
    • 1999
  • 개인교통수단의 선호로 인한 자가용 승용차의 급증은 서울시의 교통혼잡을 가중시키는 주요한 요인이 되고 있다. 이러한 서울시의 교통혼잡을 완화하기 위해서는 대중교통 중심의 교통체계가 구축되어야 하며 승용차 이용자를 대중교통수단으로 유인할 수 있는 대중교통 활성화정책이 필요하다. 이러한 인식하에 버스를 이용하는 통근 및 통학목적 통행자의 버스이용횟수에 대한 개별행태모형을 통하여 버스 이용에 영향을 미치는 요인을 파악함으로써 승용차 이용자를 대중교통수단으로 유인할 수 있는 정책적인 시사점을 도출하고자 하였다. 본 연구의 목적은 일주일간 버스이용횟수 추정에 적합한 가산자료모형의 적용이다. 국내에서는 가산자료모형을 이용한 연구가 많지 않은 실정이며, 또한 모형의 설정시 과산포(overdispersion)에 대한 검정을 통하여 자료에 적합한 모형을 설정하는 것이 중요함에도 불구하고 적절한 검정없이 일반적으로 사용되고 있는 포와송 회귀모형을 주로 사용하여 왔다. 그러나 본 연구에서는 가산자료모형을 선정하기 전에 과산포에 대한 통계적인 검정을 시행한 결과 음이항 회귀모형이 본 연구의 자료에 적합한 것으로 판정되었으며, 모형설정의 중요성을 살펴보기 위하여 음이항 회귀모형을 이용하여 추정한 결과와 포와송 회귀모형을 이용하여 추정한 결과를 비교하여 보았다.

  • PDF