• 제목/요약/키워드: negative binomial

검색결과 297건 처리시간 0.019초

폴랴-감마 잠재변수에 기반한 베이지안 영과잉 음이항 회귀모형: 약학 자료에의 응용 (A Bayesian zero-inflated negative binomial regression model based on Pólya-Gamma latent variables with an application to pharmaceutical data)

  • 서기태;황범석
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.311-325
    • /
    • 2022
  • 0의 값을 과도하게 포함하는 가산자료는 다양한 연구 분야에서 흔히 나타난다. 영과잉 모형은 영과잉 가산자료를 분석하기 위해 가장 일반적으로 사용되는 모형이다. 영과잉 모형에 대한 전통적인 베이지안 추론은 조건부 사후분포의 형태가 폐쇄형 분포로 나타나지 않아 모형 적합 과정이 용이하지 않다는 한계점이 존재했다. 그러나 최근 Pillow와 Scott (2012)과 Polson 등 (2013)이 제안한 폴랴-감마 자료확대전략으로 인해, 로지스틱 회귀모형과 음이항 회귀모형에서 깁스 샘플링을 통한 추론이 가능해지면서, 영과잉 모형에 대한 베이지안 추론이 용이해졌다. 본 논문에서는 베이지안 추론에 기반한 영과잉 음이항 회귀모형을 Min과 Agresti(2005)에서 분석된 약학 연구 자료에 적용해본다. 분석에 사용된 자료는 경시적 영과잉 가산자료로 복잡한 자료 구조를 가지고 있다. 모형 적합 과정에서는 깁스 샘플링을 통한 추론을 수행하기 위해 폴랴-감마 자료확대전략을 사용한다.

영과잉 음이항회귀 모형을 이용한 보험설계사들의 이직횟수 적합 (Fit of the number of insurance solicitor's turnovers using zero-inflated negative binomial regression)

  • 전희주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.1087-1097
    • /
    • 2017
  • 본 연구는 계수자료 (count data)를 반응변수로 갖는 포아송회귀 모형, 음이항회귀 모형, 영과잉 포아송회귀 모형, 영과잉 음이항회귀 모형의 4 모형의 비교를 통해 보험 설계사들의 이직횟수 적합을 위한 최적모형을 찾고자 한다. 보험설계사 이직횟수의 분산이 평균보다 큰 과대산포가 존재하고 0인 경우의 비중이 높을 경우에 영과잉 음이항회귀 모형을 적합하는 것이 타당함을 보여주고 보험 설계사들의 이직횟수에 영향을 주는 요인을 규명하고자 한다. 로그우도값, AIC, SBC 등을 고려하여 보험설계사 이직횟수 적합을 최적의 모형은 영과잉 이항모형과 음이항회귀모형의 결합인 영과잉 음이항 모형이 선택되었다. 영과잉 이항모형에 포함된 변수로는 성별, 총 보험설계사 근무연월, 교차모집 설계사 등록, 보유고객 수, 소속회사 유형이었고, 음이항회귀 모형에 포함된 변수로는 직무만족, 조직몰입, 채널경영만족, 총 보험설계사 근무연월, 현 직장에서 근무연월, 소속회사 유형이었다. 영과잉 음이항회귀 모형의 적합결과, 이직횟수에 유의한 영향을 주는 요인으로는 현 직장에서 근무연월, 총 보험설계사 근무연월, 소속회사 유형, 채널경영만족, 직무만족 순으로 나타났다.

이변량 음이항 모형에서 붓스트랩 방법을 이용한 과대산포에 대한 검정 (Testing for Overdispersion in a Bivariate Negative Binomial Distribution Using Bootstrap Method)

  • 전명식;정병철
    • 응용통계연구
    • /
    • 제21권2호
    • /
    • pp.341-353
    • /
    • 2008
  • 본 연구에서는 이변량 음이항 분포에서 과대산포와 "내재적 상"의 존재유무에 대한 가설검정 문제를 다루었다. 과대산포에 대한 스코어 검정의 표준정규분포 근사는 명목 유의수준을 과소추정한 반면 "내재적 상"에 대한 스코어 검정은 명목유의수준을 과대 추정하고 있음을 보였다. 본 연구에서는 이와 같은 스코어 검정의 표준정규분포 근사의 문제점을 해결하기 위하여 붓스트랩 방법을 제안하였다. 스코어 검정에 대한 붓스트랩 방법은 두 검정에서 명목유의수준을 제대로 유지하고 검정력도 높게 나타나 스코어 검정의 표준정규분포 근사에 존재하는 문제를 해결하는 효율적인 대안으로 판단된다.

Random Parameters 음이항 모형을 이용한 신호교차로 교통사고 모형개발에 관한 연구 -대전광역시를 대상으로 - (Traffic Accident Models using a Random Parameters Negative Binomial Model at Signalized Intersections: A Case of Daejeon Metropolitan Area)

  • 박민호;홍정열
    • 한국도로학회논문집
    • /
    • 제20권2호
    • /
    • pp.119-126
    • /
    • 2018
  • PURPOSES : The purpose of this study is to develop a crash prediction model at signalized intersections, which can capture the randomness and uncertainty of traffic accident forecasting in order to provide more precise results. METHODS : The authors propose a random parameter (RP) approach to overcome the limitation of the Count model that cannot consider the heterogeneity of the assigned locations or road sections. For the model's development, 55 intersections located in the Daejeon metropolitan area were selected as the scope of the study, and panel data such as the number of crashes, traffic volume, and intersection geometry at each intersection were collected for the analysis. RESULTS : Based on the results of the RP negative binomial crash prediction model developed in this study, it was found that the independent variables such as the log form of average annual traffic volume, presence or absence of left-turn lanes on major roads, presence or absence of right-turn lanes on minor roads, and the number of crosswalks were statistically significant random parameters, and this showed that the variables have a heterogeneous influence on individual intersections. CONCLUSIONS : It was found that the RP model had a better fit to the data than the fixed parameters (FP) model since the RP model reflects the heterogeneity of the individual observations and captures the inconsistent and biased effects.

여행비용모형을 이용한 전남 바다목장 해역 유어활동의 경제적 가치 추정 (Estimating the Economic Value of Recreational Fishing in the Jeonnam Marine Ranching Area)

  • 서주남;김도훈;강성경
    • 수산경영론집
    • /
    • 제43권2호
    • /
    • pp.41-49
    • /
    • 2012
  • This study aimed to estimate the economic value of the recreational fishing in the Jeonnam marine ranching area as a part of the total socioeconomic evaluation of the Jeonnam marine ranching program. A travel cost method was applied to the estimation of economic value of the recreational fishing in the Jeonnam marine ranching area and input variables included annual fishing trip days, average travel cost per trip, average catch amount, monthly income, marriage, age, and personal perception on the marine ranching program. In the analysis, due to its characteristic of count data, both poisson model and negative binomial model were used. Model results indicated that a negative binomial model was statistically more suitable than the poisson model as the overdispersion problem occurred in the poisson model. All signs of the estimated parameters were estimated as previous studies showed. Based on the results, the economic value per trip of the recreational fishing in the Jeonnam marine ranching area was estimated to be 145,000 won and the annual total economic value of the recreational fishing in the Jeonnam marine ranching area was analyzed to be 2,514,000 won. In addition, the change of total value by catch rate showed that the economic value could be increased by 180,900 won as the catch increased by one kilogram.

회전 및 진입 차로 수에 따른 학교와 인접한 회전교차로 보행자 사고모형 (Pedestrian Accident Models of Roundabout Near Schools by the Number of Entry and Circulatory Lane)

  • 손슬기;박병호
    • 한국안전학회지
    • /
    • 제32권5호
    • /
    • pp.135-140
    • /
    • 2017
  • This study deals with the safety of roundabout. The purpose of this study is to analyze the factors affecting the pedestrian accidents of roundabout near schools. In pursuing the above, this study gives particular attentions to comparatively analyzing the pedestrian accident by number of entry and circulatory lane. The traffic accident data from 2013 to 2015 are collected from TAAS data set of Road Traffic Authority. To develop the pedestrian accident model, the Poisson and negative binomial models has been utilized in this study. Such the dependent variable as the number of pedestrian accidents and the 24 independent variables as geometry, traffic volume and others are used. The main results are as follows. First, 3 Poisson and 2 negative binomial models(${\rho}^2$ of 0.153~0.426) which are all statistically significant are developed. Second, the common variable of models based on the number of circulatory roadway lane is analyzed to be the entry lane width and that of the number of entry lane is evaluated to be the design speed. Also specific variables are evaluated to splitter island, roundabout sign, number of approach road, bus stop and elementary school. Finally, the design speed might be expected to decrease the number of pedestrian accidents near schools.

음이항회귀식을 이용한 도로표지의 인지반응시간 추정모형 개발 (Development of Recognition and Reaction Time Prediction Model in Road Signs using Negative Binomial Regression)

  • 박형진;이기영;김정룡
    • 대한인간공학회지
    • /
    • 제25권4호
    • /
    • pp.23-33
    • /
    • 2006
  • The purpose of this study is to determine the economical standard of road signs by verifying the difference of driver's recognition and reaction time according to the space rate of letters on the road signs. For this reason, indoor simulations was conducted to confirm difference of recognition and reaction time on six sign-targets having different space rate. Also, a negative binomial regression model was used to find the main factors which could lower the rate of misreading. For this model, increasing of legibility of sign is not only simple enlargement of sign, but also suitable match of letters and sign. The result of this study is capable of verifying the importance of the space rate in road signs, and being utilized as a effective method to determine the standard of the road signs.

확률적 모수를 고려한 음이항모형에 의한 교통사고와 기하구조와의 관계 - 미국 워싱턴 주(州) 고속도로를 중심으로 (Relationship between Interstate Highway Accidents and Heterogeneous Geometrics by Random Parameter Negative Binomial Model - A case of Interstate Highway in Washington State, USA)

  • 박민호
    • 대한토목학회논문집
    • /
    • 제33권6호
    • /
    • pp.2437-2445
    • /
    • 2013
  • 이 연구는 확률적 모수를 고려한 음이항회귀분석을 이용하여 고속도로에서의 사고와 기하구조와의 관계를 파악하는데 목적이 있다. 고속도로에서의 기하구조는 모든 구간에 동일한 설계요소가 적용되기에는 현실적으로 불가능함에도 불구하고, 지금까지의 연구에서는 모형을 통해 도출되는 계수값이 구간에 설치된 기하구조의 특성에 관계없이 항상 고정된 값으로 추정되어왔다. 고정된 값을 이용한 일반적인 음이항모형은 시간적 변화 또는 각 대상구간이 가지고 있는 고유한 특성에 따른 변화를 통합하여 설명하지 못한다는 단점이 있으며, 이로 인해 추정된 계수의 표준오차가 과소추정되어 t-값이 부풀려지게 되며, 그 결과 모형의 설명력이 떨어지게 된다. 따라서, 이 연구에서는 워싱턴 주에 위치하고 있는 7개의 고속도로에서 발생한 9년동안의 사고자료 및 기하구조자료를 이용하여 구간별로 상이한 기하구조가 사고에 미치는 영향을 알아보고자 한다. 총 16개의 기하구조 관련 변수가 모형 도출에 이용되었으며, 기존의 음이항모형과의 비교를 통해 이 연구에서 제시하는 모형이 교통사고와 기하구조와의 관계파악에 더욱 적합함을 보이고자 한다. 그리고, 각 변수의 한계효용 및 탄력성 분석을 통해 이질성을 가지는 기하구조가 사고에 미치는 영향을 제시하고자 한다. 이는 향후 기하구조 관련 정책수립에 도움이 될 것으로 판단된다.

어가의 고용량 결정요인 분석 (An Analysis on the Determinants of Employed Labour Quantity in the Fishing Industry)

  • 김태현;박철형;남종오
    • 자원ㆍ환경경제연구
    • /
    • 제27권3호
    • /
    • pp.545-567
    • /
    • 2018
  • 본 연구는 포아송모형, 음이항모형, 영과잉 포아송모형, 영과잉 음이항모형을 이용하여 어가의 고용량 결정요인을 분석하고, 개별모형 간 고용량 결정요인을 비교 분석한다. 이들 모형의 추정에 사용된 자료는 통계청에서 제공하는 2010년과 2015년의 농림어업총조사 마이크로 데이터이며, 이들 자료를 풀링(Pooling)하여 고용량 결정요인과 그 변화분에 대해 추정한다. 분석모형의 선정 결과, 과대 산포 경향을 갖고 있으면서 자가 노동 및 가족 경영으로 고용을 대체하고 있는 수산업의 특성을 모형에 동시에 반영하고 있는 영과잉 음이항모형이 선정되었다. 또한 2010년 대비 2015년 고용량 결정요인의 변화분을 분석해 본 결과, 어선을 보유한 어가와 판매금액이 많은 어가는 고용량 감소에 유의한 영향을 미치는 것으로 나타난 반면, 어가의 종사경력은 길수록 고용량 증가에 유의한 영향을 미치는 것으로 나타났다. 결론적으로 자본화된 어가와 고령화의 가속화가 수산업의 어가 고용량 수 변화에 유의한 영향을 미친 것으로 나타났다.

과대산포 가산자료의 새로운 표본선택모형 (A new sample selection model for overdispersed count data)

  • 조성은;조준;김형문
    • 응용통계연구
    • /
    • 제31권6호
    • /
    • pp.733-749
    • /
    • 2018
  • 어떠한 연구에서 관심의 대상이 되는 관찰치가 부분적으로 관측 가능할 때 표본선택의 문제가 일어난다. 이러한 자료를 분석하기 위해 헤크만은 표본선택 모형을 개발하였고 이변량 정규분표의 가정 하에 최대우도방법을 사용하여 모수를 추정하였다. 최근 이항자료와 포아송 자료에 대한 표본선택모형이 제안되었다. 이를 분포조정에 기초하여 과대산포 자료에 대한 모형으로 확장하고자 한다. 표본선택이 없는 과대산포 자료는 흔히 음이항 분포로 분석되어진다. 따라서 음이항 분포를 이용하고 분포조정을 도입한 과대산포 자료에 대한 새로운 모형을 제시하고자 한다. 실제 자료를 이용하여 분석을 하였다. 모의실험 결과 프로파일 우도함수를 이용하여 모수에 대해 추정한 결과는 안정적이다.