• 제목/요약/키워드: Gamma regression model

검색결과 69건 처리시간 0.035초

상대오차예측을 이용한 자동차 보험의 손해액 예측: 패널자료를 이용한 연구 (Predicting claim size in the auto insurance with relative error: a panel data approach)

  • 박흥선
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.697-710
    • /
    • 2021
  • 상대오차를 이용한 예측법은 상대오차(혹은 퍼센트오차)가 중요시되는 분야, 특히 계량경제학이나 소프트웨어 엔지니어링, 또는 정부기관 공식통계 부분에서 기존 예측방법 외에 선호되는 예측방법이다. 그 동안 상대오차를 이용한 예측법은 선형 혹은 비선형 회귀분석 뿐 아니라, 커널회귀를 이용한 비모수 회귀모형, 그리고 정상시계열분석에 이르기까지 그 범위가 확장되어 왔다. 그러나, 지금까지의 분석은 고정효과(fixed effect)만을 고려한 것이어서 임의효과(random effect)에 관한 상대오차 예측법에 대한 확장이 필요하였다. 본 논문의 목적은 상대오차예측법을 일반화선형혼합모형(GLMM)에 속한 감마회귀(gamma regression), 로그정규회귀(lognormal regression), 그리고 역가우스회귀(inverse gaussian regression)의 패널자료(panel data)에 적용시키는데 있다. 이를 위해 실제 자동차 보험회사의 손해액 자료를 사용하였고, 최량예측량과 최량상대오차예측량을 각각 적용-비교해 보았다.

건강검진이 개인 의료비지출에 미치는 영향 (The Association between Health Examination and Personal Medical Cost through Panel Survey)

  • 이환형;박재용
    • 보건행정학회지
    • /
    • 제24권1호
    • /
    • pp.35-46
    • /
    • 2014
  • Background: This paper describes the relationship and effect of health examination on personal medical cost by identifying the difference of the cost for medical care in physician visit between the population without and with health examination. Methods: After classifying into three cohorts in which, independent variables were designed according to the Andersen's behavioral model, the association of personal medical cost for medical care and prescription drugs which is dependent variable was analyzed by t-test and Mann-Whitney test for description and gamma regression model for inference. Results: In personal average medical cost, the population with health examination paid significantly more than without health examination, 11.6% more in cohort 2008, 26.6% more in cohort 2009, and 48.0% more in combined cohort. The odds ratio on medical expenditure of outpatients with health examination was 1.067, 1.126, 1.398 significantly in cohort 2008, 2009, and combined cohort respectively, comparing to the group without health examination. In independent variables, that is female, the elderly, never married, non-working, non-metropolitan, the higher family income, the smaller family size, people with disability, the people with chronic disease, and people with health examination have significantly being paid more tendency showing positive association with medical cost. Conclusion: This result showed that medical expenditure in physician visit has been increased after taking a health examination. Therefore reasonable limitation of getting preventive medical service is suggested to avoid medical shopping around and reduce being repeated health examination by unifying control to find out easily the clinical results from various medical facilities.

로지스틱회귀모형의 변수선택에서 로그-오즈 그래프를 통한 로그-밀도비 연구 (A study on log-density with log-odds graph for variable selection in logistic regression)

  • 강명욱;신은영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.99-111
    • /
    • 2012
  • 반응변수가 주어졌을 때 설명변수의 조건부 확률분포의 로그-밀도비는 로지스틱회귀모형에서 어떤 설명변수가 어떻게 모형에 포함되는지에 대한 변수선택문제에서 유용한 정보를 제공한다. 설명변수의 조건부 확률분포가 좌우대칭이 아닌 경우 감마분포로 가정하는 것이 적절하고 이 경우 x항과 log(x)항이 모형에 포함되어야 한다. 로그-오즈 그래프는 변수선택문제를 연구하는데 매우 중요한 도구가 된다. 이러한 그래픽적 연구에 의하면, x|y = 0과 x|y = 1의 두 분포가 겹치는 경우에서는 x항과 log(x)항 모두 필요하다. 그리고 두 분포가 분리된 경우에는 x항 또는 log(x)항 중 하나만 필요하다.

Joint Modeling of Death Times and Counts Using a Random Effects Model

  • Park, Hee-Chang;Klein, John P.
    • Journal of the Korean Data and Information Science Society
    • /
    • 제16권4호
    • /
    • pp.1017-1026
    • /
    • 2005
  • We consider the problem of modeling count data where the observation period is determined by the survival time of the individual under study. We assume random effects or frailty model to allow for a possible association between the death times and the counts. We assume that, given a random effect, the death times follow a Weibull distribution with a rate that depends on some covariates. For the counts, given the random effect, a Poisson process is assumed with the intensity depending on time and the covariates. A gamma model is assumed for the random effect. Maximum likelihood estimators of the model parameters are obtained. The model is applied to data set of patients with breast cancer who received a bone marrow transplant. A model for the time to death and the number of supportive transfusions a patient received is constructed and consequences of the model are examined.

  • PDF

ALTERATION MODELS TO PREDICT LACTATION CURVES FOR DAIRY COWS

  • Sudarwati, H.;Djoharjani, T.;Ibrahim, M.N.M.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제8권4호
    • /
    • pp.365-368
    • /
    • 1995
  • Lactation curves of dairy cows were generated using three models, namely; incomplete gamma function (model 1), polynomial inverse function (model 2) and non-linear regression (model 3). Secondary milk yield data of 27 cows which had completed 6 lactations were used in this study. Milk yield records (once a week) throughout the lactation and from the first three months of lactation were fitted to the models. Estimation of total milk yield by model 3 using the data once a week throughout the lactation resulted in smaller % bias and standard error than those generated from model 1 and 2. But, model 2 was more accurate in predicting the 305-day milk yield equivalent closer to actual yields with smaller bias % and error using partial records up to 3 months. Also, model 2 was able to estimate the time to reach peak yield close to the actual data using partial records and model 2 could be used as a tool to advise farmers on appropriate feeding and management practices to be adopted.

복부초음파 영상에서 담낭담석을 예측하는 혈액학적 수치의 분석 (Analysis of Hematological Factor to Predict of the Gallbladder Stone in Abdominal Ultrasound Images)

  • 안현;황철환;임인철
    • 한국방사선학회논문지
    • /
    • 제11권3호
    • /
    • pp.131-137
    • /
    • 2017
  • 본 연구는 부산 경남지역의 담낭담석의 위험인자를 알아보고자 하였다. 실험대상은 2016년 6월~12월까지 2016년 12월까지 부산 P병원을 내원하여 복부초음파를 실시한 대상으로 하였다. 그 중 복부초음파와 혈청학적 검사를 동시에 실시한 353명을 대상으로 위험인자를 분석하였다. 초음파 검사 상 담낭담석과 관련있는 위험인자들의 통계분석은 독립표본 t검정(independent t-test)과 카이제곱 검정(chi-square test)을 시행하였다. 차이검정 결과를 고려하여 독립변수에 대한 상대 위험비(odds ratio, OR) 산출을 위해 다중 로지스틱 회귀분석(multiple logistic regression analysis)을 시행하여 변수들로부터 예측모형을 산정하여 타당성을 검정하였다. 그 결과 담낭담석 위험인자로 확인된 연령, ${\gamma}GTP$로 예측모형 및 예측 확률값을 산출하였다. 연령에서 민감도 49.7%, 특이도 82.2%를 보였으며, ROC 곡선하면적이 0.724를 나타내었다. ${\gamma}GTP$에서는 민감도 69.3%, 특이도 62.4%를 보였으며, ROC 곡선하면적이 0.699를 나타내어 예측모형의 타당성을 확인할 수 있었다.

고속도로 커브구간에서 운전자의 운전부하와 감마파 특성분석에 관한 연구 (The Analysis of Driving Workload and Gamma Waves on Curved Sections in Expressway)

  • 강학건;남궁문;김원철;왕위걸
    • 대한교통학회지
    • /
    • 제34권6호
    • /
    • pp.560-569
    • /
    • 2016
  • 운전자의 정신부하는 교통사고를 감소하는데 중요한 역할을 하는 것으로 선행연구에서 나타나고 있다. 본 연구에서는 도로 및 환경요소 뿐만 아니라 운전자의 알파파, 베타파, 감마파를 측정할 수 있는 운전시뮬레이터를 활용하여 분석자료를 확보하였다. 운전자의 운전부하와 감마파의 연관성을 분석하기 위한 방법으로 로지스틱모형을 적용하였다. 분석결과, 도로의 커브가 많을수록 운전자의 베타 영역은 증가하는 반면 알파와 감마 영역은 감소되는 것으로 나타났다. 그리고, 운전부하는 감마영역과 음의 상관관계를 지닌 것으로 나타났다. 결론적으로, 직선구간에서의 도로주행이 운전자의 스트레스를 줄이고 행복감을 높일 수 있을 것으로 판단된다.

특성화고 학생의 수학교과에 대한 태도 조사 (Mathematics education attitude of the students in the specialized high school)

  • 김민석;오광식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권6호
    • /
    • pp.1173-1181
    • /
    • 2012
  • 특성화고등학교와 일반계고등학교 학생들의 수학교과에 대한 태도를 비교 검토하고, 수학교과의 기초학습능력에 영향을 주는 요인을 파악하여, 특성화고에서 수학교과를 가르치는 교사들에게 효율적으로 수학교과를 교수 학습하는 방안을 마련하는 기초자료를 제공하고자 한다. 고등학생 654명을 대상으로 설문조사를 실시하여 통계분석하였다. 설문지에 대한 타당성과 신뢰성을 검토하고, 그 자료에 대하여 카이제곱검정과 감마값을 통하여 학교급 및 학년과 내 외적 요인들의 관련성을 분석한다. 또한 수학교과 기초학습능력이 학교급과 학년사이에 차이가 있는지 일반화선형모형을 적합해 본다. 그리고 기초학습능력에 영향을 주는 내 외적 요인을 회귀분석의 단계적 변수선택방법을 이용하여 찾아본다.

수도(水稻) 적정시비량(適正施肥量) 결정(決定)에 대한 대체모형(代替模型) (An Alternative Model for Determining the Optimal Fertilizer Level)

  • 장석환
    • 한국토양비료학회지
    • /
    • 제13권1호
    • /
    • pp.21-32
    • /
    • 1980
  • Linear models, with and without site variables, have been investigated in order to develop an alternative methodology for determining optimal fertilizer levels. The resultant models are : (1) Model I is an ordinary quadratic response function formed by combining the simple response function estimated at each site in block diagonal form, and has parameters [${\gamma}^{(1)}_{m{\ell}}$], for m=1, 2, ${\cdots}$, n sites and degrees of polynomial, ${\ell}$=0, 1, 2. (2) Mode II is a multiple regression model with a set of site variables (including an intercept) repeated for each fertilizer level and the linear and quadratic terms of the fertilizer variables arranged in block diagonal form as in Model I. The parameters are equal to [${\beta}_h\;{\gamma}^{(2)}_{m{\ell}}$] for h=0, 1, 2, ${\cdots}$, k site variable, m=1, 2, ${\cdots}$ and ${\ell}$=1, 2. (3) Model III is a classical response surface model, I. e., a common quadratic polynomial model for the fertilizer variables augmented with site variables and interactions between site variables and the linear fertilizer terms. The parameters are equal to [${\beta}_h\;{\gamma}_{\ell}\;{\theta}_h$], for h=0, 1, ${\cdots}$, k, ${\ell}$=1, 2, and h'=1, 2, ${\cdots}$, k. (4) Model IV has the same basic structure as Mode I, but estimation procedure involves two stages. In stage 1, yields for each fertilizer level are regressed on the site variables and the resulting predicted yields for each site are then regressed on the fertilizer variables in stage 2. Each model has been evaluated under the assumption that Model III is the postulated true response function. Under this assumption, Models I, II and IV give biased estimators of the linear fertilizer response parameter which depend on the interaction between site variables and applied fertilizer variables. When the interaction is significant, Model III is the most efficient for calculation of optimal fertilizer level. It has been found that Model IV is always more efficient than Models I and II, with efficiency depending on the magnitude of ${\lambda}m$, the mth diagonal element of X (X' X)' X' where X is the site variable matrix. When the site variable by linear fertilizer interaction parameters are zero or when the estimated interactions are not important, it is demonstrated that Model IV can be a reasonable alternative model for calculation of optimal fertilizer level. The efficiencies of the models are compared us ing data from 256 fertilizer trials on rice conducted in Korea. Although Model III is usually preferred, the empirical results from the data analysis support the feasibility of using Model IV in practice when the estimated interaction term between measured soil organic matter and applied nitrogen is not important.

  • PDF

제주도 북동부 연안에서 추동계 파랑특성과 JONSWAP 스펙트럼의 적용성 평가 (Evaluation of Wave Characteristics and JONSWAP Spectrum Model in the Northeastern Jeju Island on Fall and Winter)

  • 강동협;이병걸
    • 한국해양환경ㆍ에너지학회지
    • /
    • 제17권2호
    • /
    • pp.63-69
    • /
    • 2014
  • 제주도 북동부 연안에서 추 동계에 관측된 파랑자료를 주파수 분석을 통해 파랑의 특성을 검토하였다. 그리고 최대파고를 산정하기 위해 1차 회귀식을 이용하여 유의파고와 최대파고를 비를 계산하였다. 또한, JONSWAP 스펙트럼을 계산하기 위해 계산 된 유의파고와 첨두주파수를 이용하여 관측해역에 맞는 ${\gamma}$값을 추정하였다. 그 결과, 유의파고의 경우 1 m이하의 파랑이 가장 높은 빈도를 가지고 발생하였으며, 1차 관측 시 평균 0.523 m로 관측이 되었고, 2차 관측 시 평균 0.423 m로 관측이 되었다. 그 중 가장 높은 유의파고는 9월 15일부터 9월 17일까지 발생된 태풍으로 인해 4.8 m로 관측되었다. 첨두주파수의 경우 0.12~0.15 Hz(주기는 약 6.67~8.33초)가 가장 높은 빈도로 나타났으며, 유의파고와 첨두 주파수를 이용하여 계산 된 ${\gamma}$값은 평균 2.72를 나타내고 있다. 또한 직선 회귀 식을 이용해 계산 된 유의파고와 최대파고의 비는 $1.635H_s$로 계산되었다.