• Title/Summary/Keyword: 회귀 모형

Search Result 3,363, Processing Time 0.043 seconds

A Two Factor Model with Mean Reverting Process for Stochastic Mortality (평균회귀확률과정을 이용한 2요인 사망률 모형)

  • Lee, Kangsoo;Jho, Jae Hoon
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.3
    • /
    • pp.393-406
    • /
    • 2015
  • We examine how to model mortality risk using the adaptation of the mean-reverting processes for the two factor model proposed by Cairns et al. (2006b). Mortality improvements have been recently observed in some countries such as United Kingdom; therefore, we assume long-run mortality converges towards a trend at some unknown time and the mean-reverting processes could therefore be an appropriate stochastic model. We estimate the parameters of the two-factor model incorporated with mean-reverting processes by a Metropolis-Hastings algorithm to fit United Kingdom mortality data from 1991 to 2015. We forecast the evolution of the mortality from 2014 to 2040 based on the estimation results in order to evaluate the issue price of a longevity bond of 25 years maturity. As an application, we propose a method to quantify the speed of mortality improvement by the average mean reverting times of the processes.

Steal Success Model for 2007 Korean Professional Baseball Games (2007년 한국프로야구에서 도루성공모형)

  • Hong, Chong-Sun;Choi, Jeong-Min
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.3
    • /
    • pp.455-468
    • /
    • 2008
  • Based on the huge baseball game records, the steal plays an important role to affect the result of games. For the research about success or failure of the steal in baseball games, logistic regression models are developed based on 2007 Korean professional baseball games. The analyses of logistic regression models are compared of those of the discriminant models. It is found that the performance of the logistic regression analysis is more efficient than that of the discriminant analysis. Also, we consider an alternative logistic regression model based on categorical data which are transformed from uneasy obtainable continuous data.

Fitting Distribution of Accident Frequency of Freeway Horizontal Curve Sections & Development of Negative Binomial Regression Models (고속도로 평면선형상 사고빈도분포 추정을 통한 음이항회귀모형 개발 (기하구조요인을 중심으로))

  • 강민욱;도철웅;손봉수
    • Journal of Korean Society of Transportation
    • /
    • v.20 no.7
    • /
    • pp.197-204
    • /
    • 2002
  • 교통사고예측 및 예방을 위해서는 실제적으로 도로설계과정에서 제어가 가능한 도로 기하구조요소에 대한 사고관계를 파악함이 타당하다. 즉, 도로의 설계자는 도로건설에 앞서 기하구조요소와 사고와의 관계를 현장자료를 통해 정확히 밝혀 도로설계에 반영해야 한다. 이를 위해, 교통사고의 빈도분포를 박히는 것은 가장 기본이 되는 일이며, 교통사고 예측모형개발에 선행되어야 한다. 일반적으로 교통사고건수의 경우 분산이 평균보다 큰 과분산(overdispersion)의 특징을 가지고 있어 음이항 분포를 따른다고 알려져 있다. 따라서 본 논문은 사고모형의 개발에 앞서, 사고발생지점에 대한 도로설계요소와 기타 잠재적인 사고발생 관련요인이 비교적 잘 파악되어있는 호남고속도로를 중심으로 평면 선형상 곡선부에 대하여 교통사고의 분포를 적합도 검정을 통해 알아보고자 하였다. 사고자료는 한국도로송사의 호남고속도로 5년(1996∼2000)간 자료를 분석에 맞게 정리하였으며, 강민욱과 송봉수(2002)에서 제시한 평면선형에 있어서의 구간분할법을 이용하여 배향곡선구간과 단일곡선구간에 대한 사고분석을 하였다. 적합도 분석결과, 예상대로 음이항분포가 사고건수를 설명하기에 가장 적합한 확률분포로 제시되었으며, 이를 통해 최우추정법을 이용한 음이항회귀모형을 개발하였다. 구간분할법을 적용한 음이항회귀모형의 경우, 기존의 확률회귀토형에 비하여 높은 결정계수를 갖았으며, 모형에서 적용된 기하구조요소로는 차량 노출계수, 곡선반경, 단위거리 당 편경사변화값 등이다.

Pollutant Loads Simulation on Watershed Scale using LOADEST and SWAT (LOADEST와 SWAT 모형을 이용한 유역단위 오염부하량 모의)

  • Kim, Kyeung;Kang, Moon Seong;Song, Jung Hun;Jun, Sang Min
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.288-288
    • /
    • 2016
  • 유역단위 오염부하량 산정에는 SWAT, HSPF 등의 물리적 매개변수 기반 분포형 모형이 주로 사용되고 있으나, 공간분포형 입력자료로 인한 많은 매개변수는 모의 과정을 복잡하게 하며, 보정 과정에 있어 많은 시간과 노력을 요구하는 단점이 있다. 이로 인해 실무에서는 원단위법이나 유량-부하량 관계식과 같은 통계적 분석에 의한 회귀식이 주로 사용되고 있다. 그 중 LOADEST는 회귀식 기반 프로그램으로, 다양한 연구자들에 의해 연구되고 있으나, 수질 모형과의 모의능력을 비교하는 연구는 부족하다. 본 연구에서는 청미천 상류유역을 대상으로 유역특성에 따른 LOADEST 기반 회귀식의 매개변수를 추정하여 오염부하량을 모의하고, SWAT 모형에 의한 오염부하량 모의결과와 비교 평가하고자 한다. 모형의 구동 및 회귀식 매개변수 추정에 필요한 입력 자료는 용인시 백암면 일대에서 2013년부터 2015년까지 모니터링한 수질, 유량 및 기상자료와 지형자료 (토지이용도, 토양도, 수치표고자료)를 이용하여 구축하였다. LOADEST 기반 회귀식의 매개 변수 추정은 김계웅 (2015)이 개발한 방법을 사용하였으며, 유역면적, 토지이용비율 등은 지형자료를 이용하여 산정하였다. SWAT 모형의 보정은 2013년부터 2014년까지의 자료를 이용하였으며, 2015년 자료를 이용하여 검정하였다. 본 연구의 결과는 비점오염원 모델에 대한 이해를 넓히고, 오염부하량 모의를 위한 모형 선정에 있어 도움이 될 수 있을 것으로 기대한다.

  • PDF

An Estimation of the Optimal Hedge Ratio in KOSPI 200 Spot and Futures (KOSPI 200 현(現).선물간(先物間) 최적(最適)헤지비율(比率)의 추정(推定))

  • Chung, Han-Kyu
    • The Korean Journal of Financial Management
    • /
    • v.16 no.1
    • /
    • pp.223-243
    • /
    • 1999
  • 포트폴리오의 위험을 통제하거나 감소시키기 위해서 헤저들은 최적헤지비율을 추정하여야 하는데, 최적헤지비율의 추정치는 사용하는 모형에 따라 많은 차이를 보인다. 전통적인 회귀분석모형에 의하여 추정된 최적헤지비율은 시계열자료의 불안정성(nonstationary) 등으로 인하여 잘못될 가능성이 많으며, 잘못 추정된 헤지비율을 그대로 이용할 경우 현물포트폴리오의 시장위험을 최소화시키지 못하고 헤징비용을 증가시키는 결과를 초래한다. 시계열자료의 불안정성으로 말미암아 야기되는 문제점들을 개선할 수 있는 모형으로서 오차 수정모형(Error Correction Model : ECM)이 널리 이용되고 있다. 본 연구는 ECM을 사용하여 추정된 최적헤지비율과 전통적 회귀분석모형을 사용하여 추정한 최적헤지비율을 비교하여 어떤 모형으로 추정한 헤지비율이 더 정확한지를 평가하는데 목적을 두고 있다. 즉, 본 연구는 KOSPI 200 현 선물지수 자료를 대상으로 ECM과 전통적 회귀분석모형에 의한 최적헤지비율을 추정하고 각 모형의 설명력과 예측력을 비교하고자 한다. 실증분석 결과, KOSPI 200 현물지수와 KOSPI 200 선물지수간에는 공적분 관계가 존재하며, ECM과 전통적 회귀분석모형을 이용하여 추정한 최적헤지비율의 크기는 서로 다르며, ECM을 이용할 때 모형의 설명력이 조금 더 높게 나타났으며, 예측력도 ECM이 좀더 우월한 것으로 나타났다.

  • PDF

Comparison of Different Multiple Linear Regression Models for Real-time Flood Stage Forecasting (실시간 수위 예측을 위한 다중선형회귀 모형의 비교)

  • Choi, Seung Yong;Han, Kun Yeun;Kim, Byung Hyun
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.32 no.1B
    • /
    • pp.9-20
    • /
    • 2012
  • Recently to overcome limitations of conceptual, hydrological and physics based models for flood stage forecasting, multiple linear regression model as one of data-driven models have been widely adopted for forecasting flood streamflow(stage). The objectives of this study are to compare performance of different multiple linear regression models according to regression coefficient estimation methods and determine most effective multiple linear regression flood stage forecasting models. To do this, the time scale was determined through the autocorrelation analysis of input data and different flood stage forecasting models developed using regression coefficient estimation methods such as LS(least square), WLS(weighted least square), SPW(stepwise) was applied to flood events in Jungrang stream. To evaluate performance of established models, fours statistical indices were used, namely; Root mean square error(RMSE), Nash Sutcliffe efficiency coefficient (NSEC), mean absolute error (MAE), adjusted coefficient of determination($R^{*2}$). The results show that the flood stage forecasting model using SPW(stepwise) parameter estimation can carry out the river flood stage prediction better in comparison with others, and the flood stage forecasting model using LS(least square) parameter estimation is also found to be slightly better than the flood stage forecasting model using WLS(weighted least square) parameter estimation.

Bayesian ordinal probit semiparametric regression models: KNHANES 2016 data analysis of the relationship between smoking behavior and coffee intake (베이지안 순서형 프로빗 준모수 회귀 모형 : 국민건강영양조사 2016 자료를 통한 흡연양태와 커피섭취 간의 관계 분석)

  • Lee, Dasom;Lee, Eunji;Jo, Seogil;Choi, Taeryeon
    • The Korean Journal of Applied Statistics
    • /
    • v.33 no.1
    • /
    • pp.25-46
    • /
    • 2020
  • This paper presents ordinal probit semiparametric regression models using Bayesian Spectral Analysis Regression (BSAR) method. Ordinal probit regression is a way of modeling ordinal responses - usually more than two categories - by connecting the probability of falling into each category explained by a combination of available covariates using a probit (an inverse function of normal cumulative distribution function) link. The Bayesian probit model facilitates posterior sampling by bringing a latent variable following normal distribution, therefore, the responses are categorized by the cut-off points according to values of latent variables. In this paper, we extend the latent variable approach to a semiparametric model for the Bayesian ordinal probit regression with nonparametric functions using a spectral representation of Gaussian processes based BSAR method. The latent variable is decomposed into a parametric component and a nonparametric component with or without a shape constraint for modeling ordinal responses and predicting outcomes more flexibly. We illustrate the proposed methods with simulation studies in comparison with existing methods and real data analysis applied to a Korean National Health and Nutrition Examination Survey (KNHANES) 2016 for investigating nonparametric relationship between smoking behavior and coffee intake.

혼합모형의 구간추정을 위한 PROC MIXED의 활용

  • Park, Dong-Jun
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2005.05a
    • /
    • pp.1-6
    • /
    • 2005
  • SAS의 PROC MIXED는 ANOVA 추정량보다 더 다양한 잔차최대우도추정법 또는 최대우도추정법으로 모수들을 추론할 수 있다. 혼합모형에 속하는 불균형중첩오차구조를 갖는 선형회귀모형에서 랜덤효과에 해당되는 그룹간의 분산과 고정효과에 해당되는 회귀계수들에 대한 신뢰구간을 구하기 위하여 대표본인 경우와 소표본인 경우에 대하여 PROC MIXED를 사용한다. 시뮬레이션을 실행한 결과, 대표본인 경우에는 모수들의 신뢰구간을 구하기 위하여 PROC MIXED를 활용할 수 있지만, 소표본인 경우에는 PROC MIXED를 사용할 경우, 그룹간 분산과 회귀계수 가운데 하나인 절편항에 대한 신뢰구간은 시뮬레이터된 신뢰계수가 명시한 신뢰계수를 지키지 못하는 것을 보인다.

  • PDF

Application of geographical and temporal weighted regression model to the determination of house price (지리시간가중 회귀모형을 이용한 주택가격 영향요인 분석)

  • Park, Saehee;Kim, Minsoo;Baek, Jangsun
    • Journal of the Korean Data and Information Science Society
    • /
    • v.28 no.1
    • /
    • pp.173-183
    • /
    • 2017
  • We investigate the factors affecting the price of apartments using the spatial and temporal data of private real estate prices. The factors affecting the price of apartment were analyzed using geographical and temporal weighted regression (GTWR) model which incorporates the temporal and spatial variation. In contrast to the OLS, a general approach used in previous studies, and GWR method which is most widely used for analyzing spatial data, GTWR considers both temporal and spatial characteristics of the house price, and leads to better description of the house price determination. Year of construction and floor area are selected as the significant factors from the analysis, and the house price are affected by them temporally and geographically.