• Title/Summary/Keyword: 선형회귀모형

Search Result 636, Processing Time 0.029 seconds

Bayesian Variable Selection in Linear Regression Models with Inequality Constraints on the Coefficients (제한조건이 있는 선형회귀 모형에서의 베이지안 변수선택)

  • 오만숙
    • The Korean Journal of Applied Statistics
    • /
    • v.15 no.1
    • /
    • pp.73-84
    • /
    • 2002
  • Linear regression models with inequality constraints on the coefficients are frequently used in economic models due to sign or order constraints on the coefficients. In this paper, we propose a Bayesian approach to selecting significant explanatory variables in linear regression models with inequality constraints on the coefficients. Bayesian variable selection requires computation of posterior probability of each candidate model. We propose a method which computes all the necessary posterior model probabilities simultaneously. In specific, we obtain posterior samples form the most general model via Gibbs sampling algorithm (Gelfand and Smith, 1990) and compute the posterior probabilities by using the samples. A real example is given to illustrate the method.

A Stability Test of the Regression Coefficients for the Linear Models using Chow Test (차우검정을 활용한 선형회귀모형간 유사성 검증)

  • Lee, Ki-Young;Lee, Seongkwan Mark;Jeong, So-Young;Heo, Tae-Young
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.16 no.2
    • /
    • pp.73-82
    • /
    • 2017
  • In this research, we tried to check the applicability of a Chow test to the linear models which are generated in the process of transportation planning or traffic flow analyses. The Chow test is a very popular statistical method which is being used to see if the coefficients from two separate linear regression models are equal or not. In order to prove the effectiveness of the Chow test, we found the linear relationships between speed and density under the situations such as driving in daytime and in nighttime on a rainy day. Based on the two months of Joong-Bu Expressway traffic data, we proved that the Chow test is useful to testify the similarity between two linear regression models. And this statistical tool seems to be able to have a very important role in traffic flow analysis or in transportation planning process. Finally, we expect the Chow test be implemented even to the non-linear regression models or to the multi-variate models.

Prediction of damages induced by Snow using Multiple-linear regression and Artificial Neural Network model (다중선형회귀 및 인공신경망 모형을 이용한 대설피해에 따른 피해액 예측에 관한 연구)

  • Kwon, Soon Ho;Lee, Eui Hoon;Chung, Gunhui;Kim, Joong Hoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.20-20
    • /
    • 2017
  • 최근 기후변화 영향에 따라 전 세계적으로 인명피해 및 재산피해를 유발하는 자연재난이 지속적으로 증가하고 있으며, 그로 인한 자연재해의 규모가 점점 더 커지고 있다. 실제로 우리나라에서도 지난 1994 년에서 2013 년까지 지난 20 년간 자연재해에 의한 피해액은 12조 3천억 원으로 집계되었으며, 이 중 강우와 태풍에 의한 피해가 85 % 이고, 대설에 의한 피해는 약 13 % 로 자연재해 중 대부분의 피해는 강우 및 태풍에서 발생하지만, 폭설에 의한 피해도 적지 않은 것으로 나타났다. 이에 따라, 정확한 예측을 위해 신뢰도 높은 자료 구축을 통한 대설피해 예측에 관한 연구가 필요한 시점이다. 본 연구에서는 대설피해액 예측을 위해 우리나라의 63개 기상 관측소에서 관측한 적설심 자료 및 기상관측 자료와 사회 경제 자료 총 11개를 대설피해 예측을 위한 입력변수로 선정하고, 이를 기상관측소가 속한 도시의 면적에 따라 3개의 지역으로 구분하였다. 주성분분석을 활용하여 선정된 입력변수들을 4개의 주성분으로 구분하고, 인공신경망 및 다중선형 회귀 모형을 구성하여 각 지역별 대설피해 예측의 오차를 분석하였다. 적용결과, 인공신경망 모형을 이용한 대설피해 예측의 수정결정계수는 22.8 %~48.2 %를 나타냈고, 다중선형회귀 모형의 수정결정 계수는 9.2 %~39.7% 로 나타났다. 그러므로 인공신경망 모형이 다중회귀 모형보다 선택된 입력자료를 활용하여 대설피해를 예측하는 목적으로 조금 더 우수한 결과를 나타내었다. 향후 자료를 보완 및 모형의 고도화를 통해 보다 정확한 대설피해 예측 함수 개발이 가능할 것으로 기대된다.

  • PDF

Precipitation Analysis Based on Spatial Linear Regression Model (공간적 상관구조를 포함하는 선형회귀모형을 이용한 강수량 자료 분석)

  • Jung, Ji-Young;Jin, Seo-Hoon;Park, Man-Sik
    • The Korean Journal of Applied Statistics
    • /
    • v.21 no.6
    • /
    • pp.1093-1107
    • /
    • 2008
  • In this study, we considered linear regression model with various spatial dependency structures in order to make more reliable prediction of precipitation in South Korea. The prediction approaches are based on semi-variogram models fitted by least-squares estimation method and restricted maximum likelihood estimation method. We validated some candidate models from the two different estimation methods in terms of cross-validation and comparison between predicted values and observed values measured at different locations.

일반화혼합회귀 추정량과 베이지안 회귀추정량의 비교

  • 김주성;김영권
    • Communications for Statistical Applications and Methods
    • /
    • v.3 no.3
    • /
    • pp.1-9
    • /
    • 1996
  • 본 논문에서는 일반화 회귀모형의 회귀모수${\beta}$에 대한 사전정보의 형태에 따른 각 추정량들에 대하여 연구하였다. 먼저 사전정보가 ${\beta}$에 대한 사전분포로 주어지는 경우에 해당하는 베이지안 회귀추정량을 제시하였고, 다른 하나는 ${\beta}$에 대한 사전정보모형으로 선형회귀모형식이 주어진 경우의 일반화 혼합회귀추정량에 대하여 연구하였다. 두가지 경우로부터 얻어진 각 추정량의 정도를 알아보기 위하여 각 추정량의 공분산행렬을 이 용하여 서로 비교하여 보았다. 각 추정량의 분산비들을 이용하여 일반적으로 일반화 혼합회귀추정량이 베이지안 회귀추정량들보다 비교적 작은 분산값을 가진다는 결론을 얻었다.

  • PDF

Generally non-linear regression model containing standardized lift for association number estimation (연관성 규칙 수의 추정을 위한 일반적인 비선형 회귀모형에서의 표준화 향상도 활용 방안)

  • Park, Hee Chang
    • Journal of the Korean Data and Information Science Society
    • /
    • v.27 no.3
    • /
    • pp.629-638
    • /
    • 2016
  • Among data mining techniques, the association rule is one of the most used in the real fields because it clearly displays the relationship between two or more items in large databases by quantifying the relationship between the items. There are three primary quality measures for association rule; support, confidence, and lift. We evaluate association rules using these measures. The approach taken in the previous literatures as to estimation of association rule number has been one of a determination function method or a regression modeling approach. In this paper, we proposed a few of non-linear regression equations useful in estimating the number of rules and also evaluated the estimated association rules using the quality measures. Furthermore we assessed their usefulness as compared to conventional regression models using the values of regression coefficients, F statistics, adjusted coefficients of determination and variation inflation factor.

Density Estimation of Mixture Normal Distribution with Binned Data Using Nonlinear Regression

  • Na, Yeong-Ho;Oh, Chang-Hyeok
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2004.04a
    • /
    • pp.127-130
    • /
    • 2004
  • 혼합정규분포에서 얻어진 히스토그램 자료에서 모수의 추정은 EM 알고리즘 혹은 스프라인 방법이 흔히 이용되고 있다. 본 논문에서는 히스토그램 자료를 비선형회귀모형으로 적합하는 방법을 제시하고, 시뮬레이션으로 제시된 방법과 EM 알고리즘 방법을 비교하였다.

  • PDF

Determining the existence of unit roots based on detrended data (추세 제거된 시계열을 이용한 단위근 식별)

  • Na, Okyoung
    • The Korean Journal of Applied Statistics
    • /
    • v.34 no.2
    • /
    • pp.205-223
    • /
    • 2021
  • In this paper, we study a method to determine the existence of unit roots by using the adaptive lasso. The previously proposed method that applied the adaptive lasso to the original time series has low power when there is an unknown trend. Therefore, we propose a modified version that fits the ADF regression model without deterministic component using the adaptive lasso to the detrended series instead of the original series. Our Monte Carlo simulation experiments show that the modified method improves the power over the original method and works well in large samples.

A Study on the Number of Domestic Food Delivery Services (국내 배달음식 이용건수 분석 및 예측)

  • Kwon, Jaeyoung;Kim, Sinae;Park, Eungee;Song, Jongwoo
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.5
    • /
    • pp.977-990
    • /
    • 2015
  • Food delivery services are well developed in the Republic of Korea, The increase of one person households and the success of app applications influence delivery services these days. We consider a prediction model for the food delivery service based on weather and dates to predict the number of food delivery services in 2014 using various data mining techniques. We use linear regression, random forest, gradient boosting, support vector machines, neural networks, and logistic regression to find the best prediction model. There are four categories of food delivery services and we consider two methods. For the first method, we estimate the total number of delivery services and the posterior probabilities of each delivery service. For the second method, we use different models for each category and combine them to estimate the total number of delivery services. The neural network and linear regression model perform best in the first method, this is followed by the neural network which is the best for the second method. The result shows that we can estimate the number of deliveries accurately based on dates and weather information.

SOH estimation method based on simple linear regression model for high power lithium ion battery (고출력 리튬이온 배터리에 적합한 단순선형회귀모형 기반 SOH 추정 기법)

  • Lee, Pyeong-Yeon;Park, Jin-Hyeong;Yoon, Chan-O;Kim, Jonghoon
    • Proceedings of the KIPE Conference
    • /
    • 2018.07a
    • /
    • pp.246-248
    • /
    • 2018
  • 본 논문에서는 배터리 수명의 지표인 SOH(state of health) 추정 시 배터리 노화에 따라 방전 용량의 급격한 변화가 발생하면 SOH도 변화하게 된다. 이로 인해 잘못된 SOH의 정보를 가지고 오게 되며 배터리의 안정성 및 신뢰성에 문제가 된다. 본 논문에서는 방전 용량과 내부 저항의 선형적 관계를 확인하고, 방전 용량과 내부저항을 고려한 단순선형회귀모형(simple linear regression model)을 모델링하였다. 방전 용량의 급격한 변화나 오프라인 기반 방전 용량을 측정함에 어려움이 있는 경우 단순선형회귀모형에 따라 방전 용량을 추정하여 SOH를 보정하는 기법을 제안하고 이에 대한 검증을 수행하였다.

  • PDF