• 제목/요약/키워드: Variance inflation factor

검색결과 29건 처리시간 0.027초

Diagnostics of partial regression and partial residual plots

  • Lee, Jea-Young;Choi, Suk-Hwa
    • Journal of the Korean Data and Information Science Society
    • /
    • 제11권1호
    • /
    • pp.73-81
    • /
    • 2000
  • The variance inflation factor can be expressed by the square of the ratio of t-statistics associated with slopes of partial regression and partial residual plots. Disagreement of two sides in the interpretation can be occurred, and we analyze it with some illustrations.

  • PDF

Multicollinarity in Logistic Regression

  • Jong-Han lee;Myung-Hoe Huh
    • Communications for Statistical Applications and Methods
    • /
    • 제2권2호
    • /
    • pp.303-309
    • /
    • 1995
  • Many measures to detect multicollinearity in linear regression have been proposed in statistics and numerical analysis literature. Among them, condition number and variance inflation factor(VIF) are most popular. In this study, we give new interpretations of condition number and VIF in linear regression, using geometry on the explanatory space. In the same line, we derive natural measures of condition number and VIF for logistic regression. These computer intensive measures can be easily extended to evaluate multicollinearity in generalized linear models.

  • PDF

Estimation and Variance Estimation for the U.S. Consumer Expenditures Surveys Redesign Research

  • Kim, Jong-Ik
    • Journal of the Korean Statistical Society
    • /
    • 제12권1호
    • /
    • pp.36-45
    • /
    • 1983
  • After every decennial census in the U.S., national surveys such as the Consumer Expenditures surveys are redesigned. The redesigned samples will be multi-stage systematic samples. Many sampling schemes have been proposed for comparison which requires the estimation and variance estiamtion formula. This paper deals with the surveys redesign research which concerns the sample design within the Primary Sampling Unit (PSU). In constructing the estimators it deals with the problem of which first stage inflation factor to use. The expected value of the proposed estimators is also derived.

  • PDF

머신러닝 기반 외식업 프랜차이즈 가맹점 성패 예측 (Prediction of Food Franchise Success and Failure Based on Machine Learning)

  • 안예린;유성민;이현희;박민서
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.347-353
    • /
    • 2022
  • 외식업은 소비자의 수요가 많고 진입장벽이 낮아 창업이 활발하게 일어난다. 하지만 외식업은 폐업률이 높고, 프랜차이즈의 경우 동일 브랜드 내에서도 매출 편차가 크게 나타난다. 따라서 외식업 프랜차이즈의 폐업을 방지하기 위한 연구가 필요하다. 이를 위해, 본 연구에서는 프랜차이즈 가맹점 매출에 영향을 미치는 요인들을 살펴보고, 도출된 요인들에 머신러닝 기법을 활용하여 프랜차이즈의 성패를 예측하고자 한다. 강남구 프랜차이즈 매장의 PoS(Point of Sale) 데이터와 공공데이터를 활용하여 가맹점 매출에 영향을 미치는 여러 요인들을 추출하고, VIF(Variance Inflation Factor)를 활용하여 다중공산성을 제거하여 타당성 있는 변수 선택을 진행한 뒤, 머신러닝 기법 중 분류모델을 활용하여 프랜차이즈 매장의 성패 예측을 진행한다. 이를 통해 최고 정확도 0.92를 가진 프랜차이즈 성패 예측 모델을 제안한다.

중고 벌크선의 가격결정요인 선정에 관한 연구 (A Study on the Selection of Pricing Factors for Used Bulk Carriers)

  • 양윤옥
    • 한국항해항만학회지
    • /
    • 제41권4호
    • /
    • pp.181-188
    • /
    • 2017
  • 기존 선박매매시장에서 선박가격은 최근 거래되는 비슷한 유형의 선박가격을 기반으로 산정되었다. 하지만 2008년 금융위기 이후 선박가격 변동이 심해지면서 선박 내재적 가치를 산정할 수 있는 선박가격평가기준이 필요하다. 본 연구에서는 선박의 내재된 요소를 추정하기 위해 헤도닉가격모형을 사용하였다. 이에 본 연구는 헤도닉가격모형을 이용하여 선박가격에 미치는 영향을 각 특성별 가치를 분석하고 추정모형을 도출하였다. 헤도닉가격모형에서 제시된 4가지 모형들 중에 분산확대인자와 단계선택방식으로 최적의 모형을 선정하였다. 이를 위해 실제 거래된 선박과 특성자료를 활용하여 선박가격에 미치는 결정변수들의 영향력 정도를 분석하였다. 최종 선정된 모형은 Log-Line모형으로 회귀분석결과 DWT, Age, Market Value, Short-Term Charter, Long-Term Charter, Enbloc, Special Survey Due, Builder 8개의 변수가 선박가격모형에 영향을 미치는 것으로 나타났다. 제시한 선박가격모형은 선박가격을 평가할 때 객관적이고 균형있는 의사결정을 하는데 도움이 될 것이다.

선형회귀모형에서 잔차분식에 대한 시스템적 관점 (Systematic View on Residual Plots in Linear Regression)

  • 강명욱;김영일;안철환
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2000년도 춘계공동학술대회 논문집
    • /
    • pp.373-376
    • /
    • 2000
  • We investigate some properties of commonly used residual plots in linear regression and provide some systematic insight into the relationships among the plots. We discuss three issues of linear regression in this stream of context. First of all, we introduce two graphical comparison methods to display the variance inflation factor. Secondly, we show that the role of a suppressor variable in linear regression can be checked graphically. Finally, we show that several other types of standardized regression coefficients, besides the ordinary one, can be obtained in residual plots and the correlation coefficients of one of these residual plots can be used in ranking the relative importance of variables.

  • PDF

A Systematic View on Residual Plots in Linear Regression

  • Myung-Wook;YoungIl;Chul H.
    • Communications for Statistical Applications and Methods
    • /
    • 제7권1호
    • /
    • pp.37-46
    • /
    • 2000
  • We investigate some properties of commonly used residual plots in linear regression and provide some systematic insight into the relationships among the plots. We discuss three issues of linear regression in this stream of context. First of all we introduce two graphical comparison methods to display the variance inflation factor. Secondly we show that the role of a suppressor variable in linear regression can be checked graphiclly. Finally we show that several other types of standardized regression coefficients besides the ordinary one can be obtained in residual plots and the correlation coefficients of one of these residual plots can be used in ranking the relative importance of variables.

  • PDF

유아 기질 및 교사-유아 관계가 유아 리더십에 미치는 영향 (Effect Young Children's Temperament and Teacher-child Relationship on Young Children's Leadership)

  • 고정리
    • 한국콘텐츠학회논문지
    • /
    • 제14권5호
    • /
    • pp.524-540
    • /
    • 2014
  • 본 연구는 유아 기질 및 교사-유아 관계가 유아 리더십에 미치는 영향을 살펴보고자 하는 것이다. 이를 위해 유아기질 검사는 학부모가 설문에 응답하였고, 교사-유아 관계와 유아 리더십은 담임교사와 부담임 교사가 응답하였다. 연구대상은 8곳의 유치원 만 3-5세 유아 333명이다. 유아기질 및 교사-유아 관계, 유아리더십을 검사하기 위한 검사 도구는 선행연구에서 활용된 도구를 바탕으로 본 연구의 목적에 맞게 재구성하여 사용하였고, 이를 근거로 연구 자료를 수집하고 분석하였다. 자료처리는 SPSS Statistics 20 for Windows 프로그램을 이용하여 Scheff$\acute{e}$ 검증, Pearson의 적률상관계수, 다중회귀분석, 공차(Tolerance), 분산팽창지수(Variance Inflation Factor, VIF), 상관계수 등을 실시하였다. 연구결과 유아 기질은 규칙성, 활동성, 지속성, 적응성 순으로 높게 나타났고, 교사-유아관계는 친밀관계, 의존관계, 갈등관계 순으로 나타났다. 리더십은 목표달성능력, 인간관계능력, 통솔력, 재창조능력 순으로 높게 나타났다. 유아의 기질중 적응성, 지속성은 유아의 리더십에 긍정적인 영향을 미치는 것으로 나타났다. 교사-유아 관계에서는 친밀관계와 의존관계가 유아의 리더십에 긍정적인 영향을 미치는 것으로 나타났다. 따라서 유아 리더십 발달에는 기질 면에서 상황변화에 잘 적응하고 안정된 성향과 교사-유아 관계에서 친밀하고 의존적인 관계가 중요함을 알 수 있다.

능형회귀분석을 활용한 부동산 헤도닉 가격모형의 정확성 및 해석력 향상에 관한 연구 - 서울시 구로구 아파트를 대상으로 - (Using Ridge Regression to Improve the Accuracy and Interpretation of the Hedonic Pricing Model : Focusing on apartments in Guro-gu, Seoul)

  • 구본상;신병진
    • 한국건설관리학회논문집
    • /
    • 제16권5호
    • /
    • pp.77-85
    • /
    • 2015
  • 헤도닉 가격 모형은 부동산 가격에 영향을 미치는 여러 요소를 모델링하는데 활용되는 대표적 방법이다. 부동산 가격은 전용면적, 방의 개수, 주차공간과 같은 내재적 속성 뿐 아니라 주변 선호/비선호시설의 존재여부에 따라 영향을 받는다. 주변 입지시설의 경우, 그 영향을 파악하기 위해서는 해당 부동산과의 인접거리를 설명변수로 사용하게 된다. 그러나 다수의 입지시설이 인접해 있는 경우에는 설명 변수 간 다중공선성이 발생하는 문제가 존재한다. 본 연구에서는 분산팽창지수 및 능형회귀분석을 이용해 다중공선성을 파악하고 유의한 설명변수를 선별하는데에 활용하였다. 이들 기법을 서울시 구로구 아파트들에 적용한 결과, 전철 차량 기지, 디지털 단지 및 위도에 해당하는 변수간의 다중공선성을 파악하였으며, 능형회귀분석을 통해 적합한 변수들을 체계적으로 선정할 수 있었다. 본 사례를 통해 상기 기법들이 더 정확하고 적정한 헤도닉 가격 모형을 구축하는데 중요한 보완적 기능을 해준다는 것을 알 수 있다.

대형 데이터에서 VIF회귀를 이용한 신속 강건 변수선택법 (Fast robust variable selection using VIF regression in large datasets)

  • 서한손
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.463-473
    • /
    • 2018
  • 연구에서는 선형회귀모형을 가정한 대형 데이터에서의 변수선택 알고리즘을 다룬다. 방법의 속도와 강건성에 주안점을 둔 여러 알고리즘들이 제안되었다. 그 중에서 streamwise 회귀 접근법을 사용한 VIF회귀는 신속하고 정확하게 수행된다. 그러나 VIF회귀는 최소제곱방법에 의해 모형이 추정되므로 이상치에 민감하다. 변수선택방법의 강건성을 높이기 위해 가중 추정치를 사용한 강건측도가 제안되었으며 강건 VIF회귀도 제안되었다. 본 연구에서는 잠재적 이상치를 탐지하여 제거한 후 VIF회귀를 수행하는, 빠르고 강건한 변수선택 방법을 제안한다. 제안된 방법은 모의실험과 데이터 분석 통해 다른 방법들과 비교된다.