• 제목/요약/키워드: OLS 회귀분석

검색결과 119건 처리시간 0.023초

부산시 실거래 주택매매 가격을 이용한 공간계량모형의 적합도 비교연구 (A Comparative Study on the Goodness of Fit in Spatial Econometric Models Using Housing Transaction Prices of Busan, Korea)

  • 정건섭;김성우;이양원
    • 한국지리정보학회지
    • /
    • 제15권1호
    • /
    • pp.43-51
    • /
    • 2012
  • 주택시장 분석에 널리 사용되는 헤도닉 방법은 OLS(ordinary least squares) 모형을 이용하는데, 이는 오차가 독립적이며, 평균이 0이고, 분산이 일정하다는 가정에 기초한다. 그러나 공간 자기상관이 존재할 경우에는 이러한 가정에 위배되며, 공간효과를 제대로 반영하지 않으면 왜곡된 추정결과를 가져오게 된다. 최근 이에 대한 대안으로 공간계량모형이 도입되고 있는데, 이 연구에서는 OLS 모형과 공간계량모형의 적합도를 비교 평가하고자 한다. 부산시 실거래 주택매매 가격자료를 이용하여 분석한 결과, OLS를 이용한 기존의 헤도닉 모형보다는 공간자기상관을 고려한 공간계량모형들이 보다 설명력이 높았다. Dubin이 제시한 기준과 Log Likelihood 기준을 통해 볼 때 공간계량모형 중에서는 공간자기회귀모형(spatial autoregressive model: SAR)모형의 적합도가 높은 것으로 나타났다. 이를 통해 주택가격에 있어서의 공간효과를 확인할 수 있었으며, 재건축 추진여부가 아파트 매매가격에 매우 큰 영향을 미침을 알 수 있었다. 또한 적절한 공간계량모형의 선택은 정부의 주택정책에 있어서도 매우 중요하다고 하겠다.

베이지안 회귀분석을 이용한 수위-유량 관계곡선의 불확실성 분석 (Identification of Uncertainty in Fitting Rating Curve with Bayesian Regression)

  • 김상욱;이길성
    • 한국수자원학회논문집
    • /
    • 제41권9호
    • /
    • pp.943-958
    • /
    • 2008
  • 본 연구는 수위-유량 관계곡선식의 매개변수 추정을 수행하기 위하여 Bayesian 회귀분석을 적용하였다. 또한 불확실성측면에서의 효과를 탐색하기 위하여 Bayesian 회귀분석에 의한 추정치와 t 분포를 이용하여 산정한 일반 최소자승법(ordinary least square, OLS)에 의한 회귀분석의 추정치를 각각 산정하여 산정결과의 신뢰구간을 비교분석 하였다. 등분산케이스의 통계적 실험결과 t 분포를 이용하여 산정된 평균 추정치와 Bayesian 회귀분석에 의한 평균 추정치는 크게 다르지 않았으나, 비등분산 케이스의 경우에는 Bayesian 회귀분석이 참값에 가까운 추정치를 산정함을 알 수 있었다. 또한 불확실성 측면에서 평가해 볼 때 신뢰구간의 상한추정치와 하한추정치의 차이는 Bayesian 회귀분석을 사용한 경우가 기존 방법을 사용한 경우보다 작은 것으로 나타났으며, 이로부터 수위-유량 관계곡선식의 매개변수를 추정하는 경우 Bayesian 회귀분석이 일반 회귀분석보다 불확실성을 표현하는데 있어서 우수하다는 결과를 얻을 수 있었다. 적용된 두 가지의 추정방법은 비등분산성을 고려한 통계적 실험을 통하여 장점과 단점이 비교되었으며, 안양천 유역의 5개 지점으로부터 얻어진 유량측정성과를 이용하여 적용성을 알아보았다. 현장 적용결과는 참값을 알지 못하므로 정량적 우수성은 평가할 수 없었으나, 기존에 사용되는 불확실성 산정방법보다 Bayesian 회귀 분석 불확실성은 감소시켜 나타냄을 알 수 있었다.

한국노동패널자료를 활용한 국내 운송업 고용생산성 결정요인 분석 (An Analysis of the Determinants of Employment Productivity in Korean Transportation Industry Using Korea Labor and Income Panel Study)

  • 소애림;신승식
    • 한국항만경제학회지
    • /
    • 제35권1호
    • /
    • pp.57-76
    • /
    • 2019
  • 본 연구는 우리나라 산업 발전에 크게 기여한 운송산업의 주체인 운송업 종사자의 고용생산성 결정요인에 대해 다룬다. 본 연구는 노동패널자료를 활용해 운송업의 고용생산성 결정요인을 선정하고 패널 로지스틱 회귀 모형(Panel Logistic Regression), Panel OLS 모형, Panel Robust regression 모형을 활용하여 요인 간 영향력을 분석하였다. 분석 결과는 다음과 같다. 첫째, 정규직 여부의 경우 '학력'이 높을수록, '노조가입' 할수록, '직업훈련 경험'이 있을수록 긍정적인 효과가 나타난 것으로 분석되었다. 둘째, 고용안정성은 '학력'이 높고 '노조가입' 할수록 긍정적인 영향이 미치는 것으로 조사되었으며, '회사규모'가 크고 '기혼'일 경우 고용안정성이 큰 것으로 분석되었다. 셋째, 소득생산성의 경우 '나이', '학력', '회사규모'의 값이 클수록 긍정적인 영향을 미치고 '직업훈련 이외의 교육', '건강상태'의 값이 클수록 부정적인 영향을 미치는 것으로 분석되었다. 넷째, 직무만족도의 경우는 '여성'일수록, '노조가입' 할수록, '소득'이 높을수록, '고용안정성'이 높을수록 높았고, '보통사람대비 건강상태'가 좋을수록, '전반적 생활만족도'와 '경제적 수준'이 높을수록 직무만족도는 낮은 것으로 분석되었다. 본 연구에서 도출한 운송산업 고용생산성 결정요인의 분석과 향상 방안 모색을 통해 운송업 고용 생산성 향상에 기여할 수 있을 것으로 생각된다.

지가 추정을 위한 공간내삽법의 정확성 평가 (Evaluating the Accuracy of Spatial Interpolators for Estimating Land Price)

  • 전병운
    • 한국지리정보학회지
    • /
    • 제20권3호
    • /
    • pp.125-140
    • /
    • 2017
  • 지금까지 지가나 주택가격을 추정하는데 회귀모형 기반 공간내삽법과 크리깅(Krging) 기반 공간내삽법이 많이 사용되었지만, 이들 공간내삽법의 성능을 서로 비교한 연구는 거의 없는 실정이다. 따라서 본 연구는 대구시 달서구를 사례로 지가를 추정하는데 회귀모형 기반 공간내삽법과 크리깅 기반 공간내삽법을 적용해 보고 그 정확성을 평가하였다. 회귀모형 기반 공간내삽을 위해 최소자승모형(OLS), 공간지체모형(SLM), 공간오차모형(SEM), 지리가중회귀모형(GWR)을 사용하였고, 크리깅 기반 공간내삽을 위해 단순 크리깅(SK), 정규 크리깅(OK), 일반 크리깅(UK), 공동 크리깅(CK)을 이용하였다. 먼저, 전역적 정확성 지수인 평균 제곱근 오차(RMSE), 수정된 평균 제곱근 오차(adjusted RMSE), 분산지수(COD)를 이용하여 그 정확성을 통계적으로 평가하였다. 다음으로, 3차원 잔차도와 산점도를 이용하여 그 정확성을 시각적으로 서로 비교하였다. 통계적 및 시각적 분석결과에 의하면, 공간적 의존성을 반영할 수 있는 공간회귀모형(SAR)과 크리깅 기법들 보다 공간적 이질성을 고려할 수 있는 GWR이 사례지역에서 지가를 추정하는데 상대적으로 정확한 공간내삽방법인 것으로 나타났다. 본 연구의 결과는 지가를 통해 도시의 공간구조를 분석하는 이차적 연구에 기여할 것이다.

기업의 규모와 산업이 장애인 고용률에 미치는 영향 -장애인 1인 이상 의무고용기업체를 중심으로- (The Effects of Enterprise Size and Industry on the Employment Rate of People with Disabilities -Focusing on the Enterprises with Disability Employment Obligation That Hire at Least One Person with Disabilities-)

  • 권기돈;김호진
    • 한국사회복지학
    • /
    • 제66권1호
    • /
    • pp.251-276
    • /
    • 2014
  • 연구는 기업 규모가 클수록 장애인 고용률이 하락한다는 장애인 고용계의 상식을 상세히 재검토한다. 이러한 상식은 기업 규모와 산업 유형의 교호작용에 대한 고려 없이, 통상적인 다중회귀분석을 통해 형성되었다. 이 연구는 기업규모별 장애인 고용률이 통상적 회귀분석의 가정인 자료의 선형성과 등분산성을 위반한다는 사실을 밝힌 후, 일반 선형회귀모형, 가중회귀모형, 다항로짓모형을 사용하여 자료를 설명하는 데 적합한 모형을 찾고자 했다. 또한 경로모형 분석을 통해 고용률에 대한 기업 규모의 직간접적 효과가 산업별로 어떻게 나타나는지도 확인하였다. 분석 결과, 기업 규모와 산업 유형의 교호작용을 모형에 추가할 경우, 상시근로자 100인 이상의 기업에 대해 규모는 장애인 고용률에 유의한 영향을 미치지 않았으며, 업무 환경, 장애인 고용으로 인한 도움, 장애에 대한 배려, 제도/정책에 대한 인지와 같은 요인들이 기업의 규모보다 더 중요한 것으로 나타났다. 향후의 장애인 고용 연구와 정책 이행에서는 기업의 규모 못지않게 산업 및 방금 열거한 요인들에 더 많은 주의를 기울여야 한다.

  • PDF

KRUGLYAK과 LANDER의 유전연관성 비모수 방법과 반복 자료를 고려한 가중 회귀분석법의 비교 (Comparisons of Kruglyak and Lander's Nonparametric Linkage Test and Weighted Regression Incorporating Replications)

  • 최은경;송혜향
    • 응용통계연구
    • /
    • 제21권1호
    • /
    • pp.1-17
    • /
    • 2008
  • 형제 쌍(sibpair)의 연속형 형질(continuous traits) 자료를 이용한 유전연관성 검정 법(linkage test)으로서 Haseman과 Elston (1972)의 최소제곱(ordinary least square, OLS) 회귀분석법이 주로 사용된다. 비모수적 방법으로서 제시된 Kruglyak과 Lander (1995)의 검정통계량은 Haseman과 Elston (1972)의 방법에 대응되는 방법처럼 보이지만 실제로는 매우 다르다. 본 논문에서는 Kruglyak와 Lander (1995)의 검정통계량과 Haseman과 Elston (1972)의 검정통계량의 관계를 설명하고 모의실험으로 두 검정통계량의 검정력을 비교한다. 유전연관성에 사용되는 형제 자료의 특징은 한정된 설명변수의 값에 매우 많은 자료가 반복(replicated)되었다는 점이며, 이러한 반복 자료에 더욱 적절한 가중 회귀분석법을 제안한다. 가중 회귀분석법의 효율성을 정규분포 또는 정규분포가 아닌 연속형 형질 모의실험 자료로 알아본 결과 형제 쌍 자료의 유전연관성 검정에서 가중 회귀분석법이 다른 검정법들보다도 검정력이 높음을 확인하였다.

GWR을 활용한 NDVI와 지형·태양광도의 상관성 평가 : 금강산 지역을 사례로 (Exploring NDVI Gradient Varying Across Landform and Solar Intensity using GWR: a Case Study of Mt. Geumgang in North Korea)

  • 김준우;엄정섭
    • 대한공간정보학회지
    • /
    • 제21권4호
    • /
    • pp.73-81
    • /
    • 2013
  • 식생의 분포와 지형 태양광도의 상관성을 규명하는 것은 공간적 이질성을 내포하는 공간데이터의 분석이지만 기존의 많은 선형모델들은 이들 데이터가 갖는 공간적 특성을 고려하지 못하고 있다. 이러한 문제점을 극복하기 위해 금강산을 대상으로 식생분포를 정량적으로 나타내는 NDVI(Normalized Difference Vegetation Index)와 일사량, 일조시간, 고도, 경사에 대하여 지리가중회귀분석(GWR : Geographically Weighted Regression)을 실시하였다. GWR 은 전역적 모형인 OLS(Ordinary Least Squares)에 비해 모형의 설명력과 적합성이 확연히 높아졌으며, 잔차의 공간적 자기상관성 또한 해소된 것으로 나타났다. OLS 분석결과는 NDVI에 미치는 지형 태양광도의 영향력을 연구지역에서 단일하게 추정하였으나, GWR은 각 인자가 NDVI에 미치는 영향력을 국지적으로 보다 세밀하게 추정하여 공간단위에 따른 각 인자의 영향력을 보다 확연히 나타내었다. 국지적 차원에서 추정된 NDVI와 지형 태양광도의 상관성은 식생분포를 조사하는 과정에서 보다 객관적이고 세밀한 분석을 위한 중요한 참고자료로 사용될 수 있을 것이다.

다중 스케일 지리가중회귀 모형과 KT 측정기 자료를 활용한 대구시 미세먼지에 대한 환경적 형평성 분석 (Environmental Equity Analysis of Fine Dust in Daegu Using MGWR and KT Sensor Data)

  • 조은아;전병운
    • 한국지리정보학회지
    • /
    • 제26권4호
    • /
    • pp.218-236
    • /
    • 2023
  • 본 연구는 다중 스케일 지리가중회귀(MGWR: Multi-scale Geographically Weighted Regression) 모형과 KT(Korea Telecom Corporation) 측정기 자료를 활용하여 대구시를 사례로 미세먼지(PM10)에 대한 환경적 형평성을 분석하였다. 미세먼지를 측정하기 위한 기존의 국가 측정망 자료는 넓은 지역에서 드물게 분포하는 적은 수의 관측지점에서 수집된다. 이러한 단점을 보완하기 위하여 많은 수의 관측지점이 조밀하게 분포하는 KT 측정기 자료를 본 연구에서 사용하였다. MGWR 모형은 미세먼지의 농도와 사회경제적 변수 간의 공간적 관계에 있어서 공간적 이질성과 다중 스케일 맥락 효과를 다루기 위하여 사용되었다. 분석 결과에 의하면, 대구시에서 지가 및 외국인 비율과 관련하여 미세먼지의 분포에 따른 환경적 불형평성이 나타났다. 또한, MGWR 모형이 미세먼지의 농도와 사회경제적 변수 간의 공간적 관계를 설명하는데 있어서 OLS(Ordinary Least Square: 최소자승법)와 GWR(Geographically Weighted Regression: 지리가중회귀) 모형 보다 나은 설명력을 보였다. 본 연구는 미세먼지를 측정하기 위한 기존의 국가 측정망 자료의 보완자료로서 KT 측정기 자료의 가능성을 논증하였다.

지리적가중회귀분석을 이용한 관외입원진료비 비율의 지역 간 차이 분석 (Analysis on the Regional Variation of the Rate of Inpatient Medical Costs in Local-Out: Geographically Weighted Regression Approach)

  • 조은경;이광수
    • 보건의료산업학회지
    • /
    • 제8권2호
    • /
    • pp.11-22
    • /
    • 2014
  • This study purposed to analyze the regional variation of the local-out rates of inpatient services. Multiple data sources collected from National Health Insurance Corporation and statistics Korea were merged to produce the analysis data set. The unit of analysis in this study was city, Gun, Gu, and all of them were included in analysis. The dependent variable measured the local-out rate of inpatient cost in study regions. Local environments were measured by variables in three dimensions: provider factors, socio-demographic factors, and health status. Along with the traditional ordinary least square (OLS) based regression model, geographically weighted regression (GWR) model were applied to test their effects. SPSS v21 and ArcMap v10.2 were applied for the statistical analysis. Results from OLS regression showed that most variables had significant relationships with the local-out rate of inpatient services. However, some variables had shown diverse directions in regression coefficients depending on regions in GWR. This implied that the study variables might not have consistent effects and they may varied depending the locations.

동적요인모형에 기반한 한국의 GDP 성장률 예측 (Forecasting Korea's GDP growth rate based on the dynamic factor model)

  • 이경서;임예지
    • 응용통계연구
    • /
    • 제37권2호
    • /
    • pp.255-263
    • /
    • 2024
  • GDP는 한 나라의 가계, 기업, 정부 등 모든 경제 주체가 일정 기간 동안 창출한 재화와 서비스의 시장 가치의 합을 나타낸다. GDP를 통하여 국가의 경제 규모를 파악할 수 있으며, 정부의 정책 방향에 영향을 미치는 대표적인 경제 지표이므로 이에 대한 연구가 다양하게 이루어지고 있다. 본 논문에서는 G20 국가들의 주요 거시경제 지표를 활용하여 dynamic factor model 기반의 GDP 성장률 예측 모델을 제시하였다. 추출된 factor를 다양한 회귀분석 방법론과 결합하여 그 결과들을 비교하였으며, 기존의 전통적인 시계열 예측방법인 ARIMA 모델, common component를 이용한 예측 등도 함께 비교하였다. COVID 이후 지표의 변동성이 큰 점을 고려하여 예측 시기를 COVID 전후로 나누었으며, 그 결과 factor에 대해 ridge regression과 lasso regression을 적용하여 예측한 경우 가장 좋은 성능을 나타내었다.