• 제목/요약/키워드: Panel Regression Model

검색결과 390건 처리시간 0.029초

회귀나무 모형을 이용한 패널데이터 분석 (Panel data analysis with regression trees)

  • 장영재
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1253-1262
    • /
    • 2014
  • 회귀나무 (regression tree)는 독립변수로 이루어진 공간을 재귀적으로 분할하고 해당 영역에서 종속변수의 최선의 예측값을 찾고자 하는 비모수적 방법론이다. 회귀나무 모형이 제안된 이래 로지스틱 회귀나무모형이나 분위수 회귀나무모형과 같이 유연하고 다양한 모형적합을 위한 연구가 진행되어 왔다. 최근에 들어서는 Sela와 Simonoff (2012)의 RE-EM 알고리즘, Loh와 Zheng (2013)의 GUIDE 등 패널데이터와 관련하여 진일보한 나무모형 알고리즘도 제안되었다. 본 논문에서는 각 알고리즘을 소개하고 특징을 살펴보는 한편, 실험 데이터를 생성하여 평균제곱오차 (mean squared error)를 바탕으로 예측력을 비교하였다. 분석결과, RE-EM 알고리즘의 예측력이 상대적으로 우수하게 나타났다. 이 알고리즘을 통해 기업경기실사지수 업종별 패널자료를 분석한 결과 최근의 업황에 가장 큰 영향을 미치는 요소는 매출 실적으로 나타났으며 매출 상위 그룹의 경우 비제조업이 제조업에 비해 업황에 대한 판단이 긍정적인 것으로 나타났다.

A Bayesian inference for fixed effect panel probit model

  • Lee, Seung-Chun
    • Communications for Statistical Applications and Methods
    • /
    • 제23권2호
    • /
    • pp.179-187
    • /
    • 2016
  • The fixed effects panel probit model faces "incidental parameters problem" because it has a property that the number of parameters to be estimated will increase with sample size. The maximum likelihood estimation fails to give a consistent estimator of slope parameter. Unlike the panel regression model, it is not feasible to find an orthogonal reparameterization of fixed effects to get a consistent estimator. In this note, a hierarchical Bayesian model is proposed. The model is essentially equivalent to the frequentist's random effects model, but the individual specific effects are estimable with the help of Gibbs sampling. The Bayesian estimator is shown to reduce reduced the small sample bias. The maximum likelihood estimator in the random effects model is also efficient, which contradicts Green (2004)'s conclusion.

패널회귀모형에서 최대엔트로피 추정량에 관한 연구 (A Study of Generalized Maximum Entropy Estimator for the Panel Regression Model)

  • 송석헌;전수영
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.521-534
    • /
    • 2006
  • 횡단면 자료와 시계열 자료가 병합된 패널회귀모형을 다루는 대부분의 연구들에서 사용되고 있는 자료는 완전한 자료를 고려하고 있다. 그러나, 실제적으로 완전한 자료보다는 불완전한 자료가 많다. 이러한 상황을 고려하지 않고 통계적인 추론을 하게 되면 잘못된 결론이 도출될 수 있다. 따라서, 자료의 형태를 충분히 고려한 추정량을 바탕으로 자료를 분석해야 한다. 본 연구는 패널회귀모형에서 자료가 불완전 상태인 경우 최대 엔트로피 형식을 이용한 일반화최대엔트로피 추정량을 제안하고, 추정량들의 효율성을 모의실험을 통하여 비교하였다. 모의실험 결과, 일반화 최대엔트로피 추정량이 가장 안정적이고 효율적인 추정량임을 보여주었다.

항만 SOC가 수출입에 미치는 영향 실증분석 - 일본 항만을 중심으로 - (An Empirical Study of Port SOC Impact on Trade Volume : Focusing on Japanese Ports)

  • 안영균;이주원
    • 무역학회지
    • /
    • 제41권5호
    • /
    • pp.373-389
    • /
    • 2016
  • 본 연구는 총 무역액 중 95% 이상이 해상 수송되는 현실을 바탕으로, 해상 수송의 근간이 되는 항만의 자본스톡과 무역 규모 간의 회귀분석을 수행하는 논문이다. 패널 데이터 분석 및 고정 효과 모형 분석을 통해 항만 SOC가 무역 규모에 어떠한 영향을 미치는지를 실증분석 하였다. 항만 SOC를 6개 부문별로 분류하고, 장래 부문별 투자가 이루어졌을 때 무역 규모는 각각 얼마만큼의 영향을 받는 지를 추정하였다. 이와 더불어 LR(Likelihood ratio) 검정을 실시하여 고정효과 모형(Fixed Effects Model)을 통해 회귀분석 하였다.

  • PDF

국내 지역별 도로운송네트워크가 지역경제에 미치는 영향: SNA 및 공간패널회귀모형의 적용 (A Study on Road Transport Network And Economy effect in Korea: Application of SNA and Spatial Panel Regression)

  • 오진호;안재선;오진
    • 무역학회지
    • /
    • 제47권2호
    • /
    • pp.175-193
    • /
    • 2022
  • This study analyzes the effects of road transportation networks on the local economy in korea. The analysis methods are SNA and spatial panel regression model. The subjects of this study are inland areas of Korea, and the research period is from 2010 to 2019. The network analysis showed that the connection centrality of Gyeongg-do was high internally and externally. Gyeonggi-do has played a central role in the domestic road freight transportation industry. The results of spatial panel regression analysis showed that there was economic competition between regions. Domestic road transportation industry has been competitive among regions and has economic ripple effect. And Internal cargo has been shown to boost the economy of the region. But internal cargo has been shown to lower the economy of surrounding regions, but external cargo has been shown to increase the economy. In order to revitalize the local economy, it is necessary to increase road cargo.

공간 패널 회귀모형을 이용한 양파 생산량 추정 (Onion yield estimation using spatial panel regression model)

  • 최성천;백장선
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.873-885
    • /
    • 2016
  • 노지에서 재배되는 양파 생산량은 기후환경에 의하여 영향을 받으며, 특정 지역에서 많이 생산되는 지역적인 특성을 가지고 있다. 따라서 생산량 예측시 기상과 지역을 동시에 고려하는 접근이 필요하다. 본 논문에서는 공간 패널 회귀모형을 이용하여 기상변화에 따른 생산량을 추정하였다. 양파 주산지 13곳에 대한 2006년부터 2015년까지의 기상 패널자료를 사용하여, 공간시차를 반영한 공간자기회귀(spatial autoregressive)모형을 사용하였다. 공간가중치 행렬은 임계치 설정방법과 최근거리 설정방법으로 나누어 분석하여, 최근 3곳까지 거리 설정방법을 사용한 모형이 최종 모형으로 선택되었으며, 자기상관성이 유의함을 보였다. 하우스만 검정을 통해 채택된 확률효과모형으로 분석한 결과 누적일조시간(1월), 평균상대습도(4월), 평균최저기온(6월), 누적강수량(11월) 등이 양파 생산량 예측에 유의한 변수로 나타났다.

한국노동패널자료를 활용한 국내 운송업 고용생산성 결정요인 분석 (An Analysis of the Determinants of Employment Productivity in Korean Transportation Industry Using Korea Labor and Income Panel Study)

  • 소애림;신승식
    • 한국항만경제학회지
    • /
    • 제35권1호
    • /
    • pp.57-76
    • /
    • 2019
  • 본 연구는 우리나라 산업 발전에 크게 기여한 운송산업의 주체인 운송업 종사자의 고용생산성 결정요인에 대해 다룬다. 본 연구는 노동패널자료를 활용해 운송업의 고용생산성 결정요인을 선정하고 패널 로지스틱 회귀 모형(Panel Logistic Regression), Panel OLS 모형, Panel Robust regression 모형을 활용하여 요인 간 영향력을 분석하였다. 분석 결과는 다음과 같다. 첫째, 정규직 여부의 경우 '학력'이 높을수록, '노조가입' 할수록, '직업훈련 경험'이 있을수록 긍정적인 효과가 나타난 것으로 분석되었다. 둘째, 고용안정성은 '학력'이 높고 '노조가입' 할수록 긍정적인 영향이 미치는 것으로 조사되었으며, '회사규모'가 크고 '기혼'일 경우 고용안정성이 큰 것으로 분석되었다. 셋째, 소득생산성의 경우 '나이', '학력', '회사규모'의 값이 클수록 긍정적인 영향을 미치고 '직업훈련 이외의 교육', '건강상태'의 값이 클수록 부정적인 영향을 미치는 것으로 분석되었다. 넷째, 직무만족도의 경우는 '여성'일수록, '노조가입' 할수록, '소득'이 높을수록, '고용안정성'이 높을수록 높았고, '보통사람대비 건강상태'가 좋을수록, '전반적 생활만족도'와 '경제적 수준'이 높을수록 직무만족도는 낮은 것으로 분석되었다. 본 연구에서 도출한 운송산업 고용생산성 결정요인의 분석과 향상 방안 모색을 통해 운송업 고용 생산성 향상에 기여할 수 있을 것으로 생각된다.

패널회귀모형에서 회귀계수 추정량의 설계기반 성질 (Design-based Properties of Least Square Estimators in Panel Regression Model)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제12권3호
    • /
    • pp.49-62
    • /
    • 2011
  • 본 논문에서는 패널회귀모형에서 회귀계수 추정량으로 일반최소제곱추정량과 가중최소 제곱추정량의 설계기반 성질을 고찰한다. 회귀계수의 최소제곱추정량을 선형화하여 일반최소제곱추정량의 근사편향, 근사분산, 그리고 근사평균제곱오차의 수식과, 가중최소제곱추정량의 근사분산 수식을 유도한 후, 모의실험을 통하여 두 추정량의 근사분산 및 근사평균 제곱오차의 크기를 수치적으로 비교한다. 모의실험에서는 한국복지패널 3개년 데이터를 모집단으로 간주하고, 가구소득 변수를 관심변수로 하며 가구와 가구주 관련 7개 변수를 설명변수로 하는 유한모집단 회귀계수를 고려한다. 두 추정량의 설계기반 성질을 비교하기 위하여 표본수를 50에서 1,000까지 50 간격으로 설정하여 일반최소제곱추정량의 근사편향, 근사분산 그리고 가중최소제곱추정량의 근사분산을 계산한다. 모의실험을 통하여 다음과 같은 경향을 확인하였다. 첫째, 표본의 크기가 커지면 일반최소제곱추정량의 평균제곱오차가 가중최소제곱추정량의 분산보다 커진다. 둘째, 일반최소제곱추정량의 평균제곱오차를 가중최소제곱추정량의 분산으로 나눈비(ratio)는 설명변수에 따라 크기가 다르게 나타나고, 일반최소제곱추정량의 편향이 클수록 큰 값을 보인다. 셋째, 분산만 비교하면 일반최소제곱추정량의 분산이 가중최소제곱추정량의 분산보다 대부분의 경우에 더 작게 나타난다.

  • PDF

A computational note on maximum likelihood estimation in random effects panel probit model

  • Lee, Seung-Chun
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.315-323
    • /
    • 2019
  • Panel data sets have recently been developed in various areas, and many recent studies have analyzed panel, or longitudinal data sets. Often a dichotomous dependent variable occur in survival analysis, biomedical and epidemiological studies that is analyzed by a generalized linear mixed effects model (GLMM). The most common estimation method for the binary panel data may be the maximum likelihood (ML). Many statistical packages provide ML estimates; however, the estimates are computed from numerically approximated likelihood function. For instance, R packages, pglm (Croissant, 2017) approximate the likelihood function by the Gauss-Hermite quadratures, while Rchoice (Sarrias, Journal of Statistical Software, 74, 1-31, 2016) use a Monte Carlo integration method for the approximation. As a result, it can be observed that different packages give different results because of different numerical computation methods. In this note, we discuss the pros and cons of numerical methods compared with the exact computation method.

민간의료보험 가입 유형별 의료 이용: 6개년 불균형패널 분석 (Effect of Private Health Insurance on Medical Care Utilization: Six Year Unbalanced Panel Data Model)

  • 유창훈;강성욱;최지헌;권영대
    • 보건의료산업학회지
    • /
    • 제11권3호
    • /
    • pp.51-64
    • /
    • 2017
  • Objectives : This study examined the effect of private health insurance on medical care utilization by subscription type. Methods : The data used were the six waves of the Korea Health Panel (2009-2014), and 16,187 persons were the subjects of the analysis. We performed a panel regression with a fixed effects model. Results : Indemnity private health insurance was positively related to the number of physician visits, number of admissions, and total length of stays. However, fixed-benefit private health insurance was not related to medical care utilization. Conclusions : The result of this study, which shows the difference by subscription type in the effect of private health insurance on medical care utilization, suggests that continuous monitoring of indemnity private health insurance is needed in the future.