• 제목/요약/키워드: panel regression

검색결과 1,039건 처리시간 0.026초

패널회귀모형에서 최대엔트로피 추정량에 관한 연구 (A Study of Generalized Maximum Entropy Estimator for the Panel Regression Model)

  • 송석헌;전수영
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.521-534
    • /
    • 2006
  • 횡단면 자료와 시계열 자료가 병합된 패널회귀모형을 다루는 대부분의 연구들에서 사용되고 있는 자료는 완전한 자료를 고려하고 있다. 그러나, 실제적으로 완전한 자료보다는 불완전한 자료가 많다. 이러한 상황을 고려하지 않고 통계적인 추론을 하게 되면 잘못된 결론이 도출될 수 있다. 따라서, 자료의 형태를 충분히 고려한 추정량을 바탕으로 자료를 분석해야 한다. 본 연구는 패널회귀모형에서 자료가 불완전 상태인 경우 최대 엔트로피 형식을 이용한 일반화최대엔트로피 추정량을 제안하고, 추정량들의 효율성을 모의실험을 통하여 비교하였다. 모의실험 결과, 일반화 최대엔트로피 추정량이 가장 안정적이고 효율적인 추정량임을 보여주었다.

Development and Policy of Proper Management Estimation of Domestic Service Industry in Comparison with OECD Countries for Advancement of Korean Service Industry

  • Suh, Geun-Ha;Yoon, Sung-Wook
    • 유통과학연구
    • /
    • 제12권11호
    • /
    • pp.25-34
    • /
    • 2014
  • Purpose - Considering that the governments' official statistics on the optimum scale of the domestic service industry will be crucial in future, this study's results will be used as an important benchmark to develop and verify the parameters in the government's official statistics. Research design, data, and methodology - To identify the appropriate scale of Korea's service industry and its adequacy, I have determined them through estimation using a regression method involving panel data analysis on the panel data of 30 OECD countries. Results - The regression coefficient provided indications of being non-linear. This means that a U-shaped curve relationship exists-that is, the level of the economic growth leverage decreases along with the service industry's growth up to the level of 70.9% in terms of the Korean service industry's adequacy; it increases along with the service industry's growth at a level higher than 70.9%. Conclusions - While the current proportion of the size of the service industry among all industries in Korea stands at 50.7%, its proper proportion estimated by a regression analysis was 70.9%.

LM Tests in Nested Serially Correlated Error Components Model with Panel Data

  • Song, Seuck-Heun;Jung, Byoung-Cheol;Myoungshic Jhun
    • Journal of the Korean Statistical Society
    • /
    • 제30권4호
    • /
    • pp.541-550
    • /
    • 2001
  • This paper considers a panel data regression model in which the disturbances follow a nested error components with serial correlation. Given this model, this paper derives several Lagrange Multiplier(LM) testis for the presence of serial correlation as well as random individual effects, nested effects, and for existence of serial correlation given random individual and nested effects.

  • PDF

민간의료보험 가입 유형별 의료 이용: 6개년 불균형패널 분석 (Effect of Private Health Insurance on Medical Care Utilization: Six Year Unbalanced Panel Data Model)

  • 유창훈;강성욱;최지헌;권영대
    • 보건의료산업학회지
    • /
    • 제11권3호
    • /
    • pp.51-64
    • /
    • 2017
  • Objectives : This study examined the effect of private health insurance on medical care utilization by subscription type. Methods : The data used were the six waves of the Korea Health Panel (2009-2014), and 16,187 persons were the subjects of the analysis. We performed a panel regression with a fixed effects model. Results : Indemnity private health insurance was positively related to the number of physician visits, number of admissions, and total length of stays. However, fixed-benefit private health insurance was not related to medical care utilization. Conclusions : The result of this study, which shows the difference by subscription type in the effect of private health insurance on medical care utilization, suggests that continuous monitoring of indemnity private health insurance is needed in the future.

Discrete-time Survival Analysis of Risk Factors for Early Menarche in Korean Schoolgirls

  • Yong Jin Gil;Jong Hyun Park;Joohon Sung
    • Journal of Preventive Medicine and Public Health
    • /
    • 제56권1호
    • /
    • pp.59-66
    • /
    • 2023
  • Objectives: The aim of this study was to evaluate the effect of body weight status and sleep duration on the discrete-time hazard of menarche in Korean schoolgirls using multiple-point prospective panel data. Methods: The study included 914 girls in the 2010 Korean Children and Youth Panel Study who were in the elementary first-grader panel from 2010 until 2016. We used a Gompertz regression model to estimate the effects of weight status based on age-specific and sex-specific body mass index (BMI) percentile and sleep duration on an early schoolchild's conditional probability of menarche during a given time interval using general health condition and annual household income as covariates. Results: Gompertz regression of time to menarche data collected from the Korean Children and Youth Panel Study 2010 suggested that being overweight or sleeping less than the recommended duration was related to an increased hazard of menarche compared to being average weight and sleeping 9 hours to 11 hours, by 1.63 times and 1.38 times, respectively, while other covariates were fixed. In contrast, being underweight was associated with a 66% lower discrete-time hazard of menarche. Conclusions: Weight status based on BMI percentiles and sleep duration in the early school years affect the hazard of menarche.

패널회귀모형에서 회귀계수 추정량의 설계기반 성질 (Design-based Properties of Least Square Estimators in Panel Regression Model)

  • 김규성
    • 한국조사연구학회지:조사연구
    • /
    • 제12권3호
    • /
    • pp.49-62
    • /
    • 2011
  • 본 논문에서는 패널회귀모형에서 회귀계수 추정량으로 일반최소제곱추정량과 가중최소 제곱추정량의 설계기반 성질을 고찰한다. 회귀계수의 최소제곱추정량을 선형화하여 일반최소제곱추정량의 근사편향, 근사분산, 그리고 근사평균제곱오차의 수식과, 가중최소제곱추정량의 근사분산 수식을 유도한 후, 모의실험을 통하여 두 추정량의 근사분산 및 근사평균 제곱오차의 크기를 수치적으로 비교한다. 모의실험에서는 한국복지패널 3개년 데이터를 모집단으로 간주하고, 가구소득 변수를 관심변수로 하며 가구와 가구주 관련 7개 변수를 설명변수로 하는 유한모집단 회귀계수를 고려한다. 두 추정량의 설계기반 성질을 비교하기 위하여 표본수를 50에서 1,000까지 50 간격으로 설정하여 일반최소제곱추정량의 근사편향, 근사분산 그리고 가중최소제곱추정량의 근사분산을 계산한다. 모의실험을 통하여 다음과 같은 경향을 확인하였다. 첫째, 표본의 크기가 커지면 일반최소제곱추정량의 평균제곱오차가 가중최소제곱추정량의 분산보다 커진다. 둘째, 일반최소제곱추정량의 평균제곱오차를 가중최소제곱추정량의 분산으로 나눈비(ratio)는 설명변수에 따라 크기가 다르게 나타나고, 일반최소제곱추정량의 편향이 클수록 큰 값을 보인다. 셋째, 분산만 비교하면 일반최소제곱추정량의 분산이 가중최소제곱추정량의 분산보다 대부분의 경우에 더 작게 나타난다.

  • PDF

패널자료의 무응답 대체법 (Non-Response Imputation for Panel Data)

  • 박기덕;신기일
    • Communications for Statistical Applications and Methods
    • /
    • 제17권6호
    • /
    • pp.899-907
    • /
    • 2010
  • 무응답 대체(non-response imputation) 방법에 관한 많은 이론과 방법이 제안되었으며 실제 자료 분석에 이용되고 있다. 흔히 횡단면 무응답 대체를 위하여 다중대체법(multiple imputation)이 사용되고 있으며 2차년도 이상의 패널자료에는 종시점회귀대체법(cross-wave regression imputation)이 사용되고 있다. 본 연구에서는 패널자료 분석을 위하여 종시점회귀대체법의 일반형태인 시계열 대체법과 횡단면 무응답 대체법을 결합한 시계열-횡단면 다중 대체법을 제안하였다. 노동부의 매월노동통계 자료를 이용하여 제안한 방법과 기존의 종시점회귀대체법을 비교하여 우수함을 보였다.

건강보험 지역가입자의 보험료 부담 형평성 종단분석 (Longitudinal Study on the Equity of National Health Insurance Contribution of the self-employed)

  • 이옥진;문용필;박현식
    • 사회복지연구
    • /
    • 제47권4호
    • /
    • pp.309-332
    • /
    • 2016
  • 본 연구의 목적은 국민건강보험 지역가입자의 부담능력별로 수직적 형평성을 측정하고, 각 부담능력 및 인구학적 특성이 보험료의 변화와 인과관계를 보이는지 종단 분석하는 것이다. 분석대상은 한국복지패널 6차(2011년)-10차(2015년) 조사에 모두 참여한 지역가입자 가구주이다. 분석방법으로는 카크와니(Kakwani) 누적지수 산출 및 패널회귀분석을 적용하였다. 연구결과는 첫째, 2011년-2015년까지 카크와니 지수는 종합소득에 대한 보험료 부과가 역진적임을 나타내고 있다. 둘째, 패널회귀분석 결과 종합소득이 적은 가구일수록 보험료 부담이 통계상 유의미한 부(-)의 영향력을 보여 역진적임을 보였다. 이를 통해 국민건강보험 지역가입자의 보험료 부과체계 개편에 대한 정책적 함의를 제시하였다.

공간적 상관성을 고려한 민수용 도시가스 수요결정 요인 분석 (Analysis of Determinants of Civilian City Gas Demand Considering Spatial Correlation)

  • 박은비;원두환
    • 자원ㆍ환경경제연구
    • /
    • 제33권1호
    • /
    • pp.59-86
    • /
    • 2024
  • 최근 도시가스 수요에 관한 연구는 광역별, 지역별로 각 지역 특성을 반영하여 미시적 관점에서 접근하는 경향이 확대되는 추세이다. 이때 인접지역이 가지는 사회구조의 유사성과 공급 인프라의 밀집성은 지역 간 미시적인 관계를 가지는 군집성과 공간적 상관성을 유도한다. 이에 민수용 도시가스 수요에 대해 34개 도시가스사의 관할지역을 기준으로 총 54개의 지역으로 구분한 후 공간 상관성을 분석한 결과 전역적, 국지적 관점에서 양의 공간적 상관성이 있음을 확인할 수 있었다. 본 연구에서는 2014년 1월부터 2022년 12월까지 54개 지역에 대한 민수용 도시가스 수요를 패널데이터로 구성하여 공간패널회귀분석과 일반 패널회귀분석을 비교하였으며, 오차에 공간적 효과가 존재하는 공간오차모형(SEM)이 가장 적합한 모형임을 도출할 수 있었다. 이는 한 지역의 민수용 도시가스 수요가 인접지역과 유의한 관계가 있음을 확인함으로써 정책적, 실무적 시사점을 제시한다.

A computational note on maximum likelihood estimation in random effects panel probit model

  • Lee, Seung-Chun
    • Communications for Statistical Applications and Methods
    • /
    • 제26권3호
    • /
    • pp.315-323
    • /
    • 2019
  • Panel data sets have recently been developed in various areas, and many recent studies have analyzed panel, or longitudinal data sets. Often a dichotomous dependent variable occur in survival analysis, biomedical and epidemiological studies that is analyzed by a generalized linear mixed effects model (GLMM). The most common estimation method for the binary panel data may be the maximum likelihood (ML). Many statistical packages provide ML estimates; however, the estimates are computed from numerically approximated likelihood function. For instance, R packages, pglm (Croissant, 2017) approximate the likelihood function by the Gauss-Hermite quadratures, while Rchoice (Sarrias, Journal of Statistical Software, 74, 1-31, 2016) use a Monte Carlo integration method for the approximation. As a result, it can be observed that different packages give different results because of different numerical computation methods. In this note, we discuss the pros and cons of numerical methods compared with the exact computation method.