• 제목/요약/키워드: 패널 회귀분석모형

검색결과 157건 처리시간 0.029초

간헐적인 패널 1차 자기회귀과정들의 동질성 검정과 적용 (Test of Homogeneity for Intermittent Panel AR(1) Processes and Application)

  • 이성덕;김선우;조나래
    • 응용통계연구
    • /
    • 제27권7호
    • /
    • pp.1163-1170
    • /
    • 2014
  • 간헐적인 패널 시계열 자료의 개념과 구조를 소개하고, 간헐적인 패널 시계열 자료의 모형으로 간헐적인 패널 1차 자기회귀 모형을 고려하였다. 간헐적인 패널 1차 자기회귀 모형의 동질성 검정을 위하여 Wald 검정통계량을 제안하고, 그 극한분포를 제시하였다. 또한 동질성이 만족되는 경우 시점 별 평균을 이용하여 종합한 자료로 모형을 적합하였다. 이 모형의 동질성 검정 통계량의 극한분포가 $^x2$분포에 잘 따르는지를 알아보기 위해 모의실험을 실시하고, 실제 자료 분석으로 지역별 월별 Mumps 자료에 간헐적인 패널 1차 자기회귀 모형을 적합하여 동질성 검정을 수행한 결과 동질성을 만족하였다. 동질성이 만족된 지역별 월별 Mumps 자료를 시점 별 평균을 이용하여 종합하고 1차 자기회귀 모형으로 적합하였다.

회귀나무 모형을 이용한 패널데이터 분석 (Panel data analysis with regression trees)

  • 장영재
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1253-1262
    • /
    • 2014
  • 회귀나무 (regression tree)는 독립변수로 이루어진 공간을 재귀적으로 분할하고 해당 영역에서 종속변수의 최선의 예측값을 찾고자 하는 비모수적 방법론이다. 회귀나무 모형이 제안된 이래 로지스틱 회귀나무모형이나 분위수 회귀나무모형과 같이 유연하고 다양한 모형적합을 위한 연구가 진행되어 왔다. 최근에 들어서는 Sela와 Simonoff (2012)의 RE-EM 알고리즘, Loh와 Zheng (2013)의 GUIDE 등 패널데이터와 관련하여 진일보한 나무모형 알고리즘도 제안되었다. 본 논문에서는 각 알고리즘을 소개하고 특징을 살펴보는 한편, 실험 데이터를 생성하여 평균제곱오차 (mean squared error)를 바탕으로 예측력을 비교하였다. 분석결과, RE-EM 알고리즘의 예측력이 상대적으로 우수하게 나타났다. 이 알고리즘을 통해 기업경기실사지수 업종별 패널자료를 분석한 결과 최근의 업황에 가장 큰 영향을 미치는 요소는 매출 실적으로 나타났으며 매출 상위 그룹의 경우 비제조업이 제조업에 비해 업황에 대한 판단이 긍정적인 것으로 나타났다.

기상자료를 이용한 마늘 생산량 추정 (Garlic yields estimation using climate data)

  • 최성천;백장선
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.969-977
    • /
    • 2016
  • 야외에서 재배되는 주요 채소류의 생산에 대한 기상변화의 영향력이 점차 커지고 있다. 기상변화로 인한 농작물 생산량의 변화는 공급과 수요의 불안정과 물가안정의 불안요소로 작용하고 있다. 본 논문에서는 패널회귀모형을 이용하여 기상상태에 따른 마늘의 생산량을 추정하였다. 2006년부터 2015년까지의 마늘 주산지 15곳의 10a당 마늘 생산량과 해당 지역의 기상자료를 사용하였다. 7가지 기상요인 (평균기온, 평균최저기온, 평균최고기온, 누적강수량, 누적일조시간, 평균상대습도, 평균지면온도)의 월별 (1월-12월)자료인 총 84개 기상변수중 다중회귀분석 단계선택방법을 통하여 7가지 기상변수를 선택하여 패널회귀모형에 사용하였다. 고정효과 모형과 확률효과 모형을 구분하는 하우스만 검정을 통하여 확률효과 모형으로 분석한 결과 평균최고기온 (1월), 누적강수량 (3월, 10월), 누적일조시간 (4월, 10월)등이 마늘 생산량 추정에 유의한 변수로 나타났다. 또한 연도별로 추정된 생산량 추정값의 추이가 실제 생산량과 동일한 추세를 보이고 있어 제안된 패널 회귀 모형이 잘 적합됨을 확인할 수 있다.

패널회귀모형에서 최대엔트로피 추정량에 관한 연구 (A Study of Generalized Maximum Entropy Estimator for the Panel Regression Model)

  • 송석헌;전수영
    • 응용통계연구
    • /
    • 제19권3호
    • /
    • pp.521-534
    • /
    • 2006
  • 횡단면 자료와 시계열 자료가 병합된 패널회귀모형을 다루는 대부분의 연구들에서 사용되고 있는 자료는 완전한 자료를 고려하고 있다. 그러나, 실제적으로 완전한 자료보다는 불완전한 자료가 많다. 이러한 상황을 고려하지 않고 통계적인 추론을 하게 되면 잘못된 결론이 도출될 수 있다. 따라서, 자료의 형태를 충분히 고려한 추정량을 바탕으로 자료를 분석해야 한다. 본 연구는 패널회귀모형에서 자료가 불완전 상태인 경우 최대 엔트로피 형식을 이용한 일반화최대엔트로피 추정량을 제안하고, 추정량들의 효율성을 모의실험을 통하여 비교하였다. 모의실험 결과, 일반화 최대엔트로피 추정량이 가장 안정적이고 효율적인 추정량임을 보여주었다.

패널무응답의 가중수정 방법

  • 신민웅;윤연옥
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2002년도 춘계학술대회 발표논문집
    • /
    • pp.157-162
    • /
    • 2002
  • 패널 무응답자(panel nonrespondent)란 처음 조사에서는 응답을 하였으나 나중 조사에서는 응답을 하지 않은 사람을 의미한다. 패널조사에서는 앞 단계에서의 응답으로부터 뒷 단계의 무응답에 대한 정보를 얻을 수 있다. 무응답에 대한 수정 방법은 어떤 보조 변수들을 선택하고, 그 변수들이 수정하는 데 어떻게 사용하는 가를 결정하는 것이다. 우리는 가중 수정을 패널 무응답자에 대해서만 생각한다. 이러한 가중은 패널 무응답자에 대하여 보상하기 위하여 패널 무응답의 가중값을 수정한다. 종속 변수로서 패널응답 상태(status)는 로지스틱 회귀분석으로 패널 무응답에 대한 모형을 선택하는 방법이다. 로지스틱 회귀분석에서 패널무응답과 상관이 있는 변수들은 패널무응답 편향을 감소시키기 위하여 가중 수정에서 사용하기 위한 변수들이다.

  • PDF

공간 패널 회귀모형을 이용한 양파 생산량 추정 (Onion yield estimation using spatial panel regression model)

  • 최성천;백장선
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.873-885
    • /
    • 2016
  • 노지에서 재배되는 양파 생산량은 기후환경에 의하여 영향을 받으며, 특정 지역에서 많이 생산되는 지역적인 특성을 가지고 있다. 따라서 생산량 예측시 기상과 지역을 동시에 고려하는 접근이 필요하다. 본 논문에서는 공간 패널 회귀모형을 이용하여 기상변화에 따른 생산량을 추정하였다. 양파 주산지 13곳에 대한 2006년부터 2015년까지의 기상 패널자료를 사용하여, 공간시차를 반영한 공간자기회귀(spatial autoregressive)모형을 사용하였다. 공간가중치 행렬은 임계치 설정방법과 최근거리 설정방법으로 나누어 분석하여, 최근 3곳까지 거리 설정방법을 사용한 모형이 최종 모형으로 선택되었으며, 자기상관성이 유의함을 보였다. 하우스만 검정을 통해 채택된 확률효과모형으로 분석한 결과 누적일조시간(1월), 평균상대습도(4월), 평균최저기온(6월), 누적강수량(11월) 등이 양파 생산량 예측에 유의한 변수로 나타났다.

주택가격과 기초경제여건의 장기 관계: 우리나라의 패널 자료를 이용하여 (The Long-Run Relationship between House Prices and Economic Fundamentals: Evidence from Korean Panel Data)

  • 심성훈
    • 국제지역연구
    • /
    • 제16권1호
    • /
    • pp.3-27
    • /
    • 2012
  • 본 연구는 패널 공적분 검정 그리고 비교적 최근에 개발된 패널 단위근 검정을 이용하여 지역 주택가격과 지역총생산 간의 장기관계를 분석하였다. 횡단면 의존성(cross-section dependence)이 확인된 경우, 이를 고려한 Pesaran의 CIPS 패널 단위근 검정을 이용하였다. 기존 패널 단위근 검정의 결과와 다르게 CIPS 검정은 변수들이 불안정성을 갖는 것으로 나타났다. 또한 패널 벡터오차수정모형(VECM)을 이용하여 변수들 간의 인과관계를 확인하였으며, 고정효과모형(Fixed effect)과 패널 자기회귀시차(ARDL)모형을 이용하여 계수들의 장기관계를 구체적으로 추정하였다. 먼저 변수들 간에 공적분관계가 형성되며 장 단기 인과관계가 성립하는 것으로 나타났다. 또한 VECM 모형의 오차수정항은 통계적으로 유의한 것으로 나타나 변수들 간의 장기 공적분 관계를 뒷받침하고 있다. 모형의 추정 결과, 장기적으로 주택가격의 상승은 지역총생산을 증가시키며 반대의 관계도 성립함을 알 수 있다. 이 결과에 의해 우리나라 지역 주택시장에서 부의 효과(wealth effect)가 존재하고 있는 것으로 나타났다. 이러한 결과들과 함께 오차수정항으로부터, 주택 가격과 경제 변수들은 단기적으로는 일시적인 균형상태로부터 이탈될 수 있지만, 장기적으로는 이들 변수는 균형관계에 있다는 것을 의미한다.

MODIS 영상 자료와 패널 자료를 이용한 지표면온도변화 요인분석 (The Factor Analysis of Land Surface Temperature(LST) Change using MODIS Imagery and Panel Data)

  • 배다혜;김홍명;하성룡
    • 한국지리정보학회지
    • /
    • 제21권1호
    • /
    • pp.46-56
    • /
    • 2018
  • 본 연구에서는 지표면 온도 변화에 미치는 주요 지역특성인자를 도출하고 각각의 인자가 미치는 확률적 영향계수를 추정하였다. 연구대상지역은 충청북도 전역이며 패널 분석을 위해 시 군 행정 단위로 분할하였다. 지표면온도 및 지역특성 시계열자료들은 MODIS 영상과 통계청자료를 사용하여 각각 구축하였다. 그리고 지표면온도와 횡단면자료인 지역특성인자들을 다중회귀관계로 설정하고 패널 모형 분석을 통하여 회귀계수 추정치를 산정하였다. 지표면온도와 지역특성인자는 패널 모형 분석에서 종속변수와 설명변수로 각각 사용하였다. 패널 자료 분석은 상용 통계프로그램 STATA14를 사용하였으며, 일원 개체 고정효과모형이 본 연구의 지표면온도 변화 해석에 가장 적절한 모형으로 선정되었다. 지표면온도 변화에 미치는 설명변수의 영향수준을 나타내는 기여율은 회귀방정식의 추정회귀계수로부터 구했다. 설명변수별 기여율은 도시 공업지역이 3.746로 가장 컸으며, 다음으로 평균고도${\times}$대지면적비율이 2.856, 전력사용량 2.742, 평균풍속 0.553, 비도시관리지역 0.102, 농림지역과 자연 환경보전지역은 0.085와 0.071 그리고 시 군의 평균강우량 한 단위 변화가 지표면온도 변화에 미치는 기여율은 0.003으로 추정되었다.

패널 분위수회귀 모형을 사용한 우리나라 지방 상수도 생활용수 수요의 가격탄력성 추정 (Estimating Price Elasticity of Residential Water Demand in Korea Using Panel Quatile Model)

  • 김형건
    • 자원ㆍ환경경제연구
    • /
    • 제27권1호
    • /
    • pp.195-214
    • /
    • 2018
  • 우리나라에서도 최근 잦아진 가뭄으로 물 부족에 대한 경각심이 높아졌다. 특히, 2015년의 가뭄은 경제적으로 큰 피해를 야기하였고 적극적인 물 수요 관리의 필요성을 부각시킨 계기가 되었다. 경제학적 측면에서 수요관리 정책을 설계하기 위해 선행되어야 될 점 중 하나는 신뢰성 있는 가격탄력성의 추정이다. 그러므로 본 연구에서는 기존 국내 선행연구들에 비해 강건한 생활용수 수요의 가격탄력성을 추정하고자 한다. 이를 위해 2010년도에서 2013년도까지 지방 상수도 공급지역 161개의 자료를 패널 분위수회귀모형을 사용해 추정하였고 이를 패널자료 회귀모형의 결과와 비교 분석하였다. 분석 결과, 생활용수 수요의 가격탄력성은 -0.156에서 -0.189 사이의 값을 갖는 것으로 추정되었다. 또한 본 연구에서는 조건부 평균 회귀를 사용하는 경우 왼쪽꼬리가 길고 오른쪽 분포가 두꺼운 우리나라 생활용수 수요량 분포의 특징으로 수요량이 많은 지역들의 성향이 추정결과에 상대적으로 크게 반영된다는 점을 확인하였다.

베타회귀분석 방법을 이용한 건강 관련 삶의 질 자료 분석 (Analysis of health-related quality of life using Beta regression)

  • 장은진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.547-557
    • /
    • 2017
  • 건강 관련 삶의 질 자료는 정규분포를 따르지 않고 치우친 분포를 보이며, 등분산 가정을 만족하지 않는 경우가 대부분이다. 또한 건강 관련 삶의 질 자료는 범위가 정해져 있는 자료이며, 건강한 상태를 나타내는 경우 최대값을 가지는 천장효과가 있는 자료이다. 본 연구에서는 건강 관련 삶의 질 자료인 EQ-5D에 대해 선형회귀모형과 베타회귀모형, 그리고 평균과 정밀도에 대한 하위모형을 가지고 있는 확장된 베타회귀모형을 이용하여 예측모형을 개발하고 모형의 예측 정확도를 비교하였다. 선형회귀모형에 비해 확장된 베타회귀모형의 예측 정확도가 높기는 하지만 신뢰구간이 겹치고 있기 때문에 확장된 베타회귀모형의 정확도가 더 높다고 할 수는 없다. 하지만 확장된 베타회귀모형은 공변량에 따라 분산이 달라지는 부분을 설명할 수 있으며 선형회귀모형이 제한된 범위를 벗어난 값을 예측하는 부분을 개선할 수 있다. 따라서 범위가 제한되고 이분산이 있는 치우친 자료에 대해 공변량들이 평균 및 정밀도에 영향을 주는 정도를 동시에 고려하는 확장된 베타회귀모형은 건강 관련 삶의 질 자료인 EQ-5D를 분석하는 방법으로 적절하다고 할 수 있다.