• 제목/요약/키워드: 오차제곱합회귀모형

검색결과 9건 처리시간 0.029초

회귀모형에 의한 소지역추정

  • 최지영;최기헌;한근식
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 춘계 학술발표회 논문집
    • /
    • pp.261-267
    • /
    • 2003
  • 표본의 크기가 작은 경우 추정치의 정도에 문제가 발생한다. 본 연구에서는 대규모 조사에서의 표본을 소지역 혹은 소도메인에 할당하였을 경우 발생하는 추정치의 문제점을 해결하는 방안으로서 회귀모형을 도입하였다. 회귀모형을 기계산업 표본설계 자료에 적용하여 소지역추정의 가능성을 확인하였으며, 고전적인 추정방법과의 비교도 함께 이루어졌다.

  • PDF

공간자료에 대한 지리적 가중회귀 모형과 크리깅의 비교 (Comparison between Kriging and GWR for the Spatial Data)

  • 김선우;정애란;이성덕
    • 응용통계연구
    • /
    • 제18권2호
    • /
    • pp.271-280
    • /
    • 2005
  • 공간상관이 존재하는 지리통계 자료(geostatistical data)에 대하여 일반적으로 널리 사용되는 Kriging 모형과 통계학적 공간자료 분석모형인 지리적 가중회귀 모형을 고려하고, 미지의 위치에 대한 예측력을 비교해 본다. 두 모형의 예측력을 검토하기 위하여 환경부 자료를 실증사례로 활용한다. 전국의 116개 대기오염 측정망에서 얻은 1999년의 월별 일산화탄소(Co/ppm) 자료의 평균을 구하여 Kriging모형과 지리적 가중회귀 모형에 적합하고 미지의 위치를 예측하여 예측오차제곱합(PRESS)으로 각각의 방법에 대한 예측성능을 비교한다.

반응표면방법론에서의 강건한 실험계획 (A Robust Design of Response Surface Methods)

  • 임용빈;오만숙
    • 응용통계연구
    • /
    • 제15권2호
    • /
    • pp.395-403
    • /
    • 2002
  • 반응표면방법론에서의 세번째 단계에서는 일차모형이 가정되고, 반응표면의 곡선효과는 중앙점과 2수준 부분실시법에서의 실험을 통해서 검토된다. 참모형이 2차 모형인 경우를 가정하자. 최적실험계획을 선택하기 위해서 Box와 Draper(1959)는 관심영역에서 예측치 y(x)의 평균제곱오차를 적분한 값인 가중평균제곱오차(AMSE)를 최소화 시키는 최적실험계획 기준을 제안하였다. AMSE는 예측치의 가중분산과 가중제곱편의 량의 합으로 분할될 수 있다. AMSE는 실험계획 적률과 참모형의 회귀계수들의 값에 종속되어서 가중평균제곱오차를 최 소화하는 실험 계획을 찾기는 불가능하다. 실용적인 대안으로 Box와 Draper(1959)는 가중제곱편의 량을 최소화하는 실험계획을 제안했고, 이 실험계획의 상자점들이 중앙점을 향해서 축소됨을 보였다. 이 논문에서는 표준화된 회귀계수들의 값에 대해서 실험계획의 최소효율을 최대화하는 강건한 실험계획을 제안한다.

여러 가지 가중행렬을 가진 공간 시계열 모형들의 예측 (Prediction for spatial time series models with several weight matrices)

  • 이성덕;주수인;이소현
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.11-20
    • /
    • 2017
  • 시간의 변화뿐만 아니라 공간 위치의 변화를 함께 고려한 자료를 공간 시계열 자료라고 한다. 공간 시계열 자기회귀 이동평균 모형과 공간 시계열 중선형 모형에 대해 소개하고 각각의 Kalman Filter 방법에 의한 모수 추정의 과정을 거쳐 최종 선택된 모형의 예측력을 비교하였다. 또한 공간 시계열 자료의 모형에 포함되는 가중행렬에 대하여 기존의 방법인 동일한 가중치와 더불어 거리에 비례한 가중치와 인구수에 비례한 가중치를 제안하였다. 실증분석을 위해 한국질병관리본부에서 수집한 유행성 이하 선염 자료를 활용하여 가중치를 달리한 공간 시계열 모형을 적합시키고 예측하였다. 예측 오차 제곱합을 활용하여 어느 모형이 가장 효과적인 모형인지 판정하였다.

생물계절모형을 이용한 진달래 개화 예상시기 모형 연구 (Prediction Model for Flowering date of Rhododendron mucronulatum Turcz. using a Plant Phenology Model)

  • 유성태;김병도;박현호;백진영;권혜연;이명훈
    • 한국자원식물학회:학술대회논문집
    • /
    • 한국자원식물학회 2020년도 춘계학술대회
    • /
    • pp.31-31
    • /
    • 2020
  • 본 연구는 대표적인 봄 꽃 식물인 진달래(Rhododendron mucronulatum Turcz.)의 개화시기를 예측하기 위해 지난 9년간(2011년-2019년) 주왕산 지역에 생육하는 진달래의 식물계절자료(파열·개화·개엽·만개·낙엽)와 기상자료(일평균기온·일최고기온·일최저기온)를 토대로 이탈리아 생물기상연구소(IBMET)의 Chill Day 개화 예측모형인 생물계절모형을 실시하였다. 생물계절모형에 의한 예상 발아일간 편차의 제곱을 최소로 하는 조합은 기준온도 5℃, 저온요구량과 가온요구량은 97.94로 나타났다. 즉, 휴면해제일로부터 기준온도 5℃로 Chill Day를 누적시켜 97.94에 도달하는 날짜가 낙엽~내생휴면해제일이자 내생휴면해제일~발아기간까지의 값이며, 내생휴면해제일을 기점으로 개화일까지 102.93이 개화에 필요한 가온량으로 나타났다. 2011년부터 2019년까지 개화예상일을 기상청 회귀모형을 실관측기온에 적용한 결과 오차는 MAE=1.44이며, 생물계절모형을 적용할 경우 오차는 MAE=1.39, 기준온도 5℃일 경우 MAE=4.23, 기준온도 6℃일 경우 MAE=5.47, 기준온도 7℃일 경우 MAE=5.05로 나타나 생물계절에 의한 관측과 기상청의 회귀모형이 가장 유사한 것으로 나타났다. 가장 최근인 2018년과 2019년의 기상청 회귀모형와 생물계절모형의 개화 예측일을 비교한 결과, 2018년의 경우 청송지역의 진달래는 기상청 회귀모형에서 3월 30일 전후로 개화를 예상하였고 생물계절모형은 기준온도 5℃에 적용할 경우 내생휴면일에 가장 근접한 날은 3월 26일이였으며 이를 기준으로 가온량의 합이 102.93에 가깝게 되는 날인 4월 2일을 전후로 개화를 예측하였다. 실제 청송 주왕산의 진달래는 4월 3일에 개화를 시작하여 생물계절모형과 매우 유사함을 확인하였다. 2019년의 경우 청송지역의 진달래는 기상청 회귀모형에서 3월 25일 전후로 개화를 예상하였고 생물계절모형은 기준온도 5℃에 적용할 경우 내생휴면일에 가장 근접한 날은 3월 8일이였으며 이를 기준으로 가온량의 합이 102.93에 가깝게 되는 날인 3월 29일을 전후로 개화를 예측하였다. 실제 청송 주왕산의 진달래는 4월 5일에 개화를 시작하여 오히려 생물계절모형과 더욱 유사함을 확인하였다.

  • PDF

공간시계열 자료에 대한 STARMA 모형과 STBL 모형의 예측력 비교 (A Comparison on Forecasting Performance of STARMA and STBL Models with Application to Mumps Data)

  • 이성덕;이응준;박용석;주재선;이건명
    • 응용통계연구
    • /
    • 제20권1호
    • /
    • pp.91-102
    • /
    • 2007
  • 본 논문은 공간시계열 자기회귀 이동평균(STARMA) 모형과 공간 시계열 중선형(STBL) 모형에 대해 식별, 추정, 예측 등의 통계적 절차와 특징들을 논하고, 두 모형을 비교하는데 목적이 있다. 사례 연구를 위 해 2001년부터 2006년까지 8개 지역으로부터 보고된 월별 Mumps 자료를 사용했고, 예측오차제곱합(SSF)을 활용하여 두 모형의 적합도를 비교하였다.

한우의 성장곡선의 모수추정과 연도별 효과 분석 (Estimation of growth curve parameters and analysis of year effect for body weight in Hanwoo)

  • 조광현;나승환;최재관;서강석;김시동;박병호;이영창;박종대;손삼규
    • Journal of Animal Science and Technology
    • /
    • 제48권2호
    • /
    • pp.151-160
    • /
    • 2006
  • 본 연구는 유전능력의 검정자료로서 뿐만 아니라 농가에서 편리하게 체중을 추정할 수 있도록 하여 관리 경영상 뚜렷한 개선을 제공하기 위하여 한우의 성장 단계별 발육 특성을 조사하였다. 자료의 구성은 1980~2004년의 남원, 대관령, 서산과 핵군농가의 자료로 암소 27,647개 비거세우 14,744개 거세우 1,290개를 이용하였다. 암소의 경우 시그모이드(sigmoid)의 형태를 나타내고 있으며, 비거세우의 경우에도 거의 비슷한 분포를 보여주고 있으나 거세우의 경우에는 직선 회귀식의 형태를 보여주고 있다. Gompertz 모형을 이용하여 년도별로 분석한 성장곡선은 암, 수소 모두 1990~1994년의 잔차값이 68.49와 54.29로 낮게 나타났으며, 모수 A, b, k의 경우 암소에서 각각 423.6±5.8, 2.387±0.064, 0.0908±0.0033로 추정되었고 수소에서 823.3±15.3, 3.584±0.070, 0.1139±0.0032로 추정되었다. 적합도가 Logistic 모형보다 좋은 Gompertz 모형을 이용하여 곡선추정을 하였으며, 추정된 암소의 월별추정값과 일별추정값은 379.3±7.509, 2.499±0.057, 0.114±0.0045와 367.1±1.9003, 2.3983±0.012, 0.004±0.00003이며, 오차의 평균 제곱합(Residual mean square)은 31.85, 998.4으로 추정되었다. 수소의 월별추정값과 일별추정값은 834.6±22.00, 3.319±0.062, 0.104±0.0037과 796.0±6.128, 3.184±0.014, 0.003±0.00003으로 오차의 평균 제곱합은 66.18, 2106.5로 추정되었으며, 거세우의 경우 1049.1±144.2, 3.024±0.008, 0.067±0.0096와 1505.1±176.6, 2.997±0.067, 0.001±0.0001이며, 오차의 평균 제곱합은 186.0, 1119.1이었다. 성장의 특성을 살펴보면 Gompertz 모형으로 추정할 때 암소의 변곡점(Inflection point)에서의 체중은 139.53kg 이었으며, 변곡점에서의 일당증체율은 0.52kg으로 추정되었다. 수소의 변곡점에서의 체중은 307.03kg 이었으며, 일당증체율은 1.04kg 이었다. 거세우의 경우 변곡점 체중은 385.94kg 이었고 성장속도가 최대인 지점의 순간적인 증체율은 두 모형에서 0.84kg을 나타내었다. 암소가 수소나 거세우에 비하여 성숙체중이 작고 변곡점까지의 도달일령이 빠르며 일당증체량도 작은 성장특성을 보였다.

불균등 착유 시간간격의 오전·오후 유량기록을 이용한 1일 산유량 추정에 관한 연구 (A Study on Estimating Daily Yield from Morning or Afternoon Milking Records with Unequal Milking Intervals)

  • 조용민;박병호;안병석
    • Journal of Animal Science and Technology
    • /
    • 제46권5호
    • /
    • pp.707-718
    • /
    • 2004
  • 오전(AM) 및 오후(PM)의 단얼 착유기록에 의한 유우의 1일 생산량 추청을 위한 통계적 모형에 대한 연구를 실시하였다. 본 연구에서 조사한 모형들 가운데, Model 7은 각 요인 조합 구간별로 개별적인 회귀식을 추정함으로써 산차, 착유시간 간격, 비유 단계에 따른 이분산성을 고려할 수 있기 때문에 평균 오차 제곱 합, 추정치와 실제 1일 유 생산량간의 상관계수 및 추정치의 분산을 고려할 때 가장 적합도가 높은 것으로 사료된다. 오후 착유 기록을 이용한 1일 유 생산량 추정치는 오전 착유 기록을 이용한 것보다는 정확도가 낮은 것을 나타났으며, Model 7의 경우 l일 유 생산량 추정을 위한 제반 요인이 추가되어 정확도가 높일수 있으면서도 모형이 간단하기 때문에 적용이 간펀한 장점이 있다.

Support Vector Machine과 상태공간모형을 이용한 단변량 수문 시계열의 동역학적 비선형 예측모형 (Dynamic Nonlinear Prediction Model of Univariate Hydrologic Time Series Using the Support Vector Machine and State-Space Model)

  • 권현한;문영일
    • 대한토목학회논문집
    • /
    • 제26권3B호
    • /
    • pp.279-289
    • /
    • 2006
  • 최근에 수문시계열로부터 저차원의 비선형 거동을 재구성하고자 하는 연구가 활발히 진행되고 있다. 이러한 관점에서 본 연구에서는 Support Vector Machine(SVM)을 이용하여 우수한 상태-공간 재구성 능력을 갖는 비선형 예측모형을 구성하여 Great Salt Lake(GSL) Volume에 적용하였다. SVM은 Kernel 함수로부터 유도된 고차원의 특성공간 안에서 선형함수의 가상공간을 이용하는 Machine Learning 방법론이다. 또한 SVM은 훈련자료로부터 얻어지는 평균제곱오차가 아닌 일반화된 오차를 최소화함으로써 상대적으로 기존 방법에 비해 적은 수의 매개변수와 과적합(over fitting)을 피하면서 비선형 함수의 최적화가 가능하다. 본 연구에서 제시한 SVM 회귀분석의 적용성은 미국의 GSL의 2주 간격 Volume을 대상으로 검토하였다. SVM을 이용한 비선형 예측모형은 GSL Volume의 2주(1-Step), 8주(4-Step)와 반복예측(Iterated Prediction, 121-Step)까지 적용되었다. 본 연구에서는 극치사상 즉, 급격한 감소 및 증가 구간을 예측하는데 있어서 훈련구간과 예측구간을 구분하여 모형의 신뢰성을 평가하였다. 예측결과SVM은 훈련자료로부터 적은 수의 관측치를 이용하여 동역학적 거동을 추출할 수 있었으며 실제 관측자료와 거의 유사한 예측이 가능함을 통계적 지표로 확인할 수 있었다. 따라서 비선형 수문시계열의 단기 예측을 위한 모형으로 적용이 가능할 것으로 판단된다.