• 제목/요약/키워드: 회귀 모형

검색결과 3,342건 처리시간 0.027초

ANN과 회귀모형의 오차 수정을 통한 댐 유입량 예측 향상 (Improving Forecasts of Dam Inflow Using Rescaling Errors From ANN and Regression Model)

  • 장선우;유지영;김태웅
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1164-1168
    • /
    • 2010
  • 수자원이 우리 생활의 전반적으로 중요한 역할을 차지하면서 댐의 효율적인 운영과 안정적인 용수공급에 대한 연구는 지속적으로 수행되어지고 있다. 1990년대 이후 비선형적인 특성을 잘 모의하는 장점을 가진 인공신경망(ANN)을 이용하여 유입량 예측에 대한 많은 연구가 수행되었다. 하지만 ANN 모형을 포함한 회귀모형은 월 강우 및 유입량의 예측에 대해 간편하게 사용을 할 수 있지만, 예측의 정확성에 한계를 가지고 있다. 본 연구에서는 ANN 모형과 회귀모형의 예측오차를 후처리 과정을 통하여 오차를 줄임으로써 예측모형의 성과를 향상시키는 방법을 제안하였다. 연구지역은 금강수계의 대청댐 유역으로, 1982년 9월부터 2005년 12월에 해당하는 유역 내 11개 지점의 강우관측소에서 관측한 월 강우와 댐 유입량을 수집하여 모형을 구축하였다. 강우량과 유입량 자료에 대해 자기상관함수와 교차상관함수를 이용하여 입력변수를 결정하였고, 정규화를 통한 전처리 과정을 거쳐 ANN 모형과 회귀모형을 이용한 예측모형을 구축하였으며, 예측성과의 향상을 위하여 군집 분석을 이용하여 오차를 재조정하였다. 이러한 오차 후처리 과정을 포함한 모형은 RMSE와 상관계수를 이용하여 비교 평가한 결과, 예측성과를 약 40% 정도 향상시켰다.

  • PDF

비선형 회귀모형을 이용한 학년별 학생수 추계 (Estimations of the student numbers by nonlinear regression model)

  • 윤용화;김종태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권1호
    • /
    • pp.71-77
    • /
    • 2012
  • 본 연구는 코호트 조성법에 의해 구성된 진학률들을 사용한 비선형 회귀모형을 이용하여 장래 초등과 중등, 고등학교의 학년별 학생수를 추계 하는데 목적이 있다. 이러한 진학률들의 모형을 분석하기 위하여 경향-외삽법 중 하나인 비선형 회귀모형의 로그모형과 거듭제곱 모형을 이용하였다. 그 결과 로그모형에 의한 예측이 거듭제곱모형에 의한 예측보다 조금 더 신뢰할 수 있고, 학생수도 적게 예측됨을 알 수 있었다.

조건부 합성기법과 MODIS LST를 활용한 토양수분 다중분위회귀모형 산정 연구 (A Study on Estimation of Soil Moisture Multiple Quantile Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data)

  • 정충길;이지완;이용관;김세훈;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2018년도 학술발표회
    • /
    • pp.23-23
    • /
    • 2018
  • 본 연구에서는 다중분위회귀분석모형(Multiple Quantile Regression Model, MQRM)과 MODIS(MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상관측지점에서 관측한 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중분위회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 71개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중분위회귀분석 모형은 LST 인자를 중심으로 각각의 분위(0.05, 0.25, 0.5, 0.75, 0.95)에 해당되는 값의 회귀식을 NDVI, 강수 입력자료를 독립인자로서 조합하여 계절 및 토성에 따른 총 80개의 회귀식을 산정하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.70 (철원), 0.90 (춘천), 0.85 (수원), 0.65 (서산), 0.78 (청주), 0.82 (전주), 0.62 (순천), 0.63 (진주), 0.78 (보성)로 높은 상관성을 보였다. 본 연구에서는 다중분위회귀 모형의 성능을 검증하기 위해 기존의 다중선형회귀모형의 결과와 비교하여 크게 개선됨을 나타냈다.

  • PDF

로지스틱회귀에서 잔차산점도를 이용한 모형평가 (Model assessment with residual plot in logistic regression)

  • 강명욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권1호
    • /
    • pp.141-150
    • /
    • 2015
  • 로지스틱회귀에서 모형을 평가하거나 진단할 때 가설검정이 주로 사용되지만 이것만으로는 놓칠 수 있는 부분이 많고 이에 대한 보완을 위하여 그래픽적 방법의 사용이 요구된다. 그래프를 이용한 모형의 적절성 평가를 위한 도구로 잔차산점도가 널리 이용되고 있으나 적용 범위가 선형회귀에 국한되는 문제점이 있다. 해결 방안으로 주변모형산점도를 이용하여 모형의 적절성을 평가하는 방법이 있으나 역시 문제점을 가지고 있다. 본 논문에서는 주변모형산점도의 대안으로 카이잔차산점도를 제안하고 그 효용성을 알아본다.

식중독 발생 예측모형 (Models for forecasting food poisoning occurrences)

  • 여인권
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권6호
    • /
    • pp.1117-1125
    • /
    • 2012
  • 식중독 발생에 대한 기존 연구에서는 기온과 습도와 같은 기후변수가 주된 설명변수로 취급되어 왔다. 이 논문에서는 주별 식중독 발생건수와 기후변수 간에 관계를 고찰하고 식중독 발생건수를 예측하기 위한 모형으로 포아송 회귀모형과 자기회귀이동평균모형을 비교한다. 비교결과 우리나라 식중독 발생은 시차를 두고 기후 변수에 영향을 많이 받고 있으나 식중독 발생 예측은 이들 변수보다 이전 시점의 식중독 발생 건수에 더 많이 영향을 받는 것으로 나타났으며 포아송 회귀모형은 예측의 관점에서 문제가 있음을 보였다.

최적 시계열 모형에 기초한 오존주의보 날짜 예측 (Predicting ozone warning days based on an optimal time series model)

  • 박철용;김현일
    • Journal of the Korean Data and Information Science Society
    • /
    • 제20권2호
    • /
    • pp.293-299
    • /
    • 2009
  • 이 논문에서는 대구 두 개 동의 시간별 오존농도를 예측하는 모형으로 회귀, 자기회귀누적이동평균, 자기회귀누적이동평균 오차를 가지는 회귀 같은 선형모형들을 고려하였다. 평균제곱오차제곱근에 근거하여 보았을 때 한 개 동에서는 자기회귀누적이동평균 모형이 최적의 모형으로 선택되었고, 다른 동에서는 자기회귀누적이동평균 오차를 가지는 회귀 모형이 최적 모형으로 선택되었다. 이 최적의 모형으로부터 나온 잔차들의 변동석 분석을 수행하였는데 이를 통해 120 ppb를 넘는 오존 주의보 날짜를 예측하였다. 2000년에서 2003년까지의 훈련용 자료에 근거하여 보았을 때 잔차값의 경계값으로 35 ppb를 잡았을 때 오존주의보 날짜를 예측하는데 좋은 결과를 보였다. 하나의 동에서는 2004년의 오존주의보가 발령된 이틀 중 하루와 나머지 주의보가 발령되지 않은 364일을 모두 정확히 예측하였다. 다른 동에서는 2004년의 오존주의보가 발령된 하루와 주의보가 발령되지 않은 365일을 모두 정확히 예측하였다.

  • PDF

비선형 평균 일반화 이분산 자기회귀모형의 추정 (Estimation of nonlinear GARCH-M model)

  • 심주용;이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권5호
    • /
    • pp.831-839
    • /
    • 2010
  • 최소제곱 서포트벡터기계는 비선형회귀분석과 분류에 널리 쓰이는 커널기법이다. 본 논문에서는 금융시계열자료의 평균 및 변동성을 추정하기 위하여 평균의 추정 방법으로는 가중최소제곱 서포트벡터기계, 변동성의 추정 방법으로는 최소제곱 서포트벡터기계를 사용하는 비선형 평균 일반화 이분산 자기회귀모형을 제안한다. 제안된 모형은 선형 일반화 이분산 자기회귀모형 및 선형 평균 일반화 이분산 자기회귀모형보다 더 나은 추정 능력을 가진다는 것을 실제자료의 추정을 통하여 보였다.

로지스틱 회귀모형에서의 SUPPRESSION (Suppression for Logistic Regression Model)

  • 홍종선;김호일;함주형
    • 응용통계연구
    • /
    • 제18권3호
    • /
    • pp.701-712
    • /
    • 2005
  • 로지스틱 회귀모형에서 suppression의 논의는 선형회귀의 논의보다 많지 않은데 그 이유 중의 하나는 회귀제곱합 또는 결정계수의 정의가 유일하지 않고 다양하기 때문이다. 여러 종류의 결정계수들 중에서 선호되는 두 종류의 결정계수와 Liao와 McGee(2003)가 제안한 두 종류의 수정 결정계수의 정의로부터 회귀제곱합을 유도하여 로지스틱 회귀모형에서의 suppression을 설명하고자 한다. 모의실험을 통하여 자료를 생성하여 어떤 경우에 suppression이 발생하는지를 살펴보고 그 결과를 선형회귀모형에서의 suppression 결과와 비교한다.

Regression-Kriging 모형을 이용한 인구분포 추정에 관한 연구 (Population Distribution Estimation Using Regression-Kriging Model)

  • 김병선;구자용;최진무
    • 대한지리학회지
    • /
    • 제45권6호
    • /
    • pp.806-819
    • /
    • 2010
  • 센서스 단위의 인구자료는 기초적인 인문사회 자료로 행정구역 단위로 요약되어 공간분석에 시용된다. 정밀한 인구 분포를 추정하기 위해 기존의 연구에서는 위성영상과 회귀분석 모형을 이용하였다. 하지만 회귀식에 의한 추정치는 공간자료의 공간적자기상관과 잔차 때문에 정확도에 있어 한계가 있었다. 본 연구는 회귀모형과 회귀모형에서 추출된 잔차에 대해 공간적자기상관을 고려하도록 크리깅 보간하는 RK모형(Regression Kriging Model)을 이용하여 인구분포의 추정 정확도를 향상하였다. RK모형을 적용하여 서울시의 4개구를 대상으로 사례분석을 하였으며, 모형의 효율성을 검증하기 위해 회귀분석만을 이용한 예측 결과와 RK모형을 이용한 예측 결과를 서로 비교하였다. 비교한 결과로 상관관계 계수 평균제곱근 오차, G 통계량 수치에서 RK모형의 추정 정확도가 기존의 회귀모형에 비해 높게 나온 것을 확인할수 있었다. 향후 정확한 인구추정을 위해 RK모형이 많이 활용될 수 있을 것이다.

다항회귀모형에서의 추가받힘점 선택 (Selection of extra support points for polynomial regression)

  • 김영일;장대흥
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1491-1498
    • /
    • 2014
  • 최적실험의 제일 큰 약점은 실험기준이 지나치게 모형과 그에 수반되는 가정에 의존한다는 점이다. 이는 종종 모형의 모수의 개수와 받힘점의 개수가 일치를 하는 경우로 이루어지는데 이는 가정된 모형이 참이 아닌 경우를 대비한 실험이 될 수 없다. 이런 경우 문헌에서는 가정된 다항회귀모형의 차수보다 큰 차수를 가진 다항회귀모형을 가정하고 최적실험을 제안하나 이는 D-효율에 근거한 관행적인 방법일 뿐이다. 본 연구에서는 O'Brien (1995)이 제안한 가정된 모형의 일반적인 이탈을 염두에 둔 추가받힘점 생성에 관하여 알아보고 단순회귀모형과 2차 회귀모형에 대한 실험들을 D-효율로 카타로그화 하여 실험자로 하여금 선택을 할 수 있게 하였다. O'Brien은 비선형모형에 대해 추가받힘점의 선택 방법을 제시하였지만 방법을 구현하는 데 있어 명확치 않은 기준이 있어 모수에 의존하는 비선형모형에 대한 최적실험보다는 다항회귀모형을 중심으로 심층적으로 사용방법을 알아보았다.