• Title/Summary/Keyword: 다중 선형 회귀

검색결과 423건 처리시간 0.034초

호우피해자료에서의 고차원 자료 및 다중공선성 문제를 해소한 회귀모형 개발 (Development of Regression Models Resolving High-Dimensional Data and Multicollinearity Problem for Heavy Rain Damage Data)

  • 김정환;박지현;최창현;김형수
    • 대한토목학회논문집
    • /
    • 제38권6호
    • /
    • pp.801-808
    • /
    • 2018
  • 선형회귀모형의 학습은 일반적으로 자료의 개수가 설명변수의 개수보다 충분히 크고, 설명변수들 사이에 심각한 다중공선성이 없다는 가정 하에서 안정적으로 이루어진다. 본 연구에서는 이러한 가정이 위배되었을 경우 모형 학습의 어려움을 실제 호우피해자료를 분석함으로써 조명하였고, 이를 해결하기 위해 자료를 통합한 다음 주성분회귀모형 또는 능형회귀모형을 사용할 것을 검토하였다. 모형의 학습에 사용된 자료와 별도의 독립된 자료에서 제안된 모형들의 예측력을 평가하였고, 제안된 방법이 선형회귀모형보다 더 나은 예측력을 보이는 것을 확인하였다.

선형회귀 모형에서 자기공분산 기반 추정 (Autocovariance based estimation in the linear regression model)

  • 박철용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제22권5호
    • /
    • pp.839-847
    • /
    • 2011
  • 이 연구에서는 다중 선형회귀 모형에서 자기공분산에 근거한 회귀 계수의 추정량을 도출하였다. 자기공분산에 근거한 방법은 Park (2009)에 제시된 방법으로 직관적으로 매혹적이지는 않지만, 이것에 근거한 추정량이 회귀 계수의 불편추정량이 된다. 설명변수 벡터가 어떤 정칙조건을 만족한다면, 오차가 자기회귀이동평균 모형을 따르면 만족되는 약한 조건 하에서 이 추정량이 최소제곱 추정량과 점근적으로 동일한 분포를 가지며 또한 회귀 계수에 확률 상 수렴한다는 것을 보였다. 마지막으로 모의실험을 통해 이 성질들이 소표본에서도 성립하는 것을 보였다.

풍속 예측을 위한 선형회귀분석과 비선형회귀분석 기법의 비교 및 인자분석 (Comparison of Linear and Nonlinear Regressions and Elements Analysis for Wind Speed Prediction)

  • 김동연;서기성
    • 한국지능시스템학회논문지
    • /
    • 제25권5호
    • /
    • pp.477-482
    • /
    • 2015
  • 단기풍속 예측을 위한 진화적 선형 및 비선형 회귀분석 기반의 보정 기법을 비교한다. 모델의 체계적 오류를 교정하기 위한 효율적인 MOS(Model Output Statistics)의 개발이 필요하나, 기존의 선형회귀분석 기반의 보정기법은 다양한 기상요소의 복잡한 비선형 특성을 반영하기 힘들다. 이를 개선하기 위해서 유전 프로그래밍을 사용하여 풍속 예측에 대한 비선형 보정 수식을 생성하는 기법을 제안하고 기본 다중선형회귀분석법 및 Ridge, Lasso 회귀분석법과 비교한다. 더불어, 선형회귀분석법과 진화적 비선형회귀분석 기법의 인자 선택의 차이와 유사성을 비교하고 분석한다. 2007년~2013년의 KLAPS(Korea Local Analysis and Prediction System) 재분석자료를 사용하여 제주도와 부산지역의 격자점에 대한 실험을 수행한다.

제주지역 지하수 함양 지체시간 분석 (Analysis on the delay time of groundwater recharge in Jeju region)

  • 정일문;나한나
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.433-433
    • /
    • 2012
  • 제주지역의 지하수 함양 지체시간을 분석하기 위해 18개 지점의 지하수 관측자료를 기초로 강수-지하수위 자료를 강수사상별로 분류하여 분석하였다. 지하수 함양에 결정적인 영향을 주는 인자로 지하수위의 대수층 두께와 지점의 투수계수를 설정하였다. 대체로 고도가 낮은 지역에서는 지하수 함양 지체가 짧았으나 고도가 높아질 수록 대수층 두께도 증가하여 지하수 함양지체시간은 길게 나타났다. 하지만 대수층 두께만으로 지체시간이 결정되는 것은 아니며 이에 투수계수 자료를 함께 분석해야만 타당한 결과를 얻을 수 있을 것으로 판단하여 대수층 두께와 지점 투수계수를 변수로 두고 관측된 지하수 함양지체시간과의 관계를 다중선형회귀분석을 통해 구하였다. 다중상관계수는 0.9정도로 높게 나타났으며, 대수층 두께에 대한 통계학적 유의성도 적합하게 나타났다. 이와 같이 결정된 회귀식은 향후 지하수 함양지체시간의 공간분포를 결정함에 있어 활용이 가능하며 분포형 수문모형과 연계시킬 경우 통합모델링에 적절하게 반영될 수 있을 것으로 판단된다.

  • PDF

MODIS 다중 위성영상 기반의 토양수분 및 가뭄지수 산정연구 (Estimation of Spatio-temporal soil moisture and drought index based on MODIS multi-satellite images)

  • 정지훈;김주연;김형석;정다은;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.446-446
    • /
    • 2022
  • 본 연구에서는 MODIS(MODerate resolution Imaging Spectroradiometer) 다중 위성영상을 기반으로 전국 시공간 토양수분 및 토양수분 기반의 가뭄지수 SWDI(Soil Water Deficit Index)를 산정하였다. 시공간 토양수분의 산정을 위해 입력자료로 MODIS 위성의 지표면온도(Land Surface Temperature, LST), 증발산 및 식생(Enhanced Vegetation Index, EVI; Fraction of Photosynthetically Active Radiation, FPAR; Leaf Area Index, LAI; Normalized Difference Vegetation Index, NDVI) 관련 산출물 자료와 지상 관측자료인 일 단위 강수량 자료를 구축하였다. MODIS 위성영상은 산출물별로 제공되는 QC(Quality Control) 영상을 활용해 보정을 수행하였고, 공간 강수량 자료는 기상청에서 제공하는 전국 92개 지점의 종관기상관측자료를 구축하여 공간보간기법인 역거리가중법을 적용해 생성하였다. 실측 토양수분은 농촌진흥청에서 제공하는 76개 지점의 토양 깊이 10 cm에 설치된 TDR(Time Domain Reflectomerty) 센서에서 측정된 토양수분 자료를 활용하였으며, 토양수분 모의 시 토양 속성을 고려하기 위해 국립농업과학원에서 제공하는 토양도를 구축하여 활용하였다. 토양수분 산정 모형은 다중선형회귀모형(Multiple Linear Regression Model, MLRM)을 활용하였으며, 계절 및 토성에 따른 회귀식을 산정하였다. 회귀식 기반의 토양수분과 토성별 포장용수량 및 영구위조점 값을 이용하여 SWDI를 산정하고, 실제 가뭄 발생 시기 및 지역과의 비교하고자 한다.

  • PDF

자료기반 실시간 홍수예측 모형의 비교·검토 (Comparison of Data-based Real-Time Flood Forecasting Model)

  • 최현구;한건연;노홍식;박세진
    • 대한토목학회논문집
    • /
    • 제33권5호
    • /
    • pp.1809-1827
    • /
    • 2013
  • 기후변화로 인해 발생하는 이상홍수에 대비하기 위해서는 다양한 대책을 강구할 필요가 있다. 그 중 비구조적 대책으로 홍수예경보시스템을 구축하여 홍수에 대비할 수 있도록 하는 것이 중요하다. 본 연구의 목적은 실시간 홍수예측 시스템을 구축하기 위해 뉴로-퍼지 모형과 다중선형회귀 모형을 비교하여 우수한 실시간 홍수예측 모형을 개발하는데 있다. 이를 위해 같은 입력자료를 사용하여 뉴로-퍼지 모형과 다중선형회귀 모형을 구축하고 낙동강 유역의 다양한 홍수사상에 대해 적용하였다. 모의결과 뉴로-퍼지 모형이 다중선형회귀 모형보다 좀 더 나은 예측 결과를 나타내는 것을 확인할 수 있었다. 본 연구는 향후 낙동강 유역의 충분한 선행시간을 확보한 정확도 높은 홍수정보시스템의 구축에 활용할 수 있을 것으로 판단된다.

다중회귀모형을 이용한 AMSR2 토양수분의 정량적 개선 (Bias Correction of AMSR2 Soil Moisture Data Using a Multiple Regression Method)

  • 김묘정;김광섭
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.514-514
    • /
    • 2015
  • 홍수 예측의 개선에 있어 정확한 공간 토양수분 정보는 필수적이다. 위성관측을 활용한 토양수분관측이 이루어지고 있으나 실제적 토양수분 상태와 정량적 차이가 크므로 편이보정을 통한 정량적 개선과정이 요구되는 실정이다. 따라서, 본 연구에서는 위성에서 관측한 AMSR2 토양수분과 지상관측 토양수분자료 및 다중회귀모형를 이용하여 토양수분자료를 정량적로 개선하였다. 공간 해상도가 10 km인 AMSR2 토양수분을 1 km로 상세화한 우리나라 전역의 토양수분 자료와 수자원관리종합정보시스템(WAMIS)에서 제공하는 강우관측소 556개 지점에서 관측한 강우자료, 후처리한 MODIS LST 자료, 증발산량 및 식생지수를 사용하였다. 2012년 7월부터 2013년까지 기상청 농업기상관측관서에서 관측하는 지점 중 사용 가능한 6개 토양수분관측소 자료에 대해 토양군별회귀계수를 산정하였다. 토양군별 다중회귀모형을 이용하여 편이보정한 토양수분자료는 전반적으로 과소추정되는 AMSR2 토양수분의 단점을 개선하여 위성관측 토양수분자료의 활용성을 개선하였다(Fig. 1).

  • PDF

OLS 및 변수선택법에 의한 다중선형회귀모형 매개변수 산정 (Parameter Estimation for Multiple Linear Regession Model by OLS and Stepwise)

  • 김경탁;김주훈;박정술
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.1161-1165
    • /
    • 2006
  • 본 연구는 OLS 및 변수선택법에 의해 통계학적 모형의 매개변수를 산정하여 모형의 적용성을 입증하고 하천 주요지점에 대한 홍수위 예측을 통해 홍수예보 및 예측 업무에 기여코자하는데 연구목적이 있다. 다중선형회귀모형을 구성하기 위한 독립변수는 예보지점의 수위/유출량 자료와 상류지점의 수위/유출량 자료, 그리고 유역의 선행 평균강우량 등의 자료를 독립변수로 하여 통계학적 홍수예측을 위한 다중선형 회귀모형을 각각 구성하여 적합성 여부를 판단하였다. 매개변수 산정은 OLS(Ordinary least square root method)와 변수선택(Stepwise)방법에 의해 산정하였으며, 중랑천 유역의 2002년부터 2005년까지의 수문사상 16개를 선정하여 모형에 적용한 결과 두 매개변수 산정방법 모두 30분에서 90분 예측은 상대적으로 정확한 결과를 나타내었으며, OLS 및 변수선택법에 의한 매개변수 산정결과 변수선택법에 의한 방법이 OLS 방법보다는 상관성이나 효율지수면에서 조금 더 정확한 값을 나타내고 있으나 독립변수의 일관성을 감안한다면 변수선택법보다는 OLS방법에 의한 매개변수 산정이 타당할 것으로 사료된다. 기존의 홍수예보 업무에 활용되고 있는 수문학적 홍수예측 모형인 저류함수법의 여러 매개변수 조정에 의한 홍수위 예측 방법보다는 비교적 간단한 통계적 방법에 의한 홍수위 예측 방법으로 홍수예보의 선행시간 확보가 필수적인 중랑천과 같이 유역면적이 작은 중소하천에서의 홍수예보 업무에 효과적으로 이용 가능할 것으로 사료된다.

  • PDF

비교차 제약식을 이용한 다중 선형 분위수 회귀모형에 관한 비교연구 (A comparison study of multiple linear quantile regression using non-crossing constraints)

  • 방성완;신승준
    • 응용통계연구
    • /
    • 제29권5호
    • /
    • pp.773-786
    • /
    • 2016
  • 분위수 회귀는 반응변수의 조건부 분위수 함수를 추정함으로써 반응변수와 예측변수의 관계에 대한 포괄적인 정보를 제공한다. 그러나 여러 개의 분위수 함수를 개별적으로 추정하게 되면 이들이 서로 교차할 가능성이 있으며, 이러한 분위수 함수의 교차(quantile crossing) 현상 분위수의 이론적 기본 특성에 위배된다. 본 논문에서는 다중 비교차 분위수 함수의 추정의 대표적인 방법들의 특성을 적합식과 계산 알고리즘의 측면에서 살펴보고, 모의실험과 실제 자료 분석을 통해 그 성능을 비교하였다.

기상자료기반 다중선형회귀분석에 의한 농업용 저수지 월단위 저수율 예측 및 저수지 가뭄지수(RDI) 추정 (Forecasting Monthly Agricultural Reservoir Storage and Estimation of Reservoir Drought Index (RDI) Using Meteorological Data Based Multiple Linear Regression Analysis)

  • 이지완;김진욱;정충길;김성준
    • 한국지리정보학회지
    • /
    • 제21권3호
    • /
    • pp.19-34
    • /
    • 2018
  • 본 논문의 목적은 농업용 저수지 저수율 계측자료와 기상인자와의 다중선형회귀분석을 통해 저수율 예측 월단위 회귀식을 산정하는데 있다. 2002년부터 2016년까지의 한국농어촌공사 저수지 3,067개에 대한 저수율 관측자료와 기상청 63개 지점 관측자료를 수집하여 저수율 예측 다중선형 회귀식을 도출하였으며, 개발된 월별 회귀식에 대한 $R^2$는 0.51~0.95로 분석되었다. 또한 회귀식의 적용성 평가를 위해 9개 대표저수지에 대해 관측값과 비교한 $R^2$는 0.44~0.81로 나타났다. 회귀식을 이용하여 평년(1976-2005) 대비 저수지 가뭄지수(Reservoir Drought Index, RDI)를 산정하여 ROC 분석을 수행한 결과, 극심한 가뭄의 경우 2년(2015~2016) 평균 적중률은 0.64로 겨울의 적중률이 0.70으로 가장 높았고, 여름의 적중률이 0.58로 가장 낮게 나타났으며, 봄과 가을의 적중률은 각각 0.59, 0.68로 분석되었다. 본 연구에서 도출한 회귀식은 가용한 관측자료 및 1~3개월의 장기 기상전망자료 기반의 월단위 저수율 전망자료 생산이 가능하므로, 이를 기반으로 농업가뭄 전망정보의 생산이 가능할 것으로 판단된다.