• 제목/요약/키워드: 다중선형회귀

검색결과 417건 처리시간 0.032초

기상자료기반 다중선형회귀분석에 의한 농업용 저수지 월단위 저수율 예측 및 저수지 가뭄지수(RDI) 추정 (Forecasting Monthly Agricultural Reservoir Storage and Estimation of Reservoir Drought Index (RDI) Using Meteorological Data Based Multiple Linear Regression Analysis)

  • 이지완;김진욱;정충길;김성준
    • 한국지리정보학회지
    • /
    • 제21권3호
    • /
    • pp.19-34
    • /
    • 2018
  • 본 논문의 목적은 농업용 저수지 저수율 계측자료와 기상인자와의 다중선형회귀분석을 통해 저수율 예측 월단위 회귀식을 산정하는데 있다. 2002년부터 2016년까지의 한국농어촌공사 저수지 3,067개에 대한 저수율 관측자료와 기상청 63개 지점 관측자료를 수집하여 저수율 예측 다중선형 회귀식을 도출하였으며, 개발된 월별 회귀식에 대한 $R^2$는 0.51~0.95로 분석되었다. 또한 회귀식의 적용성 평가를 위해 9개 대표저수지에 대해 관측값과 비교한 $R^2$는 0.44~0.81로 나타났다. 회귀식을 이용하여 평년(1976-2005) 대비 저수지 가뭄지수(Reservoir Drought Index, RDI)를 산정하여 ROC 분석을 수행한 결과, 극심한 가뭄의 경우 2년(2015~2016) 평균 적중률은 0.64로 겨울의 적중률이 0.70으로 가장 높았고, 여름의 적중률이 0.58로 가장 낮게 나타났으며, 봄과 가을의 적중률은 각각 0.59, 0.68로 분석되었다. 본 연구에서 도출한 회귀식은 가용한 관측자료 및 1~3개월의 장기 기상전망자료 기반의 월단위 저수율 전망자료 생산이 가능하므로, 이를 기반으로 농업가뭄 전망정보의 생산이 가능할 것으로 판단된다.

다중 선형 회귀를 이용한 PNU/CME CGCM의 동아시아 여름철 강수예측 보정 연구 (A Correction of East Asian Summer Precipitation Simulated by PNU/CME CGCM Using Multiple Linear Regression)

  • 황윤정;안중배
    • 한국지구과학회지
    • /
    • 제28권2호
    • /
    • pp.214-226
    • /
    • 2007
  • 강수는 다양한 대기 변수들의 영향으로 나타나기 때문에 비선형성이 매우 강하다. 따라서 역학 모형을 통해 예측된 강수의 보정은 비선형 모형인 인공 신경망 등을 통해 가능할 것이지만, 인공 신경망의 경우 초기 가중치 선택, 지역 최소화 문제, 뉴런의 수 결정 등의 문제로 인한 한계가 있다. 그러므로 본 연구에서는 가장 보편적으로 사용되는 다중 선형 회귀 모형을 이용하여 CGCM에 의해 모사된 강수를 보정하였으며, 예측성을 살펴보았다. 이를 위하여 우선 PNU/CME 접합 대순환 모형(Coupled General Circulation model, CGCM)(박혜선과 안중배, 2004)을 이용하여 1979년부터 2005년까지 매해 4월부터 8월까지 5개월간 앙상블 적분을 하였다. 적분 결과 중 한반도를 포함한 동북아시아 지역$(110^{\circ}E-145^{\circ}E,\;25^{\circ}N-55^{\circ}N)$의 여름철인 6월(리드 2), 7월(리드 3), 8월(리드 4) 및 여름철 평균인 JJA(from June to August) 기간의 PNU/CME CGCM에 의해 모사된 강수를 보정하기 위해 다중 선형 회귀(Multiple Linear Regression, MLR)를 이용하였다. PNU/CME 접합 대순환 모형의 결과 중 강수, 500 hPa 연직 속도, 200 hPa 발산장, 지상 기온 등의 예측 인자와 관측 강수와의 선형적인 관계를 이용하여 MLR 모형을 구축하였다. 그리고 교차 검증(cross- validation)을 수행하여 PNU/CME 접합 대순환 모형의 결과와 교차 검증 결과를 비교하였다. 상관계수, 적중률 (hit rate), 오보율(false alarm rate) 그리고 Heidke 기술 점수(Heidke skill score) 등을 살펴본 바, 보정하지 않은 모형의 결과에 비해 MLR 모형을 이용하여 보정한 결과의 강수에 대한 예측성이 뛰어난 것을 알 수 있었다.

회귀분석을 이용한 최심신적설 추정식 개발 (Estimation of Maximum Fresh Snow Depth using Regression Analysis)

  • 박희성;정건희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.205-205
    • /
    • 2016
  • 우리나라의 겨울철 자연재해 중 대설에 의한 피해가 발생하는 빈도가 증가하고 있는 가운데 그 피해를 예측하고 대비하기 위한 연구들이 다수 진행되고 있다. 강설은 일단위로 측정하며, 매일 새롭게 내린 강설의 양인 최심신적설과 기존에 녹지 않고 쌓여 있던 깊이까지를 고려한 최심적설로 구분된다. 우리나라의 경우에는 갑작스럽게 내린 폭설에 의한 피해가 대부분이므로 최심신적설량을 예측하는 것이 매우 중요하다. 이에 본 연구에서는 다중회귀분석을 이용해 우리나라의 최심신적설량을 추정하기 위한 식을 개발하였다. 다중회귀분석을 위한 독립변수로는 해당 일에 예측된 강수량, 일평균기온, 일최고기온, 일최저기온을 사용하였으며, 강수량과 일평균기온의 상호작용을 고려할 수 있도록 모형을 구성하였다. 모형의 개발에는 전국 74개 기상관측소의 최심신적설 자료를 관측소 단위로 전체 자료의 2/3을 무작위로 추출하여 이용하였으며, 추출되지 않고 남은 1/3의 자료를 이용해 모형에 대한 검증을 실시하였다. 그 결과 상호작용항이 포함되지 않은 다중선형회귀모형에 비해 상호작용을 고려한 다중회귀모형의 예측력이 훨씬 우수하게 나타났다. 강수량과 기온이 정확하게 예측된다면 개발된 추정식을 이용해 간편하게 최심신적설량을 예측할 수 있어, 폭설에 대한 대비에 활용할 수 있을 것으로 판단된다.

  • PDF

통계적 모형을 이용한 지천 홍수예측 (Tributary Flood Forecasting Using Statistical Analysis Method)

  • 성지연;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1524-1527
    • /
    • 2009
  • 본 연구는 주요지천 홍수예측에 적용된 통계적 모형을 개선하여 예측 결과의 정확성 향상을 도모하는 데 목적이 있다. 중랑천, 탄천, 왕숙천 등 한강수계 주요 지천은 홍수예보 지점으로 유역면적이 작고 도달 시간이 짧아 기존의 대하천 홍수예보에 이용되고 있는 수문학적 홍수예측 모형을 적용하기에는 한계가 있다. 이러한 문제점을 해결하기 위해 주요 지천 홍수예측에 통계적 모형인 다중선형 회귀모형을 이용하는 방법이 제안되어 활용되었다. 본 연구에서는 지천홍수예측에 기 적용된 다중선형 회귀 모형의 다중공선성 문제를 해결하기 위해 독립변수를 조정하고, 10분 단위 관측 자료를 활용한 예측 결과를 얻기 위해 매개변수를 재산정하였다. 그 결과 기존 모형에 비해 적은 수의 독립변수와 재 산정된 매개변수를 이용한 통계적 모형으로 예측 수위의 오차를 줄일 수 있었다.

  • PDF

미계측 관측 강수 자료 생성을 통한 제주도 지역의 수문총량 추정 (Estimating the Total Precipitation Amount with Simulated Precipitation for Ungauged Stations in Jeju Island)

  • 김남원;엄명진;정일문;허준행
    • 한국수자원학회논문집
    • /
    • 제45권9호
    • /
    • pp.875-885
    • /
    • 2012
  • 본 연구에서는 미계측 강수자료를 생성하여 공간 해석함으로써 제주도의 정확한 수문총량을 산정하였다. 미계측 강수자료는 본 연구에서 제시된 수정된 다중회귀선형 모형으로 생성하였으며 공간강수량은 PRISM을 적용하여 구하였다. 수정된 다중선형회귀 모형에 의한 미계측 강수자료의 추정 값들은 기존의 강수 패턴과 유사한 양상을 나타내어 모형의 정확도가 우수한 것으로 나타났으며, 공간강수량의 해석결과는 Case 1(원자료)과 Case 2(미계측 강수자료를 보완한 자료)의 연평균 강수량이 약 1.5%의 미미한 차이를나타내었으나 고도별 연평균 강수량 차이는 최대 37.4%가 증가하는 것으로 산정되었다. 따라서 본 연구에서 제안한 미계측 관측 자료 생성방법은 현재 관측소의 밀도가 낮은 곳과 국지적으로 강수량의 변화가 큰 곳에서의 수문총량의 산정시 유용할 것으로 판단된다.

통합 비교차 다중 분위수회귀나무 모형을 활용한 AI 면접체계 자료 분석 (Analysis of AI interview data using unified non-crossing multiple quantile regression tree model)

  • 김재오;방성완
    • 응용통계연구
    • /
    • 제33권6호
    • /
    • pp.753-762
    • /
    • 2020
  • 본 연구는 대한민국 육군이 선도적으로 도입하고자 노력하고 있는 AI 면접체계의 자료를 통합 비교차 다중 분위수 회귀나무 모형(unified non-crossing multiple quantile tree; UNQRT)을 활용하여 분석한 것이다. 분위수 회귀가 일반적인 선형회귀에 비하여 많은 장점을 가지지만, 선형성 가정은 여전히 많은 현실 문제해결에 있어 지나치게 강한 가정이다. 선형성을 완화한 모형의 하나인 기존 나무모형 기반의 분위수 회귀는 추정된 분위수 함수별로 교차하는 문제와 분위수별로 나무모형을 제시하여 해석력을 저하시키는 문제가 있다. 통합 비교차 다중 분위수회귀나무 모형은 비교차 제약식을 부여한 상태로 다중 분위수 함수를 동시에 추정함으로서 분위수 함수의 교차 문제를 해결하며, 극단 분위수에서 안정된 결과를 기대할 수 있고, 하나의 통합된 나무모형을 제시하여 우수한 해석력이 있다. 본 연구에서는 통합 비교차 다중 분위수회귀나무 모형을 활용하여 육군 AI 면접체계의 결과와 기존 인사자료간 관계를 충분히 탐색하여 의미있는 다양한 결과를 도출하였다.

커터수명지수 예측을 위한 다중선형회귀분석과 트리 기반 머신러닝 기법 적용 (Application of Multiple Linear Regression Analysis and Tree-Based Machine Learning Techniques for Cutter Life Index(CLI) Prediction)

  • 홍주표;고태영
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.594-609
    • /
    • 2023
  • TBM 공법은 굴착면 안정성 확보 및 주변환경에 비치는 영향을 최소화하기 때문에 도심지나 하·해저터널 등에서 적용 사례가 증가하는 추세이다. 디스크 커터의 수명을 예측하는 대표적인 모델 중 NTNU모델은 커터수명지수(Cutter Life Index, CLI)를 주요 매개 변수로 활용하지만 복잡한 시험절차와 시험장비의 희귀성으로 측정에 어려움이 있다. 본 연구에서는 다중선형회귀분석과 트리 기반의 머신러닝 기법으로 암석물성을 활용하여 CLI를 예측하였다. 문헌 조사를 통해 암석의 일축압축강도, 압열인장강도, 등 가석영함량과 세르샤 마모지수 등을 포함한 데이터베이스를 구축하였고 파생변수를 계산하여 추가하였다. 다중선형회귀분석은 통계적 유의성과 다중공선성을 고려하여 입력 변수를 선정하였고 머신러닝 예측 모델은 변수 중요도를 기반으로 입력 변수를 선정하였다. 학습용과 검증용 데이터를 8:2로 나누어 모델 간 예측 성능을 비교한 결과 XGBoost가 최적의 모델로 선정되었다. 본 연구에서 도출된 다중선형회귀모델과 XGBoost모델을 선행 연구와 예측 성능을 비교하여 타당성을 확인하였다.

Shrinkage Structure of Ridge Partial Least Squares Regression

  • Kim, Jong-Duk
    • Journal of the Korean Data and Information Science Society
    • /
    • 제18권2호
    • /
    • pp.327-344
    • /
    • 2007
  • 다중공선성의 데이터에 사용되는 대표적인 편향회귀방법은 능형회귀(RR), 주성분회귀(PCR), 부분최소제곱회귀(PLS) 등이다. 이 회귀방법들은 계수베거 추정량의 놈(norm)이 모두 보통 최소제곱회귀(OLS)의 추정량의 놈보다 작아진다는 의미에서 축소회귀라 부른다. 새로운 회귀방법으로 RR과 PCR을 결합한 능형주성분회귀(RPCR)가 있고 RR과 PLS를 결합한 능형부분최소제곱회귀(RPLS)가 있으며 이들도 또한 축소회귀이다. 이들 추정량은 X'X의 고유벡터들의 선형결합으로 나타낼 수 있고 따라서 각 고유방향에서 OLS에 비해 얼마나 축소되는지를 연구할 수 있다. 본 논문에서는 먼저 이들 추정량을 일반적인 축소인자의 식으로 나타내고 이를 이용하여 MSE의 일반식을 구하였으며 PLS 추정량의 MSE 식도 구하였다. 그리고 RPLS의 축소인자 식을 두 가지 다른 형태로 유도하였다. RPLS의 경우도 이 축소인자 식을 MSE의 일반식에 대입하면 MSE 식이 바로 얻어진다. 그러나 PLS나 RPLS의 축소인자는 y의 복잡한 비선형이 되어 결정적이 아니므로 이들 추정량의 MSE는 근사적인 식이라 할 수 있다. 따라서 PLS나 RPLS를 평가하기 위해 이 MSE를 사용하는 것은 제한적이며, 경험적인 방법으로 이들 회귀의 수행성을 평가하는 것이 필요하다. 다중공선성의 대표적인 데이터인 근적외선 분광 데이터를 이용하여 이 유도된 회귀의 축소인자 값이 인자수에 따라 어떻게 변화하는지와 전체적인 축소 비율도 살펴보았다. 이들의 축소 형태를 잘 이해하면 회귀방법들의 예측력과 안정성을 파악하는데 많은 도움이 되리라 판단된다.

  • PDF

선박 생산계획에 대한 일정 예측방법의 다중선형회귀분석 모형연구 (A Study of Multiple Linear Regression Model for Schedule Prediction Method about Ship Production Planning)

  • 강태욱;옥영석
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.351-352
    • /
    • 2016
  • 조선소의 생산계획 담당자가 기존 실적 정보를 이용하여 관심 대상인 미래의 생산계획 상황을 보다 쉽게 예측하여 생산계획의 적중률을 높일 수 있도록 할 예정이다. 2006년에서 2016년의 S조선사의 2차 데이터를 이용하여 요인 분석을 하고 다중회귀분석 모형을 설계하여 활용하는 프로세스를 설계한다. 사례 연구를 통해 연구 모형이 적절한지를 검증할 계획이다.

  • PDF