• Title/Summary/Keyword: 다중선형회귀

Search Result 416, Processing Time 0.048 seconds

Estimation of Hydrometeorologic Parameters using Dynamic Multiple Linear Regression Model (동적 다중선형회귀 모형을 이용한 한반도 수문기상인자 산정)

  • Cho, Hyungon;Kim, Baek-Jo;Lim, Yoon-Jin;Kim, Gwangseob
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.286-286
    • /
    • 2016
  • 기후변화를 고려한 위한 미래 수자원 계획은 신뢰성 있는 수문기상인자의 산정을 통한 수자원 영향 평가 결과로 수립되는 것이 중요하다. 본 연구에서는 DHSVM모형과 TOPLATS모형에서 생산된 결과를 가지고 제약조건을 가지는 다중선형회귀 모형을 통하여 2012년-2014년 동안의 한반도 유역에 대한 수문기상인자를 산정하였다(Fig. 1). 다중선형회귀 모형은 하나의 종속변수의 변화를 설명하기 위하여 두 개 이상의 독립변수를 사용하는 모형으로 일반적으로 다중선형회귀 모형의 회귀 계수는 음의 값을 가질 수 있으므로 본 연구의 적용을 위하여 검정지점에 대하여 산정된 음의 회귀계수 값이 그대로 적용될 경우 적합하지 않으므로 회귀 계수에 제약조건을 부여하였다. 제한된 회귀 계수의 범위는 0-1사이를 가진다. 동적 다중선형 모형의 구성은 광릉 GCK, GDK 지점자료를 활용하였다.

  • PDF

Flood risk index optimization using multiple linear regression (다중선형회귀를 이용한 홍수위험지수 최적화)

  • Kim, Myojeong;Kim, Gwangseob
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2016.05a
    • /
    • pp.283-283
    • /
    • 2016
  • 기후변화의 지역적 영향으로 호우의 강도와 빈도가 증가하고 있는 상황에서 수재해 대응을 위하여 다양한 기술들이 필요하며 특히 홍수 취약성에 대한 분석과 평가가 선행되어야 한다. 본 연구에서는 기존의 PSR(Pressure-State-Response) 모형과 DPSIR(Driving force-Pressure-StateImpact-Response 모형을 다중선형회귀 기법을 사용하여 최적화하였다(Fig. 1). 대상기간은 2008년부터 2013년까지이며, mod 1에서는 연도별로 다중선형회귀기법을 사용하여 최적 가중치를 산정하였고, mod 2에서는 대상기간(2008 ~ 2013) 전체에 대해 다중선형회귀기법을 사용하여 최적 가중치를 산정하는 방법을 적용하였다.

  • PDF

A Study on the Estimation Method of Hemoglobin Based on Linear and Multiple Regression Analysis Using Health Examination Big Data (건강검진 빅데이터를 이용한 선형 및 다중회귀분석 기반 헤모글로빈 추정 방법에 관한 연구)

  • Hong, Sang-Hoon;Hong, Kwang-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.553-555
    • /
    • 2021
  • 빈혈의 유병률은 매년 증가하고 있으나 이를 가벼운 질병으로 인식해 치료 시기를 놓치는 환자들이 존재한다. 빈혈의 발생원인으로 혈액 내 헤모글로빈 및 헤모글로빈 내 철 부족이 있으며, 헤모글로빈 측정기술의 경우 채혈 이외에 사람의 신체 및 건강 정보를 적용한 사례는 찾아보기 어렵다. 본 논문에서는 신체(키, 몸무게 및 허리둘레) 및 건강 정보(혈청지오티, 이완기 혈압 및 감마지티피 등)가 포함된 건강검진 빅데이터를 이용하여 단일 특징에 대해 선형회귀분석을 수행하고, 다중 특징에 대해 다중회귀분석을 수행하여 회귀분석 식을 산출, 산출된 회귀분석 식을 통해 헤모글로빈을 추정하여 실제 헤모글로빈값과 오차율을 계산하고 비교한다. 실험 결과, 선형회귀분석 식을 통해 헤모글로빈을 추정하였을 때 평균 8.124%의 오차율이 계산되었으며, 다중회귀분석의 경우 선형회귀분석보다 낮은 6.767%의 오차율이 계산되었다.

특허분석을 활용한 항해 시스템 기술예측

  • Park, Eun-Ju;Jeong, Jung-Sik
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2015.07a
    • /
    • pp.50-52
    • /
    • 2015
  • 특허는 기술에 대한 광범위한 정보를 포함하고 있다. 기존의 기술예측은 정량적분석으로 시도되었지만 특허분석을 활용하여 정성적분석을 실시하였다. 특허분석을 시행하기 위하여 R 프로그램을 이용하여 주성분분석과 다중선형회귀분석을 실행하였다. 주성분분석과 다중선형회귀분석을 통하여 키워드를 추출하고 추출된 키워드를 통해 기술예측을 실시한다.

  • PDF

Development of Multiple Linear Regression Model to Predict Agricultural Reservoir Storage based on Naive Bayes Classification and Weather Forecast Data (나이브 베이즈 분류와 기상예보자료 기반의 농업용 저수지 저수율 전망을 위한 저수율 예측 다중선형 회귀모형 개발)

  • Kim, Jin Uk;Jung, Chung Gil;Lee, Ji Wan;Kim, Seong Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.112-112
    • /
    • 2018
  • 최근 이상기후로 인한 국부적인 혹은 광역적인 가뭄이 빈번하게 발생하고 있는 추세이며 발생횟수 뿐 아니라 가뭄 심도 및 지속기간이 과거보다 크게 증가하여 그에 따른 피해가 커질 것으로 예측되고 있다. 특히, 2014~2015년도의 유례없는 가뭄으로 인해 저수지 용수공급이 제한되면서 많은 농가들이 피해를 입었다. 본 연구의 목적은 전국 농업용 저수지를 대상으로 기상청 3개월 예보자료를 활용 할 수 있는 농업용 저수지 저수율 다중선형 회귀 모형을 개발하여 저수율 전망정보를 생산하는 것이다. 본 연구에서는 전국에 적용 가능한 저수율 다중선형 회귀 모형개발을 위해 5개의 기상요소(강수량, 최고기온, 최저기온, 평균기온, 평균풍속)와 관측 저수지 저수율을 활용했다. 기상자료는 2002년부터 2017년까지의 기상청 63개 지상관측소로부터 기상관측자료를 수집하였다. 본 연구에서는 저수율 전망 단계를 세 단계로 나누었다. 첫 번째 단계로 농어촌공사에서 전국 511개 용수구역을 대상으로 군집분석 및 의사결정나무 분석을 통해 제시한 65개 대표저수지를 대상으로 기상자료 및 관측 저수율 자료를 이용하여 다중선형 회귀분석을 실시하였다. 수집한 기상요소와 저수율을 독립변수로 하여 월별 회귀식을 산정한 결과 결정계수($R^2$)는 0.51~0.95로 나타났다. 두 번째 단계로 대표저수지의 회귀분석 결과를 전국의 저수지로 확대하기 위해 나이브 베이즈 분류법을 적용하여 전국 3098개의 저수지를 65의 군집으로 분류하고 각각의 군집에 해당되는 월별 회귀식을 산정하였다. 마지막으로 전국 저수지로 산정된 회귀식과 농업 가뭄 예측을 위해 기상청의 GS5(Global Seasonal Forecasting System 5) 3개월 예보자료를 수집하여 회귀식에 적용해 2017년 전국 저수지의 3개월 저수율 전망정보를 생산하였다. 본 연구의 전국 저수지 군집결과 기반의 저수율 전망기술은 2017년도 관측 저수율과 비교한 결과 유의한 상관성을 나타냈으며 이 결과는 추후 농업용 저수지의 물 공급 및 농업가뭄 전망 자료로서 이용이 가능할 것으로 판단된다.

  • PDF

Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient (다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가)

  • Lee, Sun Mi;Park, Inhwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

Comparison of Different Multiple Linear Regression Models for Real-time Flood Stage Forecasting (실시간 수위 예측을 위한 다중선형회귀 모형의 비교)

  • Choi, Seung Yong;Han, Kun Yeun;Kim, Byung Hyun
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.32 no.1B
    • /
    • pp.9-20
    • /
    • 2012
  • Recently to overcome limitations of conceptual, hydrological and physics based models for flood stage forecasting, multiple linear regression model as one of data-driven models have been widely adopted for forecasting flood streamflow(stage). The objectives of this study are to compare performance of different multiple linear regression models according to regression coefficient estimation methods and determine most effective multiple linear regression flood stage forecasting models. To do this, the time scale was determined through the autocorrelation analysis of input data and different flood stage forecasting models developed using regression coefficient estimation methods such as LS(least square), WLS(weighted least square), SPW(stepwise) was applied to flood events in Jungrang stream. To evaluate performance of established models, fours statistical indices were used, namely; Root mean square error(RMSE), Nash Sutcliffe efficiency coefficient (NSEC), mean absolute error (MAE), adjusted coefficient of determination($R^{*2}$). The results show that the flood stage forecasting model using SPW(stepwise) parameter estimation can carry out the river flood stage prediction better in comparison with others, and the flood stage forecasting model using LS(least square) parameter estimation is also found to be slightly better than the flood stage forecasting model using WLS(weighted least square) parameter estimation.

Multivariate Analysis for Clinicians (임상의를 위한 다변량 분석의 실제)

  • Oh, Joo Han;Chung, Seok Won
    • Clinics in Shoulder and Elbow
    • /
    • v.16 no.1
    • /
    • pp.63-72
    • /
    • 2013
  • In medical research, multivariate analysis, especially multiple regression analysis, is used to analyze the influence of multiple variables on the result. Multiple regression analysis should include variables in the model and the problem of multi-collinearity as there are many variables as well as the basic assumption of regression analysis. The multiple regression model is expressed as the coefficient of determination, $R^2$ and the influence of independent variables on result as a regression coefficient, ${\beta}$. Multiple regression analysis can be divided into multiple linear regression analysis, multiple logistic regression analysis, and Cox regression analysis according to the type of dependent variables (continuous variable, categorical variable (binary logit), and state variable, respectively), and the influence of variables on the result is evaluated by regression coefficient${\beta}$, odds ratio, and hazard ratio, respectively. The knowledge of multivariate analysis enables clinicians to analyze the result accurately and to design the further research efficiently.

Prediction of damages induced by Snow using Multiple-linear regression and Artificial Neural Network model (다중선형회귀 및 인공신경망 모형을 이용한 대설피해에 따른 피해액 예측에 관한 연구)

  • Kwon, Soon Ho;Lee, Eui Hoon;Chung, Gunhui;Kim, Joong Hoon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.20-20
    • /
    • 2017
  • 최근 기후변화 영향에 따라 전 세계적으로 인명피해 및 재산피해를 유발하는 자연재난이 지속적으로 증가하고 있으며, 그로 인한 자연재해의 규모가 점점 더 커지고 있다. 실제로 우리나라에서도 지난 1994 년에서 2013 년까지 지난 20 년간 자연재해에 의한 피해액은 12조 3천억 원으로 집계되었으며, 이 중 강우와 태풍에 의한 피해가 85 % 이고, 대설에 의한 피해는 약 13 % 로 자연재해 중 대부분의 피해는 강우 및 태풍에서 발생하지만, 폭설에 의한 피해도 적지 않은 것으로 나타났다. 이에 따라, 정확한 예측을 위해 신뢰도 높은 자료 구축을 통한 대설피해 예측에 관한 연구가 필요한 시점이다. 본 연구에서는 대설피해액 예측을 위해 우리나라의 63개 기상 관측소에서 관측한 적설심 자료 및 기상관측 자료와 사회 경제 자료 총 11개를 대설피해 예측을 위한 입력변수로 선정하고, 이를 기상관측소가 속한 도시의 면적에 따라 3개의 지역으로 구분하였다. 주성분분석을 활용하여 선정된 입력변수들을 4개의 주성분으로 구분하고, 인공신경망 및 다중선형 회귀 모형을 구성하여 각 지역별 대설피해 예측의 오차를 분석하였다. 적용결과, 인공신경망 모형을 이용한 대설피해 예측의 수정결정계수는 22.8 %~48.2 %를 나타냈고, 다중선형회귀 모형의 수정결정 계수는 9.2 %~39.7% 로 나타났다. 그러므로 인공신경망 모형이 다중회귀 모형보다 선택된 입력자료를 활용하여 대설피해를 예측하는 목적으로 조금 더 우수한 결과를 나타내었다. 향후 자료를 보완 및 모형의 고도화를 통해 보다 정확한 대설피해 예측 함수 개발이 가능할 것으로 기대된다.

  • PDF

A Study on Estimation of Soil Moisture Multiple Quantile Regression Model Using Conditional Merging and MODIS Land Surface Temperature Data (조건부 합성기법과 MODIS LST를 활용한 토양수분 다중분위회귀모형 산정 연구)

  • Jung, Chung Gil;Lee, Ji Wan;Kim, Da Rae;Kim, Se Hun;Kim, Seong Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.23-23
    • /
    • 2018
  • 본 연구에서는 다중분위회귀분석모형(Multiple Quantile Regression Model, MQRM)과 MODIS(MODerate resolution Imaging Spectroradiometer) LST (Land Surface Temperature) 자료를 이용하여 전국 공간토양수분을 산정하였다. 공간토양수분을 산정하기 위한 과정은 크게 두가지로 구분된다. 첫 번째로 기존의 MODIS LST 자료를 조건부 합성 보정기법을 적용하여 실측 LST 자료와 비교하여 위성 LST 자료가 갖고 있는 오차를 보정하였다. 그 결과, 조건부 합성 보정기법을 적용하기전 전국 71개 지상관측지점에서 관측한 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.70으로 어는정도 유의성 있는 상관관계를 나타냈으나 조건부 합성 보정기법을 적용한 후 실측 LST와 MODIS LST의 $R^2$는 전체 평균 0.92로 상당히 크게 향상됨을 알 수 있었다. 두 번째로 보정된 MODIS LST를 이용하여 다중분위회귀분석 모형을 개발하고 토양수분을 예측하는 단계로 입력자료로 위성영상 자료와 관측자료를 융합하여 사용하였다. 위성영상 자료로는 보정된 MODIS LST와 MODIS NDV를 구축하였고 일단위 강수량 및 일조시간의 기상자료는 기상청으로부터 전국 71개 지점에 대해 구축하여 IDW 공간보간기법을 이용한 공간자료로 구축하였다. 토양수분 결과를 비교하기 위한 관측 토양수분은 자동농업기상관측(Automated Agriculture Observing System, AAOS)지점에서 2013년 1월부터 2015년 12월까지의 실측 일단위 토양수분 자료를 구축하여 사용하였다. 다중분위회귀분석 모형은 LST 인자를 중심으로 각각의 분위(0.05, 0.25, 0.5, 0.75, 0.95)에 해당되는 값의 회귀식을 NDVI, 강수 입력자료를 독립인자로서 조합하여 계절 및 토성에 따른 총 80개의 회귀식을 산정하였다. 관측 토양수분과 모의 토양수분을 비교한 결과 $R^2$가 0.70 (철원), 0.90 (춘천), 0.85 (수원), 0.65 (서산), 0.78 (청주), 0.82 (전주), 0.62 (순천), 0.63 (진주), 0.78 (보성)로 높은 상관성을 보였다. 본 연구에서는 다중분위회귀 모형의 성능을 검증하기 위해 기존의 다중선형회귀모형의 결과와 비교하여 크게 개선됨을 나타냈다.

  • PDF