• Title/Summary/Keyword: 회귀분석식

Search Result 1,999, Processing Time 0.033 seconds

Comparison of Regression Coefficient Significance Test for Temporal Distribution by Multiple Regression Analysis Method (다중회귀분석 방법에 따른 시간분포 회귀식의 회귀계수 유의성 검정 비교)

  • Lee, Sung Ho;Lee, Jae Joon;Park, Jin Hee
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2019.05a
    • /
    • pp.205-205
    • /
    • 2019
  • 우리나라에서 강우의 시간분포를 위해 보편적으로 사용되고 있는 방법은 Huff 4분위법으로 강우의 시간적 분포특성을 나타내는 무차원 시간분포곡선을 제시한 것으로, 강우의 지속기간을 4분위로 구분하여 각 분위의 강우량 중 가장 큰 값이 속해 있는 구간을 선택하여 그 구간의 위치에 따라 분위를 정하는 방법이다. 현재 실무에서는 Huff의 분위별 곡선에 대한 회귀식은 지속기간 전반에 걸쳐 정확도가 높은 이유로 6차식을 적용하고 있으나, 통계 모델링에서 간결함의 원리에 따라 회귀식이 간결할 필요가 있으며, 통계적 유의수준에 기초하여 회귀계수를 결정하여야 하므로 유의성 검정 방법을 통한 검정결과를 비교할 필요가 있다. 따라서 본 연구에서는 다중회귀분석 방법에 따른 회귀계수 유의성 검정결과 비교를 위하여 구미지역의 무차원 누가우량 백분율을 이용한 시간분포 회귀식을 이용하여 유의성 검정 방법인 분산분석 방법(Analysis of Variance)과 변수선택 방법(Backward Selection)의 검정 결과를 도출 및 비교하였다. 통계프로그램인 프로그래밍 R을 이용하여 변수선택 방법 중 후방제거법 함수를 이용하여 최종 회귀식을 도출하고 또한 7차 회귀식을 분산분석을 이용한 후방제거법으로 회귀계수를 제거하는 방법으로 최종 회귀식을 산정하였다. 분산분석을 이용한 후방제거법의 유의성 검정결과는 프로그래밍 R을 이용한 후방제거법의 결과와 동일한 것으로 분석되었다. 일반적으로 설계강우량의 시간분포를 위한 방법으로 사용되고 있는 Huff의 4분위 방법의 시간분포 회귀식은 회귀계수의 유의성 검정이 이루어지고 있지 않으므로 본 연구결과를 통해 설계강우량 시간분포 회귀식의 유의성 검정방법 제시 및 결과도출과정을 통해 시간분포 회귀식 산정기법으로 활용할 수 있을 것으로 사료된다.

  • PDF

Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient (다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가)

  • Lee, Sun Mi;Park, Inhwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

A Suggestion of Two-Way Variable Algorism for Least-Squares Regression Analysis (상호변수 최소자승 회귀분석 방법의 제안)

  • Lee, Chang-Hae
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2005.05b
    • /
    • pp.189-193
    • /
    • 2005
  • 기존의 회귀식을 사용하거나 새로 유도하여 사용하는 경우 모두 일반적으로 회귀분석의 특성을 간과하고 사용하는 경우가 종종 발생한다. 일반적으로 자료들에서 구해진 회귀식은 분명히 독립변수와 종속변수가 구분되어 유도되었음에도 불구하고 이 식을 사용함에 있어서는 간혹 그 구분을 무시하고 역으로 적용하는 경향이 있었다. 그러나, 독립$\cdot$종속변수가 서로 바뀌면, 연직거리의 잔차들로부터 유도되는 기존의 회귀분석에 의하여, 회귀식이 서로 달라지기 때문에 역으로 적용하여서는 안된다. 이를 해결하기 본 연구에서는 상호변수 최소자승 회귀분석법을 제안하였다. 이론적 내용을 검토를 위해 임진강 영평천의 영중수위표 지점의 2001-2003년의 유량측정자료와 수위-유량곡선을 비교 분석하였다. 결론적으로 상호변수 회귀분석을 사용하면, 기존의 잘못 사용해온 관행을 해소할 수 있을 것이다.

  • PDF

A Study on the Estimation Method of Hemoglobin Based on Linear and Multiple Regression Analysis Using Health Examination Big Data (건강검진 빅데이터를 이용한 선형 및 다중회귀분석 기반 헤모글로빈 추정 방법에 관한 연구)

  • Hong, Sang-Hoon;Hong, Kwang-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.05a
    • /
    • pp.553-555
    • /
    • 2021
  • 빈혈의 유병률은 매년 증가하고 있으나 이를 가벼운 질병으로 인식해 치료 시기를 놓치는 환자들이 존재한다. 빈혈의 발생원인으로 혈액 내 헤모글로빈 및 헤모글로빈 내 철 부족이 있으며, 헤모글로빈 측정기술의 경우 채혈 이외에 사람의 신체 및 건강 정보를 적용한 사례는 찾아보기 어렵다. 본 논문에서는 신체(키, 몸무게 및 허리둘레) 및 건강 정보(혈청지오티, 이완기 혈압 및 감마지티피 등)가 포함된 건강검진 빅데이터를 이용하여 단일 특징에 대해 선형회귀분석을 수행하고, 다중 특징에 대해 다중회귀분석을 수행하여 회귀분석 식을 산출, 산출된 회귀분석 식을 통해 헤모글로빈을 추정하여 실제 헤모글로빈값과 오차율을 계산하고 비교한다. 실험 결과, 선형회귀분석 식을 통해 헤모글로빈을 추정하였을 때 평균 8.124%의 오차율이 계산되었으며, 다중회귀분석의 경우 선형회귀분석보다 낮은 6.767%의 오차율이 계산되었다.

Effects of the Role Conflict, Ambiguity, and Job Satisfaction of the Health Professionals to Their Customer Orientation (의료종사자의 역할갈등, 모호성, 직무만족이 고객지향성에 미치는 영향)

  • Kim, Chang Tae;Kang, Su Man;Park, Cheol Woo
    • Journal of the Korean Society of Radiology
    • /
    • v.9 no.1
    • /
    • pp.23-30
    • /
    • 2015
  • Recently in the health service the globalization and opening their market to foreigners are realized in Korea. So, it becomes necessary for the health service institutes to execute their management to focus on service quality to satisfy their customers. We examined the customer orientation of the individual health professional rather than the market orientation concept based on the health institute. For the market orientation of the health institute should require the individual health professional worked there. The hypotheses for the effect of the role conflict, ambiguity, and job satisfaction of the health professionals to their customer orientation were established based on the literature review and previous researches and tested to the 250 health professionals such as health technician, nurse, radiologist, and management clerk in D hospital located in Busan, in summer 2008. First, the hypothesis 'The role conflict between the individual health professionals might effect to the customer orientation' was rejected. Second, the hypothesis 'The role ambiguity of the individual health professional might effect to the customer orientation' was accepted. Third, the hypothesis 'The satisfaction of the individual health professional might effect to the customer orientation' was rejected. and the multiple regression analysis was taken with the dependent variables as each construct of customer orientation-responsiveness, empathy, tangibility, and reliability, and independent variables as role conflict, role ambiguity, and job satisfaction. With these analysis, we found also the role ambiguity effected to the customer orientation.

An Application of a New Two-Way Regression Model for Rating Curves (수위-유량관계식에 새로운 양방향 회귀모형의 적용)

  • Lee, Chang-Hae
    • Journal of Korea Water Resources Association
    • /
    • v.41 no.1
    • /
    • pp.17-25
    • /
    • 2008
  • Whether rating curves are used in practice or new ones are derived, the characteristics of regression analysis are often neglected. For example, a discharge rating curve, which is established from a regression of observed water levels (H) on observed flowrates(Q), is sometimes used for estimating a design water level corresponding to a simulated design flood runoff. However, if independent and dependent variables are changed with each other, the regression equation is changed in existing regression analysis, which is derived from vertical errors between observed data and regression line. Thus, regression equations should not be applied inversely. To avoid this problem, A new two-way variable least-squares regression analysis is proposed. The new method was applied to the rating curves of five water level stations on main stream of Nakdong River. The three kinds of regression models, which are respectively regression of Q versus H (model 1), H versus Q (model 2) and two-way (model 3), showed that the new method can reduce inadvertent mistakes when applied in practice.

A Study on Estimation of Lowflow Ungauged Basin Using Multiple Regression Analysis (다중회귀분석을 이용한 미계측 유역의 갈수유량 산정에 관한 연구)

  • Lim, Ga Kyun;Jeung, Se Jin;Kim, Byung Sik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2020.06a
    • /
    • pp.133-133
    • /
    • 2020
  • 갈수량이란 1년 중 355일은 유지되는 유량을 말하며 물 공급 계획 및 관리, 저수지 설계, 관개용수의 수량과 수질 관리, 생태계 보존 등에 있어서 갈수량의 크기와 빈도를 파악하는 것은 매우 중요한 과정이다. 갈수량 산정을 위해서는 오랜 기간의 관측 일유량 자료가 필요하지만 우리나라의 경우 관측 유량 자료의 결측자료가 많아 갈수량 산정에 필요한 장기간의 자료가 부족하다. 따라서 본 연구에서는 전국 40개 중권역 유역을 대상으로 갈수 빈도별 갈수량 산정 회귀식 개발을 수행하였다. 갈수량 산정에 적용할 수 있는 18개의 유역인자와 4개의 수문 인자를 상관분석을 통해 다중공선성을 고려하였으며 상관분석 결과를 토대로 미계측 유역에 적용 가능한 인자를 선정하였다. 갈수 빈도 분석과 단계적 회귀분석을 통하여 미계측 유역에 적용할 수 있는 갈수 빈도별 갈수량 산정 회귀식을 개발하였다. 또한 계측 유역을 미계측 유역으로 가정하여 개발된 갈수량 산정 회귀식을 이용하여 갈수량을 산정하고 분석 결과와 실제 갈수량을 비교하여 개발된 회귀식의 적정성을 검토하였다.

  • PDF

Development of Multiple Linear Regression Model to Predict Agricultural Reservoir Storage based on Naive Bayes Classification and Weather Forecast Data (나이브 베이즈 분류와 기상예보자료 기반의 농업용 저수지 저수율 전망을 위한 저수율 예측 다중선형 회귀모형 개발)

  • Kim, Jin Uk;Jung, Chung Gil;Lee, Ji Wan;Kim, Seong Joon
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2018.05a
    • /
    • pp.112-112
    • /
    • 2018
  • 최근 이상기후로 인한 국부적인 혹은 광역적인 가뭄이 빈번하게 발생하고 있는 추세이며 발생횟수 뿐 아니라 가뭄 심도 및 지속기간이 과거보다 크게 증가하여 그에 따른 피해가 커질 것으로 예측되고 있다. 특히, 2014~2015년도의 유례없는 가뭄으로 인해 저수지 용수공급이 제한되면서 많은 농가들이 피해를 입었다. 본 연구의 목적은 전국 농업용 저수지를 대상으로 기상청 3개월 예보자료를 활용 할 수 있는 농업용 저수지 저수율 다중선형 회귀 모형을 개발하여 저수율 전망정보를 생산하는 것이다. 본 연구에서는 전국에 적용 가능한 저수율 다중선형 회귀 모형개발을 위해 5개의 기상요소(강수량, 최고기온, 최저기온, 평균기온, 평균풍속)와 관측 저수지 저수율을 활용했다. 기상자료는 2002년부터 2017년까지의 기상청 63개 지상관측소로부터 기상관측자료를 수집하였다. 본 연구에서는 저수율 전망 단계를 세 단계로 나누었다. 첫 번째 단계로 농어촌공사에서 전국 511개 용수구역을 대상으로 군집분석 및 의사결정나무 분석을 통해 제시한 65개 대표저수지를 대상으로 기상자료 및 관측 저수율 자료를 이용하여 다중선형 회귀분석을 실시하였다. 수집한 기상요소와 저수율을 독립변수로 하여 월별 회귀식을 산정한 결과 결정계수($R^2$)는 0.51~0.95로 나타났다. 두 번째 단계로 대표저수지의 회귀분석 결과를 전국의 저수지로 확대하기 위해 나이브 베이즈 분류법을 적용하여 전국 3098개의 저수지를 65의 군집으로 분류하고 각각의 군집에 해당되는 월별 회귀식을 산정하였다. 마지막으로 전국 저수지로 산정된 회귀식과 농업 가뭄 예측을 위해 기상청의 GS5(Global Seasonal Forecasting System 5) 3개월 예보자료를 수집하여 회귀식에 적용해 2017년 전국 저수지의 3개월 저수율 전망정보를 생산하였다. 본 연구의 전국 저수지 군집결과 기반의 저수율 전망기술은 2017년도 관측 저수율과 비교한 결과 유의한 상관성을 나타냈으며 이 결과는 추후 농업용 저수지의 물 공급 및 농업가뭄 전망 자료로서 이용이 가능할 것으로 판단된다.

  • PDF

Development of Flood Discharge Estimation System Using Fuzzy Regression Technique in Mountainous River (Fuzzy 회귀분석 기법을 이용한 산지하천 홍수유출 산정 시스템 개발)

  • Lee, Tae-Geun;Choi, Chang-Won;Yi, Jae-Eung
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2012.05a
    • /
    • pp.382-386
    • /
    • 2012
  • 최근 산지하천 유역에서 발생하는 홍수와 이를 동반한 토석류에 의해 많은 인적, 물적 피해가 빈번히 발생하고 있다. 이러한 피해를 최소화하기 위해서는 유역의 정확한 홍수유출량 해석이 동반되어야 하지만 산치하천 유역은 유출특성 분석에 기본이 되는 수위관측소의 수가 적고, 관측소가 존재하더라도 결측치가 많거나 자료보유 연한이 짧아 자료의 활용성이 떨어진다. 따라서 선행 연구에서는 미비한 자료만으로도 회귀분석이 가능하며 높은 신뢰도를 갖는 Fuzzy 회귀분석 기법을 도입하여 수위자료 없이도 산지하천 유역의 유역면적과 하도경사를 바탕으로 홍수유출량을 평가할 수 있는 기술을 개발하였다. 본 연구에서는 여기에 빈도별 강우량을 새롭게 추가하여 홍수량 산정식을 개선 및 보완하였다. 새롭게 도출된 홍수량 산정식의 정확도는 기존 대상유역 내 특정지점 설계홍수량을 기준으로 기존 개발된 홍수량 산정식과 비교하여 검토하였고 비교적 높은 정확도를 나타냈다. 이를 바탕으로 일반 사용자도 손쉽게 홍수량을 산정할 수 있도록 MATLAB을 이용하여 홍수량 산정 프로그램을 개발하였다.

  • PDF

Applying regional regression analysis of the hydrologic model parameters for assessing climate change impacts in the ungaged watershed (미계측 유역의 기후변화 영향평가를 위한 수문모형 매개변수의 지역회귀분석 적용)

  • Kim, Youngil;Seo, Seung Beom;Kim, Sung Jin;Kim, Young-Oh
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2017.05a
    • /
    • pp.219-219
    • /
    • 2017
  • 상대적으로 유역의 관측 자료가 충분하지 못하거나 검증되지 않았을 경우 미계측 유역으로 정의되며 수문모형의 매개변수 검정을 할 수 없으므로 다른 방법을 고안해야 한다. 이를 위해 기존 연구에서는 지역적 특성을 고려한 지역회기분석을 통해 미계측 유역의 유량을 산정하였는데, 대부분 유역의 특성과 연 평균 유출량 자료의 관계를 이용한 회귀식으로 실시간 유량의 변화를 고려하기 어려웠다. 본 연구에서는 개념적 강우-유출모형으로 많이 사용되고 있는 개념적 수문모형인 GR4J의 매개변수에 대해 미계측 유역의 특성을 고려한 변수들을 이용하여 회귀식을 구하고 그 적용성을 평가하였다. 이를 통해 미계측 유역의 유량 시계열 자료를 생성할 수 있었다. 또한 IPCC에서 발간한 AR5의 RCP 4.5 시나리오를 적용하여 미래 유출량을 산정하였다. 우선 지역회귀분석을 적용하기 위해 수문모형을 이용한 계측 유역의 유출량을 구하였으며 22개의 전국 댐 상류 지점을 기준으로 SCE 알고리즘을 이용하여 GR4J의 최적 매개변수를 구하고 각 유역별로 물리적, 지형적, 기상학적 특성을 고려하여 11개의 변수를 선택하였다. 각 변수간 다중공선성(Multicollinearity)를 고려하기 위해 VIF(Variation Inflation Factor) test를 적용하여 최종 7개의 변수를 선정하고 단계별 회귀방법(Stepwise regression)을 이용하여 GR4J의 매개변수별 회귀식을 생성하였다.

  • PDF