• Title/Summary/Keyword: 비선형회귀식

Search Result 215, Processing Time 0.034 seconds

Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient (다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가)

  • Lee, Sun Mi;Park, Inhwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

  • PDF

Introduction of a Nonlinear Regression Analysis System NLIN2000 (비선형회귀분석을 위한 통계소프트웨어 NLIN2000)

  • 강근석;심규호
    • The Korean Journal of Applied Statistics
    • /
    • v.17 no.1
    • /
    • pp.173-184
    • /
    • 2004
  • A statistical software for nonlinear regression analysis, NLIN2000, is introduced. This software, operated tinder the Window systems, has many user-friendly functions and Provides various statistics. As an upgraded version of the Previous Program operated under the DOS system, NLIN2000 provides easier steps for model specification and fitting process than any other statistical packages. Also it has a database system for model functions which has addition and deletion options. While it can be a useful research tool for statisticians, NLIN2000 can be used practically also by researchers in many other scientific fields, who needs nonlinear regression analysis for their study.

Calculation Of Critical Stress On Jointed Concrete Pavement By Using Neural Networks & Linear Regression Models (뉴럴 네트워크 및 선형 회귀식을 이용한 줄눈 콘크리트 포장의 한계 응력 계산)

  • Kang, Tae-Wook;Ryu, Sung-Woo;Kim, Seong-Min;Cho, Yoon-Ho
    • International Journal of Highway Engineering
    • /
    • v.10 no.3
    • /
    • pp.129-138
    • /
    • 2008
  • The finite element method(FEM) was one of tools used to solve problem of previous Concrete Pavement and was applied to Korea Pavement Research Program Study. This study used the ABAQUS and the fortran analysis program to calculate the critical stress on jointed concrete pavement and compared and analyzed the results by using neural networks and linear regression model. In that case, which are not enough analysises by using FEM programs though many input variables, when the results of FEM with NN and linear regression models are compared, there are some differences. The other cases, which are reduced input variables and a lot of analysises each of them, results of Neural Networks(NN) and linear regression models are simulated to them of FEM. But, the result of NN is more exact than them of linear regression at the (0,0), (1,1). On the results of this study, it is suggested that the calculation of stress using NN is more compatible to Korea Pavement Research Program Study.

  • PDF

Investigating Uncertainty in Flow Measurement and Developing Rating Curves (유량측정시 불확실성의 검토와 수위-유량곡선식의 개발)

  • Lee, Kil Seong;Lee, Kyung Ho
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2004.05b
    • /
    • pp.1242-1246
    • /
    • 2004
  • 본 연구에서는 유속계와 봉부자를 동한 측정값의 불확실성를 검토한 후, 한강의 7개 지류의 실측 자료들의 불확실성을 ISO 규정을 통하여 추정하였다. Simulated Annealing 기법과 황금비 분할법을 이용한 비선형회귀식을 적용하여 기존의 수위-유량 곡선식자 비교해보았다. 불확실성 추정결과 유량 측정치들의 불확실성이 ISO 규정의 기준에 비해 높게 추정되었으며, 특히 무작위 오차와 계통 오차 중에 무작위 오차의 불착실성이 높게 나타났다. 또한, 기존 수위-유량곡선식과 Simulated Annealing 기법과 황금비 분할법을 이용한 방법을 비교해본 결과 황금비 분할법이 가장 좋은 결과를 얻었다. 이때 수위-유량곡선식의 영수위값을 황금비 분할법을 이용해 구한 후 비교해 본 결과는 기존의 선형회귀방법과 비선형방법에서 큰 차이를 보이지 않았다. 또한 곡선 분리시에는 하나의 수위-유량곡선일때보다 오차가 줄어드는 경향을 보였다.

  • PDF

Shrinkage Structure of Ridge Partial Least Squares Regression

  • Kim, Jong-Duk
    • Journal of the Korean Data and Information Science Society
    • /
    • v.18 no.2
    • /
    • pp.327-344
    • /
    • 2007
  • Ridge partial least squares regression (RPLS) is a regression method which can be obtained by combining ridge regression and partial least squares regression and is intended to provide better predictive ability and less sensitive to overfitting. In this paper, explicit expressions for the shrinkage factor of RPLS are developed. The structure of the shrinkage factor is explored and compared with those of other biased regression methods, such as ridge regression, principal component regression, ridge principal component regression, and partial least squares regression using a near infrared data set.

  • PDF

Relationship Between Physical Properties and Compression Index for Marine Clay (해성점토의 물리적 특성과 압축지수의 상관성)

  • 김동후;김기웅;백영식
    • Journal of the Korean Geotechnical Society
    • /
    • v.19 no.6
    • /
    • pp.371-378
    • /
    • 2003
  • The compression index of clay distributed in the west and south coast of the Korean Peninsula had been studied. Compression index was obtained from the conventional consolidation test, and was conducted accordingly to obtain the field virgin compression curve by means of Schmertmann's graphical correction. To examine a correlation closely between physical properties of soils($e_o$, LL, w) and compression index(Cc), linen. and non-linear regression analysis were employed based on the data collected from tests. The conclusions are as follows. The compression index obtained by means of Schmereann's graphical correction is about 1.16 times for the value of original oedometer test curve for U/D samples. Non-liner regression curve was preferable to establish a correlation equation rather than linear regression curve. All derived equations so far achieved have been summarized and given. However, linear equation is better for practical use so that part by part simplified linear equations were also suggested alternatively together with their own non-linear regression curve.

Development of Rainfall-Flood Damage Estimation Function using Nonlinear Regression Equation (비선형 회귀식을 이용한 강우-홍수피해액 추정 함수 개발)

  • Eo, Gyu;Kim, Kyung-Tae;Kim, Yon-Soo;Lee, Jongso;Kim, Hung-Soo
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2015.11a
    • /
    • pp.259-260
    • /
    • 2015
  • 재해가 발생하기 전에 피해규모와 이에 따른 영향 및 피해액을 신속하게 추정하는 것은 효율적인 재난 관리를 하는데 있어 중요하고, 더불어 정책결정자들이 의사결정을 할 때 도움이 될 수 있다. 하지만 기존의 연구는 단순 재해 피해발생 후에 그 피해액 혹은 복구액을 산정하는 수준이며, 현재 피해액 추정에 대한 연구는 전무 하며 그 기술개발에 또한 초기단계에 있다. 이에 피해액 추정에 대한 연구가 시급한 실정이다. 실질적으로 자연재해 정보에 대한 수요가 급증하고 있는 반면에 체계적이고 일관된 통계기반의 정보체계는 미흡하다. 이에 국가에서도 재해에 대한 피해액 및 복구비 산정 등 예산편성에 있어 큰 어려움을 겪고 있다. 기존통계 방식에 대한 개선의 필요성 인식과 더불어 본 연구의 목적은 재해 발생 전에 그 피해규모와 영향을 고려하여 이에 따른 피해액을 신속하게 추정하기 위함에 있다. 본 연구에서는 비선형 회귀식을 이용하여 강우-홍수피해액에 대한 함수를 제시하고자 한다.

  • PDF

Annual Cycle of PCBs Concentration in the Atmosphere

  • Kang, Byung-Wook;Shin, Eun-Sang;Yeo, Hyun-Gu
    • Journal of environmental and Sanitary engineering
    • /
    • v.22 no.2
    • /
    • pp.61-73
    • /
    • 2007
  • PCBs의 대기 중 농도는 고용량 PUF sampler를 이용하여 2000년부터 2002년까지 주 1회 수도권 인근지역인 경기도 안성에서 측정하였다. 본 논문은 비선형 회귀모델을 이용하여 대기 중 가스상 PCBs의 연간, 월간 사이클을 평가 하고자 한다. Clausius-Clepeyron 식을 이용한 가스상 PCBs의 기울기는 고분자로 갈수록 증가하는 경향이었다. 이는 고분자 PCBs는 저분자 PCBs에 비해 온도 의존성이 크다는 것을 의미한다. 다시 말해, 고분자 PCBs는 다른 지역에서 장거리 이송되어 오는 오염물질의 영향 보다는 지역적인 오염원(예, 토양, 수계 등)에 의해 영향을 크게 받고 있다는 것을 시사한다. Lorentzian 모델을 이용한 총 PCBs의 일별, 월별 회귀식의 결정계수($R^2$)는 각각 0.62(p<0.0001), 0.88(p<0.0001)로 나타나 유의한 결과를 보였다. 또한, 비선형 회귀식 모델을 활용하여 구한 가스상 PCBs의 일별, 월별 싸이클을 모사한 방정식도 매우 유의한 결과(p<0.0001)를 나타내었다.

National Nonstationary Frequence Analysis Using for Gumbel Distribution (Gumbel 분포를 이용한 전국의 비정상성 빈도 해석)

  • Kim, Gwang-Seob;Lee, Gi-Chun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.379-379
    • /
    • 2011
  • 본 연구는 우리나라 전국 기상관측소 중 1973년부터 2009년까지의 시 강수자료가 구축되어 있는 기상관측소 55개 지점에 대하여 비정상성 빈도해석을 수행하였다. 각 지점에 대하여 지속시간 1시간, 24시간에 대한 연 최대 강수량 자료를 구축하여 초기 20년을 기준으로 1년씩 추가한 연 최대 강수량 누적 자료를 생성하고, 생성된 기간별 자료의 평균, 위치매개변수, 축척매개변수를 산정하였으며, 위치매개변수와 축척매개변수는 확률가중모멘트법을 사용하여 산정하였다. 산정된 연 최대 평균 누적 강수량과 연도와의 선형 회귀식을 산정하여 목표연도별(2040, 2070, 2100년) 평균 강수량을 산정하였고, 위치매개변수와 축척매개변수도 평균 누적 강수량과의 선형 회귀식을 산정함으로써, 목표연도에 해당하는 각 매개변수를 산정하였다. 또한 산정된 목표연도별 평균 강수량, 위치매개변수와 축척매개변수를 이용해 확률강수량을 산정하였다. 비정상성 빈도해석을 수행하여 산정된 55개 지점에 대한 목표연도별 확률강수량을 Inverse Distance Weighted(IDW) 보간법을 사용하여 전국의 확률강수량을 공간적으로 표현하였다. 전국단위의 비정상성 빈도해석을 실시한 결과, 전체적으로 각 목표연도별 확률강수량이 증가하는 것으로 나타났으나, 일부 감소하는 지역도 나타났다. 경기도와 강원도 등 중부지역에서 확률강수량의 증가가 큰 것으로 나타났으며, 특히 강원도(강릉, 인재 등) 지역에서 확률강수량의 증가폭이 가장 크게 나타났다. 또한 남해지역에서는 대부분 확률강수량이 감소하는 것으로 나타났고, 그중에서 전라남도 남해안 부근(장흥 등)에 확률강수량의 감소가 가장 크게 나타났으며, 경북지역과 전북지역 부근에서는 증가 또는 감소의 차이가 미비하게 나타났다. 하지만 목표연도 2070년과 2100년에 대하여 산정된 확률강수량으로부터 선형 회귀식을 통해 목표연도별 평균 강수량, 위치매개변수, 축척매개변수를 추정하여 확률강수량을 산정하는 것에 한계가 있음을 보여주었다.

  • PDF

Locally Weighted Polynomial Forecasting Model (지역가중다항식을 이용한 예측모형)

  • Mun, Yeong-Il
    • Journal of Korea Water Resources Association
    • /
    • v.33 no.1
    • /
    • pp.31-38
    • /
    • 2000
  • Relationships between hydrologic variables are often nonlinear. Usually the functional form of such a relationship is not known a priori. A multivariate, nonparametric regression methodology is provided here for approximating the underlying regression function using locally weighted polynomials. Locally weighted polynomials consider the approximation of the target function through a Taylor series expansion of the function in the neighborhood of the point of estimate. The utility of this nonparametric regression approach is demonstrated through an application to nonparametric short term forecasts of the biweekly Great Salt Lake volume.volume.

  • PDF