Performance Evaluation of Multilinear Regression Empirical Formula and Machine Learning Model for Prediction of Two-dimensional Transverse Dispersion Coefficient (다중선형회귀경험식과 머신러닝모델의 2차원 횡 분산계수 예측성능 평가)

  • Lee, Sun Mi;Park, Inhwan
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.172-172
    • /
    • 2022
  • 분산계수는 하천에서 오염물질의 혼합능을 파악할 수 있는 대표적인 인자이다. 특히 하수처리장 방류수 혼합예측과 같이 횡 방향 혼합에 대한 예측이 중요한 경우, 하천의 지형적, 수리학적 특성을 고려한 2차원 횡 분산계수의 결정이 필요하다. 2차원 횡 분산계수의 결정을 위해 기존 연구에서는 추적자실험결과로부터 경험식을 만들어 횡 분산계수 산정에 사용해왔다. 회귀분석을 통한 경험식 산정을 위해서는 충분한 데이터가 필요하지만, 2차원 추적자 실험 건수가 충분치 않아 신뢰성 높은 경험식 산정이 어려운 상황이다. 따라서 본 연구에서는 SMOTE기법을 이용하여 횡분산계수 실험데이터를 증폭시켜 이로부터 횡 분산계수 경험식을 산정하고자 한다. 또한 다중선형회귀분석을 통해 도출된 경험식의 한계를 보완하기 위해 다양한 머신러닝 기법을 적용하고, 횡 분산계수 산정에 적합한 머신러닝 기법을 제안하고자 한다. 기존 추적자실험 데이터로부터 하폭 대 수심비, 유속 대 마찰유속비, 횡 분산계수 데이터 셋을 수집하였으며, SMOTE 알고리즘의 적용을 통해 회귀분석과 머신러닝 기법 적용에 필요한 데이터그룹을 생성했다. 새롭게 생성된 데이터 셋을 포함하여 다중선형회귀분석을 통해 횡 분산계수 경험식을 결정하였으며, 새로 제안한 경험식과 기존 경험식에 대한 정확도를 비교했다. 또한 다중선형회귀분석을 통해 결정된 경험식은 횡 분산계수 예측범위에 한계를 보였기 때문에 머신러닝기법을 적용하여 다중선형회귀분석에 대한 예측성능을 평가했다. 이를 위해 머신러닝 기법으로서 서포트 벡터 머신 회귀(SVR), K근접이웃 회귀(KNN-R), 랜덤 포레스트 회귀(RFR)를 활용했다. 세 가지 머신러닝 기법을 통해 도출된 횡 분산계수와 경험식으로부터 결정된 횡 분산계수를 비교하여 예측 성능을 비교했다. 이를 통해 제한된 실험데이터 셋으로부터 2차원 횡 분산계수 산정을 위한 데이터 전처리 기법 및 횡 분산계수 산정에 적합한 머신러닝 절차와 최적 학습기법을 도출했다.

Annual Cycle of PCBs Concentration in the Atmosphere

  • Kang, Byung-Wook;Shin, Eun-Sang;Yeo, Hyun-Gu
    • Journal of environmental and Sanitary engineering
    • /
    • v.22 no.2
    • /
    • pp.61-73
    • /
    • 2007
  • PCBs의 대기 중 농도는 고용량 PUF sampler를 이용하여 2000년부터 2002년까지 주 1회 수도권 인근지역인 경기도 안성에서 측정하였다. 본 논문은 비선형 회귀모델을 이용하여 대기 중 가스상 PCBs의 연간, 월간 사이클을 평가 하고자 한다. Clausius-Clepeyron 식을 이용한 가스상 PCBs의 기울기는 고분자로 갈수록 증가하는 경향이었다. 이는 고분자 PCBs는 저분자 PCBs에 비해 온도 의존성이 크다는 것을 의미한다. 다시 말해, 고분자 PCBs는 다른 지역에서 장거리 이송되어 오는 오염물질의 영향 보다는 지역적인 오염원(예, 토양, 수계 등)에 의해 영향을 크게 받고 있다는 것을 시사한다. Lorentzian 모델을 이용한 총 PCBs의 일별, 월별 회귀식의 결정계수($R^2$)는 각각 0.62(p<0.0001), 0.88(p<0.0001)로 나타나 유의한 결과를 보였다. 또한, 비선형 회귀식 모델을 활용하여 구한 가스상 PCBs의 일별, 월별 싸이클을 모사한 방정식도 매우 유의한 결과(p<0.0001)를 나타내었다.

Mixed Approach for Fast System-Level Power Analysis based on Regression Analysis (시스템 수준의 전력 예측을 위한 회귀분석에 기반하는 분석 방법)

  • 김희석;임채석;하순회
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.694-696
    • /
    • 2002
  • 이 논문에서는 시스템 수준의 전력 소모를 분석하는 방법론을 설명한다. 응용의 시스템 수준 전력 모델을 구하기 위해서, 시스템을 이루는 각 부분들을 선형적으로 모델링하고, 이를 모두 더한다. 선형적으로 모델링된 식의 파라메터들을 구하기 위해서, 회귀분석에 기반한 분석을 한다. 이를 위해서 다양한 벤치마크들을 준비하고, 응용에 대해서 측정을 한 것과 수정된 시뮬레이터에서 필요한 정보를 얻어야 한다. 이렇게 분석한 전력 모델의 예측치는 5% 내의 정확도를 가짐을 확인하였다.

Determination of the Strength and Stiffness Degradation Factor for Circular R/C Bridge Piers (원형 철근콘크리트 교각의 강성 및 강도감소지수 결정)

  • 이대형;정영수
    • Journal of the Earthquake Engineering Society of Korea
    • /
    • v.4 no.2
    • /
    • pp.73-82
    • /
    • 2000
  • 본연구의 목적은 반복하중을 받는 철근콘크리트 교량 교각의 비선형 이력거동을 해석적으로 예측하는 것이다 이를 위해서 반복적인 횡하중이 작용하는 경우에 실험결과와 일치하는 교각의 하중-변위 이력곡선을 도출하고자 수정된 trilinar 이력거동모델을 이용하였다 철근과 콘크리트의 비선형 거동특성과 각 하중단계에 따른 교각의 중립축을 구하여 소성힌지부의 모멘트와 변형률을 구하고 반복하중하에서의 강성의 변화를 해석적으로 모형화하기 위하여 각기 다른 강성을 갖는 5가지 지선을 갖춘 형태의 이력거동모델식을 제안하였다 본 연구에서는 실험적으로 구한 하중-변위 이력곡선을 이용하여 축하중비 주철근비 및 구속철근비에 따른 강도감소지수와 강성감소지수의 영향을 회귀분석을 이용하여 일반식으로 제안하였다 새로운 이력거동 해석 모델을 프로그램 SARCF III에 적용함으로써 기존 철근콘크리트 교각에 강도 및 강성감소 현상을 정확하게 예측하였다

Multi-objective Genetic Algorithm for Variable Selection in Linear Regression Model and Application (선형회귀모델의 변수선택을 위한 다중목적 유전 알고리즘과 응용)

  • Kim, Dong-Il;Park, Cheong-Sool;Baek, Jun-Geol;Kim, Sung-Shick
    • Journal of the Korea Society for Simulation
    • /
    • v.18 no.4
    • /
    • pp.137-148
    • /
    • 2009
  • The purpose of this study is to implement variable selection algorithm which helps construct a reliable linear regression model. If we use all candidate variables to construct a linear regression model, the significance of the model will be decreased and it will cause 'Curse of Dimensionality'. And if the number of data is less than the number of variables (dimension), we cannot construct the regression model. Due to these problems, we consider the variable selection problem as a combinatorial optimization problem, and apply GA (Genetic Algorithm) to the problem. Typical measures of estimating statistical significance are $R^2$, F-value of regression model, t-value of regression coefficients, and standard error of estimates. We design GA to solve multi-objective functions, because statistical significance of model is not to be estimated by a single measure. We perform experiments using simulation data, designed to consider various kinds of situations. As a result, it shows better performance than LARS (Least Angle Regression) which is an algorithm to solve variable selection problems. We modify algorithm to solve portfolio selection problem which construct portfolio by selecting stocks. We conclude that the algorithm is able to solve real problems.

Proposal of allowable prediction error range for judging the adequacy of groundwater level simulation results of artificial intelligence models (인공지능 모델의 지하수위 모의결과 적절성 판단을 위한 허용가능 예측오차 범위 제안)

  • Shin, Mun-Ju;Ryu, Ho-Yoon;Kang, Su-Yeon;Lee, Jeong-Han;Kang, Kyung Goo
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2022.05a
    • /
    • pp.449-449
    • /
    • 2022
  • 제주도는 용수의 대부분을 지하수에 의존하므로 지하수위의 예측 및 관리는 매우 중요한 사항이다. 제주도의 지층은 화산활동에 의한 현무암이 겹겹이 쌓여있는 형태를 나타내며 육지의 지층구조와 매우 다른 복잡한 형태를 나타낸다. 이에 따라 제주도 지하수위의 예측은 매우 난해하며, 최근에는 딥러닝 인공지능 모델을 활용하여 지하수위를 예측하는 연구사례가 증가하고 있다. 기존의 연구들은 인공지능 모델들이 지하수위를 적절히 예측한다고 보고하고 있으나 예측의 적절성에 대한 판단기준을 제시하지 못하였으므로 이에 대한 명확한 제시가 필요하다. 본 연구의 목표는 인공지능을 활용한 지하수위 예측오차가 허용 가능한지 판단할 수 있는 기준을 제시함에 있다. 이를 위해 전 세계의 과거 20년 동안 관련 연구결과들을 수집 및 분석하였으며, 분석 결과 인공지능 모델의 지하수위 예측오차는 지하수위 변동성이 큰 지역일수록 증가하는 것을 확인하였다. 이것은 지하수위의 변동형태가 크고 복잡할수록 인공지능 모델의 지하수위 예측성능은 낮아진다는 것을 의미한다. 이 관계를 명확하게 나타내기 위해 지하수위 최대변동폭과 평균제곱근오차 및 최대오차와의 관계를 선형회귀식으로 도출하여 허용가능한 예측오차 기준을 제시하였다. 그리고 기존 연구들에서 제시한 Nash-Sutcliffe 효율성지수와 결정계수를 분석하여 선형회귀식에 의한 기준을 보완할 수 있는 추가적인 기준을 제시하였다. 본 연구에서 제시한 인공지능 모델에 의한 지하수위 예측결과의 적절성 판단기준은 향후 지속적으로 증가하는 인공지능 예측연구에 유용하게 사용될 수 있다.

Improvement of Search Method of Genetic Programing for Wind Prediction MOS (풍속 예측 보정을 위한 Genetic Programing 탐색 기법의 개선)

  • Oh, Seungchul;Seo, Kisung
    • Proceedings of the KIEE Conference
    • /
    • 2015.07a
    • /
    • pp.1349-1350
    • /
    • 2015
  • 풍속은 다른 기상요소들보다 순간 변동이 심하고 국지성이 강하여 수치 예보 모델만으로 예측의 정확성을 높이기가 어렵다. 기상청의 단기 풍속 예보는 전 지구적 통합 예보모델인 UM(Unified Model)의 예측값에 MOS(Model Output Statictics)를 통한 보정을 수행하며, 보정식의 생성에 다중선형회귀분석 방법을 사용한다. 본 연구자는 유전프로그래밍(Genetic Programming)을 이용한 비선형 회귀분석 기반의 보정식 생성을 통하여 이를 개선한 바 있는데, 본 연구에서는 보다 향상된 성능을 얻기 위하여 GP 기법 측면에서 Automatically Defined Functions과 다군집(Multiple Populations) 수행을 통해 성능을 높이고자 한다.

One-dimensional Positioning using Iterative Linear Regression Based on Received Signal Strength and Mobility Information (반복선형회귀를 이용한 수신 신호 세기와 이동성 정보에 기반한 1차원 위치 추정)

  • Lee, Dong-Jun;Kim, Da-Yeong;Lee, Eun-Hye
    • Journal of Advanced Navigation Technology
    • /
    • v.24 no.2
    • /
    • pp.128-133
    • /
    • 2020
  • In this study, an 1-dimensional positioning method using iterative linear regression for path loss expression is proposed. In the proposed method, received signal strengths (RSS) measured in several locations and distances between the measuring locat ions obtained by dead reckoning are used to derive a linear regression for the path loss from the transmitting beacon. In the proposed method, for the distance between the transmitting beacon and a target measuring location, several tentative values are assumed. For each tentative value, a linear regression is obtained. Among the linear regression expressions, the one closest to the known reference RSS value is selected and used to derive the distance to the target location. Test results show that the proposed method is more accurate than path loss model.

Study on the Estimation of Duncan & Chang Model Parameters-initial Tangent Modulus and Ultimate Deviator Stress for Compacted Weathered Soil (다짐 풍화토의 Duncan & Chang 모델 매개변수-초기접선계수와 극한축차응력 산정에 관한 연구)

  • Yoo, Kunsun
    • Journal of the Korean GEO-environmental Society
    • /
    • v.19 no.12
    • /
    • pp.47-58
    • /
    • 2018
  • Duncan & Chang(1970) proposed the Duncan-Chang model that a linear relation of transformed stress-strain plots was reconstituted from a nonlinear relation of stress-strain curve of triaxial compression test using hyperbolic theory so as to estimate an initial tangent modulus and ultimate deviator stress for the soil specimen. Although the transformed stress-strain plots show a linear relationship theoretically, they actually show a nonlinearity at both low and high values of strain of the test. This phenomenon indicates that the stress-strain curve is not a complete form of a hyperbola. So, if linear regression analyses for the transformed stress-strain plot are performed over a full range of strain of a test, error in the estimation of their linear equations is unavoidable depending on ranges of strain with non-linearity. In order to reduce such an error, a modified regression analysis method is proposed in this study, in which linear regression analyses for transformed stress-strain plots are performed over the entire range of strain except the range the non-linearity is shown around starting and ending of the test, and then the initial tangent modulus and ultimate deviator stresses are calculated. Isotropically consolidated-drained triaxial compression tests were performed on compacted weathered soil with a modified Proctor density to obtain their model parameters. The modified regression analyses for transformed stress-strain plots were performed and analyzed results are compared with results estimated by 2 points method (Duncan et al., 1980). As a result of analyses, initial tangent moduli are about 4.0% higher and ultimate deviator stresses are about 2.9% lower than those values estimated by Duncan's 2 points method.

Relationship Between Physical Properties and Compression Index for Marine Clay (해성점토의 물리적 특성과 압축지수의 상관성)

  • 김동후;김기웅;백영식
    • Journal of the Korean Geotechnical Society
    • /
    • v.19 no.6
    • /
    • pp.371-378
    • /
    • 2003
  • The compression index of clay distributed in the west and south coast of the Korean Peninsula had been studied. Compression index was obtained from the conventional consolidation test, and was conducted accordingly to obtain the field virgin compression curve by means of Schmertmann's graphical correction. To examine a correlation closely between physical properties of soils($e_o$, LL, w) and compression index(Cc), linen. and non-linear regression analysis were employed based on the data collected from tests. The conclusions are as follows. The compression index obtained by means of Schmereann's graphical correction is about 1.16 times for the value of original oedometer test curve for U/D samples. Non-liner regression curve was preferable to establish a correlation equation rather than linear regression curve. All derived equations so far achieved have been summarized and given. However, linear equation is better for practical use so that part by part simplified linear equations were also suggested alternatively together with their own non-linear regression curve.