DOI QR코드

DOI QR Code

SMOTE와 분류 기법을 활용한 산사태 위험 지역 결정 방법

Method for Assessing Landslide Susceptibility Using SMOTE and Classification Algorithms

  • 윤형구 (대전대학교 재난안전공학과)
  • 투고 : 2023.05.08
  • 심사 : 2023.06.19
  • 발행 : 2023.06.30

초록

산사태 위험 지역을 사전에 조사하여 설정하는 것은 다수의 피해를 줄이기 위해 필요하다. 해당 연구의 목적은 machine learning 기법 중 분류 알고리즘을 활용하여 대상 지반의 안전율 분류를 수행할 수 있는 방법론을 제시하는 것이다. 산사태 위험 지역은 high risk area(HRA) 모델을 적용하였으며, 8개의 지반공학 물성치를 통해 위험 지역을 판단하였다. 분류 알고리즘은 decision tree(DT), K-Nearest Neighbor(KNN), logistic regression(LR) 그리고 random forest(RF)의 4가지가 활용 되었으며, 안전율 1.2~2.0 범위에 8가지 지반공학 물성치의 분류 정확도를 계산하였다. 정확도는 안전율이 1.2~1.7 범위에서 신뢰성 높게 나타났지만, 그 외 범위인 1.8~2.0 사이에서는 상대적으로 낮은 정확도를 보였다. 이를 극복하기 위하여 synthetic minority over-sampling technique(SMOTE) 알고리즘을 적용하여 데이터 개수를 증폭하였으며, 증폭한 데이터를 통해 분류 알고리즘을 적용하면 안전율 1.8~2.0 범위에서 정확도가 평균적으로 약 250% 증가한 것으로 나타났다. 해당 연구 결과는 SMOTE 알고리즘이 데이터 개수를 향상시켜 분류 알고리즘의 정확도가 개선된 것을 보여주며, 타 분야에도 정확도 향상에 적용 가능하다고 판단된다.

Proactive assessment of landslide susceptibility is necessary for minimizing casualties. This study proposes a methodology for classifying the landslide safety factor using a classification algorithm based on machine learning techniques. The high-risk area model is adopted to perform the classification and eight geotechnical parameters are adopted as inputs. Four classification algorithms-namely decision tree, k-nearest neighbor, logistic regression, and random forest-are employed for comparing classification accuracy for the safety factors ranging between 1.2 and 2.0. Notably, a high accuracy is demonstrated in the safety factor range of 1.2~1.7, but a relatively low accuracy is obtained in the range of 1.8~2.0. To overcome this issue, the synthetic minority over-sampling technique (SMOTE) is adopted to generate additional data. The application of SMOTE improves the average accuracy by ~250% in the safety factor range of 1.8~2.0. The results demonstrate that SMOTE algorithm improves the accuracy of classification algorithms when applied to geotechnical data.

키워드

참고문헌

  1. Chawla, N. V., Bowyer, K. W., Hall, L. O., and Kegelmeyer, W. P. (2002), "SMOTE: Synthetic Minority Over-sampling Technique", Journal of Artificial Intelligence Research, Vol.16, pp.321-357. https://doi.org/10.1613/jair.953
  2. Hong, M. and Jeong, S. (2019), "A Combined Method for Rainfall-induced Landslides and Debris Flows in Regional-scale Areas", Journal of the Korean Geotechnical Society, Vol.35, No.10, pp. 17-31. https://doi.org/10.7843/KGS.2019.35.10.17
  3. Jeon, B. G., Kim, J., and Kang, G. (2021), "Case Study on Location of Possible Tension Crack in Rock Slope," Journal of the Korean Geotechnical Society, Vol.37, No.3, pp.5-17.
  4. Ji, Y., Kin, H. S., Lee, M, G., Cho, H. I., and Sun, C. G. (2021), "MLP-based 3D Geotechnical Layer Mapping Using Borehole Database in Seoul, South Korea", Journal of the Korean Geotechnical Society, Vol.37, No.5, pp.47-63.
  5. Jun, H., Min, D. H., and Yoon, H. K. (2017), "Determination of Monitoring Systems and Installation Location to Prevent Sebris Flow through Web-based Database and AHP", Marine Georesources & Geotechnology, Vol.35, No.8, pp.1049-1057. https://doi.org/10.1080/1064119X.2017.1280716
  6. Kim, J., Kang, J. M., and Back, S. H. (2021), "Development of Random Forest Model for Sewer-induced Sinkhole Susceptibility", Journal of the Korean Geotechnical Society, Vol.37, No.12, pp. 117-125. https://doi.org/10.7843/KGS.2021.37.12.117
  7. Kim, T. W., Yoo, H. S., Park, S. I., and Kim, J. H. (2022), "Slope Stability in Logging Areas Using Unmanned Aerial Vehicle Imaging", Journal of the Korean Geotechnical Society, Vol.38, No.7, pp.39-47. https://doi.org/10.7843/KGS.2022.38.7.39
  8. Kumar, S., Lal, R., and Liu, D. (2012), "A Geographically Weighted Regression Kriging Approach for Mapping Soil Organic Carbon Stock", Geoderma, Vol.189, pp.627-634. https://doi.org/10.1016/j.geoderma.2012.05.022
  9. Lee, J. S., Park, J., Kim, J., and Yoon, H. K. (2022), "Study of Oversampling Algorithms for Soil Classifications by Field Velocity Resistivity Probe", Geomechanics and Engineering, Vol.30, No.3, pp.247-258. https://doi.org/10.12989/GAE.2022.30.3.247
  10. Ma, J. and Yun, T. S. (2022), "Prediction of Slope Failure Arc Using Multilayer Perceptron", Journal of the Korean Geotechnical Society, Vol.38, No.8, pp.39-52.
  11. Min, D. H. and Yoon, H. K. (2021), "Suggestion for a New Deterministic Model Coupled with Machine Learning Techniques for Landslide Susceptibility Mapping", Scientific Reports, Vol.11, No.1, 6594.