Abstract
While the frequency of seismic occurrence has been increasing recently, the domestic seismic response system is weak, the objective of this research is to compare and analyze the seismic vulnerability of buildings using statistical analysis and machine learning techniques. As the result of using statistical technique, the prediction accuracy of the developed model through the optimal scaling method showed about 87%. As the result of using machine learning technique, because the accuracy of Random Forest method is 94% in case of Train Set, 76.7% in case of Test Set, which is the highest accuracy among the 4 analyzed methods, Random Forest method was finally chosen. Therefore, Random Forest method was derived as the final machine learning technique. Accordingly, the statistical analysis technique showed higher accuracy of about 87%, whereas the machine learning technique showed the accuracy of about 76.7%. As the final result, among the 22,296 analyzed building data, the seismic vulnerabilities of 1,627(0.1%) buildings are expected as more dangerous when the statistical analysis technique is used, 10,146(49%) buildings showed the same rate, and the remaining 10,523(50%) buildings are expected as more dangerous when the machine learning technique is used. As the comparison of the results of using advanced machine learning techniques in addition to the existing statistical analysis techniques, in spatial analysis decisions, it is hoped that this research results help to prepare more reliable seismic countermeasures.
최근 지진 발생 빈도가 증가하고 있는 반면 국내 지진 대응 체계는 취약한 현실에서, 본 연구의 목적은 통계분석 기법과 머신러닝 기법을 활용한 공간분석을 통해 건물의 지진취약도를 비교분석 하는 것이다. 통계분석 기법을 활용한 결과, 최적화척도법을 활용해 개발된 모델의 예측정확도는 약 87%로 도출되었다. 머신러닝 기법을 활용한 결과, 분석된 4가지 방법 중, Random Forest의 정확도가 Train Set의 경우 94%, Test Set의 경우 76.7%로 가장 높아, 최종적으로 Random Forest가 선정되었다. 따라서, 예측정확도는 통계분석 기법이 약 87%, 머신러닝 기법이 76.7%로, 통계분석 기법의 예측정확도가 더 높은 것으로 분석되었다. 최종 결과로, 건물의 지진취약도는 분석된 건물데이터 총 22,296개 중, 1,627(0.1%)개의 건물데이터는 통계분석 기법 사용 시 더 위험하다고 도출되었고, 10,146(49%)개의 건물데이터는 동일하게 도출되었으며, 나머지 10,523(50%)개의 건물데이터는 머신러닝 기법 사용 시 더 위험하게 도출되었다. 기존 통계분석 기법에 첨단 머신러닝 기법활용결과가 추가로 비교검토 됨으로써 공간분석 의사결정에 있어서, 좀더 신뢰도가 높은 지진대응책 마련에 도움이 되길 기대한다.