DOI QR코드

DOI QR Code

Landslide Susceptibility Mapping Using Deep Neural Network and Convolutional Neural Network

Deep Neural Network와 Convolutional Neural Network 모델을 이용한 산사태 취약성 매핑

  • 공성현 (서울시립대학교 공간정보공학과) ;
  • 백원경 (서울시립대학교 공간정보공학과) ;
  • 정형섭 (서울시립대학교 공간정보공학과)
  • Received : 2022.12.08
  • Accepted : 2022.12.09
  • Published : 2022.12.31

Abstract

Landslides are one of the most prevalent natural disasters, threating both humans and property. Also landslides can cause damage at the national level, so effective prediction and prevention are essential. Research to produce a landslide susceptibility map with high accuracy is steadily being conducted, and various models have been applied to landslide susceptibility analysis. Pixel-based machine learning models such as frequency ratio models, logistic regression models, ensembles models, and Artificial Neural Networks have been mainly applied. Recent studies have shown that the kernel-based convolutional neural network (CNN) technique is effective and that the spatial characteristics of input data have a significant effect on the accuracy of landslide susceptibility mapping. For this reason, the purpose of this study is to analyze landslide vulnerability using a pixel-based deep neural network model and a patch-based convolutional neural network model. The research area was set up in Gangwon-do, including Inje, Gangneung, and Pyeongchang, where landslides occurred frequently and damaged. Landslide-related factors include slope, curvature, stream power index (SPI), topographic wetness index (TWI), topographic position index (TPI), timber diameter, timber age, lithology, land use, soil depth, soil parent material, lineament density, fault density, normalized difference vegetation index (NDVI) and normalized difference water index (NDWI) were used. Landslide-related factors were built into a spatial database through data preprocessing, and landslide susceptibility map was predicted using deep neural network (DNN) and CNN models. The model and landslide susceptibility map were verified through average precision (AP) and root mean square errors (RMSE), and as a result of the verification, the patch-based CNN model showed 3.4% improved performance compared to the pixel-based DNN model. The results of this study can be used to predict landslides and are expected to serve as a scientific basis for establishing land use policies and landslide management policies.

산사태는 가장 널리 퍼진 자연재해 중 하나로 인명 및 재산피해 뿐만 아니라 범 국가적 차원의 피해를 유발할 수 있기 때문에 효과적인 예측 및 예방이 필수적이다. 높은 정확도를 갖는 산사태 취약성도를 제작하려는 연구는 꾸준히 진행되고 있으며 다양한 모델이 산사태 취약성 분석에 적용되어 왔다. 빈도비 모델, logistic regression 모델, ensembles 모델, 인공신경망 등의 모델과 같이 픽셀기반 머신러닝 모델들이 주로 적용되어 왔고 최근 연구에서는 커널기반의 합성곱신경망 기법이 효과적이라는 사실과 함께 입력자료의 공간적 특성이 산사태 취약성 매핑의 정확도에 중요한 영향을 미친다는 사실이 알려졌다. 이러한 이유로 본 연구에서는 픽셀기반 deep neural network (DNN) 모델과 패치기반 convolutional neural network (CNN) 모델을 이용하여 산사태 취약성을 분석하는 것을 목적으로 한다. 연구지역은 산사태 발생 빈도가 높고 피해가 큰 인제, 강릉, 평창을 포함한 강원도 지역으로 설정하였고, 산사태 관련인자로는 경사도, 곡률, 하천강도지수, 지형습윤지수, 지형위치 지수, 임상경급, 임상영급, 암상, 토지이용, 유효토심, 토양모재, 선구조 밀도, 단층 밀도, 정규식생지수, 정규수분지수의 15개 데이터를 이용하였다. 데이터 전처리 과정을 통해 산사태관련인자를 공간데이터베이스로 구축하였으며 DNN, CNN 모델을 이용하여 산사태 취약성도를 작성하였다. 정량적인 지표를 통해 모델과 산사태 취약성도에 대한 검증을 진행하였으며 검증결과 패치기반의 CNN 모델에서 픽셀기반의 DNN 모델에 비해 3.4% 향상된 성능을 보였다. 본 연구의 결과는 산사태를 예측하는데 사용될 수 있고 토지 이용 정책 및 산사태 관리에 관한 정책 수립에 있어 기초자료 역할을 할 수 있을 것으로 기대된다.

Keywords

1. 서론

최근 지구온난화 및 이상기온과 같은 기후변화의 영향으로 인해 세계 곳곳에서 태풍 및 집중호우가 빈번하게 발생하고 있으며 이로인한 침수, 범람 및 산사태 등의 자연재해가 증가하고 있다(Melanie and David, 2018; Gariano And Guzzetti, 2016). 산사태는 자연적 또는 인위적인 원인으로 토양이나 암석들이 산의 사면을 따라 일시에 미끄러져 내리는 현상으로 6–9월 사이에 강우량이 집중되어 있고, 국토의 70% 이상이 산지로 이루어져 있는 우리나라에서는 해마다 많은 인명피해와 재산피해를 일으키고 있다(Kim and Kim, 2013). 산림청에 의하면 우리나라의 산사태 발생추이는 1980년대 산사태 피해면적이 231 ha이었던 것에 비해 2000년 대에는 713ha로 증가하였으며 최근 10년간 우리나라의 연평균 산사태 복구비용은 601.9억원에 달한다고 보고된 바 있다(Korea Forest Service, 2013). 특히 2020년에는 국지성 집중호우와 태풍 ‘마이삭’, ‘하이선’ 등으로 인한 산사태 피해로 인해 9명의 사상자가 발생했고 피해복구액은3,317억원에 달했다.

이와 같은 문제는 우리나라 뿐만 아니라 전세계적으로 발생하고 있는 현상이며 산사태 피해에 대한 우려의 목소리가 커지고 있다. 이러한 상황속에서 산사태에 대한 연구는 국내 뿐만 아니라 해외에서도 활발히 진행되고 있으며, 특히 산사태로 인한 인명피해와 재산피해를 예방하기 위해서 산사태 취약성 분석에 관한 연구가 국내외 연구자들에 의해 활발하게 이루어지고있다(Lee et al., 2004). 산사태 취약성 분석에 관한 연구는 정량적으로 산사태의 발생 원인을 분석하는 것에 그치지 않고 이를 바탕으로 산사태의 발생 가능성을 예측하여 산사태에 의한 피해 예방과 관리가 가능하다는 점에서 중요하다(Lee et al., 2005).

이러한 필요성에 의해 국내외 많은 산사태 취약성 연구에서 GIS 및 다양한 모델을 사용한 연구가 활발히 이루어지고 있다(Lee, 2019). 확률 모델에서는 빈도비 모델, evidential belief functions 모델, logistic regression 모델 등이 많이 적용되었고, 기계학습 모델에서는 ensembles 모델, support vector machines 모델, neural networks 모델 등이 주로 적용되어왔다(Lee and Oh, 2019; Lee and Lee, 2017). 최근에는 산사태 취약성 분석 연구에서 머신러닝 기법 중 하나인 딥러닝 기술을 사용한 연구가 많은 관심을 받고 있으며 활발하게 진행 중이다. 딥러닝 기술은 원격탐사를 비롯한 영상 기반 분석에서 물체의 감지, 식별 그리고 특징을 추출하는데 효과적이라고 알려졌으며 기존의 머신러닝 기술에 비해 더 좋은 성능을 나타낸다고 검증된 바 있다. 여러 개의 은닉층(hidden layer)을 가지는 인공신경망(Artificial Neural Network, ANN) 모델을 기반으로 하는 deep neural network (DNN) 모델은 검증되었으며 대표적으로 사용되는 딥러닝 모델이다(Lee et al., 2020). Convolution 연산을 하는 패치기반의 딥러닝 모델인 convoultional neural network (CNN) 모델은 이미지 기반의 분석에서 좋은 성능을 보이며 인접 픽셀과의 연관 관계를 고려하여 특징을 추출할 수 있다는 장점을 가지고있다.

본 연구에서는 가장 대표적인 딥러닝 모델 중 하나인 DNN과 CNN 모델을 통해 산사태 취약성을 분석하는 것을 목표로 한다. 이를 위해 산사태 발생관련 인자들을 데이터베이스로 구축하였고 딥러닝 모델을 사용하여 산사태 취약성도를 작성하고 최종적으로 픽셀기반의 DNN 모델과 패치기반의 CNN 모델을 정량적으로 검증하고 비교 분석하는 과정을 수행하였다.

2. 연구지역 및 데이터

1) 연구지역

본 연구대상지역은 인제군, 평창군, 강릉시를 포함한 강원도지역 일대를 포함하도록 설정하였다. 강원도 지역은 전체의 약 81%에 달하는 면적이 산지로 형성되어 있으며 총면적의 5.6%에 해당하는 면적만이 100 m 이하의 저지대로 이루어져 있다. 또한 500 m에서 1,000 m 높이 사이의 중산야지대가 43.4%로 형성되어있고 1,000 m 이상의 고산지대가 7.7% 면적을 차지한다. 이처럼 50% 이상의 면적이 고지대를 이루고 있는 강원도 지역은 지형이 가파르고 험하게 형성되어 있으며 토사의 깊이가 2 m 이내로 얉아 산사태 발생에 취약한 환경조건을 가지고 있다(Lee and Kim, 2012).

본 연구의 대상지역으로 설정한 인제군, 평창군 그리고 강릉시는 산사태 발생에 취약한 강원도의 환경조건을 갖추고 있어 산사태로 인한 피해가 빈번한 지역이며 국내의 산사태 취약성 관련 연구에서 연구대상지역으로 선정되어 연구된 사례가 많이 존재한다(Lee et al., 2005; Lee and Kim., 2012; Rahnuma et al., 2020). 연구지역은 지리학적으로 위도 37°32′58″–38°9′24″N, 경도 128°6′42″–128°56′28″ E 사이에 위치한다(Fig. 1).

OGCSBN_2022_v38n6_2_1723_f0001.png 이미지

Fig. 1. Study area of this study.

2) 데이터

산사태는 한 가지 요인에 의해서만 발생하지 않으며 지형, 지질, 임상, 암상, 토양 등 여러가지 요인들의 상호작용에 의해 발생되기 때문에 산사태 분석에 있어서 이러한 데이터들의 공간 데이터베이스 구축이 필수적이다. 본 연구에 사용된 산사태 위치데이터는 환경빅데이터 플랫폼으로부터 취득한 강원도 지역의 산사태 발생 지점 10,248개의 데이터를 사용하였다. 산사태 발생에 관련된 인자는 경사도, 곡률, stream power index (SPI), topographic wetness index (TWI), topographic position index (TPI), 임상경급, 임상영급, 암상도, 토지이용도, 유효토심, 토양모재, 선구조조도, 단층밀도도의 13개 지형공간정보 자료와 Sentinel-2 위성영상으로부터 제작한 normalized difference vegetation index (NDVI), normalized difference water index(NDWI)의 총 15개 자료를 본 연구에 이용하였다(Lee, 2019). 연구에 사용된 산사태 발생 관련 인자는 ArcGIS 소프트웨어를 사용하여 전처리 과정을 거쳤으며 15 × 15 m의 격자 크기를 갖는 공간데이터 베이스로 구축하였다(Table 1).

Table 1. Landslide influential varibles used in this study

OGCSBN_2022_v38n6_2_1723_t0001.png 이미지

먼저 지형 요소는 국토지리정보원(National Geographic Information Institute)에서 제작된 수치표고모형(digital elevation model, DEM)으로부터 계산되었다. 본 연구에서 사용한 지형 요소는 DEM으로부터 계산된 경사도, 곡률, SPI, TWI, TPI의 5개 요소이다. 경사도(Fig. 2(a))는 지형의 기울기를 나타내며 물의 흐름과 토양의 특성에 영향을 미치므로 산사태 발생에 있어 중요한 요소로 다뤄진다(Lee et al., 2017). 곡률(Fig. 2(b))은 지형의 형태학적 특성을 나타내며 0값을 기준으로 양의 값으로 갈수록 지형 경사면의 형태가 볼록한 것을 나타내며, 음의 값으로 갈수록 오목한 지형임을 의미한다. 곡률은 지형의 침식작용과 수분함량에 영향을 미치기 때문에 산사태 발생에 영향을 미치는 지표로 사용되며 일반적으로 오목한 지형이 볼록한 지형에 비해 산사태 발생에 더 취약한 구조를 갖는다(Oh, 2010; Pourghasemi et al., 2018). SPI와 TWI는 물의 흐름과 관련된 수리적 지형 요소이다. SPI(Fig. 2(c))는 하천의 침식력 지수를 의미하며 지형 표면의 주어진 지점에서의 안정성을 나타내는 지표로 사용된다(Florinsky, 2012). TWI (Fig. 2(d))는 지형습윤지수를 의미하며 토양의 물리·화학적 속성이 균질하다는 가정하에 지표면의 수분 보유 가능성을 나타내는 지표이며 물의 유동 및 물의 유출에 따른 퇴적물의 이동을 유추할 수 있다(Willson and Gallant, 2000). TPI (Fig. 2(e))는 Weiss (2001)에 의해 계산되어지며 지형의 볼록함과 오목함을 정량적으로 나타낸 지표로 산사태 발생지 예측을 위한 연구에 사용되었다(Woo et al., 2007).

OGCSBN_2022_v38n6_2_1723_f0002.png 이미지

Fig. 2. Landslide-influencing variables used in this study: (a) Slope, (b) Curvature, (c) SPI, (d) TWI, (e) TPI, (f) Timber diameter, (g) Timber age, (h) NDVI, (i) NDWI, (j) Lithology, (k) Fault density, (l) Lineament density, (m) Soil depth, (n) Soil parent material, and (o) Land use.

임상 관련 요소는 산림청(Korea Forest Service)에서 제공하는 1:25,000 임상도로부터 임상경급 과 임상영급을 추출하였다. 식생은 토양에 떨어지는 비의 충격을 줄여 사면의 침식을 방지하고, 식생의 뿌리는 토양의 전단강도를 증가시키고 이는 사면의 안전성을 증가시킨다.

이러한 이유로 임상 관련 요소는 산사태 취약성 연구에서 빈번하게 사용된다(Lee, 2019). 임상경급(Fig. 2(f))은 나무의 지름을 나타내며 임목의 평균 흉고직경을 치수, 소경목, 중경목, 대경목의 4 단계로 구분한다. 임상영급(Fig. 2(g))은 나무의 나이를 의미하며 10년 단위로 구분하고, 본 연구지역에 대해서는 1~8영급으로 구분한다. 식생과 토양의 수분 관련 요소는 임상 뿐만 아니라 NDVI와 NDWI 지수와도 밀접한 연관이 있다. NDVI(Fig.2(h))는 정규식생지수, NDWI(Fig. 2(i))는 정규수분지수로 각각 식생지역과 수계영역을 효과적으로 탐지할 수 있는 지표로 널리 사용되고있다(Gao, 1996). 최근 산사태 취약성 분석에 관한 연구에서 NDVI와 NDWI 지표는 중요한 산사태 관련인자로 사용되고 있다(Wang et al., 2020; Yaa’cob et al., 2020; Hua et al., 2021).

한국지질자원연구원(Korea Institute of Geoscience and Mineral Resources)에서 제공하는 1:50,000 수치지질도에서 암상, 단층밀도, 선구조밀도에 대한 요소를 추출하였다. 암상(Fig. 2(j))은 강도, 구성 및 구조와 같은 다양한 특성을 가지며 산사태 발생에 영향을 미친다(Kincal et al., 2009; Pourghasemi et al., 2018). 단층(Fig. 2(k))은 지각변동으로 인한 지질구조를 파악할 수 있는 지표로 산사태 발생과 연관이 있다. 또한 선구조(Fig. 2(l))가 산사태의 취약성분석에 중요한 요소로 작용함을 분석한 연구가 이루어진 바 있다(Ramli et al., 2010).

토양 내 물의 양이 배수용량을 초과하여 토양의 응집력이 급격하게 떨어지는 경우 산사태의 발생 위험이 증가한다. 또한 토양은 지표수 및 지하수를 포함한 물의 흐름에 영향을 미치므로 산사태 발생과 밀접한 관련이 있다(Jones et al., 1983). 토양 관련 요소는 국립농업과학원(National Institute of Agricultural Sciences)에서 제공하는 1:25,000 토양도로부터 유효토심(Fig. 2(m))과 토양모재(Fig. 2(n))에 대한 정보를 추출하였다. 유효토심은 작물 뿌리가 땅속에서 뻗을 수 있는 깊이를 의미하며 작물이 이용할 수 있는 수분의 양을 판단할 수 있는 지표로 쓰일 수 있다.

마지막으로 토지이용(Fig. 2(o)) 자료는 환경부(Ministry of Environment)에서 제공하는 1:25,000 토지이용도로부터 추출하여 연구에 사용하였다. 환경부에서 발행한 토지이용도는 SPOT-5 영상을 이용하여 작성되었다.

3. 연구방법

본연구에 사용된 입력데이터셋은 ground truth 데이터와 산사태 입력 데이터의 쌍으로 구성되며 구축된 공간데이터베이스로부터 추출하여 생성하였다. 입력데이터셋은 픽셀기반의 DNN 모델과 패치기반의 CNN 모델에 적용하기 위해 각각 1 × 1 픽셀과 9 × 9 패치 크기로 제작하였으며 모델의 학습에 이용되는 학습용 데이터셋(70%)과 모델의 성능 평가 및 검증에 사용되는 검증용 데이터셋(30%)으로 무작위로 나누었다. 이때 학습용 데이터셋에는 데이터 증강을 적용시켜 주었다. 데이터 증강은 원본 데이터로부터 새로운 데이터를 만들어 내는 기법으로 데이터 증강을 통해 한정적인 데이터를 딥러닝 학습에 이용할 수 있고 딥러닝 학습시에 과적합을 방지하여 성능을 향상시킬 수 있다(Shorten and Khoshgoftaar, 2019). 본 연구에서는 데이터 증강 기법으로, 90°, 180°, 270° rotation과 horizontal flip, vertical flip 방법을 사용하였다. 학습용 데이터 셋을 사용하여 학습을 마친 DNN과 CNN 모델을 통해 전체 연구지역에 대한 산사태 취약성도를 작성하였고 최종적으로 정량적인 지표를 통해 검증 비교를 하였다. 전체적인 연구의 흐름은 Fig. 3과 같다.

OGCSBN_2022_v38n6_2_1723_f0003.png 이미지

Fig. 3. Dataflow of this study.

1) Ground Truth 제작

산사태가 발생한 지역에 대한 데이터는 한국지질자원연구원으로부터 취득하였지만 산사태 취약성 분석을 위해서는 산사태가 일어나지 않은 지역에 대한 데이터도 필요하다. 본 연구에서는 빈도비 분석(frequency ratio)방법을 사용하여 ground truth를 제작하였다. 입력자료를 구간을 정하여 나눈뒤 전체 픽셀 수에서 각 구간이 차지하는 픽셀 수의 비율을 구한다. 이때 각 구간이 갖는 참값(산사태 발생 픽셀의 개수)의 비율을 구하여 두값을 나누어 입력자료의 구간에 대한 빈도비를 구할 수 있다. 이렇게 구한 빈도비의 값이 동일하게 낮은 구간​​​을 추출하여 산사태가 반드시 일어나지 않았을 것이라고 가정하는 false label 을 생성하였고 산사태 위치 데이터와 함께 ground truth를 제작하였다(Fig. 4).

OGCSBN_2022_v38n6_2_1723_f0004.png 이미지

Fig. 4. Ground Truth of this study.

2) Deep Neural Network 모델

입력 레이어, 히든 레이어 그리고 출력 레이어의 구조로 이루어진 ANN 사람의 신경망 원리와 구조에서 착안하여 만든 기계학습 알고리즘으로 예측 및 분류를 포함한 다양한 분야에서 가장 널리 쓰이는 알고리즘 중 하나이다(Du et al., 2018). 역전파 알고리즘은 입력 레이어와 출력 레이어를 알고 있는 상태에서 신경망을 학습시키는 방법으로 인공신경망의 학습에 쓰이는 기본적인 알고리즘이다. 인공신경망 학습은 역전파 알고리즘을 통해 기존에 정해 둔 예측값에 도달할 때까지 학습이 반복적으로 수행되고 이 과정을 통해 예측값과 실측값 사이의 오차를 최소화 하는 가중치를 찾는다(Liu et al., 2017).

딥러닝은 이러한 인공신경망 구조를 기반으로 하며 최근에는 더 깊은 층을 갖고 복잡한 구조를 갖는 모델들이 제안되고 있다. DNN은 여러 층의 인공신경망을 가지는 딥러닝 모델로 입력 레이어와 출력 레이어 사이에 여러 층의 히든 레이어를 갖는 구조를 지니고 있다. 본 연구에 사용된 DNN 모델은 9개의 히든 레이어를 갖는 구조이며 각각의 히든 레이어는 [150, 150, 90, 45, 15, 45, 90, 150, 150]개의 히든 노드를 갖는다(Fig. 5). 활성화 함수로는 ReLU 함수를 사용하였고 optimizer는 Nadam을 사용하였으며, batch size와 learning rate, epoch는 각각 1000, 0.001, 500으로 설정하였다.

OGCSBN_2022_v38n6_2_1723_f0005.png 이미지

Fig. 5. Model architecture proposed in this study: Deep Neural Network.

3) Convolutional Neural Network 모델

최근 CNN 모델을 활용한 분류, 탐지, 예측 등의 기법이 많은 분야에서 널리 쓰이고 있다. 특히 CNN 모델은 이미지 기반 분석에 있어서 가장 좋은 성능을 보이는 딥러닝 기법중 하나이며 원격탐사 분야를 비롯한 영상분석에서는 널리 활용되고 있다(LeCun et al., 2015). CNN은 이동창(moving window) 방식의 컨볼루션 레이어(convolution layer)를 통해 영상의 특징을 추출하고 풀리커넥티드 레이어(fully connected layer)를 통해 요약하여 특징맵을 만드는 구조를 가지고 있으며 이미지를 입력데이터로 받아 파라미터 수를 크게 줄여 처리속도가 빠르다는 장점이 있다(Ghorbanzadeh et al., 2019).

본 연구에서 사용된 CNN 모델은 가장 일반적인 CNN모델로써 convolutional layer와 fully connected layer의 구조를 갖고 입력 데이터는 9 × 9 크기의 패치를, 출력 데이터는 1 × 1 픽셀 크기를 갖는다(Fig. 6). 활성화 함수로는 ReLU 함수를 사용하였고 optimizer는 Nadam을 사용하였으며, batch size와 learning rate, epoch는 각각 1000, 0.0001, 300으로 설정하였다.

OGCSBN_2022_v38n6_2_1723_f0006.png 이미지

Fig. 6. Model architecture proposed in this study: Convolutional Neural Network.

4) 모델 성능평가

예측된 산사태 취약성도와 연구에 사용된 DNN, CNN 모델에 대한 정량적인 검증 지표로는 root mean square errors (RMSE)와 average precision (AP)값이 사용되었다. RMSE는 예측된 값과 실제 값의 차이의 표준편차를 의미하는 지표이며 작성된 산사태 취약성도의 성능을 평가하는데 사용하였다(Tien et al., 2018; Pham et al.,2019). 이때 RMSE는 모델의 학습에 사용되지 않은 검증용 데이터(30%)를 사용하여 계산되었다.

본 연구에서 모델의 정량적 성능평가는 precision recall curve (PR curve)의 아래 넓이를 의미하는 AP값을 통해 이루어졌다. PR curve는 threshold 변화에 따른 precision과 recall의 변화양상을 나타낸 그래프로 AP값이 높을수록 모델의 예측 성능이 우수하다는 것을 의미한다(Davis and Goadrich, 2006).

4. 연구결과

Fig. 7은 본 연구에 사용된 모델을 통해 예측한 산사태 취약성도의 작성 결과이다. Fig. 7(a)는 DNN 모델을 통해 작성된 산사태 취약성도이고 Fig. 7(b)는 CNN 모델을 통해 예측된 산사태 취약성도이다. 작성된 산사태 취약성도의 모든 픽셀 값은 바다를 제외한 연구지역에 대하여 0 에서 1 사이의 값을 나타내며, 값이 1에 가까울수록 산사태 취약성이 높고 값이 0에 가까울수록 산사태 취약성이 낮다는 것을 의미한다. 두 모델의 결과는 대체로 유사한 공간적 분포를 나타내고 있으며 ground truth map과 비슷한 양상을 띄는 것을 확인할 수 있다.

OGCSBN_2022_v38n6_2_1723_f0007.png 이미지

Fig. 7. Landslide susceptibility maps using (a) DNN and (b) CNN models.

취약성이 0.2 미만인 지역은 전체 연구지역에 대하여 DNN과 CNN의 결과에서 각각 7.19%, 13.06%였고, 취약성이 0.8 이상인 지역은 DNN과 CNN의 결과에서 각각 27.66% 와 26.15%로 나타났다. 취약성이 낮은 지역은 DNN에 비해 CNN의 결과에서 확연히 높은 비율을 나타내는데 이는 수계영역의 영향에 의한 것으로 판단된다. 강, 호수, 계곡 등의 수계영역은 실제 산사태가 발생할 확률이 0에 가깝지만 픽셀기반의 DNN 모델에서는 수계영역에 대한 예측이 잘 이루어지지 않았다. 이는 픽셀기반 모델의 특성상 인접 픽셀의 공간정보를 반영하지 못하여 예측이 잘 이루어지지 않은 것으로 해석되며, 패치기반의 CNN 모델에서는 인접한 픽셀의 공간정보를 반영하였기에 수계영역에 대한 취약성 예측결과가 좋은 것을 확인할 수 있다. 반면 산사태 취약성이 높은 지역은 낮은 지역과 달리 픽셀기반의 DNN 모델에서 1.5% 가량 높은 값을 보였다. 이는 패치기반의 CNN 모델의 특성상 스무딩 되는 효과가 발생했기 때문이며 DNN 모델의 결과에 비해 공간해상도가 낮아졌음을 확인할 수 있다.

모델의 정량적 성능평가는 PR curve의 아래쪽 면적을 의미하는 AP값을 통해 이루어 졌다. 훈련용 데이터셋은 산사태 관련 변수들과 산사태가 발생한 지역의 데이터를 사용하여 산사태 취약성에 관한 예측 성능을 높이도록 학습하는데 사용되었고 훈련에 사용되지 않은 30%의 검증용 데이터셋을 통해 성능평가를 진행하였다. DNN 모델의 AP 값은 0.9866, CNN 모델의 AP 값은 0.9883으로 두가지 모델 모두 예측에 대한 정확도가 98% 이상의 성능을 보이고 있으며 DNN 모델에 비해 CNN모델이 0.0017만큼 높았다. RMSE는 DNN이 0.2566, CNN이 0.2481로 큰 차이를 보이지는 않았지만 CNN이 DNN에 비해 3.4% 향상된 결과를 보여준다. Fig. 8(a–b)의 RMSE 빈도 그래프를 통해 CNN 모델이 DNN 모델에 비해 참값에 가깝게 예측한 값이 많았음을 확인할수 있다. CNN 모델이 DNN 모델에 비해 정량적인 결과가 높게 나온 이유는 CNN 모델이 DNN 모델과 달리 패치기반 모델이므로 주변 픽셀의 지형 공간정보를 반영할 수 있었기 때문이다. 산사태는 발생할 때 임상, 토양, 지질, 지형정보 등의 요소들이 복합적으로 작용하며 하나의 픽셀에서 독립적으로 발생하지 않는다. 또한 산사태는 한 방향 이상의 방향에서 발생하며 각 산사태 지역은 서로 다른 형태와 구조를 갖기 때문에 양상을 일반화하기 어렵고 이로 인해 주변의 공간적 특성을 반영하는 패치기반 모델에서 더 향상된 성능을 보였다.​​​​​​​

OGCSBN_2022_v38n6_2_1723_f0008.png 이미지

Fig. 8. Model performance evaluation results: (a-b) root mean square errors (RMSE) and (c-d) average precision (AP) scores of the DNN and CNN models.

5. 결론

산사태는 해마다 발생하여 많은 인명피해와 경제적 손실을 일으키는 자연재해로 이상기온과 기후변화가 심각해짐에 따라 산사태 취약지역에 대한 분석과 예측에 대한 필요성이 커지고 있다. 이러한 필요성에 입각하여 본 연구에서는 최근 활발한 연구가 이루어지고 있으며 이미지 기반 분석에서 뛰어난 성능을 보이는 딥러닝 모델을 이용하여 강원도의 인제, 강릉, 평창을 포함한 지역에 대하여 산사태 취약성 분석을 진행하였다. 강원도는 대부분이 산지로 이루어져 있고 이러한 지형특성상 산사태에 취약하며 산사태 발생 데이터가 많이 분포하여 연구대상지로 선정하였다.

본 연구에서는 경사도, 곡률, 하천강도지수, 지형습윤지수, 지형위치지수, 임상경급, 임상영급, 암상도, 토지이용도, 유효토심, 토양모재, 선구조조도, 단층밀도도, 정규식생지수, 정규수분지수의 15개 산사태 관련 요소들이 입력자료로 사용되었으며 15 × 15 m 격자 크기를 갖는 공간데이터베이스를 구축하여 입력데이터셋을 구축하였다. 입력데이터셋은 훈련용 데이터셋(70%)과 검증용 데이터셋(30%)으로 나누어 훈련용 데이터셋은 모델의 훈련에, 검증용 데이터셋은 성능 평가 및 검증에 사용하였다.

본 연구에 사용된 딥러닝 모델은 산사태 취약성을 잘 예측하였는데, AP값을 통해 모델 성능을 평가한 결과, DNN과 CNN은 각각 98.66%, 98.83%의 예측 성능을 보였다. RMSE값을 통해 예측된 취약성도의 성능 평가 결과에서는 패치기반의 CNN 모델이 픽셀기반의 DNN 모델에 비해 3.4% 향상된 결과를 보였는데 이는 패치기반의 모델이 인접 픽셀의 공간적 특성을 반영하였기 때문이다. 산사태는 한가지 단일 요소에 의하여 발생하지 않으며 다양한 요인이 복합적으로 작용하여 발생하며 주변의 지형요소들이 중요하게 작용하므로 주변의 공간적 특성을 반영하는 것이 중요하다.

본 연구에서 산사태 취약성 분석에 사용한 DNN과 CNN 모델은 산사태 취약성도 작성에서 좋은 성능을 보였으며 이는 앞으로 산사태를 예측하는데 사용될 수 있을 것이다. 추후 본 연구에서 설정한 지역 외에도 다른 지역에 대해서도 분석 및 적용하여 산사태 위험 예측 및 예방을 위한 도구로 사용할 수 있고 산사태 방지에 관한 정책 수립에 있어서 기초자료 역할을 할 수 있을 것으로 기대된다.

사사

이 연구는 2020년 대한민국 정부의 재원으로 한국연구재단(NFR-2020R1A2C1006593)의 지원을 받아 수행되었으며 이에 감사드립니다.

References

  1. Cruden, D. and D. Varnes, 1996. Landslide types and processes, Special Report, Transportation Research Board, National Academy of Science, 247: 36-75.
  2. Davis, J. and M. Goadrich, 2006. The relationship between Precision-Recall and ROC curves, Proc. of the 23rd International Conference on Machine Learning, Pittsburgh, PA, Jun. 25-29, pp. 233-240. https://doi.org/10.1145/1143844.1143874
  3. Du, S.S., Y. Wang, X. Zhai, S. Balakrishnan, R.R. Salakhutdinov, and A. Singh, 2018. How many samples are needed to estimate a convolutional neural network?, Proc. of the 32nd International Conference on Neural Information Processing Systems, Montreal, QC, Dec. 3, pp. 371-381. https://dl.acm.org/doi/10.5555/3326943.3326978
  4. Florinsky, I.V., 2012. Digital Terrain Analysis in Soil Science and Geology, Elsevier Press, Amsterdam, Netherland. https://doi.org/10.1016/b978-0-12-385036-2.00023-7
  5. Froude, M.J. and D.N. Petley, 2018. Global fatal landslide occurrence from 2004 to 2016, Natural Hazards and Earth System Sciences, 18(8): 2161-2181. https://doi.org/10.5194/nhess-18-2161-2018
  6. Gao, B.C., 1996. NDWI-A normalized difference water index for remote sensing of vegetation liquid water from space, Remote Sensing of Environment, 58(3): 257-266. https://doi.org/10.1016/s0034-4257(96)00067-3
  7. Gariano, S.L. and F. Guzzetti, 2016. Landslides in a changing climate, Earth-Science Reviews, 162: 227-252. https://doi.org/10.1016/j.earscirev.2016.08.011
  8. Ghorbanzadeh, O., T. Blaschke, K. Gholamnia, S.R. Meena, D. Tiede, and J. Aryal, 2019. Evaluation of different machine learning methods and deep-learning convolutional neural networks for landslide detection, Remote Sensing, 11: 196. https://doi.org/10.3390/rs11020196
  9. Hua, Y., X. Wang, Y. Li, P. Xu, and W. Xia, 2021. Dynamic development of landslide susceptibility based on slope unit and deep neural networks, Landslides, 18(1): 281-302. https://doi.org/10.1007/s10346-020-01444-0
  10. Jones, H.G., 1983. Estimation of an effective soil water potential at the root surface of transpiring plants, Plant, Cell & Environment, 6(8): 671-674. https://doi.org/10.1111/1365-3040.ep11589241
  11. Kim, J.H. and W.Y. Kim, 2013. Review of research trends on landslide hazards, The Journal of Engineering Geology, 23(3): 305-314 (in Korean with English abstract). https://doi.org/10.9720/kseg.2013.3.305
  12. Kincal, C., A. Akgun, and M.Y. Koca, 2009. Landslide susceptibility assessment in the Izmir (West Anatolia, Turkey) city center and its near vicinity by the logistic regression method, Environmental Earth Sciences, 59(4): 745-756. https://doi.org/10.1007/s12665-009-0070-0
  13. Korea Forest Service, 2013. Detailed strategy for primary policy, Korea Forest Service, Seoul, Republic of Korea, pp. 12-16 (in Korean).
  14. LeCun, Y., Y. Bengio, and G. Hinton, 2015. Deep learning, Nature, 521: 436-444. https://doi.org/10.1038/nature14539
  15. Lee, H.G. and G.H. Kim, 2012. Landslide risk assessment in Inje using logistic regression model, Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography, 30(3): 313-321. https://doi.org/10.7848/ksgpc.2012.30.3.313
  16. Lee, S., M. Lee, and J. Won, 2004. Study on landslide using GIS and remote sensing at the Kangneung area (II) - landslide susceptibility mapping and cross-validation using the probability technique, Journal of Korean Society of Economic and Environmental Geology, 37(5): 521-532
  17. Lee, S.R., M.J. Lee, and J.S. Won, 2005. Landslide Susceptibility Analysis and Vertification using Artificial Neural Network in the Kangneung Area, Economic and Environmental Geology, 38(1): 33-43. https://doi.org/10.1080/01431160701264227
  18. Lee, S., M.J. Lee, and H.S. Jung, 2017. Data mining approaches for landslide susceptibility mapping in Umyeonsan, Seoul, South Korea, Applied Sciences, 7: 683. https://doi.org/10.3390/app7070683
  19. Lee, S. and M.J. Lee, 2017. Susceptibility mapping of Umyeonsan using logistic regression (LR) model and post-validation through field investigation, Korean Journal of Remote Sensing, 33(6-2): 1047-1060. https://doi.org/10.7780/kjrs.2017.33.6.2.2
  20. Lee, S. and H.J. Oh, 2019. Landslide susceptibility prediction using evidential belief function, weight of evidence and artificial neural network models, Korean Journal of Remote Sensing, 35(2): 299-316. https://doi.org/10.7780/kjrs.2019.35.2.9
  21. Lee, S., 2019. Current and Future Status of GIS-based Landslide Susceptibility Mapping: A Literature Review, Korean Journal of Remote Sensing, 35(1): 179-193. https://doi.org/10.7780/kjrs.2019.35.1.12
  22. Lee, S., W.K. Baek, H.S. Jung, and S. Lee, 2020. Susceptibility mapping on urban landslides using deep learning approaches in mt. Umyeon, Applied Sciences, 10(22): 8189. https://doi.org/10.3390/app10228189
  23. Liu, W., Z. Wang, X. Liu, N. Zeng, Y. Liu, and F.E. Alsaadi, 2017 A survey of deep neural network architectures and their applications, Neurocomputing, 234: 11-26. https://doi.org/10.1016/j.neucom.2016.12.038
  24. Oh, H.J., 2010. Landslide Detection and Landslide Susceptibility Mapping using Aerial Photos and Artificial Neural Networks, Korean Journal of Remote Sensing, 26(1): 47-57. https://doi.org/10.7780/kjrs.2010.26.1.47
  25. Pham, B.T., I. Prakash, S.K. Singh, A. Shirzadi, H. Shahabi, and D.T. Bui, 2019. Landslide susceptibility modeling using Reduced Error Pruning Trees and different ensemble techniques: Hybrid machine learning approaches, Catena, 175: 203-218. https://doi.org/10.1016/j.catena.2018.12.018
  26. Pourghasemi, H.R., Z.T. Yansari, P. Panagos, and B. Pradhan, 2018. Analysis and evaluation of landslide susceptibility: A review on articles published during 2005-2016 (periods of 2005-2012 and 2013-2016), Arabian Journal of Geosciences, 11: 193. http://dx.doi.org/10.1007/s12517-018-3531-5
  27. Ramli, M.F., N. Yusof, M.K. Yusoff, H. Juahir, and H.Z.M. Shafri, 2010. Lineament mapping and its application in landslide hazard assessment: a review, Bulletin of Engineering Geology and the Environment, 69(2): 215-233. https://doi.org/10.1007/s10064-009-0255-5
  28. Shorten, C. and T.M. Khoshgoftaar, 2019. A survey on image data augmentation for deep learning, Journal of Big Data, 6(1): 1-48. https://doi.org/10.1186/s40537-019-0197-0
  29. Tien Bui, D., H. Shahabi, A. Shirzadi, K. Chapi, M. Alizadeh, W. Chen, A. Mohammadi, B.B. Ahmad, M. Panahi, and H. Hong, 2018. Landslide detection and susceptibility mapping by airsar data using support vector machine and index of entropy models in cameron highlands, malaysia, Remote Sensing, 10: 1527. https://doi.org/10.3390/rs10101527
  30. Urmi, R.B.R. and D.H. Jang, 2020. Life risk assessment of landslide disaster in Jinbu area using logistic regression model, Journal of The Korean Geomorphological Association, 27(2): 65-85. https://doi.org/10.16968/jkga.27.2.65
  31. Wang, Y., L. Feng, S. Li, F. Ren, and Q. Du, 2020. A hybrid model considering spatial heterogeneity for landslide susceptibility mapping in Zhejiang Province, China, Catena, 188: 104425. https://doi.org/10.1016/j.catena.2019.104425
  32. Woo, C.S., C.W. Lee, and Y. Jeong, 2008. Study on application of topographic position index for prediction of the landslide occurrence, Journal of the Korean Society of Environmental Restoration Technology, 11(2): 1-9.
  33. Yaa'cob, N., Z.N.A. Abd Rashid, N. Tajudin, and M. Kassim, 2020. Landslide possibilities using remote sensing and geographical information system (GIS), Proc. of 10th IGRSM International Conference and Exhibition on Geospatial & Remote Sensing, Kuala Lumpur, Malaysia, Oct. 20-21, vol. 540, pp. 1-10. https://doi.org/10.1088/1755-1315/540/1/012084