DOI QR코드

DOI QR Code

An Artificial Intelligence Approach to Waterbody Detection of the Agricultural Reservoirs in South Korea Using Sentinel-1 SAR Images

Sentinel-1 SAR 영상과 AI 기법을 이용한 국내 중소규모 농업저수지의 수표면적 산출

  • Choi, Soyeon (Department of Spatial Information Engineering, Division of Earth Environmental System Science, Pukyong National University) ;
  • Youn, Youjeong (Department of Spatial Information Engineering, Division of Earth Environmental System Science, Pukyong National University) ;
  • Kang, Jonggu (Department of Spatial Information Engineering, Division of Earth Environmental System Science, Pukyong National University) ;
  • Park, Ganghyun (Department of Spatial Information Engineering, Division of Earth Environmental System Science, Pukyong National University) ;
  • Kim, Geunah (Department of Spatial Information Engineering, Division of Earth Environmental System Science, Pukyong National University) ;
  • Lee, Seulchan (Department of Water Resources, Sungkyunkwan University) ;
  • Choi, Minha (Department of Water Resources, Sungkyunkwan University) ;
  • Jeong, Hagyu (Disaster Information Research Division, National Disaster Management Research Institute) ;
  • Lee, Yangwon (Department of Spatial Information Engineering, Division of Earth Environmental System Science, Pukyong National University)
  • 최소연 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공) ;
  • 윤유정 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공) ;
  • 강종구 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공) ;
  • 박강현 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공) ;
  • 김근아 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공) ;
  • 이슬찬 (성균관대학교 수자원학과) ;
  • 최민하 (성균관대학교 수자원학과) ;
  • 정하규 (국립재난안전연구원 재난정보연구실) ;
  • 이양원 (부경대학교 지구환경시스템과학부 공간정보시스템공학전공)
  • Received : 2022.10.11
  • Accepted : 2022.10.24
  • Published : 2022.10.31

Abstract

Agricultural reservoirs are an important water resource nationwide and vulnerable to abnormal climate effects such as drought caused by climate change. Therefore, it is required enhanced management for appropriate operation. Although water-level tracking is necessary through continuous monitoring, it is challenging to measure and observe on-site due to practical problems. This study presents an objective comparison between multiple AI models for water-body extraction using radar images that have the advantages of wide coverage, and frequent revisit time. The proposed methods in this study used Sentinel-1 Synthetic Aperture Radar (SAR) images, and unlike common methods of water extraction based on optical images, they are suitable for long-term monitoring because they are less affected by the weather conditions. We built four AI models such as Support Vector Machine (SVM), Random Forest (RF), Artificial Neural Network (ANN), and Automated Machine Learning (AutoML) using drone images, sentinel-1 SAR and DSM data. There are total of 22 reservoirs of less than 1 million tons for the study, including small and medium-sized reservoirs with an effective storage capacity of less than 300,000 tons. 45 images from 22 reservoirs were used for model training and verification, and the results show that the AutoML model was 0.01 to 0.03 better in the water Intersection over Union (IoU) than the other three models, with Accuracy=0.92 and mIoU=0.81 in a test. As the result, AutoML performed as well as the classical machine learning methods and it is expected that the applicability of the water-body extraction technique by AutoML to monitor reservoirs automatically.

농업용 저수지는 전국적으로 중요한 수자원으로 기후변화에 따른 가뭄과 같은 이상기후의 영향에 취약한 특성을 가지며 적절한 운영을 위해 강화된 관리가 필요하다. 지속적인 모니터링을 통한 수위 추적(water level tracking)이 필요하지만 현실적인 문제로 현장 실측 및 관측이 어려운 실정이다. 본 연구는 저수지 수표면적을 측정하기 위해 광역 모니터링이 가능한 위성레이더 자료를 이용하여 4가지 AI 모델 간의 수체 탐지 성능에 대해 객관적인 비교를 제시한다. 위성 레이더자료는 Sentinel-1 SAR 이미지를 사용하였으며, 광학영상과 달리 기상환경에 영향을 적게 받기 때문에 장기 모니터링에 적합하다. 드론 이미지, Sentinel-1 SAR 그리고 DSM 데이터를 사용하여 Support Vector Machine (SVM), Random Forest (RF), Artificial Neural Network (ANN), Automated Machine Learning (AutoML)의 4가지 AI 모델을 구축했다. 연구대상 저수지는 총 22개소로 유효저수량이 30만톤 미만의 중소형 저수지이다. 총 45개 이미지가 모델 훈련과 검증에 사용되었으며, 연구 결과 AutoML 모델이 Accuracy=0.92, mIoU=0.81로 다른 3가지 모델에 비해 수체 픽셀 분류에서 0.01-0.03 더 나은 것을 보여주었다. 해당 결과는 SAR 영상으로부터 AutoML을 이용한 중소형 저수지 대상의 수체 분류 기법이 기존의 머신러닝 기법만큼의 성능을 보이는 것을 보여주었고, 학습을 통한 수표면적 분류 기술의 저수지 모니터링에 대한 적용 가능성을 보여주었다.

Keywords

1. 서론

지형적으로 한국 국토의 약 70%가 산지이며 강우의 유출이 빨라 토지의 보수력이 낮기 때문에 농업용수의 주수원공인 저수지는 중요한 수자원의 하나이다. 농업저수지는 상류 유출량을 저장하여 관개지구에 공급해주는 역할을 하고 나머지는 하천으로 방류되어 하류 유출량에도 영향을 주며, 저수지의 수위 및 저장능력에 따라 농업용수 공급의 기능과 가뭄 및 홍수 예방의 역할을 하므로, 농업 저수지의 보존과 원활한 운영을 위해 저수위 및 저수량의 자료를 확보하고 분석하는 것이 필수적이다(Jeong et al., 2021).

우리나라에는 전국적으로 약 18,000여개의 저수지가 있지만 공사 및 지자체에 관리하에 있는 저수지는 한정적이며 그 외 저수지들의 수위나 저수량 관측은 매우 제한적이다(Jang, 2011). 저수지 상당수가 자동계측시설이 아닌 현장 관측을 통해 수위 및 저수량 관리가 수행되고 있으며 실질적으로 장기간의 연속적인 관측이 어렵다고 보이며 이는 가뭄이나 홍수 등의 위험 상황뿐만 아니라 평상시에도 정확한 저수량을 파악하는 것에 한계를 보여준다. 더욱이 전 지구적인 기후변화로 인해 지구온난화가 가속화되며, 전세계적으로 연평균 온도 상승과 지표수 온도 상승을 겪고 있으며 그에 따른 가뭄의 심도와 기간이 증가하고 있다(Helfer et al., 2012; Nam et al., 2014). 가뭄은 기상학적 가뭄, 농업적 가뭄, 수문학적 가뭄으로 분류되며, 기상학적 가뭄인 무강수 기간이 길어지면서 농업용수 부족을 유발하는 농업적 가뭄 그리고 저수지와 하천의 수위가 저하되어 생활용수 공급에도 어려움이 생기는 수문학적 가뭄으로 전이하며 발달한다(Byun, 2009). 한반도의 기후 특성상 강수가 지역 및 계절별로 편중되어 나타나 매년 국지적 및 계절적 가뭄, 그리고 6년 주기의 극한 가뭄이 발생하고 있다(Lee et al., 2012). 대부분의 가뭄이 지류 또는 상류의 소규모 용수공급시설이 위치한 지역에서 주로 발생하며, 유역 상류의 경우는 물의 빠른 배출로 인하여 장기 가뭄 시유량이 급격히 줄어드는 등 가뭄에 취약한 특성을 보이지만 실질적인 현장 관리가 어려운 실정이다(Lee et al., 2022). 현장 관측의 번거로움과 현장 조사 수준에 따라 수위계측이 실제와 오차가 생길 수 있는 관측의 단점을 보완할 수 있는 대안책으로 광범위한 지역을 동시에 촬영이 가능한 위성영상을 이용하여 저수면적을 추출하고 추출된 면적으로 저수량을 구하는 기술을 개발하는 것이다.

Synthetic Aperture Radar (SAR) 영상을 이용한 수체를 탐지하고 그 면적을 구하려는 연구가 다수 수행되고있다. SAR 영상을 이용한 수체 탐지 기법은 위성의 레이더에 방출된 마이크로파가 지표면에서 반사된 후방산란계수를 이용하여 수표면적을 추출하는 원리로 구름, 눈과 같은 기상현상의 영향을 적게 받기 때문에 장기간모니터링에 적합하다고 할 수 있다. Kim (2022)는 SAR 영상을 활용하여 저수지 면적을 탐지하고 Reservoir Area Drought Index (RADI)를 산정하여 지역 규모의 수문학적 가뭄 모니터링을 수행한바 있으며, 머신러닝 기법을 이용해서 SAR 영상에서 수체 탐지 및 추출하려는 연구도 진행되었다(Qin et al., 2019). 그 외에도 Sentinel-1 SAR영상을 기반으로 한 홍수 피해 범위 매핑 연구(Giustarini,2013; Lin et al., 2019) 및 광학 위성과 융합하여 수체를 추출하는 방법(Li et al., 2021) 등 SAR 영상의 특징과 여러방법들을 적용하여 수체 탐지 및 모니터링 하려는 시도가 다수 존재한다. 그러나 대부분 위성 자료의 해상도에 따라 오차에 덜 민감한 대형 저수지 혹은 하천 등에대한 측정이 주로 이루어졌으며, 중소규모 저수지에 대한 연구가 드문 편이고, 해당 연구에서도 수체 추출 결과에서 여러 요인으로 인해 오탐지 확률이 높았다(Seo et al., 2018; Lee et al., 2019).

따라서, 본 연구에서는 기상현상에 비교적 영향을 적게 받는 SAR 영상을 활용해 국내 22개 중소규모 저수지를 대상으로 4가지의 수체 탐지 모델을 제안하며, 다중 AI의 성능을 객관적으로 비교하고 저수지별 AI 모델에 따른 정확도 특성을 살펴보고자 한다. 저수면적을 판단하기 위해서 Sentinel-1의 SAR 후방산란계수 및 지표면 고도자료를 입력 자료로 설정하였으며, 사용된 AI모델은 Support Vector Machine (SVM), Random Forest (RF)와 같은 머신러닝 모델과 Artificial Neural Network (ANN) 신경망 모델, 그리고 Automated Machine Learning (AutoML)을 포함한다. 해당 모델의 정확도 및 성능평가를 위해서 위성 촬영 날짜와 근접한 항공위성 자료를 실측 자료로 사용하였으며 이를 통해 인공지능을 이용하여 저수지수표면적 분석 정확도 개선 및 모니터링 기술 기반 구축에 적용할 수 있는 가능성을 확인하고자 한다.

2. 자료 및 방법

1) 연구 지역

우리나라 농업용 저수지는 총 약 18,000개소로 이 중 총 저수용량 30만 톤 미만의 중소규모 저수지는 약 17,000개소로 약 93%를 차지하고 있다. 농업용 저수지의 경우 한국농어촌공사가 3,356개소(19.1%), 지방자치단체가 14,175개소(80.9%)를 관리하고 있으며, 대다수의 중소규모 저수지가 미처 관리대상에 포함되지 않은 경우가 존재한다(Shin and Lee, 2012). 본 연구에서는 전국 저수지 수표면적 모니터링 체계 구축을 위한 기초 연구 단계로 국내 중소규모의 미계측 저수지와 공사관리 계측 저수지 22곳을 선정하였다(Fig. 1). 저수지들의 제원은 Table 1과 같다.

OGCSBN_2022_v38n5_3_925_f0001.png 이미지

Fig. 1. Study areas of (a) Location of study area and reservoirs, (b) Bonghwang, and (c) Drone Image.

Table 1. Specifications of observed reservoirs (KRCC, 2021)

OGCSBN_2022_v38n5_3_925_t0001.png 이미지

- : 미계측 저수지

2) 데이터

Fig. 2는 본 연구에 사용된 데이터 및 모델들을 나타낸다. 4가지 AI 모델들(SVM, RF, ANN, AutoML)은 Senitnel-1 위성의 SAR 영상의 Vertical-Vertical (VV) copolarization, Vertical-Horizonal (VH) cross-polarization, Incidence Angle (IA), Digital Surface Model (DSM)을 입력자료로 사용한다. Sentinel-1은 European Space Agency(ESA)에서 운영하는 다목적 위성으로 C-밴드(5.405 GHz)의 Sentinel-1A와 Sentinel-1B 두 개의 위성으로 운용되고 있으며 자료 획득 모드에 따라 Strip Map (SM), Interferometric Wide (IW) Swath, Extra-Wide (EW) Swath, Wave (WV)의 4가지 모드로 구분된다. SAR 위성의 주요 목적은 주야간, 역광 등 일조현상에 상관없이 모든 기상 조건에서 전처후로 광범위한 지역에 대한 주기적인 모니터링을 하는 것이다(Geudtner et al., 2014). Sentinel-1 위성은 이중 편광 기능(HH, VV, HH + HV, VV + VH)을 갖추고 있어 4가지의 편파 영상이 제공되며, 6~12일의 시간해상도와 10 m, 25 m, 40 m의 공간 해상도를 제공한다. 본 연구에서는 구글 어스 엔진(Google Earth Engine, GEE)에서 제공하는 IW 모드의 Ground Range Detected (GRD) 레벨 1자료를 사용하여 Sentinel-1의 SAR 영상을 수집하였다. DSM은 건물, 나무 등과 같은 인공 및 자연 물체를 포함한 지구 표면의 높이 정보를 나타낸다. 디지털 표면 모델은 수문학 분야에서 침수 지역의 수면 표고 추정 및 수역 분류 등에 사용되며 해당값이 지역적 변화를 고려하여 수체와 비수체를 구별하는 데 사용될 수 있다(Puttinaovarat et al., 2015). SAR 영상의 그림자 효과 제거 및 더 정확한 분류 효과를 주기 위해서 추가적으로 DSM 자료를 활용하였으며, 모델 평가 및 검증을 위해 재난안전연구원에서 제공받은 연구 대상 저수지의 항공 영상 자료를 사용하였다.

OGCSBN_2022_v38n5_3_925_f0002.png 이미지

Fig. 2. Summary of the data used in this study. Input variables were the satellite data such as VV, VH polarization, Incidence Angle (IA), Digital Surface Models (DSM) and the in-situ observations from drone Images.

Table 2. Date used in this study

OGCSBN_2022_v38n5_3_925_t0002.png 이미지

OGCSBN_2022_v38n5_3_925_t0003.png 이미지

3) 입력 데이터 전처리

SAR 영상에서 추출할 수 있는 입력자료는 후방산란계수(backscattering coefficient, [dB])이다(Jang et al., 2011). SAR 원본 영상은 스페클 노이즈(speckle noise)가 심해이미지를 그대로 사용하게 되면 분류 정확도에 영향을 미친다. 수표면적 분류를 용이하게 하기 위해 필수적인 전처리 과정은 궤도 보정(apply orbit file), 노이즈 제거(noise removal), 방사보정(radiometric calibration)과 지형 보정(terrain correction)의 단계를 포함하고 있으며, GEE에서는 위 과정을 수행한 Sentinel-1 GRD 자료를 제공한다(Filipponi, 2019; Mullissa et al., 2021). 본 연구에 사용된 SAR 영상은 리 필터(Lee Filter)를 이용하여 speckle filtering을 추가적으로 수행하여 불규칙한 노이즈들을 제거하였으며 저수지별로 수체(저수지 영역)과 비수체(저수지 외 영역)의 비율이 한 쪽에 치우치지 않도록 Region of Interest (ROI)를 선택하여 크롭(crop)하였다.

DSM을 입력 자료로 사용하기 위해서 ALOS Global Digital Surface Model의 “ALOSWorld 3D – 30 m” 자료를 다운로드 받았다 . DSM은 JAXA Earth Observation Research Center에서 무료로 제공하고 있으며, 해상도는 30 m이고 2006년부터 2011년까지 데이터셋 이용이 가능하다. ALOS DSM 데이터는 산의 그림자가 수체로 오탐지되는 것을 방지하고(Chen and Zhao, 2022) 일반적으로 저수지와 같은 수체는 주변보다 낮은 위치에 존재하기 때문에, 해당 정보를 이용하여 수체의 존재 확률을 결정할 수 있다(Jeon et al., 2020). Sentinel-1 크기와 동일한 사이즈로 10 m 해상도로 리샘플링(resampling) 하였고 R 프로그램을 통해서 좌표참조계를 epsg: 4326으로 재투영(reprojection) 하였다.

위성 영상을 통해 추정된 저수면적은 드론 촬영을 통해 검증 방안을 마련하였다. 실제 위성 영상이 촬영하는 날짜 혹은 1~2일 간격으로 드론 촬영을 실시하였다. 정사영상으로 제작된 연구대상 저수지의 현장관측 영상을 Senitnel-1의 해상도(10 m)와 동일하게 맞추기 위해 재투영 과정과 10 m 해상도 리샘플링 과정을 거쳐 화소형태의 GeoTiff 파일을 생성하였고 실측 수표면적 데이터셋을 구축하였다.

저수지당 Sentinle-1의 VV, VH 후방산란계수와 DSM의 지형정보자료를 픽셀별로 제작하였고 총 22개 저수지에 대한 45개의 영상을 랜덤하게 8:2 비율로 훈련과 검증용 2개 그룹으로 나누었으며, 수체 10,615 픽셀과 비수체 30,823 픽셀, 총 41,438 픽셀이 모델 훈련에 사용되었으며, 수체 1,804 픽셀과 비수체 4,624픽셀의 총 6,428 픽셀이 모델 검증에 사용되었다.

4) 인공지능 모델

(1) Support Vector Machine

SVM은 통계적 학습 이론에 기반한 기계 학습 알고리즘으로, 필요한 훈련 샘플의 수가 적고 비선형적인 문제도 고차원 공간을 통해 분류가 가능하기 때문에 원격탐사 이미지 분류에서 많이 사용되고 있다(Mountrakis et al., 2011). SVM은 최적의 분류를 위해 다항식 및 가우스 함수와 같은 비선형 커널함수를 사용하여 데이터그룹 간의 마진을 최대화하는 초평면(Maxium Margin Hyperplane, MMH)을 설정한다. 본 연구에서는 Python의 scikit-learn 라이브러리를 사용하였고 비선형 MMH에 대해 Gaussian Radial-basis Function (RBF) 커널을 사용하여 초매개변수 cost와 gamma를 최적화하였다.

(2) Random Forest

RF는 무작위 샘플에서 파생된 다수의 의사결정나무(decision tree)를 활용하는 앙상블 기법이다. RF 또한 분류 정확도가 높은 편으로 원격 탐사에서 이미지 분류에 많이 사용되고 있다(Mariana and Lucian, 2016). RF는 필요한 경우 샘플 분포를 고려하여 리샘플링을 위한 부트스트랩(bootstrap) 프로세스가 수행된다. 배깅(bagging)은 각 트리의 부트스트랩 결과의 집계를 통해 최종 모델을 생성한다(Pal, 2005). 본 연구에서는 Python scikit-learn 라이브러리의 RandomizedSearch (Paper, 2020) 기능을 사용해서 초매개변수 최적화를 하였다.

(3) Artificial Neural Network

ANN은 다층퍼셉트론(Multi-Layer Perceptron, MLP)이라고 하며 설명변수를 위한 입력 레이어(input layer)와 비선형 계산을 위한 여러 은닉 레이어(hidden layer) 그리고 결과를 산출하는 출력 레이어(output layer)로 구성된다. ANN은 분류 정확도를 향상시키기 위해 학습시 출력값과 실제값의 오차가 최소화되도록 초매개변수 최적화를 수행하여 가중치(weight)와 바이어스(bias)를 조정한다(Mas and Flores, 2008). Python scikit-learn 라이브러리 중GridSearch (Liashchynskyi and Liashchynskyi, 2019) 기능을 사용해서 히든유닛 수, 반복학습 수 등의 주요 초매개변수를 최적화하였다.

(4) Automated Machine Learning

AutoML은 데이터 추출, 훈련 및 초매개변수 최적화(Hyperparameter Optimization, HPO) 및 신경망 아키텍처 탐색(Neural Architecture Search, NAS)과 같은 주요 프로세스를 자동화하는 모델이다(Jin et al., 2019). RF, Gradient Boosting Machine (GBM), Deep Neural Network (DNN)등 복수의 모델에 대해 다양한 초매개변수를 설정하여구동 시키고, 상위 N개 모델에 대한 앙상블을 통해 가장 성능이 우수한 모델을 선별하는 자동화 프로세스이다. Python에서 AutoKeras 라이브러리를 사용하였으며, 모델 구조는 Fig. 3과 같다. 각 모델에 사용된 라이브러리와 초매개변수 설정 방법에 대한 요약은 Table 3과 같다.

Table 3. Hyperparameters and libraries used for the four AI models in this study

OGCSBN_2022_v38n5_3_925_t0004.png 이미지

SVM: Support Vector Machine, RF: Random Forest, ANN: Artificial Neural Network, AutoML: Automated Machine Learning.

OGCSBN_2022_v38n5_3_925_f0003.png 이미지

Fig. 3. An overview of AutoML pipeline covering with 4 sections (Data Preparation, Feature Engineering, Model generation and Model evaluation) (He et al., 2021).

(5) 모델 평가

일반적으로 학습 속도의 향상과 손실함수(loss function)의 최적화를 위해서 입력 자료의 각기 다른 스케일을 일정한 범위로 변환하는 정규화 과정이 필요하다(Jeon et al., 2020). Sentinel-1의 VV, VH 후방산란계수 및 DSM으로 입력 데이터를 생성할 때 3가지 데이터 간에 단위가 일치하지 않기 때문에 표준화식(standardization)을 이용해 다수의 특징에 대한 기준을 생성하고 기준을 중심으로 데이터들의 범위를 통일시켰다. Z-score 정규화는 가장 기본적인 방법으로 입력 자료가 정규 분포일 때 평균과 표준편차를 0과 1로 변환하는 것이다. Z-score와 동일한 표준화식을 입력 자료에 적용하였다.

\(\begin{aligned}z=\frac{x-\mu}{\sigma}\\\end{aligned}\)       (1)

Where z is Z-score normalized data, μ and σ are the mean and standard deviation of x

실측 자료인 드론 이미지로부터 만들어진 레이블 영상과 예측 영상을 이용하여 true positive (TP), true negative(TN), false positive (FP), false negative (FN)로 구성되어있는 혼동행렬(confusion matrix)을 생성하고, 정확도(Accuracy), 정밀도(Precision), 재현율(Recall), F1-score, Intersection over Union (IoU)를 산출하였다. Accuracy는 예측된 모든 화소와 레이블 영상과 동일한 화소의 비율을 의미하며, Precision은 분류된 클래스(수체, 비수체)의 화소 중에서 정답 화소의 비율을 의미한다. Recall은 레이블 영상에서의 정답 화소 비율이며, F1-score는 Precision과 Recall의 조화평균(harmonic mean)으로 계산한다. IoU는 레이블 영상과 예측 영상의 합집합 영역에 대한 교집합 영역의 면적비로 구한다(Kang et al., 2021).

\(\begin{aligned}Accuracy=\frac{T P+T N}{T P+T N+F P+F N}\\\end{aligned}\)       (2)

\(\begin{aligned}Precision=\frac{T P}{T P+F P}\\\end{aligned}\)       (3)

\(\begin{aligned}Recall=\frac{T P+T N}{T P+F N}\\\end{aligned}\)       (4)

\(\begin{aligned}F1-score=\frac{2T P}{2T P+F P+F N}\\\end{aligned}\)       (5)

\(\begin{aligned}IoU=\frac{T P}{T P+F N+F P}\\\end{aligned}\)       (6)

3. 결과 및 고찰

1) 모델별 예측 결과 비교

Fig. 4는 본 연구에 사용된 4가지 모델로부터 학습을 통해 생성된 최적의 알고리즘으로부터 수체 탐지 결과에 대한 혼동행렬을 보여준다. 검증에 사용된 데이터는 총 45개 저수지 영상 중 6개 저수지(BH, CR, DD, DG, DI, ER)가 랜덤하게 선택되었다. 모델 정확도는 SVM, RF, ANN 그리고 AutoML 순으로 0.91, 0.91, 0.91, 0.92로 전체 모델이 0.9 이상으로 상당히 높은 정확도를 보였으며 정밀도, 재현율 등의 성능 평가 지표들 값이 모델별 0.01~0.03 정도 차이가 났으며, 예측 결과도 비슷한 양상을 보였다. AutoML은 각 클래스의 IoU 값을 평균한 mIOU가 0.81을 가지며 수체 픽셀에 대한 IoU가 0.72로 앞의 세 모델에 비해 수체 픽셀 탐지 성능이 0.01–0.03 정도로 높게 나타났지만, 모델 훈련에 쓰인 데이터셋의 양이 많지 않기 때문에 성능적으로 유의미한 큰 차이는 없었다.

OGCSBN_2022_v38n5_3_925_f0004.png 이미지

Fig. 4. Confusion matrix of (a) SVM, (b) RF, (c) ANN, and (d) AutoML.

본 연구에 사용된 4가지 모델은 수체 분류에 있어서 유사한 성능을 보였다. 그러나 AutoML의 사용자 친화적인 특징은 기존의 머신러닝 알고리즘과 신경망에 비해 여러 이점을 제공한다. 머신러닝 및 신경망 모델의 성능을 향상시키기 위해서는 입력 데이터 문제에 최적화된 모델과 초매개변수를 찾아내는 것이 필요하며 이는 사용자의 숙련도에 따라 시간과 비용적인 면에서 상당히 오래 걸리는 작업이기도 하다(Sun et al., 2019). AutoML 프레임워크는 전처리, 초매개변수 조정 및 모델 생성을 통해 입력 데이터에서 모델 평가까지의 자동화된 데이터 파이프라인을 구축한다. 생성 가능한 모델은 고전적인 머신러닝 모델(SVM, RF etc.)부터 Deep Neural Network (DNN) 구조의 모델 생성이 가능하고, 해당 모델의 초매개변수를 자동적으로 탐색하여 파이프라인을 구성할 수 있다(Daun, 2022). 즉, 수표면적 분류 시 지정된 횟수 만큼 반복 계산을 통해 모델 탐색을 수행하며 이 과정을 통해 주어진 입력 데이터에 적합한 수체 분류 모델을 구현하고 초매개변수 최적화를 하기 때문에 AutoML이 본 연구의 수체 탐지 문제에 있어서 정확도와 시간 효율성 측면에 있어서 효과적인 모델임을 확인할 수 있다.

Table 4. Prediction results of four models (SVM, RF, ANN, and AutoML) across the six reservoirs

OGCSBN_2022_v38n5_3_925_t0005.png 이미지

2) Senitnel-1 SAR 영상을 이용한 중소규모 저수지 탐지의 한계점

SAR 영상으로부터 분류한 수표와 레이블 자료와의 상관관계가 0.76 이상이며, 정확도도 0.91 이상으로 나타났지만, 예측 이미지 확인 결과 미계측, 오탐지 등의 극복해야 하는 기술적 문제들이 존재함을 확인했다. 저수지 예측 결과 비교 시(Fig. 5) 차리 저수지(CR)와 같은 유효저수량 8,66,000 m3, 유역면적이 300 ha (1 ha = 10,000 m2) 이상의 중소규모 저수지 중에서도 대형 저수지에 해당하는 정점은 미탐지 및 오탐지 부분이 존재하긴 하나 상대적으로 나머지 정점들에 비해 레이블 영상과 유사하게 나타났다. 반면에 유효저수량 33,000 m3, 유역면적 6 ha 정도의 소규모에 해당하는 분황 저수지(BH)의 경우, 예측 결과가 저수지 영역 안에서 미탐지 경향이 높았고 주변의 비수체 영역에서는 오탐지가 상당부분 발생하였다. 특히나 저수지에서 뻗어 나오는 작은 도랑이나 줄기 형태의 물 웅덩이를 본 모델에서 탐지하지 못한 곳이 상당 부분 발견되었다.

OGCSBN_2022_v38n5_3_925_f0005.png 이미지

Fig. 5. Comparison of water-body extraction results for 4 models at each of the 6 test sites.

후방산란을 이용하는 레이더의 특성상 바람에 의한 파랑, 수풀, 부유물 등 매끈하지 않은 수표면의 영향으로 정확한 값을 받지 못할 경우가 있다. 수체와 같은 매끄러운 면은 산란이 적어 후방산란계수가 낮게 나오지만 바람에 의한 파랑 혹은 강우에 의한 수표면 타격 등으로 인해 거친 표면이 형성되면 후방산란계수에 영향을 주며 평소보다 높은 값을 기록하게 된다. 또한 식생도 계절과 저수위의 변동에 따라 움직이거나 저수지 경계부근에 식물이 자라서 불분명한 영상 경계를 형성하고 수표면적 추출에 방해가 된다. 특히 식물 혹은 표층에서 식물플랑크톤이 번성하는 봄에서 여름 시즌에 이러한 영향을 크게 받는다(Jang et al., 2011). 그리고 저수지 주변의 논밭, 도로 등의 구조물도 명확한 경계 구분을 방해하는 요소로 작용할 수 있다. 본 연구의 중소규모 저수지 정점들은 상당수가 논밭 지역 중심 혹은 근처에 위치하여 관계용수로 사용되고 있는 주수원 및 보조수원 저수지들로, 주변 도로, 논밭 및 도랑 등의 영향을 받은 것으로 보인다. 저수지 외 영역의 탐지는 모델의 과탐지율을 높이고 본 연구에서 불필요한 영역이므로 마스킹(Masking) 처리를 통해 주변 지역을 제거하는 방식을 이용하거나 저수지와 배경 영역의 특성을 이용해 구역을 구분하는 후처리 등을 추가적으로 적용하면 과탐지 경향을 제한할 수 있을 것으로 보인다(Bai et al.,2016).

다음으로는 사용된 Sentinel-1 영상의 낮은 공간해상도에서 문제를 찾을 수 있다. Sentinel-1의 해상도는 10m로 상당히 고해상도 영상이긴 하나 중소규모 저수지 크기에 비해 크기 때문에 안정적인 탐지가 어렵다. 분황 저수지 같은 소규모 저수지 특히, 50,000 m2 이하의 저수면적을 가지는 저수지의 경우 만수면적 기준 약 100개 내외의 픽셀로 나타나며 해당 픽셀 개수로는 Sentinel-1 위성영상 분석을 통한 판독이 어려운 것으로 나타났다. 해상도 문제에 관련해서 1 m급 해상도를 가진 고해상도 SAR 영상을 추가적으로 이용하거나 광학영상의 Normalized Difference Water Index (NDWI)와 같은 지수식을 이용하면 규모가 작은 저수지에서의 미탐지 및 오탐지율을 어느 정도 제어할 수 있을 것으로 보인다(Li et al., 2021).

4. 결론

SAR 위성영상은 주간 및 야간, 그리고 악천후에서도 사용할 수 있다는 장점을 가지고 있으며, 본 연구에서는 AI 모델별 Sentinel-1의 C밴드 SAR 영상을 이용하여 저수지 수체 탐지 알고리즘 성능간 객관적인 비교를 제시하였다. 사용된 AI 모델은 SVM, RF, ANN과 AutoML로 초매개변수 설정을 통해 분류 문제에 대해 최적의 모델을 구현하고 실측 자료를 통해 그 결과를 평가하였다. 연구지역 저수지는 총 22곳으로 공사 관리 저수지와 미계측 저수지를 포함하며, 유효저수량이 30만 톤 미만의 중소규모 농업용 저수지에 해당한다. 각 모델의 상관관계는 0.75 이상으로 나타났으며 모델 정확도는 0.90 이상을 보였다. 제시된 모델 중 AutoML은 정확도 0.92 및 mIoU 0.81 이상으로 상당히 우수한 성능을 보여주었다. 그러나 실제 탐지 영상을 확인해봤을 때 오탐지와 미탐지 영역이 다수 분포하여 실질적으로 저수지의 수체면적 측정에 적용하기에는 몇 가지 기술적 뒷받침이 준비되어야 함을 보여주었다. 본 연구에서 첫 번째로 개선이 필요한 점은 저수지 크기에 맞는 위성 영상을 확보하는 것이다. Senitnel-1은 10 m 해상도를 가지며 무료로 데이터를 접근할 수 있다는 장점이 있지만, 중소규모 저수지를 탐지하기에는 부족하였다. 이와 관련해서 다른 위성영상을 사용하는 추가적인 방안이 고려될 수 있는데, 주파수가 다른 SAR 영상을 같이 사용하는 방법 및 광학 영상과 융합하는 기술 등을 적용할 수 있을 것으로 본다. 그 외에도 학습을 통한 수표면 분류의 정확도를 향상시키기 위해서 충분한 양의 레이블 영상의 확보가 필요할 것으로 보인다.

또한, 영상 학습에 있어서 좀 더 고차원적인 접근을 위해 Convolution Neural Network (CNN) 기반의 딥러닝(deep learning) 알고리즘을 적용해 볼 수 있다. U-Net, DeepLab 등과 같은 CNN 기반의 의미론적 분할(semantic segmentation) 방법을 수체 탐지 문제에 적용한 연구가 다수 존재하며, 그 결과도 기존 머신러닝 기법에 비해 향상된 것을 확인할 수 있다(Mahdianpari et al., 2018;Merchant, 2020). 향후 딥러닝 기반의 영상 인식 모델을 구축한 후 동일한 데이터셋을 사용하여 탐지 및 평가할 예정이다. 이를 통해 저수지 수체 탐지 정확도가 향상될 것으로 사료된다.

사사

본 연구는 행정안전부 국립재난안전연구원의 지원(위성레이더 자료를 이용한 수표면적 분석정확도 개선 기술 개발, NDMI-주요-2022-03-03)에 의해 수행되었습니다. 이에 감사드립니다.

References

  1. Bai, T., D. Li, K. Sun, Y. Chen, and W. Li, 2016. Cloud detection for high-resolution satellite imagery using machine learning and multi-feature fusion, Remote Sensing, 8(9): 715. https://doi.org/10.3390/rs8090715
  2. Byun, H.R., 2009. Comparative analysis of the drought diagnosis and related systems, Journal of the Korean Society of Hazard Mitigation, 9: 7-18.
  3. Chen, Z. and S. Zhao, 2022. Automatic monitoring of surface water dynamics using Sentinel-1 and Sentinel-2 data with Google Earth Engine, International Journal of Applied Earth Observation and Geoinformation, 113: 103010. https://doi.org/10.1016/j.jag.2022.103010
  4. Duan, S., 2022. AutoML-Based Drought Forecast with Meteorological Variables, arXiv preprint arXiv: 2207.07012. https://doi.org/10.48550/arXiv.2207.07012
  5. Filipponi, F., 2019. Sentinel-1 GRD preprocessing workflow. Proceedings, 18(1): 11. https://doi.org/10.3390/ECRS-3-06201
  6. Geudtner, D., R. Torres, P. Snoeij, M. Davidson, and B. Rommen, 2014. Sentinel-1 system capabilities and applications, Proc. of 2014 IEEE Geoscience and Remote Sensing Symposium, Quebec City, QC, Jul. 13-18, pp. 1457-1460. https://doi.org/10.1109/IGARSS.2014.6946711
  7. Giustarini, L., R. Hostache, P. Matgen, G.J. Schumann, P.D. Bates, and D.C. Mason, 2013. A change detection approach to flood mapping in urban areas using TerraSAR-X, IEEE Transactions on Geoscience and Remote Sensing, 51: 2417-2430. https://doi.org/10.1109/TGRS.2012.2210901
  8. He, X., K. Zhao, and X. Chu, 2021. AutoML: A survey of the state-of-the-art, Knowledge-Based Systems, 212: 106622. https://doi.org/10.1016/j.knosys.2020.106622
  9. Helfer, F., C. Lemckert, and H. Zhang, 2012. Impacts of climate change on temperature and evaporation from a large reservoir in Australia, Journal of Hydrology, 475: 365-378. https://doi.org/10.1016/j.jhydrol.2012.10.008
  10. Jang, M.W., H.J. Lee, L.H. Kim, and S.Y. Hong, 2011. Applicability of satellite SAR imagery for estimating reservoir storage, Journal of the Korean Society of Agricultural Engineers, 53(6): 7-16. https://doi.org/10.5389/KSAE.2011.53.6.007
  11. Jeon, E.I., S.H. Kim, B.S. Kim, K.H. Park, and O.I. Choi, 2020. Semantic segmentation of drone imagery using deep learning for seagrass habitat monitoring, Korean Journal of Remote Sensing, 36(2-1): 199-215. https://doi.org/10.7780/kjrs.2020.36.2.1.8
  12. Jeon, H., D.J. Kim, J. Kim, S.K.P. Vadivel, J. Kim, T. Kim, and S. Jeong, 2020. Selection of optimal band combination for machine learning-based water body extraction using SAR satellite images, Journal of the Korean Association of Geographic Information Studies, 23(3): 120-131. https://doi.org/10.11108/kagis.2020.23.3.120
  13. Jeong, J.H., S.C. Oh, S.C. Lee, J.Y. Kim, and M.H. Choi, 2021. Sentinel-1 SAR image-based waterbody detection technique for estimating the water storage in agricultural reservoirs, Journal of Korea Water Resources Association, 54(7): 535-544. https://doi.org/10.3741/JKWRA.2021.54.7.535
  14. Jin, H., Q. Song, and X. Hu, 2019. Auto-Keras: An efficient neural architecture search system, Proc. of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, Anchorage, AK, Aug. 4-8, pp. 1946-1956.
  15. Kang, J., G. Kim, Y. Jeong, S. Kim, Y. Youn, S. Cho, and Y. Lee, 2021. U-Net cloud detection for the SPARCS cloud dataset from Landsat 8 images, Korean Journal of Remote Sensing, 37(5-1): 1149-1161. https://doi.org/10.7780/kjrs.2021.37.5.1.25
  16. Kim, W.Y., J.H. Jeong, and M.H. Choi, 2022. Evaluation of reservoir monitoring-based hydrological drought index using Sentinel-1 SAR waterbody detection technique, Korean Journal of Remote Sensing, 38(2): 153-166. https://doi.org/10.7780/kjrs.2022.38.2.2
  17. KRCC (Korea Rural Community Corporation), 2021. Agricultural infrastructure facility specifications Certificate, https://www.data.go.kr/data/15044342/fileData.do, Accessed on Jan. 10, 2022.
  18. Lee, D., E.J. Cheon, H. Yun, and M.H. Lee, 2019. A study on water surface detection algorithm using Sentinel-1 satellite imagery, Korean Journal of Remote Sensing, 35(5-2): 809-818. https://doi.org/10.7780/kjrs.2019.35.5.2.5
  19. Lee, J.H., J.W. Seo, and C.J. Kim, 2012. Analysis on trends, periodicities and frequencies of Korean drought using drought indices, Journal of Korea Water Resources Association, 45(1): 75-89. https://doi.org/10.3741/JKWRA.2012.45.1.75
  20. Lee, J.H., S.Y. Park, M.G. Kim, and I.M. Chung, 2021. Hydrological drought analysis and monitoring using multiple drought indices: The case of Mulrocheon watershed, KSCE Journal of Civil and Environmental Engineering Research, 41(5): 477-484. https://doi.org/10.12652/Ksce.2021.41.5.0477
  21. Li, M., L. Hong, J. Guo, and A. Zhu, 2021. Automated extraction of lake water bodies in complex geographical environments by fusing Sentinel1/2 data, Water, 14(1): 30. https://doi.org/10.3390/w14010030
  22. Liashchynskyi, P. and P. Liashchynskyi, 2019. Grid search, random search, genetic algorithm: a big comparison for NAS, arXiv preprint arXiv:1912.06059. https://arxiv.org/abs/1912.06059
  23. Lin, Y.N., S.H. Yun, A. Bhardwaj, and E.M. Hill, 2019. Urban flood detection with Sentinel-1 multitemporal synthetic aperture radar (SAR) observations in a Bayesian framework: A case study for Hurricane Matthew, Remote Sensing, 11(15): 1778. https://doi.org/10.3390/rs11151778
  24. Mariana, B. and D. Lucian, 2016. Random forest in remote sensing: A review of applications and future directions, ISPRS Journal of Photogrammetry and Remote Sensing, 114: 24-31. https://doi.org/10.1016/j.isprsjprs.2016.01.011
  25. Mas, J.F. and J.J. Flores, 2008. The application of artificial neural networks to the analysis of remotely sensed data, International Journal of Remote Sensing, 29(3): 617-663. https://doi.org/10.1080/01431160701352154
  26. Mountrakis, G., J. Im, and C. Ogole, 2011. Support vector machines in remote sensing: A review, ISPRS Journal of Photogrammetry and Remote Sensing, 66(3): 247-259. https://doi.org/10.1016/j.isprsjprs.2010.11.001
  27. Mullissa, A., A. Vollrath, C. Odongo-Braun, B. Slagter, J. Balling, Y. Gou, and J. Reiche, 2021. Sentinel-1 SAR backscatter analysis ready data preparation in Google Earth Engine, Remote Sensing, 13(10):1954. https://doi.org/10.3390/rs13101954
  28. Nam, W.H., E.M. Hong, and J.Y. Choi, 2014. Uncertainty of water supply in agricultural reservoirs considering the climate change, Journal of the Korean Society of Agricultural Engineers, 56(2): 11-23. https://doi.org/10.5389/KSAE.2014.56.2.011
  29. Pal, M., 2005. Random forest classifier for remote sensing classification. International Journal of Remote Sensing, 26(1): 217-222. https://doi.org/10.1080/01431160412331269698
  30. Paper, D., 2020. Scikit-Learn Classifier Tuning from Simple Training Sets, In: Hands-on Scikit-Learn for Machine Learning Applications, Apress, Berkeley, CA, USA, pp. 137-163. https://doi.org/10.1007/978-1-4842-5373-1_5
  31. Puttinaovarat, S., K. Khaimook, W. Polnigongit, and P. Horkaew, 2015. Robust water body extraction from Landsat imagery by using gradual assignment of water index and DSM, Proc. of 2015 IEEE International Conference on Signal and Image Processing Applications (ICSIPA), Kuala Lumpur, Malaysia, Oct. 19-21, pp. 122-126. https://doi.org/10.1109/ICSIPA.2015.7412175
  32. Seo, M.J., D.K. Kim, W. Ahmad, and J.H. Cha, 2018. Estimation of stream flow discharge using the satellite synthetic aperture radar images at the mid to small size streams, Journal of Korea Water Resources Association, 51(12): 1181-1194. https://doi.org/10.3741/JKWRA.2018.51.12.1181
  33. Shin, E.C. and J.K. Lee, 2012. Safety management improving way of small agricultural reservoir, Journal of the Korean Geosynthetics Society, 11(3): 53-58. https://doi.org/10.12814/jkgss.2012.11.3.053
  34. Sun, S., Z. Cao, H. Zhu, and J. Zhao, 2019. A survey of optimization methods from a machine learning perspective, IEEE Transactions on Cybernetics, 50(8): 3668-3681. https://doi.org/10.1109/TCYB.2019.2950779