DOI QR코드

DOI QR Code

Rainfall Intensity Estimation Using Geostationary Satellite Data Based on Machine Learning: A Case Study in the Korean Peninsula in Summer

정지 궤도 기상 위성을 이용한 기계 학습 기반 강우 강도 추정: 한반도 여름철을 대상으로

  • Shin, Yeji (Department of Urban and Environmental Engineering, Ulsan National Institute of Science and Technology) ;
  • Han, Daehyeon (Department of Urban and Environmental Engineering, Ulsan National Institute of Science and Technology) ;
  • Im, Jungho (Department of Urban and Environmental Engineering, Ulsan National Institute of Science and Technology)
  • 신예지 (울산과학기술원 도시환경공학부) ;
  • 한대현 (울산과학기술원 도시환경공학부) ;
  • 임정호 (울산과학기술원 도시환경공학부)
  • Received : 2021.10.02
  • Accepted : 2021.10.18
  • Published : 2021.10.31

Abstract

Precipitation is one of the main factors that affect water and energy cycles, and its estimation plays a very important role in securing water resources and timely responding to water disasters. Satellite-based quantitative precipitation estimation (QPE) has the advantage of covering large areas at high spatiotemporal resolution. In this study, machine learning-based rainfall intensity models were developed using Himawari-8 Advanced Himawari Imager (AHI) water vapor channel (6.7 ㎛), infrared channel (10.8 ㎛), and weather radar Column Max (CMAX) composite data based on random forest (RF). The target variables were weather radar reflectivity (dBZ) and rainfall intensity (mm/hr) converted by the Z-R relationship. The results showed that the model which learned CMAX reflectivity produced the Critical Success Index (CSI) of 0.34 and the Mean-Absolute-Error (MAE) of 4.82 mm/hr. When compared to the GeoKompsat-2 and Precipitation Estimation from Remotely Sensed Information Using Artificial Neural Networks (PERSIANN)-Cloud Classification System (CCS) rainfall intensity products, the accuracies improved by 21.73% and 10.81% for CSI, and 31.33% and 23.49% for MAE, respectively. The spatial distribution of the estimated rainfall intensity was much more similar to the radar data than the existing products.

강우 현상은 물 순환과 에너지 순환의 주요 요소 중 하나이며 강우량 추정은 수자원 확보와 수재해 예측 및 피해 감축에 매우 중요한 역할을 한다. 위성 기반 강우량 추정은 시공간적으로 고해상도인 자료를 통하여 넓은 지역을 연속적으로 감시할 수 있다는 장점이 있다. 본 연구에서는 Himawari-8 Advanced Himawari Imager(AHI) 수증기 채널(6.7 ㎛), 적외 채널(10.8 ㎛)과 기상 레이더 Column Max (CMAX) 합성장을 이용하여 기계학습 기반 정량적 강우량 추정 모델을 개발하였다. 기계학습 기법으로는 랜덤 포레스트(Random Forest, RF)를 사용하였으며 기상 레이더 반사도(dBZ)와 Z-R식으로 변환한 강우강도(mm/hr)를 타겟으로 하는 모델을 구축하여 비교하였다. 레이더 강우강도를 통해 검증하였을 때 임계성공지수(Critical Success Index, CSI)는 0.34, Mean-Absolute-Error (MAE) 4.82 mm/hr였다. GeoKompsat-2(GK-2A) 강우강도 산출물, Precipitation Estimation from Remotely Sensed Information Using Artificial Neural Networks (PERSIANN)-Cloud Classification System (CCS) 산출물과 비교하였을 때 강우 유무 분류에서 CSI 21.73%, 10.81%, 강우강도 정량적 평가에서 MAE 31.33%, 23.49% 높은 성능을 보였다. 강우량 산출물을 지도화 한 결과, 실제 강우강도 분포와 유사한 분포를 모의하여 기존 산출물 대비 높은 정확도의 강우량을 추정했다.

Keywords

1. 서론

강우 현상은 전 지구적 규모의 물 순환과 에너지 순환의 중요한 요소 중 하나이며 기후, 기상학적, 수문학적 모델의 주요 변수로써 사용되기도 한다. 정확한 강우량을 추정하는 것은 수자원을 파악하고 활용하는 것뿐만 아니라 수재해(water-related hazards) 피해를 예측하고 감소시키기 위한 전략 구축에 매우 중요한 요소이다(Kidd and Huffman, 2011; Hou et al., 2014). 한반도의 경우 1979~2013년 동안 호우로 인해 25조 원 이상의 사회경제적 손실이 발생하여(Ahn et al., 2015) 이를 감축하기 위한 정확한 강우 추정 연구의 중요성이 꾸준히 대두되어오고 있다.

강우량 추정 방법에는 여러 가지가 있다. 그 중 우량계는 지표면에 도달한 강우를 직접적으로 측정하는 기기로써 전통적이며 가장 신뢰도가 높은 자료이지만 (Huffman et al., 1997) 단일 지점의 강우 정보만 제공하여 공간적으로 연속된 강우 분포를 추정할 수 없고, 관측소가 불균일적으로 분포되어 있어 강우 패턴에 대한 정보를 제공하지 않는 한계점이 있다(Prigent, 2010). 기상 레이더는 높은 시공간 해상도(500-1000 m, 5-10분)의 수평 및 연직 강우정보를 제공하며 내륙지역뿐만 아니라 해상까지 레이더 관측 가능 영역 내 공간적으로 연속적인 정보를 제공한다(Saltikoff et al., 2019). 하지만 지형에 의해 생기는 빔 차폐 현상-지형 에코, 해면에 반사되어 나타나는 파랑 에코, 멀리 있는 목표물이 가까이에 있는 것처럼 나타나는 이착 에코 등의 문제가 발생하여 비강우를 강우로 판단하는 한계점이 존재한다(Joss et al., 1990; Germann et al., 2006; Saltikoff et al., 2019). 위성자료를 기반으로 하는 정량적 강우 추정(Quantitative precipitation estimation, QPE)은 위성이 관측할 수 있는 모든 지역에 대하여 강우 추정이 가능한 기법으로 차세대 인공위성의 넓은 관측 영역과 높은 시공간 해상도를 활용해 부족한 우량계와 기상레이더 기반의 강우 추정을 대체할 수 있는 방법으로 제안되고 있다(Prigent, 2010; Mishra et al., 2018; Sun et al., 2018).

정지궤도 기상위성을 활용한 정량적 강우량 추정은 전통적으로 적외(infrared, IR) 채널 영상의 밝기 온도 (Brightness temperature)와 강우강도 간의 비선형적 관계식을 추정한다. 미국 해양 대기청(National Oceanic and Atmospheric Administration, NOAA)에서 제공하는 A-E(Auto Estimator) 산출물은 GOES-8 적외 채널(10.7 µm)의 밝기 온도와 레이더 반사도의 비선형 회귀식을 통해 시간당 강우량(이하, 강우강도)를 계산하였고(Vicente et al., 1998), 유럽기상위성기구(European Organization for the Exploitation of Meteorological Satellites, EUMETSAT)에서는 대류운의 강우강도(Convective Rainfall Rate, CRR)를 산출하는 PGE05-CRR 모듈을 개발하여 적외 채널(6.7 µm, 10.8 µm)의 밝기 온도와 채널 간의 온도 차, 그리고 가시 채널(0.6 µm)의 반사도를 기반으로 강우 강도를 추정하고 있다(Marcos and Rodríguez, 2013). 우리나라의 정지궤도복합위성 천리안 2A호(GK-2A)도 적외 채널(6.24 µm, 8.59 µm, 11.21 µm, 12.36 µm)의 밝기 온도를 이용하여 강우강도를 추정하여 산출물로 제공(https://nmsc.kma.go.kr/)하고 있다(Chung et al., 2020).

최근에는 기계 학습을 기반으로 한 정량적 강우량 추정 연구가 활발히 이루어지고 있는데 구름 최상층 온도(could-top temperature, CTT)와 강우강도의 관계를 인공 신경망(Artificial Neural Network, ANN)으로 학습한 Precipitation Estimation from Remotely Sensed Information Using Artificial Neural Networks(PERSIANN)이 대표적인 방법이다 (Hsu et al., 1997; Sorooshian et al., 2000; Hong et al., 2004; Hong et al., 2007; Miao et al., 2015; Ashouri et al., 2015). PERSIANN 모델은 일본과 미국 플로리다반도 지역에 대해 GOES-8 적외 채널(10.2-11.2 µm) 밝기 온도와 강우강도 관계를 모의한 것이며(Hsu et al., 1997) 이후 구름 유형을 분류하고 그에 따라 강우강도를 모의하는 PERSIANN-Cloud Classification System(CCS), Global Precipitation Climatology Project(GPCP) 자료를 융합하여 개발한 PERSIANN-Climate Data Record(CDR), 수증기 채널(6.7 µm)을 추가적으로 사용하여 비강우 지역을 효율적으로 제거할 수 있는 PERSIANN-Stacked Denoising Autoencoders(SDAE), 이미지 기반의 딥러닝 기법인 Convolutional Neural Network(CNN) 기법을 활용한 PERSIANN-CNN 등 다양한 기법들이 개발되어 오고 있다(Hong et al., 2004; Ashouri et al., 2015; Tao et al., 2018; Sadeghi et al., 2019). 하지만 이들은 모두 GOES-series와 미국 지역에서 관측한 강우 자료를 사용하였으며 학습한 강우 특성이 다른 기후대의 지역과 상이하여 미국 외 지역에서 강우강도 추정 정확도가 낮아지는 한계가 있다. 최근 대만에서는 미국 외 지역에 대한 PERSIANN 기법들의 적용 연구 부족을 지적하며 Himawari-8 위성 영상과 레이더 영상 기반 강우량 자료를 이용하여 PERSIANNCNN 기법을 적용하는 연구를 진행해 자국에 특화된 PERSIANN-Central Weather Bureau(CWB) 기법을 제안하였다(Tsay et al., 2020). 해당 연구를 통해 동아시아 아열대 기후 지역에 대한 PERSIANN 기법 적용 및 정량적 강우량 추정 정확성 향상이 확인되며 한반도를 비롯한 동북아시아 영역 기후대에 대한 정량적 강우량 추정 정확성 향상을 기대할 수 있게 되었다. 하지만 한반도에서 기계학습을 활용한 정량적 강우량 추정 연구는 기상 레이더 반사도를 기반으로 한 연구가 주를 이뤄 위성 활용한 연구는 미미한 실정이며(Yu et al., 2017; Shin et al., 2019) 기존 위성 영상 기반 정량적 강우량 추정 연구에서는 한반도의 강우 특성에 따른 연구의 필요성을 제시해 오고 있다(Choi et al., 2018).

따라서, 본 연구에서는 한반도의 강우 특성을 반영한 정량적 강우 강도 추정 기법을 제안하고자 한다. 정지궤도 기상위성 Himawari-8의 고해상도 영상 자료와 한국 기상청에서 제공하는 기상 레이더 관측 값을 강우 강도로 변환하여 사용하였으며 기계학습 기법을 기반으로 강우 강도를 직접 산출하는 모델과 레이더 반사도를 추정하여 검증된 레이더 반사도-강우 강도 관계식을 통해 강우 강도를 산출하는 모델을 구축하여 정확도를 비교하였다. 이는 기상 레이더 반사도 값을 강우 강도로 변환할 때 강우 구름의 특징에 따라 관계식의 계수가 다름을 고려한 것으로 레이더 반사도 추정 정확도가 높을 경우 차후 모델을 통해 산출한 레이더 반사도에 다양한 관계식 적용 가능성을 보기 위함이다. 개발된 모델로 산출한 강우 강도 산출물은 한반도 여름철 강우 사례에 대하여 검증하였으며 기존 산출물 GK-2A, PERSIANNCCS 강우 강도 산출물과 비교하여 시공간적 안정성을 확인하였다.

2. 연구지역 및 연구자료

연구지역은 대한민국 영토와 영해를 포함하는 위도 33°-39°N, 경도 124°-131°E로 선정하였다 (Fig. 1). 한반도는 유라시아 대륙의 동부에 있는 반도로 대륙과 해양 사이의 온도차에 의한 계절풍대가 형성되는 지역에 위치하고 있다. 겨울에는 한랭건조한 대륙성 기후를, 여름에는 온난 다습한 해양성 기후를 보이며 대부분의 강우량이 여름철에 집중된다. 여름철 강우 유형 중 긴 기간 동안 비를 내리는 장마전선에 의한 강우 유형은 비교적 높이가 낮은 온난형(warm-type) 구름에 의해서 발생하며 (Song and Sohn, 2015) 이는 높이가 높은 한랭형(cold-type) 구름에 의한 대류성 강우 형태와 구분되는 특징이다. 한반도를 연구 지역으로 채택함으로써 높은 고도까지 발달한 구름에 대하여 강우를 추정하는 기존 강우 추정 연구와 달리 높이가 낮은 온난형 구름에 대한 강우 추정을 수행할 수 있게 된다. 연구 기간은 한반도의 강우가 여름철에 집중되는 것과 최근 강우 사례 적용을 위하여 2020-2021년 여름(6-8월)으로 선정하였다.

OGCSBN_2021_v37n5_3_1405_f0001.png 이미지

Fig. 1. The study area (33°-39°N, 124°-131°E) with 10 weather radar stations operated by Korean Meteorological Administration.

본 연구에서는 연속적인 정량적 강우 추정을 위하여 입력 자료로써 정지궤도 기상위성인 Himawari-8 Advanced Himawari Imager(AHI) 자료를 사용하였으며 타겟 변수로써 기상레이더 반사도 자료 및 강우강도를 사용하였다. Himawri-8 AHI 자료는 태국(Sakolnakhon and Nuntakamolwaree, 2016) 대만(Tsay et al., 2020) 등에서 위성 영상을 활용한 강우강도 추정 연구에 활용된 바가 있다.

일본 기상청(Japan Meteorological Agency, JMA)에서 발사한 차세대 정지궤도 기상위성 Himawri-8의 AHI는 RGB 합성과 지표 반사도 측정을 위한 가시광(Visible, VIS) 및 근적외(Near Infrared, NIR) 채널, 지구의 열방사량을 측정하는 적외(Infared, IR) 채널 등 총 16개의 채널을 보유하고 있다. 본 연구에서 사용한 AHI 센서는 수증기 채널(Water Vapor, WV: 6.95 μm)과 장파적외 채널 (IR, 10.45 μm)로 각각 대기 중의 수증기량과 구름 최상층의 온도 정보를 제공한다. 위성 영상은 동아시아 영역을 대상으로 2 km의 공간 해상도와 10분의 시간 해상도를 가지며 일본 우주항공연구개발기구(Japan Aerospace Exploration Agency, JAXA)의 Ptree(ftp.ptree.jaxa.jp)를 통해 다운로드할 수 있다. JAXA에서 제공하는 L1 자료는 적외 영상 자료를 밝기 온도(Brightness Temperature, BT)로 변환하여 제공된다.

기상레이더는 강우영역의 분포와 강우량을 추정할 수 있는 지상관측 기기로 본 연구에서는 기상레이더 센터에서 제공하는 10개 관측소(강릉, 고산, 관악산, 광덕산, 구덕산, 면봉산, 백령도, 성산, 오성산, 진도)의 이중편파 도플러 관측자료의 CMAX(Column Max) 합성장을 사용하였다. CMAX 합성장은 관측자료 중 연직으로 가장 강한 반사도를 2차원 평면 영상으로 표출한 것으로 일정 고도의 반사도만을 나타내는 CAPPI(Constant Altitude Plan Position Indicator)보다 누적 강우량을 더 잘 모의하며(Yoon, 2013) 대류운의 발달 정도를 판단하는 데에 활용할 수 있어 여름철 강우 에코를 분석하는데 유용한 자료이다. CMAX 자료는 방재기상정보시스템(https://afso.kma.go.kr/)을 통해 품질평가(Quality Check, QC)가 완료된 자료로 수집하였으며 한반도 전체 영역에 대하여 1153×1441의 격자 자료로 1km의 공간 해상도와 10분의 시간 해상도를 가진다.

3. 연구방법

본 연구에서는 강우강도를 정량적으로 추정하는 기계학습 기반 모델을 개발하였다. 자세한 흐름은 Fig. 2에 나타나 있으며 세부 내용은 아래와 같다. 입력 변수 간의 상이한 공간 해상도와 지리 좌표계는 재격자화 과정을 통해 일치시켰으며 강우 가능 확률이 높은 구름을 대상으로 강우-비강우 샘플을 추출하여 학습을 진행하였다. 강우강도 추정 위치 주변의 평균 밝기 온도 값을 계산하여 추가적인 입력 변수를 만들었으며 사용한 변수의 종류와 개수에 따라 총 8개의 모델을 구축하였다. 모델 학습에 사용한 기계학습 기법은 랜덤 포레스트(Random Forest, RF)이며 기상 레이더 반사도를 추정한 모델은 결과 값을 Z-R 관계식을 이용하여 강우강도로 변환하여 평가를 진행하였다.

OGCSBN_2021_v37n5_3_1405_f0002.png 이미지

Fig. 2. Process flow diagram for the quantitative precipitation estimation approach proposed in this study.

1) 자료전처리(Preprocessing)

AHI와 CMAX의 상이한 지리 좌표계와 공간 해상도 일치화를 위하여 자료의 재가공을 수행하였다. CMAX의 공간 해상도는 1 km로 AHI의 공간 해상도인 2 km로 재격자화하였다. 연직으로 가장 강한 반사도를 합성한 CMAX의 특성상 이상치(outlier)가 존재할 수 있음을 고려하여 재격자화 전 이상점을 기준으로 이상치 제외 3×3 격자 반사도 값의 평균을 이상치 격자의 값으로 배정하는 노이즈 제거 과정을 진행한 후 재격자화를 수행하였다. 재격자화는 1153×1441 격자의 처음부터 끝까지 2 격자 간격으로 2×2 격자 셀의 평균값을 채택하는 방식으로 이루어졌으며 재격자화가 완료된 CMAX는 2 km 공간 해상도와 576×720의 크기를 가진다. CMAX 좌표계는 격자점(561,841)을 기준점(126E, 38N)으로 미터를 계산해 직각으로 만나는 축들로 위치를 표현하는 직교 좌표계 중 하나인 데카르트 좌표계(Cartesian coordinates)를 형성하여 사용한다. 하지만 해당 좌표계는 3차원 타원체를 이용하는 좌표계인 WGS84(World Geodetic System 1984) 지리 좌표계를 가지는 AHI와 상이하므로 이를 일치시켜주는 과정이 필요하다. 재격자화 된 CMAX의 좌표계는 MATLAB R2021a를 사용하여 AHI의 좌표계와 일치시켜주었으며 데이터 보간 방법은 bicubic interpolation을 사용하였다.

강우 현상이 일어나는 면적은 위성에서 관측되는 구름의 면적보다 매우 작기 때문에 강우강도를 추정하기 위해선 임계 값 설정을 통해 강우 확률이 높은 구름 영역을 추출한 뒤 샘플링을 진행해야 한다(Fig. 3). 초기 GOES precipitation index (GPI)는 구름의 온도가 235K 이하인 영역에 대하여 3 mm/hr의 강우를 추정하였고(Meisner and Arkin, 1987), Cloud-patch 기반의 PERSIANN-CCS에서는 253 K 이하인 구름 영역에서 강우를 추정하였다 (Hong et al., 2004). 본 연구에서는 한반도 여름철 강우 구름의 특성을 파악하고 강우 존재 유무 확률을 분석하기 위하여 2020년 6-8월 모든 강우 사례의 위성영상 모든 픽셀의 밝기 온도에 대하여 210 K부터 300 K까지 5 K 간격으로 1 mm/hr 이상의 강우의 유무 확률을 계산하였다. 강우강도(mm/hr)는 우리나라는 층운형 구름의 강우 비중이 높은 특성을 고려하여(Choi et al., 2018) CMAX 반사도에 Z-R관계식(Marshall, 1948)를 적용하여 계산 하였다(eq 1).

\(Z=200 \mathrm{R}^{1.6}\)       (1)

OGCSBN_2021_v37n5_3_1405_f0003.png 이미지

Fig. 3. An example of Himawari-8 Advanced Himawari Imager (AHI) Infrared (10.45 µm) channel image (left) and the weather radar rain rate (mm/hr) image (right) collected at 15:20 UTC on July 5, 2021.

Z-R 식에서 Z는 레이더 반사도(dBZ), R은 강우강도(mm/hr)이다.

강우 확률을 분석하기 위하여 사용된 샘플의 개수는 270,856,423개이며 밝기 온도가 낮아질수록 강우 확률이 높아지는 것으로 나타났다(Fig. 4). 청천(Clear sky)로 간주할 수 있는 285 K 이상인 구간에서는 0.002 확률로 강우가 존재하였으며 260-265 K 구간에서 0.107로 처음으로 강우 확률 10% 이상을 보이기 시작했다. 강우 확률이 낮은 구름을 학습 자료로 사용할 시 학습에 저해가 될 수 있기 때문에 위 분석 내용을 기반으로 265 K 이상의 구름에 대하여 강우가 존재한다고 가정하여 학습자료 구축을 진행하였다.

OGCSBN_2021_v37n5_3_1405_f0004.png 이미지

Fig. 4. Raining probability (%) according to the Infrared (10.45 µm) cloud-top temperatures (Brightness temperature, K). A total of 270,856,423 samples were collected from June 1 to August 31, 2021.

연구 기간 2020년 6-8월 간 13,248개의 레이더 및 위성 영상 중 총 1,931개의 강우 사례에서 학습 자료를 구축하였다. 강우 사례 채택은 전체 기상 레이더 관측 영역 내 강우강도가 1 mm/hr 이상인 강우 격자 수가 전체 격자 수의 10% 이상일 때 강우 사례로 판별하였다. 실제 자연 현상에서는 비강우 현상이 강우 현상에 비해, 그리고 저강도 강우가 고강도 강우에 비해 면적 비율이 훨씬 높지만 해당 비율로 학습할 경우 모델이 비강우 현상과 저강도 강우에 대해 편향적인 학습을 할 가능성이 크다. 따라서 모델 학습률을 높이기 위하여 샘플은 강우(Rain)-비강우(No-Rain) 경우로 나누어 1:1.5 비율로 구분하여 추출하였으며 강우 샘플의 경우 고강도 강우와 저강도 강우의 비율이 2배가 넘지 않도록 레이더 반사도 50-60dBZ 기준으로 10dBZ씩 구간을 두고 강우강도별 비율이 균등하게 증가하도록 설정하여 샘플링을 진 행하였다. 강우강도별 샘플링 비율은 0-10 dBZ(비강우): 10-20 dBZ:20-30 dBZ:30-40 dBZ:40-50 dBZ:50-60 dBZ=10.5:1.8:1.6:1.4:1.2:1.0 (10.5:7.0=1.5:1.0)이다.

추출된 샘플은 입력 변수로써 IR, WV의 밝기 온도값과 타겟 변수로써 레이더 반사도와 강우강도 값을 가진다. 또한 추출하고자 하는 격자를 중심으로 주변 값의 분포를 고려한 변수를 추가적으로 생성한다. 주변 밝기 온도 분포를 변수로 사용하는 것은 PERSIANN(Hsu et al., 1997)에서 사용한 방법으로 본 연구에서는 주변 3×3, 9×9, 27×27 격자의 IR 밝기 온도 값의 평균(IR_3mean, IR_9mean, IR_27mean)을 생성하여 입력 변수로 활용하였다. WV 채널 값은 강우 구름 내 강우 추정 위치 주변값과의 차이가 크지 않아 단일 위치 값만을 사용한다. 추출된 샘플 수는 5,772,928개이며 모델 학습 시간을 고려하여 약 0.5배인 2,886,655개의 샘플을 사용하였다. 이 중 무작위 추출을 통해 80%인 2,309,322개는 모델 학습을 위하여 사용하였고 20%인 577,333개는 모델 검증을 위하여 사용하였다.

2) 모델 구축(Model development)

본 연구에서는 학습하는 변수의 종류와 개수에 따라 총 8개의 모델이 구축되었다. 모델 이름은 타겟 변수와 입력 변수에 따라 아라비아 숫자와 영문 소문자 알파벳으로 구분하여 명명한다. 자세한 모델 설명은 Table 1에 자세히 기술되어 있다.

Table 1. Target and input variables description of the developed RF model.

OGCSBN_2021_v37n5_3_1405_t0001.png 이미지

본 연구에서는 기계학습 기법으로 랜덤 포레스트 (random forest; RF)를 사용하였다. RF는 의사결정 나무(decision tree; DT)의 집합으로, 복수의 DT의 값으로부터 최종 값을 결정한다. RF는 Breiman (2001)에 의해 제시된 이후 지금까지 여러 원격탐사 분야에서 활용되었다 (Yoo et al., 2017; Kim et al., 2018; Han et al., 2019; Cho et al., 2020; Jang et al., 2021). RF는 전체 샘플 내에서 무작위로 학습 샘플과 검증 샘플(out of bag)을 나누기 때문에 자체적인 검증 결과를 제시하며, 입력 변수도 무작위로 포함 및 제외하므로 상대적인 변수 중요도를 제공한다는 장점이 있다. 각 의사 결정 나무에서 불순도(impurity)가 감소하는 방향으로 모델을 구축해 나가는 RF의 구조상 변수 중요도는 입력 변수의 유무에 따라 불순도를 얼마만큼 변화시키는지를 통해 계산할 수 있다. 대부분의 기계학습 모델은 모델 구조 및 파라미터에 대해 정확도가 크게 좌우된다. 대표적으로 잘 훈련된 신경망 알고리즘(neural networks)의 경우 전반적으로 RF에 비해 좋은 성능을 보이지만 모델의 구조 및 파라미터 설정에 따라 성능이 매우 크게 달라지므로 최적의 모델을 찾는 작업이 매우 중요하다. 이에 비해 RF의 경우 파라미터 설정에 따라 성능이 크게 변하지 않는다는 장점이 있기 때문에 연구 진행에서 모델에 의한 불확실성을 크게 줄일 수 있다. 앞서 제시된 장점을 활용하기 위해 본 연구에서는 RF 모델을 활용하였다. RF 모델로는 Python 환경에서 Scikit-learn 라이브러리의 RandomForestRegressor() 함수를 사용하였다(https://scikit-learn.org/stable/mo dules/generated/sklearn.ensemble.RandomForestRegre ssor.html). 사용된 트리 개수는 1,000개이며, 트리 개수가 1,000개 이상일 때는 정확도의 차이가 거의 발생하지 않았다. RandomForestRegressor() 함수에서는 자체적으로 병렬화를 지원하기 때문에, 본 연구에서는 16개의 CPU core를 할당하여 병렬 학습을 하였으며 학습에는 최대 754.4초가 소요되었다. 변수 중요도는 Python 환경에서 Scikit-learn 라이브러리의 feature_importances_() 함수를 사용하여 계산하였다(https://scikit-learn.org/stable/auto_examples/ensemble/plot_forest_importances.html). feature_importances_() 함수는 변수들의 중요도 합이 1이 되도록 계산하여 변수 중요도를 제시한다.

3) 모델 검증 및 분석(Model validation and analysis)

정량적 모델 평가를 위해 본 연구에서는 선행 연구에서 주로 사용하는 평가 항목을 사용하였다. 레이더 강우를 참값으로 간주하고 예측 결과의 성능을 분석하였다. 연속적인 강우강도의 값에 대한 평가 항목으로는 Mean-Absolute-Error (MAE), Root-Mean-Squared-Error (RMSE), 편차(bias), 상관계수(R)을 사용하였다. 강우에 대한 정확도만을 계산하기 위하여 참값인 레이더 강우 강도가 1mm/h인 지역에 대해서만 평가하였다. 연속적인 값에 대한 평가 이외에도 강우 탐지에 대한 이진 분류 성능을 평가하기 위하여 1 mm/hr 이상을 강우 발생으로 간주하여 Table 2와 같은 분류를 수행하였으며, 이를 기반으로 탐지율(probability of detection; POD), 오탐지율(false alarm rate; FAR), 임계성공지수(critical success index; CSI)를 계산하였다. 각 정확도 식은 Equation 2-4과 같다.

\(\mathrm{POD}=\frac{\mathrm{H}}{\mathrm{H}+\mathrm{M}}\)       (2)

\(\operatorname{FAR}=\frac{F}{H+F}\)       (3)

\(\mathrm{CSI}=\frac{\mathrm{H}}{\mathrm{H}+\mathrm{M}+\mathrm{F}}\)       (4)

Table 2. A 2×2 contingency table for binary quantitative evaluation of the proposed models

OGCSBN_2021_v37n5_3_1405_t0002.png 이미지

4. 연구결과 및 고찰

Table 3은 연구 기간 내 검증 자료에 대하여 모든 모델의 검증 결과 POD, FAR, CSI, MAE, RMSE, Bias, R을 나타낸 것이다. 강우 유무의 이진 분류 평가를 살펴보면, 강우강도를 타겟으로 학습한 모델(이하, Model 2)은 POD ~0.97, FAR ~0.54, CSI ~0.47의 결과를 보였고 레이더 반사도를 타겟으로 학습한 모델(이하, Model 1)은 POD ~0.63, FAR ~35, CSI ~0.49의 결과를 보였다. Model 2는 Model 1보다 POD가 약 0.3 정도 높지만 FAR 또한 약 0.2 정도 높아 같은 자료에 대하여 강우 확률을 높게 모의하고 있다. 연속적인 강우강도 추정에 대한 평가 기준인 MAE, RMSE, Bias, R은 Model 1에서 MAE ~5.45, RMSE ~16.23, Bias ~4.34, R ~0.49으로 Model 2의 MAE ~6.84, RMSE ~15.50, Bias ~-0.34, R ~0.55과 비교하였을 때 총 강우강도 추정 오차는 차이가 작지만 편차가 크고 상관성이 낮은 것으로 나타났다.

Table 3. Accuracy assessment results using the validation datasets for the eight QPE models based on random forest.

OGCSBN_2021_v37n5_3_1405_t0003.png 이미지

모델 검증 결과 밝기 온도의 공간 분포를 고려한 변수(IR_mean)를 추가할수록 성능이 개선되었다. Table 4는 모든 모델의 입력 변수 중요도를 분석한 결과이다. 강우강도 추정 기법은 위성 영상에서 구름 최상층의 밝기 온도와 강우강도 간의 관계를 기반으로 하기 때문에 IR, WV 단일 위치 값만 사용한 경우 구름 최상층의 밝기 온도를 측정할 수 있는 IR 채널의 값이 WV 채널 값보다 더 중요한 변수로 채택되었으며 공간적으로 주변 값들을 추가할 시 주변 값(IR_mean)이 더 중요하게 분 되었다. 이는 일반적으로 강우가 발달하면서 강우강도의 공간적 분포는 고강도 강우를 중심으로 저강도 강우가 넓은 지역으로 퍼지면서 나타나게 되는 상황에서 (Griffith et al., 1978) 주변 값을 고려함을 통해 평균값으로 대변되는 주변 강우 구름 발달 정도와 추정 위치의 추정 위치의 밝기 온도 값 차이를 통해 추정 위치에 고강도 강우를 모의할 수 있게 된 결과이다. Model 1c와 Model 1d에서 WV와 9IR_mean, 27IR_mean의 변수 중 요도가 각각 (0.302, 0.315), (0.252, 0.233)으로 근소한 차이로 비슷한 값을 보이는데 이는 주변 값을 고려한 입력 변수를 사용할 시 구름 최상층의 밝기 온도만큼 중층 대기의 수증기량 발달 정도도 강우 추정에 중요한 역할을 하는 것으로 해석된다.

Table 4. The relative variable importance identified by the developed models.

OGCSBN_2021_v37n5_3_1405_t0004.png 이미지

Table 5. The performance of the proposed eight models using the hindcast dataset from 21:00 UTC on July 4 to 09:00 UTC on July 6, 2021 with 214 scenes at 10-minute intervals. The performance metrics were averaged for all scenes

OGCSBN_2021_v37n5_3_1405_t0005.png 이미지

모델 결과의 시공간 연속성을 평가하기 위하여 2021년 7월 5-6일에 발생한 장마 사례에 대하여 Hindcast 검증을 시행하였다. 해당 장마 사례는 7월 5일 해남 141.7 mm, 강진 137.8 mm, 6일 해남 297.3 mm, 강진 210.9 mm, 부산 121.3 mm, 창원 148.7 mm, 남해 269.0 mm, 김해 151.7 mm의 기록적인 강우량을 보인 호우 사례이다. 정확한 모델 평가 기간은 세계표준시(UTC)로 2021년 7월 4일 21시 00분부터 7월 6일 09시 00분까지이며 10분 간격으로 총 214개 장면에 대하여 평가하였다(Table 5). 강우 유무 분류 평가에서 Model 1, 2 각각 POD ~0.90,~1.00, FAR ~0.67, ~0.81, CSI ~0.31, 0.18로 Model 1이 2보다 실제 강우 유무 분류 정확도가 높게 평가되었다. 강우강도 추정 평가 시 MAE ~10.6, ~24.05, RMSE ~15.61, ~27.04, Bias ~-4.48, -23.12 R ~0.23, ~0.17로 Model 1이 2보다 압도적으로 높은 정확도를 보인다. 강우강도 추정의 차이는 위성 영상에서 관측된 구름의 밝기 온도와 레이더 반사도, 강우강도 간의 관계에서 찾아볼 수 있다(Fig. 5). Fig. 5는 연구 기간 내 추출된 강우 샘플들 중 10%를 무작위로 추출하여 그린 산점도(Scatter plot)이다. Fig. 5(a)와 (b)에서 레이더 반사도와 강우강도가 강해질수록 구름의 밝기 온도가 낮아지는 경향을 보이지만 같은 반사도 혹은 강우강도에서도 밝기 온도의 변화 폭이 큰 것을 확인할 수 있다. 강우강도의 경우 0 mm/hr 부근에 샘플의 밀도가 높고 저강도 강우 샘플에서 구름의 밝기 온도 범위가 매우 크기 때문에 모델이 밝기 온도-강우강도 간 비선형 관계를 유추하기 어려워 강우강도를 과소 모의하는 경향을 가지게 된다. 반대로 레이더 반사도는 강우 강도에 비해 밝기 온도와 선형적인 관계를 가지고 있으며 이를 학습한 모델은 추정한 강우강도와 실제 강우강도 간 편차가 적어 정량적으로 높은 정확도를 가진다.

OGCSBN_2021_v37n5_3_1405_f0005.png 이미지

Fig. 5. The relationship between the brightness temperature of clouds and weather radar reflectivity (a) and rainfall intensity (b). Radar reflectance shows a linear relationship with brightness temperature than the rainfall intensity does.

Fig. 6은 Hindcast 검증 결과를 박스 플롯(boxplot)으로 나타낸 것이다. 강우 유무 분류 평가 정확도를 나타내는 POD, FAR, CSI는 Fig. 6(a)에 나타냈으며 강우강도 추정 정확도를 나타내는 MAE, RMSE, Bias는 Fig. 6(b)에 나타냈다. 강우 유무 분류(POD, FAR, CSI)에서 Model 1이 2보다 높은 정확도를 보인다. 레이더 반사도를 기준으로 분류된 학습 데이터는 같은 카테고리 안에 분류되더라도 높은 반사도의 카테고리인 경우 Z-R 관계식(Marshall, 1948)에 의해 작은 차이에도 변환된 강우강도의 차이는 크게 나타나게 된다. 이로 인해 Model 2는 다수의 100 mm/hr 이상 고강도 강우를 학습하였으며 평균 값을 추정하는 RF의 특성으로 인해 비강우 구름 영역에서도 저강도 강우를 모의하여 높은 확률로 강우가 존재한다고 판단하는 경향을 가진다. 실제 강우가 없는 영역을 강우 영역으로 추정함으로 인해 높은 POD, FAR와 낮은 CSI가 나타나고 있고 강우강도 정량적 평가 면에서도 214개 장면 모두 실제 강우강도와 음의 방향으로 큰 차이를 보이며 대부분의 강우를 과소 모의하는 경향을 보인다. Model 1에서 모의한 강우 강도는 Model 2와 비교하였을 때 실제 강우 강도와 차이가 적고 양의 방향으로도 차이를 보여 편향적인 모의를 하지 않는다. 이는 밝기 온도와 강우강도 간의 관계를 학습하는 것보다 레이더 반사도와의 관계를 학습 후 Z-R 관계식을 통하여 강우강도를 산출하는 것이 더 정확한 강우강도를 산출할 수 있음을 나타낸다.

OGCSBN_2021_v37n5_3_1405_f0006.png 이미지

Fig. 6. The boxplot of the six performance metrics for the hindcast evaluation results

Fig. 7은 hindcast 기간의 모든 장면에 대해 265K 이하 구름 영역에서 강우강도가 1 mm/hr 이상인 영역이 일치하는 비율(Matched percent)과 Model1의 POD(Fig. 7(a)), FAR(Fig. 7(b)), CSI(Fig. 7(c)) 변화를 나타낸 그래프이다. Hindcast 기간 동안 구름 영역 대비 강우가 존재하 는 면적 비율은 약 0.2에서 0.4사이이며 면적 비율이 상승하는 것은 강우강도가 증가함에 따라 강우 가능 영역이 증가하는 것을 의미한다(Griffith et al., 1978). POD, FAR은 강우 면적 비율이 변화하는 방향과 반대로 변화하지만 CSI는 같은 방향으로 변화하여 강우 면적 비율이 높을수록 강우 유무 분류가 정확해지는 경향을 보인다. 강우 면적 비율은 추정 강우강도를 정량적으로 평가하였을 때 그 의미를 더 크게 갖는다(Fig. 8). 강우 면적 비율이 증가하면서 Model 1의 MAE(Fig. 8(a)), RMSE (Fig. 8(b))가 증가한다. 강우 면적 비율의 증감과 MAE, RMSE의 증감 추이는 약간의 시간차가 존재하는데 강우 면적이 증가하는 과정은 강우가 발달하는 과정으로 고강도 강우보다 저강도 강우가 대부분을 차지할 때이며 이때 강우강도 모의는 비교적 정확하나 강우 면적 비율이 최고점이 되는 시점 전후로 고강도의 강우가 최대로 발달했을 땐 강우강도 모의가 제대로 이루어지지 않고 있다. 강우강도가 발달함에 따라 음의 방향으로 크게 증가하는 Bias는 모델이 고강도 강우를 과소 모의한다는 것을 말한다. 강우 면적이 감소함에 따라 오차도 감소한다. 모델 간 성능을 비교하면 밝기 온도의 공간 분포를 고려한 입력 변수를 더 많이 사용할수록 강우 유무 분류와 강우강도 추정의 정확도가 높아진다. 단, 강우 면적 비율이 0.4 이상일 때 Model 1c가 Model 1d 보다 강우 유무 분류 정확도가 더 높다.

OGCSBN_2021_v37n5_3_1405_f0007.png 이미지

Fig. 7. The timeseries of POD, FAR, and CSI of Model 1 using the hindcast dataset (21:00 UTC on July 4 to 09:00 UTC on July 6, 2021).

OGCSBN_2021_v37n5_3_1405_f0008.png 이미지

Fig. 8. The timeseries of MAE, RMSE, and Bias of Model 1 using the hindcast dataset (21:00 UTC on July 4 to 09:00 UTC on July 6, 2021).

Fig. 9는 2021년 7월 5일 15시 20분(UTC)의 강우강도 추정 결과를 모델별로 보여주고 있다. 적외 채널에서 265 K 이상의 구름 영역과 강우강도 1 mm/hr 이하로 추정된 영역은 비강우 지역으로 분류하였다. 공간 분포를 고려한 변수를 사용하지 않은 Model 1a는 강우 영역에 대하여 평균 10 mm/hr 이상의 강우강도를 추정하였으며 고강도 강우를 모의하지 못하고 강우 영역 내에 점잡음(salt-and-pepper noise) 현상이 뚜렷하게 나타나고 있다. Model 1b는 약 220K 이하의 구름에서 과대 모의를 하는 경향이 있다. Model 1c와 Model 1d는 주변 격자셀의 평균 값을 추가적으로 사용함으로써 전라남도 해남 부근의 고강도 강우에서 저강도 강우로 변화하는 연속적인 강우강도 분포를 모의했다. Model 1d는 전라남도 남쪽 해상 인근과 서쪽 해상 인근의 약 220 K 이하의 구름 영역에 대하여 고강도 강우를 모의하였으나 동해안 인근의 약 230 K 부근의 구름 영역에 대해서는 저강도 강우를 모의했다. 이는 모델 타입 d의 강우 강도 추정 위치 격자와 주변 격자 평균값의 차이가 강우 구름의 형태가 수직으로 발달한 대류운의 형태인지 수평으로 고르게 발달한 층운형의 형태인지의 판단에 기여한 것이다(Hong et al., 2004). Table 6은 해당 장면에 대한 모델 성능 평가를 수치로 나타내고 있으며 강우 유무 분류 시 Model 1c의 성능이 가장 높았으나 강우강도 정확도는 Model 1d의 성능이 가장 높았다.

OGCSBN_2021_v37n5_3_1405_f0009.png 이미지

Fig. 9. An example of heavy rain occurred at 15:20 UTC on July 5, 2021.

Table 6. The Model 1 performance on the case of heavy rain occurred at 15:20 UTC on July 5, 2021. The best performance of each evaluation metric is shown in bold

OGCSBN_2021_v37n5_3_1405_t0006.png 이미지

본 연구에서 개발한 모델과 한국 기상청에서 제공하는 GK-2A 강우강도(Rain rate, RR) 산출물, CHRS(Center for Hydrometeorology and Remote Sensing, University of California Irvine)에서 제공하는 PERSIANN-CCS 산출물과 비교하였다(Table 7). GK-2A 강우강도 산출물의 경우 2021년 7월 5일 15시 20분(UTC) 자료의 부재로 인하여 2021년 7월 5일 15시 18분(UTC) 산출물을 이용하였다. PERSIANN-CCS 산출물은 GK-2A 강우강도 산출물 및 본 연구에서 개발한 모델 산출물과 공간 해상도 일치를 위해 4 km에서 2 km로 재격자화하였고 재격자화된 값은 기존 값과 같은 값을 가진다. GK-2A 강우강도, PERSIANN-CCS, Model 1d는 각각 POD 0.28, 0.54, 0.64, FAR 0.70, 0.66, 0.57로 Model 1d가 가장 낮은 오보율을 보였다. CSI는 각각 0.16, 0.26, 0.34로 Model 1d가 기존의 강우강도 산출물보다 정확한 강우 유무 분류를 한다. MAE는 각각 7.02, 6.30, 4.82, RMSE는 12.16, 10.45, 7.63, Bias는 3.96, 5.95, 0.68, R은 0.38, 0.23, 0.41로 강우강도를 정량적으로 평가하였을 때도 Model 1d가 가장 정확한 강우강도를 모의한다. 본 연구에서 개발한 모델은 GK2A 강우강도 산출물과 PERSIANN-CCS 산출물 대비 CSI 기준 21.42%, 10.81%, MAE 기준 31.33%, 23.49% 향상된 성능을 보인다.

Table 7. The results of three quantitative precipitation estimation algorithms, GK-2A, PERSIANN-CCS, Model 1d for the heavy rain case occurred at 15:20 UTC on July 5, 2021

OGCSBN_2021_v37n5_3_1405_t0007.png 이미지

Fig. 10은 2021년 7월 5일 15시 20분 장면에 대한 강우강도 산출물과 모델 결과를 공간적으로 나타낸 그림이다. 모든 강우강도 산출물은 구름 온도와 강우강도 간의 관계식 기반으로 산출된 자료이므로 강우 가능 구름 영역에 대하여 강우를 모의하는 경향을 가진다. 전라남도 남쪽 해안 인근에서 기상레이더 강우강도가 가장 강하게 나타나며 위성 영상에서 가장 낮은 온도의 구름이 발달되어 있다. 해당 지역에 대하여 강우강도 산출물 모두 강우 유무 분류에서 강우가 존재한다고 판단하였으 며 GK-2A 강우강도는 60 mm/hr 이상, PERSIANN-CCS 는 20 mm/hr 이하의 강우강도를 추정하였다. GK-2A 강우강도 산출물은 고강도 강우 면적을 과도 모의하며 저강도 강우 영역과의 공간적으로 불연속적이다. PERSIANN-CCS 산출물은 고강도 강우를 모의하지 못하고 대부분 강우에 대해 과소 모의한다. 본 연구에서 제안하는 Model 1d는 60 mm/hr 이상의 고강도 강우를 모의함과 동시에 강우 지역과 강우강도 변화 패턴이 기상 레이더 관측 자료와 매우 유사하다. GK-2A 강우강도 산출물과 비교하였을 때 강우 추정 위치뿐만 아니라 주변값을 고려함으로써 강우 구름 내 강우 강도 분포 변화를 모의하였으며 PERSIANN-CCS에 비교하였을 때 한반도 강수 특성인 높이가 낮은 온난형 구름의 특성을 학습하여 구름의 밝기 온도가 높더라도 고강도의 강우 강도를 모의하였다. 동해안 부근에 비교적 강한 강우를 모의해냈으나 기상 레이더와 위성 영상 간의 관측 각도 차이로 인한 왜곡으로 인한 공간 불일치로 인하여 강우 영역이 다르게 나타났다. 이는 다른 관측 기기를 사용함에서 기인하는 한계점이며 차후 좌표계 변환 시 강우 산출물을 제공하는 위성 자료를 활용한 보정(Wu et al., 2020)이나 위성 영상과 레이더 영상의 상관 정도 검열을 통해 개선할 수 있을 것으로 판단된다.

OGCSBN_2021_v37n5_3_1405_f0010.png 이미지

Fig. 10. An example of heavy rain occurred at 15:20 UTC on Jul 5, 2021.

5. 논의 및 결론

본 연구에서는 한반도 여름철 강우에 대하여 기계학습 기반 정량적 강우량 추정 기법을 개발하였다. 정지 궤도 기상위성 Himawari-8 AHI의 적외 채널과 수증기 채널 영상을 활용하여 위성 영상의 밝기 온도와 기상 레이더 반사도, 강우강도 간의 관계에 따라 강우강도 추정의 정확도 비교를 위하여 종속 변수를 기상 레이더 반사도, 강우강도로 달리 두어 모델을 학습하였으며 기상 레이더 반사도를 추정하여 강우강도로 변환하는 모델의 성능이 높았다. 또한 강우강도 추정 위치 주변의 위성 영상 밝기 온도 분포를 고려할수록 성능이 개선되는 것을 확인했다. 본 연구에서 개발한 모델은 GK-2A 강우강도와 PERSIANN-CCS 산출물과 비교했을 때 각각 CSI 21.42%, 10.81%, MAE 31.33%, 23.49% 향상된 성능을 보였다. 산출물을 지도화하였을 때 대부분의 강우를 고강도 강우로 모의한 GK-2A, 저강도 강우로 모의한 PERSIANN-CCS와 달리 본 연구에서 개발한 모델은 고강도와 저강도 강우를 실제 강우강도 분포와 유사하게 모의하였다. 추정 강우강도를 지도화한 결과 salt-and-pepper 현상이 두드러지게 발생하였는데 단일 값을 모의하는 RF의 결과를 지도화하였을 때 공간적으로 불연속적인 현상이 나오는 한계점으로 이는 후처리 과정에서 스무딩 기법 등을 이용해 공간적으로 불연속적인 값을 완화시켜 보완할 수 있으며 기법적으로는 CNN 등 이미지 기반의 딥러닝 기법을 활용하여 한계를 극복할 수 있을 것이다.

AHI의 적외 영상을 활용한 기계학습 및 딥러닝 기반 정량적 강우량 추정 기법은 태국, 대만과 같은 동아시아 아열대 기후대에서 연구된 바가 있지만 대류성 강우의 특징을 기반으로 연구되어 왔으며 본 연구는 한반도 지역의 층운형 구름 강우 유형을 고려하여 중위도 기후대의 특성을 반영하였다는 차이점을 가진다. 또한 기상 레이더 반사도를 산출하는 모델을 제안하여 강우 강도 추정 정확도를 향상시킬 수 있음을 확인했다. 본 연구에서는 층운형 강우 유형에 집중하여 산출된 기상 레이더 반사도에도 동일한 Z-R 관계식을 사용하였지만 다양한 강우 유형에 Z-R 관계식을 유연하게 적용할 수 있는 가능성을 제안한다. 이후 강우 구름 유형을 분류하는 기법을 적용한다면 다양한 유형의 강우 유형에 따른 강우 강도를 모의할 수 있을 것으로 기대된다.

본 연구는 한반도 지역을 대상으로 정지궤도 기상위성 자료만을 이용하여 기계학습 기반 강우강도 모델 구축 및 산출물을 최초로 제시하는 데에 의미가 있다. 기존의 미국 지역 대류성 강우를 기반으로 개발된 기계학습 모델들과 달리 한반도의 강우 구름 유형 및 강우 패턴을 반영하였다. 레이더 반사도를 추정하는 모델을 통해 강우 구름 유형에 따라 다양한 Z-R 관계식을 적용하여 강우강도 추정 정확성 향상을 기대할 수 있다. 본 연구를 기반으로 한반도 지역의 강우 특성을 고려한 기계 학습 기반 강우강도 추정 기법의 가능성을 제안하며 우리나라 정지궤도복합위성 GK-2A 자료의 활용을 기대해 본다.

사사

본 연구는 행정안전부 재난안전 부처협력 기술개발사업(No. 20009742)의 지원으로 수행되었습니다.

References

  1. Ahn, S.-H., K.-J. Park, J.-Y. Kim, and B.-J. Kim, 2015. The characteristics of the frequency and damage for meteorological disasters in Korea, Journal of Korean Society of Hazard Mitigation, 15(2): 133-144 (in Korean with English abstract). https://doi.org/10.9798/KOSHAM.2015.15.2.133
  2. Ashouri, H., K.-L. Hsu, S. Sorooshian, D.K. Braithwaite, K.R. Knapp, L.D. Cecil, B.R. Nelson, and O.P. Prat, 2015. PERSIANN-CDR: Daily precipitation climate data record from multisatellite observations for hydrological and climate studies, Bulletin of the American Meteorological Society, 96(1): 69-83. https://doi.org/10.1175/BAMS-D-13-00068.1
  3. Breiman, L., 2001. Random forests, Machine Learning, 45(1): 5-32. https://doi.org/10.1023/A:1010933404324
  4. Cho, D., C. Yoo, J. Im, Y. Lee, and J. Lee, 2020. Improvement of spatial interpolation accuracy of daily maximum air temperature in urban areas using a stacking ensemble technique, GIScience & Remote Sensing, 57(5): 633-649. https://doi.org/10.1080/15481603.2020.1766768
  5. Choi, H., J.-J. Seo, J. Bae, S. Kim, and K.-M. Lee, 2018. Improvement of Non-linear Estimation Equation of Rainfall Intensity over the Korean Peninsula by using the Brightness Temperature of Satellite and Radar Reflectivity Data, Journal of the Korean Earth Science Society, 39(2): 131-138 (in Korean with English abstract). https://doi.org/10.5467/JKESS.2018.39.2.131
  6. Chung, S.-R., M.-H. Ahn, K.-S. Han, K.-T. Lee, and D.-B. Shin, 2020. Meteorological Products of Geo-KOMPSAT 2A (GK2A) Satellite, Asia-Pacific Journal of Atmospheric Sciences, 56: 185. https://doi.org/10.1007/s13143-020-00199-x
  7. Germann, U., G. Galli, M. Boscacci, and M. Bolliger, 2006. Radar precipitation measurement in a mountainous region, Quarterly Journal of the Royal Meteorological Society: A Journal of the Atmospheric Sciences, Applied Meteorology and Physical Oceanography, 132(618): 1669-1692. https://doi.org/10.1256/qj.05.190
  8. Griffith, C.G., W.L. Woodley, P.G. Grube, D.W. Martin, J. Stout, and D.N. Sikdar, 1978. Rain estimation from geosynchronous satellite imagery-Visible and infrared studies, Monthly Weather Review, 106(8): 1153-1171. https://doi.org/10.1175/1520-0493(1978)106<1153:REFGSI>2.0.CO;2
  9. Han, D., J. Lee, J. Im, S. Sim, S. Lee, and H. Han, 2019. A novel framework of detecting convective initiation combining automated sampling, machine learning, and repeated model tuning from geostationary satellite data, Remote Sensing, 11(12): 1454. https://doi.org/10.3390/rs11121454
  10. Hong, Y., D. Gochis, J.-T. Cheng, K.-l. Hsu, and S. Sorooshian, 2007. Evaluation of PERSIANN-CCS rainfall measurement using the NAME event rain gauge network, Journal of Hydrometeorology, 8(3): 469-482. https://doi.org/10.1175/JHM574.1
  11. Hong, Y., K.-L. Hsu, S. Sorooshian, and X. Gao, 2004. Precipitation estimation from remotely sensed imagery using an artificial neural network cloud classification system, Journal of Applied Meteorology, 43(12): 1834-1853. https://doi.org/10.1175/JAM2173.1
  12. Hou, A.Y., R.K. Kakar, S. Neeck, A.A. Azarbarzin, C.D. Kummerow, M. Kojima, R. Oki, K. Nakamura, and T. Iguchi, 2014. The global precipitation measurement mission, Bulletin of the American Meteorological Society, 95(5): 701-722. https://doi.org/10.1175/BAMS-D-13-00164.1
  13. Hsu, K.-L., X. Gao, S. Sorooshian, and H.V. Gupta, 1997. Precipitation estimation from remotely sensed information using artificial neural networks, Journal of Applied Meteorology, 36(9): 1176-1190. https://doi.org/10.1175/1520-0450(1997)036<1176:PEFRSI>2.0.CO;2
  14. Huffman, G.J., R.F. Adler, P. Arkin, A. Chang, R. Ferraro, A. Gruber, J. Janowiak, A. McNab, B. Rudolf, and U. Schneider, 1997. The global precipitation climatology project (GPCP) combined precipitation dataset, Bulletin of the American Meteorological Society, 78(1): 5-20. https://doi.org/10.1175/1520-0477(1997)078<0005:TGPCPG>2.0.CO;2
  15. Jang, E., Y.J. Kim, J. Im, and Y.-G. Park, 2021. Improvement of SMAP sea surface salinity in river-dominated oceans using machine learning approaches, GIScience and Remote Sensing, 58(1): 138-160. https://doi.org/10.1080/15481603.2021.1872228
  16. Joss, J., A. Waldvogel, and C. Collier, 1990. Precipitation measurement and hydrology, Radar in Meteorology, 1990: 577-606.
  17. Kidd, C. and G. Huffman, 2011. Global precipitation measurement, Meteorological Applications, 18(3): 334-353. https://doi.org/10.1002/met.284
  18. Kim, M., J. Lee, and J. Im, 2018. Deep learning-based monitoring of overshooting cloud tops from geostationary satellite data, GIScience and Remote Sensing, 55(5): 763-792. https://doi.org/10.1080/15481603.2018.1457201
  19. Marcos, C. and A. Rodriguez, 2013. Validation report for "convective rainfall rate"(CRR-PGE05 v4.0). NWC-CDOP2-GEO-AEMET-SCI-ATBD-Precipitation_v1.1, 15p. Available online at https://www.nwcsaf.org/documents/20182/30785/NWC-CDOP2-GEOAEMET-SCI-ATBD-Precipitation_v1.1.pdf/091e7abe-518d-4b55-a744-cccd12d9f2b9, Accessed on Oct. 19, 2021.
  20. Marshall, J.S., 1948. The distribution of raindrops with size, Quarterly Journal of the Royal Meteorological Society, 76(327): 165-166.
  21. Meisner, B.N., and P.A. Arkin, 1987. Spatial and annual variations in the diurnal cycle of large-scale tropical convective cloudiness and precipitation, Monthly Weather Review, 115(9): 2009-2032. https://doi.org/10.1175/1520-0493(1987)115<2009:SAAVIT>2.0.CO;2
  22. Miao, C., H. Ashouri, K.-L. Hsu, S. Sorooshian, and Q. Duan, 2015. Evaluation of the PERSIANN-CDR daily rainfall estimates in capturing the behavior of extreme precipitation events over China, Journal of Hydrometeorology, 16(3): 1387-1396. https://doi.org/10.1175/JHM-D-14-0174.1
  23. Mishra, K.V., A. Gharanjik, M.B. Shankar, and B. Ottersten, 2018. Deep learning framework for precipitation retrievals from communication satellites, Proc. of 10th European Conference on Radar in Meteorology and Hydrology, Wageningen, NL, Jul. 1-6, pp.1-9.
  24. Prigent, C., 2010. Precipitation retrieval from space: An overview, Comptes Rendus Geoscience, 342(4-5): 380-389. https://doi.org/10.1016/j.crte.2010.01.004
  25. Sadeghi, M., A.A. Asanjan, M. Faridzad, P. Nguyen, K. Hsu, S. Sorooshian, and D. Braithwaite, 2019. PERSIANN-CNN: Precipitation estimation from remotely sensed information using artificial neural networks-convolutional neural networks, Journal of Hydrometeorology, 20(12): 2273-2289. https://doi.org/10.1175/jhm-d-19-0110.1
  26. Sakolnakhon, K. and S. Nuntakamolwaree, 2016. The estimation rainfall using infrared (IR) band of Himawari-8 satellite over Thailand, Engineering: Naresuan University, 39: 236-248.
  27. Saltikoff, E., K. Friedrich, J. Soderholm, K. Lengfeld, B. Nelson, A. Becker, R. Hollmann, B. Urban, M. Heistermann, and C. Tassone, 2019. An overview of using weather radar for climatological studies: Successes, challenges, and potential, Bulletin of the American Meteorological Society, 100(9): 1739-1752. https://doi.org/10.1175/bams-d-18-0166.1
  28. Shin, J.-Y., Y. Ro, J.-W. Cha, K.-R. Kim, and J.-C. Ha, 2019. Assessing the Applicability of Random Forest, Stochastic Gradient Boosted Model, and Extreme Learning Machine Methods to the Quantitative Precipitation Estimation of the Radar Data: A Case Study to Gwangdeoksan Radar, South Korea, in 2018, Advances in Meteorology, 2019.
  29. Song, H.-J. and B.-J. Sohn, 2015. Two heavy rainfall types over the Korean peninsula in the humid East Asian summer environment: A satellite observation study, Monthly Weather Review, 143(1): 363-382. https://doi.org/10.1175/MWR-D-14-00184.1
  30. Sorooshian, S., K.-L. Hsu, X. Gao, H.V. Gupta, B. Imam, and D. Braithwaite, 2000. Evaluation of PERSIANN system satellite-based estimates of tropical rainfall, Bulletin of the American Meteorological Society, 81(9): 2035-2046. https://doi.org/10.1175/1520-0477(2000)081<2035:EOPSSE>2.3.CO;2
  31. Sun, Q., C. Miao, Q. Duan, H. Ashouri, S. Sorooshian, and K.L. Hsu, 2018. A review of global precipitation data sets: Data sources, estimation, and intercomparisons, Reviews of Geophysics, 56(1): 79-107. https://doi.org/10.1002/2017rg000574
  32. Tao, Y., K. Hsu, A. Ihler, X. Gao, and S. Sorooshian, 2018. A two-stage deep neural network framework for precipitation estimation from bispectral satellite information, Journal of Hydrometeorology, 19(2): 393-408. https://doi.org/10.1175/jhm-d-17-0077.1
  33. Tsay, J.-D., K. Kao, C.-C. Chao, and Y.-C. Chang, 2020. Deep learning for satellite rainfall retrieval using Himawari-8 multiple spectral channels, Preprints, 2020100648.
  34. Vicente, G.A., R.A. Scofield, and W.P. Menzel, 1998. The operational GOES infrared rainfall estimation technique, Bulletin of the American Meteorological Society, 79(9): 1883-1898. https://doi.org/10.1175/1520-0477(1998)079<1883:TOGIRE>2.0.CO;2
  35. Wu, H., Q. Yang, J. Liu, and G. Wang, 2020. A spatiotemporal deep fusion model for merging satellite and gauge precipitation in China, Journal of Hydrology, 584: 124664. https://doi.org/10.1016/j.jhydrol.2020.124664
  36. Yoo, C., J. Im, S. Park, and D. Cho, 2017. Thermal characteristics of Daegu using land cover data and satellite-derived surface temperature downscaled based on machine learning, Korean Journal of Remote Sensing, 33(6-2): 1101-1118 (in Korean with English abstract). https://doi.org/10.7780/KJRS.2017.33.6.2.6
  37. Yoon, S., 2013. statistical of extreme rainfall events and applications of radar rainfall estimates for reducing flood risk in Gyeongnam area, Kyungsang University, Jinju, KR (in Korean with English abstract).
  38. Yu, P.-S., T.-C. Yang, S.-Y. Chen, C.-M. Kuo, and H.-W. Tseng, 2017. Comparison of random forests and support vector machine for real-time radar-derived rainfall forecasting, Journal of Hydrology, 552: 92-104. https://doi.org/10.1016/j.jhydrol.2017.06.020