DOI QR코드

DOI QR Code

해양관측부위 자료 기반 딥러닝 기술을 활용한 해양 혼합층 수온 예측

Prediction of Sea Water Temperature by Using Deep Learning Technology Based on Ocean Buoy

  • 고관섭 (아주대학교 국방디지털융합학과) ;
  • 변성현 (국방대학교 국방과학학과) ;
  • 김영원 (국방대학교 국방과학학과)
  • Ko, Kwan-Seob (Department of Military Digital Convergence, Ajou University) ;
  • Byeon, Seong-Hyeon (Department of Defence Science, Korea National Defence University) ;
  • Kim, Young-Won (Department of Defence Science, Korea National Defence University)
  • 투고 : 2021.11.29
  • 심사 : 2022.06.21
  • 발행 : 2022.06.30

초록

최근 한반도 주역 해역의 수온이 꾸준히 증가하고 있다. 수온변화는 어업생태계에 영향을 미칠 뿐만 아니라 해양에서의 군사작전과도 밀접히 연관되어 있다. 본 연구는 딥러닝 기술을 기반으로 하는 다양한 예측모델을 통해 단기간 수온예측을 시도함으로써 어떠한 모델이 수온예측분야에 더욱 적합한지를 제시하는 것에 목적을 두었다. 예측을 위해 사용한 데이터는 국립수산과학원에서 해양 관측부이를 통해 관측한 2016년부터 2020년까지 동해 지역(고성, 양양, 강릉, 영덕)의 수온 데이터이다. 또한 예측을 위한 모델로는 시계열 데이터 예측에 우수한 성능을 보이는 Long Short-Term Memory (LSTM), Bidirectional LSTM 그리고 Gated Recurrent Unit (GRU) 기법을 사용하였다. 기존 연구가 LSTM만을 활용하였던데 반해 이번 연구에서는 LSTM 외에 다양한 기법을 적용함으로써 각 기법의 예측 정확도와 수행시간을 비교하였다. 연구결과, 1시간 예측을 기준으로 모든 관측지점에서 Bidirectional LSTM과 GRU 기법이 실제값과 예측값의 오차가 가장 적은 것으로 확인되었으며, 학습시간에 있어서는 GRU가 가장 빠른 것으로 확인되었다. 이를 통해, 예측 오차를 줄이면서 정확도를 향상하기 위한 수온예측에는 Bidirectional LSTM을 활용하고 대잠작전처럼 정확도 외에 실시간 예측이 필요한 분야에 있어서는 GRU 기법을 활용하는 방안이 더욱 적절할 것으로 판단된다.

Recently, The sea water temperature around Korean Peninsula is steadily increasing. Water temperature changes not only affect the fishing ecosystem, but also are closely related to military operations in the sea. The purpose of this study is to suggest which model is more suitable for the field of water temperature prediction by attempting short-term water temperature prediction through various prediction models based on deep learning technology. The data used for prediction are water temperature data from the East Sea (Goseong, Yangyang, Gangneung, and Yeongdeok) from 2016 to 2020, which were observed through marine observation by the National Fisheries Research Institute. In addition, we use Long Short-Term Memory (LSTM), Bidirectional LSTM, and Gated Recurrent Unit (GRU) techniques that show excellent performance in predicting time series data as models for prediction. While the previous study used only LSTM, in this study, the prediction accuracy of each technique and the performance time were compared by applying various techniques in addition to LSTM. As a result of the study, it was confirmed that Bidirectional LSTM and GRU techniques had the least error between actual and predicted values at all observation points based on 1 hour prediction, and GRU was the fastest in learning time. Through this, it was confirmed that a method using Bidirectional LSTM was required for water temperature prediction to improve accuracy while reducing prediction errors. In areas that require real-time prediction in addition to accuracy, such as anti-submarine operations, it is judged that the method of using the GRU technique will be more appropriate.

키워드

1. 서론

기후변화에 관한 정부 간 협의체(Intergovernmental Panel on Climate Change, IPCC)에서 발간한 보고서에 의하면 지난 5년(2016 2020)간 전 세계적인 기온은 1850년 이후 가장 높은 것으로 확인되었다. 기상청(Korea Meteorological Administration, KMA)에서 해양기상부 이를 통해 2020년 여름철 우리나라 주변 해양 수온 자료를 관측한 결과 역시, 우리나라 주변 해양 수온은 최초 관측된 1997년 20.7°C에서 2020년 21.8°C로 지속적으로 상승 추세 임을 확인하였다 (KMA, 2020). 이러한 수온 변화는 해양생태계에도 큰 영향을 미치게 된다. 해당 지역의 어종 분포, 어획량은 물론 어종 변화에도 직접적인 영향을 미친다. 한편, 해양수온의 변화는 해군의 작전과도 밀접하게 연관되어 있다. 그 중 하나가 잠수함을 탐지하는 대잠작전이다. 대잠작전에서는 음파를 활용하여 적대적 잠수함의 위치를 확인한다. 음파는 수온 층의 형성에 따라 회절하거나 반사하는 특징을 지니고 있어 대잠작전을 위해서는 주변 해역의 수온을 수집하고 분석하려는 노력이 필수적이다. 우리나라의 경우 해군과 기상청, 해양조사원, 수상과학원이 해양부이, 선박 등을 통해 얻은 수온 데이터를 수집하고 분석한다. 또한 우리나라 외에도 미 해군의 해군연구청(Office of Naval Research, ONR), 중국의 국가 해양환경예보센터와 같은 각국의 해양 관련 기관들이 주변 해역의 여러 지점에서 수온을 측정하고 다시 이를 분석하는 노력을 기울이고 있다.

그러나 이러한 노력들은 실시간으로 이루어지는 적대적 잠수함 전력에 대응하기에는 한계가 있다. 해양 관련 기관이 수온 데이터를 수집하고 분석하는 데 많은 시간은 물론 고성능의 전산기를 요구하기 때문이다. 본 연구는 최근 데이터 예측 분야에서 우수한 성능을 보이고 있는 딥러닝 기법을 수온 예측에 활용하였다. 이를 통해 잠수함 또는 함정이 수집한 수온 데이터를 분석기관에 보내지 않고도 자체 능력만으로도 예측이 가능하도록 단기간 수온 예측 모델을 설계하였다. 또한 모델 설계에 있어 딥러닝의 여러 기법을 수행 시간과 정확도를 통해 비교 분석함으로써 어떤 기법이 실시간성을 요구하는 대잠작전에 적합한지 제시하고자 한다.

2. 선행 연구고찰

1) 수치 모델에 기반한 수온 예측

수온을 예측하는 방법으로 현재 사용되고 있는 방법으로는 수치모델이 있다. 수치 모델은 바람, 기온, 습도와 같은 관측된 기상 요소의 시간 변화를 나타내는 물리 방정식에 대입하고 슈퍼컴퓨터에 입력함으로써 미래를 예측하는 방법이다(Lim et al., 2007). 우리나라에서는 국립수산과학원(National Institute of Fisheries Science)이 IPCC 4차 평가 보고서에서 사용된 기후 모델의 자료를 입수하여 한국형 해양기후 모델을 구축하고 있다. 또한, 국립해양조사원은 관측자료 기반의 관측 지점에 대한 예측 가능한 조석과 조류 예측정보 생산에서 점차적으로 수치 모델을 이용한 공간적 기본 해양예측정보(유 속, 해수면 높이, 수온, 염분) 생산체계를 구축하고 있다 (Kim et al., 2013).

국방분야에서는 국방과학연구소가 실시간 관측이 제한되는 점을 고려하여 과거 관측자료에 대한 데이터베이스와 제한적인 실시간 관측자료를 융합하여 잠수 함용 음탐환경 분석을 위한 실시간 Full Sound Speed Profile 추정 알고리즘을 개발하였다(ADD, 2005). 그러나 수치 모델을 기반으로 하는 수온 예측 알고리즘은 계산과정이 복잡하고 이를 계산하기 위한 복잡한 계산식과 고성능의 컴퓨터를 요구하는 단점을 지니고 있다.

2) 딥러닝 기법을 활용한 수온 예측

최근에는 딥러닝 기법을 활용하여 수온을 예측하는 연구가 활발히 진행되고 있다. Zhang et al. (2017)은 기존 수치모델의 단점과 Recurrent neural network (RNN) 기법의 단점을 극복하기 위한 방안으로 표층수온 예측 분야에서는 처음으로 Long Short-Term Memory (LSTM)을 활용함으로써 기존 수온예측 모델보다 예측이 정확해 졌음을 입증하였다. Jung et al. (2020)은 수온예측에 우수한 성능을 보여준 LSTM과 Convolutional LSTM 기법을 활용하여 남해지역에 대한 해수면 수온예측을 시도하였다. 실험결과, 시공간적인 특성을 동시에 학습할 수 있는 Convolutional LSTM이 LSTM 기반 모델보다 고수온 탐지에서 정확도가 높음을 확인하였다. 또한 중단기 예측 모델에서는 LSTM이 2일전, Convolutional LSTM 이 5일 전 탐지 예측이 가능함을 확인하였다.

또한, Park (2019)은 LSTM 기법을 활용하여 국립해양 조사원 등에서 관측한 우리나라 서해 14개 지점에 대한 수온예측을 시도하였다. 수온예측에는 1시간부터 72시간 이후까지의 실제값과 예측값을 비교하였으며, 1시 간 후 평균절대오차는 0.52°C, 6시간 후 평균절대오차 는 0.64°C, 12시간 후 평균절대오차는 0.58°C, 24시간 후 평균절대오차는 0.77°C, 48시간 후 평균절대오차는 1.02°C, 72시간 후 평균절대오차는 1.01°C로 시간이 경과함에 따라 오차가 커지는 것을 확인하였다. 특히, Ko et al. (2021)은 이어도 해양과학기지에서 관측한 수심 38 m 지점까지의 수온 데이터와 LSTM 기법을 활용하여 기존 연구에서 다루지 않았던 해양 혼합층 수온 예측을 시도하였으며, 표층수온의 데이터로 저층수온 예측이 가능함을 입증하였다.

하지만 기존 연구의 경우 딥러닝 기법을 활용하여 수온을 예측함에 있어 LSTM 기법만을 활용하였다. LSTM 기법에서 파생되어 최근 날씨 예측과 같은 분야에서 우수한 성능을 보이고 있는 Bidirectional LSTM이나 Gated Recurrent Unit (GRU) 기법은 활용되지 않았다. 따라서 이번 연구에서는 LSTM, Bidirectional LSTM, GRU 기법을 모두 활용하여 성능을 비교함으로써 어느 기법이 잠수함 탐지와 같은 실시간 수온 예측 영역에 더욱 적합한지를 확인하였다.

3. 연구지점 및 자료

1) 연구지점 및 데이터

국내에서 해양 관측 데이터를 제공하는 기관은 기상과학원, 해양조사원, 수산과학원 등이 있다. Table 1은 각 기관에서 제공하고 있는 해양 관측 데이터이다. 기관마다 관측 내용과 주기, 최대 수심이 각기 다른 것을 확인할 수 있다. 이 중에서도 저층 수온의 데이터를 제공하는 곳은 국립수산과학원과 국립해양조사원이며, 국립수산과학원의 경우 해양관측 부이로 관측한 일부 지점에 대해서만 해양수심에 따른 수온 자료를 제공하고 있다. 이번 이번 연구에서는 잠수함의 위치와 활동 범위와 연계한 해양수심에 따른 수온을 예측하기 위한 자료로써 동해안에 위치한 고성, 양양, 강릉, 영덕지점 (Fig. 1)의 데이터를 수온 예측에 활용하였다.

Table 1. Ocean observation data by Institution

OGCSBN_2022_v38n3_299_t0001.png 이미지

OGCSBN_2022_v38n3_299_f0001.png 이미지

Fig. 1. Location(Goseong,Yangyang,Gangneung,Yeongdeok) of this Study.

2) 데이터 분석 및 전처리

국립수산과학원에서 제공한 고성, 양양, 강릉, 영덕지점의 데이터를 Table 2와 같이 수심에 따른 최고·최저수온과 평균 수온으로 분석하였다. 먼저, 각 측정지점별 최고 수온을 살펴보면 표층(5 m) 수온은 양양이 29°C로 제일 높았으며, 중층(20 m)수온은 강릉과 영덕이 28.2°C로 동일하였고, 저층(30 m) 수온은 34.5°C로 고성의 저층 수온이 제일 높은 것으로 나타났다. 한편, 고성 지점의 저층 수온의 최고온도가 34.5°C로 같은 시기의 수온에 비해 과도하게 높아 이를 측정 장비의 이상으로 판단하고 이후 데이터 전처리 과정에서 이전 시간 값으로 대체하였다. 최저수온의 경우 강릉 지점의 저층 수온이 0.9°C로 가장 낮았는데, 다른 지점의 최저수온과의 1°C 미만으로 관측지점에 따라 수온 차는 크게 나지 않는 것으로 확인되어 그대로 활용하였다. 한편 영덕의 중층수 온 최저값이 0°C로 측정되어 이전 시간의 수온 값으로 보정하였다.

Table 2. Sea water temperature at the observation point

OGCSBN_2022_v38n3_299_t0002.png 이미지

또한 각 관측지점에서 관측한 수온 데이터는 짧게는 몇 시간 이내에서 길게는 1주일 이상의 기간의 결측값이 있는 것을 확인할 수 있었다. Table 3은 관측지점마다 표층, 중층, 저층 수온의 결측값이다. 결측값은 관측지점에 따라 최소 786개에서 최대 6,142개까지 서로 달랐다. 이러한 결측값은 측정 장비의 고장 등으로 측정이 되지 않았거나 관측기관에서 데이터 검증간 신뢰할 수 없어 처리하지 않은 데이터이다.

Table 3. Number of missing values of Sea water data

OGCSBN_2022_v38n3_299_t0003.png 이미지

이러한 결측값을 대체하지 않고 삭제하는 경우 예측 모델을 생성하고 학습하는데 저조한 결과를 초래할 수 있어 결측값을 채우는 것으로 데이터를 전처리하였다. 결측값을 대체하는 방법에는 결측값의 이전 값 또는 이후 값으로 대체하는 방법이 있으며, 결측 이전값과 이후 값의 평균 또는 선형보간법을 이용하여 대체하는 방법이 있다. 수온의 경우 계절성 특징을 보이면서도 시간 변화에 따라 하루 사이에도 값이 차이가 크게 나기 때문에 장기간 결측값을 이전, 이후, 또는 평균값으로 대체할 경우 예측에 오차가 더욱 커진다. 따라서 이번 연구에서는 결측값의 이전과 이후 값을 직선 거리에 따라 선형적으로 계산하는 선형보간법을 사용하여 결측값을 대체하였다. Fig. 2는 데이터 전처리 이전(a)와 평균값으로 대체한 데이터(b), 그리고 선형보간법을 사용하여 전 처리한 데이터 (c)를 나타난 그래프이다.

OGCSBN_2022_v38n3_299_f0002.png 이미지

Fig. 2. (a) Before Data Preprocessing, (b) Data Preprocessing Using Mean Substitution, and (c) Data Preprocessing Using Linear Interpolation.

4. 연구 방법

1) 시계열 학습 딥러닝 기법

(1) RNN

시계열 데이터를 학습하고 예측하기 위한 딥러닝 기법에는 순환신경망(RNN)이 있다. 순환신경망은 은닉계층 안에 하나 이상의 순환(Recurrent) 계층을 갖는 신경망을 의미한다. 기존의 신경망은 은닉층에서 활성화 함수를 지닌 값으로 오직 출력층 방향으로만 향하는 Feed Forward Neural Network (FFNN)이다. 입력 신호가 다음 층(중간층)으로 전달되고, 그 신호를 받은 층은 그다음 층으로 전달되는 형식으로 한 방향으로만 신호가 전달되는 형식이다 (Saito, 2019). 이러한 FFNN은신경망 구성이 단순하여 구조가 쉽고 많은 문제에 응용할 수 있는 장점이 있으나, 단순한 Feed Forward Neural Network에서는 시계열 데이터의 성질(패턴)을 학습할 수 없다는 단점이 있다. 그러나, RNN은 순환경로를 포함하기 때문에 FFNN과 달리 과거의 정보까지를 기억할 수 있다. 하지만 RNN의 경우. 비교적 짧은 절차(sequence)에 대해서만 효과를 보이는 단점이 있다. RNN은 입력과 출력 데이터 사이가 멀어지는 경우, 즉 시점(time step)이 길어질수록 앞의 정보가 뒤로 충분히 전달되지 못하는 현상인 장기의존성 문제(Long-term Dependencies)가 발생한다(Kwak et al., 2019).

(2) LSTM 

LSTM은 앞서 RNN의 장기의존성 문제를 해결하고자 고안된 알고리즘으로 단기 기억(Short-term)을 오랜(Long) 시간 동안 지속할 수 있는 것을 의미한다. Fig. 3에서처럼 LSTM은 Input Gate, Forget Gate, Output Gate 라는 3개의 게이트(Gate)로 이루어져 있다. Forget Gate는 Cell State에서 어떤 과거 정보를 잊을지 결정하는 Gate이다. Input Gate는 현재 입력정보 중에 어떤 정보를 Cell State에 더해줄지 결정한다. Output Gate는 Cell State와 현재 입력으로부터 출력값(ht) 정보를 선택한다 (Kim et al., 2020).

OGCSBN_2022_v38n3_299_f0003.png 이미지

Fig. 3. Structure of RNN and LSTM (Ko and Shin, 2018).

(3) BidirectionalLSTM

일반적인 RNN과 LSTM은 입력 순서를 시간 순서대로 처리하기 때문에 결과는 주로 직전 패턴만을 기반으로 하는 경향을 보이는 한계가 있다. 즉시 계열 정보를 예측할 때 뒤에서 앞으로 가는 역방향의 데이터는 활용할 수 없다. 이 단점을 해결하는 목적으로 Bidirectional LSTM이 제안되었다. Fig. 4는 Bidirectional LSTM의 구조로 순방향과 역방향의 두 개의 분리된 순환신경망을 통해 학습이 진행되는 것을 알 수 있다. 이를 통해 과거와 미래의 양방향으로 데이터를 수집하고 기억한다. 이러한 방법으로 학습되는 시계열 데이터의 역방향에 은닉 계층을 추가시킨다면 성능이 더 향상된다(Kwak and Lim, 2021).

OGCSBN_2022_v38n3_299_f0004.png 이미지

Fig. 4. Structure of Bidirectional LSTM.

(4) GRU

GRU는 RNN이 갖고 있던 장기의존성 문제를 해결하면서 LSTM의 구조를 더욱 간단하게 만든 모델이다. LSTM에서는 Input gate, Forget gate, Output gate 3개의 gate가 있지만, Fig. 5와 같이 GRU에는 Reset gate, Update gate 2개의 gate만을 사용한다. Reset gate는 이전 시점의 hidden state와 현시점의 x를 활성화 함수 시그모이드를 적용하여 구한다. 결과값은 0–1 사이의 값을 갖고 이전 hidden state의 값을 얼마나 활용할 것인지 결정한다. Update gate는 LSTM의 Input gate 및 Forget gate와 비슷한 역할을 하며 과거와 현재의 정보를 각각 얼마나 반영할지에 대한 비율을 구한다. GRU는 LSTM보다 연산 속도가 빠르다는 장점을 갖고 있다(Kim et al., 2021).

OGCSBN_2022_v38n3_299_f0005.png 이미지

Fig. 5. Structure of GRU (Kwak and Lim, 2021).

2) 성능평가 지표

가지 딥러닝 기반 예측 모델의 성능을 비교하기 위한 평가지표로 평균절대오차(Mean Absolute Error, MAE; 식(1))와 평균제곱근오차(Root Mean Square Error, RMSE; 식(2))를 사용하였다. 먼저, MAE는 예측값과 실제값의 차이를 절댓값으로 변환하여 평균화한 값이다. MAE는 오차에 있어서 절댓값을 취하기 때문에 오차의 크기를 그대로 반영하는 특징을 갖고 있다. RMSE는 예측값과 실제값의 사이의 절대 오차인 Mean Squared Error (MSE)에 루트 값을 씌우고 제곱하여 평균화한 값이다. MSE의 경우 특이값이 존재하면 수치가 많이 늘어난다는 특징을 지니고 있다. 이를 보완하고자 MSE에 루트를 씌운 값이 RMSE로 RMSE는 오차가 클수록 가중치가 높이 반영된다. 본 연구에서는 성능지표로 MAE와 RMSE를 동시에 사용하여 실제값과 예측값의 차이를 설명하였다.

   \(M A E=\frac{1}{n} \sum_{i=1}^{n}\left|y_{i}-\widehat{y}\right|\)    (1)

   \(R M S E=\sqrt{\frac{\sum_{i=1}^{n}\left(y_{i}-\widehat{y}\right)^{2}}{n}}\)    (2)

3) 모델 설계 및 학습

본 연구에서 Keras와 Tensorflow를 기반으로 하여 LSTM, Bidirectional LSTM 그리고 GRU의 딥러닝 기법을 적용한 예측 모델을 개발하였다. 먼저, 예측 모델을 최적화하기 위해 학습의 횟수를 의미하는 epoch와 학습의 크기인 batch 사이즈, 은닉층의 개수를 변경해가며 최적화를 시도하였다. 또한, 조기 종료 기능을 통해 학습하다가 오차가 증가하는 것을 감지하면 종료하도록 설정하였다. 이러한 종료 기능은 예측 모델의 과적합을 방지할 수 있다.

모델 최적화를 위한 학습을 위해 사용한 데이터는 국립수산과학원에서 측정한 2016년부터 2020년까지의 강릉지역의 수온 데이터를 활용하였다. 2016년부터 2020년까지의 데이터는 학습 데이터로 활용하였고, 2020년의 데이터는 평가 데이터로 입력하였다. LSTM을 기반으로 하여 epoch를 50, 100, 150, 200으로 설정하여 실험을 진행한 결과, RMSE는 0.71, 0.644, 0.619, 0.61으로 나타났다. Epoch가 150 이후로는 예측값과 실제값에는 큰 변화가 없다는 것을 확인하였다. epoch 수를 늘리면 오차에는 큰 차이가 없으나, 수행 속도가 늘어나기 때문에 이후 성능 실험은 epoch를 150으로 설정하였다. 다음으로 batch 사이즈를 각각 12, 24, 36, 48, 72로 설정하고 성능을 비교하였다. batch 크기가 12, 24, 36, 48, 72일 때 RMSE가 0.673, 0.614, 0.605, 0.59, 0.644로 batch 크기가 72일 때 오히려 오차가 늘어나는 것을 확인하였다. 마지막으로 은닉층의 개수를 늘려가며 실험을 진행하였다. Epoch와 batch 크기를 고정한 상태에서 은닉층의 수를 1, 2, 3으로 늘려 실험을 진행하였을 때 RMSE는 0.605, 0.616 0.623으로 레이어 층의 개수를 늘려도 학습 결과에는 큰 영향을 미치지 않는 것으로 확인하였다.

이에 이번 연구에서는 모델 학습을 위한 설정은 epoch는 150, batch 사이즈는 48, 그리고 은닉층의 개수는 1로 설정하였으며, 고성, 양양, 강릉, 영덕에서 측정한 2016년부터 2019년까지의 데이터를 학습 데이터로 2020년 데이터를 평가 데이터로 하여 LSTM, Bidirectional LSTM 그리고 GRU 3가지 모델을 학습하고 1시간 이후의 수온을 예측함으로써 각 모델의 성능을 비교하였다

5. 연구 결과

1) 예측 오차에 따른 성능

연구지점을 기준으로 각 모델의 성능을 Table 4와 같이 성능 평가지표인 MAE와 RMSE를 이용하여 비교하였다. 먼저, 고성의 경우 LSTM 모델로 학습한 결과를 보면 예측값과 실제값의 오차를 MAE로 평가한 값은 0.306이었고, RMSE는 0.543이었다. 다음으로 Bidirectional LSTM으로 평가한 결과는 MAE가 0.195, RMSE가 0.503이었으며, GRU 모델로 평가한 결과는 MAE가 0.245, RMSE가 0.516으로 나타났다. 고성을 기준으로는 Bidirectional LSTM 기반 모델이 예측 오차가 가장 적은 것으로 확인하였다. 다음으로 양양의 경우, MAE가 가장 낮은 모델은 GRU가 0.308이었으며, RMSE 가 가장 낮은 모델은 Bidirectional LSTM이 0.709로 가장 낮았으나, GRU의 RMSE가 0.715로 Bidirectional LSTM 기반 모델과 거의 유사한 수준이었다. 강릉은 MAE는 GRU가 0.319로 오차가 가장 적었고 RMSE 역시 GRU가 0.708로 가장 적은 것으로 확인되었으며, 영덕은 MAE는 GRU 모델이 0.775로 가장 낮았고 RMSE는 Bidirectional LSTM이 0.768로 가장 낮았다.

Table 4. Performance comparison by Deep Learning Model

OGCSBN_2022_v38n3_299_t0004.png 이미지

2) 학습 시간에 따른 성능 비교

앞서 예측 오차에 따른 성능 비교에서는 Bidirectional LSTM과 GRU가 우수한 성능을 보였다. 대잠작전과 같은 군사작전에서는 예측값과 실제값의 차이가 어느 정도인지도 중요하나, 실시간으로 수온을 예측하여 음파와의 관계를 얼마나 빠르게 정의하는 작업 역시 중요하다. 따라서 Table 5와 같이 각 모델별로 학습시간을 계산하여 성능을 비교하였다.

Table 5. Learning Time by Deep Learning Model

OGCSBN_2022_v38n3_299_t0005.png 이미지

학습시간을 계산한 결과, 전반적으로 LSTM의 학습 시간이 GRU보다 낮거나 유사하였으며, 학습에 가장 오랜 시간이 소요되는 모델은 Bidirectional LSTM이었다. 고성에서 관측한 수온데이터로 예측한 모델의 경우 Bidirectional LSTM 기법을 활용한 모델의 학습 시간이 295,000 ms로 LSTM모델의 학습시간인 43,578 ms와는 6.7배 정도 차이가 났다. 한편, 영덕의 수온 데이터를 GRU로 학습한 시간은 62,203 ms 였던 데 반해 Bidirectional LSTM은 185,844 ms로 약 2.98배 차이가 나는 것으로 확인되었다. Bidirectional LSTM과 LSTM, GRU의 학습시간은 최소 2.9배에서 최대 6.7배까지 차이가 나는 것이다. 학습 속도면에서는 GR와 LSTM이 Bidirectional LSTM보다 우수한 성능을 보이는 것이다.

3) 은닉층 레이어 수 변화에 의한 성능 비교

이번 연구에서는 시험을 위한 은닉층의 수를 1로 설정하고 실험을 진행하였다. 그러나 앞서 학습속도에 있어 LSTM보다 빠르다고 알려진 GRU 기법이 LSTM과 비슷하거나 오히려 느린 지점도 확인되었다. 이에, 은닉층의 레이어 수를 최초 1에서 3, 5로 늘려가며 LSTM과 GRU의 수행 속도를 비교하였다. 실험 결과, Table 6과 같이 양양을 기준으로 LSTM은 72,578 ms, 122,125 ms, 121,875 ms로 속도가 느려지는데 반해, GRU는 74,656 ms, 56,828 ms, 49,188 ms로 빨라지는 것을 확인하였다. 레이어 수가 1일 때는 수행 속도의 차이가 크게 나지 않으나 레이어 수가 늘어날수록 GRU 기법이 LSTM보다 더 빨라졌다. 양양 이외에도 다른 관측지점으로 실험한 결과 역시 은닉층의 레이어의 수를 늘리면 LSTM은 학습 시간이 더 많이 소요되는 반면, GRU는 더 빨라지는 것을 확인하였다.

Table 6. ComparisonofLearningTimebyNumberofhidden layer

OGCSBN_2022_v38n3_299_t0006.png 이미지

4) 수심에 따른 예측 정확도 분석

표층(5 m) 수온 이외에 해양 수심 변화에 따라 수온 예측 오차가 어떻게 변화하는지 확인하기 위해 각 연구지점별로 오차를 분석하였다(Table 7). 모든 연구지점에서 20 m에서 30 m로 수심이 깊어지면 오차가 늘어나는 것으로 나타났다. 이는 Ko et al. (2021) 연구에서 수심이 깊어질수록 표층 수온과 저층 수온 간의 수온 차이가 많이 나게 되어 오차도 커진다는 결과와 유사하다고 볼 수 있다. 또한 앞서 Table 3에서 확인한 각 연구지점별 결측값의 개수에서 수심 20 m 지점의 결측값보다 수심 30 m 지점의 결측값의 개수가 많은 것을 고려하면 전처리 과정을 거친 데이터라 할지라도 결측값의 개수가 오차에도 영향을 미치는 것으로 분석된다.

Table 7. Performance according to water depth change

OGCSBN_2022_v38n3_299_t0007.png 이미지

5) 연구 결과

해양 수온의 실제값과 예측값 오차는 Bidirectional LSTM이 LSTM보다 우수한 성능을 보였다. 이는 Bidirectional LSTM이 LSTM과 달리 역방향의 데이터까지를 분석하기 때문으로 판단된다. 한편 수행속도면에서 Bidirectional LSTM이 LSTM보다 학습에 시간이 더 많이 소요되었는데, 이는 Bidirectional LSTM은 LSTM과 달리 한 방향이 아닌 양방향으로 학습하기 때문에 시간이 더 많은 시간이 소요되는 것으로 분석될 수 있다. 또한 은닉층의 개수를 늘려가며 실험을 진행하였을 때 GRU가 LSTM보다 학습속도가 빠른 것을 확인하였다. 이는 GRU의 구조에서 기인한 것으로 GRU가 LSTM보다 게이트 수가 적어 학습속도가 더 빠른 것으로 분석되며, 수온 예측 이외에 다른 연구 결과와 유사하다. 특히 수심이 증가할수록 오차가 커지는 것을 확인하였다. 앞선 결과를 종합해보면, 잠수함을 탐지하기 위한 수온 예측과 같이 빠른 수행 시간과 정확도를 필요로 하는 수온 예측에 있어서는 GRU기법을 활용하는 방안이 고려되어야 한다.

6. 결론

본 연구에서는 국립수산과학원에서 해양관측부이 를 통해 원격으로 관측한 우리나라 동해안 지역의 2016년부터 2020년까지의 혼합층수온 데이터를 활용하여 저층 수온을 예측하고자 하였다. 관측된 데이터는 장비 고장 등으로 인해 결측값이 다수 존재하여 전처리 과정을 수행하였고, 예측 모델의 최적화된 성능을 도출하기 위해 batch 크기와 epoch, 은닉층의 개수를 달리하여 실험을 진행하였다. 최적화된 모델 설정을 통해 인공신경망 기법 중 시계열 데이터 처리에 우수한 성능을 보이고 있는 LSTM, Bidirectional LSTM, GRU 기법을 모두 사용하여 실제값과 예측값의 차이를 확인하는 한편, 수행 속도를 비교함으로써 혼합층수온 예측을 위한 최적의 기법을 제시하였다.

성능을 비교하기 위한 지표로 MAE와 RMSE를 활용하였으며, 오차에 있어서는 Bidirectional LSTM과 GRU 가 LSTM보다 우수한 성능을 보이는 것으로 확인하였으나, 학습 시간에 있어서는 Bidirectional LSTM이 GRU와 LSTM보다 2.9–6.7배까지 차이가 나는 것으로 확인되었다. 따라서 혼합층수온을 예측하기 위한 최적의 기법으로 GRU 기법이 우수함을 입증하였다.

이번 연구에서는 최근 5년치의 데이터를 학습에 활용하였으므로, 향후에는 보다 많은데이터를 활용하여 수행 속도와 성능 차이가 얼마만큼 나는지를 실험할 예정이다. 또한 수온 예측 외에 기상, 강우량 예측과 같은 분야에 LSTM 기반으로 한 딥러닝 기술을 활용하고 그 성능을 비교함으로써 실시간 예측에 적합한 모델을 제안하고자 한다.

참고문헌

  1. ADD (Agency for Defense Development), 2005. Research on the Data Assimilation Methods for the Realtime Forecast Model of the EastSea, Agency for Defense Development, Daejeon, Korea, p. 256.
  2. Choi, H.M., M.K. Kim, and H. Yang, 2020. High water temperature prediction using RNN-based LSTM, Proc. of The Korean Institute of Information Scientists and Engineers Conference, Dec. 21-23, pp. 693-695.
  3. Joo, I.T. and S.H. Choi, 2018. Stock Prediction Model based on Bidirectional LSTM Recurrent Neural Network, The Journal of Korea Institute of Information, Electronics, and Communication Technology, 11(2): 204-208 (in Korean with English abstract). https://doi.org/10.17661/JKIIECT.2018.11.2.204
  4. Jung, S.H., Y.J. Kim, S.M. Park, and J.H. Im, 2020. Prediction of Sea Surface Temperature and Detection of Ocean Heat Wave in the South Sea of Korea Using Time-series Deep-learning Approaches, Korean Journal of Remote Sensing, 36(5-3): 1077-1093 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2020.36.5.3.7
  5. KMA (Korea Meteorological Administration), 2020. Korean Peninsula Impact Typhoon Analysis Report 2020, https://www.kma.go.kr/download_01/typhoon/typeffect_2020.pdf, Accessed on Jun. 20, 2021.
  6. Ko, K.S., Y.W. Kim, S.H. Byeon, and S.J. Lee, 2021. LSTM Based Prediction of Ocean Mixed Layer Temperature Using Meteorological Data, Korean Journal of Remote Sensing, 37(3): 603-614 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2021.37.3.19
  7. Ko, S.J., H.Y. Yun, and D.M. Shin, 2018. Electronic Demand Data Prediction Using Bidirectional Long Short Term Memory Networks, Journal of Software Assessment and Valuation, 14(1): 33-40 (in Korean with English abstract).
  8. Kim, R.M., K.M. Kim, and J.H. Ahn, 2021. Comparison Between Random Forest and Recurrent Neural Network for Photovoltaic Power Forecasting, Journal of Korean Society of Environmental Engineers, 43(5): 347-355 (in Korean with English abstract). https://doi.org/10.4491/KSEE.2021.43.5.347
  9. Kim, Y.I., D.H. Kim, and S.O. Lee, 2020. Prediction of Temperature and Heat Wave Occurrence for Summer Season Using Machine Learning, Journal of Korean Society of Disaster and Security, 13(2): 27-38 (in Korean with English abstract). https://doi.org/10.21729/ksds.2020.13.2.27
  10. Kim, Y.H., B.J. Choi, J.S. Lee, D.S. Byun, K.R. Kang, Y.G. Kim, and Y.K. Cho, 2013. Korean Ocean Forecasting System: Present and Future, The Sea: Journal of the Korean Society of Oceanography, 18(2): 89-103 (in Korean with English abstract). https://doi.org/10.7850/jkso.2013.18.2.89
  11. Kwak, N.W. and D.H. Lim, 2021. Financial time series forecasting using AdaBoost-GRU ensemble model, Journal of the Korean Data & Information Science Society, 32(2): 267-281 (in Korean with English abstract). https://doi.org/10.7465/jkdi.2021.32.2.267
  12. Kwak, G.H., M.G. Park, C.W. Park, K.D. Lee, S.I. Na, H.Y. Ahn, and N.W. Park, 2019. Combining 2D CNN and bidirectional LSTM to consider spatiotemporal features in crop classification, Korean Journal of Remote Sensing, 35(5-1): 681-692 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2019.35.5.1.5
  13. Lim, S.H., J.Y. Yun, Y.B. Kim, and S.H. Nam, 2007. Variability of Underwater Sound Propagation in the Northern Part of the East Sea, Korea Institute of Military Science and Technology, 10(4): 52-61 (in Korean with English abstract).
  14. Moon, J.H., S.S. Park, and E.J. Hwang, 2019. A Multilayer Perceptron-Based Electric Load Forecasting Scheme via Effective Recovering Missing Data, KIPS Transactions on Software and Data Engineering, 8(2): 67-78 (in Korean with English abstract). https://doi.org/10.3745/KTSDE.2019.8.2.67
  15. Park, J.H., 2019. Prediction of Short-term Surface Water Temperature Using Artificial Neural Network, University of Seoul, Seoul, Korea.
  16. Saito, G.K., 2019. Deep Learning from scratch, O'Reilly Media, Sebastopol, CA, USA.
  17. Zhang, Q., H. Wang, J. Dong, G. Zhong, and X. Sun, 2017. Prediction of sea surface temperature using long short-term memory, IEEE Geoscience and Remote Sensing Letters, 14(10): 1745-1749. http://doi.org/10.1109/LGRS.2017.2733548