DOI QR코드

DOI QR Code

Automatic Extraction of Training Data Based on Semi-supervised Learning for Time-series Land-cover Mapping

시계열 토지피복도 제작을 위한 준감독학습 기반의 훈련자료 자동 추출

  • Kwak, Geun-Ho (Geoinformatic Engineering Research Institute, Inha University) ;
  • Park, No-Wook (Department of Geoinformatic Engineering, Inha University)
  • 곽근호 (인하대학교 공간정보공학연구소) ;
  • 박노욱 (인하대학교 공간정보공학과)
  • Received : 2022.09.22
  • Accepted : 2022.10.04
  • Published : 2022.10.31

Abstract

This paper presents a novel training data extraction approach using semi-supervised learning (SSL)-based classification without the analyst intervention for time-series land-cover mapping. The SSL-based approach first performs initial classification using initial training data obtained from past images including land-cover characteristics similar to the image to be classified. Reliable training data from the initial classification result are then extracted from SSL-based iterative classification using classification uncertainty information and class labels of neighboring pixels as constraints. The potential of the SSL-based training data extraction approach was evaluated from a classification experiment using unmanned aerial vehicle images in croplands. The use of new training data automatically extracted by the proposed SSL approach could significantly alleviate the misclassification in the initial classification result. In particular, isolated pixels were substantially reduced by considering spatial contextual information from adjacent pixels. Consequently, the classification accuracy of the proposed approach was similar to that of classification using manually extracted training data. These results indicate that the SSL-based iterative classification presented in this study could be effectively applied to automatically extract reliable training data for time-series land-cover mapping.

이 연구에서는 시계열 토지피복도를 제작하기 위해 분석자 개입 없이 준감독학습 기반 분류를 이용하는 새로운 훈련자료 추출 기법을 제안하였다. 준감독학습 기반 훈련자료 추출 기법은 먼저 분류 대상 영상과 유사한 토지피복 특성을 포함하는 과거 영상으로부터 획득한 초기 훈련자료를 이용하여 초기 분류를 수행한다. 이후, 분류의 불확실성 정보와 인접 화소의 분류 항목을 제약 조건으로 이용하는 준감독학습 기반 반복 분류를 이용하여 초기 분류 결과로부터 신뢰할 수 있는 훈련자료를 추출한다. 준감독학습 기반 훈련자료 추출기법의 적용 가능성은 농경지에서 unmanned aerial vehicle 영상을 이용하는 분류 실험을 통해 평가되었다. 제안한 준감독학습 기반 훈련자료 추출 기법에 의해 자동으로 추출된 새로운 훈련자료를 이용하는 것은 초기 분류 결과에서 나타난 오분류를 두드러지게 완화할 수 있었다. 특히, 인접 화소의 공간 문맥 정보를 고려함으로써 고립된 화소가 크게 감소하였다. 결과적으로, 제안 기법의 분류 정확도는 수동으로 추출한 훈련자료를 이용하는 분류 정확도와 유사하였다. 이러한 결과는 이 연구에서 제시한 준감독학습 기반 반복 분류가 시계열 토지피복도를 제작하기 위해 신뢰할 수 있는 훈련자료를 자동으로 추출하는데 효과적으로 적용될 수 있음을 나타낸다.

Keywords

1. 서론

광범위한 지역을 주기적으로 촬영할 수 있는 원격탐사 자료는 지구환경 모니터링을 수행하기 위한 주요 자원 중 하나이다. 특히 감독 분류를 이용하여 토지피복도를 제작하는 것은 원격탐사 기반의 지구환경 모니터링을 위한 가장 대표적인 응용 분야에 해당된다(Kim et al., 2010; Kim et al., 2021). 이러한 주제도는 다양한 분야에서 2차 분석을 위한 기초자료로 이용되기 때문에, 신뢰성 높은 토지피복도를 제작하는 것은 매우 중요하다.

감독 분류를 이용하여 제작된 토지피복도의 신뢰성을 높이기 위해서는 다량의 양질의 훈련자료를 수집할 필요가 있다(Deng et al., 2018; Kwak and Park, 2022). 그러나 훈련자료를 수집하는 과정에는 전문가의 사전 지식과 더불어 많은 시간과 비용이 소요되는 한계가 수반된다. 특히 연단위로 주기적인 모니터링을 수행하기 위해서는 시계열 토지피복도 제작이 필요한데, 이러한 경우 매년 다량의 양질의 훈련자료를 수집하는 것은 시간과 비용 측면에서 더욱 어려운 작업이 된다.

준감독학습(semi-supervised learning, SSL)은 감독 분류에서 훈련자료의 수집 문제를 완화하기 위한 가장 대표적인 방법론으로(Bruzzone et al., 2006; Tan et al., 2014; Romaszewski et al., 2016), 초기 적은 수의 훈련자료와 함께 다량의 레이블이 없는 자료를 이용한다. 먼저 초기 훈련자료를 이용하여 초기 분류 결과를 생성한 다음 불확실성이 낮은 레이블이 없는 자료에 분류 항목을 자동으로 할당함으로써 훈련자료를 확장한다. 분석자의 추가적인 수동 작업을 필요로 하지 않기 때문에 이 방법은 훈련자료를 수집하는데 필요한 시간 및 비용을 크게 줄일 수 있다. 따라서 매년 다량의 훈련자료 수집이 필요한 시계열 토지피복도 제작에 준감독학습은 유용하게 적용될 수 있다.

준감독학습의 분류 성능은 레이블이 없는 자료의 품질에 큰 영향을 받는다. 다시 말하자면, 불확실성이 낮은 영역에서 레이블이 없는 자료에 분류 항목을 할당하기 때문에 분류 항목의 분광 특성이 명확한 경우 우수한 성능을 보이는 것으로 알려져 있다(Romaszewski et al., 2016). 반대로 분류 항목 간 분광특성이 혼재되는 경우에는 새롭게 추가된 훈련자료로 인해 오히려 분류 성능이 저하될 수도 있다. 이러한 문제를 완화하기 위해 방법론 측면에서는 공간적인 연속성으로 인해 특정 화소 주변이 동일한 항목일 가능성이 높은 토지피복의 특성인 공간 문맥 정보를 이용해 왔다(Camps-Valls et al., 2007; Ghimire et al., 2010). 또한 서로 다른 시기나 지역에서 촬영된 영상의 경우 기상 조건의 차이에 따른 방사학적 불일치가 발생할 수 있기 때문에 입력 자료 측면에서는 초기 훈련자료와 레이블이 없는 자료가 동일한 영상으로부터 수집된 경우에 주로 적용되어 왔다(Wang et al., 2014; Kwak et al., 2017). 다만 동일한 지역에서 서로 다른 시기에 획득된 영상은 방사학적 불일치가 존재하더라도 서로 유사한 토지피복 정보를 갖고 있기 때문에 과거 영상에서 수집한 훈련자료를 준감독학습의 초기 훈련자료로 이용할 가능성이 존재한다. 그럼에도 불구하고 서로 다른 시기에 획득된 영상을 이용하여 준감독학습 기반 분류를 적용한 연구는 매우 드문 상황이다.

이 연구에서는 시계열 토지피복도 제작을 위해 훈련자료 수집에 필요한 시간 및 비용을 최소화하는 것을 목적으로 분석자 개입 없이 훈련자료를 수집하는 준감독 학습 기반의 훈련자료 추출 기법을 제안하였다. 이때 불확실성이 낮은 영역에서 레이블이 없는 자료에 분류 항목을 할당하기 위해 분류 모델의 불확실성 정보와 함께 분류 결과에서 인접한 화소의 분류 항목을 고려하는 공간 문맥 정보를 이용하였다. 제안 기법의 적용 가능성을 평가하기 위해 연단위로 토지피복의 변화가 크게 발생하는 밭작물 재배지를 대상으로 사례연구를 수행하였다.

2. 자료 및 연구 방법

1) 연구 지역 및 사용 자료

사례연구 지역은 경상북도 합천군 초계면의 일부지역으로 선정하였다. 이 지역은 대표적인 마늘/양파 주산지로 마늘, 양파와 더불어 맥류를 함께 재배하고 있으며, 일부 필지는 나지 상태의 휴경지로 관리하고 있다. 분류 항목은 건물, 도로 등과 같은 비작물을 제외하고 마늘, 양파, 맥류, 휴경지로 정의하였다.

사례연구 지역의 분류에는 대상 지역의 규모와 필지 크기를 종합적으로 고려하여 가시광선 파장대역(RGB)의 자료를 획득할 수 있는 Canon IXUS/ELPH 카메라로 촬영된 unmanned aerial vehicle (UAV) 영상을 이용하였다(Fig. 1). 이 연구에서 이용한 UAV 영상은 사례연구지역에서 재배하는 모든 작물의 식생활력도가 가장 높은 4월 말에 촬영되었다. 그리고 훈련자료를 자동으로 추출하는데 동일 지역 이전 연도에 획득한 훈련자료의 이용 가능성을 검토하기 위해 2018년과 2019년에 촬영된 영상을 이용하였다(Table 1). 2018년에 촬영된 영상은 초기 훈련자료를 수집하는데 이용되며, 이후 2019년에 촬영된 영상은 초기 훈련자료를 이용하여 새로운 훈련자료를 추출하고 분류를 수행하기 위한 분류 대상 영상으로 이용된다.

OGCSBN_2022_v38n5_1_461_f0001.png 이미지

Fig. 1. UAV images and ground truth map acquired in 2018 and 2019.

Table 1. Summary of UAV images used in this study

OGCSBN_2022_v38n5_1_461_t0001.png 이미지

이 연구에서는 촬영한 UAV 영상으로부터 육안 판독을 수행한 후에 구분이 모호한 필지에 대해 현장방문을 수행하여 구축한 2018년과 2019년의 현장조사자료를 이용하였다(Fig. 1). 이 연구에서 제안한 기법은 분류 대상 영상에 대한 훈련자료를 자동으로 추출하기 위해 이전 연도에 획득한 훈련자료와 같은 사전 정보를 이용하는 것이다. 먼저 2018년에 획득한 UAV 영상과 현장조사자료로부터 얻어진 화소 정보와 분류 항목을 이용하여 초기 훈련자료를 구성하였다. 이때 초기 훈련자료는 분석자가 사전에 알고 있는 정보로 간주된다. 따라서 기존 준감독학습과는 다르게 다량의 초기 훈련자료를 이용할 수 있기 때문에 UAV 영상의 크기를 고려하여 총 5,000개의 초기 훈련자료를 수집하였다(Table 2). 그리고 2019년에 획득한 현장조사자료는 제안 기법의 성능을 평가하기 위한 검증자료로 이용하였다.

Table 2. Number of initial training data and test data

OGCSBN_2022_v38n5_1_461_t0002.png 이미지

서로 다른 시기에서 획득된 영상에서 분광특성의 차이를 살펴보기 위해, Fig. 2는 2018년과 2019년에 수집한 UAV 영상과 현장조사자료를 이용하여 각 분류 항목별 반사율에 대한 boxplot을 나타냈다. 영상 촬영시기에 관계없이 개별 항목 별로 살펴보면, 마늘, 양파와 맥류 항목의 반사율은 green, red, blue 밴드 순서로 높게 분포하고 있는 것으로 나타났다. 그리고 마늘과 양파의 반사율은 매우 유사한 것으로 나타났다. 영상 촬영시기 별로 살펴보면, 2019년에 획득한 영상에서 세 작물의 반사율은 2018년에 비해 상대적으로 낮은 것을 확인할 수 있다. 예를 들어, 2018년과 2019년의 마늘 항목에서의 red 밴드 반사율의 평균은 각각 0.45와 0.4를 나타냈다. 이와 같이, 개별 촬영된 영상에서 세 작물의 반사율이 좁은 범위 내에서 유사한 반면 서로 다른 시기의 영상에서 개별 항목은 반사율의 차이를 보였다. 따라서 이전 연도에 획득한 초기 훈련자료를 분류에 그대로 이용하는 경우 분류 결과는 유사한 분광특성을 갖는 항목 간 혼재를 야기할 수 있다.

OGCSBN_2022_v38n5_1_461_f0002.png 이미지

Fig. 2. Comparison of reflectance for individual classes in two images acquired at different times.

2) 작물 분류 방법론

이 연구에서는 훈련자료 수집 과정 없이 시계열 토지피복도를 제작하기 위해 이전 연도에 획득한 현장조사 자료와 같은 사전정보를 이용하여 추출한 다량의 훈련자료를 초기 훈련자료로 이용하는 준감독학습 기반 훈련자료 추출 기법을 제안하였다(Fig. 3). 이 기법은 먼저 초기 훈련자료를 이용하여 분류 모델을 학습한 후에 분류 대상 영상에 대해 초기 분류를 수행한다. 이후 초기 분류 결과에서 특정 제약 조건을 이용하여 확실하게 분류된 것으로 간주할 수 있는 화소들을 새로운 훈련자료로 구성한다. 이러한 훈련자료는 분류 대상 영상으로부터 추출되므로 이전 연도 영상에서 획득한 초기 훈련자료에 비해 분류 항목을 구분하는데 더 용이하기 때문에 분류 모델의 결정 경계를 더 명확하게 할 수 있다. 이러한 절차는 특정 종료 조건을 만족할 때까지 반복적으로 수행한다.

OGCSBN_2022_v38n5_1_461_f0003.png 이미지

Fig. 3. Flowchart of the SSL-based training data extraction procedures applied in this study.

준감독학습 기반 반복 분류에는 UAV 영상에서 나타나는 개별 분류 항목의 서로 다른 공간 특징을 고려할 수 있는 convolutional neural network (CNN)을 적용하였다. CNN의 입력 자료는 패치(patch) 단위로 구성되며, 합성곱 계층(convolution layer), 풀링 계층(pooling layer)과 전결합 계층(fully-connected layer)의 다양한 조합에 의해 분류에 유용한 공간 특징을 추출한다(Song and Kim, 2017; Kwak et al., 2019). 그런 다음 네트워크의 마지막에 위치한 전결합 계층에서 softmax 함수가 적용되어 최종 분류 결과를 생성한다. CNN은 입력 자료의 특성을 반영하는 분류에 유용한 특징 정보를 추출할 수 있지만, 이를 위해 최적의 구조와 하이퍼파라미터를 결정할 필요가 있다. 이 연구에서는 CNN 모델의 입력으로 5×5 크기의 패치를 이용하였다. 그리고 3×3 크기의 합성곱 필터를 갖는 3개의 합성곱 계층, 1개의 풀링 계층과 2개의 전결합 계층의 조합으로 CNN 모델을 구성하였으며 과적합을 방지하기 위해 dropout을 포함하였다(Table 3).

Table 3. Structure and hyper-parameters of CNN model

OGCSBN_2022_v38n5_1_461_t0003.png 이미지

이 연구에서 정의한 훈련자료를 추출하기 위한 특정 제약 조건은 불확실성 정보와 공간 문맥 정보를 순차적으로 고려하는 것이다. 반복 분류를 수행할수록 분류 모델이 올바른 결정 경계를 갖도록 하기 위해서는 신뢰할 수 있는 훈련자료가 추출되어야 한다. 먼저 불확실성 정보를 이용한 훈련자료 추출 방법은 CNN 모델에 의해 확실하게 분류된 것으로 간주되는 화소를 선정하는 것이다. CNN 모델의 마지막 계층에서 적용되는 softmax는 네트워크의 출력을 분류 항목에 대한 확률로 정규화한다. 모든 분류 항목에 대한 확률의 합은 1이며, 가장 높은 확률을 갖는 항목은 분류 결과로 할당된다. 따라서 특정 항목에 대해 확률이 1에 가까운 화소는 신뢰성이 높다고 간주할 수 있다. 이 연구에서는 CNN을 이용한 반복 분류 과정에서 특정 항목에 대해 softmax에 의해 산출된 확률이 0.9 이상인 경우를 신뢰성이 높다고 정의하였다.

불확실성 정보로부터 추출된 높은 신뢰성을 갖는 새로운 훈련자료는 분류 결과의 인접 화소 간 유사성을 고려하는 공간 문맥 정보를 이용하여 그 신뢰성을 더욱 높일 수 있다. 공간 문맥 정보는 불확실성 정보에 의해 추출된 훈련자료가 초기 혹은 이전 분류 결과에서 인접 화소의 분류 항목과 일치하는 정도를 의미한다. 여기서 인접 화소에 대한 범위는 CNN 모델의 입력 패치 크기와 동일하게 5×5로 설정하였고, UAV 영상의 공간해상도를 고려하여 인접 화소가 모두 동일한 경우에 훈련자료로 추출하도록 정의하였다. 이와 같이 불확실성 정보와 함께 공간 문맥 정보를 이용하는 준감독학습 기반 분류는 공간 및 분광 특성을 모두 고려할 수 있기 때문에 분류 대상 연도에서 신뢰할 만한 훈련자료를 추출할 가능성이 높아진다.

마지막으로 준감독학습 기반 분류의 종료 조건을 정의해야 한다. 이 연구에서는 이전 분류 결과와 현재 분류 결과의 분류 항목의 변화가 크지 않을 때를 종료 조건으로 정의하였다. 이때 분류 항목의 변화 정도는 분류 결과의 서로 다른 화소의 비율이 영상 전체 화소의 3%보다 적을 때로 정의하였다.

3) 분류 성능 평가

이 연구에서 제안한 준감독학습 기반 훈련자료 추출 기법은 분석자가 분류 대상 연도의 일부 필지에서 수집한 소수의 훈련자료를 이용한 분류 결과와 비교를 통해 평가하였다. 즉, 제안 기법이 소수의 훈련자료를 이용한 분류 결과와 유사하거나 보다 우수한 성능을 보인다면 분석자 개입 없이 자동으로 훈련자료를 추출하는데 유용하다고 할 수 있다. 여기서 준감독학습기반 분류와 동일하게 분류 대상 연도에서 소수의 훈련자료를 이용한 분류에는 Table 3에서 정의한 CNN 모델을 이용하였다. 그리고 분류 대상 연도에서 수집한 소수의 훈련자료는 초기 훈련자료의 10%에 해당하는 500개만 수집하였다. 반복 분류를 이용하는 제안 기법은 초기 분류 결과와 일부 단계별 반복 분류 결과를 함께 비교하였다. 제안 기법의 초기 분류 결과는 이전 연도에 획득한 초기 훈련자료만 이용하기 때문에 단계별 반복 분류 결과와의 비교를 통해 자동으로 추출된 훈련자료의 유용성을 검증할 수 있다. 이 연구에서는 제안 기법의 초기 분류 결과, 제안기법의 반복 분류 결과와 소수의 훈련자료를 이용하는 분류 결과를 각각 initial CNN, SSL-based CNN과 baseline CNN이라는 용어로 편의상 통일하여 사용하였다. 분류성능 평가는 분류 결과의 시각적 분석과 함께 전체 정확도와 분류 항목별 사용자 정확도를 이용하였다.

3. 연구 결과 및 토의

1) 작물 분류 결과

Initial CNN, SSL-based CNN과 baseline CNN은 Fig. 4에 제시하였다. 먼저 initial CNN을 살펴보면(Fig. 4(a)), 다수의 양파 필지에서 마늘 항목의 고립된 화소가 발생하거나 일부 양파 필지가 마늘 항목으로 오분류되었다. 이러한 결과는 마늘과 양파의 유사한 분광특성과 서로 다른 시기에 획득된 영상 간 반사율 차이에 의한 것으로 판단된다(Fig. 2). 또한 일부 마늘 필지는 맥류와 혼재되는 양상이 나타났다. 즉, 초기 분류 결과를 통해 동일한 지역이더라도 다른 시기에 획득한 영상으로부터 수집한 초기 훈련자료는 대상 영상 분류에 그대로 이용하기 어렵다는 것을 보여준다.

OGCSBN_2022_v38n5_1_461_f0004.png 이미지

Fig. 4. Classification results: (a) initial CNN, (b) 1st and (c) 6th iterative classification in SSL-based CNN, (d) baseline CNN.

SSL-based CNN은 initial CNN과 비교해서 첫 번째 반복에서 가장 큰 변화를 보였으며, 여섯 번째 반복에서 종료 조건에 만족하였다. Fig. 4(b)와 (c)에 제시된 SSL-based CNN를 종합적으로 살펴봤을 때, initial CNN에서 나타난 일부 마늘 필지에서 맥류로 오분류되는 양상은 SSL-based CNN에서 계속 영향을 미치는 것으로 나타났다. 이는 초기 훈련자료를 기반으로 새로운 훈련자료를 수집하기 때문에 반복 분류 과정에서 계속 영향을 미치는 것으로 보인다. 반면, SSL-based CNN은 initial CNN에 비해 양파 필지에서 나타난 고립된 화소가 크게 완화되었다. 특히 반복 분류 횟수가 증가하였을 때 고립된 화소의 영향이 크게 완화되었는데, 이러한 결과는 새로운 훈련자료를 추출하는 과정에서 특정 제약 조건으로 공간 문맥 정보를 이용하기 때문인 것으로 판단된다. 또한 SSL-based CNN은 initial CNN과 비교해서 마늘과 양파에서 나타난 오분류를 대부분 완화하였다.

Baseline CNN은 대부분 마늘 필지에서 맥류와의 혼재 양상이 나타났다(Fig. 4(d)). Baseline CNN의 이러한 오분류 양상으로 인해 이전 연도에 획득한 다량의 훈련자료가 존재하는 경우에 분석자가 소수의 훈련자료를 수집하는 것보다 준감독학습 기반 분류를 적용할 필요가 있음을 보여준다. 이러한 정성적 평가 결과를 바탕으로 시계열 토지피복도 제작을 위한 준감독학습 기반 훈련자료 추출 기법의 적용 가능성을 확인하였다.

2) 분류 정확도 평가 결과

Initial CNN, SSL-based CNN과 baseline CNN의 정확도 통계는 Table 4에 제시하였다. SSL-based CNN의 전체 정확도는 initial CNN 대비 첫 번째 반복 분류에서 11.06%p만큼 크게 증가하였다. 그 이후에도 SSL-based CNN의 전체 정확도는 종료 조건에 만족한 여섯 번째 반복 분류까지 점차 증가하는 양상을 보였는데 첫 번째 반복 분류와 비교해서 정확도 향상 정도는 1.55%p로 매우 작았다. 그리고 여섯 번째 반복 분류에서 SSL-based CNN의 전체 정확도는 baseline CNN과 비교해서도 2.87%p 높아 가장 우수한 것으로 나타났다.

Table 4. Overall and user accuracy of different classification methods

OGCSBN_2022_v38n5_1_461_t0004.png 이미지

사례 연구 지역에서 주요 분류 항목 중 하나인 마늘의 사용자 정확도를 살펴보면, SSL-based CNN은 initial CNN 대비 12.18%p 높게 나타났다. 이러한 결과는 시각적 분석에서 확인한 바와 같이(Fig. 4), 양파 필지에서 마늘과의 혼재가 SSL-based CNN을 통해 완화되어 정확도가 크게 향상된 것으로 판단된다. 사용자 정확도에서 가장 두드러진 차이를 보인 맥류 항목을 살펴보면, SSL-based CNN은 initial CNN, baseline CNN과 비교해서 각각 43.72%p, 37.74%p 높게 나타났다. 사례연구 지역에서 마늘과 맥류의 유사한 분광 특성으로 인해(Kwak et al., 2021), initial CNN과 baseline CNN에서 맥류 항목의 사용자 정확도가 낮게 나타난 것으로 보인다. 즉, SSL-based CNN에서 맥류 항목의 사용자 정확도 향상은 새롭게 추출된 훈련자료가 혼재가 발생하는 분류 항목을 구분하는데 용이한 정보를 제공한다는 것을 보여준다.

4. 결론

이 연구에서는 시계열 토지피복도 제작을 목적으로 신뢰성 높은 훈련자료를 추출하기 위한 준감독학습 기반 훈련자료 추출 기법을 제안하였다. 이 기법은 분석자 개입 없이 자동으로 훈련자료를 추출하기 위해 과거 영상으로부터 수집한 초기 훈련자료를 이용한다는 점에서 기존 연구와의 차별성을 갖는다. 그리고 신뢰할 수 있는 훈련자료를 추출하기 위해 특정 제약 조건으로 분류 모델의 불확실성 정보와 함께 공간 문맥 정보를 고려하였다.

우리나라 경상남도 합천군 일부지역을 대상으로 사례연구를 수행한 결과, SSL-based CNN은 initial CNN에서 나타난 고립된 화소와 특정 항목의 오분류를 크게 완화하였고, 12.61%p의 향상된 전체 정확도를 나타냈다. 또한 SSL-based CNN은 baseline CNN에서 나타난 분광 특성이 유사한 마늘과 맥류의 혼재 양상을 크게 완화하였다. 이러한 결과는 서로 다른 시기에서 획득한 초기 훈련자료를 이용하더라도 분류 모델의 불확실성 정보와 함께 공간 문맥 정보를 고려하는 제안 기법이 분류항목을 구분하는데 용이한 새로운 훈련자료를 추출할 수 있음을 의미한다.

제안 기법으로부터 추출한 새로운 훈련자료는 초기 훈련자료 정보를 기준으로 추출되기 때문에 초기 분류 결과에서 나타나는 오분류의 영향을 여전히 내포한다는 한계를 갖는다. 이러한 한계를 극복하기 위해서는 시계열로 획득된 과서 토지피복도나 현장조사자료를 이용할 수 있을 것이다. 예를 들어, 긴 기간동안 시간이 지나더라도 변하지 않는 토지피복 항목은 확실하게 분류된 것으로 간주할 수 있는 화소들을 선택하는 과정에서 특정 제약 조건으로 이용함으로써 새로운 훈련자료의 신뢰성을 높일 수 있을 것이다. 또한 초기 분류 결과의 오분류 영향을 줄이기 위해 서로 다른 영상 간 방사학적 불일치 문제를 완화하고 분류를 수행할 수 있는 전이학습의 일종인 도메인 적응을 적용할 필요가 있다. 향후에는 초기 분류 결과에 의한 오분류 영향을 완화하기 위해 토지피복의 경계 정보와 같은 추가적인 사전 정보의 이용과 함께 도메인 적응 개념을 결합하는 새로운 준감독학습 기반 훈련자료 추출 기법을 고려할 예정이다.

사사

이 논문은 정부(과학기술정보통신부)의 재원으로 한국연구재단의지원을받아수행된연구입니다(No.NRF2022R1F1A1069221). 연구에 사용한 영상과 현장조사 자료를 제공해주신 국립농업과학원 연구원분들과 논문의 표현을 명확히 하는데 도움을 주신 익명의 심사자분들께 감사드립니다.

References

  1. Bruzzone, L., M. Chi, and M. Marconcini, 2006. A novel transductive SVM for semisupervised classification of remote-sensing images, IEEE Transactions on Geoscience and Remote Sensing, 44(11): 3363-3373. https://doi.org/10.1109/TGRS.2006.877950
  2. Camps-Valls, G., T.V.B. Marsheva, and D. Zhou, 2007. Semi-supervised graph-based hyperspectral image classification, IEEE Transactions on Geoscience and Remote Sensing, 45(10): 3044-3054. https://doi.org/10.1109/TGRS.2007.895416
  3. Deng, F., S. Pu, X. Chen, Y. Shi, T. Yuan, and S. Pu, 2018. Hyperspectral image classification with capsule network using limited training samples, Sensors, 18(9): 3153. https://doi.org/10.3390/s18093153
  4. Ghimire, B., J. Rogan, and J. Miller, 2010. Contextual land-cover classification: Incorporating spatial dependence in land-cover classification models using random forests and the Getis statistic, Remote Sensing Letters, 1(1): 45-54. https://doi.org/10.1080/01431160903252327
  5. Kim, E.S., S.H. Lee, and H.K. Cho, 2010. Segmentbased land cover classification using texture information in degraded forest land of North Korea, Korean Journal of Remote Sensing, 26(5): 477-487 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2010.26.5.477
  6. Kim, J., Y. Song, and W.K. Lee, 2021. Accuracy analysis of multi-series phenological landcover classification using U-Net-based deep learning model - focusing on the Seoul, Republic of Korea, Korean Journal of Remote Sensing, 37(3): 409-418 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2021.37.3.4
  7. Kwak, G.-H., C.-W. Park, K.-D. Lee, S.-I. Na, H.-Y. Ahn, and N.-W. Park, 2021. Potential of hybrid CNN-RF model for early crop mapping with limited input data, Remote Sensing, 13(9): 1629. https://doi.org/10.3390/rs13091629
  8. Kwak, G.-H. and N.-W. Park, 2022. Unsupervised domain adaptation with adversarial self-training for crop classification using remote sensing images, Remote Sensing, 14(18): 4639. https://doi.org/10.3390/rs14184639
  9. Kwak, G.-H., N.-W. Park, K.-D. Lee, and K.-Y. Choi, 2017. Crop classification for inaccessible areas using semi-supervised learning and spatial similarity - A case study in the Daehongdan region, North Korea, Korean Journal of Remote Sensing, 33(5-2): 689-698 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2017.33.5.2.8
  10. Kwak, T., A. Song, and Y. Kim, 2019. The impact of the PCA dimensionality reduction for CNN based hyperspectral image classification, Korean Journal of Remote Sensing, 35(6-1): 959-971 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2019.35.6.1.7
  11. Romaszewski, M., P. Glomb, and M. Cholewa, 2016. Semi-supervised hyperspectral classification from a small number of training samples using a cotraining approach, ISPRS Journal of Photogrammetry and Remote Sensing, 121: 60-76. https://doi.org/10.1016/j.isprsjprs.2016.08.011
  12. Song, A. and Y. Kim, 2017. Deep learning-based hyperspectral image classification with application to environmental geographic information systems, Korean Journal of Remote Sensing, 33(6-2): 1061-1073 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2017.33.6.2.3
  13. Tan, K., E. Li, Q. Du, and P. Du, 2014. An efficient semisupervised classification approach for hyperspectral imagery, ISPRS Journal of Photogrammetry and Remote Sensing, 97: 36-45. https://doi.org/10.1016/j.isprsjprs.2014.08.003
  14. Wang, L., S. Hao, Q. Wang, and Y. Wang, 2014. Semisupervised classification for hyperspectral imagery based on spatial-spectral label propagation, ISPRS Journal of Photogrammetry and Remote Sensing, 97: 123-137. https://doi.org/10.1016/j.isprsjprs.2014.08.016