1. 서론
저궤도 지구관측 위성 보유국에서 매일 획득(Acquisition)되는 위성 정보가 급속하게 축적되고 있다. U.S. Geological Survey (USGS)의 경우 Landsat 8호와 향후 발사되는 9호의 자료까지 포함하여 하루에 1,365장의 자료가 수집(Ingestion)되고 1.7 TB 이상의 용량으로 저장되어 일 년 동안에 631 TB 이상이 축적될 것으로 예상된다(Frantz, 2019). 따라서 USGS는 이미 2015년부터 물리적 저장 공간의 부담을 감소하면서 동시에 빅 데이터 정보 자원이나 머신 러닝 자료로서의 위성 정보의 민간 활용을 증가시키기 위하여 아마존 웹 서비스(Amazon Web Service: AWS)와 Amazon S3 저장 장치 등의 클라우드 컴퓨팅 환경에서 자료를 제공하는 구조를 채택하고 있다(Kline, 2018). 이처럼 계속 누적되고 있는 지구 관측 위성 자료의 활용을 위한 새로운 정보 유형으로 2010년대 중반부터 Committee on Earth Observation Satellites (CEOS)에서 픽셀 형식의 위성 자료를 직접 분석에 이용할 수 있는 과학 정보로 변환하는 Analysis-Ready Data (ARD) 개념을 정립하면서 주로 Landsat 위성 정보를 대상으로 한 ARD에 대한 표준 프레임워크 개발을 주도하고 있다. ARD는 사용자가 추가적인 전처리 보정을 하지 않아도 직접 활용 목적에 맞도록 사전에 준비된 위성 정보를 의미하며, 기계 학습과 빅데이터 자료 처리를 위한 자료로 직접 사용할 수 있기 때문에 점점 활용 가치가 증가하고 있다.
CEOS는 지구관측 위성 프로그램의 조정과 위성 자료의 공유를 목적으로 하여 NASA, NOAA, USGS, ESA, DLR, JAXA 등을 포함하는 12개 우주 연구 기관을 주 회원으로 하고 기타 해외 43개 연구기관이 참여하는 국제기구이다(https://ceos.org/). CEOS는 Group on Earth Observations(GEO)-Global Earth Observation System of Systems(GEOSS) 구축을 위한 기반 플랫폼으로 Australia Geoscience Data Cube (AGDC)에서 출발한 Open Data Cube (ODC)를 채택하고 있다(https://www.opendatacube. org/ceos). Gomes et al. (2020)은 ODC와 Google Earth Engine (GEE)의 기능과 성능을 비교하면서 ODC의 장점을 소개하였다.
ARD와 ODC 관련된 기술 자료 및 시스템 구축을 통한 활용 사례도 계속 발표되고 있다. Giuliania et al. (2017)은 지구관측 정보의 복잡성, 자료량의 증가, 처리 성능의 문제 등으로 충분히 활용되지 못하고 있다고 하면서 이러한 문제를 감소시키면서 시공간 자료 처리를 가능하게 하는 패러다임으로 Data Cube (DC)의 의미를 강조하면서 Swiss Data Cube 구축을 통하여 문제 해결 가능성을 예시하였다. Kopp et al. (2019)는 데이터 전처리, 최적화 저장 방식, 데이터 큐브의 통합, 분석 및 공유 등에 기술적인 내용을 구체적으로 설명하면서 앞으로 DC의 확장 가능성이 높을 것으로 예상하였다. Maso et al. (2019)는 Sentinel-2 영상정보를 적용한 지역적 DC의 개발 사례 관련하여 OGC (Open Geospatial Consortium, Inc.) 웹 인터페이스로 구성되어 시계열 분석 기능을 제공하는 웹 브라우저 개발 성과를 소개하였다. Dhu et al. (2019)는 호주의 수자원 관리 시스템, 멕시코의 생태 환경 통계 분석을 위한 인공위성 응용 시스템, 스위스의 강설 모니터링 시스템, 탄자니아의 도시화 분석 시스템 등에 활용된 국가 단위의 DC 개발 사례를 소개하였다. Zhang et al. (2019)는 중국의 GEOSS 전략은 15개 이상에 달하는 자국 내의 위성 정보 처리 기관 간의 자료 통합 활용을 위한 Data Sharing Network (DSNet)을 구축하고 GEOSS 플랫폼에서 지원하는 GEO Discovery andAccess Broker (DAB)을 이용하여 국제적인 GEOSS 포털과 연계시키는 방식이라고 하였다. Truckenbrodt et al. (2019)는 데이터 큐브의 입력 자료가 되는 Sentinel-1 SAR 영상의 후방산란계수 성과가 SNAP과 GAMMA 처리 도구에 따라서 얼마나 차이가 있는지를 분석하였고 처리 결과의 평가에 대한 필요성에 대하여 언급하였다. Quang et al. (2019)는 베트남 데이터 큐브의 응용 사례로 메콩강 주변 지역의 홍수 모니터링에 SAR 영상과 광학 영상의 융합 처리 결과 분석을 수행하였다. Frantz (2019)는 현재 ARD에 구름 제거 기능과 복사 보정을 처리하는 기능을 제공하는 시스템을 개발하면서 기계 학습 기반 분류 작업에 적용할 수 있는 Highly analysis ready data (hARD)를 제시하였다. Bendini et al. (2020)은 다양한 환경 정보를 이용한 식생 분류 작업을 위한 ARD 적용 사례를 제시하였다. Giuliani et al. (2020a)은 원격탐사 영상정보로부터 도출되는 육상, 대기, 해양의 기후 변수 정보와 DC와의 연계성을 제시하면서 Normalized Difference Water Index (NDWI)와 Normalized Difference Vegetation Index (NDVI) 처리 결과를 예시하였다. Giuliani et al. (2020b)은 Sustainable Development Goals indicator 15.3.1을 만족하는 MODIS, AVHRR, Landsat 등 영상정보를 Land productivity, changes in soil organic carbon (SOC) 모델을 포함하는 DC 모델에 대하여 설명하였다. Rizvi et al. (2020)은 UN의 지속 개발 목표(SDGS)를 위한 활용 시스템으로 ODC 알고리즘을 채택한다고 하였다
이러한 연구와 기술 개발과 함께 최근에는 Maxar와 같은 민간 사업체에서도 자체적으로 구축한 ARD 정보를 제공하고 있고 (Geller, 2021), Planet은 상업 제품으로서 ARD 프레임워크에 대한 연구를 진행하고 있다(https://www.planet.com/pulse/planets-framework-foranalysis-ready-data/).
우리나라에서도 관련 주제에 대하여 ODC의 적용성에 대한 기초 연구와 지표 반사도 ARD 구축을 위한 기초 연구로서 지표 반사도 정확도 검증 연구 등을 수행한 바 있다. Lee et al. (2017)은 오픈스택(OpenStack) 클라우
드 환경에서 운영되는 한국항공우주연구원의 위성 정보 활용 지원 서비스(https://ksatdb.kari.re.kr/main/main. do)의 내부 구조에 대하여 설명하였고, Lee et al. (2020)은 KOMPSAT 영상정보를 Open Data Cube에 적용하는 데 고려해야 하는 몇 가지 기술 사항을 정리한 바 있다. Lee and Kim (2019)는 오픈소스 원격탐사 도구인 Orfeo Toolbox의 대기 방사 보정 모듈에 KOMPSAT-3A 센서 모델을 적용하여 새로 빌드(Build)한 오픈소스 도구를 개발하였고, Lee et al. (2020)은 상대 대기 보정 처리 결과와 절대 대기 보정 알고리즘에 기반한 이 도구의 결과를 비교하면서 시험적인 식생 지수 추출 연구에 이 도구를 적용하였다. Lee and Kim (2020)은 RadCalNet RVUS 사이트 자료를 이용하여 Landsat-8, Sentinel-2 영상 정보의 지표반사도와 KOMPSAT-3A 영상 정보의 대기 및 지표 반사도 값을 정량 비교하였다. Kim and Lee (2020a), Kim and Lee (2020b)는 RadCalNet 사이트를 이용하여 KOMPSAT-3A 영상 정보의 지표 반사도 성과 검증 실험을 수행하였고 대부분 경우에 KOMPSAT-3A 영상의 대기 및 지표 반사도 산출 값이 현장 측정값과 5% 이내의 일치도를 보이는 결과를 제시하였다. 한편 국토지리 정보원에서는 차세대중형위성 1, 2호(CAS-500 1,2) 국토 위성의 ARD를 사용자 친화형 영상제품으로 구축하기 위한 계획을 수립하였다(Kim et al., 2021).
이 연구는 우선 ARD와 ODC의 개요 및 현황을 소개하고 ARD 자료의 서비스 방식을 구분하여 정리하였다. 그리고 ARD와 ODC의 연계 방식에 대하여 설명하였으며, 지표 반사도 산출물을 대상으로 하는 ARD 구축 및 응용 모델을 제시하였다. 또한 토의 사항에서 여기서 제시한 구축과 응용 모델에 대하여 데이터 가격 정책, 품질 관리 문제, 보안 이슈, 플랫폼 적용성 문제, 클라우드 환경 문제 등을 우리 주변국의 상황과 함께 정리하였다.
2. Analysis Ready Data와 Open Data Cube의연계
ARD는CEOS Land Surface ImagingVirtualConstellation (LSI-VC)에서 Working Group on Calibration & Validation (WGCV)의 기술적 협력하에 주도하고 있으며 Data Cube는 CEOS Working Group on Information Systems and Services (WGISS)에서 기술 사양과 활용 방안을 연구하고 있다.
Ferreira et al. (2020)은 브라질 Data Cube 구축에 적용되는 소프트웨어 구성에 OGC 표준 사양의 적용에 대하여 정리하였다. 특히 이 데이터 큐브는 Landsat 8 OLI 영상 정보와 Sentinel 2 영상 정보의 ARD와 함께 자국의 China-Brazil Earth Resources Satellite (CBERS-4) ARD를 구축하였다. 대만 Data Cube도 자국의 FORMOSAT-2/5 ARD를 구축하고 있다(Cheng et al., 2019). OGC 표준 사양도 Data Cube 구축과 직접 관련되는 기술 내용으로 Web Data Cube Service (WDCS), Web Time Series Service (WTSS), Web Land Trajectory Service (WLTS)등과 같은 사양을 개발하였다(Voidrot and Percivall, 2020). Killough et al. (2020)은 2019년을 기준으로 하여 과거, 현재, 미래 시점에서 ARD와 ODC 기술 발전 동향을 정리하였다. ARD의 경우는 광학 영상과 레이더 영상의 융합과 기계 학습을 위한 자료로의 발전을 위한 CEOS의 적극적인 표준화 활동이 이루어질 것으로 예상하고, ODC의 경우는 대륙이나 국가 단위의 서비스 시스템 구축이 활발하게 진행될 것이라고 하였다. 그러나 이 연구에서 클라우드 컴퓨팅 환경은 기본적으로 AWS를 전제로 하고 있다. 고해상도 위성영상이나 오픈소스 클라우드 환경에 대해 언급은 하지 않고 있다.
The “Road to 20” International ODC Deployment (https://www.opendatacube.org/resources)에 의하면 국가 단위로 ODC를 구축하여 운영하고 있는 국가는 2018년 기준으로 호주, 콜롬비아, 스위스, 대만 등과 아프리카 대륙의 5개국 등을 포함하는 9개국이며, 영국뿐만 아니라 태국, 몽골 등을 포함하여 14개국이 현재 개발단계에 있는 것으로 보고되었다. 여기에 추가하여 2020년 기준으로 브라질과 베트남 등이 ODC 구축을 완료하였다
Table 1은 ODC에서 제공하는 기능을 응용 유형별로 정리한 것이다. ODC가 오픈소스 기반 플랫폼이므로 알고리즘이나 처리 함수 등을 개발자가 Jupyter Notebook 환경에서 추가할 수 있다.
Table 1. ODC application type and feature list (Open Data Cube, https://www.opendatacube.org/)
CARD4L SR은 CEOSARD for Land SurfaceReflectance를 의미한다.CARD4LSR의PFS(ProductFamilySpecification) 개발은 Geoscience Australia와 USGS 연구진이 주도하고 있다. CARD4L SR PFS에 포함되는 규격은 일반 메타데이터, 픽셀 메타데이터, 대기 보정, 기하 보정이 항목으로 구성되어 있다(https://ceos.org/ard/files/PFS/ SR/v5.0/CARD4L_Product_Family_Specification_Surface_ Reflectance-v5.0.pdf).
Fig. 1은 현재 구축된 ARD의 배포 방식을 세 가지 유형으로 구분하여 정리한 것이다. Fig. 1(a)는 USGS Earth Explorer (https://earthexplorer.usgs.gov/)에서 Landsat ARD 자료를 제공하는 방식으로 Landsat Collection 1, 2의 Level 파일과 같이 개별 파일 단위(scene)로 자료를 내려받기(downloadable) 가능한 상태로 제공하는 방식이다. 이 방식은 기존의 영상 배포 서비스에 자료 유형을 추가하는 방식이므로 다른 방식에 비하여 시스템 구축이나 운영이 가장 쉬운 방식이다. 분광 밴드에서 16 m의 공간 해상도를 보이는 중국의 GaoFen-1 위성 정보의 경우도 ARD를 구축하고 이와 같은 파일 내려받기 방식의 ARD를 구축하였다(Zhong et al., 2021). Fig. 1(b)는 Google Earth Engine (GEE) (Gorelick et al., 2017; Kumar and Mutang, 2018)에서 ARD를 제공하는 방식으로 기본적인 서비스 모델은 사용자가 위성영상 정보를 직접 내려받아 사용하는 방식이 아니고 직접 스크립트 (Script) 코드를 작성하여 ARD를 호출하도록 한다. Fig. 1(c)는 AWS 클라우드 환경에 구축된 ODC를 통하여 ARD 자료를 제공하는 방식이다. 이 경우에는 파일 단위로 제공하지 않고 사용자 원하는 지역 범위와 시기를 입력하면 이 조건에 해당하는 ARD가 있는 경우 자료를 직접 웹 서비스에서 표출하는 방식이다. 이 자료는 ODC에 개발된 알고리즘을 선택하여 사용자가 결과물을 생성하도록 한다. 이 경우는 사용자 인터페이스를 통하여 직접 처리 알고리즘으로 제공하는 방식 외에 중간 개발자가 직접 자신의 함수를 구현하는 이중 인터페이스(Dual Interface)를 제공한다. 이 세 가지 경우는 현재는 무료로 제공되는 Landsat 영상정보를 기본 자료로 제공하고 있으며 부분적으로 Sentinel-2 영상 정보의 ARD가 제공되기도 한다. 물론 여기서 ARD는 CEOS에서 공통 지침으로 제시하는 CARD4L 표준에 따른 지표 반사도와 지표 온도도로 국한되어 있다.
Fig. 1. Types of ARD service: (a) Landsat ARD of USGS EarthExplorer, (b) Access interface for ARD in Google Earth Engine (GEE), and (c) ARD in Open Data Cube on Amazon Web Service (AWS).
Fig. 2는 Sudmanns et al. (2020)이 제시한 ARD 사용 이전과 이후 배포 방식을 일부 수정하여 비교한 것이다. 여기서 Fig. 2(a)는 웹 서버와 영상 정보 서버와 연계된 포털을 통하여 내려받기 기능을 통하여 영상정보를 제공하는 일반적인 웹 서비스 방식이다. 이 포털(판매용 영상을 제공하는 포털 서비스 포함)을 통하여 자료를 처리할 수 있는 분석가나 전문가가 필요한 영상정보를 파일로 내려받은 후에 필요한 보정 작업과 분석을 수행하고 결과를 일반에게 제시하는 방식이다. Fig. 2(b)는 사전에 구축된 ARD를 통하여 이와 같은 작업이 이루어지는 방식을 비교하는 한 가지 예시로서 Fig. 1(c)의 경우를 다른 관점에서 표현한 것이다. 여기서는 데이터 포털이 아닌 데이터 서버에 있는 영상정보를 ARD로 가공하여 클라우드 서버로 등록하면, 이 서버는 ODC 플랫폼을 기반으로 ARD를 수집(ingestion)하고 이러한 ARD 영상 처리와 분석 알고리즘이 ODC에 구현된 경우에는 전문가가 이 환경에서 자료에 접속하여 필요한 분석을 직접 수행할 수 있도록 하고 일반 사용자도 이 클라우드 서비스를 통하여 처리 결과를 활용할 수 있도록 한다. 한편 ARD 자료 유형의 품질 관리를 위한 검보정 (Calibration/Validation: CAL/VAL)은 데이터 제공자가 반드시 수행해야 하는 자료 처리 단계이며 처리 결과는 사용자에게 항상 공개해야 한다.
Fig. 2. Dissemination of Earth Observation (EO) data: (a) Conventional case, redrawn and edited from Sudmanns et al. (2020), and (b) Service case based on Open Data Cube with ARD on cloud environment.
3. Analysis Ready Data 구축및응용모델
현재 개발된 지표 반사도 ARD 제작 및 구축 방법은 Landsat 영상 정보를 대상으로 한 것으로 CEOS에서는 성과물에 포함되어야 할 기본 항목을 정의한 것으로 어떻게 제작하고 구축하는지에 대한 실제적인 기술 내용은 다루지 않는다. 따라서 고해상도 영상 정보의 경우도 기존에 구축된 Landsat의 경우를 참고로 하여 구축 절차를 수립해야 한다. 또한 ARD를 적용하는 데이터 큐브는 낱장의 영상 파일이나 한 세트의 표준 영상 파일을 처리하는 개념이 아니고 대상으로 수많은 영상 파일을 이용하는 국가 단위나 지역 단위의 구축을 기본으로 한다.
Fig. 3은 ARD를 제작 또는 생성하는 단계를 나타낸 것이다. Landsat ARD 생성 단계를 Holmes (2018)에서 제시한 것으로 다시 나타낸 것이고, 이 연구에서는 고해상도 영상을 위한 처리 단계를 별도로 제시하고자 하였다. 고해상도 영상의 경우 Level 1 영상 정보를 기본 영상으로 사용하고 원하는 정밀도 수준까지의 기하 보정을 우선 수행한다. 이후 이 기하 보정 영상을 대상으로 절대 대기 보정을 수행하고 이로부터 지표 반사도 성과물을 도출한다. 이처럼 개별 파일 단위로 처리된 영상 정보는 ARD 구축 지역 범위에 맞게 모자이크(집성) 처리하고 이 모자이크 영상을 타일(Tile) 구조로 클라우드 서버에 저장한다. 이 작업은 여러 시기별 ARD를 구축하기 위하여 자료 제공자에 의하여 지속해서 진행된다. 여기까지는 ARD 자료 제공자가 담당하는 내용이며 이후에는 사용자가 원하는 지역과 시기를 검색하고 필요한 관심 영역(Region-of-Interest: ROI)을 설정하도록 한다. 서버는 이 조건에 맞는 ARD 자료가 있는 경우에는 해당 자료를 제공한다. 사실 여기서 가장 중요한 단계는 절대 대기 보정 과정이다. 그러나 중저해상도 위성영상의 경우는 달리 고해상도 위성영상을 위한 절대 대기 보정 알고리즘을 지원하는 도구는 DigitalGlobe사의 Atmospheric Compensation (Acomp) 도구(https:// blog.maxar.com/earth-intelligence/2017/lets-clear-the-airdigitalglobe-atmospheric-compensation-acomp-part-2)와 같이 공개되어 있지 않거나 다른 영상의 경우는 센서 모델을 지원하는 상업 도구에 의존하는 경우가 대부분이다. 한편 아직까지 오픈소스에서 이러한 기능을 지원하는 경우는 OTB 도구 이외는 없다. KOMPSAT-3A의 경우도 상용 소프트웨어는 아직 이러한 기능을 제공하지 않고 있으며 현재까지 공식적으로 발표된 절대 대기 보정 처리와 지표 반사도 생성 도구는 Lee and Kim (2019)와 Lee et al. (2020)의 OTB Extension for KOMPSAT-3A가 유일하다. 따라서 우리나라 영상 배포 기관에서는 생성되고 있는 고해상도 위성영상을 위한 절대 대기 보정 알고리즘과 지표 반사도 산출시스템을 개발하고 Maxar의 경우처럼 이를 지속해서 검증하고 그 결과를 공개 발표하는 작업을 수행해야 한다. 이는 지표 반사도 ARD의 민간 활용을 증대시키는 가장 중요한 요소라고도 할 수 있다. 추가로 Pacific (2020)과 같이 한 가지 해상도 영상이 모든 문제해결을 위한 솔루션이 될 수 없기 때문에 고해상도 ARD 경우도 중저해상도 위성영상과의 상호운영성을 위하여 CARD4L과 같은 국제 지침을 준수할 필요가 있다.
Fig. 3. Comparison ARD generation step of Holmes’ (2018) scheme for Landsat with the suggested scheme for high-resolution images.
Fig. 4는 클라우드 환경에서 전문가와 일반 사용자에게 ARD 자료가 제공되는 방식을 네 가지로 나누어서 정리한 것이다. 첫 번째 방식 ①은 일반 사용자에게 사전에 구축된 ARD 정보를 직접 제공하는 방식으로 Fig. 1(a)가 이에 해당한다. 두 번째 ②는 일반 사용자뿐만 아니라 전문가와 분석가를 대상으로 한 경우로 영상 정보와 함께 이 영상정보를 ARD로 가공할 수 있는 처리 도구와 알고리즘을 오픈소스로 제공하는 방식이다. 이 방식은 이미 USGS에서도 채택한 방식으로 Landsat TM, ETM+ 영상정보로부터 지표 반사도를 추출할 수 있는 소스 코드인 Landsat 4-7 Collection 1 Surface Reflectance Code(LEDAPS)와 Landsat 8 Collection 1 Land Surface Reflectance Code (LaSRC)를 공개하고 있다. 세 번째 경우 ③은 ARD를 제작할 수 있는 소프트웨어가 저작권이 있는 사유 도구인 경우 소스 코드는 공개하지 않고 사용자가 요청하면 클라우드 내부에서 즉시 처리하여 사 용자에게 ARD 성과물을 제공하는 방식이다. GEE의 경우 실시간으로 USGS ARD의 API 접근 권한을 제공하기 때문에 이 방식과 유사하지만, 미리 구축된 자료를 제공한다는 점과 직접 지표 반사도 영상 자료를 제공하지 않는다는 점이 다르다. 네 번째 ④는 ARD와 ODC를 연계하는 제공 방식으로 이 경우에는 실제 처리나 분석 기능까지 제공하는 Fig. 1(c)나 Fig. 2(b)의 경우에 해당하는 것으로 일반 사용자는 ARD 자료와 함께 메뉴 방식으로 제공되는 분석 기능을 사용할 수 있다. 한편 개발자는 ARD 자료와 자신의 소스 코드를 직접 연계시켜서 결과를 생성하도록 하는 이중 인터페이스(Dual Interface)를 제공하는 방식이다.
Fig. 4. Supply types of ARD products for users on cloud environment: ①Level 2 products by preprocessed and archived ARD, ②Open source tools for ARD generation and data images for experts, ③On- the-fly or on-demand processing by internal ARD generator, and ④Archived ARD embedded in Open Data Cube with analysis functions.
ARD는 사용자가 즉시 활용할 수 있는 자료를 제공하는 것이며 AWS 클라우드 환경에서 ODC 플랫폼과 연계하여 구축하는 경우가 CEOS에서 권고하는 일반적인 경우라고 볼 수 있다. 또한 ODC 환경에서 Jupyter notebook으로 구현된 위성영상 처리 및 분석 알고리즘들이 계속 개발, 공개되고 있다.
Fig. 5는 ARD의 응용 모델을 정리한 것이다. Fig. 5(a)-(c)는 Baumann (2017)의 일반적인 데이터 큐브 응용 모델을 다시 정리한 것이다. Fig. 5(a)는 어떤 일시에 해당하는 ARD를 이용하는 경우이고, Fig. 5(b)는 어떤 측선 위치에 대한 시기별 ARD를 활용하는 것을 의미한다. Fig. 5(c)는 사각 영역의 ROI를 정하고 여러 시기를 조건으로 했을 때 ARD 자료를 나타낸 것으로 현재 사각 영역을 검색 조건으로 이용하는 AWS-ODC 경우에 해당한다. 여기서 Level 2와 Level 3 자료는 센서에 따라 정의가 달라질 수 있고 구체화될 수 있으나, 이 연구는 Level 2와 Level 3 자료를 각각 절대 대기 보정 알고리즘을 적용하여 산출한 부가 영상과 Level 2 단계의 영상을 융합하거나 분석 알고리즘을 추가하여 재생산한 산출물을 나타내며, 지표 반사도 영상정보는 Level 2 자료에 해당한다.
Fig. 5. ARD application model: (a) Extraction of user-defined Region-of-Interest (ROI) block as shown dark rectangle, (b) Slice set at the user-defined time, (c) Profile by user-defined period, (d) Conditional search by spatio-temporal query for a certain event for Level 3 products, (e) Conditional search by multiple criteria for Level 3 products, and (f) 3D visualization for a given theme using multi-sensors. Note: (a)-(c) are edited from Baumann (2017).
한편 Fig. 5(d)는 관심 영역을 임의 도형 영역으로 설정하고 동시에 시기 조건을 변화시켰을 때 나타나는 3D ARD 유형을 나타낸다 Fig. 5(e)의 경우는 Level 3에 해당하는 ARD가 있으면 한 개 이상의 분석 대상이나 목표를 정하고 수행할 수 있는 일종의 복합 질의가 가능한 상태이고, Fig. 5(f)는 다중 센서 ARD 환경에서 한 개의 주제에 대하여 3D 산포도 유형을 추출할 수 있는 경우를 나타낸다. Fig. 5(d)-(f)에서 제시한 응용 모델은 이 연구에서 제안하는 것이며, 이미 데이터 큐브를 구축한 국가에서도 아직 실제 적용 사례가 발표된 경우는 없다(2021년 6월 기준).
4. 토의
KOMPSAT-3/3A와 CAS-500 1/2, CAS-500 4 등과 같은 고해상도 위성영상 정보 ARD 구축을 위한 첫 번째 고려 사항은 영상 정보의 지식 재산권 또는 사유 소유권 등에 대한 문제라고 할 수 있다. Landsat 영상 정보의 경우 무상으로 제공되기 때문에 이를 가공한 ARD의 생성이나 응용에는 문제가 없지만 그렇지 않은 경우에는 ARD 구축이 이루어지더라도 자료 접근 방식이나 배포 방식은 달라진다. ARD 자료 유형을 원시 영상으로부터 가공된 2차 가공 성과로 인정하더라도 민간 업체인 Maxar의 Worldview-2/3 영상의 ARD 제공 방식과 같이 Landsat의 경우와는 다를 수밖에 없다. 이 문제는 이미 Lee et al. (2019)에서도 언급한 바 있으며 고해상도 위성 정보의 경우는 지구관측 위성 별로 만들어진 자료 배포 정책과 가격 정책 등에 따라 다양한 방식이 있을 수 있다. 즉, 아직까지 해외에서도 ARD 구축과 데이터 큐브의 운용은 국제기구를 중심으로 무상 자료와 오픈 소스를 기반으로 하기 때문에 이러한 상업 위성 자료나 지식 재산권과 관련된 이슈는 논의되지 않고 있는 상황이다. 사적 소유권이 있는 고해상도 위성영상 정보의 사회 문제 해결이나 연구 목적의 무상 배포에 대한 사례는 Maxar의 Open Data 프로그램(https://www.maxar.com/ open-data)이나 미국 NASA에서 2017년부터 시행하고 있는 Commercial Smallsat Data Acquisition (CSDA) 프로그램(https://earthdata.nasa.gov/esds/csdap#program) 등이 참고 대상이 될 수 있다.
두 번째 고려사항은 ARD 품질에 대한 것이다. 여기서 품질은 고해상도 광학 위성 정보로부터 산출한 지표 반사도의 정확도와 관계되는 항목이다. 품질 관리 측면에서 위성 센서로부터 대기보정 알고리즘을 적용하여 얻을 수 있는 대기 반사도와 지표 반사도의 정확도 또는 허용 오차범위를 규정한 사례는 중저해상도 영상의 경우도 아직 없다. Pinto et al. (2020)은 현장 실측 자료를 고려한 실험에서 Landsat 위성정보로부터 산출한 지표 반사도의 오차가 최대 10%까지 나올 수 있다고 하였다. Maxar의 경우 자체 보유한 절대 대기보정 알고리즘에 의하여 생성된 지표 반사도 정확도 기준을 현장 측정값 대비 ±5%로 설정하고 검정(Validation) 결과를 발표하고 있다(Kuester and Ochoa, 2019). 허용 오차를 포함한 정확도에 대한 규정은 앞으로 고해상도 위성영상의 지표 반사도 ARD 구축 기관이 많아지면 국제적으로 표준화해야 하는 항목이라고 할 수 있다. KOMPSAT 이나 CAS-500 광학 위성의 경우 고정적인 현장 측정값을 확보하기 위한 노력도 필요하지만 전 세계 5개 측정소에 매일 대기 반사도와 지표 반사도 측정값을 제공하는 RadCalNet 포털(https://www.radcalnet.org/)이 자료를 적극적으로 활용하는 것이 가장 현실적인 방안이라고 할 수 있다. 즉, 주기적으로 RadCalNet 측정소 주변 지역의 영상을 촬영하여 정확도를 확인하고 품질에 영향을 줄 수 있는 요인을 분석하는 것이다.
세 번째 고려사항은 ODC 플랫폼의 적용에 대한 문제라고 할 수 있다. 현재 ODC는 CEOS의 기술 지원 아래에 실제적(de-facto) 표준으로 자리 잡고 있는 상황이다. 초기에 ODC를 채택한 호주나 스위스의 경우와 같이 최근에 구축 성과를 보고하고 있는 대만과 베트남은 AWS 클라우드를 이용하고 자국의 클라우드 서버와 연동하는 구조로 되어 있다. 또한, 유럽도 Euro Data Cube 구축을 현재 고려 단계에 있다고 발표하였다(European Data Cube Facility Service: the ultimate EO resource for researchers and value-adders, https://eo4society.esa.int/ 2019/05/21/european-data-cube-facility-service-an-eoresource-factory/). 그러나 Landsat ARD를 가장 먼저 구축하고 이를 활용하고 있는 미국의 경우는 아직 US Data Cube 구축에 대한 계획이나 성과가 발표된 적이 없다. 이는 Amazon, GEE, Maxar 등과 같은 자국 민간 사업체들에 의하여 이미 Landsat ARD를 API 방식으로 제공하고 있어서 별도로 자국 내 활용을 위한 공공 ODC의 필요성이 없다고 보기 때문이라고 생각한다. 일본의 경우도 SAR 영상인 ALOS PALSAR의 ARD 국제 표준화와 구축에는 적극적이지만 ODC 보다는 지구 과학 정보 배포 서비스 시스템인 자국의 DAIS 개발과 활용(Kawasaki et al., 2018)에 주력하고 있는 양상이다. 그러나 중국의 경우는 자국의 위성영상 공통 활용 및 배포 서비스 시스템인 Spectrum Earth 프로젝트 추진과 함께 ODC 구축에 대한 관심을 나타내고 있다(Gu, 2018; Yao et al., 2018; Zhang et al., 2019). 이러한 상황을 고려하여 우리나라는 우선 ODC의 채택 여부를 우선 결정해야 할 시점이다.
네 번째는 클라우드 컴퓨팅 환경에 대한 것이다. 고해상도 위성영상의 경우 중저해상도 위성영상보다 저장용량이 크기 때문에 특히 데이터 저장 공간의 제공을 포함하는 클라우드 환경이 더욱 중요하다. 현재 대부분의 ARD가 구축되고 ODC가 개발된 뒤에 운영되는 환경은 AWS인데, 이 클라우드 환경이 상용 서비스로 여러 가지 대여 조건 설정과 비용 부담이 간단하지 않다. 미국의 USGS는 기관의 대규모 위성영상을 민간에서 제공하는 클라우드 환경과 직접 연계시키는 방식을 채택하면서 점점 민간에서 제공하는 서비스의 범위를 확대하려는 움직임을 보인다. 그러나 일본과 같이 자국의 클라우드가 포함된 자체 서비스 시스템을 구축하거나 (Kawasaki et al., 2018), 대만과 같이 국가 공용 클라우드와 AWS를 연계하는 방식 등도 운영 중이다. 또한 기술적 검토를 통하여 오픈스택(OpenStack)과 같은 오픈소스 클라우드 환경을 적용하는 방안 등도 있다.
다섯 번째 사항은 위성정보 서비스 시스템 구축과 관련된 기술 분야를 다루는 국제기구의 참여에 대한 것이다. CEOS는 1990년대 말부터 대용량 위성영상 정보의 상호운영과 위성 자료에 대한 접근과 관리뿐만 아니라 시스템 구축에 필요한 기술 교류 등을 목적으로 한 Working Group on Information Systems and Services (WGISS, https://ceos.org/ourwork/workinggroups/wgiss/) 을 운영하고 있다. WGISS에는 미국, 독일, 호주, 프랑스, 일본, 중국, 인도 등의 위성정보 획득 및 배포, 활용을 담당하는 정부 산하 연구 기관들이 거의 대부분 참여하고 있는 데, 우리나라는 아직 이 기구에 참여하는 기관이 없는 실정이다. 이 기구에서 최근 다루는 주요 주제에 ODC와 클라우드 컴퓨팅이 자주 포함되기 때문에 이러한 기구를 통한 기술 교류도 중요한 고려 사항이라고 할 수 있다.
5. 결론
지구관측 위성과 관계된 주요 국제기구인 GEO와 CEOS등에서 ARD와 ODC의 확산을 위한 시스템 기술과 표준 개발을 지속하고 있으며 이러한 성과는 민간 부문으로 확대되고 있다. KOMPSAT-3/3A, CAS-500 1/2/4와 같은 고해상도 영상의 민간 활용을 위하여 최근 위성 정보의 중요한 동향 중 하나인 CEOS-ARD 기술과 구축에 대한 연구가 필요한 시점이다. 이 연구는 현재까지 운용되고 있는 ARD 자료의 배포 방식을 세 가지로 구분하여 정리하였고 ODC와의 연계성을 설명하였다. ODC는 클라우드 환경에서 구축되고 GEO의 GEOSS에 적용되고 있는 위성 정보 응용 플랫폼이다. 연구의 결과로 KOMPSAT-3/3A와 같은 고해상도 위성 영상의 실무적인 ARD 구축 단계를 제시하였고, ODC와 클라우드 환경에서 배포되는 고해상도 위성영상의 ARD 구축/운영 모델과 ARD 구축에 따른 개념적 단계의 응용 모델을 제시하였다. 한편 우리나라의 고해상도 광학 위성영상의 ARD 구축, ODC 운영 등에서 고려해야 하는 사유 지식재산권, RadCalNet 포털을 이용한 정확도 품질 관리, ODC 채택, 오픈소스 클라우드 환경, 국제기구 참여 등과 같은 토의 사항을 제시하였다. 대만의 경우 ARD와 ODC 구축에 따른 응용 단계이고, 중국의 경우는 자체 위성 응용 시스템과 함께 ODC 구축을 고려하고 있는 상태이다. 그러나 일본의 경우는 현재 ODC를 채택하지 않고 있지만, SAR 영상의 ARD 구축과 표준 개발에 집중하고 있다. 지표 반사도 ARD 구축을 통하여 얻을 수 있는 가장 중요한 이점은 사용자 입장에서는 지표 반사도 자체가 식생 분석에 필요한 기본 자료이기 때문에 품질이 확인된 ARD 자료가 제공되는 경우 즉시 적용이 가능하다는 것이다. 제공자 측면에서의 이점은 고해상도 지표 반사도의 정확도를 증가시키는 연구와 기술 개발을 통하여 자신의 제공하는 위성 정보의 부가가치를 높일 수 있다는 것이다. 따라서 이 분야에 대한 우리나라의 수준은 실용화이전의 초기 연구 단계이므로 전문가 그룹을 중심으로 하여 ARD와 ODC 적용 등에 대한 보다 적극적인 관심과 관련 기초 연구와 기술 개발이 필요하다. 이와 함께 위성 정보의 해외 시장 확대를 도모하기 위하여 이러한 국제 추세에 대한 대응 전략을 마련해야 한다.
사사
본 연구는 한성대학교 교내학술연구비 지원과제임(이기원). 이 성과는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(No. NRF-2021R1F1A1045923)(김광섭).
References
- Baumann, P., 2017. The Datacube Manifesto, http://earthserver.eu/tech/datacube-manifesto, Accessed on Mar. 25, 2021.
- Bendini, H.N., L.M.G. Fonseca, M. Schwieder, P. Rufin, T.S. Korting, A. Koumrouyan, and P. Hostert, 2020. Combining Environmental and Landsat Analysis Ready data for Vegetation Mapping: A Case Study in the Brazilian Savanna Biome, Proc. of 2020 XXIV ISPRS Congress, Virtual Conference, Aug. 31-Sep. 2, vol. XLIII-B3-2020, pp. 953-960.
- Cheng, M.-C., C.-R. Chiou, B. Chen, C. Liu, H.-C. Lin, I-. Shih, C.-H. Chung, H.-Y. Lin, and C.-Y. Chou, 2019. Open Data Cube (ODC) in Taiwan: The Initiative and Protocol Development, Proc. of IGARSS 2019, Yokohama, JP, Aug. 1, pp. 5654-5657.
- Dhu, T., G. Giuliani, J. Juarez, A. Kavvada, B. Killough, P. Merodio, S. Minchin, and S. Ramage, 2019. National Open Data Cubes and Their Contribution to Country-Level Development Policies and Practices, Data, 4: 144.
- Frantz, D., 2019. FORCE - Landsat + Sentinel-2 Analysis Ready Data and Beyond, Remote Sensing, 11: 1124. https://doi.org/10.3390/rs11091124
- Ferreira, K.R., G.R. Queiroz, L. Vinhas, R.F.B. Marujo, R.E.O. Simoes, M.C.A. Picoli, G. Camara, R. Cartaxo, V.C.F. Gomes, I.A. Santos, A.H. Sanchez, J.S. Arcanjo, J.G. Fronza, C.A. Noronha, R.W. Costa, M.C. Zaglia, F. Zioti, T.S. Korting, A.R. Soares, M.E.D. Chaves, and L.M.G. Fonseca, 2020. Earth Observation Data Cubes for Brazil: Requirements, Methodology and Products, Remote Sensing, 12: 4033.
- Geller, C., 2021. Introducing Maxar ARD: Accelerating the Pixel-to-Answer Workflow with Analysis-Ready Data, https://blog.maxar.com/earth-intelligence/2021/introducing-maxar-ard-accelerating-the-pixelto-answer-workflow-with-analysis-ready-data, Accessed on Mar. 25, 2021.
- Giuliani, G., B. Chatenoux, A. De Bono, D. Rodila, J.-P. Richard, K. Allenbach, H. Dao, and P. Peduzzi, 2017. Building an Earth Observations Data Cube: lessons learned from the Swiss Data Cube (SDC) on generating Analysis Ready Data (ARD), Big Earth Data, 1(1-2): 100-117. https://doi.org/10.1080/20964471.2017.1398903
- Giuliani, G., E. Egger, J. Italiano, C. Poussin, J.-P. Richard, and B. Chatenoux, 2020. Essential Variables for Environmental Monitoring: What Are the Possible Contributions of Earth Observation Data Cubes?, Data, 5: 100. https://doi.org/10.3390/data5040100
- Giuliani, G., B. Chatenoux, A. Benvenuti, P. Lacroix, M. Santoro, and P. Mazzetti, 2020. Monitoring Land Degradation at National Level using Satellite Earth Observation Time-Series Data to Support SDG15 - Exploring the Potential of Data Cube, Big Earth Data, 4(1): 3-22. https://doi.org/10.1080/20964471.2020.1711633
- Gomes, V.C.F., G.R. Queiroz, and K.R. Ferreira, 2020. An Overview of Platforms for Big Earth Observation Data Management and Analysis, Remote Sensing, 12: 1253 https://doi.org/10.3390/rs12081253
- Gorelick, N., M. Hancher, M. Dixon, S. Ilyushchenko, D. Thau, and R. Moore, 2017. Google Earth Engine: Planetary-scale Geospatial Analysis for Everyone, Remote Sensing of Environment, 202: 18-27. https://doi.org/10.1016/j.rse.2017.06.031
- Gu, X., 2018. Satellite Earth Observation System and Spectrum Earth, http://ggim.un.org/unwgic/presentations/2.5_Gu_Xingfa.pdf, Accessed on Mar. 25, 2021.
- Holmes, C., 2018. Analysis Ready Data Defined Cloud Native Geoprocessing Part 2, https://medium.com/planet-stories/analysis-ready-data-defined-5694f6f48815, Accessed on Mar. 25, 2021.
- Kawasaki, A., P. Koudelova, K. Tamakawa, A. Kitamoto, E. Ikoma, K. Ikeuchi, R. Shibasaki, M. Kitsuregawa, and T. Koike, 2018. Data Integration and Analysis System (DIAS) as a Platform for Data and Model Integration: Cases in the Field of Water Resources Management and Disaster Risk Reduction, Data Science Journal, 17(29): 1-14. https://doi.org/10.5334/dsj-2018-001
- Killough, B., A. Siqueira, and G. Dyke, 2020. Advancements in the Open Data cube and Analysis Ready Data - Past, Present and Future, Proc. of 2020 IEEE International Geoscience and Remote Sensing Symposium (IGARSS), Virtual Conference, Waikoloa, HI, USA, Sep. 26-Oct. 2, pp. 3376-3378.
- Kim, K. and K. Lee, 2020a. Validation of Surface Reflectance Product of KOMPSAT-3A Image Data Application of RadCalNet Baotou (BTCN) Data, Korean Journal of Remote Sensing, 36(6-2): 1509-1521 (in Korean with English abstract). https://doi.org/10.7780/KJRS.2020.36.6.2.3
- Kim, K. and K. Lee, 2020b. A Validation Experiment of the Reflectance Products of KOMPSAT-3A Based on RadCalNet Data and Its Applicability to Vegetation Indexing, Remote Sensing, 12: 3971. https://doi.org/10.3390/rs12233971
- Kim, T.J., S.H. Kim, Y.H. Hwang, S.W. Jung, C.S. Ye, and Y.K. Han, 2021. A Study on the Planning of User-Friendly Image Products for Utilization of the National Base Map, Research Report 11-1613436-000271-01, National Land Satellite Center of National Geographic Information Institute (NGII), Suwon, Korea, pp. 12-159.
- Kline, K., 2018. CEOS WGISS #46 USGS Agency Report, https://ceos.org/meetings/wgiss-46/, Accessed on Mar. 25, 2021.
- Kopp, S., P. Becker, A. Doshi, D.J. Wright, K. Zhang, and H. Xu, 2019. Achieving the Full Vision of Earth Observation Data Cubes, Data, 4: 94. https://doi.org/10.3390/data4030094
- Kuester, M. and T. Ochoa, 2019. Improvements in Calibration, and Validation of the Absolute Radiometric Response of MAXAR Earth-Observing Sensors, https://calval.cr.usgs.gov/apps/sites/default/files/jacie/MicheleKuester.pdf, Accessed on Sept. 14, 2021.
- Kumar, L. and O. Mutang, 2018. Google Earth Engine Applications since Inception: Usage, Trends, and Potential, Remote Sensing, 10: 1509. https://doi.org/10.3390/rs10101509
- Lee, K., S. Kang, K. Kim, and T.-B. Chae, 2017. Cloud-based Satellite Image Processing Service by Open Source Stack: A KARI Case, Korean Journal of Remote Sensing, 33(4): 339-350 (in Korean with English abstract). https://doi.org/10.7780/KJRS.2017.33.4.1
- Lee, K. and K. Kim, 2019. An Experiment for Surface Reflectance Image Generation of KOMPSAT 3A Image Data by Open Source Implementation, Korean Journal of Remote Sensing, 35(6-4): 1327-1339 (in Korean with English abstract). https://doi.org/10.7780/KJRS.2019.35.6.4.3
- Lee, K., K. Kim, S.-G. Lee, and Y.-S. Kim, 2019. Consideration Points for application of KOMPSAT Data to Open Data Cube, Journal of the Korean Association of Geographic Information Studies, 22(1): 62-77 (in Korean with English abstract). https://doi.org/10.11108/KAGIS.2019.22.1.062
- Lee, K. and K. Kim, 2020. Validation of Surface Reflectance Product of KOMPSAT-3A Image Data Using RadCalNet Data, Korean Journal of Remote Sensing, 36(2-1): 167-178 (in Korean with English abstract). https://doi.org/10.7780/kjrs.2020.36.2.1.6
- Lee, K., K. Kim, S. Lee, and Y. Kim, 2020. Determination of the Normalized Difference Vegetation Index (NDVI) with Top-of-Canopy(TOC) Reflectance from a KOMPSAT-3A Image Using Orfeo ToolBox (OTB) Extension, International Journal of Geo-Information, 9(4): 257. https://doi.org/10.3390/ijgi9040257
- Maso, J., A. Zabala, I. Serral, and X. Pons, 2019. A Portal Offering Standard Visualization and Analysis on Top of an Open Data Cube for Sub-National Regions: The Catalan Data Cube Example, Data, 4: 96. https://doi.org/10.3390/data4030096
- Pacific, F., 2020. Future of Remote Sensing and Data Quality, https://calval.cr.usgs.gov/apps/sites/default/files/jacie/2020-S5-Pacifici-Future_Remote_Sensing_Data_Quality.pdf. Accessed on June 12, 2021.
- Pinto, C.T., X. Jing and L. Leigh, 2020. Evaluation Analysis of Landsat Level-1 and Level-2 Data Products Using In Situ Measurements, Remote Sensing, 12: 2597. https://doi.org/10.3390/rs12162597
- Quang, N.H., V.A. Tuan, N.T.P. Hao, L.T.T. Hang, N.M. Hung, V.L. Anh, L.T.M. Phuong, and R. Carrie, 2019. Synthetic aperture radar and optical remote sensing image fusion for flood monitoring in the Vietnam lower Mekong basin: a prototype application for the Vietnam Open Data Cube, European Journal of Remote Sensing, 52(1): 599-612. https://doi.org/10.1080/22797254.2019.1698319
- Rizvi, S. R., B. Killough, A. Cherry, J. Rattz, A. Lubawy, and S. Gowda, 2020. Data Cube Application Algorithms for the United Nation Sustainable Development Goals (UN-SDGS), Proc. of 2020 IEEE International Geoscience and Remote Sensing Symposium (IGARSS), Virtual Conference, Waikoloa, HI, USA, Sep. 26-Oct. 2, pp. 3399-3402.
- Sudmanns, M., D. Tiede, S. Lang, H. Bergstedt, G. Trost, H. Augustin, A. Baraldi, and T. Blaschke, 2020. Big Earth Data: Disruptive Changes in Earth Observation Data Management and Analysis?, International Journal of Digital Earth, 13(7): 832-850. https://doi.org/10.1080/17538947.2019.1585976
- Truckenbrodt, J., T. Freemantle, C. Williams, T. Jones, D. Small, C. Dubois, C. Thiel, C. Rossi, A. Syriou, and G. Giuliani, 2019. Towards Sentinel-1 SAR Analysis-Ready Data: A Best Practices Assessment on Preparing Backscatter Data for the Cube, Data, 4: 93. https://doi.org/10.3390/data4030093
- Voidrot, M.-F. and G. Percivall, G., 2020. OGC Geospatial Coverages Data Cube Community Practice, https://iopscience.iop.org/article/10.1088/1755-1315/509/1/012058/pdf, Accessed on Mar. 25, 2021.
- Yao, X., Y. Liu, Q. Cao, J. Li, R. Huang, R. Woodcock, M. Paget, J. Wang, and G. Li, 2018. China Data Cube (CDC) for Big Earth Observation Data: Lessons Learned from the Design and Implementation, Proc. of International Workshop on Big Geospatial Data and Data Science (BGDDS), Wuhan, CN, Sept. 22, pp.1-3.
- Zhang, L., G. Li, C. Zhang, H. Yue, and X. Liao, 2019. Approach and Practice: Integrating Earth Observation Resources for Data Sharing in China GEOSS, International Journal of Digital Earth, 12(12): 1441-1456. https://doi.org/10.1080/17538947.2018.1504995
- Zhong, B., A. Yang, Q. Liu, S. Wu, X. Shan, X. Mu, L. Hu, and J. Wu, 2021. Analysis Ready Data of the Chinese GaoFen Satellite Data, Remote Sensing, 13: 1709. https://doi.org/10.3390/rs13091709