토픽모델링을 이용한 대한원격탐사학회지의 연구주제 분류 및 연구동향 분석: 자연·환경재해 분야를 중심으로

A Study on the Research Topics and Trends in Korean Journal of Remote Sensing: Focusing on Natural & Environmental Disasters

  • 김태용 (부경대학교 지구환경시스템과학부 지구환경과학전공) ;
  • 박혜민 (부경대학교 지구환경시스템과학부 지구환경과학전공) ;
  • 허준용 (부경대학교 지구환경시스템과학부 지구환경과학전공) ;
  • 양민준 (부경대학교 지구환경과학과)
  • Kim, Taeyong (Division of Earth Environmental System Sciences (Major of Earth Environmental Sciences), Pukyong National University) ;
  • Park, Hyemin (Division of Earth Environmental System Sciences (Major of Earth Environmental Sciences), Pukyong National University) ;
  • Heo, Junyong (Division of Earth Environmental System Sciences (Major of Earth Environmental Sciences), Pukyong National University) ;
  • Yang, Minjune (Department of Earth and Environmental Sciences, Pukyong National University)
  • 투고 : 2021.12.08
  • 심사 : 2021.12.20
  • 발행 : 2021.12.31


대한원격탐사학회지는 국내 원격탐사 분야를 대표하는 학술지로 원격탐사를 바탕으로 다학제 간 융합연구를 통해 수행된 다양한 분야의 연구논문들이 게재되고 있다. 본 연구는 대한원격탐사학회지에 게재된 논문을 바탕으로 토픽모델링을 수행하여 원격탐사 분야의 역사와 발전에 대해 논의하고자 한다. 1985년부터 2021년까지 총 1,847편의 논문 제목, 주제어, 다국어 초록을 수집하였다. 대한원격탐사학회지의 전반적인 연구 동향과 자연·환경재해 분야의 연구동향을 확인하기 위해 Latent Dirichlet Allocation (LDA)를 수행하였으며, 연구주제를 분류하고 연구동향을 확인하였다. 대한원격탐사학회지 전체 논문을 대상으로 LDA를 수행한 결과 4개의 연구주제('극권', '수권', '지권', '기권')로 분류할 수 있었으며, 시간에 따라 '기권'과 관련된 연구주제들이 성행하는 것을 확인하였다(linear slope=3.51 × 10-3, p< 0.05). 전체 논문 중 자연·환경재해 분야를 대상으로 LDA를 수행한 결과 7개의 연구주제('해양 오염', '대기 오염', '화산재해', '산불', '홍수', '가뭄', '폭우')로 분류할 수 있었으며, 시간에 따라 '대기 오염'과 관련된 연구주제들이 성행하는 것을 확인하였다(linear slope=2.61 × 10-3, p<0.05). 본 연구의 결과는 원격탐사를 다루는 다양한 분야의 연구자들에게 원격탐사 분야와 자연·환경재해 분야의 역사와 발전에 대한 이해를 제공했음에 의의가 있다.

Korean Journal of Remote Sensing (KJRS), leading the field of remote sensing and GIS in South Korea for over 37 years, has published interdisciplinary research papers. In this study, we performed the topic modeling based on Latent Dirichlet Allocation (LDA), a probabilistic generative model, to identify the research topics and trends using 1) the whole articles, and 2) specific articles related to natural and environmental disasters published in KJRS by analyzing titles, keywords, and abstracts. The results of LDA showed that 4 topics('Polar', 'Hydrosphere', 'Geosphere', and 'Atmosphere') were identified in the whole articles and the topic of 'Polar' was dominant among them (linear slope=3.51 × 10-3, p<0.05) over time. For the specific articles related to natural and environmental disasters, the optimal number of topics were 7 ('Marine pollution', 'Air pollution', 'Volcano', 'Wildfire', 'Flood', 'Drought', and 'Heavy rain') and the topic of 'Air pollution' was dominant (linear slope=2.61 × 10-3, p<0.05) over time. The results from this study provide the history and insight into natural and environmental disasters in KRJS with multidisciplinary researchers.


1. 서론

원격탐사(remote sensing)는 물체를 측정하여 정보를 분석하는 사진술(photography)에서 유래된 학문으로, 조사하려는 어떤 대상이나 지역을 접촉하지 않고 물체가 갖는 분광학적 특성을 기반으로 항공기, 인공위성, 드론 등에 탑재된 센서를 이용하여 반사 또는 방출된 에너지를 감지, 기록, 가공, 분석, 수집하고, 해당 정보를 적용하는 자연환경 모니터링 기술이다. 원격탐사 연구는 대기권, 수권, 지권, 생물권을 포함한 다양한 지구권역을 대상으로 수행되고 있으며, 국토관리, 해양수산관리, 수자원관리, 농림자원관리, 재해 관리, 국방 분야, 기후 변화, 기상 관측 등 다양한 분야에서 적극적으로 활용되고 있다(Jung et al., 2019). 국내 원격탐사 분야는 1985년에 창간된 대한원격탐사학회지를 필두로 본격적인 연구 논의가 이루어지고 있으며, 육상, 해양, 대기, 우주 등 다양한 전문분야에 대해 원격탐사를 적용한 다학제 간 융합연구를 바탕으로 수행된 연구논문들이 게재되고 있다.

국내 원격탐사 분야와 관련된 연구 활동이 활발해짐에 따라 원격탐사와 관련된 연구 분야 또한, 다양한 문헌고찰(literature review) 연구들이 수행되었다. 특히, 대한원격탐사학회지는 해양, 극지, 대기, 육상을 대상으로 원격탐사를 적용한 연구들과 지진·화산, 산불, 가뭄, 홍수, 태풍, 기후변화 등 자연재해·재난분야를 대상으로 원격탐사 적용한 연구들의 소개와 연구동향에 대해 논의하였다(Im et al., 2020; Lee et al., 2017a; Lee et al., 2017b; Lee et al., 2018; Kim et al., 2018; Kim et al., 2019a; Kim et al., 2020; Kim and Kim 2020; Jae et al., 2019; Jung et al., 2019; Jung et al.,2021; Ryu et al., 2020). 하지만, 기존의 선행 연구들은 원격탐사 내 특정 분야에 대해 집중적으로 분석하였기 때문에 전반적인 연구동향을 확인하기에는 어려움이 존재하였다. 또한, 원격탐사 분야의 연구동향 분석은 연구자가 직접 내용을 분석하고 판단하는 연구가 많았기 때문에 연구자 개인의 견해가 연구결과에 반영될 수 있으며, 많은 분량의 문헌을 직접 검토하고 해석하기에는 어렵다는 단점이 존재하였다.

이러한 문제점들을 해결하기 위해 최근 문헌검토 연구들은 기계학습 및 자연어 처리 분야에서 사용중인 토픽모델링(topic modeling)기법을 적용하여 분석을 실 시하였다. 토픽모델링은 대용량의 문헌 내에 존재하는 주제를 추출하기 위한 통계적 모델로, 텍스트 데이터 내 숨겨진 의미구조를 발견하기 위해 사용되는 텍스트 마이닝(text mining) 기법 중 하나이다. 그 중에서 Latent Dirichlet Allocation (LDA) 모델은 Blei et al., 2003에서 처 음 소개되었으며, 일반적으로 사용되는 토픽 모델 중 하 나이다. LDA는 확률적 생성모델(probabilistic generative model)로 주제별 단어의 확률분포와 문서별 주제들의 확률분포를 추론할 수 있어 주제별로 문헌을 분류할 수 있다. 따라서, LDA를 이용한 문헌고찰 연구는 기존의 연구 방법에 비해 빠르고, 간단하며, 연구자의 개인적인 견해가 배제되기 때문에 많은 분야에서 사용되고 있다 (Blei et al., 2010).

토픽모델링을 이용한 문헌 고찰 연구는 다양한 분야에서 수행되었다. Jiang et al. (2016)은 수력 발전 연구와 관련된 단어(e.g., hydro-power, hydro-energy, hydroelectric, etc.)들을 SCIE (Science Citation Index Expanded) 및 SSCI (Social Sciences Citation Index)의 데이터베이스에 검색하여 논문들을 수집하였고, 대용량의 문헌내에 내재되어 있는 최적의 주제개수(K=29)를 도출하였다. 또한, 주제별 동향을 파악하였고, 유사도 분석을 통해 주제 간 연관성을 확인하였다. Syed et al. (2018)은 1990년부터 2016년까지 총 21개의 수산업과 관련된 논문들을 수집하였으며, 25개의 연구주제로 분류하였다. 또한, 연구주제별 동향과 전체 논문 중 해당 연구주제의 비율을 확인하였고, 학술지별 연구주제의 비율을 확인하여 수산업의 전체적인 연구 동향을 확인하였다. Kim et al. (2021) 은 자원환경지질학술지를 대상으로 토픽모델링을 수행하여 학술지에 내재되어 있는 지질학적 연구주제들을 추론하였고, 해당 연구주제별 연구동향을 확인하였으며 연구주제 간 연관성을 정량적으로 확인하였다. 위 선행 연구들을 바탕으로, 토픽모델링과 병행한 문헌 고찰 연구를 수행하게 된다면 분석에 소요되는 시간과 비용의 한계를 극복할 수 있는 연구 동향분석이 가능할 것이다.

따라서, 본 연구에서는 대한원격탐사학회지를 대상으로 LDA 모델을 사용하여 해당 학술지의 전체 논문과 자연·환경재해 분야를 대상으로 각각의 연구주제 분류 및 연구동향을 제시하여 대한원격탐사학회지의 역사와 발전에 관하여 논의해 보고자 한다.

2. 연구 방법

1) 데이터 수집 및 전처리

본 연구에서 사용한 데이터는 국내 학술 데이터베이스 사이트인 RISS (Research Information Sharing Service) 에서 대한원격탐사학회지의 창간 년도인 1985년 1권 1호부터 2021년 37권 3호까지 총 37년간 출판한 논문 1,847편을 수집하였다. 대한원격탐사학회지는 1985년부터 1997년까지 연간 2회로 출간하였으며, 1997년부터 2001년까지 연간 4회, 2002년부터 현재까지 연간 6회로 출간하였다. 연간 평균 논문 수는 49.92편이고, 연간 누적 논문 수는 지속적으로 증가하는 추세(linearslope=51.01, R2=0.90, p<0.05)를 보였다(Fig. 1).

OGCSBN_2021_v37n6_2_1869_f0001.png 이미지

Fig. 1. The number of publications per year (grey bar) and the cumulative number of publications (black line) from 1985 to 2021 published in Korean Journal of Remote Sensing (KJRS). The vertical dashed lines (1997 and 2001) represent the time when the number of issues per year has been changed in KJRS.

대한원격탐사학술지에 게재된 논문의 제목, 주제어, 초록에 대한 정보들을 학습데이터로 준비하였으며, 해당 논문의 발행연도에 대한 데이터는 학습 후 LDA 모델의 결과데이터와 결합하여 시간에 따른 연구동향을 확인하기 위해 사용하였다. 논문에 대한 국문 데이터는 학술적 용어의 한글 표기법과 연구 분야마다 사용하는 국문 용어가 상이하기 때문에 영문 데이터를 추출하여 분석하였다. 준비된 학습데이터를 대상으로 띄어쓰기 (white space)와 구두점(punctuation mark)을 기준으로 문장을 단어로 변환시켜주는 토큰화(tokenization)를 실시하였다. 또한, 문장 내에서 자주 사용하지만 분석에 필요하지 않은 관사, 대명사와 같은 단어(e.g., is, the, that, was, etc.)를 제거하기 위해 불용어(stopwords)처리를 수행하였다. 마지막으로, 단어의 시제 및 수 일치 등 같은 의미를 지시하는 단어의 원형으로 변환하여 사용하기 위해 어간을 추출(stemming)하여 사용하였다. 텍스트 데이터 전처리는 파이썬 환경의 자연어처리 라이브러리인 NLTK (Loper and Bird, 2002)를 바탕으로 수행하였으며 어간추출은 porterstemming algorithm (Porter, 1980)을 사용하여 수행하였다.

2) Latent Dirichlet Allocation (LDA)

Latent Dirichlet Allocation (LDA)는 구조화되지 않은 대용량의 문헌에 내재되어 있는 주제를 추론하는 토픽 모델링 기법 중 하나로, 가장 보편적으로 사용되고 있는 기계학습알고리즘중하나이다(Blei et al., 2003;Blei, 2010). LDA는 확률적 생성 모델로 문서 내 포함되어 있는 단어를 바탕으로 주제에 따른 단어의 분포를 추정하고, 문서별 주제의 분포를 추정할 수 있기 때문에 많은 문헌 고찰 연구에서 적용되었다. LDA의 그래프 모델과 각 변수에 대한 설명은 Fig. 2와 Table 1에서 확인할 수 있다.

Fig. 2에서 D는 전체 문서 집합을 나타내며, N은 문서에 포함된 단어의 집합을 의미한다. θd는 d번째 문서에 대한 주제의 확률분포를 뜻하며, α를 매개변수로 갖는 디리클레(Dirichlet) 분포에 의해 샘플링되고, zd,n는 d번째 문서의 n번째에 단어에 대한 주제의 할당(allocation)을 의미한다. βk는 k번째 주제에 대한 단어의 확률분포를 뜻하며, η를 매개변수로 갖는 디리클레 분포에 의해 샘플링된다. wd, n는 d번째 문서의 n번째 단어를 의미하며 확률분포 βk와 zd,n에 의해 결정되며, wd, n는 실제로 관측 가능한 변수이고 나머지 변수들은 내재되어 있는 잠재 변수(latent variable)이다. 해당 과정은 식 (1)과 같은 결합 확률분포로 표현할 수 있다.

OGCSBN_2021_v37n6_2_1869_f0002.png 이미지

Fig. 2. Graphical model of Latent Dirichlet Allocation (LDA). Observed node (words in documents) is shaded as grey, and latent nodes are unshaded. Rectangles are plate notation which denotes the repetitions of random variables (D, N, and K).

Table 1. Notation of random variables and parameters used in this study

OGCSBN_2021_v37n6_2_1869_t0001.png 이미지

\(\begin{gathered} p\left(\beta_{1: K}, \theta_{1: D,} z_{1 D,} w_{1 D}\right)=\prod_{j=1}^{K} p\left(\beta_{i} \mid \alpha\right) \prod_{d=1}^{D} p\left(\theta_{d} \mid \eta\right) \\ \left(\prod_{n=1}^{N} p\left(z_{d, n} \mid \theta_{d}\right) p\left(w_{d, n} \mid \beta_{1: K}, z_{d, k}\right)\right) \end{gathered}\)             (1)

모델링 과정 중 사전에 설정해야 하는 초모수(hyperparameter)는 α, η, K로 α, η는 단어와 주제에 대한 디리클레 분포의 모형에 대한 매개변수이고, K는 문헌에 내재되어 있는 주제의 개수를 의미한다.

본 연구에서 수행된 LDA 모델링은 Fig. 3에서 확인할 수 있다. 먼저 대한원격탐사학회지에 게재된 전체 논문(D= 1,847)을 대상으로 모델링을 수행하였으며, 모델링 결과를 바탕으로 주제를 동정하고 전체 논문에 대한 해당 주제의 비율을 계산하였다(Fig. 3(a)). 또한, 자연·환경재해(Natural and Environmental disasters)와 관련된 단어(e.g., disaster, drought, earthquake, flood, etc.)를 선별하고, 전체 논문 중 해당 단어를 포함하는 논문(D=550)을 추출하여 모델링을 수행하고 결과를 해석하였다(Fig. 3(b)). 최적의 주제 개수를 계산하기 위해 사전 실험으로 주제의 개수를 4개부터 20개까지 다양하게 설정하여 LDA 결과를 분석하였으며, 해석하기 힘든 주제는 제외하고 결과를 확인하였다. 시간에 따른 주제별 동향을 파악하기 위해 단순선형회귀분석(simple linear regression analysis)을 실시하였다. 대한원격탐사학회지의 출판연도를 독립변수로 설정하였으며, 주제의 연도별 비중을 종속변수로 설정하여 회귀계수를 계산하였고, 유의성을 확인하기 위해 양측 t 검정(paired student t-test)을 실시하였다.

OGCSBN_2021_v37n6_2_1869_f0003.png 이미지

Fig. 3. The flow charts of topic analysis with (a) the total articles published in KJRS and with (b) the specific articles including words related to natural and environmental disasters (e.g., disaster, drought, earthquake, etc.). The results of LDA (θ and β) showed the word proportion per topic and the document proportion per topic.

3. 결과 및 토의

1) 대한원격탐사학회지의 연구주제 분류 및 연구동향

대한원격탐사학회지에 게재된 전체 논문 1,847편을 대상으로 LDA 분석을 실시하였으며 총 4개의 주제로 분류하는 것이 가장 적합하였다. 주제별 단어들의 확률 분포를 바탕으로 주제에 따른 단어의 비중이 큰 단어들을 바탕으로 연구 주제를 명명하였으며 해당결과를 워드클라우드(wordcloud)로 표현하였다(Fig. 4(a)). 모델링 분석 결과를 바탕으로 ‘극권(Polar)’, ‘수권(Hydrosphere)’, ‘지권(Geosphere)’, ‘기권(Atmosphere)’에 대한 연구주제로 분류할 수 있었다.

OGCSBN_2021_v37n6_2_1869_f0004.png 이미지

Fig. 4. (a) Wordclouds and (b) line plots of each research topic (K=4) for the total articles (D=1,847) published in KJRS. (a) The size of the words in wordclouds represents the proportion of the word in each topic. (b) The annual topic proportion indicates a trend of each topic over time.

위 결과를 바탕으로, 연구주제별 논문의 출현 확률을 계산하고 내림차순으로 논문을 정렬하여 각 주제별 세부적인 내용을 해석하였고, 연도별 비중을 바탕으로 선형회귀 분석을 실시하여 연구동향을 확인하였다(Fig. 4(b)). 1. ‘극권’에 대한 연구는 전체 논문 중 12.4%를 차지하였으며, 인공위성 자료를 이용하여 극지방 빙하 특성을 규명한 논문들이 주를 이루고 있었다(Han and Lee, 2011). 특히, 기후변화에 따른 빙하의 면적 및 해수면의 변화와 빙하의 유속 관측 등 빙하 대상의 연구들이 주를 이루었다(Ha et al., 2006; Han and Lee, 2011; Han et al., 2013; Baek et al., 2018). 선형회귀분석 결과, ‘극권’에 대한 연구주제의 연도별 비중은 통계적으로 유의한 경향을 보이지 않았다(p> 0.05). 2. ‘수권’에 대한 연구는 전체 논문 중 13.3%를 차지하였으며, 위성 영상 자료를 이용하여 지속 가능한 수자원 개발 및 관리와 관련된 연구들이 주를 이루었다(Ye, 2015). 특히, 적조 및 녹조 탐지 기술 개발과 해수, 담수 및 지하수의 수질 오염 관련 연구들이 큰 비중을 차지하였다(Jang et al., 1998; Eom et al., 2007; Shin et al., 2017). 선형회귀분석 결과, ‘수권’에 대한 연구주제의 연도별 비중은 통계적으로 유의한 경향을 보이지 않았다(p> 0.05). 3. ‘지권’에 대한 연구는 전체 논문 중 24.5%를 차지하였으며, 특정 지역의 분할영상을 기반으로 토지피복 분류 및 시간에 따른 토지피복 변동과 관련된 논문들의 집합으로 나타났다(Kim et al., 2010; Panta and Kim, 2006; Ryu et al., 2017). 특히, 위성 자료를 이용한 농작물 수확량 통계 예측 및 산림녹지 변화 분석 등 다양한 연구들이 진행되었다(Ban et al., 2017; Ryu et al., 2017). 선형회귀분석 결과, ‘지권’에 대한 연구주제의 연도별 비중은 통계적으로 유의한 경향을 보이지 않았다(p>0.05). 4. ‘기권’에 대한 연구는 전체 논문 중 16.2%를 차지하였으며, 레이더 자료를 활용한 대기권 특성과 대기 오염 물질의 농도 분포 및 장거리 이동에 관련한 주제들이 논의되었다(Heo and Kim, 2001; Nam et al., 2019; Yang et al., 2019). 특히, 이산화탄소 및 이산화황 연직칼럼농도(vertical column density, VCD) 산출과 미세먼지(particulate matter, PM) 농도 분포와 연관된 주제들이 논의되었다(Yang et al., 2017, 2019; Park et al., 2020a; Park et al., 2020b). 선형회귀분석 결과, ‘기권’에 대한 연구주제의 연도별 비중은 통계적으로 유의한 경향을 보였으며(linear slope=3.51×10–3 , p< 0.05), 이는 1990년대 대기 측정망 도입으로 인해 대용량의 원격 탐사 데이터를 축적할 수 있게 되면서 활발한 연구가 수행되었기 때문으로 판단된다. 또한, 2000년대 초반부터 고농도의 미세먼지가 발생함에 따라 미세먼지와 관련된 연구들이 활발하게 수행되었으며, 이에 따라 정부에서는 미세먼 지 종합대책을 수립하여 시행하고 있는 것으로 확인된다(Kim, 2017).

2) 자연·환경재해 분야의 연구주제 분류 및 연구동향

대한원격탐사학회지에 게재된 전체 논문 중 자연·환경재해 분야와 관련된 논문 550편을 대상으로 LDA 분석을 실시하였으며 총 7개의 주제로 분류하는 것이 가장 적합하였다. 모델링 분석 결과를 바탕으로 ‘해양 오염(Marine pollution)’, ‘대기 오염(Air pollution)’, ‘화산재해 (Volcano)’, ‘산불(Wildfire)’, ‘홍수(Flood)’, ‘가뭄(Drought)’, ‘폭우(Heavy rain)’에 대한 연구주제로 분류할 수 있었다 (Fig. 5(a)).

분류된 결과를 바탕으로 선형회귀 분석을 실시하여 연구동향을 확인하였다(Fig. 5(b)). 1. ‘해양 오염’에 대한 연구는 전체 논문 중 9.47%로 해양의 오염 탐지 및 영향 범위 추정과 관련된 논문들이 큰 비중을 차지하였으며, GOCI와 MODIS에서 제공하는 정보를 기반으로 적조 탐지 알고리즘 개발 및 모니터링 관련 연구들이 주를 이루었다(Kim and Kim, 2008b; Oh et al., 2013; Shin et al., 2017). 선형회귀분석 결과, ‘해양 오염’에 대한 연구주제의 연도별 비중은 통계적으로 유의한 경향을 보이지 않았다(p>05). 2. ‘대기 오염’에 대한 연구는 전체 논문 중 8.3%로 에어로졸의 광학적 조성 및 연직 분포 특성에 대한 논의가 이루어졌으며, LiDAR 시스템을 이용하여 대기 오염 물질 발원지 및 이동 경로 추정에 관련된 연구들이 활발히 진행된 것을 확인하였다(Noh and Lee, 2013; Noh et al., 2013; Shin et al., 2014a; Shin et al., 2014b). 선형회귀분석 결과, ‘대기 오염’에 대한 연구주제의 연도별 비중은 통계적으로 유의한 경향을 보였다(linear slope=2.61×10–3 , p 0.05). 4. ‘산불’에 대한 연구는 전체 논문 중 11.6%로 다양한 인공위성(Landsat 7, Quickbird, and IKONOS)의 관측 자료를 사용하여 산불 피해정도를 평가하기 위한 연구들이 주로 분류되었다(Im and Park, 2004; Kim, 2008a, 2009). 또한, 원격탐사를 이용하여 위성영상 기반 산불발생 데이터와 산불피해대장 정보를 연계하여 산불피해 정보의 한계점을 개선하기 위한 연구도 이루어졌다(Kim and Choi, 2020). 선형회귀분석 결과, ‘산불’에 대한 연구주제의 연도별 비중은 통계적으로 유의한 경향을 보이지 않았다(p>05). 5. ‘홍수’에 대한 연구는 전체 논문 중 11.2%로 원격자료를 이용한 수계탐지를 통해 수역 변화와 수재해 가능성을 평가하고 모델 개발을 통한 수재 해 예측 연구들의 군집으로 나타났다(Kim et al., 1995; Ye, 2015). 특히, 하천구역 관리를 위한 고해상 영상 활용 연구, 댐 붕괴에 따른 수계변화 탐지 등 하천과 댐으로 인해 발생할 수 있는 홍수피해를 예방하기 위한 연구들이 이루어졌다(Park et al., 2008; Kim et al., 2019b). 선형회귀분석 결과, ‘홍수’에 대한 연구주제의 연도별 비중은 통계적으로 유의한 경향을 보이지 않았다(p> 0.05). 6. ‘가뭄’에 대한 연구는 전체 논문 중 13.1%로 가뭄 시 발생할 수 있는 작물 및 식생의 피해를 예방하기 위해 가뭄지수, 기상자료 등을 이용한 작물 수확량 추정 및 생육조건 파악을 위한 연구들이 분류되었다(Kim et al., 2016; Ban et al., 2017; Chae et al., 2017). 특히, 국내 농업분 야에서 건조지역에 대한 벼 작물의 생육, 기상자료 기반 생물리학적 벼 수확량 추정 등 다양한 연구가 이루어지고 있다(Yang and Miller, 1985; Lee et al., 2017a; Park et al., 2000). 선형회귀분석 결과, ‘가뭄’에 대한 연구주제의 연도별 비중은 통계적으로 유의한 경향을 보이지 않았다(p>05). 7. ‘폭우’에 대한 연구는 전체 논문 중 9.5%로 원격탐사 자료를 이용하여 특정기간 발생한 폭우, 폭설에 대한 구름 분포 및 강우 강도 등 기상상태 변화를 관찰한 연구들이 주를 이루었다(Park et al., 2000; Kwon and Lee, 2013; Cho and Kwon, 2014). 특히, 급격하게 발달하는 저기압이나 태풍으로 인한 기상상태(기압, 구름 형태, 풍속 등)의 변화에 대한 연구 등 다양한 연구들이 이루어졌다(Shin et al., 1995; Chung, 1996). 선형회귀분석 결과, ‘가뭄’에 대한 연구주제의 연도별 비중은 통계적으로 유의한 경향을 보이지 않았다(p> 0.05).

OGCSBN_2021_v37n6_2_1869_f0005.png 이미지

Fig. 5. (a) Wordclouds and (b) line plots of each research topic (K=7) for the specific articles related to natural and environmental disasters (D=550) published in KJRS. (a) The size of the words in wordclouds represents the proportion of the word in each topic. (b) The annual topic proportion indicates a trend of each topic over time.

4. 결론

본 연구는 대한원격탐사학회지에서 1985년부터 2021년까지 총 37년간 출판한 논문을 대상으로 학술지 전체(D=1,847)와 전체 논문 중 자연·환경재해 분야(D= 550)의 논문을 추출하여 토픽모델링을 수행하여 대한 원격탐사학회지의 역사에 대해 논의하였다. 1) 전체 논문 1,847편을 대상으로 LDA 분석을 수행한 결과 총 4개의 연구주제(‘극권’, ‘수권’, ‘지권’, 기권’)로 분류할 수 있었다. ‘기권’에 대한 연구는 시간에 따라 증가하는 추세를 보였으며(linear slope=3.51×10–3 , p< 0.05), 나머지 연구주제들은 뚜렷한 동향을 확인할 수 없었다(p>0.05). 2) 전체 논문 중 자연·환경재해 분야를 대상으로 수행한 논문 550편을 추출하여 LDA 분석을 수행한 결과 총 7개의 연구주제(‘해양 오염’, ‘대기 오염’, ‘화산재해’, ‘산불’, ‘홍수’, ‘가뭄’, ‘폭우’)로 분류할 수 있었다. ‘대기 오염’과 관련된 연구는 시간에 따라 증가하는 추세를 보였으며(linear slope=2.61×10–3 , p0.05). 이러한 경향은 대기권 관측 장비의 발전과 최근 고농도 미세먼지 발생에 따라 대기질 개선에 대한 관심이 증대하면서 대기오염과 관련한 다양한 연구가 활발히 진행된 것으로 판단된다(Park et al., 2012; Mukherjee and Agrawal, 2017).

본 연구는 대한원격탐사학회지를 대상으로 LDA를 적용하여 질적·양적 문헌고찰 연구를 수행하였다. 하지만, LDA 결과는 분류된 주제에 대해 명확한 정의를 제공하지 않아 연구자가 직접 해석을 해야 하는 한계점이 존재하였다. 따라서, 메타분석(meta-analysis), 체계적 문헌고찰(systematic review) 등 기존에 사용되었던 다양한 문헌 고찰 방법과 병행하여 토픽모델링을 수행하게 된다면 시간적·경제적으로 효율적이고 정확한 분석결과를 도출해 낼 수 있을 것으로 판단된다. 향후 통합적 문헌고찰 연구를 수행하기 위해 다양한 문헌고찰 연구방법 제시 및 결과 해석에 대한 심도 깊은 논의가 이루어지기를 기대한다.


“본 연구는 과학기술정보통신부 및 정보통신기획평가원의 글로벌핵심인재양성지원사업의 연구결과로 수행되었음”(2021-0-01533).


  1. Ban, H.Y., D.H. Choi, J.B. Ahn, and B.W. Lee, 2017. Predicting regional soybean yield using crop growth simulation model, Korean Journal of Remote Sensing, 33(5-2): 699-708 (in Korean with English abstract).
  2. Baek, W.K., H.S. Jung, S.H. Chae, and W.J. Lee, 2018. Two-dimensional velocity measurements of Uversbreen glacier in Svalbard using TerraSAR-X offset tracking approach, Korean Journal of Remote Sensing, 34(3): 495-506 (in Korean with English abstract).
  3. Baek, W.K., M. Kim, H.G. Han, H.S. Jung, E.H. Hwang, H. Lee, J. Sun, E.C. Chang, and M. Lee, 2019. The Analysis of Volcanic-ash-deposition Damage using Spatial-information-based Volcanic Ash Damage Sector and Volcanic Ash Diffusion Simulation of Mt. Aso Volcano Eruption Scenario, Korean Journal of Remote Sensing, 35(6-3): 1221-1233 (in Korean with English abstract).
  4. Blei, D.M., A.Y. Ng, and M.I. Jordan, 2003. Latent dirichlet allocation, The Journal of Machine Learning Research, 3: 993-1022.
  5. Blei, D., L. Carin, and D. Dunson, 2010. Probabilistic topic models, IEEE Signal Processing Magazine, 27(6): 55-65.
  6. Chung, H.S., 1996. Reviewing the explosively deepening cyclone (cyclonic bomb) over the East Sea with the satellite observations, Korean Journal of Remote Sensing, 12: 126-138 (in Korean with English abstract).
  7. Cho, Y.-J. and T.-Y. Kwon, 2014. Cloud-cell tracking analysis using satellite image of extreme heavy snowfall in the Yeongdong region, Korean Journal of Remote Sensing, 30(1): 83-107 (in Korean with English abstract).
  8. Chae, S.-H., S.-H. Park, and M.-J. Lee, 2017. A study on the observation of soil moisture conditions and its applied possibility in agriculture using land surface temperature and NDVI from landsat-8 OLI/TIRS satellite image, Korean Journal of Remote Sensing, 33(6-1): 931-946 (in Korean with English abstract).
  9. Eom, J.A., Y.K. Lee, J.H. Ryu, and J.S. Won, 2007. Fractal Analysis of Tidal Channel using High Resolution Satellite Image, Korean Journal of Remote Sensing, 23(6): 567-573 (in Korean with English abstract).
  10. Ha, K.J., G.Y. Jeong, S.R. Jang, and K.Y. Kim, 2006. Variation of the sea surface height around the Korean peninsula with the use of multi-satellite data (Topex/Poseidon, Jason-1, ERS, Envisat) and its association with sea surface temperature, Korean Journal of Remote Sensing, 22(6): 519-531 (in Korean with English abstract).
  11. Han, H.S. and H.Y. Lee, 2011. Microwave radiation characteristics of glacial ice in the AMSR-E NASA Team2 algorithm, Korean Journal of Remote Sensing, 27(5): 543-553 (in Korean with English abstract).
  12. Han, H., Y. Ji, and H. Lee, 2013. Estimation of annual variation of ice extent and flow velocity of Campbell Glacier in East Antarctica using COSMO-SkyMed SAR images, Korean Journal of Remote Sensing, 29(1): 45-55 (in Korean with English abstract).
  13. Heo, B.H. and K.E. Kim, 2001. Estimation of the Convective Boundary Layer Height Using a UHF Radar, Journal of the Korean Society of Remote Sensing, 17(1): 1-14 (in Korean with English abstract).
  14. Hong, S.J., W.K. Baek, and H.S. Jung, 2019. Mapping precise two-dimensional surface deformation on Kilauea volcano, Hawaii using ALOS2 PALSAR2 Spotlight SAR Interferometry, Korean Journal of Remote Sensing, 35(6-3): 1235-1249 (in Korean with English abstract).
  15. Im, J.-H. and C.-H. Park, 2004. Neural networks approach to fire severity mapping from a single post-fire Landsat 7 ETM+ imagery, Korean Journal of Remote Sensing, 20(1): 23-38 (in Korean with English abstract).
  16. Jae, L.K., K.Y. Oh, T.B. Chae, and W.J. Lee, 2019. Research Trends in KOMPSAT Series, Korean Journal of Remote Sensing, 35(6): 1313-1318 (in Korean with English abstract).
  17. Jang, D.H., G.H. Jo, and G.H. Ji, 1998. The Analysis of Spectral characteristics of Water Quality Factors Uisng Airborne MSS Data, Korean Journal of Remote Sensing, 14(3): 295 (in Korean with English abstract).
  18. Jiang, H., M. Qiang, and P. Lin, 2016. A topic modeling based bibliometric exploration of hydropower research, Renewable and Sustainable Energy Reviews, 57: 226-237.
  19. Jung, H.S., S.E. Park, J. Kim, N.W. Park, and S. Hong, 2019. Remote Sensing Applications in Korea, Korean Journal of Remote Sensing, 35(6): 1161-1171 (in Korean with English abstract).
  20. Jung, M., D.J. Kim, H.G. Sohn, J. Choi, and J. Im, 2021. Disaster Assessment, Monitoring, and Prediction Using Remote Sensing and GIS, Korean Journal of Remote Sensing, 37(5): 1314-1320 (in Korean with English abstract).
  21. Im J., H.G. Sohn, D.J. Kim, and J. Choi, 2020. Remote Sensing-assisted Disaster Monitoring and Risk Analysis, Korean Journal of Remote Sensing, 36(5): 1007-1011 (in Korean with English abstract).
  22. Kim, K., J. Park, G. Yun, and S. Lee, 1995. Distributed Rainfall-Runoff Modeling Using GIS, Korean Journal of Remote Sensing, 11(2): 1-16 (in Korean with English abstract).
  23. Kim, C., 2008a. Evaluation of the Normalized Burn Ratio (NBR) for Mapping Burn Severity Base on IKONOS-Images, Korean Journal of Remote Sensing, 24(2): 195-203 (in Korean with English abstract).
  24. Kim, Y.M. and H.T. Kim, 2008b. A Study on Red Tide Detection Algorithm Based on Two Stage filtering-Application to MODIS Chlorophyll Information, Korean Journal of Remote Sensing, 24(4): 325-331 (in Korean with English abstract).
  25. Kim, C., 2009. Fire-Induced Forest Disturbance Mapping by Using QuickBird Imagery, Korean Journal of Remote Sensing, 25(1): 85-94 (in Korean with English abstract).
  26. Kim, E.S., S.H. Lee, and H.K. Cho, 2010. Segment-based land cover classification using texture Information in degraded forest land of North Korea, Korean Journal of Remote Sensing, 26(5): 477-487 (in Korean with English abstract).
  27. Kim, N., J. Cho, S. Hong, K.-J. Ha, R. Shibasaki, and Y.-W. Lee, 2016. Statistical estimation of crop yields for the Midwestern United States using satellite images, climate datasets, and soil property maps, Korean Journal of Remote Sensing, 32(4): 383-401 (in Korean with English abstract).
  28. Kim, Y.P., 2017. Research and Policy Directions against Ambient Fine Particles, Journal of Korean Society for Atmospheric Environment, 33(3): 191-204 (in Korean with English abstract).
  29. Kim, H.C., S.H. Hong, S.E. Park, and H. Lee, 2018. Polar Remote Sensing in Korea, Korean Journal of Remote Sensing, 34(6): 1155-1163 (in Korean with English abstract).
  30. Kim, S., J. Kim, and J. Kim, 2019a. National Disaster Scientific Investigation and Disaster Monitoring using Remote Sensing and Geo-information, Korean Journal of Remote Sensing, 35(5): 763-772 (in Korean with English abstract).
  31. Kim, Y., M. Lee, and S. Lee, 2019b. Detection of change in water system due to collapse of Laos Xe pian-Xe namnoy dam using KOMPSAT-5 satellites, Korean Journal of Remote Sensing, 35(6-4): 1417-1424 (in Korean with English abstract).
  32. Kim, J.J. and S.W. Kim, 2020. Indoor and Outdoor Particulate Matter: The Current and Future in Monitoring, Assessment, and Management, Korean Journal of Remote Sensing, 36(6): 1635-1641 (in Korean with English abstract).
  33. Kim, T. and J. Choi, 2020. The Method of Linking Fire Survey Data with Satellite Image-based Fire Data, Korean Journal of Remote Sensing, 36(5-3): 1125-1137 (in Korean with English abstract).
  34. Kim, S., H. Nho, J. Lee, J. Kim, and J. Kim, 2020. Remote Sensing and Geo-spatial Information Utilization for Managing Disaster in Korean Peninsula, Korean Journal of Remote Sensing, 36(5): 1139- 1151 (in Korean with English abstract).
  35. Kim, T., H. Park, J. Heo, and M. Yang, 2021. Topic model analysis of research themes and trends in the journal of economic and environmental geology, Economic and Environmental Geology, 54(3): 353-364 (in Korean with English abstract).
  36. Kwon, T.-Y. and J.-S. Lee, 2013. Satellite image analysis of convective cell in the Chuseok heavy rain of 21 September 2010, Korean Journal of Remote Sensing, 29(4): 423-441 (in Korean with English abstract).
  37. Lee, K.D., C.W. Park, S.I. Na, M.P. Jung, and J. Kim, 2017a. Monitoring on Crop Condition using Remote Sensing and Model, Korean Journal of Remote Sensing, 33(5): 617-620 (in Korean with English abstract).
  38. Lee, M.J., W. Park, and W. Song, 2017b. Present Condition of Environment Geospatial Information and Its Application, Korean Journal of Remote Sensing, 33(5): 763-771 (in Korean with English abstract).
  39. Lee, W.J., S.C. Park, S.W. Kim, and D.K. Lee, 2018. Application of Satellite Imagery to Research on Earthquake and Volcano, Korean Journal of Remote Sensing, 34(6): 1469-1478 (in Korean with English abstract).
  40. Loper, E. and S. Bird, 2002. NLTK: The Natural Language Toolkit, Processing and Computational Linguistics, 2002: 63-70.
  41. Mukherjee, A. and M. Agrawal, 2017. World air particulate matter: sources, distribution and health effects, Environmental Chemistry Letters, 15(2): 283-309.
  42. Nam, H., J.H. Kim, D. Shin, and K. Baek, 2019. Impact of Lambertian Cloud Top Pressure Error on Ozone Profile Retrieval Using OMI, Korean Journal of Remote Sensing, 35(3): 347-358 (in Korean with English abstract).
  43. Noh, Y. and K.-H. Lee, 2013. Characterization of optical properties of long-range transported Asian dust in Northeast Asia, Korean Journal of Remote Sensing, 29(2): 243-251 (in Korean with English abstract).
  44. Noh, Y., C. Lee, and S. Choi, 2013. Deduction of Aerosol Composition and Absorption factors using AERONET sun/sky radiometer, Korean Journal of Remote Sensing, 29(4): 407-413 (in Korean with English abstract).
  45. Oh, S.Y., S.W. Jang, W.G. Park, J.H. Lee, and H.J. Yoon, 2013. A Comparative Study for Red Tide Detection Methods Using GOCI and MODIS, Korean Journal of Remote Sensing, 29(3): 331-335 (in Korean with English abstract).
  46. Panta, M. and K.H. Kim, 2006. Spatio-temporal Dynamic Alteration of Forest Canopy Density based on Site Associated Factor: View from Tropical Forest of Nepal, Korean Journal of Remote Sensing, 22(5): 313-323 (in Korean with English abstract).
  47. Park, H.S., H.S. Chung, and Y.J. Noh, 2000. The Characteristics of Heavy Rainfall in Summer over the Korean Peninsula from precipitation radar of TRMM Satellite: Case Study, Korean Journal of Remote Sensing, 16(1): 55-64 (in Korean with English abstract).
  48. Park, H.-C., H.-S. Kim, Y.-W. Jo, and M.-H. Jo, 2008. Utilization plan research of high resolution images for efficient river zone management, Korean Journal of Remote Sensing, 24(2): 205-211 (in Korean with English abstract).
  49. Park, S.M., K.J. Moon, J.S. Park, H.J. Kim, J.Y. Ahn, and J.S. Kim, 2012. Chemical characteristics of ambient aerosol during Asian dusts and high PM episodes at Seoul intensive monitoring site in 2009, Journal of Korean Society for Atmospheric Environment, 28(3): 282-293 (in Korean with English abstract).
  50. Park, H., T. Kim, and M. Yang, 2020a. The effect of meteorological factors on PM10 depletion in the atmosphere and evaluation of rainwater quality, Korean Journal of Remote Sensing, 36(6-13): 1733-1741 (in Korean with English abstract).
  51. Park, H., M. Byun, T. Kim, J.J. Kim, J.S. Ryu, M. Yang, and W. Choi, 2020b. The washing effect of precipitation on PM10 in the atmosphere and rainwater quality based on rainfall intensity, Korean Journal of Remote Sensing, 36(6-3): 1669-1679 (in Korean with English abstract).
  52. Porter, M.F., 1980. An algorithm for suffix stripping, Program, 14(3): 130-137.
  53. Ryu, J., J. Hwang, J. Lee, H.I. Chung, K.I. Lee, Y.Y. Choi, Y. Zhu, M.J. Sung, R. Jang, and H.C. Sung, 2017. Analysis of changes in forest according to urban expansion pattern and morphological features-Focused on Seoul and Daegu, Korean Journal of Remote Sensing, 33(5-3): 835-854 (in Korean with English abstract).
  54. Ryu, J.H., S.H. Hong, Y.H. Jo, and D.J. Kim, 2020. Coastal Remote Sensing in Korea, Korean Journal of Remote Sensing, 36(2): 231-236 (in Korean with English abstract).
  55. Shin, D.S., A.S. Suh, Y.S. Kim, 1995. The Ana1ysis of Typhoon Center Location and Intensity from NOAA Satellite Microwave Data, Korean Journal of Remote Sensing, 11(2): 29-42.
  56. Shin, S.K., Y.S. Park, B.C. Choi, K. Lee, D. Shin, Y.J. Kim, and Y. Noh, 2014a. Retrieval of the Variation of Optical Characteristics of Asian Dust Plume according to their Vertical Distributions using Multi-wavelength Raman LIDAR System, Korean Journal of Remote Sensing, 30(5): 597-605 (in Korean with English abstract).
  57. Shin, S.K., Y. Noh, K. Lee, D. Shin, K. Kim, and Y.J. Kim, 2014b. Study on the variation of optical properties of Asian dust plumes according to their transport routes and source regions using multi-wavelength Raman LIDAR system, Korean Journal of Remote Sensing, 30(2): 241-249 (in Korean with English abstract).
  58. Shin, J., J.E. Min, and J.H. Ryu, 2017. A study on red tide surveillance system around the Korean coastal waters using GOCI, Korean Journal of Remote Sensing, 33(2): 213-230 (in Korean with English abstract).
  59. Syed, S., M. Borit, and M. Spruit, 2018. Narrow lenses for capturing the complexity of fisheries: A topic analysis of fisheries science from 1990 to 2016, Fish and Fisheries, 19(4): 643-661.
  60. Yang, Y.-K. and L.-D Miller, 1985. Correlations of Rice Grain Yields to Radiometric Estimates of Canopy Biomass as a Function of Growth Stage: Hand-Held Radiometric Measurements of Two of the Thematic Mapper's Spectral Bands Indicate that the Forecasting of Rice Grain Yields is Feasible at, Korean Journal of Remote Sensing, 1(1): 63-87 (in Korean with English abstract).
  61. Yang, J., W. Choi, J. Park, D. Kim, H. Kang, and H. Lee, 2019. Retrieval of sulfur dioxide column density from TROPOMI using the principle component analysis method, Korean Journal of Remote Sensing, 35(6-3): 1173-1185 (in Korean with English abstract).
  62. Yang, J., H. Hong, W. Choi, J. Park, D. Kim, H. Kang, H. Lee, and J. Kim, 2017. Retrieval of Nitrogen Dioxide Column Density from Ground-based Pandora Measurement using the Differential Optical Absorption Spectroscopy Method, Korean Journal of Remote Sensing, 33(6-1): 981-992 (in Korean with English abstract).
  63. Ye, C.S., 2015. Water body extraction in SAR image using water body texture index, Korean Journal of Remote Sensing, 31(4): 337-346 (in Korean with English abstract).