DOI QR코드

DOI QR Code

텍스트 마이닝을 통한 우리나라의 벼 도열병 발생 개황 분석

Analysis of Rice Blast Outbreaks in Korea through Text Mining

  • Song, Sungmin (Department of Plant Medicine, Sunchon National University) ;
  • Chung, Hyunjung (Crop Foundation Research Division, National Institute of Crop Science, Rural Development Administration) ;
  • Kim, Kwang-Hyung (Department of Agricultural Biotechnology, Seoul National University) ;
  • Kim, Ki-Tae (Department of Plant Medicine, Sunchon National University)
  • 투고 : 2022.07.06
  • 심사 : 2022.09.13
  • 발행 : 2022.09.30

초록

벼 도열병은 전 세계적으로 발병하여 쌀 수확량을 크게 감소시키는 주요 식물병이다. 벼 도열병은 한국에서도 주기적으로 대발생하여 사회경제적으로 큰 피해를 입힌다. 이를 예방하기 위해서는 병 발생 예찰 시스템이 필요하다. 또한 병 발생에 대한 역학 조사는 식물병 관리를 위한 의사결정을 내릴 때 도움을 줄 수 있다. 현재 도열병 예찰 및 역학 조사는 주로 작물의 생육량, 기상 환경 요인 등 정량적으로 측정 가능한 정형 데이터를 기반으로 수행되고 있다. 정형 데이터와 함께 도열병 발생과 관련한 텍스트 자료들도 많이 축적되고 있다. 그러나 이러한 비정형 데이터를 이용한 역학 조사는 이루어지지 않고 있다. 비정형 데이터를 활용하여 유용한 정보를 추출한다면 도열병을 포함한 앞으로의 식물병 관리에 사용할 수 있을 것이다. 이 연구는 텍스트 마이닝을 통해 도열병 관련 뉴스 기사를 분석하여 우리나라에서 벼 도열병이 다발생한 연도와 지역을 조사하였고, 해당 지역의 평균 기온, 합계 강수량, 일조시간, 공급된 벼 품종을 분석하였다. 이를 통해 2020년 평년에 비해 낮은 기온과 일조시간 및 높은 강수량이 전국적인 도열병 다발생의 원인에 기여했고, 2021년 전라북도와 경상북도 일부 지역의 다발생은 비슷한 기상학적 요인에 의한 것으로 추측할 수 있었다. 더하여 같은 벼 품종의 연작에 의한 도열병 다발생 가능성과 질소 비료의 시비량이 병 발생에 미치는 영향에 대한 추후 연구가 필요하다. 결론적으로, 쏟아지는 정보의 홍수속에서 관련 기사를 종합적으로 보기 어렵다. 따라서, 텍스트 마이닝을 통해 얻은 결과로 특정 키워드들이 많이 관찰될 때 적극적 방제에 대한 의사결정을 할 수 있는 시스템이 구축될 필요가 있다. 이는 추후 딥러닝 기술과 접목되어 벼 도열병 역학 조사 도구로 사용될 수도 있을 것이다. 텍스트 마이닝을 통해 얻은 유의미한 정보를 기존의 정형 데이터 기반의 모델과 결합한다면 농업현장에서 병발생 예측 또는 방제기술 개선에 필요한 고품질 정보를 제공해줄 수 있을 것이라고 예상한다.

Rice blast is a major plant disease that occurs worldwide and significantly reduces rice yields. Rice blast disease occurs periodically in Korea, causing significant socio-economic damage due to the unique status of rice as a major staple crop. A disease outbreak prediction system is required for preventing rice blast disease. Epidemiological investigations of disease outbreaks can aid in decision-making for plant disease management. Currently, plant disease prediction and epidemiological investigations are mainly based on quantitatively measurable, structured data such as crop growth and damage, weather, and other environmental factors. On the other hand, text data related to the occurrence of plant diseases are accumulated along with the structured data. However, epidemiological investigations using these unstructured data have not been conducted. The useful information extracted using unstructured data can be used for more effective plant disease management. This study analyzed news articles related to the rice blast disease through text mining to investigate the years and provinces where rice blast disease occurred most in Korea. Moreover, the average temperature, total precipitation, sunshine hours, and supplied rice varieties in the regions were also analyzed. Through these data, it was estimated that the primary causes of the nationwide outbreak in 2020 and the major outbreak in Jeonbuk region in 2021 were meteorological factors. These results obtained through text mining can be combined with deep learning technology to be used as a tool to investigate the epidemiology of rice blast disease in the future.

키워드

과제정보

This work was supported by a Research promotion program of SCNU.

참고문헌

  1. Ahmad, A., Saraswat, D. and El Gamal, A. 2022. A survey on using deep learning techniques for plant disease diagnosis and recommendations for development of appropriate tools. Smart Agric. Technol. 3: 100083. https://doi.org/10.1016/j.atech.2022.100083
  2. Baek, M.-K., Park, H.-S., Lee, C.-M., Lee, H.-J., Jeong, J.-M., Ahn, E.-K. et al. 2021. Identification of stable resistance genes based on resistance evaluation to blast for monogenic lines and leading Japonica varieties in rice. Korean J. Breed. Sci. 53: 217-229. (In Korean) https://doi.org/10.9787/KJBS.2021.53.3.217
  3. Chung, H., Jeong, D. G., Lee, J.-H., Kang, I. J., Shim, H.-K., An C. J. et al. 2022. Outbreak of rice blast disease at Yeoju of Korea in 2020. Plant Pathol. J. 38: 46-51. https://doi.org/10.5423/PPJ.NT.08.2021.0130
  4. Dean, R., Van Kan, J. A. L., Pretorius, Z. A., Hammond-Kosack, K. E., Di Pietro, A., Spanu, P. D. et al. 2012. The top 10 fungal pathogens in molecular plant pathology. Mol. Plant Pathol. 13:414-430. https://doi.org/10.1111/j.1364-3703.2011.00783.x
  5. Fenu, G. and Malloci, F. M. 2021. Forecasting plant and crop disease: an explorative study on current algorithms. Big Data Cogn. Comput. 5: 2. https://doi.org/10.3390/bdcc5010002
  6. Ferentinos, K. P. 2018. Deep learning models for plant disease detection and diagnosis. Comput. Electron. Agric. 145: 311-318. https://doi.org/10.1016/j.compag.2018.01.009
  7. Han, S.-S., Ryu, J. D., Shim, H.-S., Lee, S.-W., Hong, Y.-K. and Cha, K.-H. 2001. Breakdown of resistance of rice cultivars by new race KI-1117a and race distribution of rice blast fungus during 1999~2000 in Korea. Res. Plant Dis. 7: 86-92. (In Korean)
  8. Kang, S. W. and Kim, H. K. 1994. Factors affecting unusually severe outbreak of rice blast in Gyeongnam province in 1993. Korean J. Plant Pathol. 10: 78-82. (In Korean)
  9. Kang, W. S., Seo, M.-C., Hong, S. J., Lee, K. J. and Lee, Y. H. 2019. Outbreak of rice panicle blast in southern provinces of Korea in 2014. Res. Plant Dis. 25: 196-204. (In Korean) https://doi.org/10.5423/RPD.2019.25.4.196
  10. Kaundal, R., Kapoor, A. S. and Raghava, G. P. S. 2006. Machine learning techniques in disease forecasting: a case study on rice blast prediction. BMC Bioinformatics 7: 485. https://doi.org/10.1186/1471-2105-7-485
  11. Kim C.-H. 2002. Current status and future prospect of plant disease forecasting system in Korea. Res. Plant Dis. 8: 84-91. (In Korean) https://doi.org/10.5423/RPD.2002.8.2.084
  12. Kim, K.-H. and Lee, J. 2020. Smart plant disease management using agrometeorological big data. Res. Plant Dis. 26: 121-133. (In Korean) https://doi.org/10.5423/RPD.2020.26.3.121
  13. Kim, Y. 2014. Investment analysis of insects and diseases prevention of rice in public using a real option approach. Ph.D. thesis. Seoul National University, Seoul, Korea. 59 pp. (In Korean)
  14. Korea Seed and Variety Service. 2020. List of variety characteristics for government-supplied species in 2021. URL https://www.seed.go.kr/ [20 May 2022].
  15. Lee, S. and Kim, K.-H. 2018. Predicting potential epidemics of rice leaf blast disease using climate scenarios from the best global climate model selected for individual agro-climatic zones in Korea. J. Clim. Change Res. 9: 133-142. (In Korean) https://doi.org/10.15531/KSCCR.2018.9.2.133
  16. Lee, Y.-H. 2012. Pest monitoring, prediction: one-stop processing up to diagnosis. Life Agrochem. 277: 22-25. (In Korean)
  17. Lee, Y. H., Ra, D.-S., Yeh, W.-H., Choi, H.-W., Myung I.-S., Lee, S.-W. et al. 2010. Survey of major disease incidence of rice in Korea during 1999-2008. Res. Plant Dis. 16: 183-190. (In Korean) https://doi.org/10.5423/RPD.2010.16.2.183
  18. Mohanty, S. P., Hughes, D. P. and Salathe, M. 2016. Using deep learning for image-based plant disease detection. Front. Plant Sci. 7: 1419. https://doi.org/10.3389/fpls.2016.01419
  19. Pletscher-Frankild, S., Palleja, A., Tsafou, K., Binder, J. X. and Jensen, L. J. 2015. DISEASES: text mining and data integration of disease-gene associations. Methods 74: 83-89. https://doi.org/10.1016/j.ymeth.2014.11.020
  20. Ristaino, J. B., Anderson, P. K., Bebber, D. P., Brauman, K. A., Cunniffe N. J., Fedoroff, N. V. et al. 2021. The persistent threat of emerging plant disease pandemics to global food security. Proc. Natl. Acad. Sci. U. S. A. 118: e2022239118. https://doi.org/10.1073/pnas.2022239118
  21. Shim, H.-S., Kim, Y.-K., Hong, S.-J., Han, S.-S. and Sung, J.-M. 2003. Assessments of yield and quality of rice affected by rice panicle blast. Res. Plant Dis. 9: 183-188. (In Korean) https://doi.org/10.5423/RPD.2003.9.4.183
  22. Van Driel, M. A., Bruggeman, J., Vriend, G., Brunner, H. G. and Leunissen, J. A. 2006. A text-mining analysis of the human phenome. Eur. J. Hum. Genet. 14: 535-542. https://doi.org/10.1038/sj.ejhg.5201585