DOI QR코드

DOI QR Code

Machine Learning-based Production and Sales Profit Prediction Using Agricultural Public Big Data

농업 공공 빅데이터를 이용한 머신러닝 기반 생산량 및 판매 수익금 예측

  • 이현조 (전북대학교 컴퓨터공학과) ;
  • 김용기 (전주비전대학교 IT융합시스템과) ;
  • 구현정 (한국농수산대학교 작물.산림학부) ;
  • 채철주 (한국농수산대학교 교양학부)
  • Received : 2022.05.12
  • Accepted : 2022.05.31
  • Published : 2022.05.31

Abstract

Recently, with the development of IoT technology, the number of farms using smart farms is increasing. Smart farms monitor the environment and optimise internal environment automatically to improve crop yield and quality. For optimized crop cultivation, researches on predict crop productivity are actively studied, by using collected agricultural digital data. However, most of the existing studies are based on statistical models based on existing statistical data, and thus there is a problem with low prediction accuracy. In this paper, we use various predition models for predicting the production and sales profits, and compare the performance results through models by using the agricultural digital data collected in the facility horticultural smart farm. The models that compared the performance are multiple linear regression, support vector machine, artificial neural network, recurrent neural network, LSTM, and ConvLSTM. As a result of performance comparison, ConvLSTM showed the best performance in R2 value and RMSE value.

IoT 기술의 발전에 따라 스마트팜을 활용하는 농가가 증가하고 있다. 스마트팜은 환경을 모니터링하고, 원격 또는 자동으로 최적의 내부 환경을 조성하여 작물의 생산량 및 품질을 향상시킨다. 이를 위해 수집되는 농업 디지털 데이터를 활용하여 작물의 생산성을 예측하는 기술에 대한 연구가 활성화되고 있다. 그러나 생산량 예측을 위한 연구에서는 기존의 통계자료를 바탕으로 하는 통계모델 기반의 연구가 대부분이며, 이에 따라 예측 정확도가 낮은 문제점이 존재한다. 본 연구에서는 시설 원예 스마트팜에 수집된 농업 디지털 데이터를 활용하여 다양한 머신러닝 모델을 통해 생산량 및 판매 수익금을 예측하고, 성능을 비교하였다. 성능을 비교한 모델은 다중선형회귀, 서포트벡터머신, 인공신경망, 순환신경망, LSTM, ConvLSTM이다. 성능 비교 결과 ConvLSTM가 R2 값 및 RMSE 값에서 가장 우수한 성능을 나타내었다.

Keywords

Acknowledgement

이 성과는 정부(과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 연구임(NRF-2021R1F1A1063042)

References

  1. T. W. Kim, "ICT-based Smart Farm Greenhouse Status and Outlook," Proceedings of Symposium of the KICS, Vol. 36, No. 3, pp. 256-257, 2019.
  2. 스마트팜 코리아 (2022), https://www.smartfarmkorea.net/ (accessed Apr., 01, 2022)
  3. B. Alhnaity et al., "Using Deep Learning to Predict Plant Growth and Yield in Greenhouse Environments," arXiv preprint arXiv:1907.00624, 2019.
  4. J. H. Lee, H. J. Lee, and S. K. Kim, "Development of Growth Models as Affected by Cultivation Season and Transplanting Date and Estimation of Prediction Yield in Kimchi Cabbage," Protected Horticulture and Plant Factory, Vol. 26, No. 4, pp. 235-241, Oct. 2017. https://doi.org/10.12791/KSBEC.2017.26.4.235
  5. 나명환, 박유하, 조완현, "스마트팜 데이터를 이용한 토마토 최적인자에 관한 연구," 한국데이터정보과학회지, 제28권, 제6호, 1427-1435쪽, 2017년 11월
  6. 노희선, 이윤숙, "토마토 스마트팜 생육데이터와 수확량의 연관성 분석," 융복합지식학회논문지, 제8권, 제3호, 17-25쪽, 2020년 9월 https://doi.org/10.22716/SCKT.2020.8.3.016
  7. 이철원, 안수용, 김재영, 안형태, "환경 데이터를 활용한 온실형 스마트팜에서 센서 이상 탐지 시스템," 한국데이터정보과학회지, 제32권, 제6호, 1237-1248쪽, 2021년 11월
  8. 황인철, 노희선, 양동일, 김만배, "다중 회귀 분석을 이용한 파프리카 생산량 예측," 한국통신학회논문지, 제46권, 제11호, 2048-2055 쪽, 2021년 11월
  9. 김영호, 김광진, 이수진, 김지원, 이양원, "딥러닝을 이용한 남한 500 미터 해상도의 일단위 토양수분 산출," 한국지도학회지, 제17권, 제3호, 109-121쪽, 2017.
  10. 응웬딘휘, 권현한, "기계학습 기반의 토양함수 예측 기법 개발," 대한토목학회 학술대회, 320-321쪽, 2018년 10월
  11. 이상원, 조한진, 채철주, "SVM(Support Vector Machine) 알고리즘 기반의 EEG (Electroencephalogram) 신호 분류," 한국융합학회논문지, 제11권, 제2호, 17-22쪽, 2020년 2월 https://doi.org/10.15207/jkcs.2020.11.2.017
  12. 정민수, 김종석, 장호원, 이주헌, "MLP ANN 가뭄예측 모형에 대한 ROC 평가," 한국수자원학회논문지, 제49권, 제10호, 877-885쪽, 2016년 10월
  13. 김한중, "통계학적 모델과 인공신경망 (ANN) 을 이용한 필리핀의 마늘생산성 예측," 한국농공학회 학술대회초록집, 288-288쪽, 강원도 홍천군, 2019년 10월
  14. 이지원, 김형준, 김문겸, "빅데이터를 이용한 인공신경망 기반 시간별 전력수요 예측," 전기학회논문지, 제69권, 제6호, 792-799쪽, 2020년 6월
  15. 박수환, 이보영, 김민지, 김보경, 상완규, 서명철, 백재경, 모창연, "순환신경망 기법(RNN)을 이용한 콩 재배포장의 토양 수분함량 예측모델 개발," 한국농업기계학회 학술발표논문집, 제26권, 제2호, 334-334쪽, 2021.
  16. 박기철, 이성훈, 박재화, "다변량 데이터와 순환신경망을 이용한 젖소의 유방염 진단예측 방법," 한국소프트웨어감정평가학회논문지, 제17권, 제1호, 75-82쪽, 2021년 6월
  17. 정시훈, 김영준, 박수민, 임정호, "시계열 기계학습을 이용한 한반도 남해 해수면 온도 예측 및 고수온 탐지," 대한원격탐사학회지, 제36권, 제5호, 1077-1093쪽, 2020년 8월 https://doi.org/10.7780/kjrs.2020.36.5.3.7
  18. 박남규, 임정수, "LSTM, SVM 기계 학습 기반 KOSPI200 시계열 학습 값에 따른 미래 값 예측력 비교," 대한산업공학회 추계학술대회 논문집, 3470-3493쪽, 2019년 11월
  19. 이정규, 오종우, 조용진, 이동훈, "인공지능 기반온실 환경인자의 시간영역 추정," 시설원예.식물공장, 제29권, 제3호, 277-284쪽, 2020년 7월
  20. 조라훈, 남민기, 전영광, 김석준, 박승영, 김대현, "딥러닝을 이용한 스마트팜 내부 온.습도 예측 알고리즘 개발 및 검증," 한국농업기계학회 학술발표논문집, 제26권, 제2호, 123-123쪽, 2021.
  21. 이권동, 이석희, 아르온, 송석일, "ConvLSTM 을 이용한 도로 구간 속도 예측 기법," 한국정보기술학회논문지, 제19권, 제12호, 27-33쪽, 2021년 12월
  22. 이제우, 김영준, 홍인기, 문정모, "ConvLSTM과 3D CNN에 의한 모바일 트래픽 예측 성능 비교 분석," 한국통신학회 학술대회논문집, 479-480쪽, 2021년
  23. 안소정, 최윤, 손명재, 김광호, 정성화, 박영연, "기상레이더 강수 합성데이터를 활용한 심층신경망 기반 초단기 강수예측 기술 연구," 한국정보통신학회 종합학술대회 논문집, 제25권, 제1호, 43-45쪽, 2021.
  24. Coefficient of determination(2022), https://en.wikipedia.org/wiki/Coefficient_of_determination (accessed Apr., 03, 2022)
  25. Root-mean-square deviation(2022), https://en.wikipedia.org/wiki/Root-mean-square_deviation (accessed Apr., 03, 2022)