Analyzing Significant Variables from a Linear Regression-Based Prediction Model for Rice Prices

선형 회귀를 이용한 쌀 가격 예측 모델의 유의미한 변수 추출

  • Seo, Jin-kyeong (Dept. of Digital Information & Statistics, Pyeongtaek University) ;
  • Choi, Da-jeong (Dept. of Digital Information & Statistics, Pyeongtaek University) ;
  • Ko, Kwang-Ho (Dept. of Smart Mobility, Pyeongtaek University) ;
  • Paik, Juryon (Dept. of Digital Information & Statistics, Pyeongtaek University)
  • 서진경 (평택대학교 데이터정보학과) ;
  • 최다정 (평택대학교 데이터정보학과) ;
  • 고광호 (평택대학교 스마트자동차학과) ;
  • 백주련 (평택대학교 데이터정보학과)
  • Published : 2022.07.13

Abstract

쌀을 주식으로 하는 우리나라에서, 쌀의 가격에 영향을 미치는 변수를 찾는 것은 유의미한 연구이다. 본 논문에서는 쌀 가격을 예측하는 모델에 포함되는 여러 변수 가운데 상대적인 중요도가 낮은 변수를 제거하고 유의미한 변수만을 남기고자 한다. 이를 위해 기상, 수확량, 소비자물가의 10년 치 정보를 수집하고 정제한 결과 총 2460일, 7개 지역에서 추출된 17,219개의 데이터를 이용하였다. 모델 평가 결과, 모든 변수를 포함한 모델의 RMSE는 166.0759, 단계적으로 계수가 작은 9개의 변수를 제거한 최종적인 모델의 RMSE는 168.5576으로 유의미한 차이를 보이지 않았다. 최종적으로 남은 변수는 총 10개로 평균 기온, 평균 풍속, 합계 일사, 평균 지면 온도, 0.5M 평균 습도, 4.0M 평균 습도, 10CM 일 토양 수분, 30CM 일 토양 수분, 50CM 일 토양 수분, 전년도 생산량이 포함된다.

Keywords

Acknowledgement

이 논문은 2021년도 정부 (과학기술정보통신부)의 재원으로 한국연구재단의 지원을 받아 수행된 이공분야기초연구사업임 (NRF-2021R1F1A1064073).