머신러닝을 이용한 한국프로야구 관중 수 예측모델

Prediction Model of the Number of Spectators in Korean Baseball League Using Machine Learning

  • 서원빈 (성균관대학교 소프트웨어대학) ;
  • 길이만 (성균관대학교 소프트웨어대학)
  • Seo, WonBin (College of Software, Sungkyunkwan University) ;
  • Kil, RheeMan (College of Software, Sungkyunkwan University)
  • 발행 : 2019.05.23

초록

본 연구는 기존 관중 수 예측에 주로 사용되는 ARIMA 모형과 다른 GKFN(Network with Gaussian kernel functions) 모델을 시계열 모델로 제안하고 여러 변수 간의 상관관계를 분석한 MLP(Multilayer Perceptron) 모델을 각각 따로 만들어 두 가지 RMSE값의 가중치를 결합한 새로운 모델을 최종적으로 제안한다. GKFN 모델은 phase space 분석을 위해 smoothness measure를 측정하고 커널 개수를 늘려가며 학습시키는 방법이다. 또한, MLP 모델은 관중 수에 영향을 주는 여러 변수(날짜, 날씨 등 팀과 관련된 특징들)의 상관관계를 correlation coefficient 값을 이용해 분석하고 높은 상관관계를 가지는 변수들을 이용해 MLP 모델을 만들어 학습하는 것이다. 이를 통해 프로야구팀 기아 타이거즈의 일일 단위 관중 수를 예측하고자 하였다. 관중 수 예측을 통해 구단과 관객 모두 긍정적인 활용이 가능할 것이다. 훈련 자료는 2010년부터 2018년까지 9년 동안 기아 타이거즈의 일별 관중 수를 자료로 하였다.

키워드