DOI QR코드

DOI QR Code

Deep Learning-Based Daily Baseball Attendance Predcition

딥러닝 기반 일별 야구 관중 수 예측

  • Hyunhee Lee ;
  • Seoyoung Sohn ;
  • Minseo Park (Dept. of Data Science, Seoul Women's Univ)
  • 이현희 (서울여자대학교 데이터사이언스학과) ;
  • 손서영 (서울여자대학교 데이터사이언스학과) ;
  • 박민서 (서울여자대학교 데이터사이언스학과)
  • Received : 2024.03.04
  • Accepted : 2024.04.20
  • Published : 2024.05.31

Abstract

Baseball attracts the largest audience among professional sports in Korea. In particular, attendance is the primary source of income in baseball. Previous studies have limitations in reflecting the characteristics of individual stadium. For instance, the KIA Tigers exhibit the highest away game revenue among domestic teams, but they show lower home game earnings. Therefore, we aim to predict the daily attendance at the Gwangju-KIA Champions Field of the KIA Tigers using deep learning. We collected and preprocessed daily attendance, dates, weather, and team-related variables for Gwangju-KIA Champions Field from 2018 to 2023. We propose a deep learning-based linear regression model to predict the daily attendance. We expect that the proposed deep learning model will be used as basic information to increase the club's revenue.

한국에서 야구는 프로 스포츠 종목 중 가장 많은 관중 수를 동원하고 있다. 특히 수입 대부분이 입장 수입이기 때문에 관중 수가 무엇보다 중요하다. 기존 연구는 타 종목이나 모든 구장을 동시에 고려하고 있어 구장 별 관중수를 예측이 쉽지 않다는 한계가 존재한다. 예를 들어 기아 타이거즈는 국내 구단 중 가장 높은 원정 수입을 보이는데에 반해 낮은 홈 수입을 보인다. 따라서, 본 연구에서는 딥러닝(Deep Learning)을 사용하여 기아 타이거즈의 광주 - 기아 챔피언스 필드의 일별 관중 수를 예측하고자 한다. 2018년~2023년의 광주 - 기아 챔피언스 필드의 일별 관중 수와 날짜, 날씨, 팀과 관련된 변수를 수집하고 전처리한다. 전처리 한 데이터를 활용하여 일별 관중 수를 예측하는 딥러닝기반 선형 회귀모델을 제안한다. 본 연구를 통해 구단의 수익 증대를 위한 기초 자료로 활용할 수 있을 것으로 기대한다.

Keywords

Acknowledgement

이 논문은 서울여자대학교 학술연구비의 지원에 의한 것임 (2024-0026).

References

  1. J. Lee, "A Study on Determinants in Korean Pro-Baseball Spectators," Journal of the Korean Data Analysis Society, Vol.12 No.6, pp. 3507-3517, December 2010.
  2. J. Lee, "The Influence of Factors Affecting Decision to Spectate on Spectator Satisfaction and Revisiting Intention in Professional Baseball Games," Korean Journal of Sport Management, Vol.17 No.3, pp. 41-53, June 2012.
  3. Prosports Data Portal, http://data.prosports.or.kr
  4. Korean Baseball Organization, https://www.koreabaseball.com
  5. J. Park and S.H. Park, "A Study on Prediction of Attendance in Korean Baseball League Using Artificial Neural Network," KIPS Tr. Software and Data Eng, Vol. 6, No. 12 pp. 565~572 August 2017. DOI: 10.3745/KTSDE.2017.6.12.565
  6. J. Chea, "Prediction Model for Korean Professional Baseball Spectators," Korean Journal of Sport Science, Vol. 23, No. 4, pp. 892-905, December 2012.
  7. S. Lee, "Deep Structured Learning: Architectures and Applications," The International Journal of Advanced Culture Technology(IJACT), Vol. 6, No. 4, pp. 262-265, 2018. DOI:10.17703//IJACT2018.6.4.262
  8. S. Oh, and M. Park, "Deep Learning-based Happiness Index Model Considering Social Variables and Individual Emotional Index," The Journal of the Convergence on Culture Technology (JCCT), Vol. 10, No. 1, January 2024.
  9. H. Kim, "Study on the Prediction of the Number of Spectators and It's Factors in Pro Sports by Machine Learning Method," Journal of the Korean Data Analysis Society, Vol. 21, No. 4, pp. 1867-1880, August 2019.
  10. J. Cho and B. Seok, "The Development prediction model of Korea Professional Baseball League spectator using machine learning," The Korea Journal of Sports Science, Vol. 32, No. 5 pp. 547-558, October 2023. DOI: 10.35159/kjss.2023.10.32.5.547
  11. S. Nam and K. Jeon, "A Study on the Impact of Air Pollution on the Korean Baseball Attendance," Korean J ournal of Business Administration, Vol. 32, No. 1, pp. 71-88, January 2019. DOI: 10.18032/kaaba.2019.32.1.71
  12. N. Ryu, H. Kim, and P. Kang, "Evaluating Variable Selection Techniques for Multivariate Linear Regression," Journal of the Korean Institute of Industrial Engineers, Vol. 42, No. 5, pp. 314-326, October 2016. DOI: 10.7232/JKIIE.2016.42.5.314