DOI QR코드

DOI QR Code

A Study on the Win-Loss Prediction Analysis of Korean Professional Baseball by Artificial Intelligence Model

인공지능 모델에 따른 한국 프로야구의 승패 예측 분석에 관한 연구

  • 김태훈 (순천대학교 컴퓨터공학과) ;
  • 임성원 (순천대학교 컴퓨터공학과) ;
  • 고진광 (순천대학교 컴퓨터공학과) ;
  • 이재학 (송원대학교 전기전자공학과)
  • Received : 2020.11.30
  • Accepted : 2020.12.11
  • Published : 2020.12.31

Abstract

In this study, we conducted a study on the win-loss predicton analysis of korean professional baseball by artificial intelligence models. Based on the model, we predicted the winner as well as each team's final rank in the league. Additionally, we developed a website for viewers' understanding. In each game's first, third, and fifth inning, we analyze to select the best model that performs the highest accuracy and minimizes errors. Based on the result, we generate the rankings. We used the predicted data started from May 5, the season's opening day, to August 30, 2020 to generate the rankings. In the games which Kia Tigers did not play, however, we used actual games' results in the data. KNN and AdaBoost selected the most optimized machine learning model. As a result, we observe a decreasing trend of the predicted results' ranking error as the season progresses. The deep learning model recorded 89% of the model accuracy. It provides the same result of decreasing ranking error trends of the predicted results that we observe in the machine learning model. We estimate that this study's result applies to future KBO predictions as well as other fields. We expect broadcasting enhancements by posting the predicted winning percentage per inning which is generated by AI algorism. We expect this will bring new interest to the KBO fans. Furthermore, the prediction generated at each inning would provide insights to teams so that they can analyze data and come up with successful strategies.

본 연구에서는 인공지능 모델에 따른 한국 프로야구의 승패 예측 분석에 관한 연구를 했다. 승리할 팀과 해당 팀의 최종 리그 순위를 예측했고, 사용자의 편의를 위해 웹사이트도 구축했다. 각 1·3·5이닝 별로 가장 정확도가 높으면서도 오차가 적은 모델을 최적 모델로 선정해 승·패 결과를 예측했고, 이를 토대로 순위표를 작성했다. 결과표는 2020년 개막인 5월 5일부터 8월 30일까지의 예측 결과를 바탕으로 작성했다. 기아타이거즈가 아닌 다른 구단끼리의 경기는 실제 결과를 사용했다. 머신러닝 모델은 KNN과 AdaBoost가 최적 모델로 선정되었으며, 실제 순위와 비교해 본 결과, 경기가 진행될수록, 예측 결과의 순위 오차가 점점 작아지는 것을 확인했다. 딥러닝 모델은 89%의 정확도를 기록했고, 머신러닝 모델과 마찬가지로 경기를 진행할수록 예측 결과 순위 오차가 작아지는 것을 확인했다. 실험 결과는 한국 프로야구 승·패 결과 예측뿐 아니라 다양한 분야에서 사용할 수 있을 것으로 사료된다. 방송국에서 야구 경기를 중계하는 중 이닝별로 인공지능 알고리즘이 예상한 승·패 여부를 중계화면에 띄울 수 있다. 시청자들에게 새로운 흥미를 일으킬 수 있을 것이고, 나아가 구단의 감독들이 이닝마다 데이터를 분석해 경기 중 유동적으로 승리하기 위한 전략을 세울 수 있을 것으로 기대된다.

Keywords

References

  1. https://tigers.co.kr/game/schedule/view?type=major&gameKey=20201031NCHT0&gameDate=20201031
  2. Younhak Oh, Han Kim, Jaesub Yun and Jong-Seok Lee, "Using Data Mining Techniques to Predict Win-Loss in Korean Professional Baseball Games", Korean Institute of Industrial Engineersm, Vol. 40, No. 1, pp. 8-17, 2014. https://doi.org/10.7232/JKIIE.2014.40.1.008
  3. 오광모, 이장택, "데이터마이닝을 이용한 한국프로야구 선수들의 연봉에 관한 모형연구", 한국스포츠사회학회지, Vol. 16, No 2. pp.2-310, 2003.
  4. Miljkovic, D., "The use of data mining for basketball matches outcomes prediction" pp.309-312, 2010.
  5. 채진석, 조은형, 엄한주, "프로야구 포스트시즌 진출 예측을 위한 통계적 모형 비교", 한국체육측정평가학회지, Vol 12, No. 1, pp.33-48, 2010.
  6. 홍석미, 정경숙, 정태충, "혼합형 기계 학습 모델을 이용한 프로야구 승패 예측 시스템", 한국정보과학회, Vol. 9, No. 6, pp.693-698, 2003.
  7. 서영진, 문형우, 우용태, "기계학습 기법을 이용한 한국프로야구 승패 예측 모델", 한국컴퓨터정보학회, Vol 24, No 2, pp.17-24, 2019.
  8. 노언석, 최재현, "기계학습을 활용한 프로야구승부예측에 관한 연구", 한국IT정책경영학회논문지, Vol. 9, No. 1, pp.335-338, 2017.
  9. Eonseok No, "A Study of KBO Professional Baseball Game Prediction using Artificial Neural Networks", Thesis, p.5, 2017.
  10. Sung Eun Moon, Soo Beom Jang, Jung Huk Lee, Jong Seok Lee, "Machine Learning and Deep Learning Technology Trends", Journal of korea institute of communication sciences, Vol. 33, No. 10, pp.49-56, 2016.
  11. 김도엽, 장주용, "얼굴 특장점 검출울 위한 적분회귀 네트워크", 한국방송.미디어공학회, Vol. 24, No. 4, pp.564-572, 2019.

Cited by

  1. 데이터 분석을 활용한 신인급 선수 육성 방안 연구 vol.19, pp.4, 2020, https://doi.org/10.22678/jic.2021.19.4.017