DOI QR코드

DOI QR Code

A Study on the Timing of Starting Pitcher Replacement Using Machine Learning

머신러닝을 활용한 선발 투수 교체시기에 관한 연구

  • Received : 2022.03.07
  • Accepted : 2022.03.28
  • Published : 2022.03.31

Abstract

The purpose of this study is to implement a predictive model to support decision-making to replace a starting pitcher before a crisis situation in a baseball game. To this end, using the Major League Statcast data provided by Baseball Savant, we implement a predictive model that preemptively replaces starting pitchers before a crisis situation. To this end, first, the crisis situation that the starting pitcher faces in the game was derived through data exploration. Second, if the starting pitcher was replaced before the end of the inning, learning was carried out by composing a label with a replacement in the previous inning. As a result of comparing the trained models, the model based on the ensemble method showed the highest predictive performance with an F1-Score of 65%. The practical significance of this study is that the proposed model can contribute to increasing the team's winning probability by replacing the starting pitcher before a crisis situation, and the coach will be able to receive data-based strategic decision-making support during the game.

본 연구는 야구 경기에서 선발 투수를 위기 상황 이전에 교체하기 위한 의사결정을 지원하는 예측 모델 구현을 목적으로 한다. 이를 위해 베이스볼 서번트(Baseball Savant)에서 제공하는 메이저리그 스탯캐스트 데이터를 활용하여, 선발 투수를 위기 상황 이전에 선제적으로 교체하는 예측 모델을 구현한다. 이를 위해 첫째, 데이터 탐색을 통해 선발 투수가 경기에서 직면하는 위기 상황을 도출하였다. 둘째, 선발 투수가 이닝 종료 전에 교체된 경우, 이전 이닝에서 교체하는 것으로 레이블을 구성하여 학습을 진행하였다. 학습된 모델을 비교한 결과 앙상블 기법을 기반으로 한 모델이 F1-Score가 65%로 가장 높은 예측 성능을 보였다. 본 연구의 실무적 의의는 제안하는 모델을 통해 선발 투수를 위기 상황 이전에 교체하여 팀의 승리 확률을 높이는 데 기여할 수 있으며, 경기 중 감독은 데이터 기반의 전략적 의사결정 지원을 받을 수 있을 것이다.

Keywords

References

  1. G. Ganeshapillai, J. Guttag, "A data-driven method for in-game decision making in MLB," MIT SSAC, 2014.
  2. M. Fichman, M. Fichman, "From darwin to the diamond: How baseball and billy beane arrived at moneyball," Available at SSRN, 2012.
  3. T. Ishii, "Using machine learning algorithms to identify undervalued baseball players," Technical Report: Stanford University, 2016.
  4. 박동주, 김병우, 정영선, 안창욱 "Deep Neural Network 기반 프로야구 일일 관중 수 예측 : 광주-기아 챔피언스 필드를 중심으로," 스마트미디어저널, 제7권, 제1호, 16-23쪽, 2018년 3월 https://doi.org/10.30693/SMJ.2018.7.1.16
  5. 김원종, 최연식, 유동희, "데이터 마이닝을 활용한 한국 프로야구 구단의 승패예측과 승률 향상을 위한 전략 도출 연구," 한국스포츠산업경영학회지, 제23권, 제3호, 88-104쪽, 2018년 6월
  6. C.S. Valero, "Predicting Win-Loss outcomes in MLB regular season games-A comparative study using data mining methods," International Journal of Computer Science in Sport, vol. 15, no. 2, pp. 291-112, 2016.
  7. B. Tolbert, T. Trafalis, "Predicting major league baseball championship winners through data mining," Athens Journal of Sports, vol. 3, no. 4, pp. 239-252, 2016. https://doi.org/10.30958/ajspo.3.4.1
  8. B. Everman, "Analyzing baseball statistics using data mining," Jan. 2015.
  9. 오윤학, 김한, 윤재섭, 이종석, "데이터마이닝을 활용한 한국프로야구 승패예측모형 수립에 관한 연구," 대한산업공학회지, 제40권, 제1호, 8-17쪽, 2014년 2월 https://doi.org/10.7232/JKIIE.2014.40.1.008
  10. 이장택, "한국프로야구에서의 투수평가지표," 한국데이터정보과학회지, 제25권, 제3호, 485-492쪽, 2014년 5월
  11. P. Yifan, "Predict Next Baseball Pitch Type with RNN"
  12. G,D, Sidle, "Using multi-class machine learning methods to predict major league baseball pitches," North Carolina State University, 2017.
  13. P. Hoang, M. Hamilton, J. Murray, C. Stafford and H. Tran, "A dynamic feature selection based LDA approach to baseball pitch prediction," Springer, pp. 125-137, 2015.
  14. M. Woodham, J. Hawkins, A. Singh, S. Chakraborty, "When to Pull Starting Pitchers in Major League Baseball? A Data Mining Approach," 2019 18th IEEE International Conference On Machine Learning And Applications (ICMLA), FL, USA, pp. 426-431, 2019.
  15. 김강민, 김판구, 전찬준, "Deep Metric Learning을 활용한 합성곱 신경망 기반의 피부질환 분류 기술," 스마트미디어저널, 제10권 제4호, 45-53쪽, 2021년 12월
  16. 유병주, "불균형 자료의 분류분석 방법별 성능 비교와 접근 전략 연구," Journal of The Korean Data Analysis Society, 제23권, 제1호, 195-207쪽, 2021년 2월 https://doi.org/10.37727/jkdas.2021.23.1.195
  17. Keith Law, SMART BASEBALL, 두리반, 4-352쪽, 2020년