혼합형 기계 학습 모델을 이용한 프로야구 승패 예측 시스템

Win/Lose Prediction System : Predicting Baseball Game Results using a Hybrid Machine Learning Model

  • 홍석미 (경희대학교 전자계산공학과) ;
  • 정경숙 (경희대학교 전자계산공학과) ;
  • 정태충 (경희대학교 전자계산공학과)
  • 발행 : 2003.12.01

초록

야구는 매 경기마다 다양한 기록을 생성하며, 이러한 기록을 기반으로 다음 경기에 대한 승패예측이 이루어진다. 프로야구 승패 예측에 대한 연구는 많은 사람들에 의해 행해져 왔으나 아직 이렇다할 결과를 얻지 못하고 있는 상태이다. 이처럼 승패 예측이 어려운 이유는 많은 경기 기록들 중 승패 예측에 영향을 주는 요소의 선별이 어렵고, 예측에 사용된 자료들 간의 중복 요인으로 인해 학습 모델의 복잡도만 증가시킬 뿐 좋은 성능을 보이지 못하고 있다. 이에 본 논문에서는 전문가들의 의견을 바탕으로 학습 요소들을 선택하고, 선택된 자료들을 이용하여 휴리스틱 함수를 구성하였다. 요소들 간의 조합을 통해 예측에 영향을 줄 수 있는 새로운 값을 산출함과 동시에 학습 알고리즘에 사용될 입력 값의 차원을 줄일 수 있는 혼합형 모델을 제안하였다. 그 결과, 학습 알고리즘으로 사용된 역전파 알고리즘의 복잡도를 감소시키고, 프로야구 경기 승패 예측에 있어서도 정확성이 향상되었다.

Every baseball game generates various records and on the basis of those records, win/lose prediction about the next game is carried out. Researches on win/lose predictions of professional baseball games have been carried out, but there are not so good results yet. Win/lose prediction is very difficult because the choice of features on win/lose predictions among many records is difficult and because the complexity of a learning model is increased due to overlapping factors among the data used in prediction. In this paper, learning features were chosen by opinions of baseball experts and a heuristic function was formed using the chosen features. We propose a hybrid model by creating a new value which can affect predictions by combining multiple features, and thus reducing a dimension of input value which will be used for backpropagation learning algorithm. As the experimental results show, the complexity of backpropagation was reduced and the accuracy of win/lose predictions on professional baseball games was improved.

키워드

참고문헌

  1. H. Almuallim and T. G. Dietterich. Efficient algorithm for identifying relevant features. In Proc. of 9th Canadian Conf. on Artificial Intelligence, Vancouver, Britich Columbia, pages 38-45. Morgan Kaufmann, 1992
  2. 서재순, '귀납적 추론을 이용한 프로야구 승패 예측시스템 개발에 관한 연구', 경희대학교, 1994
  3. 홍석미, '프로야구 승패 예측을 위한 게임 시뮬레이터 개발에 관한 연구', 경희대학교, 1997
  4. 허준희, '프로야구 경기 시뮬레이터에서 데이타마이닝을 이용한 투수 선정 및 투수 교체 시기 선택에 관한 연구', 경희대학교, 1999
  5. P. S. Bradley, O. L. Managasarian, and W. N. Street. Feature selection via mathematical programming. INFORMS Journal on Computing, 10(2):209-217, 1998 https://doi.org/10.1287/ijoc.10.2.209
  6. A. L. Blum and P. Langley. Selection of relevant features and examples in machine learning. Artificial Intelligence, pages 245-271, 1997 https://doi.org/10.1016/S0004-3702(97)00063-5
  7. W.S.Sarie. Neural networks and statistical models. In Proc. 19th Annual SAS Users Group Internationa Conference, pages 1538-1550. SAS Institute, 1994
  8. M. Riedmiller. Advanced supervised learning in multi-layer perceptrons-from backpropagation to adaptive learning algorithms. International Journal of Computer Standards and Interfaces, 16(5): 265-278, 1994 https://doi.org/10.1016/0920-5489(94)90017-5
  9. R. Battiti. Using mutual information for selecting features in supervised neural net learning. IEEE Transaction on Neural Networks, 5(4):537-550, July 1994 https://doi.org/10.1109/72.298224
  10. C. Guerra-Salcedo, S. Chen, D. Whitley, and S. Smith. Fast and accurate feature selection using hybrid genetic strategies. In Proc. of Genetic and Evolutionary Computation Conference, pages 177-184, Piscataway, NJ, 1999. IEEE Service Center https://doi.org/10.1109/CEC.1999.781923