회귀 분석을 통한 경마 순위 예측 모형

A Model for Predicting Horse Racing Ranking by Regression Analysis

  • 허태성 (인하공업전문대학 컴퓨터정보공학과) ;
  • 송민섭 (인하공업전문대학 컴퓨터정보공학과) ;
  • 고동수 (인하공업전문대학 컴퓨터정보공학과)
  • Hur, Tai-sung (Dept. of Computer Science Engineering, Inha Technical College) ;
  • Song, Min Seob (Dept. of Computer Science Engineering, Inha Technical College) ;
  • Ko, Dong Su (Dept. of Computer Science Engineering, Inha Technical College)
  • 발행 : 2022.07.13

초록

본 논문에서는 국내 합법 사행산업의 가장 큰 비중을 차지하는 경마에 대한 데이터 분석 모델을 제공하여 건전한 국민 여가 스포츠로 인식 개선을 제안한다. 고배당을 강조하는 경마 예측론이 성행하며 경마가 스포츠가 아닌 도박에 가깝다는 부정적 이미지를 개선하고자 부모마의 수득 상금을 이용한 순위 분석 모델을 제공한다. 현재 국내 경마 경기는 서울, 부산, 제주에서 개최되며, 이 중 서울 지역 경마 데이터를 분석 데이터로 하였다. 분석에 이용한 데이터는 2019년 3월부터 2022년 3월까지의 경주 성적, 경주마 정보, 부모마 수득상금을 이용하였다. 분석에는 선형 회귀 모형, 랜덤 포레스트 회귀 모형 (Breiman, 2001)을 이용하였다. 분석은 Python 을 이용하였으며, Python에서 제공하는 다양한 라이브러리를 이용하여 크롤링, 전처리, 분석하였다.

키워드