• 제목/요약/키워드: Baseball game data

검색결과 42건 처리시간 0.02초

A Study on Prediction of Baseball Game Based on Linear Regression

  • LEE, Kwang-Keun;HWANG, Seung-Ho
    • 한국인공지능학회지
    • /
    • 제7권2호
    • /
    • pp.13-17
    • /
    • 2019
  • Currently, the sports market continues to grow every year, and among them, professional baseball's entry income is larger than the rest of the professional league. In sports, strategies are used differently in different situations, and the analysis is based on data to decide which direction to implement. There is a part that a person misses in an analysis, and there is a possibility of a false analysis by subjective judgment. So, if this data analysis is done through artificial intelligence, the objective analysis is possible, and the strategy can be more rationalized, which helps to win the game. The most popular baseball to be applied to artificial intelligence to analyze athletes' strengths and weaknesses and then efficiently establish strategies to ease the competition. The data applied to the experiment were provided on the KBO official website, and the algorithms for forecasting applied linear regression. The results showed that the accuracy was 87%, and the standard error was ±5. Although the results of the experiment were not enough data, it would be possible to effectively use baseball strategies and predict the results of the game if the amount of data and regular data can be applied in the future.

Visual Representation and Applications of Hitting Direction in Korean Baseball Records

  • Hong, Chong-Sun;Park, Ha-Soo
    • Journal of the Korean Data and Information Science Society
    • /
    • 제19권2호
    • /
    • pp.539-549
    • /
    • 2008
  • Most important thing in professional baseball game among all kinds of sports is the winning. Both coaches and players collected and analyzed lots of game data to get a victory. In this paper, batting data are analyzed so as to represent informations of hitting direction visually. This method could be provided a lot of useful information about hitting direction of a specific batter or a team to not only coaches, players but also the audience.

  • PDF

한국프로야구에서의 피타고라스 정리의 정확도 측정 (Measuring the accuracy of the Pythagorean theorem in Korean pro-baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.653-659
    • /
    • 2015
  • 야구의 피타고라스 정리는 야구의 승률을 추정하는 방법으로 오랜 기간 동안 타당성이 입증되고 또 활용되고 있다. 본 연구에서는 2005년부터 2014년 사이의 한국프로야구 팀대 팀 전체기록을 이용하여 실제승률과 피타고라스 정리에 의해 추정된 기대승률의 차이가 발생하는 원인을 회귀모형을 이용하여 살펴보았다. 기대승률과 실제승률의 차이가 큰 경우는 득점과 실점의 분포가 특이하다는 가정아래에서 종속변수는 실제승률과 기대승률의 차이, 독립변수로는 게임당 득점 및 실점의 평균, 표준편차, 변동계수를 각각 이용하였다. 그 결과 실제승률과 기대승률의 차이에는 게임당 실점의 표준편차와 변동계수가 영향을 미치며 게임당 득점의 영향은 없는 것으로 나타났다.

The Effectiveness of CRM Approach in Improving the Profitability of Korea Professional Baseball Industry Measured by Entropy of ID3 Decision Tree Algorithm

  • Oh, Se-Kyung;Gwak, Chung-Lee;Lee, Mi-Young
    • Journal of Information Technology Applications and Management
    • /
    • 제18권3호
    • /
    • pp.91-110
    • /
    • 2011
  • Korea professional baseball industry has grown to take the lion's share of the domestic sports industry, but still does not make break even. The purpose of this study is to examine the financial impact of adopting the Customer Relation Management (CRM) approach on the profitability of Korea professional baseball industry. We use a measuring tool called entropy used in ID3 decision tree algorithm. In the paper, we specify five the most important factors that affect spectator satisfaction based on the previous literature, perform survey analysis, calculate entropy values, and find the results. We predicted the change in revenues when we adopt CRM by checking the spectators' willingness to pay more when the conditions of each factor are improved. We find that we can reap significant fruits of the effect of CRM introduction through enhancing 'game content factor' and 'game promotion factor' among the five factors. We also find that we can increase the revenues of domestic professional baseball teams to 2.4 times or 2.1 times the current level if we manage intensively those two factors respectively. It is very surprising to see that the improvement in total revenues makes both ends meet for domestic professional baseball teams. This clearly demonstrates the effectiveness of CRM approach in improving the profitability of organizations.

A Win/Lose prediction model of Korean professional baseball using machine learning technique

  • Seo, Yeong-Jin;Moon, Hyung-Woo;Woo, Yong-Tae
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권2호
    • /
    • pp.17-24
    • /
    • 2019
  • In this paper, we propose a new model for predicting effective Win/Loss in professional baseball game in Korea using machine learning technique. we used basic baseball data and Sabermetrics data, which are highly correlated with score to predict and we used the deep learning technique to learn based on supervised learning. The Drop-Out algorithm and the ReLu activation function In the trained neural network, the expected odds was calculated using the predictions of the team's expected scores and expected loss. The team with the higher expected rate of victory was predicted as the winning team. In order to verify the effectiveness of the proposed model, we compared the actual percentage of win, pythagorean expectation, and win percentage of the proposed model.

야구 피타고라스 승률의 수렴특성 (Convergence characteristics of Pythagorean winning percentage in baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권6호
    • /
    • pp.1477-1485
    • /
    • 2016
  • 본 연구에서는 한국프로야구에서 팀의 득점과 실점을 가지고 시즌 승률을 예측하는 야구의 피타고라스 정리에 의한 기대승률의 수렴특성을 살펴보았다. 사용한 자료는 2005년부터 2014년까지의 한국프로야구 정규시즌 초부터 정규시즌 말까지의 팀대 팀 전체기록이며, 그 결과 야구 팀의 특징 중에서 팀의 순위와 경기진행률이 수렴특성에 영향을 주는 것으로 나타났다. 팀의 순위는 하위 팀들의 기대승률이 최종 기대승률에 빨리 수렴하였으며, 경기진행률은 20% 이하에는 최종 기대승률과 많은 차이를 보였으나 70% 이상부터는 통계적으로 최종 기대승률과 유의한 차이가 발생하지 않았다.

혼합형 기계 학습 모델을 이용한 프로야구 승패 예측 시스템 (Win/Lose Prediction System : Predicting Baseball Game Results using a Hybrid Machine Learning Model)

  • 홍석미;정경숙;정태충
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권6호
    • /
    • pp.693-698
    • /
    • 2003
  • 야구는 매 경기마다 다양한 기록을 생성하며, 이러한 기록을 기반으로 다음 경기에 대한 승패예측이 이루어진다. 프로야구 승패 예측에 대한 연구는 많은 사람들에 의해 행해져 왔으나 아직 이렇다할 결과를 얻지 못하고 있는 상태이다. 이처럼 승패 예측이 어려운 이유는 많은 경기 기록들 중 승패 예측에 영향을 주는 요소의 선별이 어렵고, 예측에 사용된 자료들 간의 중복 요인으로 인해 학습 모델의 복잡도만 증가시킬 뿐 좋은 성능을 보이지 못하고 있다. 이에 본 논문에서는 전문가들의 의견을 바탕으로 학습 요소들을 선택하고, 선택된 자료들을 이용하여 휴리스틱 함수를 구성하였다. 요소들 간의 조합을 통해 예측에 영향을 줄 수 있는 새로운 값을 산출함과 동시에 학습 알고리즘에 사용될 입력 값의 차원을 줄일 수 있는 혼합형 모델을 제안하였다. 그 결과, 학습 알고리즘으로 사용된 역전파 알고리즘의 복잡도를 감소시키고, 프로야구 경기 승패 예측에 있어서도 정확성이 향상되었다.

A Statistical Analysis of Professional Baseball Team Data: The Case of the Lotte Giants

  • Cho, Young-Seuk;Han, Jun-Tae;Park, Chan-Keun;Heo, Tae-Young
    • 응용통계연구
    • /
    • 제23권6호
    • /
    • pp.1191-1199
    • /
    • 2010
  • Knowing what factors into a player's ability to affect the outcome of a sports game is crucial. This knowledge helps determine the relative degree of contribution by each team member as well as sets appropriate annual salaries. This study uses statistical analysis to investigate how much the outcome of a professional baseball game is influenced by the records of individual players. We used the Lotte Giants' data on 252 games played between 2007 and 2008 that included environmental data(home or away games and opponents) as well as pitchers' and batters' data. Using a SAS Enterprise Miner, we performed a logistic regression analysis and decision tree analysis on the data. The results obtained through the two analytic methods are compared and discussed.

머신러닝을 활용한 선발 투수 교체시기에 관한 연구 (A Study on the Timing of Starting Pitcher Replacement Using Machine Learning)

  • 노성진;노미진;한무명초;엄선현;김양석
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.9-17
    • /
    • 2022
  • 본 연구는 야구 경기에서 선발 투수를 위기 상황 이전에 교체하기 위한 의사결정을 지원하는 예측 모델 구현을 목적으로 한다. 이를 위해 베이스볼 서번트(Baseball Savant)에서 제공하는 메이저리그 스탯캐스트 데이터를 활용하여, 선발 투수를 위기 상황 이전에 선제적으로 교체하는 예측 모델을 구현한다. 이를 위해 첫째, 데이터 탐색을 통해 선발 투수가 경기에서 직면하는 위기 상황을 도출하였다. 둘째, 선발 투수가 이닝 종료 전에 교체된 경우, 이전 이닝에서 교체하는 것으로 레이블을 구성하여 학습을 진행하였다. 학습된 모델을 비교한 결과 앙상블 기법을 기반으로 한 모델이 F1-Score가 65%로 가장 높은 예측 성능을 보였다. 본 연구의 실무적 의의는 제안하는 모델을 통해 선발 투수를 위기 상황 이전에 교체하여 팀의 승리 확률을 높이는 데 기여할 수 있으며, 경기 중 감독은 데이터 기반의 전략적 의사결정 지원을 받을 수 있을 것이다.

코로나 19에 따른 프로야구 무관중 시청품질요인의 중요도, 만족도 분석 (Analysis of the Importance and Satisfaction of Viewing Quality Factors among Non-Audience in Professional Baseball According to Corona 19)

  • 백승헌;김기탁
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권2호
    • /
    • pp.123-135
    • /
    • 2021
  • 본 연구의 자료처리는 '코로나 19와 프로야구', '코로나 19와 프로야구 무관중'과 관련된 키워드를 중심으로 텍스톰(textom)프로그램의 텍스트마이닝과 소셜네트워크 분석을 활용해 문제점 도출 및 시청품질의 변인을 설정하는데 활용하였다. 정량적 분석을 위해 시청품질에 관한 설문지를 구성하였으며, 270부의 설문응답자 중 250부의 설문을 최종연구에 사용하였다. 설문지의 타당도와 신뢰도를 확보하기 위한 도구로 탐색적 요인 분석과 신뢰도 분석을 실시하였으며, 타당도와 신뢰도가 확보된 설문을 바탕으로 IPA분석(중요도-만족도)을 실시하여 결과 및 전략을 제시하였다. IPA분석을 실시한 결과 1사분면에 영상과 관련된 요인(영상구성, 영상배색, 영상 선명도, 영상 확대 및 구도, 고음질 영상)이 나타났고 2사분면은 경기상황(응원 팀 경기수준, 응원 선수 경기수준, 스타선수 발굴, 라이벌 팀과의 경기)과 경기정보(경기일정 안내, 선수정보 확인, 팀 성적 및 선수성적, 경기정보), 상호작용(응원팀과의 공감대) 일부의 요인이 나타났으며, 3사분면은 해설자(야구관련 지식, 의사전달 능력, 발음과 목소리, 표준어 사용, 경기관련 정보 소개)와 상호작용(프런트와 실시간 소통, 시청자와의 공감대, 채팅 등의 정보교환)의 요인이 나타났다.