• Title/Summary/Keyword: 야구경기 데이터

Search Result 43, Processing Time 0.039 seconds

Generating baseball articles using decision tree (의사결정 트리를 이용한 야구기사 작성 기법)

  • Kim, Ju-bong;Go, Hyun-yung;Yong, sang-Hyuk;Han, Youn-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2016.10a
    • /
    • pp.628-631
    • /
    • 2016
  • '야구경기 결과에 대해 자동으로 기사를 작성할 수 있는가'에서 본 논문에서는 야구 경기 데이터들을 기반으로 의사결정 트리기법을 사용하여 경기결과의 문맥과 기사작성에 필요한 요소들을 자동으로 추출해보았다. 그 결과 해당경기의 데이터를 가지고 객관적인 야구기사를 생산해 낼 수 있음을 도출해냈다.

The Study of Selecting Pitcher using Data Mining on Professional Baseball Game Simulator (데이터마이닝을 이용한 프로야구 경기 시뮬레이터에서의 투수 선정 방법에 대한 연구)

  • 정지문;박혜원;최성
    • Proceedings of the KAIS Fall Conference
    • /
    • 2000.10a
    • /
    • pp.370-374
    • /
    • 2000
  • 야구 경기에서는 한 경기에 여러 투수가 등판하게 되는데, 상황에 따라 성격이 다른 투수가 공을 던지게 된다. 이러한 등판 투수의 선정은 감독 고유의 권한이며 감독이 오랜 경험을 통해 승리하기 위해 최적의 투수를 선정하게 된다. 본 논문은 그러한 감독의 경험을 학습하기 위하여 프로야구 경기에서 발생하는 기록 데이터를 데이터마이닝을 이용하여 분석한 후, 앞으로 열릴 경기에 등판할 투수를 미리 예측할 수 있는 방안에 대하여 연구하였다.

The Correlation Of Weather And Hanhwa Eagles (날씨와 한화 이글스의 상관관계)

  • Heo, Tai-Sung;Kang, Ha-Ram
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.237-238
    • /
    • 2021
  • 야구는 데이터 스포츠라 불릴 만큼 경기마다 많은 데이터가 생성되며, 이를 바탕으로 경기를 진행한다. 본 연구는 한국 프로야구 구단인 한화 이글스의 승률 및 타자의 성적과 날씨 사이의 상관관계를 분석하였다. 이를 위하여 한화 이글스의 승률과 타자의 성적을 한국프로야구(KBO) 공식 홈페이지 및 야구 기록 통계사이트 스탯티즈(statiz)에서 수집하였으며, 날씨 데이터는 온도와 습도를 고려한 불쾌지수 데이터를 기상청으로 부터 수집하였다. 파이선의 pandas 라이브러리를 사용하여 데이터 전처리를 실행하였다. 이후 파이선의 matplotlib 라이브러리를 이용하여 데이터 분석 및 시각화를 진행하였다. 본 연구의 분석 결과로는 불쾌지수가 보통일 때 승률이 가장 크고 높음일 때 가장 낮음을 확인할 수 있었다. 또한, 타자들의 평균 성적을 분석한 결과 보통과 매우 높음은 전체적인 타격 지수가 비슷하나 높음일 때 부진한 것으로 나왔다.

  • PDF

A Prediction of Baseball Game Results Using Recurrent Neural Netowrks (순환신경망을 활용한 야구승부예측)

  • Jeong, Kyeong-Seok;Kim, Jin-Hak;Han, Youn-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2017.11a
    • /
    • pp.873-876
    • /
    • 2017
  • 최근 딥러닝(Deep-learning)을 활용한 기상 예측, 심리 예측, 교통상황 예측 등 다양한 분야에 걸쳐 여러 모델의 인공신경망이 활용되고 있다. 본 논문에서는 여러 분야 중 스포츠라는 분야에 접근했으며, 딥러닝 모델을 통해 승부를 예측하는 실험을 진행하였다. 야구의 승부는 선수의 능력치, 기상의 변화, 험/어웨이 여부, 교체 여부 등 가늠할 수 없이 수많은 데이터들에 의존하고 있다. 그러나 본 논문에서는 이러한 수많은 데이터 중 경기 외적인 데이터를 제외한 데이터를 활용하여 그 다음 경기의 승부를 예측할 수 있을 지를 연구한다. 날짜 별 경기들이 훈련데이터가 되고 목표는 이전 경기들의 영향으로 예측된 다음 경기의 승/패를 예측한다. 즉 순차적인 데이터의 활용에 적합한 모델, Recurrent Neural-Network을 이용하였다. 이를 위하여 KBreport에서 데이터를 수집하였고, 수집된 데이터를 훈련 데이터 세트로 만들어 Recurrent Neural Network를 통해 훈련시켜 다음 경기의 승패를 예측하였다.

Analysis of the Korean Baseball League using a Markov Chain Model (마르코프 연쇄를 이용한 한국 프로야구 경기 분석)

  • Moon, Hyung Woo;Woo, Yong Tae;Shin, Yang Woo
    • The Korean Journal of Applied Statistics
    • /
    • v.26 no.4
    • /
    • pp.649-659
    • /
    • 2013
  • We use a Markov chain model to analyze the Korean Baseball League. We derive the distributions of the number of runs scored and the number of batters that complete their turn at bat in a baseball game using the time inhomogeneous Markov chain. The model is tested with real data produced from the 2011 Korean Baseball League.

A Study on Result Prediction of Korean professional baseball using Random Forest Method (랜덤 포레스트 기법을 이용한 한국 프로야구 승부 예측에 관한 연구)

  • Yi, Jaeik;Lee, JongHyeok;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.721-722
    • /
    • 2014
  • 야구는 흔히 기록의 스포츠라는 별명으로 많이 불린다. 그만큼 야구라는 운동이 갖는 기록의 종류는 무척 다양하고 또한 기록의 활용 가능성 역시 무궁무진하다. 이러한 별명에 걸맞게 미국에서는 야구에 대한 다양하고 방대한 정보를 수집하고 활용하고 있다. 그러나 한국 프로야구에 대한 정보의 수집과 활용은 아직까지 크게 부각되지 못하는 것이 현실이다. 랜덤 포레스트 기법을 이용하여 경기의 승부를 예측함으로써 한국 프로야구 데이터의 수집과 활용을 증대 시키는 효과를 기대 해 본다. 본 논문에서는 2014년 한국 프로야구의 승부 예측을 주제로 어떠한 누적 스포츠 데이터집단이 가장 유효한지를 실험 하였다. 승부 예측을 하기위해 사용된 누적 스포츠 데이터는 2014년 선수와 팀 기록, 2013부터 2014년까지의 선수와 팀 기록, 2012년부터 2014년까지의 선수와 팀 기록이다. 이들 세 그룹의 데이터를 이용하여 이분데이터 모형에 랜덤 포레스트 기법을 사용한 승부예측 알고리즘에 적용 시킨 후 어느 그룹의 데이터가 가장 실제 2014 한국 프로야구 정기결과와 맞을 확률이 높음을 구하여 가장 유용한 데이터 그룹이 어떤 그룹인지 연구 하였다.

Korean Baseball League Q&A System Using BERT MRC (BERT MRC를 활용한 한국 프로야구 Q&A 시스템)

  • Seo, JungWoo;Kim, Changmin;Kim, HyoJin;Lee, Hyunah
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.459-461
    • /
    • 2020
  • 매일 게시되는 다양한 프로야구 관련 기사에는 경기 결과, 각종 기록, 선수의 부상 등 다양한 정보가 뒤섞여있어, 사용자가 원하는 정보를 찾아내는 과정이 매우 번거롭다. 본 논문에서는 문서 검색과 기계 독해를 이용하여 야구 분야에 대한 Q&A 시스템을 제안한다. 기사를 형태소 분석하고 BM25 알고리즘으로 얻은 문서 가중치로 사용자 질의에 적합한 기사들을 선정하고 KorQuAD 1.0과 직접 구축한 프로야구 질의응답 데이터셋을 이용해 학습시킨 BERT 모델 기반 기계 독해로 답변 추출을 진행한다. 야구 특화 데이터 셋을 추가하여 학습시켰을 때 F1 score, EM 모두 15% 내외의 정확도 향상을 보였다.

  • PDF

Big Data Analysis of the Correlation between Average Daily Temperature and Batting Power (빅데이터를 활용한 타자의 장타력과 일일 평균 기온 간의 상관관계 분석)

  • Kim, Semin;Shin, Chwacheol
    • Journal of Digital Convergence
    • /
    • v.18 no.8
    • /
    • pp.225-230
    • /
    • 2020
  • The KBO League is held over a long period of time due to the large number of games. Also, Korea has a diverse and distinct climate. Therefore, this study analyzed the relationship between the daily average temperature and the record of batting power such as home runs, triples, doubles, number of bases, batting percentage, and net batting percentage, and a third baseball record was defined. For this study, the correlation between the daily average temperature data and the batter who entered the standard at-bat in the KBO League in 2019 was analyzed through the SEMMA method. From the results of this study, it was found that the average daily temperature had an effect on a batter's hitting power. In particular, it was found that a batter's hitting power decreased on the day of temperatures recorded between 20.0 degrees and 24.9 degrees, and it was discussed that this may have been related to the physical condition of the pitcher the batter was facing. Therefore, it can be expected that players, coaching staff, and the front desk can use them in the game through conditions outside the game. In addition, it is expected that it will be a more useful analysis model by analyzing the records of pitching, base running, and defense as well as subsequent batting records.

Convergence characteristics of Pythagorean winning percentage in baseball (야구 피타고라스 승률의 수렴특성)

  • Lee, Jangtaek
    • Journal of the Korean Data and Information Science Society
    • /
    • v.27 no.6
    • /
    • pp.1477-1485
    • /
    • 2016
  • The Pythagorean theorem for baseball based on the number of runs they scored and allowed has been noted that in many baseball leagues a good predictor of a team's end of season won-loss percentage. We study the convergence characteristics of the Pythagorean expectation formula during the baseball game season. The three way ANOVA based on main effects for year, rank, and baseball processing rate is conducted on the basis of using the historical data of Korean professional baseball clubs from season 2005 to 2014. We perform a regression analysis in order to predict the difference in winning percentage between teams. In conclusion, a difference in winning percentage is mainly associated with the ranking of teams and baseball processing rate.

A Study on the Excellent Operation of the "Korea Baseball Hall of Fame" Based on Baseball Records (야구기록 활용에 기반한 '한국야구명예의전당' 운영 방안 연구)

  • Choi, Tae-Suk;Yim, Jin-Hee
    • Journal of Korean Society of Archives and Records Management
    • /
    • v.16 no.3
    • /
    • pp.157-177
    • /
    • 2016
  • This study proposes an effective direction for operating the "Korea Baseball of Fame" based on baseball records. To clarify problems, a literature review on the case analysis of the "Hall of Fame" of the United States and Japan, an assortment and management of Korean baseball records, and a consultation with officials who work in the baseball industry were progressed. In conclusion, this study suggested building an archive database to operate the "Korea Baseball Hall of Fame" effectively. First, archives will be collected, and then managed and utilized at the "Korea Baseball Hall of Fame." Second, to preserve the memories of baseball heroes, an oral archive will be constructed. Third, baseball records will be assorted and stored in a database.