• 제목/요약/키워드: Korean professional baseball

검색결과 77건 처리시간 0.025초

데이터마이닝을 활용한 한국프로야구 승패예측모형 수립에 관한 연구 (Using Data Mining Techniques to Predict Win-Loss in Korean Professional Baseball Games)

  • 오윤학;김한;윤재섭;이종석
    • 대한산업공학회지
    • /
    • 제40권1호
    • /
    • pp.8-17
    • /
    • 2014
  • In this research, we employed various data mining techniques to build predictive models for win-loss prediction in Korean professional baseball games. The historical data containing information about players and teams was obtained from the official materials that are provided by the KBO website. Using the collected raw data, we additionally prepared two more types of dataset, which are in ratio and binary format respectively. Dividing away-team's records by the records of the corresponding home-team generated the ratio dataset, while the binary dataset was obtained by comparing the record values. We applied seven classification techniques to three (raw, ratio, and binary) datasets. The employed data mining techniques are decision tree, random forest, logistic regression, neural network, support vector machine, linear discriminant analysis, and quadratic discriminant analysis. Among 21(= 3 datasets${\times}$7 techniques) prediction scenarios, the most accurate model was obtained from the random forest technique based on the binary dataset, which prediction accuracy was 84.14%. It was also observed that using the ratio and the binary dataset helped to build better prediction models than using the raw data. From the capability of variable selection in decision tree, random forest, and stepwise logistic regression, we found that annual salary, earned run, strikeout, pitcher's winning percentage, and four balls are important winning factors of a game. This research is distinct from existing studies in that we used three different types of data and various data mining techniques for win-loss prediction in Korean professional baseball games.

한국프로야구에서의 피타고라스 정리의 정확도 측정 (Measuring the accuracy of the Pythagorean theorem in Korean pro-baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권3호
    • /
    • pp.653-659
    • /
    • 2015
  • 야구의 피타고라스 정리는 야구의 승률을 추정하는 방법으로 오랜 기간 동안 타당성이 입증되고 또 활용되고 있다. 본 연구에서는 2005년부터 2014년 사이의 한국프로야구 팀대 팀 전체기록을 이용하여 실제승률과 피타고라스 정리에 의해 추정된 기대승률의 차이가 발생하는 원인을 회귀모형을 이용하여 살펴보았다. 기대승률과 실제승률의 차이가 큰 경우는 득점과 실점의 분포가 특이하다는 가정아래에서 종속변수는 실제승률과 기대승률의 차이, 독립변수로는 게임당 득점 및 실점의 평균, 표준편차, 변동계수를 각각 이용하였다. 그 결과 실제승률과 기대승률의 차이에는 게임당 실점의 표준편차와 변동계수가 영향을 미치며 게임당 득점의 영향은 없는 것으로 나타났다.

2007년 한국프로야구에서 도루성공모형 (Steal Success Model for 2007 Korean Professional Baseball Games)

  • 홍종선;최정민
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.455-468
    • /
    • 2008
  • 야구경기의 승패에 영향을 미치는 중요한 요인으로 간주되는 도루의 성공모형을 개발하기 위하여 2007년 한국프로야구 기록자료를 바탕으로 로지스틱 회귀모형들을 제안한다. 또한 한국프로야구의 도루성공과 실패에 대해 판별분석을 실시하고 분류 기준값을 결정하였으며, 판별분석 분류표를 이용해 로지스틱 회귀분석과 판별분석의 효율성을 비교한다. 전체적인 모형의 정확도는 로지스틱 회귀모형이 판별분석보다 더 좋은 것으로 나타났고, 연속형 자료를 범주형으로 변환한 자료에 대한 로지스틱 회귀모형도 유사한 효율성을 갖고있다.

한국 프로야구의 승률 추정 (The estimation of winning rate in Korean professional baseball league)

  • 김순귀;이영훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.653-661
    • /
    • 2016
  • 본 연구에서는 한국 프로야구의 승률을 추정하기 위하여 야구 경기의 피타고라스 정리라고 불리우는 방법을 사용하였고, 이 방법을 확장한 일반화 피타고라스 정리도 이용하면서 일반화 피타고라스 정리의 최적 지수 값을 찾아보았다. 그리고 다른 추정 방법들인 로지스틱 모형과 프로빗 모형의 사용을 제안하였다. 평균제곱오차의 제곱근 (RMSE)을 판정기준으로, 피타고라스 정리와 제안된 모형들의 효율성을 서로 비교하였다. 사용한 자료는 1982년부터 2015년 7월까지의 모든 한국 프로야구 기록이며, 제안한 방법은 일반화 피타고라스 정리를 이용한 승률 추정 방법보다 평균제곱오차의 관점에서 다소 나아졌음을 보여준다.

An Estimation Model for Defence Ability Using Big Data Analysis in Korea Baseball

  • Ju-Han Heo;Yong-Tae Woo
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.119-126
    • /
    • 2023
  • 본 연구에서는 한국프로야구에서 수비수의 수비 능력을 객관적으로 평가하기 위한 새로운 모델을 제시하였다. 제안 모델에서는 2016년부터 2019년까지 한국프로야구 경기 데이터를 이용하여 구단, 수비 포지션별로 대표 수비수를 선정하여 수비 능력을 평가하였다. 수비력을 평가하기 위하여 포지션별로 수비 범위를 계산하고 계산된 수비지역을 분할하는 방법은 제안하였다. 포지션별 수비 범위는 같은 포지션의 수비수들이 타구를 아웃시킨 지점을 기준으로 컨벡스 헐(Convex Hull) 알고리즘을 이용하여 계산하였다. 포지션별 수비 범위를 이용하여 내야수, 외야수 모두에 대한 아웃전환점수, 승리기여점수를 기본 점수로 계산하였다. 또한, 내야수는 병살 점수, 외야수는 추가진루 점수를 따로 계산하여 합산하였다.

한국프로야구에서 FIP 계수의 추정 (Estimation of FIP coefficient in Korea professional baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권3호
    • /
    • pp.625-633
    • /
    • 2017
  • 수비무관 평균자책점 (FIP)는 운과 수비력을 제외한 투수가 가진 고유의 능력만을 평가하는 지표로 야구팬들에게 매우 지지도가 높다. 미국 메이저리그 야구에서는 홈런, 볼넷, 삼진, 사구만을 이용하여 계산하는 FIP의 계수를 13, 3, -2로 사용한다. 그러나 메이저리그 야구의 득점가치를 바탕으로 정해진 계수들을 한국 프로야구에 접목시키면 팀이나 선수들의 평가가 적절하지 않을 수 있다. 본 연구에서는 한국프로야구에 적합한 FIP의 계수를 제안하고 평균자책점 (ERA)과의 연관성을 살펴본다. 그 결과 제안된 방법 kFIP는 한국프로야구에서 기존의 FIP에 비해 통계적으로 매우 유의하게 평균자책점에 대한 연관성을 높일 수 있었다.

Shoulder and Elbow Injury Rates and Patterns in Korean Rookie Professional Baseball Pitchers

  • Park, Jin-Young;Lee, Seung-Jun;Kim, Yong-Il;Heo, Gu-Yeon
    • Clinics in Shoulder and Elbow
    • /
    • 제19권1호
    • /
    • pp.15-19
    • /
    • 2016
  • Background: To investigate how many rookie pitchers suffered from injuries while playing in the amateur league without guidelines for prevention of excessive pitching, we analyzed their amateur pitching patterns based on the pitch count, use of breaking balls, and pitches during winter camp. Methods: Forty-one rookie pitchers who graduated from high school or university in 2013 and joined professional baseball teams. Participants were interviewed by a trainer using our questionnaire. Injury inclusion criteria were 1) history of shoulder surgery, 2) history of elbow surgery, 3) shoulder pain requiring treatment, and 4) elbow pain requiring treatment. Results: Mean number of pitches per game and warm-up pitches for practice was 84.5 pitches (range, 15 to 130 pitches) and 16.4 pitches (range, 2 to 210 pitches), respectively. Mean number of pitches during the last year was 906.9 (range, 80 to 2,000). Mean number of maximal pitches was 127 pitches (range, 50 to 210 pitches). Fourteen pitchers had pitched over 150 pitches. Twenty-seven pitchers (65.9%) had pitched in spite of enduring pain. During winter training (mean 1.8 months), mean number of pitches per day was 162.5 pitches, and 20 pitchers (48.8%) had practiced pitching excessively despite the cold weather. Twenty-six rookies (63.4%) had shoulder pain or history of shoulder surgery, and 31 pitchers (75.6%) had elbow pain or history of elbow surgery. Only four participants (9.8%) did not have pain and history of surgery. Conclusions: For young baseball pitchers, guidelines for prevention of excessive pitching and for regulating the winter training program may be needed.

프로야구의 상품마케팅에 대한 인식 및 선호도 조사 (A study of current awareness and preference on Korean professional baseball team's promotion for products)

  • 박승환
    • 한국산학기술학회논문지
    • /
    • 제13권3호
    • /
    • pp.1238-1245
    • /
    • 2012
  • 본 연구는 프로야구 관람자들을 대상으로 프로야구의 상품마케팅에 대한 인식 및 선호도를 규명함으로써 프로야구 관람에 참여하고 있는 관람자들에게 보다 효과적인 프로야구 관람에 대한 정보를 제공하는데 연구의 목적이 있다. 첫째, 인구사회학적 특성 중에서 성별에 따라서 프로야구 구단의 상품마케팅에 대한 인식(프로구단에 대한 인식, 상품마케팅 전략에 대한 인식), 그리고 상품마케팅의 선호도(상품가치, 상품가격, 상품종류)에 따른 차이를 비교한 결과, 통계적으로 유의한 차이를 보이지 않았다. 둘째, 인구사회학적 특성 중에서 연령에 따른 프로야구 구단의 상품마케팅에 대한 인식(프로구단에 대한 인식, 상품마케팅 전략에 대한 인식), 그리고 상품마케팅의 선호도(상품가치, 상품가격, 상품종류)에 따른 차이를 비교한 결과, 프로야구 구단의 상품마케팅에 대한 인식에는 통계적으로 유의한 차이를 보이지 않았으나, 상품마케팅의 선호도 중 상품가치와 상품가격에 대한 선호도에서는 통계적으로 유의한 차이를 나타냈다(p<.05). 특히, 상품가치의 경우, 20대와 30대 간, 20대와 40대간, 30대와 40대 간 비교에서 모두 통계적으로 유의한 차이를 나타냈다(p<.05). 셋째, 인구사회학적 특성 중에서 연간수입에 따른 프로야구 구단의 상품마케팅에 대한 인식(프로구단에 대한 인식, 상품마케팅 전략에 대한 인식), 그리고 상품마케팅의 선호도(상품가치, 상품가격, 상품종류)에 따른 차이를 비교한 결과, 프로야구 구단의 상품마케팅에 대한 인식에서는 통계적으로 유의한 차이를 보이지 않았다. 하지만, 상품마케팅의 선호도 중에서 상품가격에 대해서는 통계적으로 유의한 차이를 보였다(p<.05). 특히, 2000-2500만원미만, 그리고 2500-3000만원미만의 집단과 4000만원 이상의 수입을 얻고 있는 집단 간의 차이에서 통계적으로 유의한 차이를 나타냈다(p<.05).

혼합형 기계 학습 모델을 이용한 프로야구 승패 예측 시스템 (Win/Lose Prediction System : Predicting Baseball Game Results using a Hybrid Machine Learning Model)

  • 홍석미;정경숙;정태충
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권6호
    • /
    • pp.693-698
    • /
    • 2003
  • 야구는 매 경기마다 다양한 기록을 생성하며, 이러한 기록을 기반으로 다음 경기에 대한 승패예측이 이루어진다. 프로야구 승패 예측에 대한 연구는 많은 사람들에 의해 행해져 왔으나 아직 이렇다할 결과를 얻지 못하고 있는 상태이다. 이처럼 승패 예측이 어려운 이유는 많은 경기 기록들 중 승패 예측에 영향을 주는 요소의 선별이 어렵고, 예측에 사용된 자료들 간의 중복 요인으로 인해 학습 모델의 복잡도만 증가시킬 뿐 좋은 성능을 보이지 못하고 있다. 이에 본 논문에서는 전문가들의 의견을 바탕으로 학습 요소들을 선택하고, 선택된 자료들을 이용하여 휴리스틱 함수를 구성하였다. 요소들 간의 조합을 통해 예측에 영향을 줄 수 있는 새로운 값을 산출함과 동시에 학습 알고리즘에 사용될 입력 값의 차원을 줄일 수 있는 혼합형 모델을 제안하였다. 그 결과, 학습 알고리즘으로 사용된 역전파 알고리즘의 복잡도를 감소시키고, 프로야구 경기 승패 예측에 있어서도 정확성이 향상되었다.

한국 프로야구 선수들의 경기력과 연봉의 관계 분석 (A study on relationship between the performance of professional baseball players and annual salary)

  • 승희배;강기훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.285-298
    • /
    • 2012
  • 본 연구는 프로야구 선수들의 경기력을 세분화하고 섬세하게 측정 할 수 있는 세이버메트릭스 기법을 적용하여 한국 프로야구 8개 구단의 타자들을 대상으로 세이버메트릭스 지수를 통해서 알아본 선수들의 경기력과 연봉간의 패턴을 분석하고자 한다. 연구 방법으로는 한국 프로야구 8개 구단의 2009년, 2010년도 타자들의 경기 기록과 차년도 연봉 자료를 수집한 후, 세이버메트릭스 지수를 계산하여 연봉과의 관계를 주성분분석을 통해 살펴보았다. 각 구단별로 일부 상이한 결과도 있었지만 전반적으로는 경기력이 높은 선수들에게 많은 연봉이 지급되고 있음을 확인하였다. 본 연구의 결과는 각 구단 및 타자들이 연봉협상에 임할 때 중요한 참고 자료가 될 수 있다고 판단된다.