• 제목/요약/키워드: sabermetrics

검색결과 10건 처리시간 0.024초

한국 프로야구 선수들의 경기력과 연봉의 관계 분석 (A study on relationship between the performance of professional baseball players and annual salary)

  • 승희배;강기훈
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.285-298
    • /
    • 2012
  • 본 연구는 프로야구 선수들의 경기력을 세분화하고 섬세하게 측정 할 수 있는 세이버메트릭스 기법을 적용하여 한국 프로야구 8개 구단의 타자들을 대상으로 세이버메트릭스 지수를 통해서 알아본 선수들의 경기력과 연봉간의 패턴을 분석하고자 한다. 연구 방법으로는 한국 프로야구 8개 구단의 2009년, 2010년도 타자들의 경기 기록과 차년도 연봉 자료를 수집한 후, 세이버메트릭스 지수를 계산하여 연봉과의 관계를 주성분분석을 통해 살펴보았다. 각 구단별로 일부 상이한 결과도 있었지만 전반적으로는 경기력이 높은 선수들에게 많은 연봉이 지급되고 있음을 확인하였다. 본 연구의 결과는 각 구단 및 타자들이 연봉협상에 임할 때 중요한 참고 자료가 될 수 있다고 판단된다.

2016 KBO 최고 타자의 타격능력선수는? - 대체선수대비승수 (WAR)을 중심으로 (Top batter select through the BAI in 2016 KBO -Focusing on the sabermetrics statistics WAR)

  • 김현규;이제영;조규태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1501-1509
    • /
    • 2017
  • 야구선수들의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 대체선수대비승수 (WAR)은 가장 많이 사용되는 통계량이다. WAR의 장점은 투수와 타자처럼 서로 다른 포지션임에도 불구하고 선수들의 WAR을 비교할 수 있다는 점이다. 하지만 WAR은 복잡한 형태로 일반적으로 제공되는 기록만으로 구하기 어렵다. 따라서 지난 연구 (Lee와 Kim, 2016)에서는 2013-2015년 KBG 기록을 바탕으로 WAR에 가장 근접한 타자의 타격능력지수를 제안하였다. 본 논문에서는 제안된 모형을 바탕으로 2016년 KBO 데이터를 적용하여 2016년 최고타자를 선출하고, BAI에 따른 타자들의 전체 순위를 살펴보았다. 그리고 죄근 선수를 평가함에 있어 가장 각광받고 있는 WAR과 BAI의 비교를 통해 BAI가 매우 뛰어남을 확인하였다.

한국프로야구에서 선발투수의 투수능력지수 제안 - 대체선수대비승수 (WAR)을 중심으로 (Suggestion of starting pitcher ability index in Korea baseball - Focusing on the sabermetrics statistics WAR)

  • 김현규;이제영
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권4호
    • /
    • pp.863-874
    • /
    • 2017
  • 야구선수들의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 대체선수대비승수 (WAR)은 가장 많이 사용되는 통계량이다. WAR의 장점은 투수와 타자처럼 서로 다른 포지션임에도 불구하고 선수들의 WAR을 비교할 수 있다는 점이다. 하지만 WAR은 복잡한 형태로 일반적으로 제공되는 기록만으로 구하기 어렵다. 따라서 본 논문에서는 지난 3년간 (2014-2016년) 한국프로야구 기록 자료를 바탕으로 세이버메트릭스 변수를 계산한 뒤, 이를 이용하여 WAR을 대체할 수 있는 선발투수능력지수를 제안한다. 선발투수능력지수는 산술평균방법, 가중평균방법, 주성분회귀분석 등을 통해 산출한 뒤, WAR과 비교하여 가장 관계가 높은 방법을 선택하였다. 이는 선발투수의 능력을 파악하는데 유용하게 사용될 것이다.

한국프로야구에서 타자능력지수 제안 - 대체선수대비승수(WAR)을 중심으로 (Suggestion of batter ability index in Korea baseball - focusing on the sabermetrics statistics WAR)

  • 이제영;김현규
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1271-1281
    • /
    • 2016
  • 야구에서 타자의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 대체선수대비승수(wins above replacement; WAR)은 가장 많이 쓰이는 통계량이다. WAR은 선수의 공격능력과 주루능력, 수비능력 등을 하나의 수치로 표현하는 방법이란 점에서 큰 장점을 가지고 있다. 본 논문에서는 지난 3년간(2013-2015년) 한국프로야구 기록 자료를 바탕으로 세이버메트릭스 변수들의 값을 구한 뒤, 이를 이용하여 WAR을 대체할 수 있는 타자능력지수를 제안하였다. 타자능력지수는 산술평균방법, 가중평균방법, 주성분회귀분석 등을 통해 산출하고 WAR과 비교하여 가장 관계가 높은 방법을 선택하였다.

A Win/Lose prediction model of Korean professional baseball using machine learning technique

  • Seo, Yeong-Jin;Moon, Hyung-Woo;Woo, Yong-Tae
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권2호
    • /
    • pp.17-24
    • /
    • 2019
  • In this paper, we propose a new model for predicting effective Win/Loss in professional baseball game in Korea using machine learning technique. we used basic baseball data and Sabermetrics data, which are highly correlated with score to predict and we used the deep learning technique to learn based on supervised learning. The Drop-Out algorithm and the ReLu activation function In the trained neural network, the expected odds was calculated using the predictions of the team's expected scores and expected loss. The team with the higher expected rate of victory was predicted as the winning team. In order to verify the effectiveness of the proposed model, we compared the actual percentage of win, pythagorean expectation, and win percentage of the proposed model.

고차원 대용량 자료분석의 현재 동향 (Current trends in high dimensional massive data analysis)

  • 장원철;김광수;김정연
    • 응용통계연구
    • /
    • 제29권6호
    • /
    • pp.999-1005
    • /
    • 2016
  • 빅 데이터의 출현은 여러가지 과학적 난제에 대답 할 수 있는 기회를 제공하지만 흥미로운 도전을 또한 제공한다. 이러한 빅데이터의 주요 특징으로 "고차원"과 "대용량"을 들 수가 있다. 본 논문은 이러한 두 가지 특징에 동반되는 다음과 같은 도전문제에 대한 개요를 제시한다 : (1) 고차원 자료에서의 소음 축적과 위 상관 관계; (ii) 대용량 자료분석을 위한 계산 확장성. 또한 본 논문에서는 재난예측, 디지털 인문학과 세이버메트릭스 등 다양한 분야에서 빅 데이터의 다양한 응용사례를 제공한다.

한국프로야구에서 타자능력의 측정 (Measurements for hitting ability in the Korean pro-baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권2호
    • /
    • pp.349-356
    • /
    • 2014
  • 타자들의 평가에 대한 불완전한 부분을 보완하기 위하여 세이버메트리션들이 세워놓은 기준들이 선수 평가에 중요한 잣대가 되고 있다. 하지만 평가지표들은 개수가 많고 형태가 일정하지 않아서 팬들을 혼동에 빠지게 한다. 본 연구에서는 대표적인 타자평가지표를 이용하여 지표들의 특성을 골고루 반영하는 주성분을 찾아보고 한국프로야구에 적합한 타자지표를 제안한다. 제안된 지표는 타자들의 능력을 그룹화하여 객관적으로 설명할 수 있기 때문에 선수들의 연봉을 합리적으로 결정할 수 있다.

시뮬레이션을 통한 프로야구 타자들의 공격능력의 종합적인 평가 (Comprehensive evaluation of baseball player's offensive ability by use of simulation)

  • 김남기;김선호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권4호
    • /
    • pp.865-874
    • /
    • 2015
  • 본 연구에서는 시뮬레이션을 활용하여 타자의 공격능력, 즉 타자로서의 타격능력과 주자로서의 주루능력을 포괄하는 득점생산능력을 종합적으로 평가한다. 이를 위하여, 각 타자의 스코어링 인덱스를 구하는데, 여기서 스코어링 인덱스란 한 팀의 모든 타자가 동일한, 한 선수로만으로 구성되었을 때, 기대되는 경기당 득점이다. 시뮬레이션 입력으로는 2014시즌 한국 프로야구 데이터를 사용하였는데, 주요 출력결과로서 상위 10명의 타자들의 스코어링 인덱스 및 9개 구단과 2014시즌 한국 프로야구의 스코어링 인덱스를 제시한다. 이렇게 구한 스코어링 인덱스는 타자 및 팀의 공격능력의 종합적인 평가뿐만 아니라, 대표선수 및 선발타자의 선정, 선수들의 연봉의 책정 등에도 활용될 수 있을 것이다.

한국프로야구에서 투수 연봉에 영향을 주는 요인 (Analysis of factors affecting Korean professional baseball pitcher salaries)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권2호
    • /
    • pp.317-326
    • /
    • 2017
  • 한국프로야구에서 투수들의 연봉을 결정하는 중요한 요인들을 선형회귀모형을 통해서 살펴본다. 제안된 모형을 이용하여 투수들의 경기력과 연봉간의 패턴을 분석할 수 있으며, 구단 별로 차이점도 알 수 있다. 사용된 데이터는 2010년부터 2015년까지의 투수 기록과 다음 해의 연봉 자료를 이용하였으며, 고려된 설명변수들은 해당연도, 팀의 종류, 게임 수, 평균자책점, 수비무관 평균자책점, 이닝당 안타 및 볼넷 허용률, 대체선수 대비 승리기여도, 선발출장 게임의 수, 승, 패, 세이브, 투구 이닝수, 자유계약선수 여부, 나이, 경험연수이며 반응변수로는 연봉에 로그를 취한 로그연봉을 사용하였다. 그 결과 선발투수이며 경기수가 많고 승수가 많은 투수들에게 많은 연봉이 지급되고 있고 투수의 고유능력을 평가할 수 있는 기록들은 반영이 작게 되고 있음을 확인할 수 있었으며 연구의 결과는 연봉 결정에 중요한 참고자료로 활용될 수 있을 것으로 간주된다.

한국프로야구에서 타자력 지수 제안 (Alternative hitting ability index for KBO)

  • 홍종선;김재영;신동식
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.677-687
    • /
    • 2016
  • 야구 타자의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 WAR은 미국프로야구에서 가장 많이 사용하는 통계량이다. 그러나 한국프로야구 자료에는 수비에 관련된 변수에 포함된 야구장 요인, 포지션조정 그리고 리그 조정 통계량들이 존재하지 않으므로 WAR을 한국프로야구에 적용하는 데에는 문제가 있다. 본 연구에서는 타자의 능력을 측정하는 대안적인 세이버메트릭스 통계량을 제안하여 미국프로야구 뿐만 아니라 한국프로야구에서도 동시에 사용할 수 있도록 한다. 본 연구에서 제안한 타자력 지수 모형은 한국프로야구와 미국프로야구 타자들에 대한 다섯 종류의 통계량을 사용하여 개발한다. 우선 2015년도 최소 규정 타석을 만족한 미국프로야구 타자들의 자료를 바탕으로 타자력 지수 모형을 개발한다. 미국프로야구 타자들의 WAR과 비교하면서 본 연구에서 제안한 타자력 지수의 능력의 타당성을 검토한다. 다음으로 이 모형을 2015년도 한국프로야구 자료에 적용하여 한국형 타자력 지수를 제안한다. 한국프로야구 타자력 지수를 서로 다른 팀별, 나이별, 포지션별로 통계적으로 분석하고, 타자력 지수와 그들의 연봉과의 선형관계성을 토론한다. 연봉에 관한 회귀모형의 신뢰영역을 바탕으로 연봉책정의 적절함에 따라 46명의 타자를 세 그룹으로 할당하고, 세 그룹에 속한 연봉을 다양한 인자에 대하여 통계적으로 탐색한다.