• 제목/요약/키워드: baseball records

검색결과 26건 처리시간 0.021초

한국 프로스포츠 선수들의 연봉에 대한 다변량적 분석 (A Multivariate Analysis of Korean Professional Players Salary)

  • 송종우
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.441-453
    • /
    • 2008
  • 프로스포츠 선수들의 연봉은 선수들의 개인 성적과 팀에 대한 기여도 등으로 결정된다는 가정하에 프로농구와 프로야구 선수들의 전년도 성적으로 다음해 연봉을 예측 분석하였다. 분석에 있어서 data visualization 기법을 통해 변수사이의 관계, 이상점 발견, 모형진단등을 하였다. 다중선형회귀 모형(Multiple Linear Regression)과 트리모형(Regression Tree)을 이용해서 자료를 분석하고 모델간 비교를 했으며, Cross-Validation을 이용해서 최적모델을 선택하였다. 특히, 자동으로 변수선택을 하는 stepwise regression방법을 그냥 사용하기보다는 먼저 설명변수들 사이의 관계나 설명변수와 반응변수 사이의 관계등을 조사하고 나서 이를 통해 선택된 변수들을 가지고 stepwise regression과 regression tree 방법론을 이용해서 적절한 변수 및 최종 모형을 선택하였다. 분석결과, 프로농구의 경우에는 경기당 득점, 어시스트, 자유투 성공수, 경력 등이 중요한 변수였고, 프로야구 투수의 경우에는 경력, 9이닝 당 삼진 수, 방어율, 피홈런 수 등이 중요한 변수였고, 프로야구 타자의 경우에는 경력, 안타 수, FA(자유계약)유무 여부 등이 중요한 변수였다.

Differences between Japanese Characteristics and those of Europeans from the viewpoint of TQM: -Ways of thinking at the stage of design and/or development of new products-

  • Shingyouchi Kouji;Maruyama Yukio;Miyazu Takashi
    • 한국품질경영학회:학술대회논문집
    • /
    • 한국품질경영학회 1998년도 The 12th Asia Quality Management Symposium* Total Quality Management for Restoring Competitiveness
    • /
    • pp.37-42
    • /
    • 1998
  • In the 11th AQCS(1997), the paper entitled 'Statistical Analysis of Baseball Records - Jinx and National Characteristics -' was presented by the same authors. At that time, the differences between Japanese characteristics and those of Europeans, using baseball data were discussed, mainly from the viewpoint of 'ways of thinking about chance cause and assignable cause.' In this paper, the authors described also on the same subject from the different viewpoint, 'ways of thinking at the design and development stage of new products', From this viewpoint, the difference also be found. It seems that the most significant difference between Japan and Germany exists in the field of aeroplanes design. The German ideas in the field were very unique, therefore the authors classified and named their ideas as: A) 'Quantitative analysis' type idea, and B) 'Chemical synthetic' type idea. The former concept is composed of two ways of thinking: a) All parts essential for just flying must be used, but b) All other parts shall be rejected, as far as possible. The latter concept is that, the all additional parts necessary for the development of the above 'purified' original product should be added respectively, depending on the requests of customers. These ideas are outlined using the actual examples of German aeroplane.

  • PDF

89-92 한국 프로야구의 각 팀과 부문별 평균 성적에 대한 추가적 주성분분석의 응용 (Application of the supplementary principal component analysis for the 1982-1992 Korean Pro Baseball data)

  • 최용석;심희정
    • 응용통계연구
    • /
    • 제8권1호
    • /
    • pp.51-60
    • /
    • 1995
  • 크기가 $n \times p$인 자료행렬에서 p개의 변수들과 성격이 다소 다른 $p_s$개의 변수를 같이 고려한 크기가 $n \times (p + p_s)$ 자료행렬이 있다 하자. 전통적 주성성분분석은 성격이 다른 변수들로 인하여 효과적인 결과를 제공하지 못한다. 본 논문에서는 이런 점을 개선하기 위해서 성격이 다른 $p_s$개의 변수를 추가변수로 두는 추가적 주성분분석을 소개하려 한다. 이 기법은 전통적 주성분분석의 대수적,기하적인 면을 따른다. 그리고 전통적 주성분분석과 추가적 주성성분분석을 활용한 한국 프로야구의 8개팀과 1982-1992년 동안의 14개의 부문별 기록에 대한 전형적인 자료분석의 한 예를 제시한다. 더불어 두 분석의 결과도 비교하였다.

  • PDF

2016 KBO 최고 타자의 타격능력선수는? - 대체선수대비승수 (WAR)을 중심으로 (Top batter select through the BAI in 2016 KBO -Focusing on the sabermetrics statistics WAR)

  • 김현규;이제영;조규태
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권6호
    • /
    • pp.1501-1509
    • /
    • 2017
  • 야구선수들의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 대체선수대비승수 (WAR)은 가장 많이 사용되는 통계량이다. WAR의 장점은 투수와 타자처럼 서로 다른 포지션임에도 불구하고 선수들의 WAR을 비교할 수 있다는 점이다. 하지만 WAR은 복잡한 형태로 일반적으로 제공되는 기록만으로 구하기 어렵다. 따라서 지난 연구 (Lee와 Kim, 2016)에서는 2013-2015년 KBG 기록을 바탕으로 WAR에 가장 근접한 타자의 타격능력지수를 제안하였다. 본 논문에서는 제안된 모형을 바탕으로 2016년 KBO 데이터를 적용하여 2016년 최고타자를 선출하고, BAI에 따른 타자들의 전체 순위를 살펴보았다. 그리고 죄근 선수를 평가함에 있어 가장 각광받고 있는 WAR과 BAI의 비교를 통해 BAI가 매우 뛰어남을 확인하였다.

빅데이터를 활용한 타자의 장타력과 일일 평균 기온 간의 상관관계 분석 (Big Data Analysis of the Correlation between Average Daily Temperature and Batting Power)

  • 김세민;신좌철
    • 디지털융복합연구
    • /
    • 제18권8호
    • /
    • pp.225-230
    • /
    • 2020
  • KBO리그는 경기수가 많아서 오랜 기간에 걸쳐서 진행되고 있다. 또한 우리나라는 다양하고 뚜렷한 기후를 가지고 있다. 이에 본 연구에서는 야구기록 중 홈런, 3루타, 2루타, 루타수, 장타율, 순장타율 등 장타력에 관한 기록과 일일 평균 기온과의 상관 관계를 분석하고 야구 기록 중 3차 기록을 정의하였다. 본 연구를 위하여 일일 평균 기온 데이터와 2019년 KBO 리그에서 규정타석에 진입한 타자를 대상으로 SEMMA 기법을 통하여 상관관계를 분석하였다. 본 연구 결과를 통하여 일일 평균 기온이 타자들의 장타력에 영향을 주었다는 것을 알 수 있었다. 특히 20.0도에서 24.9도 사이를 기록한 날에 타자들의 장타력이 낮아졌다는 것을 알 수 있었으며, 타자가 상대하는 투수의 몸 상태와 관련있다고 논의하였다. 이에 경기 외적인 조건을 통하여 야구 경기에서 선수, 코칭스태프, 프런트가 경기에 활용할 수 있음을 기대할 수 있다. 또한 차후 타격 기록 뿐만 아니라 투구, 주루, 수비 등의 기록을 함께 분석하면 더욱 유용한 분석 모델이 될 수 있을 것으로 기대한다.

빅데이터를 활용한 타자의 출루 관련 경기력과 불쾌지수의 관계 분석 : 투구 수 유도와 출루율을 중심으로 (Analysis of the Relationship between a Batter's Performance and Discomfort Index using Big Data: focusing on the Number of Pitches and On Base Percentage)

  • 김세민;유강수
    • 산업융합연구
    • /
    • 제18권4호
    • /
    • pp.61-66
    • /
    • 2020
  • 최근 프로야구에서 데이터를 활용하여 경기, 시즌, 팀을 운영하려는 시도가 일반화 되고 있다. 이에 본 연구에서는 기상 응용 데이터인 불쾌지수와 같은 경기 외적인 요소를 야구 경기 기록을 수집하고 출루율과 투구 수 유도와의 관계를 분석하였으며 이를 3차 기록으로 정의하여 연구를 수행하였다. 불쾌지수가 75이상일 때 투수의 투구 수 유도가 많이 되었으며, 불쾌지수가 69.9 이하일 때는 출루율이 높게 나왔으나, 불쾌지수가 70이상 75미만일 때는 타자의 출루 관련 경기력이 가장 저조한 것으로 나타났다. 연구 결과를 통하여 불쾌지수와 타자의 출루율과 투구 유도 수는 관계가 있으며, 투수의 경기력과 관계있을 가능성이 높다고 유추할 수 있었다. 본 연구를 통하여 1차 기록이라 정의하는 누적·비율기록과 2차 기록이라 정의하는 세이버메트릭스에 이어서 경기 외적인 데이터를 연계하는 3차 기록으로 정의할 수 있는 가능성을 볼 수 있었다.