• 제목/요약/키워드: Baseball Data Analysis

검색결과 81건 처리시간 0.021초

범주형 시계열 자료의 군집화: 프로야구 자료의 사례 연구 (Categorical time series clustering: Case study of Korean pro-baseball data)

  • 박노진
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권3호
    • /
    • pp.621-627
    • /
    • 2016
  • 범주형 시계열 자료의 군집화에 대하여 정리해 보았다. 시계열 자료의 군집화는 일반적인 군집화에 시간을 고려해야하는 측면이 있다. 한편, 범주형 시계열 자료의 군집화에 대한 연구가 진행되었으나 현재 정리 요약된 국내외 논문을 찾기 어렵다. 본 논문에서는 범주형 시계열을 군집화 하는 몇 가지 방법들을 제시하고 그 방법들을 비교하기 위해 프로야구 데이터를 이용하였다. 프로야구 팀들 간에 어떤 팀이 특정 팀에 유독 약한 경기력을 보이는 경우가 있다. 국내 최강이라는 S팀이 유독 H팀에게 그런 경우가 그렇다. 2015년 S팀의 상대전적의 군집화를 통해 S팀과 H팀의 관계가 유별난 지를 밝히려 한다. 통계적으로 말하자면, 승/패로 이루어진 시계열 자료의 군집화를 수행하려는 것이다. 분석결과 S팀과 H팀과의 관계가 다른 팀들과의 관계에 비해 눈에 띠는 차이가 있음을 알 수 있었다.

야구 다리보호대 디자인을 위한 착용실태 및 착용감, 운동기능성, 3D 형태분석 (Analysis of Wearing Propensities, Wearing Comfort, Mobility of Movement, and 3D Shape for Advanced Baseball Leg Guards Design)

  • 이효정;엄란이;이예진
    • 한국의류학회지
    • /
    • 제39권1호
    • /
    • pp.63-76
    • /
    • 2015
  • This study conducted a survey to gauge the buying and wearing propensities of wearers of leg guards made for baseball catchers, as well as product characteristics of preferred leg guards. Data from the survey were analyzed to obtain basic data for the development of an advanced leg guard design. Degree of compression, horizontal distance, cross section view and outline 3D sketch were also analyzed from the 3D data of leg guards; in addition, mobility and kinematic analysis were conducted through a wearing test. The survey indicated that imported products dominate the current retail market because they are appreciated by customers in terms of fit, price, brand, and protection. Representative complaints of products were discomfort, pressure, and the heavy-weight of the leg guards in general attributed to overall structure and 3D shape. When the pressure was lower on the front area of knee, it feels better to wear and the average knee angular velocity during the up and down motion increased, which suggests a better design from a kinematic point of view. The knee is the primary part of the body responsible for any movement of the lower limbs; consequently, the degree of compression and support stability of the leg guards near the knee area are important factors to evaluate the performance of leg guards. The results of our study indicate significant opportunities for improvement in product design and the development of baseball leg guards along with an ergonomic design that considers the mobility of the knee, skin deformations is necessary to improve performance. The process followed in this study will be applicable to studies on other personal protective equipment for sports.

머신러닝을 이용한 골든글러브 수상 요인 분석에 대한 연구 (A Study on the Analysis of Factors for the Golden Glove Award by using Machine Learning)

  • 엄대엽;김성용
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.48-56
    • /
    • 2022
  • 야구에서 데이터분석의 중요성은 점점 더 커지고 있는데, 이는 Billy Beane의 머니볼 이론을 적용한 MLB의 오클랜드 구단과 2020년 KBO 우승팀인 NC다이노스의 사례에서도 알 수 있다. 미국 뿐 만 아니라 우리나라에서도 데이터를 이용한 다양한 연구이 이루어지고 있는데, 특히 경기의 승패를 예측하기 딥러닝 및 머신러닝을 이용한 연구가 활발하게 진행되고 있다. 그러나 기존 연구의 경우 경기 승패 예측에 초점이 맞추어져 있으며, 어떠한 요인이 경기에 중요한 영향을 주었는지에 대한 결과 해석이 어렵다는 한계점이 존재한다. 이에 따라 본 논문에서는 포지션별 최고의 선수에게 수여되는 골든글러브 수상 예측 모형을 개발하고, 어떠한 요인이 수상에 영향을 주는지를 파악함으로써, 우수한 선수로 구분되는 척도를 찾고자 한다. 분석 모형으로는 Boosting 기법 중의 하나인 XGBoost를 이용하였으며, 어떠한 요인이 골든글러브 수상에 중요한 영향을 주었는지 파악하기 위하여 XGBoost의 변수 중요도를 이용하였다. 이와 같은 분석을 통해 각 포지션별 중요한 지표를 파악할 수 있었다.

한국 프로야구 구단의 상대적 효율성 및 생산성 변화 (Productivity Change and Relative Efficiency of Korean Professional Baseball Teams)

  • 원도연;강호정;황선환
    • 한국콘텐츠학회논문지
    • /
    • 제12권8호
    • /
    • pp.330-342
    • /
    • 2012
  • 모기업 지원과 관중 증가 등에 힘입어 최근 3년간 프로야구 구단들의 평균 매출액은 꾸준히 증가하는 추세에 있다. 그럼에도 불구하고 선수단 운영비등의 비용 증가분을 따라가지 못해 대부분의 프로야구 구단들은 경영상태가 좋지 않기 때문에 효율성 제고가 필요하다. 본 연구는 DEA 모형과 Malmquist Index를 이용하여 2006년부터 2008년까지의 한국 프로야구 구단들의 상대적 효율성과 생산성 변화를 측정하였으며, 본 연구결과는 다음과 같다. 첫째, 규모의 수익불변을 가정하는 CCR 효율성 결과는 2006년의 경우 효율적인 프로구단은 두산베어스와 삼성라이온즈, 2007년의 경우 효율적인 프로구단은 두산베어스와 SK와이번스, 2008년의 경우 효율적인 프로구단은 롯데자이언츠와 LG트윈스로 나타났다. 둘째, 규모의 수익가변을 가정하는 BCC 효율성 결과는 2006년의 경우 효율적인 프로구단은 두산베어스와 삼성라이온즈 및 LG트윈스, 2007년의 경우 효율적인 프로구단은 SK와이번스, 두산베어스, 삼성라이온즈와 KIA타이거즈, 2008년의 경우 효율적인 프로구단은 롯데자이언츠, LG트윈스, SK와이번스, 삼성라이온즈로 나타났다. 셋째, 생산성 변화결과를 살펴보면 2006-2007 기간의 Malmquist Index의 평균은 1.0615, 2007-2008 기간의 Malmquist Index의 평균은 1.0293으로 나타나 생산성 향상을 보였다.

한국프로야구에서 타자능력지수 제안 - 대체선수대비승수(WAR)을 중심으로 (Suggestion of batter ability index in Korea baseball - focusing on the sabermetrics statistics WAR)

  • 이제영;김현규
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1271-1281
    • /
    • 2016
  • 야구에서 타자의 능력을 측정하는 많은 세이버메트릭스 통계량들 중에서 대체선수대비승수(wins above replacement; WAR)은 가장 많이 쓰이는 통계량이다. WAR은 선수의 공격능력과 주루능력, 수비능력 등을 하나의 수치로 표현하는 방법이란 점에서 큰 장점을 가지고 있다. 본 논문에서는 지난 3년간(2013-2015년) 한국프로야구 기록 자료를 바탕으로 세이버메트릭스 변수들의 값을 구한 뒤, 이를 이용하여 WAR을 대체할 수 있는 타자능력지수를 제안하였다. 타자능력지수는 산술평균방법, 가중평균방법, 주성분회귀분석 등을 통해 산출하고 WAR과 비교하여 가장 관계가 높은 방법을 선택하였다.

인경신경망을 이용한 한국프로야구 관중 수요 예측에 관한 연구 (A Study on Prediction of Attendance in Korean Baseball League Using Artificial Neural Network)

  • 박진욱;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권12호
    • /
    • pp.565-572
    • /
    • 2017
  • 본 연구는 기존의 수요 예측 등의 시계열 연구에서 주로 사용되는 ARIMA 모형의 어려움을 극복하고자 인공신경망(Artificial neural network) 모형을 이용하여 한국 프로 야구 관중 수를 예측하였다. 훈련 자료로는 2015년 3월부터 9월까지의 일별 KBO 관중 수 자료를 대상으로 하였다. 전방향 신경망(Feedforward neural network)의 모형 훈련 과정에서, 그리드 탐색(Grid search)을 적용하여 최적의 초모수(Hyperparameter)를 찾고자 하였다. 그 결과, 그리드 탐색법의 최적 모형을 이용한 평균 절대 백분율 오차(MAPE)는 평균 20.9% 였다. 앙상블 기법을 이용한 모형의 MAPE는 평균 20.0%였다. 이는 다중회귀와 비교해보았을 때, 평균적으로 각각 26.3%, 30.3% 높은 예측력을 보인다.

프로야구 활성화를 위한 구단과 관중의 정서적 연대에 관한 연구 (A Study on the Emotional Solidarity of the Club and the Spectators for the Activation of Professional Baseball)

  • 김진국;양성철
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제13권7호
    • /
    • pp.261-272
    • /
    • 2019
  • 본 연구는 프로야구 관중의 구단과 자아이미지 일치성이 구단 충성도에 미치는 영향에서 정서적 유대감의 조절효과를 규명하여 구단과 관중의 정서적 유대감의 효과성을 제고하고, 구단의 브랜드 마케팅 전략 수립에 시사점을 제시하는 데 그 목적이 있다. 이를 위해 프로야구 관람객 500명을 대상으로 설문조사를 수행하였고, 450부의 수집된 자료를 기초로 SPSS 21.0을 이용하여 상관관계분석, 단계적 회귀분석 및 위계적 회귀분석을 실시한 결과는 다음과 같다. 첫째, 프로야구 관중과 구단의 자아이미지 중 현실적 자아이미지 요인이 구단 충성도에 유의미한 영향을 주는 것으로 나타났다. 둘째, 현실적 자아이미지 일치성이 구단 충성도에 미치는 영향에서 현실적 자아이미지 일치성이 조절되는 것으로 확인되었다. 이러한 결과는 정서적 유대감 형성이 이상적 자아이미지 일치성에는 영향력이 없고, 현재 구단이 보여주고 있는 현실적 자아이미지와 관련이 있음을 실증하였기 때문에 이러한 점들을 고려하여 보다 이러한 효과가 부각될 수 있는 마케팅 전략 수립이 필요할 것으로 판단된다.

Sport and Culture: Application of Traditional and Contemporary Content

  • CHANG, Deok Seon;KIM, Hae Yu;LEE, Hyuk Jin
    • Journal of Sport and Applied Science
    • /
    • 제5권2호
    • /
    • pp.1-7
    • /
    • 2021
  • Purpose: This study started with an interest in sports culture-related content and aims to comprehend the application of traditional and contemporary cultural content to sport business. Research design, data, and methodology: The current study reviews related-documents, research papers, media reports, and a secondary data. The collected data were multiple reviewed via content analysis. Results: Findings are as follow. First, the study found that sports is born in religious rituals which are associated with human needs for survival and prosperity. Second, sports is sort of official format that inherent desire of human could be satisfied, representing play and game. Third, the current study discovered that sports could be cultural products such as literature and film. This is because sport has often been used as major themes in contemporary art production. Finally, this study included important cultural content categories, but could not cover all categories due to the limitations of the study. Conclusions: this study reviewed multiple literature to decode historical and anthropological meanings of sport. The finding presents the cultural traits and meaning of contemporary sport. Further implications were discussed.

프로야구 코치-선수관계 유지 척도 재검증 (Reexamination of Coach-Athlete Relationship Maintenance Scale in Pro Baseball)

  • 허진영;최헌혁
    • 한국체육학회지인문사회과학편
    • /
    • 제55권1호
    • /
    • pp.221-233
    • /
    • 2016
  • 본 연구는 Rhind & Jowett(2012)이 개발한 코치-선수관계 유지 척도(CARM-Q)를 국내 프로 스포츠 상황에서 활용될 수 있도록 프로야구 코치-선수관계 유지 척도를 재검증하는 것이다. 1차 예비조사는 2014년 국내 프로야구 1군에 등록된 프로야구 코치(29명)와 선수(103명) 총 132명을 대상으로 코치-선수관계 유지에 대한 자료를 수집하였다. 수집된 자료는 최대우도추정법을 사용하여 잠재적 기본구조를 확인하였다. 코치-선수관계 유지 척도의 타당도를 검증하기 위해 최종 273명(코치 62명과 선수 211명)을 연구대상자로 선정하였다. SPSS 18.0과 AMOS 16.0 프로그램을 이용하여 탐색적 요인분석(EFA), 확인적 요인분석(CFA), 내적일관성, 검사-재검사 신뢰도 분석 그리고 상관관계 분석을 통해 6요인 25문항 프로야구 코치-선수관계 유지 척도가 완성되었다. 분석결과 6요인으로 구성된 한국형 프로야구 코치-선수관계 유지 척도가 재검증되었다. 전반적으로 본 연구에서 확인된 프로야구 코치-선수관계 유지 척도를 다 집단 분석을 통해 드림과 나눔 팀, 또는 1군과 2군 간 경로의 차이를 비교하여 결과를 제공해 보는 것도 의미가 있을 것이다.

한국 프로스포츠 선수들의 연봉에 대한 다변량적 분석 (A Multivariate Analysis of Korean Professional Players Salary)

  • 송종우
    • 응용통계연구
    • /
    • 제21권3호
    • /
    • pp.441-453
    • /
    • 2008
  • 프로스포츠 선수들의 연봉은 선수들의 개인 성적과 팀에 대한 기여도 등으로 결정된다는 가정하에 프로농구와 프로야구 선수들의 전년도 성적으로 다음해 연봉을 예측 분석하였다. 분석에 있어서 data visualization 기법을 통해 변수사이의 관계, 이상점 발견, 모형진단등을 하였다. 다중선형회귀 모형(Multiple Linear Regression)과 트리모형(Regression Tree)을 이용해서 자료를 분석하고 모델간 비교를 했으며, Cross-Validation을 이용해서 최적모델을 선택하였다. 특히, 자동으로 변수선택을 하는 stepwise regression방법을 그냥 사용하기보다는 먼저 설명변수들 사이의 관계나 설명변수와 반응변수 사이의 관계등을 조사하고 나서 이를 통해 선택된 변수들을 가지고 stepwise regression과 regression tree 방법론을 이용해서 적절한 변수 및 최종 모형을 선택하였다. 분석결과, 프로농구의 경우에는 경기당 득점, 어시스트, 자유투 성공수, 경력 등이 중요한 변수였고, 프로야구 투수의 경우에는 경력, 9이닝 당 삼진 수, 방어율, 피홈런 수 등이 중요한 변수였고, 프로야구 타자의 경우에는 경력, 안타 수, FA(자유계약)유무 여부 등이 중요한 변수였다.