• 제목/요약/키워드: Baseball Data Analysis

검색결과 81건 처리시간 0.024초

한국프로농구구단의 생산성분석: DEA를 중심으로 (A Productive Analysis of Sports Organizations in Korean Basketball League: Focused on DEA)

  • 김선민
    • 대한안전경영과학회지
    • /
    • 제15권2호
    • /
    • pp.255-262
    • /
    • 2013
  • Due to the competition between the various professional events, it is imperative for the team's management to improve efficiency by removing the inefficiencies of the professional team in order to gain a competitive edge. This study use different Data Envelopment Analysis (DEA) models to measure the efficiency of professional sport organizations. In this mathematical-analytical study, this study first reviews the related literature to analyze the input/output variables. In the end, the variables were detected and the data for this study were gathered from the Korean Basketball League (KBL). While previous studies examine relative efficiency of Korean Professional baseball teams by using CCR model, this study fully utilize the DEA method to investigate Korean professional sports organizations' operating problem. Thus, this study propose full results of DEA analysis such as efficiency score (overall, technical, and scale efficiency), slacks in inputs and outputs of inefficient organizations, Malmquist index) As a result, this study provides not only the exact productivity information of a team and a way of improving a firm's productivity with a decision maker.

빅데이터 분석과 게임이론을 활용한 야구선수 영입 모델 (Baseball Player Scouting Model using Big Data Analysis and Game Theory)

  • 김윤후;김상헌;최형준;정재은
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.321-322
    • /
    • 2018
  • 빅데이터 분석은 스포츠에서 다양한 분야에서 사용되고 있다. 야구산업에서도 세이버 메트릭스를 활용하여 전술 훈련, 개인 훈련 등 다양한 방면으로 활용되고 있다. 본 논문에서는 기존의 연구인 빅데이터 분석과 게임이론을 활용한 축구선수 영입 모델을 야구에 적용킨 시뮬레이션을 진행하고 합리적인 의사결정 모델을 제안한다.

  • PDF

한국 프로야구에서 수정된 WHIP와 피홈런 수를 결합한 실점 설명 수비지표들 (Fielding indices for explaining runs lost combining adjusted WHIP and the number of home runs allowed in Korean professional baseball)

  • 김혁주
    • 응용통계연구
    • /
    • 제29권7호
    • /
    • pp.1283-1294
    • /
    • 2016
  • 한국 프로야구팀들의 실점을 설명하기 위한 수비지표를 연구하였다. 출루율과 장타율을 결합한 OPS가 팀들의 득점력을 매우 잘 설명한다는 사실을 동기로 하여 본 논문에서는 팀들의 실점을 설명하기 위한 수비지표를 연구하였다. 여러 가지의 수비지표 중 팀의 실점과 상관관계가 높은 것들을 결합하여 만든 몇 가지의 결합 지표들을 고려하였다. 프로야구 원년인 1982년부터 2015년까지의 정규리그 전 경기 자료를 분석한 결과 수정WHIP와 이닝당피홈런의 가중평균으로 정의되는 가중수정WPH2가 실점을 가장 잘 설명해줬다. 구체적으로 수정WHIP에 34%, 이닝당피홈런에 66%의 가중값을 두는 가중수정WPH2가 팀의 경기당 평균실점과 0.95362의 상관계수를 갖는 최적의 지표인 것으로 나타났다. 이 결과는 Kim과 Kim (2015a)에서 얻어진 지표에 의한 결과보다 좀 더 향상된 결과이다. 시대별 분석에서도 크게 다르지 않은 결과를 얻었다. 또한 얻어진 지표의 값이 좋은 투수 10명씩의 명단을 최근 3년간에 대해 연도별로 작성해보았다.

결합된 수비지표들을 이용한 한국 프로야구의 실점 설명 (Explanation of Runs Lost Using Combined Fielding Indices in Korean Professional Baseball)

  • 김혁주;김예형
    • 응용통계연구
    • /
    • 제28권5호
    • /
    • pp.1003-1011
    • /
    • 2015
  • 한국 프로야구에서 팀들의 실점을 설명하기 위한 지표를 연구하였다. Kim과 Kim (2014)이 팀들의 득점력을 설명하기 위한 공격지표를 연구한 것과 유사하게 본 논문에서는 팀들의 실점을 설명하기 위한 수비지표를 연구하였다. 여러 가지의 수비지표 중 팀의 실점과 관련이 큰 것들을 결합하여 만든 몇 가지의 결합지표들을 고려하였다. 프로야구 원년인 1982년부터 2014년까지의 정규리그 전 경기 자료를 분석한 결과 WHIP와 경기당피홈런의 가중평균으로 정의되는 가중WPH가 실점을 가장 잘 설명해줬다. 구체적으로 WHIP에 81%, 경기당피홈런에 19%의 가중값을 주는 가중WPH가 팀의 평균실점과 0.95033의 상관계수를 갖는 최적의 가중WPH인 것으로 나타났다. 시대별 분석에서도 크게 다르지 않은 결과를 얻었다.

빅데이터를 활용한 타자의 출루 관련 경기력과 불쾌지수의 관계 분석 : 투구 수 유도와 출루율을 중심으로 (Analysis of the Relationship between a Batter's Performance and Discomfort Index using Big Data: focusing on the Number of Pitches and On Base Percentage)

  • 김세민;유강수
    • 산업융합연구
    • /
    • 제18권4호
    • /
    • pp.61-66
    • /
    • 2020
  • 최근 프로야구에서 데이터를 활용하여 경기, 시즌, 팀을 운영하려는 시도가 일반화 되고 있다. 이에 본 연구에서는 기상 응용 데이터인 불쾌지수와 같은 경기 외적인 요소를 야구 경기 기록을 수집하고 출루율과 투구 수 유도와의 관계를 분석하였으며 이를 3차 기록으로 정의하여 연구를 수행하였다. 불쾌지수가 75이상일 때 투수의 투구 수 유도가 많이 되었으며, 불쾌지수가 69.9 이하일 때는 출루율이 높게 나왔으나, 불쾌지수가 70이상 75미만일 때는 타자의 출루 관련 경기력이 가장 저조한 것으로 나타났다. 연구 결과를 통하여 불쾌지수와 타자의 출루율과 투구 유도 수는 관계가 있으며, 투수의 경기력과 관계있을 가능성이 높다고 유추할 수 있었다. 본 연구를 통하여 1차 기록이라 정의하는 누적·비율기록과 2차 기록이라 정의하는 세이버메트릭스에 이어서 경기 외적인 데이터를 연계하는 3차 기록으로 정의할 수 있는 가능성을 볼 수 있었다.

한국 프로야구에서 가중수정OPS를 이용한 득점력 설명 (Explanation of Run Productivity Using Weighted Adjusted OPS in Korean Professional Baseball)

  • 김혁주;김예형
    • 응용통계연구
    • /
    • 제27권5호
    • /
    • pp.731-741
    • /
    • 2014
  • 한국 프로야구에서 장타율과 수정된 출루율을 이용하여 팀의 득점력을 설명하기 위한 지표인 수정OPS와 가중수정OPS를 제시하였다. 먼저 현재 사용되고 있는 출루율을 수정한 수정출루율을 정의하였으며, 수정OPS를 수정출루율과 장타율의 합으로, 가중수정OPS를 수정출루율과 장타율의 가중평균으로 정의하였다. 한국 프로야구 원년인 1982년부터 2013년까지의 정규리그 전 경기 자료를 분석한 결과 수정OPS는 기존의 OPS보다 득점력을 더 잘 설명해 줬다. 연도별 비교에서도 전체 32개 시즌 중 25개의 시즌에서 수정OPS가 기존의 OPS보다 득점력을 더 잘 설명했다. 32개 시즌의 자료를 종합한 결과 수정출루율에 60%, 장타율에 40%의 가중값을 주는 가중수정OPS가 팀의 득점력을 가장 잘 설명하는 타격지표인 것으로 밝혀졌다. 이 가중수정OPS는 Kim (2012)에서 제시된 가중OPS보다도 더욱 높은 설명력을 갖는 것으로 밝혀졌다.

고등학교 야구선수들의 신체정렬과 족저압 분포 간의 상관관계 분석 (Correlation between body alignment and foot pressure in high School Baseball Players)

  • 박치복;정호진;박성환
    • 한국산학기술학회논문지
    • /
    • 제20권12호
    • /
    • pp.224-229
    • /
    • 2019
  • 본 연구는 고등학교 야구선수를 대상으로 신체정렬과 족저압 분포 분석하여 올바른 자세지도와 스포츠 손상 및 부상 예방 프로그램에 참고 자료를 제공하는데 그 목적이 있다. 연구 대상자 32명을 대상으로 실시하였다. 신체정렬은 척추에서 몸통의 좌우기울기, 등뼈의 뒤굽음각, 허리뼈의 앞굽음각, 골반에서는 골반의 기울기, 골반의 뒤틀림을 측정하였고 족저압은 각 발의 좌우 체중분포, 각 발의 최대압력을 측정하였다. 측정항목에 대한 평균과 표준편차를 산출하여 도표화하였고, 신체정렬과 족저압 분포의 상관관계를 알아보기 위해 pearson's cerrelation analysis를 사용하여 분석하였다. 모든 통계학적 유의 수준은 0.05로 설정하였다. 신체정렬과 족저압 분포 간의 상관관계를 분석한 결과 척추에서 허리뼈의 앞굽음각과 좌우 최대압력에서 양의 상관관계가 나타났다. 몸통의 좌우기울기, 등뼈의 뒤굽음각, 골반의 기울기, 골반의 뒤틀림과 각 발의 좌우 체중분포, 각 발의 최대압력에서는 상관관계가 나타나지 않았다. 본 연구를 통해 허리뼈의 앞굽음각이 증가될수록 발의 한쪽에 힘이 더 실리게 되어 최대압력이 증가하는 양의 상관관계를 나타내는 것을 알 수 있었다. 향후 운동선수들의 신체정렬과 족저압 분포에 대한 운동프로그램의 참고 자료가 될 것으로 사료된다.

연결망분석과 초효율성분석의 결합을 통한 효율성 순위 측정에 관한 고찰 (A Reviews on the Performance Evaluation Based on Network Analysis and Super-Efficiency Analysis)

  • 최경호;곽희종
    • 디지털융복합연구
    • /
    • 제11권10호
    • /
    • pp.255-262
    • /
    • 2013
  • 자료포락분석(DEA)은 다수의 투입요소와 산출요소에 대하여 의사결정단위의 효율성을 측정하는 비모수적인 선형계획방법으로, 회사, 은행, 병원, 국가나 조직의 효율성이나 성과를 비교하는데 폭넓게 사용되고 있다. 그런데 DEA는 효율성이 1인 DMU들이 다수 있을 때 어느 DMU가 더 나은지에 대한 순위는 제공해 주지 않는다. 본 연구에서는 이런 문제를 기존의 방법에 비하여 손쉽게 해결할 수 있는 방법으로 질적(덴드로그램과 같은 graphical 접근법) 양적(초효율성 분석) 통합방법을 제안하고, 한국프로야구 자료를 이용하여 실증분석 해보았다. 그 결과 DEA를 통해서는 우선순위를 파악하기 어려운 DMU들이 12개나 되었는데, 초효율성 분석을 이용함으로써 이러한 문제를 해결할 수 있었다. 더불어 덴드로그램과 초효율성 분석 결과를 통합하여 질적 양적으로 조망해 봄으로써 더욱 심도 있는 해석이 가능함을 알 수 있었다.

빅데이터 분석 기반 자동 야구기사작성 로봇 개발 (Development of Automatic Robot for Writing Baseball Articles Based on BigData Analysis)

  • 채병주;박경철;권태정;김상환;김영준;이동규;김병규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1622-1624
    • /
    • 2015
  • 세계적으로 자동기사 작성 시스템을 적용한 사례가 증가하는 가운데 미국의 LA 타임스가 2013년에 지진 속보 기사를 완성하면서 주목 받기도 했으며 국내에서도 비슷한 사례들의 개발이 지속적으로 진행되고 있다. 본 논문에서는 로봇저널리즘 시대에 맞춰 빅데이터 기반의 자동기사작성 로봇 개발방법을 제안하고, 데이터를 수집해 기사를 추출해내는 빅데이터 기반의 자동기사작성 로봇을 객관적인 데이터를 수집할 수 있는 스포츠분야에 적용하여 개발하였다. 본 기술로 인해 객관적인 내용을 표현할 수 있는 기사를 실시간으로 작성 및 온라인으로 배포 할 수 있으며, 확장을 통해 온라인 시청자들에게 다양한 실시간 정보제공이 가능할 수 있을 것으로 예상된다.

다변량 자료에서 특이점 검출 및 시각화 - R 스크립트 (Detecting outliers in multivariate data and visualization-R scripts)

  • 김성수
    • 응용통계연구
    • /
    • 제31권4호
    • /
    • pp.517-528
    • /
    • 2018
  • 다변량 자료에서 특이점을 검출하고, 검출된 특이점을 시각화와 연결한 R 스크립트를 제공한다. 개발된 R 스크립트는 특이점을 검출하는 방법으로서 1) Robust Mahalanobis distance, 2) High Dimensional data, 3) Density-based approach 방법을 이용하였다. 특이점을 연결하면서 데이터 구조를 파악하기 위한 시각화 방법으로는 1) multidimensional scaling (MDS)와 minimal spanning tree (MST)를 K-means 군집분석과 연결하여 표시하는 방법, 2) MDS를 fviz cluster와 연결하는 방법, 3) principal component analysis (PCA)를 fviz cluster와 연결한 방법을 이용하였다. 사례분석의 예로서는 Major League Baseball (MLB) 자료에서 류현진이 적극적으로 활동하던 2013년, 2014년 투수자료를 이용하였다. 개발된 R 스트립트는 "http://www.knou.ac.kr/~sskim/ddpoutlier.html (R 스크립트와 R 패키지도 다운로드 받을 수 있다. 실행방법도 설명되어 있다.)"에서 다운받으면 된다.