• 제목/요약/키워드: 케이-평균 군집

검색결과 3건 처리시간 0.014초

그리드 기반 표본의 무게중심을 이용한 케이-평균군집화 (K-means clustering using a center of gravity for grid-based sample)

  • 이선명;박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권1호
    • /
    • pp.121-128
    • /
    • 2010
  • 케이-평균 군집분석은 데이터들을 k개의 군집으로 임의로 분할을 하여 군집의 평균을 대푯값으로 분할해 나가는 방법으로 데이터들을 유사성을 바탕으로 재배치를 하는 방법이다. 이러한 케이-평균 군집분석은 시장조사, 패턴분석 및 인식, 그리고 이미지 처리 분야 등에서 폭넓게 응용되고 있다. 그러나 대용량의 데이터베이스를 분석대상으로 하므로 그 만큼 데이터 처리 시간이 많이 소요되는 것이 문제 중의 하나이다. 특히 웹이 보편화된 현재 사용자들의 다양한 패턴을 분석하기 위한 데이터 마이닝 방법이 사용되어지고 있는데 처리 속도 문제는 더욱 중요하게 생각하고 있다. 이러한 속도 문제를 해결하기 위해 본 논문에서는 분할 군집법에서 가장 일반적으로 사용되고 있는 케이-평균 알고리즘에 대해 그리드를 기반으로 한 무게중심 알고리즘을 제안하고자 한다.

한국프로야구에서의 투수평가지표 (Pitching grade index in Korean pro-baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권3호
    • /
    • pp.485-492
    • /
    • 2014
  • 투수를 평가할 때 중요한 요소는 일반적으로 다승과 방어율을 사용하지만 이 지표들은 팀의 도움 또는 운과 같은 요소의 영향을 받는다. 그래서 야구통계학자들은 투수 개인의 능력만을 측정하는 많은 지표들을 제안하였는데 이와 같은 평가지표들은 가짓수가 너무 많고 복잡하기 때문에 팬들을 때때로 당황하게 만든다. 본 연구에서는 대표적인 투수평가지표들을 이용하여 지표들의 특성을 반영하는 주성분을 찾아보고 한국프로야구에 적합한 투수들의 능력을 객관적으로 평가할 수 있는 투수지표를 제안하였다.

한국프로야구에서 타자능력의 측정 (Measurements for hitting ability in the Korean pro-baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권2호
    • /
    • pp.349-356
    • /
    • 2014
  • 타자들의 평가에 대한 불완전한 부분을 보완하기 위하여 세이버메트리션들이 세워놓은 기준들이 선수 평가에 중요한 잣대가 되고 있다. 하지만 평가지표들은 개수가 많고 형태가 일정하지 않아서 팬들을 혼동에 빠지게 한다. 본 연구에서는 대표적인 타자평가지표를 이용하여 지표들의 특성을 골고루 반영하는 주성분을 찾아보고 한국프로야구에 적합한 타자지표를 제안한다. 제안된 지표는 타자들의 능력을 그룹화하여 객관적으로 설명할 수 있기 때문에 선수들의 연봉을 합리적으로 결정할 수 있다.