Ⅰ. 서론
n개 팀이 리그전을 치르고 있는 경우, 리그 시즌이 진행되는 특정 시점에서 i번째 팀은 승리한 경기 수 wi , 잔여 경기 수 ri와 j번째 팀과의 잔여 경기인 rij를 갖는다. 야구 배제 문제(baseball elimination problem, BEP)는 미국의 프로야구 양대 리그전에서 경기를 마친 뒤 승률이 같을 경우 최종적인 우승팀을 가리기 위해 별도로 치르는 플레이오프(playoff)에 진출하지 못하는 팀을 우선적으로 배제시키는 문제이다.[1] 왜냐하면, 임의의 시점에서 어떤 팀이 잔여 경기를 모두 승리한다고 가정하여도 리그전에서 최다 승 팀이 되지 못하는 경우 이 팀은 우선적으로 잔여 경기를 치르지 않고 시즌을 종료시킬 수 있기 때문이다.
BEP에 대해, 스포츠 기자(sports writers)는 배제 대상 팀이 잔여 경기를 모두 승리한다고 가정하여, 다른 팀 그룹의 (승리 경기 수 총합+잔여 경기 수 총합)을 그룹 수로 나눈 값이 배제될 팀의 승리 경기 수를 초과하는 그룹이 존재하면 해당 팀을 배제하는 방법을 적용한다.[1]Schwartz[2]는 배제 대상 팀을 제외한 나머지 팀들 간의 잔여 경기 수와 각 팀의 배제 대상 팀의 승리 경기 수+잔여 경기 수에서 각 팀의 현재 승리 경기 수를 뺀 값을 가진 망을 구성하여 최대흐름-최소절단 방법으로 배제 팀 여부를 결정하는 방법을 제안하였다. 이에 기반을 두어 Wayne[1]는 빠른 알고리즘을, Hoffman과 Rivlin[3]는 일반화된 결과를 제시하였다.
두 방법 모두 최소 절단을 갖는 팀 그룹(부분집합)을 찾는데 어려움이 있으며, 배제 팀이 다수 존재할 경우 이들 팀을 대상으로 반복적으로 알고리즘을 수행해야 하는 문제가 있다.
또한, Robinson[4], Ribeiro와 Urrutia[5]은 선형계획법으로 문제를 풀려고 시도하였다.
BEP의 해를 찾는 알고리즘 복잡도에 대해 Kern과 Paulusma[6], Cechlárová et al.[7]이 거론하였으며, Gusfield와 Martel[8], McCrnick[9]는 NP-완전 문제로 다항시간으로 해를 구하는 알고리즘이 알려져 있지 않은 난제임을 밝혔다.
본 논문에서는 모든 배제 팀을 결정하는데 있어 단순하면서도 빠른 계산 방법을 제안한다. 2장에서는 야구팀 배제 문제를 푸는 방법들을 고찰해 본다. 3장에서는 야구팀 배제 문제를 빠르고, 정확하게 풀 수 있는 방법을 제시한다. 4장에서는 실험 데이터에 제안된 알고리즘을 적용하여 알고리즘 적합성을 검증하여 본다.
Ⅱ. 야구팀 배제 문제
야구팀배제 문제는 다음의 2가지 방법으로 구하고 있다.
(1) 스포츠 기자 판단 법: 배제 대상 팀이 잔여 경기를 모두 승리한다고 가정하여, 팀 그룹의 승리 경기 수 + 잔여 경기 수의 총합을 그룹 수로 나눈 값이 배제될 팀의 승리 경기 수를 초과하는 부분집합 그룹이 존재하면 배제하는 방법 적용.[1]
(2) Schwartz[2]의 최대흐름-최소절단 법: 배제 대상팀을 제외한 나머지 팀들 간의 잔여 경기 수와 각 팀의 배제 대상 팀의 승리 경기 수+잔여 경기 수에서 각 팀의 현재 승리 경기 수를 뺀 값을 가진 망을 구성하여 최대흐름-최소절단 방법으로 배제 팀 결정.
스포츠 기자 판단 법[1]은 식 (1)의 부분집합 R이 존재하는 필요충분조건(if and only if, iif)을 만족하면 팀 k는 배제한다.
\(\frac{w(R) + r(R)}{\left| R \right|} > w_k + r_k\) (1)
where 부분집합 : R∈N
R의 승리 경기 수 = \(w(R) :=\sum_{iINR} w_i\)
R의 잔여 경기 수 = \(r(R) :={1 \over 2}\sum_{i,jINR} r_{ij}\)
표 1의 예제 데이터를 대상으로 두 가지 방법으로 배제 팀을 구하여 본다.
표 1. bep-1 예제 데이터
Table 1. example data of bep-1
만약, Harvard(H) 팀이 배제될지 여부를 결정하기 위해, 스포츠 기자 판단 법을 적용하면, R={Y,C,B}, R={Y,C},R={Y,B}, R={C,B}의 부분집합에 대해 식 (1)의 \(\frac{w(R)+r(R)}{|R|} \)이 wH + rH = 29 + 4 = 33보다 큰 부분집합 R을 찾아야만 한다. 이 결과 R={Y,C}가 존재하여 Harvard(H) 팀이 배제될 수 있음을 알 수 있다.
• R={Y,C,B} : 96/3=32:32<33
• R={Y,C} : 67/2=33.5;33.5>33
• R={Y,B} : 61/2=30.5:30.5<33
•R={C,B} : 56/2=28:28<33
Schwartz[2]의 최대흐름-최소절단 법은 그림 1과 같이 흐름 망을 구성하고 최소절단이 존재하면 Harvard(H)팀을 배제시킨다.
그림 1. 최대흐름-최소절단 법
Fig. 1. Max-flow/Min-cut Method
이들 알고리즘의 문제점은 모든 배제 팀을 구하기 위해서는 n개의 각 팀에 대해 부분집합 R이나 흐름 망을 구성해야만 한다는 점이다. 즉, 표 1의 예제데이터 4개 팀 중에서 배제 팀이 Harvard(H) 팀만 존재하는가? 이다. 직관적으로 볼 때, 최소한 현재 선두를 유지하는 Yale(Y)을 제외한 3개 팀 모두에 대해 알고리즘을 반복적으로 적용해야만 모든 배제 팀을 결정할 수 있다. 예로, n=4인 경우 n-1팀 각각이 4개의 R이 존재하므로 3x4=12회를 수행해야 하며, n=5인 경우 n-1팀 각각이 10개의 R이 존재하므로 4x10=40회를 수행해야 한다. 따라서 n이 증가할수록 n-1을 찾는 수행횟수는 기하급수적으로 증가함을 알 수 있어, 이 방법들은 너무나 성가신(bothersome) 결정과정을 거치야 함을 알 수 있다.
따라서 3장에서는 배제 팀 후보 k 뿐 아니라 부분집합 R 역시 최소화 시키면서도 모든 배제 팀을 간단히 결정할 수 있는 알고리즘을 제안한다.
Ⅲ. 단순 배제 팀 결정 알고리즘
본 장에서는 부분집합 R을 쉽게 판단하는 야구팀 배제 알고리즘(simple baseball elimination algorithm,SBEA)을 제안한다. SBEA는 다음과 같이 수행되며, 이를 요약하면 그림 2와 같다.
그림 2. 단순 야구팀 배제 알고리즘
Fig. 2. Simple baseball elimination algorithm(SBEA)
제안된 SBEA를 표 1의 bel-1 데이터에 적용한 결과는 표 2와 같다.
표 2. 예제 데이터에 대한 SBEA 결과
Table 2. SBEA result of example data
SBEA로 wi+ri 오름차순으로 정렬하면 B-H-C-Y 순으로 배치된다. 여기서 하위 [n/2]팀은 {B,H}로 Brown(B)의 R={{Y}, {Y,C}, {Y,C,H}}이며, Harvard(H)의 R={{Y}, {Y,C}}로 각각에 대해 식 (1)을 충족하는지 여부를 검증하여 찾은 부분집합 R은 Brown(B)은 R={Y}에서 이미 결정되었지만 추가적으로 R={Y,C}와 {Y,C,H}도 제시하였다. Harvard(H)는 R={Y,C}가 존재하여 이 문제에서의 배제 팀은 B와 H의 2개 팀임을 알 수있다.
Ⅳ. 알고리즘 적용 및 결과 분석
본 장에서는 표 3의 5개 실험 데이에 대해 제안된 SBEA를 적용하여 모든 배제 팀을 결정할 수 있는지 검증하여 본다. 표 3의 실험 데이터에 SBEA를 적용한 결과는 표 4에 제시되어 있다.
표 3. 실험 데이터
Table 3. Experimental data
표 4. 실험 데이터에 대한 SBEA 결과
Table 4. SBEA result of experimental data
BEP 실험 데이터에 SBEA를 적용한 결과인 표 4로부터 bep-2와 bep-3의 K={Tor, Det} 중 Det만 배제되었으며, bep-4의 K={P,M}중 P와 M 모두 배제되었고, bep-5의 K={TX,HO}중 TX와 HO 모두 배제되었으며, bep-6의 K={Bos, Bal}중 Bos와 Bal 모두 배제되는 결과를 얻었다.
Ⅴ. 결론
본 논문에서는 프로야구 리그전을 치르는 경기가 진행되는 일정 시점에서 잔여 경기를 모두 승리한다고 하여도 최다승을 하지 못해 잔여 경기 진행 없이 시즌을 종료시킬 수 있는 팀을 배제하고, 나머지 팀들 중에서 최다승 팀을 결정하는 플레이오프전을 치를 수 있는 야구 배제 문제를 다루었다.
이 문제를 풀기 위해 대부분은 최대흐름-최소절단 정리를 적용하고 있다. 그러나 이 방법은 최소절단을 구하는 과정 역시 어려울 뿐 아니라 배제 여부를 결정하는 팀을 제외 시킨 망을 구성하는 반복적인 과정을 수행하는 단점을 갖고 있다.
본 논문에서는 최소절단을 찾는 망을 이용하지 않고, 단순히 승리 게임 수+잔여 게임 수 오름차순으로 정렬시켜 하위 성적 절반팀을 배제 후보팀 집합으로 설정하고, 이들 집합의 개별적 팀 단위로 빠르게 배제 여부를 결정하는 단순한 계산방법을 제안하였다.
제안된 알고리즘을 다양한 실험 데이터에 적용한 결과, 모든 데이터에 대해 배제 대상 팀 모두를 단순하면서도 빠르고 정확하게 결정하는 결과를 얻었다.
References
- K. D. Wayne, "A New Property And A Faster Algorithm For Baseball Elimination", SIAM Journal on Discrete Mathematics, Vol. 14, No. 2, pp. 223-229, Sep. 1999, doi:https://doi.org/10.1137/S0895480198348847
- B. L. Schwartz, "Possible Winners in Partially Completed Tournaments", SIAM Review, Vol. 8, No. 3, pp. 302-308, Jul. 1966, doi:https://doi.org/10.1137/1008062
- A. Hoffman and T. Rivlin, "When is a Team "mathematically" eliminated?", Proceedings of the Princeton Symposium on Mathematical Programming, pp. 391-401, 1967.
- L. W. Robinson, "Baseball Playoff Eliminations: an Application of Linear Programming", Operations Research Letters, Vol. 10, No. 2, pp. 67-74, Mar. 1991, doi:https://doi.org/10.1016/0167-6377(91)90089-8
- C. C. Ribeiro and S. Urrutia, "An Application of Integer Programming to Playoff Elimination in Football Championships", International Transactions in Operational Research, Vol. 12, No. 4, pp. 375-386, Jul. 2005, doi:https://doi.org/10.1111/j.1475-3995.2005.00513.x
- W. Kern and D. Paulusma, "The Computational Complexity of the Elimination Problem in Generalized Sports Competitions", Discrete Optimization, Vol. 1, No. 2, pp. 205-214, Nov. 2004, doi:https://doi.org/10.1016/j.disopt.2003.12.003
- K. Cechlarova, E. Potpinkova, and I. Schlotter, "Refining the Complexity of the Sports Elimination Problem", Discrete Applied Mathematics, Vol. 199, pp. 172-186, Jan. 2016, doi:https://doi.org/10.1016/j.dam.2015.01.021
- D. Gusfield and C. Martel, "A Fast Algorithm for the Generalized Parametric Minimum Cut Problem and Applications", Algorithmica, Vol. 7, No. 1, pp. 499-519, Jun. 1992, doi:https://doi.org/10.1007/F01758775
- S. T. McCormick, "Fast Algorithms for Parametric Scheduling Come from Extensions to Parametric Maximum Flow", Operations Research, Vol. 45, No. 5, pp. 744-756, May 1999, doi:https://doi.org/0.1287/opre.47.5.744