EXEMPEL
Den 19e oktober 2011 spelades första matchen i den 107e World Series mellan Texas Rangers och St. Louis Cardinals. Jag tänkte använda denna match för att göra ett exempel baserat på de formler jag berättat om hittills.
Texas Rangers vs St. Louis Cardinals
Game #1, World Series
Texas Starting Pitcher: C.J. Wilson, ERA 2.94
St. Louis Starting Pitcher: Chris Carpenter, ERA 3.45
Texas W/L: 96/66
St. Louis W/L: 90/72
Texas RS/RA: 855/677
St. Louis RS/RA: 762/692
Texas modERA = ((2.94/9) * 5) + (((677/162)/9)*4) = 1.63 + 1.86 = 3.49
St. Louis modERA = ((3.45/9) * 5) + (((692/162)/9)*4) = 1.92 + 1.90 = 3.82
Runs Allowed Texas w/ CJ Wilson = 3.49 * 162 = ca 562
Runs Allowed St. Louis w/ Chris Carpenter = 3.82 * 162 = ca 618
Texas Pyth Win% = (855^2) / (855^2 + 562^2) = 731025 / (731025+315844) = 0.70
St. Louis modERA = (762^2) / (762^2 + 618^2) = 580644 / (580644+381924) = 0.60
Här har vi alltså Texas med en Pythagorean vinstprocent på 70% och St. Louis med 60%. Detta kan jämföra med Texas riktiga vinstprocent på 60% och St. Louis med 55%. Eftersom båda lagen startade med sina bästa pitchers i första matchen i World Series är det här inte alls orimliga skillnader.
Steg 2 är alltså att jämföra lagens styrkeindikatorer mot varandra för att lista ut hur stor sannolikheten är för Texas att vinna mot St. Louis (eller tvärtom).
Log5 ser som sagt ut på det här viset: W% = (A - (A*B)) / (A + B - 2 * A * B)
Vi ersätter nu A med Texas siffror och B med St. Louis siffror och får följande:
W% = (0.70 - (0.70 * 0.60)) / (0.70 + 0.60 - 2 * 0.70 * 0.60)
W% = 0.28 / 0.46 = 0.61
Lag A, Texas, har alltså i grunduträkningen 61% vinstchans mot St. Louis i den här matchen. 1-0.61 = 0.39, så St. Louis har alltså i sin tur 39% chans till vinst.
Nu inledde dock St. Louis hemma, så vi måste ge laget en liten fördel i form av 2.1% (tar schablonsiffran vi använde tidigare) och även sänka Texas med 2.1%. Det ger oss följande siffror:
Vinstchans Texas: 58.9% - odds ca 1.70
Vinstchans St. Louis: 41.1% - odds ca 2.43
För att ta hänsyn till bolagens vig (vigorish, se
http://en.wikipedia.org/wiki/Vigorish) brukar jag lägga på 10-15% för att hitta värdet, så i det här fallet hade jag ansett att allt över 1.87 på Texas hade varit spelvärt och 2.67 för St. Louis. Oddssättarna tyckte tvärtom. Enligt oddsportal var St. Louis favoriter till 1.78 och Texas fick 2.09.
Hur gick det egentligen då? Jo, St. Louis vann med 3-2.. så här gick det inte hem alls. Så långt in på säsongen är det oerhört många fler faktorer som spelar in än bara Runs Scored och Runs Allowed för laget, så jag ursäktar mig lite grann här. Viktiga faktorer som jag inte har med i dessa exempel är bland annat lagets form, eventuella saknade spelare samt nytillkomna spelare. Topplagen förstärker ju oftast i samband med trade deadline och då är det inte rätt att uteslutande ta hela säsongens siffror.
Det är flera sådana varians-variabler som jag vidareutvecklat själv, men denna genomgång är för själva grunderna i mina formler.
Jag har liknande varianter för resultaten senaste 30 dagarna samt senaste 15 dagarna och snittar sedan dessa tre procentsatser (totala säsongen, 30 dagar och 15 dagar) för att få en mer representabel siffra. Vad man dessutom borde göra är att gradvis vikta siffrorna så att ju längre säsongen går, desto mer är det 30/15 dagars som betyder något än hela säsongens siffror.