Visa ett inlägg
Gammal 2012-02-27, 13:12   #5
dgothe
 
dgothes avatar
 
Reg.datum: mar 2010
Inlägg: 347
Sharp$: 1075

Sabermetrics-Test MLB
Stats: 236 - 128 - 4
ROI: 109.75%
Vinstprocent: 65.00%

Standard

EXEMPEL

Den 19e oktober 2011 spelades första matchen i den 107e World Series mellan Texas Rangers och St. Louis Cardinals. Jag tänkte använda denna match för att göra ett exempel baserat på de formler jag berättat om hittills.

Texas Rangers vs St. Louis Cardinals

Game #1, World Series

Texas Starting Pitcher: C.J. Wilson, ERA 2.94
St. Louis Starting Pitcher: Chris Carpenter, ERA 3.45

Texas W/L: 96/66
St. Louis W/L: 90/72

Texas RS/RA: 855/677
St. Louis RS/RA: 762/692


Texas modERA = ((2.94/9) * 5) + (((677/162)/9)*4) = 1.63 + 1.86 = 3.49
St. Louis modERA = ((3.45/9) * 5) + (((692/162)/9)*4) = 1.92 + 1.90 = 3.82

Runs Allowed Texas w/ CJ Wilson = 3.49 * 162 = ca 562
Runs Allowed St. Louis w/ Chris Carpenter = 3.82 * 162 = ca 618

Texas Pyth Win% = (855^2) / (855^2 + 562^2) = 731025 / (731025+315844) = 0.70
St. Louis modERA = (762^2) / (762^2 + 618^2) = 580644 / (580644+381924) = 0.60

Här har vi alltså Texas med en Pythagorean vinstprocent på 70% och St. Louis med 60%. Detta kan jämföra med Texas riktiga vinstprocent på 60% och St. Louis med 55%. Eftersom båda lagen startade med sina bästa pitchers i första matchen i World Series är det här inte alls orimliga skillnader.

Steg 2 är alltså att jämföra lagens styrkeindikatorer mot varandra för att lista ut hur stor sannolikheten är för Texas att vinna mot St. Louis (eller tvärtom).

Log5 ser som sagt ut på det här viset: W% = (A - (A*B)) / (A + B - 2 * A * B)

Vi ersätter nu A med Texas siffror och B med St. Louis siffror och får följande:

W% = (0.70 - (0.70 * 0.60)) / (0.70 + 0.60 - 2 * 0.70 * 0.60)

W% = 0.28 / 0.46 = 0.61

Lag A, Texas, har alltså i grunduträkningen 61% vinstchans mot St. Louis i den här matchen. 1-0.61 = 0.39, så St. Louis har alltså i sin tur 39% chans till vinst.

Nu inledde dock St. Louis hemma, så vi måste ge laget en liten fördel i form av 2.1% (tar schablonsiffran vi använde tidigare) och även sänka Texas med 2.1%. Det ger oss följande siffror:

Vinstchans Texas: 58.9% - odds ca 1.70
Vinstchans St. Louis: 41.1% - odds ca 2.43

För att ta hänsyn till bolagens vig (vigorish, se http://en.wikipedia.org/wiki/Vigorish) brukar jag lägga på 10-15% för att hitta värdet, så i det här fallet hade jag ansett att allt över 1.87 på Texas hade varit spelvärt och 2.67 för St. Louis. Oddssättarna tyckte tvärtom. Enligt oddsportal var St. Louis favoriter till 1.78 och Texas fick 2.09.

Hur gick det egentligen då? Jo, St. Louis vann med 3-2.. så här gick det inte hem alls. Så långt in på säsongen är det oerhört många fler faktorer som spelar in än bara Runs Scored och Runs Allowed för laget, så jag ursäktar mig lite grann här. Viktiga faktorer som jag inte har med i dessa exempel är bland annat lagets form, eventuella saknade spelare samt nytillkomna spelare. Topplagen förstärker ju oftast i samband med trade deadline och då är det inte rätt att uteslutande ta hela säsongens siffror.

Det är flera sådana varians-variabler som jag vidareutvecklat själv, men denna genomgång är för själva grunderna i mina formler.

Jag har liknande varianter för resultaten senaste 30 dagarna samt senaste 15 dagarna och snittar sedan dessa tre procentsatser (totala säsongen, 30 dagar och 15 dagar) för att få en mer representabel siffra. Vad man dessutom borde göra är att gradvis vikta siffrorna så att ju längre säsongen går, desto mer är det 30/15 dagars som betyder något än hela säsongens siffror.
__________________
"Alla kan inte som jag koppla bort känslorna och se siffrorna" - pilen

-
To view links or images in signatures your post count must be 10 or greater. You currently have 0 posts.
Följande användare gav Sharp$ för den här posten:
JSQ (+20)

Senast redigerad av dgothe den 2012-02-27 klockan 14:48.
dgothe är inte uppkopplad   Ge poäng Svara med citat