Sharps.se - Sveriges bästa sportsbettingforum med rekar, spelförslag och bettingtips

Sharps.se - Sveriges bästa sportsbettingforum med rekar, spelförslag och bettingtips (https://www.sharps.se/forums/)
-   Speldagböcker (https://www.sharps.se/forums/speldagboecker/)
-   -   astvald utforskar statistiska modeller (NHL) (https://www.sharps.se/forums/speldagboecker/10581-astvald-utforskar-statistiska-modeller-nhl/)

astvald 2012-01-22 09:40

astvald utforskar statistiska modeller (NHL)
 
Jag har funderat av och till ett tag på att skriva ett datorprogram för att göra statistisk modellering av speldata, givetvis med förhoppning att kunna använda modeller för prediktion. De senaste dagarna gjorde jag slag i saken och har en betaversion för NHL (ishockey ger lagom många mål för att lämpa sig att modellera med Poissonprocesser och gamla data är lätt tillgängliga för NHL).

Jag har byggt en databas med matchdata för årets säsong och som en första enkel modell ser jag antalet mål hemma/borta för respektive lag som varsin Poissonprocess vars parameter jag skattar med data från redan spelade matcher. Det är välkänt att sådana modeller normalt underskattar antalet oavgjorda matcher, och det är också tydligt i mina första testkörningar. För tillfället kommer jag därför bara att visa uppskattade ML-odds. Planen är att så småningom utvidga modellen, antingen till att använda bivariata Poissonfördelningar eller med någon annan variant av korrelation.

Här var mina ML-beräkningar för gårdagens matcher (2012-01-21).

NJ-PHI 2.28/1.78
BOS-NYR 1.63/2.58
ANH-OTT 2.08/1.92
VAN-SJ 1.92/2.09
DET-CLS 1.22/5.53
NYI-CAR 1.80/2.25
TOR-MON 1.76/2.31
WPG-FLA 1.77/2.29
NSH-CHI 1.88/2.14
PHO-TB 1.50/3.02
STL-BUF 1.30/4.29
MIN-DAL 1.75/2.33
EDM-CGY 1.59/2.70
LA-COL 1.76/2.32


Observera att dessa är beräknade som "rättvisa" odds, i den meningen att de motsvarar en teoretisk återbetalning på 100%. För de flesta matcherna överensstämde mina beräkningar förvånansvärt väl med spelbolagens odds. Ett par stycken stack dock ut och jag testade att spela

VAN-SJ @ 2.20 (beräknat 2.09)
STL-BUF @1.42 (beräknat 1.30)
EDM-CGY @2.05 (beräknat 1.59)
LA-COL @2.45 (beräknat 2.32)

Det enda matchen som verkligen stack ut var EDM-CAL, där jag hade Edmonton som klar favorit, medan den allmänna uppfattningen var CGY som liten favorit.

(Resultat: STL och COL gick in, SJ och EDM gjorde inte det, för -0.13u)

astvald 2012-01-22 09:54

2012-01-22
 
Beräkningar för dagens matcher (2012-01-22) ger

PIT-WAS 1.58/2.73
PHI-BOS 1.64/2.55
ANH-COL 1.77/2.31


Den enda matchen som sticker ut är PHI-BOS, där mitt program har PHI som ganska klar favorit, medan bolagen håller BOS som knapp favorit. Jag följer givetvis mitt program, och sätter en slant på [email protected] (nordic bet).

2012-01-22 21:05NHLPhiladelphia Flyers vs Boston Bruins 1 ML 1 2.000

Migge 2012-01-22 10:02

Hur ska man utläsa vilken match som är värd att rygga? Nu ser man bara oddsen för bägge lagen men inte vem man ska lira såvida du inte har skrivit det som i t.ex. Philadelfia...markera gärna med fet stil vilket lag man bör rygga! :cheers:

astvald 2012-01-22 10:12

Oddsen jag listade är mina simulerade odds. Om beräkningarna vore perfekta (vilket de naturligtvis inte är i närheten av att vara) så finns det värde i alla spel som ger bättre odds än de beräknade. Jag kommer själv inte att rygga programmet om jag inte hittar odds som är åtminstone 0.10 bättre än de beräknade. (Egentligen borde man nog sätta gränsen på 0.15 eller 0.20 tills alla parametrar är finjusterade.)

För PHI-BOS är det en klar rygg hursomhelst. Min modell ger ett odds på [email protected], men NB erbjuder 2.00, så vi har ett teoretiskt värde på +0.36u.

Arre08 2012-01-22 10:21

Citat:

Ursprungligen postat av astvald (Inlägg 162700)
Oddsen jag listade är mina simulerade odds. Om beräkningarna vore perfekta (vilket de naturligtvis inte är i närheten av att vara) så finns det värde i alla spel som ger bättre odds än de beräknade. Jag kommer själv inte att rygga programmet om jag inte hittar odds som är åtminstone 0.10 bättre än de beräknade. (Egentligen borde man nog sätta gränsen på 0.15 eller 0.20 tills alla parametrar är finjusterade.)

För PHI-BOS är det en klar rygg hursomhelst. Min modell ger ett odds på [email protected], men NB erbjuder 2.00, så vi har ett teoretiskt värde på +0.36u.

2,17 på PHI på pinnacle ML

SPADERMAN 2012-01-22 10:30

Intressant läsning! Ska bli spännande att följa.

astvald 2012-01-22 10:44

Citat:

Ursprungligen postat av Arre08 (Inlägg 162708)
2,17 på PHI på pinnacle ML

Tack för tipset! Jag antar att det börjar bli dags att öppna ett konto på Pinnacle också...

tompa87 2012-01-22 11:51

Citat:

Ursprungligen postat av astvald (Inlägg 162713)
Tack för tipset! Jag antar att det börjar bli dags att öppna ett konto på Pinnacle också...

Kan vara en bra idé, dem har sågott som alltid bäst linor på NHL.

astvald 2012-01-22 20:37

Lite teori
 
Teorin bakom min (och många andra) statistiska modeller är att modellera t.ex. gjorda och insläppta mål som Poissonfördelade slumpvariabler. Poissonfördelningen passar bra för att beskriva händelser som är förhållandevis ovanliga, och som sker oberoende av varandra. Gjorda mål i många sporter (tex ishockey) uppfyller dessa antaganden åtminstone någorlunda väl. Däremot lämpar sig inte Poissonfördelningen så bra för att modellera (t.ex.) poäng i baseball -- det är mer sannolikt att få en andra poäng i en inning när man väl fått sin första.

Jag har knappt 700 matcher från årets NHL-spel i en databas. Vi roar oss med att låta X beteckna antalet gjorda mål för hemmalaget och Y antalet gjorda mål för bortalaget och antar vidare att X och Y är oberoende (se nedan!) Poissonfördelade slumpvariabler. Om vi anpassar X och Y till de 700 matcherna och bestämer parametrarna för X och Y med Maximum Likelihood-uppskattningar, finner vi att X är ungefär Poi(2.80) och Y är ungefär Poi(2.48).

Dessa uppskattningar i sin tur skulle medföra att antalet gjorda mål för hemmalaget skulle fördela sig enligt:

Kod:

Mål Modell Verkliga data
 0  42.0    [43]
 1  117.7  [130]
 2  165.0  [164]
 3  154.2  [120]
 4  108.1  [122]
 5  60.6    [73]
 6  28.3    [25]
 7  11.3    [9]
 8    4.0    [4]
 9    1.2    [3]
10    0.3    [0]
11    0.1    [0]

Modellen stämmer förbluffande väl. Antalet matcher med 1 och 4 mål är lite för lågt och antalet med 3 mål lite för högt, men i stort sett ser modellen bra ut. Motsvarande beräkningar för bortalaget ger

Kod:

Mål Modell Verkliga data
 0  57.8    [50]
 1  143.5  [140]
 2  178.3  [193]
 3  147.7  [150]
 4  91.7    [86]
 5  45.6    [50]
 6  18.9    [18]
 7    6.7    [5]
 8    2.1    [0]
 9    0.6    [1]
10    0.1    [0]
11    0.0    [0]

och här är överensstämmelsen mellan modell och data ännu bättre. Under förutsättningen att X och Y är oberoende slumpvariabler skulle man få följande tabell över matchresultat (hemmalagets mål radvis; bortalagets kolumnvis, verkliga data inom klammer):

Kod:

H  A: 0        1          2          3          4          5
0  3.50 [ 3]  8.69 [ 7] 10.80 [ 7]  8.95 [18]  5.56 [ 2]  2.76 [ 2]
1  9.81 [12] 24.38 [36] 30.29 [22] 25.08 [19] 15.58 [30]  7.74 [ 8]
2  13.75 [ 7] 34.17 [23] 42.46 [65] 35.17 [27] 21.85 [22] 10.86 [15]
3  12.85 [15] 31.94 [16] 39.68 [27] 32.87 [32] 20.42 [ 9] 10.15 [16]
4  9.01 [ 6] 22.39 [34] 27.81 [40] 23.04 [24] 14.31 [12]  7.11 [ 4]
5  5.05 [ 4] 12.55 [18] 15.60 [23] 12.92 [18]  8.02 [ 5]  3.99 [ 3]

Här syns det stora problemet med Poissonmodeller. I verkligheten är X och Y inte oberoende, och ett sådant antagande ger rejält underskattade sannolikheter för oavgjort, i synnerhet underskattas resultaten 1-1 och 2-2. Tyvärr blir matematiken för korrelerade Poissonmodeller avsevärt mer komplicerad, men jag planerar att återkomma till sådana lite senare.

Sammanfattningsvis uppskattar den (oberoende) Poissonmodellen slutresultat enligt

Kod:

1    322.6 [311]
x    122.4 [152]
2  248.0 [230]

Här syns det tydligt att antalet x är ca 20% för lågt, men att förhållandet 1/2 stämmer väl överens med verkliga data.

Alla ovanstående beräkningar är gjorda kollektivt för alla lag tillsammans, men kan kan förstås göra dem lag för lag också. Då blir osäkerheten förstås lite större, eftersom datamaterialet är mindre, men i det stora hela för man motsvarande överensstämmelse.

lordagspippi 2012-01-22 21:51

Direkt kommer Alice Cooper in i huvudet! Intressant projekt, kommer följas!

Persa 2012-01-22 22:56

Mycket intressant, gillar alltid när folk tar sig an statistik!

astvald 2012-01-23 08:40

2012-01-23
 
Stolpe ut i går, då Philadelphia förlorade på straffar.

Dagens beräkningar ser ut så här:

CAR-WPG 1.74/2.36
TOR-NYI 1.66/2.52
DET-STL 1.38/3.60
NSH-CLS 1.49/3.04
EDM-SJ 2.17/1.86
LA-OTT 2.17/1.86

och jag har hittat ett par matcher som jag ger ett försök

2012-01-24 02:35NHLDetroit Red Wings vs St Louis Blues 1 ML 1 1.667

2012-01-24 03:35NHLEdmonton Oilers vs San Jose Sharks 1 ML 1 2.560

2012-01-24 04:35NHLLos Angeles Kings vs Ottawa Senators 2 ML 1 2.250


Modellen har Detroit som större favorit än vad som syns i spelbolagens odds, Edmonton som mindre dog och Ottawa som favorit i stället för dog.

astvald 2012-01-24 14:53

I natt blev det stolpe in i stället med EDM som vinnare på straffar. Dagens beräknade odds är


NYR-WPG 1.50/3.02
NYI-TOR 2.06/1.95
NJ-BUF 1.54/2.87
FLA-PHI 2.40/1.72
TB-CLS 1.57/2.77
STL-PIT 1.80/2.25
DAL-ANH 1.90/2.11
CGY-SJ 2.06/1.94
PHO-OTT 1.89/2.12
COL-MIN 1.84/2.19
VAN-EDM 1.48/3.07

WAS-BOS 2.44/1.69
CHI-NSH 1.67/2.49


Märkligt nog hittar jag inga ML-linor på WAS-BOS eller CHI-NSH. Jag har ingen aning varför (varken Pinnacle eller Unibet listar matcherna, Betson har trevägslinor, men inte ML). I dag överensstämmer mina beräkningar väldigt bra med Pinnacle. De enda som modellen ser lite värde i är

2012-01-25 01:35NHLFlorida Panthers vs Philadelphia Flyers 2 ML 1 1.920

2012-01-25 03:05NHLColorado Avalanche vs Minnesota Wild 2 ML 1 2.380

2012-01-25 04:05NHLVancouver Canucks vs Edmonton Oilers 2 ML 1 3.790


Min modell tycker uppenbarligen orimligt bra om Edmonton. Även om det verkar lite suspekt, så följer jag mina beräkningar. 3.79 ser trots allt ut som ett överodds, även om jag inte har så stora förhoppningar att den går in. [email protected] och [email protected] känns lite bättre.

astvald 2012-01-24 17:28

Uppenbarligen väntade Pinnacle på att jag skulle posta mina beräkningar för WAS-BOS och CHI-NSH :whistling: I alla fall stämmer de nästan på pricken med mina uppskattningar.

Persa 2012-01-25 10:22

Dina beräkningar verkar funka bra. Du räddade nattens NHL-spel från ett totalt fiasko!



Powered by vBulletin & vBadvanced CMPS
Design, Logos, etc Copyright © Sharps.se, 2010-2011. All Rights Reserved