Sharps.se - Sveriges bästa sportsbettingforum med rekar, spelförslag och bettingtips

Sharps.se - Sveriges bästa sportsbettingforum med rekar, spelförslag och bettingtips (https://www.sharps.se/forums/)
-   Tänkarhörnan (https://www.sharps.se/forums/taenkarhoernan/)
-   -   EV+ på Trav? (https://www.sharps.se/forums/taenkarhoernan/3672-ev-pa-trav/)

LosKrikon 2010-09-27 17:19

Jo, fast inget program är ju helt perfekt. Man kan nog gå plus även om man tar alla rekomendationer, men kanske får lite mer edge om man gallrar manuellt också.

Vore konstigt om de limiterar en, med tanke på att ingen av oss verkar intresserad av att spela för stora pengar. Jag kommer börja med en instats på 10kr till exempel.

tino 2010-09-27 20:20

Citat:

Ursprungligen postat av LosKrikon (Inlägg 64050)
Jag hoppas du inte överger tråden, den var så intressant!

Jag håller som sagt (i din speldagbok) på med samma sak. Berätta gärna vad du parsar ut, detta kör jag med:

Jättekul att du håller på med något liknande då jag som sagt tror att det skall gå att knäcka den här nöten! Jag kan garantera dig att jag inte har övergett detta, men just nu är det bara jobb, jobb och återigen jobb med företaget som hamnar före.

Citat:

Ursprungligen postat av LosKrikon (Inlägg 64050)
Lopp:
Datum, loppnummer (altså för dagen), längd, starttyp (auto, volt), bana (plats), lopptyp (VP, V65, V64, V75, DD), odds, vinnare

Samtliga parametrar och dessutom omsättning på V- och P-spel och resultat för respektive häst i loppet och inte vara vem som kommer etta (men det kanske inte du menade med "vinnare"). Jag har inte hunnit laborera med omsättningen ännu, men det är troligt att man kan hitta något scenario där t.x. lägre omsättning bäddar för att oddssättarna är mindre insatta och således större sannolikhet att hitta ett överodds - även på favoriter.

Citat:

Ursprungligen postat av LosKrikon (Inlägg 64050)
Hästar:
Namn, född, kön, ras, vinster (antal), placeringar (antal etta, tvåa, trea), insprunget (år för år) [allt är år för år, med är även livsstatistik]

Hästnamn samt samtliga loppresultat med tillhörande parametrar såsom datum, resultat, galopp och prispengar. Hänsyn tas till datum för lopp, dvs. senaste lopp väger t.ex. tyngre än ett lopp för 3 månader sedan. Stor vikt tas även till prispengar, dvs. en andraplacering i ett lopp med 1 miljon i prispengar väger t.ex. mycket tyngre än en förstaplacering med 50 000 kr i prispengar. Något jag inte justerat för ännu är dock att det generellt sett är lägre prispengar i bl.a. Norge och Finland, vilket egentligen gör att man borde ta hänsyn till detta (läs: prispengar på €5000 i Finland är kanske mer jämförtbart med prispengar på 100 000 kr i Sverige än ett lopp med 50 000 kr).

Jag har inte tagit ut någon data för ålder, kön eller ras (ännu). Jag tror man kan hitta på mycket roligt med detta, som t.ex. att undersöka om renodlade stolopp bäddar för mer outsider-vinster, eller som att exkludera/öka minodds på ston i lopp mot hingstar och vallacker.

Citat:

Ursprungligen postat av LosKrikon (Inlägg 64050)
Kuskar:
Namn, född, hemmabana, licens, vinster (antal), placeringar (antal etta, tvåa, trea), insprunget (år för år) [allt är år för år, med är även livsstatistik]

Tränare:
Namn, född, hemmabana, licens, vinster (antal), placeringar (antal etta, tvåa, trea), insprunget (år för år) [allt är år för år, med är även livsstatistik]

Jag har faktiskt inte tagit någon större hänsyn till detta vilket jag känner till är av vikt, men inte av så stor vikt som man kan tro - åtminstone inte för ändamålet med mitt program.

Anledningen till att jag inte gjort det är för att jag främst kommer att spela på outsiders och mina spelobjekt har (oftast) inte någon känd kusk. Jag ser det således som en "extra" marginal till minimumoddset genom att inte har med detta, dvs. om jag hade med kuskpåverkan hade förmodligen de favorittippade hästarna fått större chans till vinst enligt mitt program och således höjt minimumoddset på outsiders jag letar efter - jag kan då lika gärna ställa om värdet för när en häst bedöms som spelvärd.

"En outsiderspelare underskattar alltså inte kuskens vikt, men ser det hela på ett annat sätt än andra spelare. Mindre kända kuskar kan fungera som omotiverade oddshöjare, vilket självklart skall utnyttjas" för att citera Johan Lindvall.

Missförstå mig dock inte - det är bra att samla in denna data och laborera med den så länge man använder det på rätt sätt.

Citat:

Ursprungligen postat av LosKrikon (Inlägg 64050)
Mitt program kan just nu dra hem samtiliga lopp för en dag och parsa ut det viktigaste och stoppa i en databas (MySQL), har dock inte byggt att den hittar dagarna själv i kalendern än, men det kommer snart. Allt skrivet i PHP. Tänkte samla på mig 1000 lopp innan jag börjar köra någon seriös analys. Kommer även bygga in så den hämtar odds från bet365 och expekt (atg har den ju redan).

Totalt är det nio tabeller, men kanske kommer fler.

Kanske ska notera att den plockar ut id för hästar/kuskar/tränare också, och de används sedan när man kopplar tabellerna. Jag kommer bara ta med dagens "huvudbana" (altså där Vxx körs) och bara travlopp.

Även mitt program är byggt m.h.a. LAMP (Linux + Apache + MySQL + PHP) då det oftast går fort att koda sånt här i skriptbaserade språk. Jag har allt uppdelat i huvudsakligen fyra olika skript:
1. Ladda ner loppdata med startlistor, odds mm. (underlag till backtestning)
2. Ladda ner tävlingsresultat mm. för deltagande hästar (underlag till backtestning)
3. Program för att backtesta och testa olika parametrar
4. Program för att ranka hästar och bedöma sannolikhet till vinst för ett kommande lopp med tillhörande odds mm. (används för att ge spelförslag i speldagboken)

Hästid och sammansatt nyckel (datum, loppnummer, bana) används för relationer.

Vart hämtar du tävlingshistorik förresten? Jag förmodar att det är via ATG eller travsport.se? Jag har upplevt prestandaproblem (begränsade anslutningar inom ett visst tidsintervall) hos ATG vilket gjorde insamligen av data mer tidskrävande än jag trodde. Har du upplevt samma problem? (Jag kör med CURL-biblioteket)

Ser fram emot återkoppling och dina synpunkter!

LosKrikon 2010-09-27 20:54

Oja, jag blir snabbt "cappad" på atg också. Dock kan jag ta ett lopp i taget med tillhörande statistik utan problem. Egentligen är det ju inget stort problem eftersom man bara behöver dra hem ett lopp en gång (om man inte vill ha mer data då). Man kan ju spara htmlen annars på disk och parsa om därifrån. Jag sparar dock inga filer på disken (förutom nåra för referens för snabbkoll i koden) utan matar in allt i databasen på en gång. Kontroll görs även om loppet/hästarna osv redan finns och då skippar den det.

Har inte mycket till gui eller nått, utan allt är en stor (typ 210 rader just nu) PHP-fil. När man kör den så dras all info till loppet man specificerat den till hem (så många parametrar som jag gjort hittils). Tänkte göra en enkel sida där man kan klicka på vad man vill göra. Tex dra hem nya lopp, uppdatera befintliga (nya saker man parsar ur som stått som null hittils tex) osv. När jag är klar så kommer jag dock ha ett mer avancerat gui där man kan ranka bäst spår vid 1640 autostart osv.

När jag kör enkla stats nu så är det direkt i MySQLs CLI. Kör WAMP själv. Inga extra bibliotek. Hämtar med file_get_contents() och parsar allt med strstr() och substr(). Har även gjort andra projekt på liknande sätt, och det var grymt snabbt att parsa. Bland annat en tvkalender (precis som TV Calendar fast helt rent interace och den har alla serier jag tittar på) som drar info (webscrape) från tvrage.com och stoppar in i en databas. Nu kan man dock köra via XML där men har inte brytt mig bygga om än. Visade koden som arbetsprov på en jobbintervju som systemutvecklare (i just PHP) jag sökte och fick jobbet :)

tino 2010-09-27 21:45

Citat:

Ursprungligen postat av LosKrikon (Inlägg 64140)
Oja, jag blir snabbt "cappad" på atg också. Dock kan jag ta ett lopp i taget med tillhörande statistik utan problem. Egentligen är det ju inget stort problem eftersom man bara behöver dra hem ett lopp en gång (om man inte vill ha mer data då). Man kan ju spara htmlen annars på disk och parsa om därifrån. Jag sparar dock inga filer på disken (förutom nåra för referens för snabbkoll i koden) utan matar in allt i databasen på en gång. Kontroll görs även om loppet/hästarna osv redan finns och då skippar den det.

Japp, jag har fått lägga in en "pipeline" med lopp som skall parsas och så har jag schemalagt körning. Att få in ca 600-700 lopp var inte så illa, tog knappt 1 dygn av konstant körning. Däremot tog det ca ytterligare 4 dygn att få in statistik för hästarna som kördes i lopp-batchar.

Citat:

Ursprungligen postat av LosKrikon (Inlägg 64140)
Har inte mycket till gui eller nått, utan allt är en stor (typ 120 rader just nu) PHP-fil. När man kör den så dras all info till loppet man specificerat den till hem (så många parametrar som jag gjort hittils). Tänkte göra en enkel sida där man kan klicka på vad man vill göra. Tex dra hem nya lopp, uppdatera befintliga (nya saker man parsar ur som stått som null hittils tex) osv. När jag är klar så kommer jag dock ha ett mer avancerat gui där man kan ranka bäst spår vid 1640 autostart osv.

När jag kör enkla stats nu så är det direkt i MySQLs CLI. Kör WAMP själv. Inga extra bibliotek. Hämtar med file_get_contents() och parsar allt med strstr() och substr(). Har även gjort andra projekt på liknande sätt, och det var grymt snabbt att parsa. Bland annat en tvkalender (precis som TV Calendar fast helt rent interace och den har alla serier jag tittar på) som drar info (webscrape) från tvrage.com och stoppar in i en databas. Nu kan man dock köra via XML där men har inte brytt mig bygga om än. Visade koden som arbetsprov på en jobbintervju som systemutvecklare (i just PHP) jag sökte och fick jobbet :)

Låter bra! preg_match_all() är grymt för detta ändamål också om du inte hunnit testa! :)

LosKrikon 2010-09-27 22:13

Häst/kusk/tränar-statstiken kan man ju lätt hämta i efterhand också, eftersom deras id finns i databasen när man väl fått in loppen (så kör jag allafall).

preg_match är fint, men har alltid undvikit pga prestandan, men med dagens datorer är det nog inga problem. Det sitter väl i sen "förr" dock. Är uppväxt med sunkiga datorer där man försökte pressa ur all prestanda. Även programmerat demos/intros osv på den gamla goda tiden. Älskar fortfarande hårdvarunära programmering i assembler. Även läst datorteknik med inriktning på inbyggda system (MCUer och DSPer). Riktigt intressant. Speciellt på DSPerna var man tvungen att optimera hårt eftersom programmen var beroende av det. Även läst datalogi, matematik och matematisk statistik. Allt har man nytta av till sånt här.

Plus att jag spelat och varit intresserad av framförallt systemspel sen mellanstadiet. Fast sen jag sålde jultidningar och en av böckerna var "Spela tippa vinn 5", som jag köpte. Hittade även nummer 2 på en loppis en gång och köpte för en femma, riktigt fynd. Har dock inte kvar någon av dem nu men ska köpa alla begagnade senare tänkte jag.

Tänkte först bygga en site lik abcranken men det är så långt mellan vinsterna att man kan få vänta livstider mellan det man får 7 rätt på V75, även med stora system. Då småspelar jag hellre och får lite vinnst i taget. Körde precis samma taktik när jag spelade poker online, satsade på cash games just för lite vinst i taget, istället för att turneringar där det är mycket vinst eller inget typ (vinsten växer exponentiellt med placeringen i turneringen) som gäller.

LosKrikon 2010-09-28 14:22

Blev just klar med parsingen för de tre viktigaste tabellerna (av nio), har även vissa värden färdiga för andra. Databasen ser ut såhär, fast kan ju komma att ändras:

Kod:

lopp (en per lopp)
+------------+-------------+------+-----+---------+----------------+
| Field      | Type        | Null | Key | Default | Extra          |
+------------+-------------+------+-----+---------+----------------+
| loppid    | int(11)    | NO  | PRI | NULL    | auto_increment |
| datum      | date        | YES  |    | NULL    |                |
| loppnummer | int(11)    | YES  |    | NULL    |                |
| distans    | int(11)    | YES  |    | NULL    |                |
| starttyp  | varchar(1)  | YES  |    | NULL    |                |
| bana      | varchar(50) | YES  |    | NULL    |                |
| V65        | tinyint(1)  | YES  |    | NULL    |                |
| V64        | tinyint(1)  | YES  |    | NULL    |                |
| V75        | tinyint(1)  | YES  |    | NULL    |                |
| DD        | tinyint(1)  | YES  |    | NULL    |                |
+------------+-------------+------+-----+---------+----------------+

lopp_stats (en per startnummer i varje lopp)
+-------------+---------+------+-----+---------+-------+
| Field      | Type    | Null | Key | Default | Extra |
+-------------+---------+------+-----+---------+-------+
| loppid      | int(11) | YES  | MUL | NULL    |      |
| startnummer | int(11) | YES  |    | NULL    |      |
| hastid      | int(11) | YES  |    | NULL    |      |
| kuskid      | int(11) | YES  |    | NULL    |      |
| tranarid    | int(11) | YES  |    | NULL    |      |
| distans    | int(11) | YES  |    | NULL    |      |
| odds        | int(11) | YES  |    | NULL    |      |
+-------------+---------+------+-----+---------+-------+

hastar (en för varje häst)
+--------+-------------+------+-----+---------+-------+
| Field  | Type        | Null | Key | Default | Extra |
+--------+-------------+------+-----+---------+-------+
| hastid | int(11)    | YES  | MUL | NULL    |      |
| namn  | varchar(50) | YES  |    | NULL    |      |
| fodd  | date        | YES  |    | NULL    |      |
| kon    | varchar(20) | YES  |    | NULL    |      |
| ras    | varchar(20) | YES  |    | NULL    |      |
+--------+-------------+------+-----+---------+-------+

hastar_stats (en för varje år per häst, plus en livs per häst)
+----------+---------+------+-----+---------+-------+
| Field    | Type    | Null | Key | Default | Extra |
+----------+---------+------+-----+---------+-------+
| hastid  | int(11) | YES  | MUL | NULL    |      |
| ar      | int(11) | YES  |    | NULL    |      |
| starter  | int(11) | YES  |    | NULL    |      |
| etta    | int(11) | YES  |    | NULL    |      |
| tvaa    | int(11) | YES  |    | NULL    |      |
| trea    | int(11) | YES  |    | NULL    |      |
| intjanat | int(11) | YES  |    | NULL    |      |
+----------+---------+------+-----+---------+-------+

kuskar (en för varje kusk)
+-----------+-------------+------+-----+---------+-------+
| Field    | Type        | Null | Key | Default | Extra |
+-----------+-------------+------+-----+---------+-------+
| kuskid    | int(11)    | YES  | MUL | NULL    |      |
| namn      | varchar(50) | YES  |    | NULL    |      |
| fodd      | int(11)    | YES  |    | NULL    |      |
| hemmabana | varchar(50) | YES  |    | NULL    |      |
| licens    | varchar(10) | YES  |    | NULL    |      |
+-----------+-------------+------+-----+---------+-------+

kuskar_stats (en för varje år per kusk)
+----------+---------+------+-----+---------+-------+
| Field    | Type    | Null | Key | Default | Extra |
+----------+---------+------+-----+---------+-------+
| kuskid  | int(11) | YES  | MUL | NULL    |      |
| ar      | int(11) | YES  |    | NULL    |      |
| starter  | int(11) | YES  |    | NULL    |      |
| etta    | int(11) | YES  |    | NULL    |      |
| tvaa    | int(11) | YES  |    | NULL    |      |
| trea    | int(11) | YES  |    | NULL    |      |
| intjanat | int(11) | YES  |    | NULL    |      |
+----------+---------+------+-----+---------+-------+

tranare (en för varje tränare)
+-----------+-------------+------+-----+---------+-------+
| Field    | Type        | Null | Key | Default | Extra |
+-----------+-------------+------+-----+---------+-------+
| tranarid  | int(11)    | YES  | MUL | NULL    |      |
| namn      | varchar(50) | YES  |    | NULL    |      |
| fodd      | int(11)    | YES  |    | NULL    |      |
| hemmabana | varchar(50) | YES  |    | NULL    |      |
| licens    | varchar(10) | YES  |    | NULL    |      |
+-----------+-------------+------+-----+---------+-------+

tranare_stats (en för varje år per tränare)
+----------+---------+------+-----+---------+-------+
| Field    | Type    | Null | Key | Default | Extra |
+----------+---------+------+-----+---------+-------+
| tranarid | int(11) | YES  | MUL | NULL    |      |
| ar      | int(11) | YES  |    | NULL    |      |
| starter  | int(11) | YES  |    | NULL    |      |
| etta    | int(11) | YES  |    | NULL    |      |
| tvaa    | int(11) | YES  |    | NULL    |      |
| trea    | int(11) | YES  |    | NULL    |      |
| intjanat | int(11) | YES  |    | NULL    |      |
+----------+---------+------+-----+---------+-------+

vinnare (en för varje lopp)
+------------+---------+------+-----+---------+-------+
| Field      | Type    | Null | Key | Default | Extra |
+------------+---------+------+-----+---------+-------+
| loppid    | int(11) | YES  | MUL | NULL    |      |
| hastid    | int(11) | YES  | MUL | NULL    |      |
| vinnarodds | float  | YES  |    | NULL    |      |
+------------+---------+------+-----+---------+-------+

Man kan såklart göra det bättre men föredrar enkelhet och snabbhet framför elegans i detta fallet.

LosKrikon 2010-09-28 16:52

tino: testa en grej! Kör analys (eller hur du nu sätter parametrar) enbart på den första halvan av dina minade data och se var du får för stats på tex alla Vxx 1640 lopp. Kör sedan testet mot andra halvan (som du inte använder analysresultat från) och kolla vad du får där. Altså ett litet minitest (även datamängden är för liten) hurvida statistik från gamla lopp även gäller framtida (viket man kan anta att den andra halvan är eftersom den inte är analyserad).

tino 2010-09-28 22:25

Citat:

Ursprungligen postat av LosKrikon (Inlägg 64347)
tino: testa en grej! Kör analys (eller hur du nu sätter parametrar) enbart på den första halvan av dina minade data och se var du får för stats på tex alla Vxx 1640 lopp. Kör sedan testet mot andra halvan (som du inte använder analysresultat från) och kolla vad du får där. Altså ett litet minitest (även datamängden är för liten) hurvida statistik från gamla lopp även gäller framtida (viket man kan anta att den andra halvan är eftersom den inte är analyserad).

Har jag förstått dig rätt om jag t.ex. har 100st lopp som är av karaktären kort distans så skall jag dela upp körningen i 50st lopp vardera och jämföra resultatet? Alla lopp är historiska och jag misstänker som sagt att jag har missuppfattat dig då jag inte förstår tanken bakom detta? :)

LosKrikon 2010-09-28 23:16

Tanken var att dela loppen i två delar, där du bara gör analys på den ena och sedan testar de optimala settingsen på den delen även på den andra delen och ser hur mycket tex ROI skiljer sig. Den andra delen kan då ses som "framtida" eftersom vi inte tagit hänsyn till dess statistik när vi gjorde analysen. Kontrollgrupp typ, istället för att göra analys på allt du har nu och sen kolla hur det blir med nya lopp, så får den andra halvan av loppen bli "nya" eftersom vi inte vet resultatet där (eller vet och vet, vi räknar inte med det allafall). Jag kommer köra så åtminstonne.

LosKrikon 2010-09-30 13:19

Kommit riktigt långt nu med mitt app. Det drar automatiskt hem alla lopp i kalendern, kan parsa loppen och stoppa i databasen. Det drar även hem statistiken för hästar/kuskar/tränare och parsar det viktigaste (lite kvar med det). Ska använda lopphemdragaren att göra samma sak med vinnarna också, behöver bara modifieras lite. Allt cachas dessutom nu. Så fort den ska ta hem något från nätet (utom kalendern då) så kontrolleras om den ligger i cachen först annars drar den hem från nätet och sparar i cachen. Konfade även om php och apache och allt är bra mycket snabbare nu. Verkar även ha hittat bra tider att vänta mellan man drar hem filer, har inte fått något fel senaste timmen. Har delat upp koden i flera filer också och man kan köra de olika delarna via en meny.

LosKrikon 2010-10-01 14:33

Har bara kvar att parsa år för årstatistik nu (av det jag tänkt använda mig av till en början allafall), ska fixa det idag, inga problem. Dock tar det tid att dra hem statistiken... 26 timmar beräknat. Har alla lopp och resultat till dem hemma dock.

LosKrikon 2010-10-02 01:05

Nu kan mitt app dra hem allt och parsa allt jag tänkt börja med. Ska sätta in rekordtider, galopprisk osv senare när det känns viktigare. Har även börjat på analysdelen, har spårstatistik just nu. Ska dela in den i distanser senare när ajg har fler lopp. Man ser dock redan nu tydliga tendenser mellan auto och volt. Har 650 lopp i databasen. Hur går det för dig?

tino 2010-10-02 08:06

Kul att se ditt engagemang LosKrikon!

Jag märkte inte större skillnader på Auto och Volt, däremot väldigt tydliga skillnader på kortdistanslopp vs långdistanslopp. Ser fram emot ditt resultat när du hunnit testa!

LosKrikon 2010-10-02 10:28

Just nu har jag inte delat in spår i distanser eftersom underlaget är för litet, men enligt min tabell så har de högsta startnummren (ej spår, skrev fel ovan) vid volt betydligt högre vinst % än än auto. Jag tar dock inte hänsyn till om en del hästar har tilllägg, än. Jag parsar det dock och stoppar in i databasen.

LosKrikon 2010-10-02 14:33

En liten analys av ROI per startnummer (n = 647):

http://i56.tinypic.com/34hi2xg.png

LTG 2010-10-02 19:27

Citat:

Ursprungligen postat av LosKrikon (Inlägg 64437)
Tanken var att dela loppen i två delar, där du bara gör analys på den ena och sedan testar de optimala settingsen på den delen även på den andra delen och ser hur mycket tex ROI skiljer sig. Den andra delen kan då ses som "framtida" eftersom vi inte tagit hänsyn till dess statistik när vi gjorde analysen. Kontrollgrupp typ, istället för att göra analys på allt du har nu och sen kolla hur det blir med nya lopp, så får den andra halvan av loppen bli "nya" eftersom vi inte vet resultatet där (eller vet och vet, vi räknar inte med det allafall). Jag kommer köra så åtminstonne.

Det LosKrikon talar om är ett vanligt förfarande för att minska risken för data-snooping (Data-snooping bias - Wikipedia, the free encyclopedia). Dela tillgänglig data i två delar (inte nödvändigtvis lika stora) och gör dina analyser och modelleringar med hjälp av data från den ena. Om du sedan testar modellen på den andra delen och resultatet skiljer sig markant så har du förmodligen överanalyserat datat och råkat ut för data-snooping.

Notera dock att detta förfarande förstås inte helt avvärjer risken för data-snooping. Del två kanske innehåller data som av någon anledning kan modelleras på samma sätt som den första delen, men som inte gäller framtida data. Kanske är det tex. någon parameter som ändras från säsong till säsong men både del 1 och två kommer från samma säsong. Eller så kan det vara bara slupmässiga variationer som orsakar det.

En annan sak att tänka på är att om man modellerar mha del ett och finner stor skillnad mot del två, uppdaterar modellen och testar mot del två igen osv så kommer man förr eller senare hitta någon som verkar modellera båda delarna bra men lider av problemet jag skrev om i förra stycket.

Ett sätt att testa om ens modell är gilltig kan vara att titta på hur dess verkliga resultat förhåller sig till det teoretiska. Är det tex. troligare att ett spel går in om modellen säger att det verkliga sannolikheten är 20% fel mot oddset jämfört med om modellen säger 10% fel. Ökar ROI i takt med att kraven på modellen om vad som är spelvärt ökar?

tino 2010-10-02 20:51

LTG då är jag med, tack! Dock är data-samplet jag har på 659 lopp (utan narrow-down) redan väldigt litet redan som det är nu så det är bäddat för stora avvikelser vid en uppdelning då man spelar högoddsare och kan få vänta i värsta fall 30-40 bets innan träff.

ATG verkar spara spel ca 10 veckor bakåt i historiken så när det passerat närmare 10 veckor sedan jag läste in samtliga lopp senast kommer jag att göra en ny körning för att dubbla min data och få fram mer statistisk säker data och utföra mer utförliga tester.

Tills dess kommer jag att testa mina teorier i praktiken för att bl.a. lära mig om hur odds rör sig långt innan / nära spelstopp med favoriter respektive outsiders och utvärdera taktiker för hur spel skall placeras samt läsa på om Trav generellt för att bli bättre då jag relativt sett är grön inom området men lärt mig en del kort på kort.

Tycker även det är kul att LosKrikon utför liknande tester vilket gör att man har någon att styrka eventuella teorier med och kan lära av varandra.

LosKrikon 2010-10-02 20:56

Bland det första jag funderade på var nått i stil med vad du skriver om i sista stycket. Hur bra måste modellen vara för ett vettigt ROI. Med den limiterade mängd data jag har just nu kan man dock se mönster redan. Till exemplel mellan vilka odds ROI är dåligt respektive bra. Enbart EN range på x till x+10 har jag hittat med positivt ROI. Man ser tydligt att de lägsta oddsen är överspelade med tanke på sitt ROI.

tino 2010-10-02 21:07

Citat:

Ursprungligen postat av LosKrikon (Inlägg 65289)
Bland det första jag funderade på var nått i stil med vad du skriver om i sista stycket. Hur bra måste modellen vara för ett vettigt ROI. Med den limiterade mängd data jag har just nu kan man dock se mönster redan. Till exemplel mellan vilka odds ROI är dåligt respektive bra. Enbart EN range på x till x+10 har jag hittat med positivt ROI. Man ser tydligt att de lägsta oddsen är överspelade med tanke på sitt ROI.

Jepp, nyckeln till framgång är att hitta bortglömda outsiders, vilket programmet hjälper till att hitta genom att analysera historisk data, skapa en ranking och därefter jämföra mot tillgängliga odds. Lägg därtill till att man är selektiv med vilka lopp man spelar, dvs. lopp som är mer skrällbenägna så känns det som att man har ett vinnande koncept redan med en halvdan algoritm.

LosKrikon 2010-10-02 22:03

Jag kommer nog ha flera typer av rankning, beroende på vad man vill. Först och främst vill jag dock hitta hästar som ger avkastning att satsa på via vinnare.

LosKrikon 2010-10-03 11:15

Citat:

Ursprungligen postat av tino (Inlägg 65288)
Tycker även det är kul att LosKrikon utför liknande tester vilket gör att man har någon att styrka eventuella teorier med och kan lära av varandra.

Precis därför jag försökte hitta nån som höll på med samma sak :)

LosKrikon 2010-10-03 14:21

Nu har jag fyra analyskörningar jag kan köra klara.

Startnummervinstprocent (hur ofta ett startnummer vinner i förhållande till antal starter)
Startnummerroi (ROI per startnummer)
ROI per oddsrange (ROI för alla intervall av odds i fasta steg, tex 0-10, 10-20 osv)
Max oddsrangeroi (räknar ut mellan vilka oddsvärden ROI är högst, kan vara 5-23, eller 17-64 eller vad det kommer fram till)

LosKrikon 2010-10-03 17:57

Känns som om jag håller på att ta över din tråd med alla mina poster men jag har nu byggt på ranksystemet. Den kör bara med två parametrar hittils (har ju hållt på hela 30 minuter med den...). Den räknar fram en ranksumma med de två parametrarna gånger var sin procentsats. Det man sedan får fram är de optimala procentsatserna och vilket roi man fick när man "spelade" med de värdena. Den häst med högst rank i varje lopp är den man satsar på.

Om du vill att jag tar det lugnt med postandet så säg till, känns som jag är den som postar mest just nu.

LosKrikon 2010-10-04 13:47

Citat:

Ursprungligen postat av tino (Inlägg 58236)
Om ATG har oddset 2.0 på en häst är således inte sannolikheten att hästen vinner 50 %, utan istället 41.66% (2 * (1/1.2)) om vi räknar på att ATG har en återbetalningsprocent på 80% (vilket vi dynamiskt kan plocka fram lopp för lopp då den kan variera någon procent).

Jag tror inte dina beräkningar stämmer där. Om ATG har en vinståterbetalningsprocent på 80% (vilket jag också får det till) så blir "sannolikheten" (egentligen hur stor procent av insatserna som är placerade på hästen) på den hästen 40%. Det fås genom 1 / (2/0,8).

Jag tror inte återbetalningen varierar, utan det är avrundningsfelen för oddsen som gör att det ser ut att vara så.

LosKrikon 2010-10-05 18:14

Har gjort analys nu på den datan jag har, och får ungefär samma värden på ROI som du. Dock har jag inte filtrerat loppen än, utan nu satsar man hela tiden på den högst rankade i varje lopp, i alla lopp. Ska fixa nått filter sen som sätter minsta rankpoäng och sånt.

LosKrikon 2010-10-06 18:09

Här kommer rekomendationer från mitt program (kan anses BETA) för dagens lopp, spela på egen risk:

http://i52.tinypic.com/157zuit.png

LTG 2010-10-06 20:47

LosKrikon, har du funderat på att lägga dem i ett spreadsheet för bättre/enklare uppföljning?

LosKrikon 2010-10-06 20:56

Japp, men det är intert i mitt app. Orkar definitivt inte sitta och fylla i manuellt. I mitt app klickar man bara på de hästar man satsat på så läggs de i ett ark. Och rättas automatiskt.

LosKrikon 2010-10-06 21:07

Kommer posta stats från det sen när jag har åtminstonne ett par dagar i det, hade dock gärna sett mer aktivitet i tråden.

Här är statstiken när jag kör på test, allt är medelvärden:

http://i52.tinypic.com/bea2dh.png

LTG 2010-10-07 09:22

Ok. Förstår att det är enklare att lägga till dem i ditt eget sheet.

Har du några krav på oddsen för att tex hästarna du postar ska vara spelvärda?
Hur stor är Analys resp. Kontroll grupperna?

LosKrikon 2010-10-07 10:34

"Har du några krav på oddsen för att tex hästarna du postar ska vara spelvärda?"

Nej, jag experimenterade lite med det, för att filtrera bort de lägsta oddsen och de högsta, för att på så sätt få bort de mest extrema fallen (att kanske det var nån högoddsare som gjorde det höga ROIet) men ROI ändrade sig bara marginellt så svaret är nej. Just nu bygger algoritmen på att den skapar en ROI-rank för varje häst, sen rekomenderar den hästen med högst rank i varje lopp, utan filter.

"Hur stor är Analys resp. Kontroll grupperna?"

Det kan jag ändra lätt, just nu är det ca 30 dagars lopp i varje, runt 350 st. Vet att det är alldeles för lite, men man får göra det man kan med det man har. Skulle gärna ha ett par tusen lopp, men med cika 300 lopp i månaden så får man ju vänta länge på det. Vet att det ROIet som visas är alldels för högt, men skulle nöja mig med hälften. Skulle jag bara få ett real life ROI på 110% så skulle jag vara mycket nöjd med det.

LosKrikon 2010-10-07 17:54

Dagens rekar, infall nån är intresserad:

http://i55.tinypic.com/2hzhgf5.png

LTG 2010-10-07 21:42

Ok. Vad baseras historiskt ROI på för odds? ATG close eller fast odds marknader?
Plockar du bästa odds för varje lopp eller är det en viss bestämd bookie?

Tolkar jag det rätt att din algoritm inte alls tar hänsyn till oddsen för dagen när den väljer spelvärda hästar?


300% ROI verkar enligt mig väldigt suspekt och jag lutar starkt åt att det är en hel del data-snooping inblandat. Som du säger så vet du att ROI är för högt vilket är bra.

Några saker som jag tycker att du bör kontrollera:
Använder du datat från kontrollgruppen för att ta fram algoritmen?
Använder du data från datum som ligger efter lopp X för att beräkna spelvärdet av lopp X?


Jag vet inte egentligen hur effektiv marknaden är för trav, och därmed hur stor ROI man kan tänkas uppnå.

Om du har opening och closing odds för loppen så kan du iaf se hur mycket oddsen rör sig och få ett hum om effektiviteten utav det. Mindre rörelser => effektivare marknad. Man kan säkert också beräkna ett mått på effektiviteten och maximal möjlig ROI eller nåt sånt, men jag vet inte riktigt hur.

LosKrikon 2010-10-07 22:56

"Vad baseras historiskt ROI på för odds? ATG close eller fast odds marknader?"

ATG close, har inte tillgång till annat.

"Plockar du bästa odds för varje lopp eller är det en viss bestämd bookie?"

Har enbart ATG i databasen, vilket gör att faktiskt real life ROI är högre om man kollar efter högre odds. I framtiden om konceptet funkar hyffsat så kommer jag dra hem fasta odds från andra bookies och sen få appet att inte bara rekomendera häst utan även var man ska betta.

"Tolkar jag det rätt att din algoritm inte alls tar hänsyn till oddsen för dagen när den väljer spelvärda hästar?"

Jo den tar hänsyn, men har inte så stor inverkan på rankpoängen som jag trodde den skulle ha från början. Har även exporterat vinstoddsen från körningarna och kollat fördelningen så att det inte är ett par storvinster som gör det höga ROIet. Men det är det inte.

"Använder du datat från kontrollgruppen för att ta fram algoritmen?"

Nej, algoritmen i sig är fast, men parametrarna till den är enbart baserade på analysgruppen (hur mycket de olika värdena ska viktas). De går att sätta manuellt men jag kör på de som har visat sig ha bäst resultat på både analys och kontrollgrupp.

"Använder du data från datum som ligger efter lopp X för att beräkna spelvärdet av lopp X?"

Japp, det är en stor brist det vet jag. Dessvärre går det inte filtrera ut vilka resultat som är från vissa datum på den datan jag har för kuskar och tränare, för hästar går det däremot, och det är något jag ska införa senare. Det är därför jag tycker det är viktigt att ha två grupper att testa mot. Skulle de olika gruppernas odds vara allt för olika så är det en av anledningarna tror jag. De skiljer sig nu också, men kontrollgruppen har högre odds än analysgruppen vilket är ett bra tecken allafall.

"Jag vet inte egentligen hur effektiv marknaden är för trav, och därmed hur stor ROI man kan tänkas uppnå."

Jag tror det mycket beror på hur stor återbetalningen är. På de fasta oddsmarknaderna är det definitivt de "felsatta" oddsen man tjänar på. De som är mycket högre än förväntat. Skulle jag inte tro att man kunde ha en edge så skulle jag inte vara intresserad, därför jag inte är minsta intresserad av lotterier till exempel. Poker har jag spelat massor online, i flera år, men tröttnat. Topptipset gillar jag (aldrig spelat dock) men man kan inte lämna in system online (via fil) vilket jag klagat på. Hade man kunnat det så hade det varit mycket intressant. Stryktipset och V75 är intressanta också men inte för enskilda spelare, utan för bolagsspel. Ska göra analys för Vxx sen också, med annan algoritm. Spelar man bara hästar där som har högst ROI i varje lopp så vinner man knappast. Tvärt om får man istället gå på vinstchans och blanda in några "ROI-hästar", det är balansen mellan de två som är intressant och något jag ska efterforska i sen.

"Om du har opening och closing odds för loppen så kan du iaf se hur mycket oddsen rör sig och få ett hum om effektiviteten utav det. Mindre rörelser => effektivare marknad. Man kan säkert också beräkna ett mått på effektiviteten och maximal möjlig ROI eller nåt sånt, men jag vet inte riktigt hur."

Drar hem oddsen cirka en halvtimme innan stängning före start av första loppet och kör rekomendationsappet då. Man kan ju dra fem minuter innan varje lopp om man vill det också.

LosKrikon 2010-10-08 17:24

Dagens rekar:

http://i51.tinypic.com/14czmlf.png

LosKrikon 2010-10-08 21:43

4 av 7 vinnare hittils idag. Inga vidare odds men ändå.

LosKrikon 2010-10-08 22:47

Meh, verkar som både lopp 9 och 10 ställdes in.... Fyra vinnare av åtta är inte helt fel allafall, även om det inte var 100+ i roi, men nästan allafall.

LosKrikon 2010-10-09 13:02

Dagens rekar:

http://i56.tinypic.com/dfhq2s.png

tino 2010-10-10 09:39

Citat:

Ursprungligen postat av LosKrikon (Inlägg 65513)
Känns som om jag håller på att ta över din tråd med alla mina poster men jag har nu byggt på ranksystemet. Den kör bara med två parametrar hittils (har ju hållt på hela 30 minuter med den...). Den räknar fram en ranksumma med de två parametrarna gånger var sin procentsats. Det man sedan får fram är de optimala procentsatserna och vilket roi man fick när man "spelade" med de värdena. Den häst med högst rank i varje lopp är den man satsar på.

Om du vill att jag tar det lugnt med postandet så säg till, känns som jag är den som postar mest just nu.

Lite sent svar.. men se absolut inte detta som min tråd! Du och alla andra får mer än gärna dela med er av era kunskaper och experiment vilket ökar chanserna till att vi lyckas hitta ett vinnande system - vilket är syftet med denna tråd!

Ett länktips (se PDF artikel) gällande att jaga Outsiders som jag tror att jag fick av KP ursprungligen om du inte hunnit läsa som är riktigt intressant!

Ser fram emot fortsatt intressanta inlägg!

LosKrikon 2010-10-10 11:22

Läste igenom alla deras artiklar, bra grejjer.



Powered by vBulletin & vBadvanced CMPS
Design, Logos, etc Copyright © Sharps.se, 2010-2011. All Rights Reserved