![]() |
Jo, fast inget program är ju helt perfekt. Man kan nog gå plus även om man tar alla rekomendationer, men kanske får lite mer edge om man gallrar manuellt också.
Vore konstigt om de limiterar en, med tanke på att ingen av oss verkar intresserad av att spela för stora pengar. Jag kommer börja med en instats på 10kr till exempel. |
Citat:
Citat:
Citat:
Jag har inte tagit ut någon data för ålder, kön eller ras (ännu). Jag tror man kan hitta på mycket roligt med detta, som t.ex. att undersöka om renodlade stolopp bäddar för mer outsider-vinster, eller som att exkludera/öka minodds på ston i lopp mot hingstar och vallacker. Citat:
Anledningen till att jag inte gjort det är för att jag främst kommer att spela på outsiders och mina spelobjekt har (oftast) inte någon känd kusk. Jag ser det således som en "extra" marginal till minimumoddset genom att inte har med detta, dvs. om jag hade med kuskpåverkan hade förmodligen de favorittippade hästarna fått större chans till vinst enligt mitt program och således höjt minimumoddset på outsiders jag letar efter - jag kan då lika gärna ställa om värdet för när en häst bedöms som spelvärd. "En outsiderspelare underskattar alltså inte kuskens vikt, men ser det hela på ett annat sätt än andra spelare. Mindre kända kuskar kan fungera som omotiverade oddshöjare, vilket självklart skall utnyttjas" för att citera Johan Lindvall. Missförstå mig dock inte - det är bra att samla in denna data och laborera med den så länge man använder det på rätt sätt. Citat:
1. Ladda ner loppdata med startlistor, odds mm. (underlag till backtestning) 2. Ladda ner tävlingsresultat mm. för deltagande hästar (underlag till backtestning) 3. Program för att backtesta och testa olika parametrar 4. Program för att ranka hästar och bedöma sannolikhet till vinst för ett kommande lopp med tillhörande odds mm. (används för att ge spelförslag i speldagboken) Hästid och sammansatt nyckel (datum, loppnummer, bana) används för relationer. Vart hämtar du tävlingshistorik förresten? Jag förmodar att det är via ATG eller travsport.se? Jag har upplevt prestandaproblem (begränsade anslutningar inom ett visst tidsintervall) hos ATG vilket gjorde insamligen av data mer tidskrävande än jag trodde. Har du upplevt samma problem? (Jag kör med CURL-biblioteket) Ser fram emot återkoppling och dina synpunkter! |
Oja, jag blir snabbt "cappad" på atg också. Dock kan jag ta ett lopp i taget med tillhörande statistik utan problem. Egentligen är det ju inget stort problem eftersom man bara behöver dra hem ett lopp en gång (om man inte vill ha mer data då). Man kan ju spara htmlen annars på disk och parsa om därifrån. Jag sparar dock inga filer på disken (förutom nåra för referens för snabbkoll i koden) utan matar in allt i databasen på en gång. Kontroll görs även om loppet/hästarna osv redan finns och då skippar den det.
Har inte mycket till gui eller nått, utan allt är en stor (typ 210 rader just nu) PHP-fil. När man kör den så dras all info till loppet man specificerat den till hem (så många parametrar som jag gjort hittils). Tänkte göra en enkel sida där man kan klicka på vad man vill göra. Tex dra hem nya lopp, uppdatera befintliga (nya saker man parsar ur som stått som null hittils tex) osv. När jag är klar så kommer jag dock ha ett mer avancerat gui där man kan ranka bäst spår vid 1640 autostart osv. När jag kör enkla stats nu så är det direkt i MySQLs CLI. Kör WAMP själv. Inga extra bibliotek. Hämtar med file_get_contents() och parsar allt med strstr() och substr(). Har även gjort andra projekt på liknande sätt, och det var grymt snabbt att parsa. Bland annat en tvkalender (precis som TV Calendar fast helt rent interace och den har alla serier jag tittar på) som drar info (webscrape) från tvrage.com och stoppar in i en databas. Nu kan man dock köra via XML där men har inte brytt mig bygga om än. Visade koden som arbetsprov på en jobbintervju som systemutvecklare (i just PHP) jag sökte och fick jobbet :) |
Citat:
Citat:
|
Häst/kusk/tränar-statstiken kan man ju lätt hämta i efterhand också, eftersom deras id finns i databasen när man väl fått in loppen (så kör jag allafall).
preg_match är fint, men har alltid undvikit pga prestandan, men med dagens datorer är det nog inga problem. Det sitter väl i sen "förr" dock. Är uppväxt med sunkiga datorer där man försökte pressa ur all prestanda. Även programmerat demos/intros osv på den gamla goda tiden. Älskar fortfarande hårdvarunära programmering i assembler. Även läst datorteknik med inriktning på inbyggda system (MCUer och DSPer). Riktigt intressant. Speciellt på DSPerna var man tvungen att optimera hårt eftersom programmen var beroende av det. Även läst datalogi, matematik och matematisk statistik. Allt har man nytta av till sånt här. Plus att jag spelat och varit intresserad av framförallt systemspel sen mellanstadiet. Fast sen jag sålde jultidningar och en av böckerna var "Spela tippa vinn 5", som jag köpte. Hittade även nummer 2 på en loppis en gång och köpte för en femma, riktigt fynd. Har dock inte kvar någon av dem nu men ska köpa alla begagnade senare tänkte jag. Tänkte först bygga en site lik abcranken men det är så långt mellan vinsterna att man kan få vänta livstider mellan det man får 7 rätt på V75, även med stora system. Då småspelar jag hellre och får lite vinnst i taget. Körde precis samma taktik när jag spelade poker online, satsade på cash games just för lite vinst i taget, istället för att turneringar där det är mycket vinst eller inget typ (vinsten växer exponentiellt med placeringen i turneringen) som gäller. |
Blev just klar med parsingen för de tre viktigaste tabellerna (av nio), har även vissa värden färdiga för andra. Databasen ser ut såhär, fast kan ju komma att ändras:
Kod:
lopp (en per lopp) |
tino: testa en grej! Kör analys (eller hur du nu sätter parametrar) enbart på den första halvan av dina minade data och se var du får för stats på tex alla Vxx 1640 lopp. Kör sedan testet mot andra halvan (som du inte använder analysresultat från) och kolla vad du får där. Altså ett litet minitest (även datamängden är för liten) hurvida statistik från gamla lopp även gäller framtida (viket man kan anta att den andra halvan är eftersom den inte är analyserad).
|
Citat:
|
Tanken var att dela loppen i två delar, där du bara gör analys på den ena och sedan testar de optimala settingsen på den delen även på den andra delen och ser hur mycket tex ROI skiljer sig. Den andra delen kan då ses som "framtida" eftersom vi inte tagit hänsyn till dess statistik när vi gjorde analysen. Kontrollgrupp typ, istället för att göra analys på allt du har nu och sen kolla hur det blir med nya lopp, så får den andra halvan av loppen bli "nya" eftersom vi inte vet resultatet där (eller vet och vet, vi räknar inte med det allafall). Jag kommer köra så åtminstonne.
|
Kommit riktigt långt nu med mitt app. Det drar automatiskt hem alla lopp i kalendern, kan parsa loppen och stoppa i databasen. Det drar även hem statistiken för hästar/kuskar/tränare och parsar det viktigaste (lite kvar med det). Ska använda lopphemdragaren att göra samma sak med vinnarna också, behöver bara modifieras lite. Allt cachas dessutom nu. Så fort den ska ta hem något från nätet (utom kalendern då) så kontrolleras om den ligger i cachen först annars drar den hem från nätet och sparar i cachen. Konfade även om php och apache och allt är bra mycket snabbare nu. Verkar även ha hittat bra tider att vänta mellan man drar hem filer, har inte fått något fel senaste timmen. Har delat upp koden i flera filer också och man kan köra de olika delarna via en meny.
|
Har bara kvar att parsa år för årstatistik nu (av det jag tänkt använda mig av till en början allafall), ska fixa det idag, inga problem. Dock tar det tid att dra hem statistiken... 26 timmar beräknat. Har alla lopp och resultat till dem hemma dock.
|
Nu kan mitt app dra hem allt och parsa allt jag tänkt börja med. Ska sätta in rekordtider, galopprisk osv senare när det känns viktigare. Har även börjat på analysdelen, har spårstatistik just nu. Ska dela in den i distanser senare när ajg har fler lopp. Man ser dock redan nu tydliga tendenser mellan auto och volt. Har 650 lopp i databasen. Hur går det för dig?
|
Kul att se ditt engagemang LosKrikon!
Jag märkte inte större skillnader på Auto och Volt, däremot väldigt tydliga skillnader på kortdistanslopp vs långdistanslopp. Ser fram emot ditt resultat när du hunnit testa! |
Just nu har jag inte delat in spår i distanser eftersom underlaget är för litet, men enligt min tabell så har de högsta startnummren (ej spår, skrev fel ovan) vid volt betydligt högre vinst % än än auto. Jag tar dock inte hänsyn till om en del hästar har tilllägg, än. Jag parsar det dock och stoppar in i databasen.
|
|
Citat:
Notera dock att detta förfarande förstås inte helt avvärjer risken för data-snooping. Del två kanske innehåller data som av någon anledning kan modelleras på samma sätt som den första delen, men som inte gäller framtida data. Kanske är det tex. någon parameter som ändras från säsong till säsong men både del 1 och två kommer från samma säsong. Eller så kan det vara bara slupmässiga variationer som orsakar det. En annan sak att tänka på är att om man modellerar mha del ett och finner stor skillnad mot del två, uppdaterar modellen och testar mot del två igen osv så kommer man förr eller senare hitta någon som verkar modellera båda delarna bra men lider av problemet jag skrev om i förra stycket. Ett sätt att testa om ens modell är gilltig kan vara att titta på hur dess verkliga resultat förhåller sig till det teoretiska. Är det tex. troligare att ett spel går in om modellen säger att det verkliga sannolikheten är 20% fel mot oddset jämfört med om modellen säger 10% fel. Ökar ROI i takt med att kraven på modellen om vad som är spelvärt ökar? |
LTG då är jag med, tack! Dock är data-samplet jag har på 659 lopp (utan narrow-down) redan väldigt litet redan som det är nu så det är bäddat för stora avvikelser vid en uppdelning då man spelar högoddsare och kan få vänta i värsta fall 30-40 bets innan träff.
ATG verkar spara spel ca 10 veckor bakåt i historiken så när det passerat närmare 10 veckor sedan jag läste in samtliga lopp senast kommer jag att göra en ny körning för att dubbla min data och få fram mer statistisk säker data och utföra mer utförliga tester. Tills dess kommer jag att testa mina teorier i praktiken för att bl.a. lära mig om hur odds rör sig långt innan / nära spelstopp med favoriter respektive outsiders och utvärdera taktiker för hur spel skall placeras samt läsa på om Trav generellt för att bli bättre då jag relativt sett är grön inom området men lärt mig en del kort på kort. Tycker även det är kul att LosKrikon utför liknande tester vilket gör att man har någon att styrka eventuella teorier med och kan lära av varandra. |
Bland det första jag funderade på var nått i stil med vad du skriver om i sista stycket. Hur bra måste modellen vara för ett vettigt ROI. Med den limiterade mängd data jag har just nu kan man dock se mönster redan. Till exemplel mellan vilka odds ROI är dåligt respektive bra. Enbart EN range på x till x+10 har jag hittat med positivt ROI. Man ser tydligt att de lägsta oddsen är överspelade med tanke på sitt ROI.
|
Citat:
|
Jag kommer nog ha flera typer av rankning, beroende på vad man vill. Först och främst vill jag dock hitta hästar som ger avkastning att satsa på via vinnare.
|
Citat:
|
Nu har jag fyra analyskörningar jag kan köra klara.
Startnummervinstprocent (hur ofta ett startnummer vinner i förhållande till antal starter) Startnummerroi (ROI per startnummer) ROI per oddsrange (ROI för alla intervall av odds i fasta steg, tex 0-10, 10-20 osv) Max oddsrangeroi (räknar ut mellan vilka oddsvärden ROI är högst, kan vara 5-23, eller 17-64 eller vad det kommer fram till) |
Känns som om jag håller på att ta över din tråd med alla mina poster men jag har nu byggt på ranksystemet. Den kör bara med två parametrar hittils (har ju hållt på hela 30 minuter med den...). Den räknar fram en ranksumma med de två parametrarna gånger var sin procentsats. Det man sedan får fram är de optimala procentsatserna och vilket roi man fick när man "spelade" med de värdena. Den häst med högst rank i varje lopp är den man satsar på.
Om du vill att jag tar det lugnt med postandet så säg till, känns som jag är den som postar mest just nu. |
Citat:
Jag tror inte återbetalningen varierar, utan det är avrundningsfelen för oddsen som gör att det ser ut att vara så. |
Har gjort analys nu på den datan jag har, och får ungefär samma värden på ROI som du. Dock har jag inte filtrerat loppen än, utan nu satsar man hela tiden på den högst rankade i varje lopp, i alla lopp. Ska fixa nått filter sen som sätter minsta rankpoäng och sånt.
|
Här kommer rekomendationer från mitt program (kan anses BETA) för dagens lopp, spela på egen risk:
http://i52.tinypic.com/157zuit.png |
LosKrikon, har du funderat på att lägga dem i ett spreadsheet för bättre/enklare uppföljning?
|
Japp, men det är intert i mitt app. Orkar definitivt inte sitta och fylla i manuellt. I mitt app klickar man bara på de hästar man satsat på så läggs de i ett ark. Och rättas automatiskt.
|
Kommer posta stats från det sen när jag har åtminstonne ett par dagar i det, hade dock gärna sett mer aktivitet i tråden.
Här är statstiken när jag kör på test, allt är medelvärden: http://i52.tinypic.com/bea2dh.png |
Ok. Förstår att det är enklare att lägga till dem i ditt eget sheet.
Har du några krav på oddsen för att tex hästarna du postar ska vara spelvärda? Hur stor är Analys resp. Kontroll grupperna? |
"Har du några krav på oddsen för att tex hästarna du postar ska vara spelvärda?"
Nej, jag experimenterade lite med det, för att filtrera bort de lägsta oddsen och de högsta, för att på så sätt få bort de mest extrema fallen (att kanske det var nån högoddsare som gjorde det höga ROIet) men ROI ändrade sig bara marginellt så svaret är nej. Just nu bygger algoritmen på att den skapar en ROI-rank för varje häst, sen rekomenderar den hästen med högst rank i varje lopp, utan filter. "Hur stor är Analys resp. Kontroll grupperna?" Det kan jag ändra lätt, just nu är det ca 30 dagars lopp i varje, runt 350 st. Vet att det är alldeles för lite, men man får göra det man kan med det man har. Skulle gärna ha ett par tusen lopp, men med cika 300 lopp i månaden så får man ju vänta länge på det. Vet att det ROIet som visas är alldels för högt, men skulle nöja mig med hälften. Skulle jag bara få ett real life ROI på 110% så skulle jag vara mycket nöjd med det. |
|
Ok. Vad baseras historiskt ROI på för odds? ATG close eller fast odds marknader?
Plockar du bästa odds för varje lopp eller är det en viss bestämd bookie? Tolkar jag det rätt att din algoritm inte alls tar hänsyn till oddsen för dagen när den väljer spelvärda hästar? 300% ROI verkar enligt mig väldigt suspekt och jag lutar starkt åt att det är en hel del data-snooping inblandat. Som du säger så vet du att ROI är för högt vilket är bra. Några saker som jag tycker att du bör kontrollera: Använder du datat från kontrollgruppen för att ta fram algoritmen? Använder du data från datum som ligger efter lopp X för att beräkna spelvärdet av lopp X? Jag vet inte egentligen hur effektiv marknaden är för trav, och därmed hur stor ROI man kan tänkas uppnå. Om du har opening och closing odds för loppen så kan du iaf se hur mycket oddsen rör sig och få ett hum om effektiviteten utav det. Mindre rörelser => effektivare marknad. Man kan säkert också beräkna ett mått på effektiviteten och maximal möjlig ROI eller nåt sånt, men jag vet inte riktigt hur. |
"Vad baseras historiskt ROI på för odds? ATG close eller fast odds marknader?"
ATG close, har inte tillgång till annat. "Plockar du bästa odds för varje lopp eller är det en viss bestämd bookie?" Har enbart ATG i databasen, vilket gör att faktiskt real life ROI är högre om man kollar efter högre odds. I framtiden om konceptet funkar hyffsat så kommer jag dra hem fasta odds från andra bookies och sen få appet att inte bara rekomendera häst utan även var man ska betta. "Tolkar jag det rätt att din algoritm inte alls tar hänsyn till oddsen för dagen när den väljer spelvärda hästar?" Jo den tar hänsyn, men har inte så stor inverkan på rankpoängen som jag trodde den skulle ha från början. Har även exporterat vinstoddsen från körningarna och kollat fördelningen så att det inte är ett par storvinster som gör det höga ROIet. Men det är det inte. "Använder du datat från kontrollgruppen för att ta fram algoritmen?" Nej, algoritmen i sig är fast, men parametrarna till den är enbart baserade på analysgruppen (hur mycket de olika värdena ska viktas). De går att sätta manuellt men jag kör på de som har visat sig ha bäst resultat på både analys och kontrollgrupp. "Använder du data från datum som ligger efter lopp X för att beräkna spelvärdet av lopp X?" Japp, det är en stor brist det vet jag. Dessvärre går det inte filtrera ut vilka resultat som är från vissa datum på den datan jag har för kuskar och tränare, för hästar går det däremot, och det är något jag ska införa senare. Det är därför jag tycker det är viktigt att ha två grupper att testa mot. Skulle de olika gruppernas odds vara allt för olika så är det en av anledningarna tror jag. De skiljer sig nu också, men kontrollgruppen har högre odds än analysgruppen vilket är ett bra tecken allafall. "Jag vet inte egentligen hur effektiv marknaden är för trav, och därmed hur stor ROI man kan tänkas uppnå." Jag tror det mycket beror på hur stor återbetalningen är. På de fasta oddsmarknaderna är det definitivt de "felsatta" oddsen man tjänar på. De som är mycket högre än förväntat. Skulle jag inte tro att man kunde ha en edge så skulle jag inte vara intresserad, därför jag inte är minsta intresserad av lotterier till exempel. Poker har jag spelat massor online, i flera år, men tröttnat. Topptipset gillar jag (aldrig spelat dock) men man kan inte lämna in system online (via fil) vilket jag klagat på. Hade man kunnat det så hade det varit mycket intressant. Stryktipset och V75 är intressanta också men inte för enskilda spelare, utan för bolagsspel. Ska göra analys för Vxx sen också, med annan algoritm. Spelar man bara hästar där som har högst ROI i varje lopp så vinner man knappast. Tvärt om får man istället gå på vinstchans och blanda in några "ROI-hästar", det är balansen mellan de två som är intressant och något jag ska efterforska i sen. "Om du har opening och closing odds för loppen så kan du iaf se hur mycket oddsen rör sig och få ett hum om effektiviteten utav det. Mindre rörelser => effektivare marknad. Man kan säkert också beräkna ett mått på effektiviteten och maximal möjlig ROI eller nåt sånt, men jag vet inte riktigt hur." Drar hem oddsen cirka en halvtimme innan stängning före start av första loppet och kör rekomendationsappet då. Man kan ju dra fem minuter innan varje lopp om man vill det också. |
|
4 av 7 vinnare hittils idag. Inga vidare odds men ändå.
|
Meh, verkar som både lopp 9 och 10 ställdes in.... Fyra vinnare av åtta är inte helt fel allafall, även om det inte var 100+ i roi, men nästan allafall.
|
|
Citat:
Ett länktips (se PDF artikel) gällande att jaga Outsiders som jag tror att jag fick av KP ursprungligen om du inte hunnit läsa som är riktigt intressant! Ser fram emot fortsatt intressanta inlägg! |
Läste igenom alla deras artiklar, bra grejjer.
|
Powered by vBulletin & vBadvanced CMPS
Design, Logos, etc Copyright © Sharps.se, 2010-2011. All Rights Reserved