Sharps är skapad av experter inom spelbranschen och alla rankningar av operatörer på vår sida är gjorda med stor diskretion. Vi hoppas att de online spelbolagen som vi har valt ut faller dig i smaken. När du väljer att klicka på en utgående länk på vår sida, kan vi komma att erhålla provision, dock utan någon kostnad från din sida. Läs hela meddelandet här.
promo
Logga in


Svara
 
LinkBack Ämnesverktyg
Gammal 2012-02-10, 11:36   #1
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Statistisk modellering


Tja!

Jag har funnit ett antal trådar startade av nykomlingar som vill ta steget fullt ut och bli professionella spelare. Detta är på sätt och vis ännu en sådan, men med den avgörande skillnaden att jag efterfrågar tips på hur man bygger statistiska modeller.

Följande tråd av Astvald är det närmaste jag kommer: https://www.sharps.se/forums/speldagb...-modeller-nhl/ - där han bl.a. presenterar lite information om Poisson-fördelning i samband med kod.

Jag har mycket små kunskaper både vad gäller programmering och statistik. Det jag söker är alltså tips på i vilken ände jag borde börja. Vilka kunskaper behövs för att bygga en statistisk modell?

1. Att jag behöver statistisk kunskap och programmeringsförmåga säger nog sig själv. Eller gör det? Behöver jag kunna invecklad PHP, eller dylikt, för att skapa en modell?

2. Eller räcker det om jag läser statistik på högskolenivå (förutsatt att den statistiska programvara jag får lära mig också låter mig bygga dessa modeller)? Rent spontant borde det räcka med att läsa statistik. Jag föreställer mig att man bygger modeller i statistisk programvara där man knappar in de formler (eller bara värden om formlerna göms under pedagogiska knappar) som skall tas hänsyn till i modellen?

3. Hur är det med databaskunskaper, ni som modellerar själva? Vilken typ av databas är att föredra för sina data (kan t.ex. MySQL kommunicera med statistisk programvara, eller finns en databasfunktion mer eller mindre inbyggd i dessa program)? (Jag känner mig ganska säker på vilka faktorer o.s.v. jag vill statistikföra i databasen, och modelleringen av denna är inte mitt största problem. Framför allt vill jag inte lägga ned onödiga terminer på programmering för att i slutändan upptäcka att statistikprogram gör hela jobbet.)

4. Går det att hämta data som redan existerar på webben och sätta upp i en egen databas? Hur går detta till? Astvald verkade ha hämtat data någonstans ifrån i sin modell där?

Jag vore mycket tacksam för vägledning vad gäller den tekniska biten. Om man vill lära sig mer eller mindre från scratch, och målet är en statistisk modell för fotboll - var börjar jag, och vilka kunskaper behöver jag?

Tack!

Edit: Jag hittade följande tråd som också handlar om modellering. Om än intressant så gav den inga direkta svar på mina frågor: https://www.sharps.se/forums/taenkarh...4-modellering/

Följande tråd gav ännu lite mera: https://www.sharps.se/forums/taenkarh...as-och-analys/ - Det var någon där som föreslog olika statistikprogram om man har stora datamängder (R, Matlab etc. räknades upp). Dessa verkar alltså räcka, varför jag inte behöver kunna någon programmering om jag läser statistik?

Dock kvarstår problemet om jag vill samla in data från befintliga databaser. Detta lär väl kräva ganska avancerade script, inte sant? Är PHP lösningen för det ändamålet?

Senast redigerad av Asprilla den 2012-02-10 klockan 11:56.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-10, 12:29   #2
 
dgothes avatar
 
Reg.datum: mar 2010
Inlägg: 347
Sharp$: 1075

Sabermetrics-Test MLB
Stats: 236 - 128 - 4
ROI: 109.75%
Vinstprocent: 65.00%

Standard

Tycker astvalds tråd är väldigt intressant och inspirerande. Statistik-kunskap på högskolenivå behövs inte, och inte heller några fantastiska programmeringskunskaper.. däremot bör du ha lite erfarenhet om varje..

Har du en statistisk modell som du vill testa så går det ju i teorin att testa manuellt. Antingen på papper eller i Excel (alternativt Google Docs, min personliga favorit).

Jag kan försöka svara på dina frågor ur personlig erfarenhetssynpunkt.

1) Ja och nej. Jag har ingen statistisk bakgrund alls, men jobbar som systemutvecklare. För mig var det mer ett programmeringsprojekt och lite bollande med låtsasformler tills jag stötte på Sabermetrics (baseball-analys), vilket jag sedan började använda mer och mer och skruvade lite på existerande formler. Andra kan komma från andra hållet, dvs har statistisk bakgrund men aldrig programmerat.

2) Högskolestatistik är överkurs. Du blir inte sämre av det, men det finns redan färdiga statistiska modeller och om man sätter sig in i dem och förstår det så kan man vidareutveckla själv (om man har lite bakom pannbenet).

3) Jag använder mig av databaser, för det är min bakgrund. Jag har även nyttjat Excel vilket gör det relativt enkelt att hämta in data från websidor och göra slagningar i den. Men om datan skulle vara av varierad layout och komma från flera olika ställen, ja då kan det bli problem. I mitt baseballprojekt använder jag mySQL och har skrivit all kod för analys och formeluträkning i php. I hockeyn använder jag Google Docs Spreadsheet och har skrivit alla formler där.. hugget som stucket..

4) Som sagt, du måste hämta datan någonstans ifrån om du vill automatisera saker och ting. I Google Docs och Excel kan du "importera" HTML-tabeller från en URL, men om du programmerar en egen lösning får du ladda ner data och parsa den själv (finns bibliotek för sådant i de flesta språk).
__________________
"Alla kan inte som jag koppla bort känslorna och se siffrorna" - pilen

-
To view links or images in signatures your post count must be 10 or greater. You currently have 0 posts.
dgothe är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-10, 16:18   #3
 
Jurets avatar
 
Reg.datum: jul 2011
Inlägg: 568
Sharp$: 4875

Hockey-VM 2013
Stats: 11 - 8 - 6
ROI: 113.31%
Vinstprocent: 57.89%

Standard

det var väldigt mycket frågor på en gång, men det är förståerligt. när man modellerar dyker det alltid upp nya problem, nya frågor att besvara. men det är också det som är oerhört kul.

jag skulle läsa Conquering Risk som handlar om hur man kan modellera sport, finns på Amazon.com, och en grundkurs i statistik om du inte stött på statistik tidigare. annars är www.khanacademy.org superbra för självstudier i bland annat statistik och sannolikhet. komplettera med wikipedia eller annat på Internet.
Juret är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-10, 16:42   #4
i hate bunnies
 
booreds avatar
 
Reg.datum: jan 2010
Ort: Akihabara
Inlägg: 1 452
Sharp$: 1188

mackapär ver.0.8.1
Stats: 2879 - 3456 - 618
ROI: 100.19%
Vinstprocent: 45.45%

Standard

Citat:
Dock kvarstår problemet om jag vill samla in data från befintliga databaser. Detta lär väl kräva ganska avancerade script, inte sant? Är PHP lösningen för det ändamålet?
De är ju mycket upp till vad du tycker är viktigt som bestämmer hur komplicerat det blir för att komma åt datan.

Jag tex anser inbördes möten inte är av nån vikt pga den lilla matchmängd sinsemellan under tex 10år, kan lika gärna vara varians så följaktligen behöver jag inte ha några resultat längre bak än pågående säsong.
Gamla säsonger buntar jag ihop en gång om året med klass indelning i excel där dom inte tar mer plats en ett par hundra rader per liga för 15 år. Inte precis nåt databas behov.

Alla har olika åsikter vad som är viktigt, tex vissa kan hjälpas åt att ladda upp saker som inte lätt går suga från sidor. En person läser Bundesliga rapporter med lite mer ingående stats och fyller i hörnor, offisides, ball possession, skott och whtever som kan tänkas ha betydelse på ett visst vis i ett online kalkylark, en annan gör en annan liga osv.
Var och en kan sedan suga in datan i sina egna program och använda den som de själva önskar. Datan är objektiv, användandet av datan är dock subjektivt.

Senast redigerad av boored den 2012-02-10 klockan 16:58.
boored är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 01:43   #5
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Spoiler:
Citat:
Ursprungligen postat av dgothe Visa inlägg
Har du en statistisk modell som du vill testa så går det ju i teorin att testa manuellt. Antingen på papper eller i Excel (alternativt Google Docs, min personliga favorit).

Jag kan försöka svara på dina frågor ur personlig erfarenhetssynpunkt.

1) Ja och nej. Jag har ingen statistisk bakgrund alls, men jobbar som systemutvecklare. För mig var det mer ett programmeringsprojekt och lite bollande med låtsasformler tills jag stötte på Sabermetrics (baseball-analys), vilket jag sedan började använda mer och mer och skruvade lite på existerande formler. Andra kan komma från andra hållet, dvs har statistisk bakgrund men aldrig programmerat.

2) Högskolestatistik är överkurs. Du blir inte sämre av det, men det finns redan färdiga statistiska modeller och om man sätter sig in i dem och förstår det så kan man vidareutveckla själv (om man har lite bakom pannbenet).

3) Jag använder mig av databaser, för det är min bakgrund. Jag har även nyttjat Excel vilket gör det relativt enkelt att hämta in data från websidor och göra slagningar i den. Men om datan skulle vara av varierad layout och komma från flera olika ställen, ja då kan det bli problem. I mitt baseballprojekt använder jag mySQL och har skrivit all kod för analys och formeluträkning i php. I hockeyn använder jag Google Docs Spreadsheet och har skrivit alla formler där.. hugget som stucket..

4) Som sagt, du måste hämta datan någonstans ifrån om du vill automatisera saker och ting. I Google Docs och Excel kan du "importera" HTML-tabeller från en URL, men om du programmerar en egen lösning får du ladda ner data och parsa den själv (finns bibliotek för sådant i de flesta språk).


Självklart går det att göra manuellt, men det kan effektiviseras rejält om man behärskar den tekniska biten. Ett exempel på det är en utredning jag företog mig. Jag ville veta hur antalet vilodagar påverkade utgången av engelska seriematcher (Premier League, Championship). Dels behövde jag jämföra lagens antal vilodagar sedan senaste match, samtidigt som jag noterar vilken matchtyp (seriematch eller cupmatch) som spelades i föregående match (eftersom somliga lag ställer över spelare i vissa matcher). Jag gjorde undersökningen på följande sida: http://soccernet.espn.go.com/fixture...=eng.2&cc=5739

Det tog ungefär en veckas heltidsarbete att göra manuellt för de tillgängliga säsongerna (2001-2012). På senare år blev dataunderlaget knapphändigt eftersom lagen allt oftare kom att ha samma antal vilodagar. Jag lyckades dock skönja tendenser. Om jag kunnat dra hem den rätta datan med ett script och rada upp i Excel eller dylikt så hade arbetet tagit ett par dagar på sin höjd. Jag hade då velat ha ett Excel-ark med följande data:

Kolumn 1: Hemmalag (t.ex. Brighton)
Kolumn 2: Bortalag (Plymouth)
Kolumn 3: Matchresultat (0-2)
Kolumn 4: Hemmalagets antal vilodagar sedan senaste match (2 st : 8+9 Augusti)
Kolumn 5: Bortalagets antal vilodagar sedan senaste match (2 st : 8+9 Augusti)
Kolumn 6: Vilken typ av tävlingsmatch hemmalaget spelade i föregående match (samma match som i kolumn 4) - Dessa kan vara Premier League, Championship, Carling Cup, FA Cup
Kolumn 7: Vilken typ av tävlingsmatch bortalaget spelade i föregående match (samma match som i kolumn 5) - Dessa kan vara Premier League, Championship, Carling Cup, FA Cup.

Hade det varit möjligt att hämta denna exakta data med hjälp av ett script? Hur pass invecklat hade det varit? Hade Excel klarat det med funktionen du nämner? Det känns som att jag behöver en hel del programmering för ändamålet...

2) Du nämner färdiga statistiska modeller. Sabermetrics? Är detta dataprogram som går att ladda ned? Jag fann wiki-sidan och förstår upplägget, men jag hittar inget program. När jag ser en modell framför mig ser jag ett program där jag matar in siffror och den spottar ur sig procentsiffror. Det går att utföra manuellt, men det tar evigheter när matchantalet ökar.

Spoiler:
Citat:
Ursprungligen postat av Juret Visa inlägg
det var väldigt mycket frågor på en gång, men det är förståerligt. när man modellerar dyker det alltid upp nya problem, nya frågor att besvara. men det är också det som är oerhört kul.

jag skulle läsa Conquering Risk som handlar om hur man kan modellera sport, finns på Amazon.com, och en grundkurs i statistik om du inte stött på statistik tidigare. annars är www.khanacademy.org superbra för självstudier i bland annat statistik och sannolikhet. komplettera med wikipedia eller annat på Internet.


Conquering Risk ska jag kolla närmare på. KhanAcademy verkade väl också bra. Han snackade jävligt snabbt bara, men det kommer man förstås in i (eller ja, klumpigt av mig att hoppa på Poisson-videon med en gång).

Spoiler:
Citat:
Ursprungligen postat av boored Visa inlägg
De är ju mycket upp till vad du tycker är viktigt som bestämmer hur komplicerat det blir för att komma åt datan.

Jag tex anser inbördes möten inte är av nån vikt pga den lilla matchmängd sinsemellan under tex 10år, kan lika gärna vara varians så följaktligen behöver jag inte ha några resultat längre bak än pågående säsong.
Gamla säsonger buntar jag ihop en gång om året med klass indelning i excel där dom inte tar mer plats en ett par hundra rader per liga för 15 år. Inte precis nåt databas behov.

Alla har olika åsikter vad som är viktigt, tex vissa kan hjälpas åt att ladda upp saker som inte lätt går suga från sidor. En person läser Bundesliga rapporter med lite mer ingående stats och fyller i hörnor, offisides, ball possession, skott och whtever som kan tänkas ha betydelse på ett visst vis i ett online kalkylark, en annan gör en annan liga osv.
Var och en kan sedan suga in datan i sina egna program och använda den som de själva önskar. Datan är objektiv, användandet av datan är dock subjektivt.


Jag håller nog med dig om att inbördes möten genom åren är en högst tvivelaktig faktor. Dock tror jag att returmöten kan ha en viss inverkan, där något lag förlorat senaste mötet (under samma säsong) och därför är extra taggade. Men att räkna med resultat från 2005 gör jag aldrig.

Tack till er alla för bra respons och överseende med många frågor!

Spelbolagen har förstås relativt perfekta kalkyler redan, där antalet vilodagar t.ex. redan lär vara en obligatorisk variabel. Dock är jag osäker på hur jag får fram spelbolagets procent för en match. Visst blir 100/2.00 = 50 %, men om oddset är 2.00 på hemmaseger så har väl spelbolaget dragit bort en del från den egentliga uträkningen, där oddset kanske landade på 2.10 (100/47.6). Alltså kan jag inte utgå från spelbolagens odds eftersom jag inte vet hur mycket eller litet ett specifikt spelbolag manipulerat sin beräkning i det synliga oddset. Därmed är det väl ganska svårt att jämföra sin modell med spelbolagens?

Senast redigerad av Asprilla den 2012-02-11 klockan 02:00.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 09:42   #6
 
Semicolons avatar
 
Reg.datum: okt 2011
Inlägg: 853
Sharp$: 1997


Stats: - -
ROI: %
Vinstprocent: %

Standard

Du kan ju ta en kik här?

http://www.pinnaclesports.com/bettin...otions/margins
Semicolon är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 10:35   #7
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Citat:
Ursprungligen postat av Semicolon Visa inlägg

Tack! Intressant, men jag känner mig osäker på hur marginalerna inverkar på slutoddset. Svenska Spel har följande linje på Sunderland - Arsenal idag:

3,40 - 2,15 - 2,00 =
29,4 % - 46,5 % - 50 % = Totalt 125,9 %

Kan jag räkna ut deras exakta marginal, och därmed den exakta chansen de beräknat för respektive tecken?

Betyder ovanstående att SvS har en marginal på 8,64 % (25,9 %/3 utfall) per tecken, och att deras beräknade chans för respektive tecken egentligen är:

20,76 % - 37,86 % - 41,36 %

Är jag säker på att de "lagt till" samma procentsats - i det här fallet 8,64 % per tecken, på varje tecken? Eller kan de ha lagt till 12 % på tvåan, 4 % på ettan o.s.v? Är det självklart att de lägger till lika mycket på varje tecken? Eller lägger de kanske till mera på ett tecken som spelas i större utsträckning (i detta fall tvåan)?

Svenska Spel är dessutom inte helt konsekventa, vilket väl talar för att olika utfall har olika marginaler (även i samma match)? Jag fick följande summor på dagens matcher i Championship:

Barnsley - Birmingham: 125,31
Hull - Bristol City: 125,78
Ipswich - Middlesbrough: 125,3
Leeds - Brighton: 125,2
Leicester - Cardiff: 125,38
Millwall - Derby: 125,9
Nottingham - Watford: 125,38
Reading - Coventry: 125,24
Southampton - Burnley: 125,84

Medel: 125,48

Summan skiljer sig alltså. Varför? Borde inte spelbolaget alltid använda exakt samma riskberäkning? Kan man säga att Svenska Spel är mest osäkra i sin bedömning av Millwall - Derby, eftersom denna summa är högst?

Senast redigerad av Asprilla den 2012-02-11 klockan 11:00.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 10:54   #8
 
LadyDeWinters avatar
 
Reg.datum: aug 2010
Inlägg: 156
Sharp$: 160


Stats: - -
ROI: %
Vinstprocent: %

Standard

Om du ska göra system kring fotboll rekomenderar jag:

http://www.football-data.co.uk

HELT fantastiskt bra hemsida. Där finns all historisk statistik för alla matcher och dessutom alla olika odds för dessa matcher. (Ex. Avg. Ö/U 2.5, 1x2, Max. Ö/U 2,5)-

Om du kör andra sporter finns det inte lika bra utbud av historiska odds och statistik.

För att få dessa odds så använder jag med lite simpel VBA-programmering en Webquery som uppdaterar sig själv och hämtar statistiken från alla matcher i vald liga. För detta går det använda valfri sida med historiska odds/statistik.

Jag har även en tråd i (https://www.sharps.se/forums/speldagb...-far-vara-med/) där jag visar hur jag sorterar min statistik lite.

Ska precis börja studera lite informationssystems-kurser (SQL o.s.v.) vid sidan av min examen, får hoppas att det går att integrera i dessa system.
LadyDeWinter är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 21:40   #9
 
dgothes avatar
 
Reg.datum: mar 2010
Inlägg: 347
Sharp$: 1075

Sabermetrics-Test MLB
Stats: 236 - 128 - 4
ROI: 109.75%
Vinstprocent: 65.00%

Standard

en statistisk modell är inget program, det är en uppsättning formler för det ena och det andra.. dessa formler går att, med rätt parametrar, göra manuellt, men givetvis blir det enklare om du har ett verktyg för att göra det.. men blanda inte ihop en statistisk modell med programmet som hjälper dig räkna ut sannolikheten.. se det som subtraktion och multiplikation är dina statiska modeller och verktyget är miniräknaren..

Sabermetrics är en samling analytiska formler för att värdera baseball i första hand, men vissa av dess formler kan användas till andra sporter också..
__________________
"Alla kan inte som jag koppla bort känslorna och se siffrorna" - pilen

-
To view links or images in signatures your post count must be 10 or greater. You currently have 0 posts.
dgothe är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 23:20   #10
 
Enroths avatar
 
Reg.datum: sep 2011
Inlägg: 110
Sharp$: 114


Stats: - -
ROI: %
Vinstprocent: %

Standard

För en nybörjare skulle jag vilja påstå att Access är det enklaste och kanske även bästa programmet för att lagra statistik. Microsofts hjälpdokumentation är gigantisk och förklarar så att en person utan grundskolebetyg borde förstå, dessutom finns otaliga privata sidor med mer avancerade tips/guider.

"Programmet" som nämns tidigare i tråden måste nog Excel vara det enklaste och mest lättförståeliga på marknaden - samma sak här med Microsofts hjälpdokumentation och ett ännu större antal sidor på nätet som behandlar programmet.

Med väldigt lite kunskaper kan man enkelt få ut all tänkbar information/statistik från Access och implementera dessa i de matematiska formler man vill använda och X/% är ju lika med odds - klura en kväll så behöver du inte göra annat än att placera automatiskt utvalda spel
Enroth är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-11, 23:24   #11
i hate bunnies
 
booreds avatar
 
Reg.datum: jan 2010
Ort: Akihabara
Inlägg: 1 452
Sharp$: 1188

mackapär ver.0.8.1
Stats: 2879 - 3456 - 618
ROI: 100.19%
Vinstprocent: 45.45%

Standard

Citat:
Ursprungligen postat av Asprilla Visa inlägg

Betyder ovanstående att SvS har en marginal på 8,64 % (25,9 %/3 utfall) per tecken...
Svenska Spel är ett specialfall.
För att kringgå att staten nekar SvS höja återbetalningsprocenten(80%) till konkurrenskraftigare siffror tar man största marginalen på krysset, vilket höjer 1 och 2 till iaf närmare marknadens odds. Nåt i stil med 90%-50%-90%, istället för 80%-80%-80% som vore logiskt.
Särskilt i svenska ligor dumpar SvS X för att vara konkurrens kraftiga på dom andra tecknen, mindre så i utländska ligor men samma tendens.

Senast redigerad av boored den 2012-02-11 klockan 23:28.
boored är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 09:25   #12
 
Reg.datum: jan 2012
Inlägg: 12
Sharp$: 407
Standard

Enroth du får det att låta väldigt enkelt.

Säg att jag vill hämta statistik från ett lag och sedan analysera den, te.x Djurgården fotboll. Jag använder mig av Excel.

Då hittar jag te.x http://annabet.com/se/soccerstats/re...arden,191.html

importerar in den i excel och formaterar datan så den går att analysera.

sedan går det några veckor och jag vill analysera datan igen, så jag går in excel dokumentet och uppdaterar tabellen med de nya resultaten. Men då så uppdateras ju tabellen tillbaka till det vanliga formatet och jag får återigen formatera datan.

det känns som att det är svårt att hitta sidor som har tabeller som är helt optimala så man slipper formatera datan. Många sidor försöker väl också stoppa så man inte enkelt ska kunna scrapa deras information rakt av?

finns det något sätt att automatisera formateringen av datan i excel så man slipper göra sånt varje gång man ska in och analysera?

Mvh
Kenneth15 är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 10:17   #13
 
Enroths avatar
 
Reg.datum: sep 2011
Inlägg: 110
Sharp$: 114


Stats: - -
ROI: %
Vinstprocent: %

Standard

Citat:
Ursprungligen postat av Kenneth15 Visa inlägg
Enroth du får det att låta väldigt enkelt.

Säg att jag vill hämta statistik från ett lag och sedan analysera den, te.x Djurgården fotboll. Jag använder mig av Excel.

Då hittar jag te.x http://annabet.com/se/soccerstats/re...arden,191.html

importerar in den i excel och formaterar datan så den går att analysera.

sedan går det några veckor och jag vill analysera datan igen, så jag går in excel dokumentet och uppdaterar tabellen med de nya resultaten. Men då så uppdateras ju tabellen tillbaka till det vanliga formatet och jag får återigen formatera datan.

det känns som att det är svårt att hitta sidor som har tabeller som är helt optimala så man slipper formatera datan. Många sidor försöker väl också stoppa så man inte enkelt ska kunna scrapa deras information rakt av?

finns det något sätt att automatisera formateringen av datan i excel så man slipper göra sånt varje gång man ska in och analysera?

Mvh
Det jag beskrev är väldigt enkelt. Och jag tror inte någon kan nämna ett enklare program att göra det i.


Men som du nämner kan det va svårt att hitta sidor som är enkla att plocka statistik utav. För att skriva ett sånt script kan man behöva läsa några guider om macros, eller liknande om man inte helt enkelt kör på att klippa och klistra in det enligt någon mall, direkt i accessdatabasen eller via en .txt som access hämtar ifrån.

Sen, som jag nämnde, tipsade jag om att använda en databas (Access) och låta Excel hämta information ifrån denna. Vill man backa är det ju bara att backa. Inte många siffror som behövs ändras för det.


Självklart finns det många program som utmärkt klarar det som Excel och Access klarar - säkerligen med råge. Men saknar man utbildning och erfarenhet inom ämnet tror jag som sagt inte att det finns någon enklare mjukvara att använda/lära sig.

Utbildade väljer ju så klart den mjukvara de är bildade i eller använder till vardags.
Enroth är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 11:11   #14
 
Persas avatar
 
Reg.datum: jan 2011
Inlägg: 474
Sharp$: 3963

Persas fotboll - 2013/2014
Stats: 6 - 2 - 0
ROI: 158.91%
Vinstprocent: 75.00%

Standard

Att hämta ut information från webbsidor är relativt enkelt om man har lite programmeringskunskaper. Utmaningen är att filtrera och hitta mönster.

Låt oss ta ett exempel där vi vill ha lite speciell statistik som t.ex. hörnor, offsides, fouls etc. Vi använder oss av ESPN Soccernet.

Spoiler:
  1. Leta upp tabellen för ligan där det finns länkar till respektive lag:
    http://soccernet.espn.go.com/tables/...league?cc=5739
  2. Kolla källkoden och skriv nu kod som filtrerar bort allt förutom länkarna till respektive lag. Resultatet blir följande:
    http://soccernet.espn.go.com/team/_/...chester-united
    http://soccernet.espn.go.com/team/_/...anchester-city
    etc.
  3. Nu är länkarna i sig oanvändbara då dessa sidor inte innehåller informationen du vill ha. Det som dock är intressant är själva id:et och namnet som vi ska använda oss av för att hitta rätt sida.

    För Manchester United är id:et "360" och namnet "manchester-united".
    För Manchester City är id:et "382" och namnet "manchester-city".

    Den sida som innehåller alla spelade matcher (endast PL) för respektive lag har följande adress:
    http://soccernet.espn.go.com/team/fixtures/_/id/$ID/league/eng.1/$NAMN?cc=5739

    Spara undan den nya adressen med korrekt id och namn i en array.
    http://soccernet.espn.go.com/team/fi...united?cc=5739
    http://soccernet.espn.go.com/team/fi...r-city?cc=5739
    etc.
  4. Nu har vi en array som är 20 lång, det vill säga en länk för respektive lag. Hämta hem varje länk och filtrera så att endast länkar som startar med "/report/_/id/" finns kvar. Nu har du ett gäng länkar som börjar med "/report/_/id/" och slutar med ett ID. Detta ID ska läggas in i följande länk
    http://soccernet.espn.go.com/match?id=$ID&cc=5739

    För Manchester Uniteds första match (borta mot WBA) får vi:
    http://soccernet.espn.go.com/match?id=318256&cc=5739
  5. Spara undan all nödvändig data i en SQL databas och glöm inte datum och match_id från föregående punkt. Anledningen att spara match_id är att inte spara dubblicerade rader i SQL databasen. Kolla därför alltid om databasen redan har respektive match_id inlagt eller inte innan du sparar.

Senast redigerad av Persa den 2012-02-12 klockan 11:14.
Persa är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 12:46   #15
ALA
 
Reg.datum: jul 2010
Inlägg: 227
Sharp$: 1512
Standard

finns det något sätt att automatisera formateringen av datan i excel så man slipper göra sånt varje gång man ska in och analysera?



Har du prövat att lägga upp ett makro som sköter formateringen?
__________________
ALA
ALA är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 13:02   #16
 
LadyDeWinters avatar
 
Reg.datum: aug 2010
Inlägg: 156
Sharp$: 160


Stats: - -
ROI: %
Vinstprocent: %

Standard

Citat:
Ursprungligen postat av ALA Visa inlägg
finns det något sätt att automatisera formateringen av datan i excel så man slipper göra sånt varje gång man ska in och analysera?



Har du prövat att lägga upp ett makro som sköter formateringen?
Makro är ett utmärkt verktyg för detta. Bara recorda och sen loopa!
LadyDeWinter är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 13:41   #17
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Excels hämta-funktion var alldeles utmärkt. Jag kan absolut tänka mig att plocka hem information om ett lag åt gången. Dock insåg jag just mina begränsningar. Anta att jag vill undersöka hur det påverkar ett lags prestationer att deras bäste målgörare är frånvarande.

1. Antingen gör jag det manuellt genom att jämföra spelarens framträdanden (appearances - ESPN.com) med lagets spelschema och skriver upp resultaten när toppspelare inte deltar. Det tar mig högst ett dygn för en säsong, om jag bara plockar med ligans vassaste målskyttar.

2. Eller så bygger jag en relationsdatabas för innevarande säsong (det kan väl vara en fördel att bygga dessa säsongsvis med tanke på att spelare byter klubbar). Detta är mig en oöverstiglig uppgift eftersom det kräver att jag hämtar detaljerad information om ligans samtliga matcher, d.v.s. vilka spelare som deltog i varenda match.
Att sätta upp en lista med alla spelare går fort, och de får ett ID-nummer. Men att koppla varje spelare till varenda match skulle ju ta en evighet, även om jag vet vilka relationer som behövs i databasen. Detta måste väl ske manuellt eftersom mina spelar-ID-nummer inte kommer att matcha någonting av den detaljerade information som jag hämtar med Excel-funktionen? Eller skulle jag kunna få matchinformationen (vilka spelare som startade) för varje match att på något sätt connecta med mina spelar-ID?

Vissa saker går helt enkelt snabbare att undersöka manuellt. Någon som håller med? Problemet blir att underlaget blir torftigt om jag gör det manuellt. Med en databas kan jag ju se exakt hur lagens prestationer skiljer sig beroende på vilken spelare som inte deltagit, d.v.s. jag kan rada upp spelare (oavsett lag) efter exempelvis antalet gjorda mål, och jämföra detta med matcher där dessa spelare inte deltagit.



Edit: Eller var det detta Persa snackade om i sin post? Jag hängde ungefär med på att man med hjälp av sökvägen kan filtrera ut rätt information, men jag förstod ändå inte hälften av inlägget. Skulle det kunna tillämpas på mitt exempel i denna post? Går det att hämta informationen för samtliga matcher under en säsong - vilka som startade etc, och knyta detta till en separat tabell över alla spelare?

Senast redigerad av Asprilla den 2012-02-12 klockan 13:54.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 19:36   #18
 
LadyDeWinters avatar
 
Reg.datum: aug 2010
Inlägg: 156
Sharp$: 160


Stats: - -
ROI: %
Vinstprocent: %

Standard

Citat:
Ursprungligen postat av Asprilla Visa inlägg
Excels hämta-funktion var alldeles utmärkt. Jag kan absolut tänka mig att plocka hem information om ett lag åt gången. Dock insåg jag just mina begränsningar. Anta att jag vill undersöka hur det påverkar ett lags prestationer att deras bäste målgörare är frånvarande.

1. Antingen gör jag det manuellt genom att jämföra spelarens framträdanden (appearances - ESPN.com) med lagets spelschema och skriver upp resultaten när toppspelare inte deltar. Det tar mig högst ett dygn för en säsong, om jag bara plockar med ligans vassaste målskyttar.

2. Eller så bygger jag en relationsdatabas för innevarande säsong (det kan väl vara en fördel att bygga dessa säsongsvis med tanke på att spelare byter klubbar). Detta är mig en oöverstiglig uppgift eftersom det kräver att jag hämtar detaljerad information om ligans samtliga matcher, d.v.s. vilka spelare som deltog i varenda match.
Att sätta upp en lista med alla spelare går fort, och de får ett ID-nummer. Men att koppla varje spelare till varenda match skulle ju ta en evighet, även om jag vet vilka relationer som behövs i databasen. Detta måste väl ske manuellt eftersom mina spelar-ID-nummer inte kommer att matcha någonting av den detaljerade information som jag hämtar med Excel-funktionen? Eller skulle jag kunna få matchinformationen (vilka spelare som startade) för varje match att på något sätt connecta med mina spelar-ID?

Vissa saker går helt enkelt snabbare att undersöka manuellt. Någon som håller med? Problemet blir att underlaget blir torftigt om jag gör det manuellt. Med en databas kan jag ju se exakt hur lagens prestationer skiljer sig beroende på vilken spelare som inte deltagit, d.v.s. jag kan rada upp spelare (oavsett lag) efter exempelvis antalet gjorda mål, och jämföra detta med matcher där dessa spelare inte deltagit.



Edit: Eller var det detta Persa snackade om i sin post? Jag hängde ungefär med på att man med hjälp av sökvägen kan filtrera ut rätt information, men jag förstod ändå inte hälften av inlägget. Skulle det kunna tillämpas på mitt exempel i denna post? Går det att hämta informationen för samtliga matcher under en säsong - vilka som startade etc, och knyta detta till en separat tabell över alla spelare?
Nu är jag trött i skallen, då det är söndag och klockan börjar närma sig sent. hur jag skulle lösa detta problem är att:

1. Hitta en hemsida där det finns laguppställningar för varje spelad match samt resultat.

2. Hämta ner denna informationen för alla matcher och lag i olika worksheets (ett för varje lag) genom ett macro som hämtar efter ett ID.
(T.ex. http://stats.swehockey.se/gameonline/65444/LineUp där är IDt 65444 och då hämta alla dessa inom en viss säsong t.ex. från 65444 till 67000 och då loopar man scriptet så det kör en count med x = 65 444 och x = x + 1 hela tiden). Det brukar finnas bra webplatser för detta att hitta om man letar.

3. I makrot som hämtar ner detta så ska det bara sorteras snyggt och prydligt för varje match. Du har nu ett worksheet för varje lag och i detta worksheetet finns det information om laguppställningen och resultatet i varje match.

4. För att få fram hur viktig en person är för varje lag så kan du ge varje spelare "rankingpoäng".

T.ex "Team Sharps" worksheet efter två matcher:




Dessa kan summeras genom att lägga in lite formler manuellt, tar inte så lång tid:

För t.ex Jonny och hur bra snitt han har för gjorda mål i laget per match:

=(SUMPRODUCT(($A$17:$A$27=$A12)*$B$17:$B$27))/(SUMPRODUCT(($A$17:$A$27=$A12)*$F$17:$F$27))

Då får du snittet för Jonny.

5. Sen ranka är det bara använda sumproduct-funktionen på samma sätt när man ska läsa av om de är med i startuppställningen. (Börjar bli trött på att skriva, så det får vara bra här)

Säg till om det är något du undrar, om det ens var detta du ville ha svar på. Annars har jag gjort en waste på 15 min, men värre saker har ju hänt.


Tar några timmar att fixa det, men skönt att ha det gjort då man kan använda samma macron sen till att lägga in spelare och sortera från vilken serie man vill.

Edit.

Är otroligt trött och tänkte inte efter helt och hållet, denna statistiken finns ju överallt. Superfail.

Nåja. Samma princip som du vill ha nytta av går att använda med sumproduct om du summerar produkterna för de spelare som spelar i dagens startuppställning t.ex.... (huvudvärk)
Följande användare gav Sharp$ för den här posten:
Bjourne (+10)

Senast redigerad av LadyDeWinter den 2012-02-12 klockan 19:47.
LadyDeWinter är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-12, 21:18   #19
 
Reg.datum: jan 2012
Inlägg: 12
Sharp$: 407
Standard

Grymt inlägg LadyDeWinter, lust att visa exemplet på macrot som hämtar informationen?

Mvh
Kenneth15 är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-13, 05:08   #20
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Tack för engagemanget, LadyDeWinter!

Jag förstår ungefär vad du gör för något. Ett macro är något som upprepar en process, ungefär som ett script. I ett macro kan man även använda sig av IF- och ELSE- och WHILE-satser o.s.v. precis som i ett script. Känner dock att jag måste läsa på någon vecka för att förstå detta bättre, framför allt om hur man spelar in sitt macro.

Du har rätt i att din information inte riktigt är vad jag sökte. Dock är du på rätt spår. Att fixa ett macro av det slag jag skulle önska går säkert också att göra.

Jag är ute efter följande:

1. Statistiken för en enskild match ser ut såhär: http://soccernet.espn.go.com/gamecas...308183&cc=5739 - I detta fall Leeds - Derby.

2. Varje lag har även en utförlig statistik över samtliga spelare för varje säsong: http://soccernet.espn.go.com/team/sq...united?cc=5739

Informationen i steg 2 har jag enkelt fått ned genom att manuellt gå in på varje lags truppstatistik i Excel-fönstret. Det gick fint och ser ut såhär när jag snyggat till det:



Alla spelare har fått ett ID (primary key) och en klubbtilhörighet (foreign key). Problemet är att koppla samtliga spelare i samtliga matcher till det ID-nummer de tilldelats m.h.a. denna sammanlagda truppstatistik.

En sak är att match-ID - i detta fall 308183 (steg 1) - blir svårt att gå efter, eftersom nästa match med ID 308184 är en match från League 2 och inte från Championship. Dock borde man förstås kunna hämta ALLA matcher under en säsong (oavsett division) eftersom ett lags spelare rimligtvis bara spelar för just det laget, och det därför borde gå att matcha rätt lag med rätt matcher.

Om jag importerar den där statistiken för matchen Leeds - Derby, ser det ut på följande sätt i Excel:



Jag har ringat in den relevanta informationen som jag vill åt.

För det första får jag en massa dödkött runtomkring som jag inte är intresserad av. Men visst, det går säkert att få macrot att ignorera denna genom att man anger vilka celler macrot ska jobba på (jag antar det).

För det andra är lagets spelare uppdelade på "startande" och "substitutes". Detta måste jag få macrot att fatta, så att enbart spelarna i den övre "gruppen" matchas som startande mot sitt spelar-ID.

För det tredje har spelarna positionsmarkeringar efter sina namn, t.ex. (D) (defensive) eller (M) (midfielder). I min andra tabell med alla spelare för alla lag, har jag givetvis inga positionsmarkeringar eftersom dessa kan skifta från match till match. Kommer detta att vara störande information när macrot försöker matcha tabellerna?

Hur matchar man två tabeller? Vad blir resultatet av detta? En ny egen tabell för varje enskild spelare, ungefär som "appearances" här: http://soccernet.espn.go.com/player/...morgan?cc=5739

Ja, den där informationen finns också att hämta. Kunde jag dra nytta av dessa tabeller istället, d.v.s. för varje enskild spelare och försöka matcha dessa mot matcher och spelar-ID? Där står ju faktiskt vilka matcher de deltagit i. Men hur tusan får jag in det i min databas på rätt sätt?

Edit: Och om någon undrar hur man importerar informationen i Excel så klickar man på "Från Webb" högst upp till vänster under fliken "Data". Därefter skriver man in rätt URL och klickar sedan på knappen Importera längst ner.

Nu har jag åtminstone sett att knappen "Makro" ligger höst upp till höger under fliken "Visa". Alltid en start!

Senast redigerad av Asprilla den 2012-02-13 klockan 05:17.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-14, 13:27   #21
 
Reg.datum: jan 2011
Inlägg: 359
Sharp$: 4135

Lets go Live
Stats: 477 - 300 - 108
ROI: 104.35%
Vinstprocent: 61.39%

Standard

Hej!

Börja med att säga att jag inte alls är kunnig inom programmering och liknande.

Jag skulle behöva ha något ihop skrivet som kan hämta resultat för tex Bundesliga. Det "enda" som programmet behöver kunna är att hämta just resultaten för varje lag och addera ihop hur många mål totalt sett det blivit i matchen och dela upp det i hemma resp bortamatcher.

Tex:

Dortmund Hemma
Leverkusen 1 mål Werder Bremen 3 mål osv

Dortmund Borta
Bayern 2 mål Gladbach 1 mål osv

Om det går så vore det bra om "programmet" kunde använda sig utav Oddsportal för jag ska använda det på en hel del olika ligor och jag är van vid OP.

Det behöver inte vara fler funktioner på det just nu för jag har en hel del andra filter som jag applicerar på ett annat sätt.

Är det någon som vill/kan skriva ihop ett sådant program så betalas det ut en belöning i form utav 500 Sharp$
MrGerrard är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-14, 15:03   #22
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Citat:
Ursprungligen postat av MrGerrard Visa inlägg

Är det någon som vill/kan skriva ihop ett sådant program så betalas det ut en belöning i form utav 500 Sharp$
Jag har ett bättre förslag!

Kan vi inte gemensamt på Sharps bygga en fotbollsdatabas som täcker all möjlig information som finns för alla ligor? Om riktigt många hjälper till borde det kunna vara en möjlig uppgift. Jag stör mig faktiskt på att spelbolag och även statistiksidor håller inne med information. Jag vill ju kunna göra exakt de sökningar i databasen som jag är intresserad av. Att bara kunna "titta" på statistiken är ju i stort sett värdelöst. Varför finns det ingen statistikdatabas där man kan sortera precis hur man vill?

Detta måste kunna göras tillgängligt på något sätt. Att ha en gemensam databas som vem som helst kan ändra i och skriva frågor till blir nog en dum idé. Men vi skulle kunna strukturera upp all information i Excel-filer, så att vem som helst på ett enkelt sätt kan bygga sin egen kompletta fotbollsdatabas.

Idag är det omöjligt att göra sökningar i de databaser som finns. Om jag vill sortera alla spelare för en speciell liga under en säsong beroende på hur lagen presterar när just den spelaren varit frånvarande, finns ingen möjlighet utan att göra det manuellt. Detta är en enorm begränsning med de databaser som finns. Informationen ser ut att vara tillgänglig, men i själva verket är den intressanta statistiken extremt svårtillgänglig om man inte är en riktigt duktig programmerare. Detta känns tråkigt. Om folk samkörde sina idéer och statistiska modeller skulle det finnas sjukt mycket mer att prata om. Ingen som håller med? Som det är idag sitter nästan alla och trycker på halvfärdiga modeller. Inskränkt.

Mitt förslag är därför att vi gör all information tillgänglig i Excel-filer, som sedan går att stoppa in i den egna databasen. Vi kan också hjälpas åt att beskriva hur databasen kan modelleras med avseende på relationer och dylikt, även det en information som inte alls existerar trots den uppsjö databaser som finns.

Vad säger ni? Ska vi göra slag i saken och göra allting tillgängligt? Det skulle berika tipsvärlden om statistisk modellering kom upp på diskussion. Alla kunde lära sig att söka statistik och man kunde föreslå varandra vilka variabler som är av intresse. Det jag menar är att modelleringen, hur man kommer fram till sina odds, är det mest intressanta men samtidigt det som absolut inte diskuteras. Det borde bli ändring på det!

Senast redigerad av Asprilla den 2012-02-14 klockan 15:06.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-14, 16:02   #23
 
Reg.datum: jan 2011
Inlägg: 359
Sharp$: 4135

Lets go Live
Stats: 477 - 300 - 108
ROI: 104.35%
Vinstprocent: 61.39%

Standard

Låter intressant!
Jag kan själv inte hjälpa till särskilt mycket med byggandet men skulle jag med hjälp utav detta komma fram till något bra så skulle jag helt klart kunna dela med mig.

Problemet är kanske att det blir några som får dra det tunga lasset med byggandet och utformningen utav en sådan modellering och det kanske inte är så många som är sugna på att lägga ner det som jag antar är ett ganska stort jobb?
MrGerrard är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-14, 17:13   #24
LL Cool J is hard as hell.
 
Boones avatar
 
Reg.datum: dec 2009
Ort: Bangkok
Inlägg: 1 864
Sharp$: 9728
Standard

Detta är säkert något vi kan integrera med Sharps om så önskas i framtiden.
__________________
"Kan bara titta på mig själv. Hur spännande skulle det vara att läsa mina drag om jag som alla andra börjar reka Barcelona, Real Madrid, Chelsea, United mfl mfl...helt ointressant. Vem fan vill läsa sånt? Jag ligger strax under 100% i roi UTAN att aldrig ha rekat dessa lag, skulle jag däremot jaga bra stat (som vissa eftersträvar) så skulle jag ju enbart reka dessa gäng. Men då tappar jag hela min nish."
-
To view links or images in signatures your post count must be 10 or greater. You currently have 0 posts.

"We expect this account to be uneconomical based on your type of business."
Boone är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-14, 17:47   #25
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Trevligt att du verkar någorlunda positiv!

Jag kan absolut tänka mig att dra ett tungt lass när det kommer till modellering av databasen samt att dela med mig av statistiska infall. Det kommer dock krävas hjälp från många håll för att ro detta i hamn, framför allt när det kommer till datainsamling.

Målet är att göra det enkelt för fotbolls- och spelintresserade att genomföra statistiska undersökningar. Tanken är att man ska ha möjlighet att undersöka precis de faktorer man är nyfiken på.

Målet nås genom att vi utvecklar en (eller flera) relationsdatabasmodell(er) för fotboll och strukturerar information i Excel-filer (.CSV) som blir tillgängliga för alla. Genom att strukturera informationen i CSV-filer blir det enkelt att för vem som helst lägga in dessa data i en egen databas. Det enda man behöver lära sig är att upprätta en databas på sin egen dator och sedan göra sökningar i databasen för att utvinna precis den information man vill undersöka statistiskt.

Vi kommer att behöva utveckla en standard för hur filerna ska vara uppbyggda, d.v.s. vilka kolumner etc. som ska finnas med och i vilken ordning dessa ska finnas med (för att man så enkelt som möjligt ska kunna plocka in dessa i den egna databasen). Jag är absolut ingen expert på databaser, men har läst på en aning. Kommer dock behöva respons på ER-modell o.s.v.

1. Först behöver vi veta exakt vilken information som är av intresse. Detta resulterar i en ER-modell av följande slag: http://i41.tinypic.com/25s8wg5.jpg

Modellen beskriver vad som ska finnas med i databasen. Enkelt beskrivet kommer kvadraterna på bilden att bli tabeller i databasen. Cirklarna intill varje kvadrat kommer att bli kolumner. Tabellen "Match" kommer således att ha kolumner som ID (varje match har ett identifierande nummer), hemmalag, bortalag och datum. Vi kan garanterat hitta ännu mer information än den förenklade modellen där. För varje spelare räcker ju inte förnamn och efternamn. Vi vill ha reda på gula kort, röda kort och allt som överhuvudtaget går att få reda på. Först måste vi alltså slå våra kloka hjärnor ihop och ta reda på exakt vilken information vi behöver ini minsta detalj.

Hur vi lägger upp själva modellen avgör också vilka sökningar som sedan går att göra.

2. Näste steg (väldigt grovindelat) borde rimligtvis vara datainsamlingen. Någon kan få i uppgift att upprätta en Excel-tabell för samtliga spelare i La Liga 2009/2010. Till viss del går det att snabba på detta genom att använda importera-funktionen i Excel. (Det går säkert att göra allting med några musklick om man kan avancerad programmering, men eftersom jag inte kan det har jag behov av en databas). Hursomhelst gör man då så att man tilldelar varje spelare ett spelar-ID. I någon tabell, beroende på ER-modellen, skriver man också upp i exakt vilka matcher var och en av spelarna har deltagit, och vilka stats (mål, assist, röda gula, etc.) spelaren har i respektive match. Jag är rätt osäker på hur detta kommer att gå till, men varje spelare ska alltså kunna kopplas till sina matcher så att statistiken för spelarens enskilda matcher också summeras någonstans. Vill man söka upp ett speciellt lag ska det gå att få fram all statistik om varje spelare för det laget under den säsongen, ungefär såhär: http://soccernet.espn.go.com/team/sq...united?cc=5739

Fördelen med att kunna ställa egna frågor till databasen är väldigt uppenbar. I nuläget kan du bara se den statistiken som hemsidan väljer att visa för dig. Du kan inte påverka strukturen. Du kan t.ex. inte få en proper lista på hur många placeringar det i genomsnitt skiljer mellan två lag för att matchen ska sluta oavgjort. Du kan heller inte lista alla spelare i en liga efter hur många minuter som i genomsnitt krävs för att en spelare ska göra mål. Du kan inte ens göra en så enkel sak som att rangordna lagen efter antal gjorda mål istället för på poäng. Allt detta är du tvungen att göra manuellt för att komma åt informationen. Genom att vi utvecklar denna databas blir detta möjligt genom enkla kommandon.

Vi börjar alltså med att föreslå behoven. Vilken statistik vill vi ha om en spelare eller om ett lag? Vad vill vi kunna ta reda på?

Vi kan göra små listor:

Lag
• Lagnamn
• Nationstillhörighet
• Antal gjorda mål (sorterat på matchtyp - liga, olika cuper - och på säsong)
• Antal insläppta mål (som ovan, + sorterat på matchminuter? + hemma/borta)
• Grundat (årtal?)
• Arena
• Nuvarande tränare (+ tidigare tränare?)
• Transfers (om vi orkar hålla reda på detta)

I sak kan alltså databasen innehålla både statistiskt användbar information och mer eller mindre onödigt vetande. Självklart kommer detta gå att applicera på andra sporter. Kom med förslag!
Följande användare gav Sharp$ för den här posten:
Volnay (+5)

Senast redigerad av Asprilla den 2012-02-14 klockan 17:52.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-14, 17:54   #26
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Citat:
Ursprungligen postat av Boone Visa inlägg
Detta är säkert något vi kan integrera med Sharps om så önskas i framtiden.

Ja, det vore ju kanon om Sharp ville hjälpa till! Ni bakom hemsidan sitter garanterat på viktigt kunnande för att kunna bistå med väldigt mycket. Det vore en stor hjälp, och mycket roligt om det blev slag i saken av detta.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-14, 18:08   #27
Super Moderator
 
dellgrens avatar
 
Reg.datum: jan 2010
Ort: Malmö
Inlägg: 1 163
Sharp$: 8661
Standard

Jag kan absolut ingenting om programmering men behöver ni någon faktasammanställare är jag på. Har en liten förkärlek till Excel
dellgren är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-14, 18:35   #28
 
zorbas avatar
 
Reg.datum: mar 2010
Inlägg: 101
Sharp$: 1263

Sharps.se VM-tävling 2014
Stats: 49 - 31 - 3
ROI: 115.35%
Vinstprocent: 61.25%

Standard

Citat:
Ursprungligen postat av dellgren Visa inlägg
Jag kan absolut ingenting om programmering men behöver ni någon faktasammanställare är jag på. Har en liten förkärlek till Excel
Samma här.
__________________
"It's a numbers game, but shit don't add up somehow"


To view links or images in signatures your post count must be 10 or greater. You currently have 0 posts.
zorba är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-14, 18:39   #29
 
snoozes avatar
 
Reg.datum: jan 2010
Inlägg: 582
Sharp$: 3415


Stats: - -
ROI: %
Vinstprocent: %

Standard

låter som en finfin Idé!
__________________
Jules: I want you to go in that bag, and find my wallet.
Pumpkin: Which one is it?
Jules: It's the one that says Bad Motherfucker
snooze är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-14, 19:58   #30
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Roligt att några verkar på. Självklart behövs alla om detta ska kunna bli någonting. Man kan se det som en filmtracker ungefär, fast för sportstatistik. Utan datainsamlare blir det ingenting av.

Vi hjälps helt enkelt åt att popularisera den statistik som framför allt spelbolagen sitter och trycker på. Det jag överraskats mest över är att ytterst få velat diskutera sina metoder för att komma fram till odds. Detta är ju vårt största intresse i bettingen, att bolla med siffror om sport. Många sitter och håller på idéer, livrädda att någon annan ska göra sig en hacka på deras arbete. Jag tycker att det känns synd och vore öppen för att diskutera statistisk modellering och manipulering av data mer ingående. När det kommer till kritan går ju de allra flesta här knappt plus. Spelbolagen har resurserna och statistisk expertis, och deras övertag är i det närmaste skottsäkert.

Istället för att prova egna teorier borde vi därför diskutera teorierna med varandra. Någon annan kan alltid komma med nya infallsvinklar. Jag tror att vi skulle vinna på det för att kunna utmana spelbolagen (okej, det var stora ord). Om någon kan göra miljoner på sin teori respekterar jag självklart detta, men det känns osannolikt. Om inte annat blir man limiterad. Man går i bästa fall runt. Personligen ser jag detta mer som en livsstil än en inkomstkälla. Men det är ju upp till mig.

Jag tänkte hursomhelst starta en ny tråd där meningen är att vi, samtidigt som datainsamlingen här, hjälps åt att utveckla våra teorier. Meningen kommer vara att man lägger fram statistiska undersökningar av olika slag. Någon kanske gör mindre stickprov för att så nya frön, medan andra lägger fram vetenskapliga undersökningar av rang.

Senast redigerad av Asprilla den 2012-02-14 klockan 20:00.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 01:22   #31
 
NiLus avatar
 
Reg.datum: dec 2010
Inlägg: 627
Sharp$: 1250

NBA
Stats: 170 - 177 - 6
ROI: 99.41%
Vinstprocent: 48.99%

Standard

Fantastiskt bra idé
NiLu är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 08:37   #32
 
Jurets avatar
 
Reg.datum: jul 2011
Inlägg: 568
Sharp$: 4875

Hockey-VM 2013
Stats: 11 - 8 - 6
ROI: 113.31%
Vinstprocent: 57.89%

Standard

Mycket bra initiativ! Det som är allra viktigast för statistisk modellering är matchspecifik data. Varje match måste ha ett ID i databasen eller hur det nu funkar (som ni märker får jag hjälp med databaser) liksom varje lag och spelare. Oavsett sport behövs all tänkbar statistik som skulle kunna förklara resultatet. Jag är gärna med och tar informationen från datastadiet till en modell för prediktion. Det är där min styrka ligger.

Tänkbar data för fotboll:
Mål
Måltidpunkter (väldigt viktigt)
Mål tillvägagångssätt (hörna, frispark, spelmål osv)
Passnings%
Bollinnehav
Skott på mål
Skottkvalitet (var kom skottet ifrån?)
Hörnor
Varningar + tidpunkt
Utvisningar + tidpunkt
Speltid (spelarspecifikt)
Specifik målvaktsdata

Plus allt annat som jag har glömt som är av vikt för lags och spelares prestationer.

I hockey finns det betydligt mer statistik och jag tänker inte göra någon lista, men det ska vara betydligt enklare att modellera än fotboll. Varför? Främsta problemet med fotboll som jag ser det är att det går att byta offensiv mot defensiv och man gör det både under matcher som mellan matcher. När ett mål faller i fotboll förändras matchbilden betydligt mer än i hockey. Faktum är att när ett mål görs i fotboll går sannolikheten upp för att det ska bli ett mål till jämfört med innan. Dessutom spelar Teneriffa väldigt olika jämfört med om de möter Barcelona (backar hem) eller Sociedad (mer offensivt), ni förstår min poäng. Men, absolut inte sagt att det inte går att modellera. Jag har bara spånat lite på vad som kommer vara viktiga saker att se till när man sätter klorna i datan.

Trevlig onsdag!
Juret är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 10:24   #33
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Citat:
Ursprungligen postat av Juret Visa inlägg
Mycket bra initiativ! Det som är allra viktigast för statistisk modellering är matchspecifik data. Varje match måste ha ett ID i databasen eller hur det nu funkar (som ni märker får jag hjälp med databaser) liksom varje lag och spelare. Oavsett sport behövs all tänkbar statistik som skulle kunna förklara resultatet. Jag är gärna med och tar informationen från datastadiet till en modell för prediktion. Det är där min styrka ligger.

Tänkbar data för fotboll:
Mål
Måltidpunkter (väldigt viktigt)
Mål tillvägagångssätt (hörna, frispark, spelmål osv)
Passnings%
Bollinnehav
Skott på mål
Skottkvalitet (var kom skottet ifrån?)
Hörnor
Varningar + tidpunkt
Utvisningar + tidpunkt
Speltid (spelarspecifikt)
Specifik målvaktsdata

Plus allt annat som jag har glömt som är av vikt för lags och spelares prestationer.

I hockey finns det betydligt mer statistik och jag tänker inte göra någon lista, men det ska vara betydligt enklare att modellera än fotboll. Varför? Främsta problemet med fotboll som jag ser det är att det går att byta offensiv mot defensiv och man gör det både under matcher som mellan matcher. När ett mål faller i fotboll förändras matchbilden betydligt mer än i hockey. Faktum är att när ett mål görs i fotboll går sannolikheten upp för att det ska bli ett mål till jämfört med innan. Dessutom spelar Teneriffa väldigt olika jämfört med om de möter Barcelona (backar hem) eller Sociedad (mer offensivt), ni förstår min poäng. Men, absolut inte sagt att det inte går att modellera. Jag har bara spånat lite på vad som kommer vara viktiga saker att se till när man sätter klorna i datan.

Trevlig onsdag!
Huruvida sannolikheten för att ett mål till ska falla ändras om ett mål redan fallit handlar förstås om den statistiska modelleringen, snarare än databasmodelleringen. Vi bör nog dela upp diskussionen i dessa två huvudområden för att den ska vara lätt att följa. Att bolla med siffrorna kan vi göra först när datainsamlingen är färdig. Samtidigt har du rätt i att dessa områden i högsta grad går in i varandra. Vad vi vill undersöka avgör som sagt hur databasen ska se ut.

Det är också möjligt att databasen måste avgränsas. Allt för detaljerad matchinformation blir svår att få tag på bakåt i tiden. Var hittar man t.ex. uppgifter om "fouls committed" och laguppställningar för superettan-matcher från förra året? (Nu kanske just detta existerar, men information som inte alls existerar blir förstås omöjlig att få tag på - men med det inte sagt att den inte går att modellera för och implementera i framtiden. I viss utsträckning går det utmärkt att ändra på databasen (addera kolumner, tabeller etc.) i efterhand.

Det är också bra om vi delar upp listorna beroende på relation (en relation i databasen är en tabell). Spelarens statistik står inte i samma tabell som lagets statistik. Tabellförslagen (egentligen entitetstyperna för att snacka ER-modellering) nedan är långt ifrån definitiva. De lär behöva delas upp. Om jag använder Jurets förslag blir det kanske såhär:

Spelare
ID
Förnamn + efternamn
Vilket lag spelar han i? Har han spelat i flera lag (och kanske under samma säsong)?
Framträdanden (appearances) - vilka matcher deltar spelaren i? Spelade han från start eller blev han inbytt? Eller satt han kvar på bänken ('unused substitute')?
Position i varje match, eller räcker det med övergripande positionsindelning (vissa spelare är backar, andra är mittfältare, o.s.v.)? Kan man ha både en övergripande indelning och en indelning för varje enskild match?
Spelarens roll i laget? (Om man hämtar data bakåt i tiden går det att avgöra om spelaren haft roll som 'lagkapten', 'lagets bäste målgörare' ('top scorer'), annan typ av nyckelspelare (kanske enbart ett värde som 'nyckelspelare', d.v.s. ingår i startelvan)?
Antal gula kort? Antal röda kort? Tidpunkter för dessa kort i enskilda matcher?
Antal fouls suffered? Antal fouls committed?
Antal räddningar? Räddningsprocent? (målvakt)
Hur gjordes målet? ('straff', 'spelmål', 'fast situation (som annan spelare slagit)', 'direktfrispark (som han slår direkt i mål)')
Målens tidpunkter?

Match
ID
Datum + Säsong
Matchtyp (FA-cup, Premier League, Allsvenskan)
Hemmalag + Hemmalagets antal mål
Bortalag + Bortalagets antal mål
Resultat (1-X-2)
Resultat (över-under - 1,5? 2,5? 3,5?)
Respektive lags skott på mål, hörnor, offsider, bollinnehav, gula, röda, räddningar
Vilka satt på avbytarbänken? Vilka blev inbytta? I vilken minut skedde byten?
Lagens startuppställning? (I termer av '4-4-2' och '5-4-1' eller i termer av 'offensiv', 'defensiv' - vore detta subjektivt? vad är subjektivt?)
Domare?

Lag
Nationstillhörighet?
Grundat år?
Arena? Kapacitet?
Transfers (in- och ut beroende på säsong)? Kostnader?
Tränare (nuvarande + tidigare)? Tidsperiod (f.o.m. xx-xx-2001 t.o.m. xx-xx-2010)?
Spelare (nuvarande + tidigare)? Tidsperioder?
Ingår i turneringar/matchtyper ('allsvenskan', 'svenska cupen', 'carling cup').
Statistik från varje enskild match (lagen kopplas till matcherna som hemmalag eller bortalag).

Tränare (om intressant?):
Nuvarande lag? Sedan datum?
Tidigare lag? Tidsperiod?
Antal 1X2 för respektive lag?
Antal gjorda/insläppta för respektive lag?
Favoriserar vilken laguppställning ('4-4-2')?

I det ovanstående har jag egentligen listat mer än den information vi kommer att plocka in i databasen i form av siffror och bokstäver. Mycket av den statistik vi vill ha reda på kommer att vara så kallade "härledda attribut" i databasen. Det innebär att om man t.ex. vill ta reda på målvaktens räddningsprocent under en viss säsong, eller kanske bara under en viss månad, så utgår man givetvis från det totala antalet räddningar, det totala antalet skott på mål som målvakten fått på sig, samt förstås dennes totala antal insläppta mål. Räddningsprocenten kommer alltså inte att skrivas som ett nummer i någon tabell, eftersom den går att härleda ur andra värden. Alla fenomen som man kan tänkas vilja undersöka statistiskt kommer alltså att vara härledda saker (manipulering av data). Man kanske funderar på följande: hur många minuter tar det i genomsnitt innan det andra laget kvitterar, i matcher där resultatet gått från 1-0/0-1 till 1-1? För att svara på frågan kommer man då att sortera ut (välja, select) data från databasen, som sedan förstås kan matas in i Excel eller dylikt. Detsamma gäller självklart "Resultat Över/Under", vilket inte kommer att skrivas in i databasen. Det härleds.

På samma sätt kommer inte lagens totala spelarstatistik (vilka spelare som gjort flest mål eller startat i flest matcher) att skrivas ut i någon tabell, eftersom denna härleds ur de enskilda spelarnas värden. Det är dock viktigt att även ange härledda attribut i själva modelleringen av databasen. Det är dessa attribut som mer än andra ligger i kontaktytan mellan den statistiska modelleringen (att söka data och plocka fram sannolikheter, fördelningskurvor etc.) och modelleringen av databasen. Den som vill ha en bra introduktion till databaser kan dra igenom följande webbkurs: http://www.databasteknik.se/webbkursen/ - Inom en vecka har du förhoppningsvis någorlunda god förståelse för de olika typerna av attribut som kommer att finnas med och hur dessa kopplas till varandra. (Du lär dig att förstå vikten av att dela upp dina attribut på olika sätt.)

Vi måste alltså börja med att komma fram till vad som är rimliga uppgifter att plocka med i databasen. Vad kommer att vara härlett, och vad kommer att behöva skrivas in som egna attribut? Ett gränsfall som jag inte är säker på är säsong. Dels borde man kunna härleda säsong ur den inbyggda kalendern (matchernas datumangivelser), men i vissa fall möts ju lag från olika länder, där t.ex. ena laget spelar höst-vår och det andra vår-höst. Jag reserverar mig därför för att säsong eventuellt borde vara ett vanligt attribut. För engelska lag anges då säsong med värdet '2011/2012' och för svenska lag med '2011' eller '2012'.

När jag skriver med enkla cittattecken tänker jag i värden som kan tänkas skrivas in i tabellcellerna (värden helt enkelt).

Senast redigerad av Asprilla den 2012-02-15 klockan 10:34.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 11:18   #34
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Söker man på Soccermetrics, d.v.s. motvarigheten till Sabermetrics, så träffar man följande hemsida: http://www.soccermetrics.net

De har bl.a. en FTP-server med ett fåtal Excel-filer. Något i den stilen tänker jag mig att vi kommer att få.

Nu vet jag inte hur mycket av deras prylar som ligger ute för allmänheten, men de skriver åtminstone följande: "Soccermetrics Research & Consulting aims to help develop and support the growing open-source soccer analytics community by initiating and contributing to relevant software projects.

We initiated the Football Match Result Database (FMRD) to collect soccer match result data in a format that would facilitate analysis, and we are proud to release it as an open source project."

Jag inser att de helt enkelt verkar ha gjort det grundjobb jag föreslagit. Det finns rent av en databas färdig att ladda ner: http://hhamilton-src.github.com/fmrd-desktop/

Dock blir jag förlorad när ordet Python kommer in i bilden. Någon som är haj på det där kan säkert jämföra deras databas med mina förslag. Hur mycket överensstämmer? Går deras databas att modifiera? Är den heltäckande? Går den att överföra till en MySQL-databas?

Jag kommer att försöka lära mig vad deras prylar innebär och hur jag får in detta i datorn. Om någon med större kunskaper hinner före med en utvärdering (exakt vad erbjuder Soccermetrics FMRD?) vore jag tacksam.

Det vore perfekt om denna databas mer eller mindre gick att applicera direkt på våra förslag. Då skulle vi nästan kunna gå direkt på datainsamlingen.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 12:20   #35
 
Enroths avatar
 
Reg.datum: sep 2011
Inlägg: 110
Sharp$: 114


Stats: - -
ROI: %
Vinstprocent: %

Standard

Det som Sharps skulle kunna va grunden för är själva databasen. Modeller och så vidare lär ju var och en få fortsätta att snickra hemma i valfri mjukvara.

Brist på öppna databaser råder det ju i så gott som varje sport/liga, framförallt databaser som följer en specifik mall. I dagsläget blir det ju väldigt mycket hämtande från olika databaser som alla har sina egna mallar...

Så en sorts knytpunkt ser jag absolut ett stort behov utav. Den måste givetvis sköta sig manuellt, då det annars skulle bli en på tok för stor arbetsbörda - men det borde ju inte vara några större klurigheter att fixa.

De flesta ligor/förbund har väl sin egna statistik bas där den mesta informationen borde gå att plocka (ex. stats.swehockey.se/ ) och sedan anpassa efter "sharp-mallen".

Skulle utan vidare betala en månatlig slant för att få tillgång till denna databas om den huserade statistik för många sporter och ligor.

Vilka siffror som är intressanta är ju ganska uppenbart - det mesta som är tillgängligt. Väder, plublik osv. är väl kanske något som missats i diskussionen (?).

Obearbetat så klart, det är ju det främsta problemet med existerande sidor - de bearbetar och väljer ut va de tycker är intressant och låser in resten.
Enroth är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 14:07   #36
 
Jurets avatar
 
Reg.datum: jul 2011
Inlägg: 568
Sharp$: 4875

Hockey-VM 2013
Stats: 11 - 8 - 6
ROI: 113.31%
Vinstprocent: 57.89%

Standard

det sätt åtminstone jag vill ha data presenterad på är säsongsbaserad data som uppdateras för varje match. för prediktion av en match i omgång 7 i Premier League använder jag således de första 6 omgångarna för att få mina inputs i modellen. jag skapar ett average för varje statistik och varje lag för varje match i databasen. simpelt uppställt:

Hemmalag: 2.47 Goals For, 1.53 Goals Against osv
Bortalag: 1.45 Goals For, 1.78 Goals Against osv

sedan använder jag mig av tidigare säsongers data för att komma fram till hur en match med ovanstående lags styrkor (i form av GF och GA eller vilken statistik som nu är signifikant i modellen) borde sluta i genomsnitt (antingen som antal mål eller som sannolikheter). så snittdata för matcher spelade upp det till det datumet, den säsongen, är ett måste för bra modellering.

sen tror jag det bästa är att börja smått och se att det fungerar. som sagt, det viktigaste är prestationsdata.
Juret är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 14:33   #37
 
Reg.datum: jan 2010
Inlägg: 247
Sharp$: 1540

greedys betting
Stats: 141 - 122 - 17
ROI: 107.69%
Vinstprocent: 53.61%

Standard

Citat:
Ursprungligen postat av Juret Visa inlägg
det sätt åtminstone jag vill ha data presenterad på är säsongsbaserad data som uppdateras för varje match. för prediktion av en match i omgång 7 i Premier League använder jag således de första 6 omgångarna för att få mina inputs i modellen. jag skapar ett average för varje statistik och varje lag för varje match i databasen. simpelt uppställt:

Hemmalag: 2.47 Goals For, 1.53 Goals Against osv
Bortalag: 1.45 Goals For, 1.78 Goals Against osv

sedan använder jag mig av tidigare säsongers data för att komma fram till hur en match med ovanstående lags styrkor (i form av GF och GA eller vilken statistik som nu är signifikant i modellen) borde sluta i genomsnitt (antingen som antal mål eller som sannolikheter). så snittdata för matcher spelade upp det till det datumet, den säsongen, är ett måste för bra modellering.

sen tror jag det bästa är att börja smått och se att det fungerar. som sagt, det viktigaste är prestationsdata.
Detta borde dock vara någonting som Asprilla kallar härledda attribut, som man kan beräkna själv mha. databasen. Alltså ingenting som ska finnas klart i den huvudsakliga databasen, om man ska gå på devisen att "så lite som möjligt ska finnas med i databasen, utan att rucka på mängden information", dvs bort med härledda data. Den devisen känns nästan som ett måste om man ska kunna göra upp någon standard för databasen.
greedy är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 14:55   #38
 
Jurets avatar
 
Reg.datum: jul 2011
Inlägg: 568
Sharp$: 4875

Hockey-VM 2013
Stats: 11 - 8 - 6
ROI: 113.31%
Vinstprocent: 57.89%

Standard

Aha, tror det blir super
Juret är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 15:04   #39
 
Enroths avatar
 
Reg.datum: sep 2011
Inlägg: 110
Sharp$: 114


Stats: - -
ROI: %
Vinstprocent: %

Standard

Citat:
Ursprungligen postat av greedy Visa inlägg
Detta borde dock vara någonting som Asprilla kallar härledda attribut, som man kan beräkna själv mha. databasen. Alltså ingenting som ska finnas klart i den huvudsakliga databasen, om man ska gå på devisen att "så lite som möjligt ska finnas med i databasen, utan att rucka på mängden information", dvs bort med härledda data. Den devisen känns nästan som ett måste om man ska kunna göra upp någon standard för databasen.
Precis min tanke...

Att kolla upp ex. GF/GA snittet per lag och säsong är hur enkelt som helst i alla ligor (genom ex. betradar). Desto svårare blir det när man vill åt GF/GA hemma/borta, i enskilda perioder eller minuter etc.

En databas med så mycket data som möjligt från respektive sport/liga - Ja!
Obearbetad, själva statistiken får man räkna ut själv i Excel. Annars kommer det bara bli som en av de hundratals statistiksidor som redan finns, om än anpassat för några av Sharps medlemmars intressen.
Enroth är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 15:43   #40
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Citat:
Ursprungligen postat av Enroth Visa inlägg
Det som Sharps skulle kunna va grunden för är själva databasen. Modeller och så vidare lär ju var och en få fortsätta att snickra hemma i valfri mjukvara.

Brist på öppna databaser råder det ju i så gott som varje sport/liga, framförallt databaser som följer en specifik mall. I dagsläget blir det ju väldigt mycket hämtande från olika databaser som alla har sina egna mallar...

Så en sorts knytpunkt ser jag absolut ett stort behov utav. Den måste givetvis sköta sig manuellt, då det annars skulle bli en på tok för stor arbetsbörda - men det borde ju inte vara några större klurigheter att fixa.

De flesta ligor/förbund har väl sin egna statistik bas där den mesta informationen borde gå att plocka (ex. stats.swehockey.se/ ) och sedan anpassa efter "sharp-mallen".

Skulle utan vidare betala en månatlig slant för att få tillgång till denna databas om den huserade statistik för många sporter och ligor.

Vilka siffror som är intressanta är ju ganska uppenbart - det mesta som är tillgängligt. Väder, plublik osv. är väl kanske något som missats i diskussionen (?).

Obearbetat så klart, det är ju det främsta problemet med existerande sidor - de bearbetar och väljer ut va de tycker är intressant och låser in resten.
Vilka är det som ligger bakom Sharps? Boone som svarade på föregående sida verkar ha ett finger med i spelet? Eller?

Även jag är villig att betala åtminstone min del av serverkostnaderna om en stor mängd data i form av Excel-filer (om nu dessa tar förhållandevis stor plats) eller vad det nu blir kommer att ligga på era servrar. Det får inte vara något hinder. Men självklart måste det vara open source. Att det sen alltid kommer att finnas snyltare är väl lika självskrivet som att jorden är rund (även om den inte har någon perfekt klotform!).

Precis! Obearbetad data är det stora målet. Och precis som ni konstaterar bör så mycket som möjligt vara härlett, utan att det inkräktar på mängden information.

Senast redigerad av Asprilla den 2012-02-15 klockan 15:44.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 16:34   #41
 
Enroths avatar
 
Reg.datum: sep 2011
Inlägg: 110
Sharp$: 114


Stats: - -
ROI: %
Vinstprocent: %

Standard

Citat:
Ursprungligen postat av Asprilla Visa inlägg
Vilka är det som ligger bakom Sharps? Boone som svarade på föregående sida verkar ha ett finger med i spelet? Eller?

Även jag är villig att betala åtminstone min del av serverkostnaderna om en stor mängd data i form av Excel-filer (om nu dessa tar förhållandevis stor plats) eller vad det nu blir kommer att ligga på era servrar. Det får inte vara något hinder. Men självklart måste det vara open source. Att det sen alltid kommer att finnas snyltare är väl lika självskrivet som att jorden är rund (även om den inte har någon perfekt klotform!).

Precis! Obearbetad data är det stora målet. Och precis som ni konstaterar bör så mycket som möjligt vara härlett, utan att det inkräktar på mängden information.
Det är väl Boone, KP och Mars om jag inte missminner mig (?)

Tanken med att inte ha en helt öppen databas syftade lite på att Sharps redan har en betaltjänst och att ett utökande utav vinstdrivande tjänster leder till fortsatt utveckling och underhåll utav Sharps.

Då tänker jag självklart att användarna själva inte ska bidra till databasen utan att detta görs automatiskt. En användargenererad databas skulle bli oregelbunden men så klart öppen för allmänheten (åtminstone reggade Sharpisar)


Och tro mig, snyltare kommer det finnas gott om ändå Slår vad om att några snart, om inte så redan sker, kommer gruppköpa Sharps gruppköp utav speltjänster
Enroth är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 16:58   #42
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Citat:
Ursprungligen postat av Enroth Visa inlägg
Och tro mig, snyltare kommer det finnas gott om ändå Slår vad om att några snart, om inte så redan sker, kommer gruppköpa Sharps gruppköp utav speltjänster
Hehe! Ja, det räcker med att skriva två meningar för mycket så hugger de hungriga gamarna på studs. Men det får väl inte stoppa oss?

Om databasen ska uppdateras automatiskt och suga upp all relevant information krävs nog en hel del jobb från crew här. Kunde jag fixa en sådan skulle jag förmodligen inte propagera här, även om jag kan vara duktig på att skriva ett par meningar för mycket...

Jag föreställde mig snarare en filsamling med relevant historik. Att allting uppdateras på stört under pågående säsong är jag mindre intresserad av. Det låter som en omöjlig uppgift om användare ska kunna bidra. Någon som har i uppgift att bevaka en liga får annat för sig och så vidare. Nä, min tanke var en kraftsamling för att suga historik.

En automatisk databas blir nog svår. Den måste väl ha regelbunden kontakt med extremt många servrar o.s.v. Jag tror snarare att risken för systematiska bortfall av data blir större om den ska sköta sig själv. En vacker dag byter franska fotbollsförbundets databas adress och allting strular.

Jag kanske tänker fel, men det finns en poäng med att användarna hjälps åt att samla data enligt en bestämd mall. Betaltjänster ökar dessutom oftast i priser med tiden och något sådant var inte min grundtanke.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 17:13   #43
LL Cool J is hard as hell.
 
Boones avatar
 
Reg.datum: dec 2009
Ort: Bangkok
Inlägg: 1 864
Sharp$: 9728
Standard

Det stämmer att det är jag, mars och KP som står bakom Sharps just nu.
Eftersom det bara är mars som besitter programmeringskunskaper av oss tre samtidigt som tid är en bristvara för honom i nuläget så kan vi inte bidra med något rent programmeringsmässigt, men däremot kan vi stötta projektet så gott det går.

Är ni intresserade skulle vi kunna skapa ett underforum här dit bara ni har tillgång, en subdomän typ databasen.sharps.se och ge er tillgång till FTP-kontot dit så ni kan utveckla det där till en början och sen eventuellt integreras med Sharps (eller hållas separat om ni nu önskar det).

Obs. Detta säger jag utan att ha kollat med mars eller KP så inget skrivet i sten.
__________________
"Kan bara titta på mig själv. Hur spännande skulle det vara att läsa mina drag om jag som alla andra börjar reka Barcelona, Real Madrid, Chelsea, United mfl mfl...helt ointressant. Vem fan vill läsa sånt? Jag ligger strax under 100% i roi UTAN att aldrig ha rekat dessa lag, skulle jag däremot jaga bra stat (som vissa eftersträvar) så skulle jag ju enbart reka dessa gäng. Men då tappar jag hela min nish."
-
To view links or images in signatures your post count must be 10 or greater. You currently have 0 posts.

"We expect this account to be uneconomical based on your type of business."
Boone är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 17:17   #44
 
Reg.datum: jan 2010
Inlägg: 247
Sharp$: 1540

greedys betting
Stats: 141 - 122 - 17
ROI: 107.69%
Vinstprocent: 53.61%

Standard

Ett underforum hade nog varit ett bra förstasteg, men då måste någon eller några ta ledarrollen i det forumet. Vad säger ni?
greedy är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 17:25   #45
 
Reg.datum: jan 2012
Inlägg: 143
Sharp$: 244
Standard

Faan, vad ni är duktiga på detta - skulle vara kul att testa något liknande på travet! vet inte om det är möjligt men det borde väl gå - vad tror experterna?
Knaborg är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 17:30   #46
 
Reg.datum: jan 2010
Inlägg: 247
Sharp$: 1540

greedys betting
Stats: 141 - 122 - 17
ROI: 107.69%
Vinstprocent: 53.61%

Standard

Citat:
Ursprungligen postat av Knaborg Visa inlägg
Faan, vad ni är duktiga på detta - skulle vara kul att testa något liknande på travet! vet inte om det är möjligt men det borde väl gå - vad tror experterna?
Har funderat i liknande banor själv, men funderar på hur mycket information som finns tillgänglig utan att se loppet. Med risk för att gå lite OT då detta mest bahandlar fotboll så är väl infon som finns på ATG rätt bristfällig? Det jag kan på rak arm är resultat, volt-/autostart, tävlingsform, vinnarmarginal, före (underlag eller vad det heter på travspråk), kilometertid (tror jag). Det som hade varit intressant att ha är t.ex. ställningen efter start (jämfört med halvtidsresultat), tid vid start (kanske första 500 m) osv. Finns mycket man vill ha med som sker under loppets gång som det inte finns någon statistik på utan som måste fyllas i manuellt. Detta blir väldigt mycket jobb.

Dock är sådan information väldigt värdefull och någonting som jag hade velat gräva djupare i, kanske finns det "gömd" statistik och mer att tillgå.
greedy är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 17:37   #47
 
Reg.datum: jan 2012
Inlägg: 143
Sharp$: 244
Standard

Citat:
Ursprungligen postat av greedy Visa inlägg
Har funderat i liknande banor själv, men funderar på hur mycket information som finns tillgänglig utan att se loppet. Med risk för att gå lite OT då detta mest bahandlar fotboll så är väl infon som finns på ATG rätt bristfällig? Det jag kan på rak arm är resultat, volt-/autostart, tävlingsform, vinnarmarginal, före (underlag eller vad det heter på travspråk), kilometertid (tror jag). Det som hade varit intressant att ha är t.ex. ställningen efter start (jämfört med halvtidsresultat), tid vid start (kanske första 500 m) osv. Finns mycket man vill ha med som sker under loppets gång som det inte finns någon statistik på utan som måste fyllas i manuellt. Detta blir väldigt mycket jobb.

Dock är sådan information väldigt värdefull och någonting som jag hade velat gräva djupare i, kanske finns det "gömd" statistik och mer att tillgå.

Kul att någon mer funderat i dessa banor! Du har ju statistikbibeln och travguron, eller vad den heter - den sistnämnda tar ju fram var hästen legat under loppets gång. Finns inbakat i Jokersystemet.
Knaborg är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-15, 17:41   #48
 
Reg.datum: jan 2010
Inlägg: 247
Sharp$: 1540

greedys betting
Stats: 141 - 122 - 17
ROI: 107.69%
Vinstprocent: 53.61%

Standard

Citat:
Ursprungligen postat av Knaborg Visa inlägg
Kul att någon mer funderat i dessa banor! Du har ju statistikbibeln och travguron, eller vad den heter - den sistnämnda tar ju fram var hästen legat under loppets gång. Finns inbakat i Jokersystemet.
Travguron hade jag helt missat, i den kan det finnas mycket matnyttig information. Bl.a. Tito har gjort liknande lyckosamma modeller för travhästar så det finns potential i det också.

Det som är nackdelen med statistikbibeln är att tabellerna är i parppers. Ska man ha statistiken tillgänglig för en modell så blir det att sitta och fylla i manuellt. Om nu inte bibeln finns som e-bok.
greedy är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-16, 09:26   #49
 
snoozes avatar
 
Reg.datum: jan 2010
Inlägg: 582
Sharp$: 3415


Stats: - -
ROI: %
Vinstprocent: %

Standard

http://www.footytube.com/openfooty/

jag hittade denna sidan och tänkte att det kanske va nått ni skulle gilla
det är opensource api för fotbollsstatistik, matchresulat, malgörare mm

kan inget om prgramering eller så men kan tänka mig hjälpa till på andra vis
__________________
Jules: I want you to go in that bag, and find my wallet.
Pumpkin: Which one is it?
Jules: It's the one that says Bad Motherfucker
snooze är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-02-16, 23:20   #50
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Hallå guys...

Jag har skissat lite på databasen och försökt plocka ut de olika relationerna (= tabeller) i Excel. Varje rad som börjar med ID kommer att bli en egen tabell i databasen.



Högst upp har vi alltså det som kommer att bli tabellen Lag. Namnen på de blivande tabellerna står i lila, till höger om varje tabell.

Jag är som sagt inte expert, men i förslaget ser ni bl.a. att "mål" och "varningar/kort" kommer att bli egna tabeller. Varje mål kommer att få ett ID-nummer och varje varning ett ID-nummer. Denna finsortering är ett måste om vi vill samla på oss så mycket information som möjligt om varje fenomen.

Jag har valt separata tabeller för hemma- respektive bortalag. (Eventuellt onödigt.) Alla bortalag i alla matcher samlas därför i en tabell. Som ni ser har tabellen för hemmalag ett ID-nummer identiskt med match-ID, vilket blir den nyckel som identifierar i vilken match Derby (i detta fall) är hemmalag.

Det rödmarkerade är härledda attribut. Jag är dock osäker på vad som är smartast i detta fall. Lagets antal "mål", "röda", och "gula" i en match (som rödmarkerats) kommer alltså att kunna härledas ur tabellerna för "mål" och "varningar". (Dock kan man eventuellt lägga till attributet (= kolumnen) "Lag" i tabellen "Mål" också, så att det direkt står vilket lag som fått målet. I nuläget har jag bara angivit målgörarens spelar-ID.)

Varje enskild spelare får en tabell enligt den längst ned. I denna noteras framträdanden (match-ID), vilken minut han blivit inbytt/utbytt eller om han startade matchen, samt position och den roll han haft under matchen (om han t.ex. blivit inbytt efter att laget fått en spelare utvisad kan man notera detta på något sätt).

Vad tror ni om denna? Jag är osäker och någon mer erfaren bör absolut titta igenom det där.

Kanonidé med ett extra delforum där vi kan utveckla databasen!

Edit: Det låter säkert som ett riktigt hästjobb om varje mål och varje rött kort ska ha så specifik information. Och ja, vissa saker kommer att gå fortare än andra att samla in. Men tänk att om alla som bidrar t.ex. samlar information om mål, röda o.s.v. för ett enda lag under en säsong, bör det faktiskt gå relativt fort att plocka hem allt. Några av kategorierna jag valde blir aningen subjektiva, men jag tror att dessa är nödvändiga. Det går ju t.ex. att skilja på om en spelare varit ett lags "top scorer" under en säsong eller om han varit "lagkaptenen". Och enbart genom att ge dessa fenomen (mål, varningar o.s.v.) egna tabeller kan vi fånga in riktigt detaljerad information, som t.ex. VAR på planen en varning delades ut. (En spelare som drar på sig onödiga kort i offensivt straffområde gång efter annan drar förstås ned lagets vinstmöjligheter).

Senast redigerad av Asprilla den 2012-02-16 klockan 23:33.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-03-28, 16:01   #51
 
Asprillas avatar
 
Reg.datum: feb 2012
Inlägg: 155
Sharp$: 775
Standard

Jag antar att detta gick upp i rök. Fick ingen större respons i alla fall. Om fler känner sig manade att diskutera detta vidare så är jag redo att fortsätta när som helst.

Det vore önskvärt med en standard vi kunde använda för att hjälpas åt att samla in statistik i form av csv-dokument, så att man enkelt kan bygga en databas.

Som sagt hör av er om det blir någon fortsättning. Möjligt att jag bygger vidare och lägger upp en färdig standard annars någon gång i framtiden, så att folk bara behöver hjälpa till med samlandet.
Asprilla är inte uppkopplad   Ge poäng Svara med citat
Svara



td