+ 100% upp till 1000 kr
+ Ofta utstick
+ Svenskt aktiebolag
+ 1000 kr bonus!
+ Skattefritt
+ Väletablerat bolag

Registrera konto
Månadens
sponsor
+ 100% upp till 1000 kr
+ Ofta utstick
+ Svenskt aktiebolag

Gå tillbaka   Sharps.se > Generella Diskussioner > Offtopic

Svara
 
LinkBack Ämnesverktyg Visningsalternativ
Gammal 2012-07-17, 19:03   #1
 
Rehn108s avatar
 
Reg.datum: apr 2012
Inlägg: 211
Sharp$: 777

2014
Stats: 50 - 69 - 1
ROI: 95.39%
Vinstprocent: 42.02%

Standard Hjälp mig med poissonfördelning och statistisk analys!

Hej sharps. Jag hade inte tänkt på det här förut, men det skrivs ju en hel del om poissonfördelning i trådar där Kellys formel nämns. Jag håller själv på med ett examensarbete på högskolenivå, där jag nu tvingas konfrontera poissonfördelning, poissonregression och liknande. Jag tänkte att eftersom det finns en bunt användare här som förstår sig på det där med poissonfördelning kanske det finns NÅGON som använt sig av det i vetenskapliga sammanhang också. Hoppas kan man ju alltid!

Jag förstår nämligen ingenting av vad jag ska göra. Jag klistrar in texten jag skrev i en tråd på flashback! Ja nu sammankopplar jag ju förresten själv det här kontot med ett konto på flashback, men det gör mig inget. Jag är snäll på båda forumen.

Här kommer textmassan:

Jag gör ett arbete på högskolenivå. Jag har så fruktansvärt svårt att förstå vilken statistik jag ska använda mig av, jag är inte direkt en stjärna på statistik. Jag har hört att jag bör kolla på poissionfördelning och GLM. Kanske var det Poissionregression till och med. Jag vet inte. Jag ska använda mig av R i alla fall.
Jag slänger ihop ett fiktivt exempel som är ganska fånigt, men som skulle behöva precis samma statistik som mitt riktiga arbete:

Jag har gått 100 m längs 10 olika gator i olika svenska städer. Jag har längs denna sträcka noterat hur många människor som äter glass.

Resultatet för de tio olika gatorna i de olika städerna ser ut såhär:
Stockholm: 5, 2, 4, 7, 3, 4, 6, 3, 5, 4.
Göteborg: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.
Sveg: 0, 0, 0, 2, 0, 0, 1, 0, 0, 0.
Orsa: 2, 1, 3, 1, 0, 0, 0, 2, 1, 1.
Borgholm: 0, 0, 0, 0, 0, 0, 0, 0, 0, 0.


Jag vill nu testa statistiskt om mina resultat från Stockholm är signifikant högre än övriga. Vad tycker ni jag ska använda mig av?

---

(och som sagt, glass-exemplet är inte mitt riktiga arbete, men siffrorna är ungefär likvärdiga och jag söker samma statistik)
Rehn108 är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-07-17, 20:13   #2
 
Reg.datum: jan 2010
Inlägg: 247
Sharp$: 1415

greedys betting
Stats: 141 - 122 - 17
ROI: 107.69%
Vinstprocent: 53.61%

Standard

Först vill jag inleda med att säga att jag inte har läst statistik på högskolenivå, men kan åtminstone starta en diskussion med mitt material. Kommer att prenumerera på din tråd både här och på FB i alla fall.

Först kan man ju diskutera om antalet glassätare inträffar helt slumpmässigt i tiden. Man går ofta i par eller grupper och köper glass tillsammans, men då det inte var ditt egentliga exempel så kan vi frångå från det.

Formeln för Poisson lyder ju:

P(X=x) = e^(-Y)*Y^(x)/x!, Y>0, x=0,1,2... där Y vanligtvis brukar betecknas med den grekiska bokstaven lambda och som mitt tangentbord saknar. Det speciella för en poissonfördelad stokastisk variabel är att väntevärdet = lambda.

En teori är ju att få fram funktionen P(X=x) för alla städer och beräkna lambda och därmed väntevärdet hos varje stad. Sedan kan man jämföra väntevärdet hos varje stad och komma fram till om Stockholm är "signifikant högre".

Hur man beräknar P(X=x) i R har jag inte en aning om, men om programspråket är liknande som Matlab så har jag en metod nedan för stockholm just. Vet inte hur legitim denna metod är så får lämna ett frågetecken för den just. Tanken i scriptet är helt enkelt att anpassa lambda med en minstakvadratmetod. Frekvensen för hur ofta det är x antal människor beräknas från datan. Sedan minstakvadratanpassar man en poissonfunktion utifrån det.

Koden följer inom spoiler:

Spoiler:
sthlm = [5, 2, 4, 7, 3, 4, 6, 3, 5, 4];

for i=0:7
Frekvens(i+1)=sum(sthlm==i)/numel(sthlm);
antal(i+1)=i;
end

Find_lambda = @(Y) sum((Frekvens-exp(-Y).*Y.^antal./(factorial(antal))).^2);

Lambda = fminsearch(Find_lambda, 10);

Poiss_funct = @(x) exp(-Lambda)*Lambda.^(x)./factorial(x);

x = 0:1:7;

plot(antal,Frekvens,'ro',x,Poiss_funct(x))

disp('std')
disp(std(sthlm))
disp('sqrt(Lambda)')
disp(sqrt(Lambda))


Beräknade värden som är av vikt:

Lambda = väntevärdet = 4,4469 med fyra decimaler.

standardavvikelsen = sqrt(Lambda) = 2.1088. Att jämföra med standardavvikelsen hos datan som är 1,4944. Kan få en att fundera om datan följer en Poissonfördelning.

Vidare en bild på fördelningen och motsvarande funktion:

http://ladda-upp.se/bilder/yafealbetuziba/
Följande användare gav Sharp$ för den här posten:
Rehn108 (+20)

Senast redigerad av greedy den 2012-07-17 klockan 20:19.
greedy är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-07-19, 12:39   #3
 
Rehn108s avatar
 
Reg.datum: apr 2012
Inlägg: 211
Sharp$: 777

2014
Stats: 50 - 69 - 1
ROI: 95.39%
Vinstprocent: 42.02%

Standard

Jag känner mig taskig som inte svarat på det här än, men jag har inte haft tid. Tack för ett bra svar. Jag ska i mån av tid, förhoppningsvis idag, ge lite bättre återkoppling på ditt svar! Men tack ska du ha i alla fall, redan nu!
Rehn108 är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-07-20, 08:05   #4
 
Jurets avatar
 
Reg.datum: jul 2011
Inlägg: 457
Sharp$: 3063

Hockey-VM 2013
Stats: 11 - 8 - 6
ROI: 113.31%
Vinstprocent: 57.89%

Standard

Citat:
Ursprungligen postat av greedy Visa inlägg
Tanken i scriptet är helt enkelt att anpassa lambda med en minstakvadratmetod. Frekvensen för hur ofta det är x antal människor beräknas från datan. Sedan minstakvadratanpassar man en poissonfunktion utifrån det.
För Poisson-regression används Maximum Likelihood och inte Least Square. Jag tycker SPSS är mest användarvänligt för estimation (jag är ingen programmerare).
Juret är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-07-21, 13:31   #5
 
Reg.datum: jan 2010
Inlägg: 247
Sharp$: 1415

greedys betting
Stats: 141 - 122 - 17
ROI: 107.69%
Vinstprocent: 53.61%

Standard

Citat:
Ursprungligen postat av Juret Visa inlägg
För Poisson-regression används Maximum Likelihood och inte Least Square. Jag tycker SPSS är mest användarvänligt för estimation (jag är ingen programmerare).
Det stämmer nog, hade det i bakhuvudet. Har ingen erfarenhet av MLE så använde minstakvadrat för att visa mina tankegångar. Har du någon länk som går igenom MLE grundligt?
greedy är inte uppkopplad   Ge poäng Svara med citat
Gammal 2012-07-25, 17:57   #6
 
Jurets avatar
 
Reg.datum: jul 2011
Inlägg: 457
Sharp$: 3063

Hockey-VM 2013
Stats: 11 - 8 - 6
ROI: 113.31%
Vinstprocent: 57.89%

Standard

Citat:
Ursprungligen postat av greedy Visa inlägg
Det stämmer nog, hade det i bakhuvudet. Har ingen erfarenhet av MLE så använde minstakvadrat för att visa mina tankegångar. Har du någon länk som går igenom MLE grundligt?
Nej tyvärr, min erfarenhet sträcker sig bara till användare av statistikprogram och en förståelse för hur modellerna fungerar. Är varken matematiker eller programmerare; men Wikipedia är väl som alltid en bra start?
Juret är inte uppkopplad   Ge poäng Svara med citat
Svara

Ämnesverktyg
Visningsalternativ







Powered by vBulletin & vBadvanced CMPS
Design, Logos, etc Copyright © Sharps.se, 2010-2011. All Rights Reserved
SEO by vBSEO 3.5.2 ©2010, Crawlability, Inc. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23