Visa ett inlägg
Gammal 2012-07-17, 21:13   #2
greedy
 
Reg.datum: jan 2010
Inlägg: 247
Sharp$: 1540

greedys betting
Stats: 141 - 122 - 17
ROI: 107.69%
Vinstprocent: 53.61%

Standard

Först vill jag inleda med att säga att jag inte har läst statistik på högskolenivå, men kan åtminstone starta en diskussion med mitt material. Kommer att prenumerera på din tråd både här och på FB i alla fall.

Först kan man ju diskutera om antalet glassätare inträffar helt slumpmässigt i tiden. Man går ofta i par eller grupper och köper glass tillsammans, men då det inte var ditt egentliga exempel så kan vi frångå från det.

Formeln för Poisson lyder ju:

P(X=x) = e^(-Y)*Y^(x)/x!, Y>0, x=0,1,2... där Y vanligtvis brukar betecknas med den grekiska bokstaven lambda och som mitt tangentbord saknar. Det speciella för en poissonfördelad stokastisk variabel är att väntevärdet = lambda.

En teori är ju att få fram funktionen P(X=x) för alla städer och beräkna lambda och därmed väntevärdet hos varje stad. Sedan kan man jämföra väntevärdet hos varje stad och komma fram till om Stockholm är "signifikant högre".

Hur man beräknar P(X=x) i R har jag inte en aning om, men om programspråket är liknande som Matlab så har jag en metod nedan för stockholm just. Vet inte hur legitim denna metod är så får lämna ett frågetecken för den just. Tanken i scriptet är helt enkelt att anpassa lambda med en minstakvadratmetod. Frekvensen för hur ofta det är x antal människor beräknas från datan. Sedan minstakvadratanpassar man en poissonfunktion utifrån det.

Koden följer inom spoiler:

Spoiler:
sthlm = [5, 2, 4, 7, 3, 4, 6, 3, 5, 4];

for i=0:7
Frekvens(i+1)=sum(sthlm==i)/numel(sthlm);
antal(i+1)=i;
end

Find_lambda = @(Y) sum((Frekvens-exp(-Y).*Y.^antal./(factorial(antal))).^2);

Lambda = fminsearch(Find_lambda, 10);

Poiss_funct = @(x) exp(-Lambda)*Lambda.^(x)./factorial(x);

x = 0:1:7;

plot(antal,Frekvens,'ro',x,Poiss_funct(x))

disp('std')
disp(std(sthlm))
disp('sqrt(Lambda)')
disp(sqrt(Lambda))


Beräknade värden som är av vikt:

Lambda = väntevärdet = 4,4469 med fyra decimaler.

standardavvikelsen = sqrt(Lambda) = 2.1088. Att jämföra med standardavvikelsen hos datan som är 1,4944. Kan få en att fundera om datan följer en Poissonfördelning.

Vidare en bild på fördelningen och motsvarande funktion:

http://ladda-upp.se/bilder/yafealbetuziba/
Följande användare gav Sharp$ för den här posten:
Rehn108 (+20)

Senast redigerad av greedy den 2012-07-17 klockan 21:19.
greedy är inte uppkopplad   Ge poäng Svara med citat