venerdì 12 febbraio 2010

Ultimi vent'anni, Napoli settimo


In questo nuovo post vogliamo confrontare più gruppi di dati, quindi verifichiamo se i posizionamenti delle cinque squadre in esame (Inter, Milan, Juventus, Roma e Napoli) negli ultimi 21 campionati giocati rispettivamente in massima divisione sono tra loro uguali.

Il metodo da utilizzare per il confronto tra più gruppi si chiama ANOVA, il quale però suppone che tali gruppi seguano una distribuzione gaussiana.

Quindi innanzitutto verifichiamo l'omoschedasticità (ossia effettuiamo un test per l'omogeneità delle varianze).

 Bartlett test of homogeneity of variances
data:  dati and gruppi 
Bartlett's K-squared = 10.7245, df = 4, p-value = 0.02984
Dal risultato si evince che le varianze non sono omogenee essendo il p-value minore di 0,05 (95%) ed a riprova di questo anche il valore Bartlett's K-squared (10,7) risulta essere maggiore del chi-quadro tabulato (9,48).

Quindi non possiamo, con i nostri dati, proseguire con un metodo parametrico come l'Anova ma dobbiamo utilizzarne uno non parametrico come il test di Kruskal-Wallis.

Tale metodo viene applicato appunto quando non si può fare l'assunzione che i gruppi seguano una distribuzione normale.
 Kruskal-Wallis rank sum test
data:  dati 
Kruskal-Wallis chi-squared = 17.4556, df = 4, p-value = 0.001576
Risulta quindi che il p-value è minore di 0,05 (95%) ed il valore di Kruskal-Wallis (17,4) è maggiore del chi-quadro tabulato (7,81).

La conclusione è che rifiutiamo l'ipotesi H0 e cioè che le medie dei 5 gruppi sono statisticamente (con un errore del 5%) differenti tra loro, come facilmente intuibile.

In effetti verificando le medie di piazzamento delle squadre negli ultimi 21 tornei disputati in serie A è facile notare come le squadre tendano a piazzarsi in posizioni differenti, nel dettaglio:
  • Il Milan è risultata la migliore (3,3) avendo una media di piazzamento poco sotto il 3° posto.
  • Segue la Juventus (3,5) e l'Inter (3,8) che tende più verso il 4° posto.
  • La Roma (5,4) ha una media di piazzamento poco sotto il 5° posto.
  • Chiude il Napoli con una media (7,6) che lo porta a posizionarsi tra il 7° e l'8° posto in classifica.
Se avessimo potuto utilizzare il test Anova, cioè avessimo potuto affermare che le varianze erano omogenee ed il risultato fosse stato significativo, avremmo potuto cercare quali delle 5 coppie di medie risultavano significativamente differenti.






Nessun commento:

Posta un commento