venerdì 19 febbraio 2010

Napoli, meglio col caldo o col freddo?

Questa volta prendiamo in considerazione due fattori di variabilità, per verificare se le medie tra i gruppi dipendono dal gruppo di classificazione (zone) o dalla seconda variabile che si va a considerare (blocco).
Ricorriamo ad una Analisi della varianza a due vie.
Organizziamo i dati in un tabella a doppia entrata.



Sono rappresentati i punteggi del Napoli negli ultimi 5 campionati disputati in serie A divisi per mese e vogliamo verificare se i punteggi dipendono dall'anno e/o dal mese oppure se sono indipendenti da questi due fattori.

Da come possiamo osservare dalla tabella il campionato 09/10 è ancora in fase di svolgimento e non tutti i campionati hanno avuto stessa durata (si è passato negli anni da un torneo a 18 squadre ad uno a 20 squadre).
Oltretutto il punteggio (colonna bianca) dipende dal numero di partite (colonna verde), quindi è opportuno pesare i punteggi in base alle partite (colonna gialla).

In queste condizioni di incertezza è impossibile quindi procedere con l'analisi per tutti gli anni, ma prendiamo in considerazione solo i campionati simili tra loro e cioè i campionati 2008/09 e 2007/08.

Con un grafico radiale oltremodo è evidente la drammatica stagione 97/98 coincisa con la retrocessione in serie B.

Verifichiamo invece l'andamento dei due campionati presi come riferimento

dove si evince una partenza migliore della squadra nel campionato 08/09 ma con un finale sicuramente a favore di quella che ha conquistato l'accesso all'intertoto nel torneo 07/08.

Come detto prima però i punteggi risentono del numero di partite disputate nei vari mesi e quindi è più utile osservare il grafico con i punteggi pesati.

Qui gli andamenti si livellano rispetto al precedente anche se le considerazioni fatte in precedenza risultano anche in questo caso.

Analizziamo quindi i dati effettuando l'Anova solo sui due campionati di riferimento ed osserviamo se una delle due variabili anno e mese, o entrambe o nessuna influenzano i punteggi della squadra.


Analysis of Variance Table
Response: punti
          Df Sum Sq Mean Sq F value Pr(>F)
mesi       9 5.4459  0.6051  1.8417 0.1882
anni       1 0.0336  0.0336  0.1023 0.7564
Residuals  9 2.9570  0.3286 

La significatività della differenza tra mesi è: F = 1.8417. Questo valore è inferiore al valore tabulato (5.11) e difatti p-value > 0.05. Quindi si accetta l'ipotesi nulla che le medie valutate in base ai mesi sono uguali; quindi la variabile "mesi" non influisce sui punteggi.

La significatività della differenza tra anni è: F = 1.1023. Questo valore è inferiore al valore tabulato (5.11) e difatti p-value > 0.05. Quindi si accetta l'ipotesi nulla che le medie valutate in base agli anni sono uguali; quindi la variabile "anni" non influisce sui punteggi.

Quindi alla domanda del titolo possiamo rispondere che non esiste una stagione che sorride di più agli azzurri rispetto ad un'altra, anche se forse avendo potuto utilizzare un numero superiore di variabili "anni" il risultato sarebbe potuto essere diverso.


Nessun commento:

Posta un commento