Errori inferenza statistica Analisi della Varianza -...

58
1 M Q Errori inferenza statistica Analisi della Varianza - I Marco Perugini Milano-Bicocca Lez: XXVIII

Transcript of Errori inferenza statistica Analisi della Varianza -...

Page 1: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

1

M

Q

Errori inferenza statistica

Analisi della Varianza - I

Marco Perugini

Milano-Bicocca

Lez: XXVIII

Page 2: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

Errori nell’inferenza statistica

• La statistica viene usata per fare inferenze a

partire dei dati empirici osservabili

• Le inferenze possono essere errate

• Tre tipi di errori

• NHST*: Errore I tipo (Falsi positivi)

Errore II tipo (Falsi negativi)

• IC: Errore di stima (imprecisione)

NHST= Null Hypothesis Significance Testing

(quello che vi è stato insegnato: H0 vs. H1)

Lezione: XXVIII

Page 3: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

Nullo è vero (H0 è corretta)

Nullo è falso (H1 è corretta)

Nullo è

vero

N

ullo è

fals

o

Mondo reale (POPOLAZIONE) Conclu

sio

ni del te

st

di

sig

nific

atività (

CA

MP

IO

NE)

Decisione corretta

Decisione Corretta

Errore II tipo

Errore I tipo

Errori di inferenza nel NHST

Lezione: XXVIII

Page 4: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

• Errore I Tipo: Rifiutare erroneamente l’ipotesi

nulla (Falso positivo).

Il risultato nel campione è significativo (p < .05),

quindi l’ipotesi nulla è rifiutata, ma in realtà essa è

vera nella popolazione.

• Errore II Tipo: Accettare erroneamente l’ipotesi

nulla (Falso negativo). Il risultato nel campione

non è significativo (p > .05), quindi l’ipotesi nulla

non è rifiutata, ma in realtà essa è falsa nella

popolazione.

Errori di inferenza nel NHST

Lezione: XXVIII

Page 5: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

Come tenere sotto controllo l’errore di I tipo?

• L’errore di I tipo (Falso positivo) è tenuto sotto controllo dal ricercatore.

• E’ chiamato il livello dell’alfa, e corrisponde al valore di probabilità che si usa per dichiarare il risultato significativo.

• Per convenzione, viene usato un alfa (a) minimo di .05. Ciò significa che l’ipotesi nulla è rifiutata quando un valore come quello trovato è probabile che accada il 5% delle volte o meno quando l’ipotesi nulla è corretta.

• Il test può essere a due code (più comune) o ad una coda (direzionale)

Lezione: XXVIII

Page 6: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

Lezione: XXVIII

Page 7: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

• Anche l’errore di II tipo (Falso negativo) può essere tenuto

sotto controllo dal ricercatore.

• L’errore di II tipo è chiamato beta (b) come complemento

ad alfa.

• Il modo più semplice per tenere sotto controllo l’errore del

II tipo è aumentare la potenza statistica di un test.

• Potenza statistica = probabilità di trovare un effetto nel

campione, se esso esiste nella popolazione

• Potenza = 1 – b

• Per convenzione, una potenza di almeno .80 (b=.20) è

considerata accettabile. Ciò significa che si ha una

probabilità di 80% o più di trovare un effetto se esso esiste

Come tenere sotto controllo l’errore di II tipo?

Lezione: XXVIII

Page 8: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

• La potenza dipiende dalla forza dell’effetto e dalla numerosità

campionaria, dato un certo livello alfa (ad es., a=.05)

Cosa influenza la potenza?

Page 9: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

Potenza tra (between) Ss

Gpower, http://www.gpower.hhu.de/en.html

Page 10: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

• La potenza per studi entro i soggetti (within Ss) è maggiore

(ceteris paribus) ma dipende da r (ad es., r = .50) tra VD

Cosa influenza la potenza?

Page 11: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

• O ci si aspetta un effetto forte o c’è bisogno di

un campione sostanziale

• L’effetto medio in Psicologia è di circa d=0.5

• Si può avere un campione ampio (ad es., N=274)

per trovare un effetto piccolo (ad es., d=0.30)

• Si può avere un campione piccolo (ad es., N=26)

per trovare un effetto grande (ad es., d=1.0)

• Ma non si può avere un campione piccolo per

trovare un effetto piccolo

• Studi entro i soggetti possono avere più potenza

Implicazioni

Lezione: XXVIII

Page 12: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

Errore IC

• In un approccio IC (ad es., AIPE, Maxwell, ARP

2008) l’errore è dato dall’imprecisione nella stima.

• Una cosa conta molto: più è grande il campione,

meglio è (ceteris paribus)

• Il punto non è se un effetto esiste (oppure no) ma

quanto è precisa la nostra stima

• All’estremo, tutti gli effetti esistono dato un camione

di dimensioni infinite

• If you want to get it right, increase sample size

Lezione: XXVIII

Page 13: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

Example from Schonbrodt & Perugini

(2013)

Page 14: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

14

Statistica Inferenziale

II

Lez: XXVIII

Page 15: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

15

Analisi della Varianza

(ANOVA, Analysis of Variance)

Obiettivo

- Confrontare due o più gruppi per stabilire se differiscono

significativamente nella media di una variabile (ANOVA,

ANCOVA)

Variabile indipendente o fattore

- La variabile (o le variabili) categoriale che definisce l’appartenenza

ai gruppi

Variabile dipendente

- La variabile misurata almeno su scala a intervalli, che viene

confrontata tra i gruppi

Lezione: XXVIII

Page 16: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

16

Diversi tipi di ANOVA

ANOVA a una via

- Una sola V.I., una sola V.D.

- Esempio: Ricerca di marketing – 3 diverse comunicazioni pubblicitarie (V.I.), valutazione del

prodotto (V.D.)

ANOVA fattoriale

- Più di una V.I., una sola V.D.

- Esempio: Ricerca di marketing – 3 diverse comunicazioni pubblicitarie (V.I.) valutate da

uomini e donne (V.I.), valutazione del prodotto (V.D.)

ANCOVA (Analysis of Covariance; Analisi della Covarianza)

- Presenza di Covariate (variabili di cui si desidera controllare statisticamente l’effetto sulla

V.D.)

- Esempio: Ricerca di marketing – 3 diverse comunicazioni pubblicitarie (V.I.), valutazione del

prodotto (V.D.) – Tenendo sotto controllo la quantità d’uso del prodotto (covariata)

Lezione: XXVIII

Page 17: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

17

Diversi tipi di ANOVA - II

Condizioni sperimentali

- Tutte le diverse modalità che si creano a seconda del valore assunto dalle

V.I.

- Qui sopra: due fattori (Spot a 3 livelli, Sesso a 2 livelli), 6 condizioni

sperimentali. Disegno fattoriale 3 x 2.

ANOVA tra i soggetti (between subjects) - Ogni soggetto partecipa a una sola condizione sperimentale

ANOVA entro i soggetti (within subjects) - Ogni soggetto partecipa a tutte le condizioni sperimentali

ANOVA mista - Presenza di fattori entro e fattori tra i soggetti

Lezione: XXVIII

Page 18: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

18

ATTENZIONE

Lezione: XXVIII

Page 19: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

19

Tutto ciò che è presentato dalla

prossima slide NON sarà parte del

programma di esame

(Nel compito d’esame NON ci

saranno domande relative alle

prossime slides, incluse quelle della

prossima lezione «virtuale»

aggiuntiva)

Lezione: XXVIII

Page 20: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

20

ANOVA a una via tra i soggetti - Esempio

Studio sui consumi

- Obiettivo: studiare il livello di soddisfazione degli acquirenti di 4 tipi di

automobili ad un anno dall’acquisto.

- Intervista a 20 acquirenti per ogni marchio, calcolo di un indicatore di

soddisfazione

Ci sono differenze significative nel

livello medio di soddisfazione degli acquirenti dei 4 tipi di auto?

H0: μ1 = μ2 = μ3 = μ4

Ossia: la variabilità osservata tra le 4 medie campionarie può essere

attribuita al caso?

Lezione: XXVIII

Page 21: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

21

ANOVA a una via – la struttura dei dati

Fattore MODELLO D’AUTOMOBILE

→ 4 CATEGORIE

→ sono tutte

osservazioni

indipendenti

→ MEDIE OSSERVATE

NEL CAMPIONE

→ MEDIE NELLA

POPOLAZIONE

𝑋 = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑖 𝑡𝑢𝑡𝑡𝑒 𝑙𝑒 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑧𝑖𝑜𝑛𝑖 𝑑𝑒𝑙 𝑐𝑎𝑚𝑝𝑖𝑜𝑛𝑒 μ = valore medio nella popolazione

Lezione: XXVIII

Page 22: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

22

ANOVA a una via – la struttura dei dati

Fattore MODELLO D’AUTOMOBILE

xij = μ + αi + εij

𝑋 = 𝑚𝑒𝑑𝑖𝑎 𝑑𝑖 𝑡𝑢𝑡𝑡𝑒 𝑙𝑒 𝑜𝑠𝑠𝑒𝑟𝑣𝑎𝑧𝑖𝑜𝑛𝑖 𝑑𝑒𝑙 𝑐𝑎𝑚𝑝𝑖𝑜𝑛𝑒

μ = valore medio nella popolazione

La generica osservazione xij può essere scomposta in 3 elementi:

μ = media generale

αi = μi - μ = effetto del fattore i

εij = componente d’errore specifica dell’osservazione

ij (scostamento rispetto alla media della condizione)

Non abbiamo i valori μ e α della popolazione, li stimiamo dal campione:

μ = X

α𝑖 = (X𝑖 − X )

ε𝑖𝑗 = (X𝑖𝑗 − X𝑖 )

xij = X + (X𝑖 − X ) + (X𝑖𝑗 − X𝑖 )

εij indica la variabilità nei punteggi non attribuibile al fattore

(attribuibile ad errore di misurazione e differenze tra i soggetti)

Lezione: XXVIII

Page 23: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

23

ANOVA a una via – la logica

Fattore MODELLO D’AUTOMOBILE

xij = X + (X𝑖 − X ) + (X𝑖𝑗 − X𝑖 )

Permette di stimare la variabilità della popolazione

nell’ipotesi

Se è vera H0, dobbiamo aspettarci che X1 , X2

, X3 , X4 non siano identiche, ma nemmeno

molto diverse. Quanto possono essere diverse? Dipende dalla variabilità della popolazione

A partire dalla variabilità delle medie campionarie possiamo ottenere una seconda stima della variabilità della popolazione. Se è vera H0 questa seconda stima non sarà (significativamente) superiore alla prima.

H0: μ1 = μ2 = μ3 = μ4

Lezione: XXVIII

Page 24: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

24

ANOVA a una via – scomposizione della varianza

xij = X + (X𝑖 − X ) + (X𝑖𝑗 − X𝑖 )

Variabilità tra i gruppi

Variabilità entro i gruppi

Dobbiamo capire se la variabilità osservata tra le medie dei campioni sia superiore a quella che è lecito aspettarsi sulla base della variabilità

entro i gruppi.

Lezione: XXVIII

Page 25: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

25

ANOVA a una via – la DEVIANZA

DEVIANZA (= SOMMA DEI QUADRATI, SQ) = 𝑥𝑖 − 𝑋 2𝑖

Possiamo distinguere

- Devianza totale: SQTOT = 𝑖 𝑥𝑖𝑗 − 𝑋 2𝑗

- Devianza entro: SQENTRO = 𝑖 𝑥𝑖𝑗 − 𝑋𝑖 2

𝑗

- Devianza tra: SQTRA = 𝑖 𝑋𝑖 − 𝑋 2

𝑗

Si può dimostrare che:

SQTOT = SQENTRO + SQTRA

→ La devianza tra i punteggi dei soggetti può essere scomposta in due

parti:

- La parte dovuta alla deviazione dei punteggi dei soggetti dalla media del gruppo cui appartengono

- La parte dovuta alla deviazione del punteggio medio del loro gruppo dalla media complessiva

SQTOT

SQENTRO SQTRA

Lezione: XXVIII

Page 26: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

26

Partizione della varianza

Lezione:

XXVIII

gruppi i entro variazione

gruppi travariazionestatisticotest =

Varianza totale (SST) =

Tra gruppi (SSM)

Entro i gruppi (SSR)

Come decido se la variazione legata al trattamento (variabilità osservata tra i gruppi) è superiore a quella non legata al trattamento?

Al test statistico è associato un valore di significatività = un valore di probabilità di ottenere quel risultato – o risultati più estremi – per effetto del caso

Page 27: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

27

ANOVA a una via – la VARIANZA

Possiamo stimare la varianza (MQ = media dei quadrati)

- Varianza totale: MQTOT = SQTOT

(N −1)

- Varianza entro: MQENTRO = SQENTRO

(N − k)

- Varianza tra: MQTRA = SQTRA

(k −1)

N = numerosità complessiva; k = numero di livelli

Gradi di libertà (g.l.)

[→quanti valori sono

liberi di variare]

Il rapporto F

𝑭 = 𝑴𝑸𝑻𝑹𝑨

𝑴𝑸𝑬𝑵𝑻𝑹𝑶

F è il rapporto tra la varianza stimata a partire dalla variabilità tra i gruppi (BETWEEN) e la varianza stimata a partire dalla variabilità entro i gruppi (WITHIN). Segue la distribuzione F di Fisher. http://web.utah.edu/stat/introstats/anovaflash.html

Lezione: XXVIII

Page 28: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

28

Rappresentazione grafica

Lezione:

XXVIII

W W W

B

B B

Page 29: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

29

Alcuni esempi

Lezione:

XXVIII

F1=B/W

B=, W>

F2<F1

B>, W=

F3>F1

B

W

Page 30: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

30

ANOVA – Esempio

H0: μ1 = μ2 = μ3 = μ4

Ipotesi alternativa: almeno una delle medie,

nella popolazione, è diversa dalle altre

F = 𝑀𝑄

𝑇𝑅𝐴

𝑀𝑄𝐸𝑁𝑇𝑅𝑂

= 446.42

26.976=16.549

SQ gl MQ

Lezione: XXVIII

Page 31: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

31

ANOVA – Ampiezza dell’effetto

Eta quadrato: la proporzione di variabilità osservata attribuibile al fattore

η2 = 𝑆𝑄𝑀𝐴𝑅𝐶𝐴

𝑆𝑄𝑇𝑂𝑇𝐴𝐿𝐸

= 1339.261

3389.454 = .395

Lezione: XXVIII

Page 32: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

32

ANOVA - assunzioni

Distribuzione normale della V.D. entro le condizioni

Omoschedasticità (= varianza uguale in ogni condizione)

Indipendenza delle osservazioni : il punteggio di un soggetto non deve essere

correlato con quello di altri soggetti (ad es., non si può usare questo modello per

osservazioni ripetute di uno stesso soggetto – vedi ANOVA entro i soggetti).

Lezione: XXVIII

Page 33: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

33

ANOVA a una via – interpretazione

Possiamo rigettare H0: μ1 = μ2 = μ3 = μ4 :

- la probabilità di osservare le differenze che abbiamo osservato tra le medie dei 4

campioni è molto bassa, se provengono tutti da una stessa popolazione.

- Il fattore marca ha un effetto statisticamente significativo sul grado di

soddisfazione dei clienti. Il livello di soddisfazione è influenzato dalla marca

acquistata.

Possiamo allora affermare che tutte le medie differiscono significativamente tra

loro?

NO: sappiamo che nel complesso differiscono significativamente tra di loro.

Lezione: XXVIII

Page 34: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

34

ANOVA – confronti post hoc

post hoc = dopo il fatto (non abbiamo ipotesi a priori) – confronto tra diversi livelli di

un fattore, effettuato dopo un’analisi iniziale dei dati.

nei confronti post hoc generalmente ogni media viene confrontata con tutte le altre.

aumentando il nr. di confronti, aumenta la probabilità che almeno uno risulti

significativo per caso

è opportuno apportare delle correzioni alla significatività di ogni singolo test.

DISUGUAGLIANZA DI BONFERRONI:

Dati c confronti post hoc,

probabilità che almeno uno sia significativo per caso ≤ c * αc

dove αc è il valore che adotto per decidere se il singolo confronto è significativo.

Scelgo il valore αc = α / c

Esempio: se il nr di confronti totale è 6 e voglio che il valore complessivo α = .05,

per ciascun confronto giudico la differenza come significativa solo se p < (.05 /6), ossia

se p < .0083.

= criterio di Bonferroni

Anche se ci limitassimo a confrontare, per esempio, la condizione Audi e la condizione Peugeot perché sono le più estreme, avremmo implicitamente fatto anche tutti gli altri 5 confronti

Lezione: XXVIII

Page 35: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

35

ANOVA – confronti post hoc

Ci sono anche altre possibilità comunemente usate (ad es. Scheffè e

Dunnett)

Una delle più usate è il Tukey HSD (Honestly Significant Difference)

E’ un approccio più liberale della correzione di Bonferroni ma più

conservatore rispetto al verificare semplicemente le significatività delle

differenze considerando tutti i gruppi a due a due. E’ un buon compromesso

L’approccio della Least Significant Difference (LSD) proposto da Fisher è

anche usato spesso ma è più liberale del Tukey HSD

Lezione: XXVIII

)x x qMS

ni j

W

h

Page 36: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

36

Lezione: XXVIII

T-test senza correzioni

Page 37: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

37’

ANOVA a una via – riportare i risultati

Il livello di soddisfazione dei clienti, a un anno dall’acquisto, è significativamente

diverso a seconda del modello acquistato, F (3,76) = 16.55, p < .001, η2 =.39.

Le principali statistiche descrittive (medie e deviazioni standard) relative all’indice

di soddisfazione, a seconda della condizione sperimentale, sono riportate nella

tabella x.

I risultati dei test post hoc (eseguiti con la correzione di Bonferroni/Tukey HSD-

LSD) sono riportati nella tabella y. Essi evidenziano una differenza significativa tra

le valutazioni medie della marca Peugeot e quelle delle altre marche. Anche la

differenza tra l’indice medio di soddisfazione degli acquirenti Audi e degli

acquirenti BMW è significativa. Nessun’altra differenza si è rivelata significativa ai

test post hoc.

Lezione: XXVIII

Page 38: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

38

ANOVA fattoriale tra i soggetti (between subjects)

ANOVA fattoriale = ci sono due o più variabili indipendenti (fattori)

Esempio: soddisfazione degli acquirenti di 4 modelli di automobili

di media cilindrata, di sesso femminile e maschile

tra i soggetti: ogni soggetto viene

assegnato a una sola cella

(condizione)

Lezione: XXVIII

Page 39: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

39

ANOVA fattoriale tra i soggetti (between subjects)

ANOVA fattoriale = ci sono due o più variabili indipendenti (fattori)

Esempio: soddisfazione degli acquirenti di 4 modelli di automobili

di media cilindrata, di sesso femminile e maschile

tra i soggetti: ogni soggetto viene

assegnato a una sola cella

(condizione)

Lezione: XXVIII

Page 40: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

40

ANOVA fattoriale - vantaggi

Vantaggi dei disegni fattoriali

Consentono lo studio dell’interazione

Aumentano la potenza del test (cioè la probabilità di rilevare un

effetto, se l’effetto è presente) perché consentono di ridurre la varianza

d’errore (cfr. slides successive)

Lezione: XXVIII

Page 41: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

41

ANOVA fattoriale – effetti principali e interazioni

Effetto principale: effetto medio di un fattore

sulla V.D., senza considerare i livelli degli

altri fattori.

C’è un effetto del tipo di

modello sul grado di soddisfazione.

Non c’è un effetto significativo del

sesso dell’acquirente

Interazione: L’effetto di un fattore sulla V.D.

è diverso ai diversi livelli dell’altro fattore

L’effetto del tipo di modello è

influenzato dal sesso dell’acquirente

Lezione: XXVIII

Page 42: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

42

ANOVA fattoriale – le ipotesi

Effetti principali

Gli effetti principali fanno riferimento alle medie marginali

H0: μaudi = μbmw = μpeugeot = μcitroen

H0: μdonne = μuomini

Interazioni

fanno riferimento alle differenze tra le medie nelle diverse

combinazioni sperimentali

H0: (μdonne - μuomini)audi = (μdonne - μuomini)bmw = (μdonne - μuomini)peugeot =

(μdonne - μuomini)citroen

Lezione: XXVIII

Page 43: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

43

ANOVA fattoriale – interpretazione dei risultati

Non c’è un effetto principale del sesso: non possiamo rifiutare l’ipotesi nulla che il

sesso non incida sul livello medio di soddisfazione, F(1,72) = 1,14, p = .29.

C’è un effetto principale del modello: in generale l’indice di soddisfazione è

influenzato dal modello acquistato, F(3,72) = 19.52, p < .001, η2p = .45.

L’effetto del modello è qualificato da un’interazione significativa, F(3,72) = 5.50,

p = .002, η2p = .19

- Quando c’è un’interazione significativa, bisogna sempre interpretare gli

effetti principali alla luce di tale interazione.

Lezione: XXVIII

Page 44: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

44

ANOVA fattoriale e interazione

Se l’interazione è significativa gli effetti principali vanno interpretati discutendo anche le interazioni. L’effetto principale di un fattore potrebbe verificarsi solo su un livello dell’altro fattore:

Lezione: XXVIII

Page 45: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

45

ANOVA fattoriale e interazione – gli effetti semplici

Come interpretiamo l’interazione significativa?

Scomponiamo il disegno e analizziamo gli effetti semplici.

- Effetti semplici: effetti di un fattore sulla V.D., separatamente per i

diversi valori dell’altro fattore.

- Analizziamo l’effetto del fattore ‘Modello’ separatamente per i

diversi livelli del fattore ‘Sesso’.

Lezione: XXVIII

Page 46: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

46

ANOVA fattoriale e interazione – gli effetti semplici

Lezione: XXVIII

Page 47: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

47

Nel caso delle donne, tutti i confronti a coppie sono significativi, tranne

quello tra audi e citroen.

Nel caso degli uomini, solo il confronto tra Peugeot e le altre

marche è significativo.

Lezione: XXVIII

Page 48: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

48

ANOVA fattoriale - interpretazione

Se l’interazione non è significativa Vanno analizzati e discussi gli effetti principali (con i contrasti pianificati o con i confronti post hoc, a seconda della presenza o meno di ipotesi a priori). Esempio: in un negozio d’abbigliamento si vuole testare l’effetto del tipo di servizio dato al cliente (a. cliente autonomo nel cercarsi i capi e provarli, b. viene fornita assistenza solo se richiesta, c. i commessi ‘servono’ il cliente) sulla spesa media effettuata.

Viene considerato anche il sesso dell’acquirente.

Lezione: XXVIII

Page 49: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

49

ANOVA fattoriale - interpretazione

Le donne, mediamente, hanno speso più degli uomini. L’ANOVA fattoriale tra i soggetti rivela che l’effetto principale del sesso è significativo, F (1, 54) = 64,65, p <.001, ηp

2.=.54. Anche l’effetto principale del tipo di servizio è significativo, F (2, 54) = 23.089, p <.001, ηp

2.=.46. L’interazione invece non si è rivelata

statisticamente significativa, F (2, 54) = 2.11, p =.13. L’effetto principale del tipo di servizio è stato ulteriormente indagato attraverso dei confronti multipli post hoc (correzione di Bonferroni).

Lezione: XXVIII

Page 50: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

50

ANOVA fattoriale - interpretazione

I test post hoc hanno evidenziato che tutte e tre le medie di acquisto sono significativamente diverse tra loro, tutti i p < .02.

Lezione: XXVIII

Page 51: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

51

ANOVA fattoriale – la scomposizione della varianza

Il modello teorico dell’ANOVA a una via tra i soggetti:

Nell’ANOVA fattoriale:

dove

- αi = μi - μ rappresenta l’effetto del livello i del fattore A

- βj = μj - μ rappresenta l’effetto del livello j del fattore B

- φij = μij - μ – (αi + βj ) rappresenta l’effetto dell’interazione: quella

parte dello scostamento della media della cella ij dalla media

generale che non dipende né dal fattore A, né dal fattore B.

- εijk rappresenta l’errore

xij = μ + αi + εij

xij = μ + αi + βj + φij + εijk

Lezione: XXVIII

Page 52: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

52

ANOVA fattoriale – la scomposizione della varianza

Nell’ANOVA fattoriale

per esaminare empiricamente il modello consideriamo le stime

campionarie dei suoi parametri:

xij = μ + αi + βj + φij + εijk

xij = X + (X𝐴𝑖 − X ) + (X𝐵𝑗 − X ) + (X𝐴𝑖𝐵𝑗 + X − X𝐴𝑖 − X𝐵𝑗) + (X𝑖𝑗 − X𝑖𝑗)

SQTOT

SQENTRO SQTRA

SQA SQB SQA * B

g.l.: N - 1

g.l.: N – a*b

g.l.: a – 1 g.l.: b – 1 g.l.: (a–1)*(b–1)

Lezione: XXVIII

Page 53: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

53

ANOVA fattoriale – la scomposizione della varianza

SQTOT

SQENTRO SQTRA

SQA SQB SQA * B

g.l.: N - 1

g.l.: N – a*b

g.l.: a – 1 g.l.: b – 1 g.l.: (a–1)*(b–1)

MQ = SQ / g.l.

FA = MQA / MQENTRO

FB = MQB / MQENTRO

FA*B = MQA*B / MQENTRO

Vantaggio dell’ANOVA fattoriale: SQENTRO e MQENTRO

sono tipicamente più piccole che nell’ANOVA a una via perché alcune fonti di variabilità non sono più d’errore. Questo aumenta la potenza del test.

Lezione: XXVIII

Page 54: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

54

ANOVA fattoriale – perché aumenta la potenza del test

La devianza d’errore diminuisce Perché l’altro fattore e l’interazione spiegano parte della variabilità. Anche i g.l. dell’errore diminuiscono, ma [se l’altro fattore ha degli effetti sulla V.D.] questa diminuzione è più che compensato dalla diminuzione della devianza. L’effetto del fattore A emerge ancora più chiaramente.

Lezione: XXVIII

Page 55: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

55

Alcuni pattern di risultati possibili

Lezione: XXVIII

A1 A2

B2

B1

A1 A2

B2

B1

MAIN EFFECTS

A1 A2

B2

B1

A1 A2

B2

B1

NO EFFECTS

Effetti principali

Nessun effetto

Page 56: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

A1 A2

B2

B1

A1 A2

B2

B1

INTERACTIONS

A1 A2

B2

B1

A1 A4

B2

B1

A2 A3

56

Alcuni pattern di risultati possibili

Lezione: XXVIII

Interazione

Page 57: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

57

E per finire...

Page 58: Errori inferenza statistica Analisi della Varianza - Ielearning.unimib.it/pluginfile.php/270309/mod_resource/content/0/... · • L’errore di II tipo è chiamato beta (Ε) come

58

Buone feste, buono studio ed in

bocca al lupo per l’esame!