ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo...

22
ANALISI della VARIANZA FATTORIALE Impostazione: E’ conosciuto: L’analisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo schema a blocchi randomizzati. L’argomento non è mai stato trattato in precedenti corsi

Transcript of ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo...

Page 1: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

ANALISI della VARIANZA FATTORIALE

Impostazione:

E’ conosciuto:

L’analisi della varianza con un solo fattore.

il significato di fattori fissi e casuali.

lo schema a blocchi randomizzati.

L’argomento non è mai stato trattato in precedenti corsi

Page 2: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

ARGOMENTI TRATTATI

Vantaggi e svantaggi dell’impostazione

fattoriale.

Concetto di interazione tra fattori.

Impianto in campo dell’esperimento.

Randomizzazione completa.

Blocchi randomizzati.

Esecuzione dei calcoli.

Interpretazione dei risultati.

Analisi grafica dell’interazione

Modelli: a effetti fissi, casuali e misto.

Contrasti in un esperimento fattoriale.

Confronti multipli in un esperimento fattoriale.

Esperimenti fattoriali sbilanciati (cenni).

Software disponibile.

Page 3: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

ANALISI della VARIANZA FATTORIALE

VANTAGGI

Si può studiare contemporaneamente l’effetto di 2 (o più) fattori.

Si può identificare l’interazione tra fattori

maggiore potenza

SVANTAGGI

difficoltà con esperimenti sbilanciati

difficile interpretazione (se i fattori sono più di 2)

> complessità calcoli (trascurabile)

Da preferire per esperimenti idonei all’identificazione dell’effetto di specifici

trattamenti, meno idonea all’analisi di sistemi reali

Page 4: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

L’INTERAZIONE

Tra 2 (o più) fattori applicati contemporaneamente può esservi:

indifferenza

sinergismo

antagonismo

I fattori esercitano il loro effetto senza variazioni dovute al livello degli altri fattori (comportamento additivo)

La presenza contemporanea di determinati livelli dei fattori migliora il risultato rispetto alla semplice additività

La presenza contemporanea di determinati livelli dei fattori peggiora il risultato rispetto alla semplice additività

Comportamenti sinergici o antagonistici indicano INTERAZIONE tra i fattori

Page 5: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

L’interazione

Produzioni frumento

0

2

4

6

8

N0-P0 N1-P0 N0-P1 N1P1

concimazioni

t h

a-1

s.s

.

Effetto dell'N

effetto del P

interazione

concimazione frumento

0

1

2

3

4

5

6

7

N0 N1

livelli di N

t h

a-1

s.s

.

P0

P1

concimazione frumento

0

1

2

3

4

5

6

7

8

N0 N1

livelli di N

t h

a-1

s.s

.

P0

P1 int

P1 int

Assenza di interazione: i segmenti sono paralleli

Presenza di interazione: i segmenti NON sono paralleli, l’effetto di un fattore dipende dal livello dell’altro

Page 6: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Principali applicazioni

E’ uno degli strumenti statistici più usati

Analisi dei rapporti genotipo-ambiente

cultivar x tecnica colturale

interazioni tra fertilizzanti

COMLETA!!!

Page 7: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Il MODELLO dell’ANOVA a 2 VIE

Yijk= + i + j + ( )ij + ijk

1

2

1

1

( )1,2

( )2,1

ijk

ijk

Il valore di un dato (Yijk) è la somma dell’effetto di uno specifico livello del 1° fattore (i) , dello specifico livello del 2° fattore (j ), della loro interazione (( )ij ) e di una componente accidentale (ijk)

Page 8: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Assunzioni

Le stesse dell’ANOVA a 1 via:

omogeneità delle varianze

normalità delle popolazioni

indipendenza dei dati

Proprie dell’ANOVA a 2 vie

i=0

j=0

()ij=0

Page 9: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

L’impianto in campo della prova

Occorre innanzitutto determinare tutte le combinazioni possibili tra i livelli dei fattori.

Esempio (didattico) con 2 fattori a 2 livelli:

Livello 1 Livello 2

N (kg ha-1) 0 100

P2O5 (kg ha-1) 0 60

Le combinazioni sono: N1-P1; N1-P2; N2-P1; N2-P2

Vanno considerate come se fossero singoli trattamenti nell’ANOVA a 1 via

Si ipotizzano 3 ripetizioni 12 parcelle, con i trattamenti da attribuirsi, secondo lo schema sperimentale adottato, casualmente

Page 10: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

N1-P2

N2-P1

N1-P1

N2-P2

N1-P1

N1-P1

N1-P2

N1-P2

N2-P1

N2-P1

N2-P2

N2-P2

La disposizione in campo

Schema a randomizzazione completa

Schema a blocchi randomizzati

N1-P2

N2-P1

N1-P1

N2-P2

N1-P1

N1-P1

N1-P2

N1-P2

N2-P1

N2-P1

N2-P2

N2-P2

Blocco 1 Blocco 2 Blocco 3

Page 11: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Esecuzione dei calcoliPasso 1: stimare la varianza errore

eseguire gli stessi calcoli necessari per l’ANOVA a 1 via, considerando le combinazioni come fossero singoli trattamenti

Si ottiene: devianza e varianza dei trattamenti nel loro complesso (utile successivamente) e devianza e varianza errore

Passo 2: stimare le varianze degli effetti semplici

sia: p il numero di livelli del fattore A

q il numero di livelli del fattore B

nrip il numero di ripetizioni

consideriamo l’esperimento come se vi fosse presente un solo fattore. Quindi si hanno nrip*q unità sperimentali che hanno ricevuto un determinato livello del fattore in esame.

Per calcolare la devianza del fattore A è allora sufficiente sostituire ogni dato con la media del livello di A a cui appartiene e calcolare la devianza di tutti i dati così ottenuti:

Del tutto analogamente si procede per il fattore b

I gradi di libertà sono p-1 e q-1

2

1

q *nrip A Dev

p

iiYY

Page 12: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Esecuzione dei calcoli (segue)

Passo 3: stimare la varianza dell’interazione

La via più semplice è per sottrazione:

Dev. Interazione = Dev. Trattamenti - Dev. A -Dev.B

si può anche calcolare indipendentemente (utile per ANOVA a 3 o più vie):

1)Porre ogni dato uguale al valore medio della combinazione a cui appartiene

2) sottrarre a ogni dato i valori medi del livello del fattore al quale si riferisce

3) calcolare la devianza dei dati così ottenuti

GL = GL trattamenti - GL A - GL B

ovvero (p-1)(q-1); infatti

(p-1)*(q-1) = pq - p - q + 1

pq = GL trattamenti +1

GL int = GL trattamenti +1 -p - q + 1

Page 13: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Esecuzione dei calcoli (segue)

Passo 4: impostare la tabella dell’ANOVA

devianze GL varianze F calcolato P(F)

totale dtot p*q*nrip-1trattamenti (tra caselle) dtratt p*q-1 dtratt/gl vtratt/verr fattore a da p-1 da/gl va/verr fattore b db q-1 db/gl vb/verr interazione a x b dint (p-1)(q-1) dint/gl vint/verrerrore de p*q*(nrip-1) de/gl

fonti di variazione

Passo 5: interpretazione

osservare innanzitutto la significatività dell’interazione: se l’effetto interattivo è significativo va considerata solo l’interazione e NON E’ LECITA ALCUNA CONCLUSIONE SUGLI EFFETTI SEMPLICI. Infatti con interazione, l’effetto di un fattore è condizionato dal livello dell’altro.

N.B.

Se i fattori a e b sono fissi, il test di tutti gli effetti si fa contro l’errore

Page 14: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

0

1

2

3

4

5

6

1 2

0

1

2

3

4

5

6

1 2

0

1

2

3

4

5

6

1 2

Esempi

Interazione e effetti semplici significativi.

Interazione e un effetto semplice significativi.

Interazione e effetti semplici significativi. L’interazione Puo’Puo’ avere valore pratico trascurabile

Page 15: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Un esempio di calcolo

I DATI:Tratt. rip 1 rip 2 rip 3 media

N0-P0 4 4.9 4.3 4.4N0-P1 4.2 5.5 5.9 5.2N1-P0 5.2 5.2 5.8 5.4N1-P1 6.6 7.2 7.8 7.2

devianza totale = 15.5

Calcolo devianza trattamenti (caselle)

4.4 4.4 4.45.2 5.2 5.25.4 5.4 5.47.2 7.2 7.2

dev. Tratt. = 12.6 GL= 3

dev errore= Dev tot - dev tratt 2.96

dev errore = 2.96 GL= 8varianza errore = 0.37

Page 16: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Un esempio di calcolo (segue)

La tabella delle medie

P0 P1 Media NN0 4.4 5.2 4.8N1 5.4 7.2 6.3Media P 4.9 6.2

Calcolo devianza effetto Nogni dato è sostituito con la media del corrispondente livello di N

N0 4.8 4.8 4.8 4.8 4.8 4.8N1 6.3 6.3 6.3 6.3 6.3 6.3

Devianza N = 6.75GL = 1

Calcolo devianza Pogni dato è sostituito con la media del corrispondente livello di P

P0 4.9 4.9 4.9 4.9 4.9 4.9P1 6.2 6.2 6.2 6.2 6.2 6.2

Devianza P = 5.07GL = 1

Page 17: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Un esempio di calcolo (segue)

Calcolo devianza interazione

dev. Interazione = D.tratt - dev. A - dev. B

dev interazione = 0.75GL = GL tratt- GL N - GL P = 1

oppure, sostituendo a ogni dato la media del gruppo e sottraendo le medie N e P relative:

Tratt. rip 1 rip 2 rip 3

N0-P0 4.4 4.4 4.4N0-P1 5.2 5.2 5.2N1-P0 5.4 5.4 5.4N1-P1 7.2 7.2 7.2

medie N4.8 4.8 4.84.8 4.8 4.86.3 6.3 6.36.3 6.3 6.3

Medie PP0 4.9 4.9 4.9P1 6.2 6.2 6.2P0 4.9 4.9 4.9P1 6.2 6.2 6.2

Risultato-5.3 -5.3 -5.3-5.8 -5.8 -5.8-5.8 -5.8 -5.8-5.3 -5.3 -5.3

dev interazione = 0.75Si constata che GL = 1

N0

N1

Page 18: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Un esempio di calcolo (segue)

0

1

2

3

4

5

6

7

8

P0 P1

N0

N1

Interpretazione: nonostante una apparente divergenza, i due segmenti sono da considerarsi paralleli in senso statistico, P(Fint) = 0,2 non fornisce evidenze sulla presenza di interazione. L’effetto migliorativo del P e dell’N è significativo

Tabella ANOVA

F.var Dev. GL Var. F calc. P(F)totale 15.5Tratt. 12.6 3 4.19 11.32 0.003 eff N 6.8 1 6.75 18.24 0.003 eff P 5.1 1 5.07 13.70 0.006 int P x N 0.8 1 0.75 2.03 0.192errore 2.96 8 0.37

Page 19: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

La presenza di fattori casuali

Nell’analisi della varianza fattoriale uno più fattori possono essere random: (cioè i trattamenti sono un campione di infiniti possibili trattamenti e non interessa studiarli in quanto tali, ma per identificare se costituiscono una fonte di variabilità significativa)

Casi tipici:

gli anni per i quali è ripetuta una sperimentazione. Si è interessati non agli specifici anni, ma li si considera come un campione di possibili andamenti meteorologici.

Le località, se intese solo come possibili campi in cui si ha una certa coltura e NON come rappresentative di areali.

In genetica, variablità delle popolazioni di partenza per ottenere incroci.( risponde alla domanda: ha effetto la variabilità genetica del genitore maschile, di quello femminile o la loro interazione nel determinare il risultato dell’incrocio ?)

In agronomia sono frequenti esperimenti con 1 fattore random e altri fattori fissi, poco frequenti quelli con più di 1 fattore random e altri fissi, rarissimi quelli con tutti i fattori random.

Page 20: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Trattamento dei dati in presenza di fattori casuali

La presenza di fattori casuali non modifica i calcoli di devianze, varianze e gradi di libertà. Sono diversi invece i test F nel caso di modelli MISTI (cioè con presenza di fattori fissi e casuali assieme) o completamente random.

Qui viene data una spiegazione intuitiva della diversa struttura dei test F. Per un approccio matematico formale si rimanda a testi specifici (es. Snedecor e Cochran, 1989).

Nel caso di schemi fattoriali a 2 vie non ci hanno difficoltà; nel caso di schemi a più vie non si hanno difficoltà se 1 solo fattore è random.

I package di calcolo statistico hanno da non molti anni introdotto il trattamento completo dei fattori random, risolvendo il problema. Occorre però riconoscere un fattore random in quanto tale.

In generale, in presenza di un fattore random nella stima della varianza di un effetto relativo a un fattore fisso è sempre compresa una quota di varianza attribuibile al fattore casuale: infatti la stima degli i è fatta in funzione di j soggetti a variazione campionaria. Nella stima della varianza di un fattore random non è invece compresa una quota di varianza legata al fattore fisso (gli i sono sempre gli stessi). L’interazione tra un fattore fisso e uno random, essendo attesi effetti diversi se l’esperimento viene ripetuto.

Page 21: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Trattamento dei dati in presenza di fattori casuali (segue)

Si può dimostrare che se il fattore a è fisso e b random:

E[var(a)] = 2 + nrip 2 +nrip * q 2/(p-1)

E[var(b)] = 2 + nrip*p 2

E[var(a x b)] = 2 + nrip 2

E[var(a x b)] = 2

Ne consegue che il test corretto per l’effetto fisso è contro l’interazione, per il fattore random e l’interazione contro l’errore. In presenza di 1 solo fattore random, ogni effetto fisso deve essere testato contro la sua interazione con il fattore random, i fattori random e le interazioni tra un fattore fisso e uno random contro l’errore.

Intuitivamente, in presenza di fattori casuali, per dichiarare un effetto fisso significativo, non ci basta che il suo effetto sia superiore a quello della variabilità sperimentale, occorre che sia anche “maggiore” della variabilità indotta dal fattore casuale affinché il suo effetto sia “apprezzabile” anche in presenza di altri valori del fattore casuale. Da questo ne consegue che il test corretto è contro la sua interazione con il fattore casuale, che comprende, oltre a una quota dovuta alla variabilità accidentale (come ogni varianza stimata), anche una quota di interazione tra il fattore fisso e quello random.

Page 22: ANALISI della VARIANZA FATTORIALE Impostazione: E conosciuto: Lanalisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo.

Altri tipi di analisi della varianza fattoriale

Esperimenti senza ripetizioni

in caso di esperimenti fattoriali un esperimento si può impostare senza repliche, assumendo a priori che NON VI SIA INTERAZIONE. Se l’interazione è nulla, allora la varianza dell’interazione stima la varianza errore e può essere usata per calcolare i rapporti F relativi agli effetti semplici. Questa impostazione è però in linea di massima sconsigliabile, essendo uno degli scopi primari dell’ANOVA fattoriale proprio l’analisi dell’interazione. Per il calcolo occorre calcolare le devianze degli effetti semplici e, per sottrazione dalla devianza totale, la devianza errore.

Approccio gerarchico

In alcuni casi non è possibile un approccio fattoriale pieno: i livelli di un fattore sono diversi a secondo dei livelli dell’altro:

Farlo meglio se questa è la lezione