Marco Acutis & Roberto Confalonieri. Limpostazione degli esperimenti Come va gestito un esperimento...

Post on 01-May-2015

217 views 3 download

Transcript of Marco Acutis & Roberto Confalonieri. Limpostazione degli esperimenti Come va gestito un esperimento...

Marco Acutis

&

Roberto Confalonieri

L’impostazione degli esperimenti

• Come va gestito un esperimento ?

• Quante ripetizioni occorrono ?

• Come dimensionare l’unità sperimentale ?

• Quale schema sperimentale adottare ?

• Gestire la variabilità spaziale

Stretto rapporto tra le risposte a queste domande,nessun punto è affrontabile singolarmete

Criteri generali di gestione di un esperimento

• Finalizzazione– L’esperimento deve rispondere a necessità specifiche

esattamente definite.

– Si deve sapere la ragione per ogni dato che si raccoglie

– Se dei dati si raccolgono “per prassi” occorre essere consci della ragione della prassi.

– Occorre un equilibrio tra i costi e i risultati ottenibili.

L’esperimento inizia a tavolino !

…A Tavolino• Quali differenze tra trattamenti consideriamo

“rilevanti” per la nostra indagine ?• Con che precisione vogliamo stimare un

parametro ? (es coefficiente angolare di una retta) • Con che precisione vogliamo stimare una Y

incognita data una X ?

Abbiamo gli elementi per calcolare il n. di repliche

+Stima della variabilità non controllata

…Dal tavolino al campo• Avere per ogni unità sperimentale un numero di

individui (massa campione) sufficienti.• Avere un’estensione spaziale dell’esperimento

ridotta per ridurre le disomogeneità e non sommare fattori accidentali agli effetti dei trattamenti che stiamo facendo.

…Criterio per il dimensionamento dell’unità sperimentale

?

Un po’ di letteratura su dimensioni del campione

Coltura Variabile misurata Dimensioni del campione CV (%) Riferimento

orzo AGB 8 piante per 3 ripetizioni / Yap et al., 1972orzo AGB 40 cm lineari per 4 ripetizioni / Brunetti et al., 1982

frumento AGB 1 m2 per 3 ripetizioni / Wittmer et al., 1982mais AGB 10-60 piante per 3 ripetizioni / Williams et al., 1965soia AGB 5-10 piante per 5 ripetizioni / Buttery et al., 1974soia AGB 4 piante per 3 ripetizioni / Gent, 1982

Vigna unguiculata AGB 1 m lineare per 4 ripetizioni / Wien, 1982girasole AGB 2 piante per 5 ripetizioni / Abbate et al., 1982

orzo, pisello AGB 40 cm lineari per 3 ripetizioni 22 Cervato e Piva, 1985frumento, orzo AGB, Nuptake 50 cm lineari per 3 ripetizioni / Delogu et al., 1998

frumento AGB, LAI, SLA 0.25 m2 / Olesen et al., 2002frumento AGB, Nuptake 0.17 m2 21 Rodriguez et al., 2000

riso AGB, LAI, SLA 0.5 m2 / Casanova et al., 1998riso AGB, LAI, Nuptake 1 m lineare (semina a file) 18 Dingkuhn et al., 1999

cereali 30 piante camminando a zig zag / Scottish Agricultural Collegetutte "buon senso" ?!?!?! ?!?!?! Campbell et al., 1998

Prove nazionali varietali (Istituto Sperimentale per la Cerealicoltura (S. Angelo Lodigiano)

...è uno standard?

•Per quanto riguarda la resa granellare:tutta la parcella esclusi i bordi (1.2 x 5 m circa)

•Per quanto riguarda biomassa aerea, ecc:0.5 m lineari per due ripetizioni (CV = 25%)

Gomez, 1972“Techniques for field experiment with rice:

layout, sampling, sources of error”

...è uno standard?

In base a numerosi set di dati sperimentali trova delle dimensioni del campione (numero di piante) diverse a seconda della variabile che si vuole misurare.

Questo perché i metodi per misurare le diverse variabili hanno diversa accuratezza.

Per la biomassa aerea suggerisce 20 piante per parcella

Wolkowski et al., 1988

Determinazione della biomassa aerea

•Raccoglie tutte le piante su una fila e ne pesa 1, 5, 10, 15, 20, 25, tutte (estrazione random)

•Calcola il coefficiente di variazione

•Guarda quando il CV è più basso (CV più basso = 14%)

Esempi da letteratura riguardanti metodi alternativi per la determinazione delle dimensioni del campione

Tirol Padre et al., 1988

metodo analogo (basato sul CV (CV più basso = 12%)) in prova riguardante attività enzimatica

La varianza a volte è correlata con la media (non c’è omoscedasticità)

meglio lavorare su media e deviazione standard separate che sul CV!!!

Esempi da letteratura riguardanti metodi alternativi per la determinazione delle dimensioni del campione

Yonezawa, 1985

Numero di piante da raccogliere per caratterizzazione genotipica

Considera tutte le attività necessarie per giungere al dato finale e lo sforzo richiesto in ogni attività ed elabora matematicamente il tutto

Conclude che:

•1. campioni di sole 10 piante per ogni località o popolazione sono sufficienti

•2. è più importante analizzare un largo numero di località o popolazioni

Queste conclusioni potrebbero essere estese a prove parcellari considerando le repliche in campo come località => meglio campione “piccolo” per ogni replica ma tante repliche?

Esempi da letteratura riguardanti metodi alternativi per la determinazione delle dimensioni del campione

1. Spesso le caratteristiche della popolazione (μ e σ) sono sconosciute (variano da situazione a situazione)

è impossibile conoscere a priori l’errore che può essere ritenuto accettabile (può essere più o meno grande a seconda del

particolare campo sperimentale in esame e della sua storia).

In questi casi è meglio analizzare la variazione relativa dell’errore dovuto al campionamento al crescere delle dimensioni

del campione all’interno del campo in esame piuttosto che basarsi su criteri assoluti per l’accettazione o meno di un certo

errore.

Premessa

2. Con un numero limitato di osservazioni a disposizione (cosa che si verifica spesso nel caso di metodi lunghi o costosi) può

essere un azzardo valutare la normalità (requisito per l’applicazione dei metodi classici per la determinazione delle

dimensioni del campione)

3. I metodi classici non prendono in considerazione lo sforzo necessario per ottenere il dato

Inoltre

I metodi di ricampionamento

I metodi di ricampionamento si sono molto diffusi a partire dagli anni 60.

Concettualmente si basano sui metodi Monte Carlo ma si basano sull’uso ripetuto dell’unico campione disponibile.

Molto importanti sono il bootstrap e il jackknife

Il visual jackknife

N: numero unità campionarie

k: numero di unità campionarie appartenenti ad un gruppo

: numero di campioni virtuali (combinazioni senza ripetizione) di N-k elementi generati eliminando

volte k valori

:numero totale di campioni virtuali generati

!!

!

kkN

N

!!

!

kkN

N

2

1 !!

!N

k kkN

N

Il visual jackknife

•Calcolare, per ogni campione generato di N-k unità campionarie, la media e la deviazione standard

•Disporre il tutto su due grafici che hanno:

•in ascissa i valori di N-k (con k da N-2 a 1; ovvero con(N-k) da 2 a (N-1)

•in ordinata la media e la deviazione standard

Il visual jackknife

0

0.4

0.8

1.2

1.6

2

1 2 3 4 5 6 7 8 9 10 11 12

Sample size (3-plants groups)

Sta

nd

ard

de

via

tion

(g

AG

B)

Il visual jackknife

8

9

10

11

12

13

14

1 2 3 4 5 6 7 8 9 10 11 12

Sample size (3-plants groups)

Me

an

va

lue

(g

AG

B)

0.00

0.02

0.04

0.06

0.08

0.10

0.12

0.14

40 60 80 100 120 140 160 180

Potenziali dimensioni del campione (cm)

med

ia (

m2

m-2

)

0

0.005

0.01

0.015

0.02

0.025

0.03

0.035

dev

. st

.

media

dev. st.

Se il campione è piccolo => non generare campioni virtuali è cosa pericolosa

Singolo campione

250 campioni generati

140 cm(7 gruppi da 20cm)

..In campo• Effetto bordo

– Attorno all’appezzamento– Entro ogni parcella

• Uniformità del trattamento– I trattamenti comuni all’intero appezzamento sperimentale spesso non sono uniformi– Lavorazione del terreno– semina– Concimazioni– Diserbi – Trattamenti fitosanitari – …….

Come ottenere una stima variabilità non controllata

• Il presupposto è che non siamo i primi a fare un esperimento con il materiale e nelle condizioni operative che ci interessano

• Quindi esistono altri esperimenti +/- analoghi

Allora una stima della variabilità non controllata è ottenibile dalla bibliografia

Un ricercatore che non studia è come un muratore che non usa il cemento: fa anche una casa, ma che cade al primo colpo di vento

Che ovviamente avrete letto con la massima attenzione possibile(un ricercatore che non legge e studia NON è un ricercatore)

Come ottenere una stima variabilità non controllata

• Obbiettivo è ottenere deviazione standard e media– La media generale è sempre riportata o facilmente ottenibile

• Il coefficiente di variazione è riportato in molte prove.• Si può ottenere la standard deviation da:

– Valore della MDS– Da anova e contrasti– dai confronti multipli (es dal Test di Duncan)

Come ottenere la deviazione standard dalla MDS

,1 2

1 1varGLerrMDS t err

n n

nnn

2

2

1

1

1In genere:

nt

MDSerr

GLerr

2var

,

Come ottenere la deviazione standard dall’ANOVA (o dai contrasti)

• Solo se si conosce il P(F) si può fare il calcolo esatto.

• Se il livello di significatività è espresso come + e ++ si può solo fare un calcolo approssimato, non sempre utile

Come ottenere la deviazione standard dall’ANOVA (o dai contrasti)

• Occorre conoscere dell’esperimento da cui vogliamo ottenere l’informazione:– Il numero di trattamenti a confronto

– Il numero di ripetizioni

– Il valore della media di ogni trattamento

– Il P(F) o il P(t) nel caso di contrasti

– Oppure il valore di F, o quello di t nel caso di contrasti

– Lo schema sperimentale adottato (randomizzazione completa, blocco randomizzato ecc)

– Non importa se l’esperimento è fattoriale

Come ottenere la deviazione standard dall’ANOVA (o dai contrasti)

• Un esempio• 6 trattamenti a confronto• 4 ripetizioni per trattamento• Schema a randomizzazione completa• P(F)=0.021• Le medie:• m1=60; m2=65; m3=70; m4=80; m5=81; m6=84

• Ora andiamo all’esempio in excel

Come ottenere la deviazione standard dal test di Duncan

• Un complicatissimo calcolo approssimato, non sempre utile.

• Una ragione in più per limitare i confronti post factum quando effettivamente sono da usarsi

• Non ritengo di spendere 1 ora per farlo qui

Le tavole di Pearson e Hartley

Nel caso dell’ANOVA, è possibile dimensionare i singoli gruppi in base a:

• potenza assegnata al test F

• differenza minima che si vuole mettere in evidenza

Per il calcolo della potenza occorre calcolare il grado di falsità dell’ipotesi nulla:

2

20

2 sp

n

Dove:

• s2= QM(e) (in esperimenti comparabili o preliminari)

• p è il numero di gruppi

• δ0 è la varianza delle medie che dipende dalla differenza minima che si vuole evidenziare

• n è il n di trattamenti

Le tavole di Pearson e Hartley

Esempio

Come usare l’abaco dal Dagnelie

Lo facciamo in pratica con carta penna e righello….

Come usare l’abaco dal Dagnelie

Usare le utility di Russel Lenth

Link locale

http://www.stat.uiowa.edu/~rlenth