Marco Acutis
&
Roberto Confalonieri
L’impostazione degli esperimenti
• Come va gestito un esperimento ?
• Quante ripetizioni occorrono ?
• Come dimensionare l’unità sperimentale ?
• Quale schema sperimentale adottare ?
• Gestire la variabilità spaziale
Stretto rapporto tra le risposte a queste domande,nessun punto è affrontabile singolarmete
Criteri generali di gestione di un esperimento
• Finalizzazione– L’esperimento deve rispondere a necessità specifiche
esattamente definite.
– Si deve sapere la ragione per ogni dato che si raccoglie
– Se dei dati si raccolgono “per prassi” occorre essere consci della ragione della prassi.
– Occorre un equilibrio tra i costi e i risultati ottenibili.
L’esperimento inizia a tavolino !
…A Tavolino• Quali differenze tra trattamenti consideriamo
“rilevanti” per la nostra indagine ?• Con che precisione vogliamo stimare un
parametro ? (es coefficiente angolare di una retta) • Con che precisione vogliamo stimare una Y
incognita data una X ?
Abbiamo gli elementi per calcolare il n. di repliche
+Stima della variabilità non controllata
…Dal tavolino al campo• Avere per ogni unità sperimentale un numero di
individui (massa campione) sufficienti.• Avere un’estensione spaziale dell’esperimento
ridotta per ridurre le disomogeneità e non sommare fattori accidentali agli effetti dei trattamenti che stiamo facendo.
…Criterio per il dimensionamento dell’unità sperimentale
?
Un po’ di letteratura su dimensioni del campione
Coltura Variabile misurata Dimensioni del campione CV (%) Riferimento
orzo AGB 8 piante per 3 ripetizioni / Yap et al., 1972orzo AGB 40 cm lineari per 4 ripetizioni / Brunetti et al., 1982
frumento AGB 1 m2 per 3 ripetizioni / Wittmer et al., 1982mais AGB 10-60 piante per 3 ripetizioni / Williams et al., 1965soia AGB 5-10 piante per 5 ripetizioni / Buttery et al., 1974soia AGB 4 piante per 3 ripetizioni / Gent, 1982
Vigna unguiculata AGB 1 m lineare per 4 ripetizioni / Wien, 1982girasole AGB 2 piante per 5 ripetizioni / Abbate et al., 1982
orzo, pisello AGB 40 cm lineari per 3 ripetizioni 22 Cervato e Piva, 1985frumento, orzo AGB, Nuptake 50 cm lineari per 3 ripetizioni / Delogu et al., 1998
frumento AGB, LAI, SLA 0.25 m2 / Olesen et al., 2002frumento AGB, Nuptake 0.17 m2 21 Rodriguez et al., 2000
riso AGB, LAI, SLA 0.5 m2 / Casanova et al., 1998riso AGB, LAI, Nuptake 1 m lineare (semina a file) 18 Dingkuhn et al., 1999
cereali 30 piante camminando a zig zag / Scottish Agricultural Collegetutte "buon senso" ?!?!?! ?!?!?! Campbell et al., 1998
Prove nazionali varietali (Istituto Sperimentale per la Cerealicoltura (S. Angelo Lodigiano)
...è uno standard?
•Per quanto riguarda la resa granellare:tutta la parcella esclusi i bordi (1.2 x 5 m circa)
•Per quanto riguarda biomassa aerea, ecc:0.5 m lineari per due ripetizioni (CV = 25%)
Gomez, 1972“Techniques for field experiment with rice:
layout, sampling, sources of error”
...è uno standard?
In base a numerosi set di dati sperimentali trova delle dimensioni del campione (numero di piante) diverse a seconda della variabile che si vuole misurare.
Questo perché i metodi per misurare le diverse variabili hanno diversa accuratezza.
Per la biomassa aerea suggerisce 20 piante per parcella
Wolkowski et al., 1988
Determinazione della biomassa aerea
•Raccoglie tutte le piante su una fila e ne pesa 1, 5, 10, 15, 20, 25, tutte (estrazione random)
•Calcola il coefficiente di variazione
•Guarda quando il CV è più basso (CV più basso = 14%)
Esempi da letteratura riguardanti metodi alternativi per la determinazione delle dimensioni del campione
Tirol Padre et al., 1988
metodo analogo (basato sul CV (CV più basso = 12%)) in prova riguardante attività enzimatica
La varianza a volte è correlata con la media (non c’è omoscedasticità)
meglio lavorare su media e deviazione standard separate che sul CV!!!
Esempi da letteratura riguardanti metodi alternativi per la determinazione delle dimensioni del campione
Yonezawa, 1985
Numero di piante da raccogliere per caratterizzazione genotipica
Considera tutte le attività necessarie per giungere al dato finale e lo sforzo richiesto in ogni attività ed elabora matematicamente il tutto
Conclude che:
•1. campioni di sole 10 piante per ogni località o popolazione sono sufficienti
•2. è più importante analizzare un largo numero di località o popolazioni
Queste conclusioni potrebbero essere estese a prove parcellari considerando le repliche in campo come località => meglio campione “piccolo” per ogni replica ma tante repliche?
Esempi da letteratura riguardanti metodi alternativi per la determinazione delle dimensioni del campione
Un approccio grafico derivato dal jackknife per la determinazione delle
dimensioni del campione
http://agrifish.jrc.it/marsstat/warm/archive.htm
1. Spesso le caratteristiche della popolazione (μ e σ) sono sconosciute (variano da situazione a situazione)
è impossibile conoscere a priori l’errore che può essere ritenuto accettabile (può essere più o meno grande a seconda del
particolare campo sperimentale in esame e della sua storia).
In questi casi è meglio analizzare la variazione relativa dell’errore dovuto al campionamento al crescere delle dimensioni
del campione all’interno del campo in esame piuttosto che basarsi su criteri assoluti per l’accettazione o meno di un certo
errore.
Premessa
2. Con un numero limitato di osservazioni a disposizione (cosa che si verifica spesso nel caso di metodi lunghi o costosi) può
essere un azzardo valutare la normalità (requisito per l’applicazione dei metodi classici per la determinazione delle
dimensioni del campione)
3. I metodi classici non prendono in considerazione lo sforzo necessario per ottenere il dato
Inoltre
I metodi di ricampionamento
I metodi di ricampionamento si sono molto diffusi a partire dagli anni 60.
Concettualmente si basano sui metodi Monte Carlo ma si basano sull’uso ripetuto dell’unico campione disponibile.
Molto importanti sono il bootstrap e il jackknife
Il visual jackknife
N: numero unità campionarie
k: numero di unità campionarie appartenenti ad un gruppo
: numero di campioni virtuali (combinazioni senza ripetizione) di N-k elementi generati eliminando
volte k valori
:numero totale di campioni virtuali generati
!!
!
kkN
N
!!
!
kkN
N
2
1 !!
!N
k kkN
N
Il visual jackknife
•Calcolare, per ogni campione generato di N-k unità campionarie, la media e la deviazione standard
•Disporre il tutto su due grafici che hanno:
•in ascissa i valori di N-k (con k da N-2 a 1; ovvero con(N-k) da 2 a (N-1)
•in ordinata la media e la deviazione standard
Il visual jackknife
0
0.4
0.8
1.2
1.6
2
1 2 3 4 5 6 7 8 9 10 11 12
Sample size (3-plants groups)
Sta
nd
ard
de
via
tion
(g
AG
B)
Il visual jackknife
8
9
10
11
12
13
14
1 2 3 4 5 6 7 8 9 10 11 12
Sample size (3-plants groups)
Me
an
va
lue
(g
AG
B)
0.00
0.02
0.04
0.06
0.08
0.10
0.12
0.14
40 60 80 100 120 140 160 180
Potenziali dimensioni del campione (cm)
med
ia (
m2
m-2
)
0
0.005
0.01
0.015
0.02
0.025
0.03
0.035
dev
. st
.
media
dev. st.
Se il campione è piccolo => non generare campioni virtuali è cosa pericolosa
Singolo campione
250 campioni generati
140 cm(7 gruppi da 20cm)
..In campo• Effetto bordo
– Attorno all’appezzamento– Entro ogni parcella
• Uniformità del trattamento– I trattamenti comuni all’intero appezzamento sperimentale spesso non sono uniformi– Lavorazione del terreno– semina– Concimazioni– Diserbi – Trattamenti fitosanitari – …….
Come ottenere una stima variabilità non controllata
• Il presupposto è che non siamo i primi a fare un esperimento con il materiale e nelle condizioni operative che ci interessano
• Quindi esistono altri esperimenti +/- analoghi
Allora una stima della variabilità non controllata è ottenibile dalla bibliografia
Un ricercatore che non studia è come un muratore che non usa il cemento: fa anche una casa, ma che cade al primo colpo di vento
Che ovviamente avrete letto con la massima attenzione possibile(un ricercatore che non legge e studia NON è un ricercatore)
Come ottenere una stima variabilità non controllata
• Obbiettivo è ottenere deviazione standard e media– La media generale è sempre riportata o facilmente ottenibile
• Il coefficiente di variazione è riportato in molte prove.• Si può ottenere la standard deviation da:
– Valore della MDS– Da anova e contrasti– dai confronti multipli (es dal Test di Duncan)
Come ottenere la deviazione standard dalla MDS
,1 2
1 1varGLerrMDS t err
n n
nnn
2
2
1
1
1In genere:
nt
MDSerr
GLerr
2var
,
Come ottenere la deviazione standard dall’ANOVA (o dai contrasti)
• Solo se si conosce il P(F) si può fare il calcolo esatto.
• Se il livello di significatività è espresso come + e ++ si può solo fare un calcolo approssimato, non sempre utile
Come ottenere la deviazione standard dall’ANOVA (o dai contrasti)
• Occorre conoscere dell’esperimento da cui vogliamo ottenere l’informazione:– Il numero di trattamenti a confronto
– Il numero di ripetizioni
– Il valore della media di ogni trattamento
– Il P(F) o il P(t) nel caso di contrasti
– Oppure il valore di F, o quello di t nel caso di contrasti
– Lo schema sperimentale adottato (randomizzazione completa, blocco randomizzato ecc)
– Non importa se l’esperimento è fattoriale
Come ottenere la deviazione standard dall’ANOVA (o dai contrasti)
• Un esempio• 6 trattamenti a confronto• 4 ripetizioni per trattamento• Schema a randomizzazione completa• P(F)=0.021• Le medie:• m1=60; m2=65; m3=70; m4=80; m5=81; m6=84
• Ora andiamo all’esempio in excel
Come ottenere la deviazione standard dal test di Duncan
• Un complicatissimo calcolo approssimato, non sempre utile.
• Una ragione in più per limitare i confronti post factum quando effettivamente sono da usarsi
• Non ritengo di spendere 1 ora per farlo qui
Le tavole di Pearson e Hartley
Nel caso dell’ANOVA, è possibile dimensionare i singoli gruppi in base a:
• potenza assegnata al test F
• differenza minima che si vuole mettere in evidenza
Per il calcolo della potenza occorre calcolare il grado di falsità dell’ipotesi nulla:
2
20
2 sp
n
Dove:
• s2= QM(e) (in esperimenti comparabili o preliminari)
• p è il numero di gruppi
• δ0 è la varianza delle medie che dipende dalla differenza minima che si vuole evidenziare
• n è il n di trattamenti
Le tavole di Pearson e Hartley
Esempio
Come usare l’abaco dal Dagnelie
Lo facciamo in pratica con carta penna e righello….
Come usare l’abaco dal Dagnelie
Usare le utility di Russel Lenth
Link locale
http://www.stat.uiowa.edu/~rlenth
Top Related