Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

14
Corso di biomatematica Corso di biomatematica lezione 7: lezione 7: Test di significatività Test di significatività Davide Grandi

Transcript of Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Page 1: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Corso di biomatematica Corso di biomatematica lezione 7:lezione 7:

Test di significativitàTest di significatività

Davide Grandi

Page 2: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Sommario•Test per la bontà dell’adattamento•Stabilire delle ipotesi•Test del 2

•Test del 2 e correzione di Yates

Page 3: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Bontà dell’adattamentoBontà dell’adattamentoLo scopo è verificare se esiste un accordo

tra una distribuzione osservata ed una distribuzione

attesa.Per questo scopo è stato proposto il 2 E’ un metodo detto di INFERENZA statistica.Il 2 serve anche per confrontare 2 o più

distribuzioni statistiche: posso avere:1. differenze piccole (accidentali…)2. differenze grandi (non per caso)Devo dunque dedurre scientificamente:1. differenze sono trascurabili (caso)2. distribuzione osservata realmente diversa

(attesa)

Page 4: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Bontà dell’adattamentoBontà dell’adattamentoVoglio trarre conclusioni generali dal

singolo esperimento:E’ possibile ricorrere al test del

2

utilizzando le frequenze assolute, cioè:

Dove i suffissi indicano la frequenza attesa o osservata ed i

gradi di libertà (g.d.l.) sono n – 1 (n numero di gruppi o

classi NON numero di individui)Se tra n variabili casuali ho k vincoli, i g.d.l.

del 2 corrispondente diventano n – k

n

katt

k

att

k

oss

k

ldg f

ff1

2

)..(

2

Page 5: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Schema Schema Il procedimento logico sarà dunque:• Stabilisco un’ipotesi nulla H0 ed una

alternativa H1 • Scelgo il test più appropriato• Specifico il livello di significatività

(indicato con )• Trovo la distribuzione di campionamento

nell’ipotesi nulla (da tabelle)• Stabilisco la zona di rifiuto (di norma

=0.05 )• Calcolo il valore del test statistico

stimando la probabilità P ad esso associata

• Data P traggo le conclusioni: P> non rifiuto H0 , P< rifiuto H0 e accetto H1

Page 6: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Esempio 1Esempio 1Abbiamo delle distribuzioni fenotipiche

(osservate ed attese) di Pisum sativum in un esperimento di

mendel per due caratteri: distribuzione (teorica attesa

9:3:3:1)

Fenotipi Freq. Osserv.

Freq. Attese

Gialli lisci 315 9/16=312,75

Gialli rugosi 101 3/16=104,25

Verdi lisci 108 3/16=104,25

Verdi rugosi

32 1/16=34,75

totale 556 556,00

Page 7: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Esempio 1Esempio 1Le distribuzione attesa e quella osservata

sono ovviamente diverse, calcoliamoci ora il 2 i cui gradi di

libertà saranno come accennato 3= n – 1

Ora consultiamo le tavole stimando la probabilità di trovare

differenze superiori a quelle riscontrate nell’ipotesi nulla H0

47,0

25,10425,104101

75,31275,312315

....

22

)3(

2

Page 8: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Esempio 1Esempio 1Per =0,05Per 3 gradi di libertà (come accennato 3= n

– 1) Abbiamo 2 =7,81

Il valore calcolato dunque è molto diverso da quello riportato

in tabella per =0,05, ovvero la probabilità di trovare per

caso le differenze osservate o ancora maggiori che possano

essere attribuite al caso è alta, superiore al valore

prefissato del 5%, in generale avremo2 alto probabile H1 2 basso probabile H0

Page 9: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Esempio 2Esempio 2Abbiamo una popolazione di Mixodiaptomus

kupelwieseri campionate in una pozza temporanea sono

state osservate le seguenti frequenze di 4 alleli del locus MPI

(mannoso fosfato isomerasi):

Tipo di Allele

Freq. Osserv.

Allele 1 26

Allele 2 38

Allele 3 62

Allele 4 118

totale 244

Page 10: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Esempio 2Esempio 2Mi chiedo dunque se sono le stesse

frequenze (differenze dovute al caso) ovvero ipotesi nulla H0 Oppure sono differenti, ipotesi alternativa

H1?Ora se fosse vera l’ipotesi nulla dovrei

avere frequenza 244/4 = 61 (valore atteso), per cui

calcolando il 2 otteniamo:

03,82

616162

616126

....

22

)3(

2

Page 11: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Esempio 2Esempio 2 Dalla tabella del 2 per tre gradi di libertà

abbiamoPer = 0.05 abbiamo 2 = 7,82Per = 0.01 abbiamo 2 = 11,43Per = 0.001 abbiamo 2 =16,27

Il valore del 2 calcolato da noi è superiore, il che significa

che la probabilità che le differenze tra le frequenze attese e

quelle riscontrate siano dovute al caso è molto piccola,

inferiore anche allo 0,1%.Rigetto l’ipotesi H0 e accetto H1

Page 12: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Validità e correzione di Yates Validità e correzione di Yates Il valore del 2 è determinato dai gradi di

libertà e quindi dal numero di gruppi, se il numero di frequenze

attese e piccolo, o il campione contiene pochi elementi (tra

100 e 30), è necessario correggere per la continuità

(Yates).Ovvero data la misura precisa X si dovrà

considerare lo spazio unitario compreso tra X – 0.5 e

X+0.5.Posso calcolare dunque il 2 in due modi:1. Sottraggo 0.5 ad ogni scarto in valore

assoluto2. Sottraggo 0.5 allo scarto maggiore e

aggiungo 0.5 a quello minoreRiduco sempre con la correzione il valore

del 2

Page 13: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Test a 1 e a 2 codeTest a 1 e a 2 codeAbbiamo la possibilità di effettuare dei test

cosiddetti ad una coda (unilaterali) o a due code (bilaterali) in

funzione della parte di distribuzione gaussiana che

consideriamo, ovvero se solo oltre un certo valore di Z=(x – m)/ con

segno o considerandone il valore assoluto.• Nel test ad una coda mi chiedo solamente

se una media è maggiore di un’altra (o di un valore atteso), escludendo a priori che possa esere minore

• Nel test a due code mi chiedo se tra le due medie o la media ed il valore atteso esistano differenze significative senza indicazioni su chi sia maggiore o minore.

Page 14: Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Adattamento dei dati

Davide Grandi - Dottorato in Biologia

• Test a 1 e a 2 codeTest a 1 e a 2 codeI test unilaterali sono più potenti dei test

bilaterali e a volte sono anche logicamente più appropriati (ad

esempio se so che un determinato farmaco è più efficace

dell’altro e devo solamente verificare se lo è in una

determinata percentuale.In termini tecnici si dice che il test a due

code è più conservativo.