Lecco, 15 dic 2005Francesco Ronzon 1 Statistica applicata allanalisi microbiologica.

Post on 02-May-2015

216 views 3 download

Transcript of Lecco, 15 dic 2005Francesco Ronzon 1 Statistica applicata allanalisi microbiologica.

Lecco, 15 dic 2005 Francesco Ronzon1

Statistica

applicata all’analisi

microbiologica

Lecco, 15 dic 2005Francesco Ronzon2

Licenza

Tu sei libero:• di riprodurre, distribuire, comunicare al pubblico, esporre in pubblico, rappresentare, eseguire o recitare quest’opera• di creare opere derivate

alle condizioni citate in:http://creativecommons.org/licenses/by-nc-sa/2.5/

per informazioni contatta Francesco Ronzon

e.mail:

Questa presentazione è parte del progetto:

http://www.iperserver.it/mediawiki/

Lecco, 15 dic 2005Francesco Ronzon3

Obiettivo

“presentare statistica applicata all’analisi microbiologica con approccio pragmatico”

“chiarire aspetti relativi al corretto utilizzo di alcune tecniche statistiche e loro significato interpretativo”

Lecco, 15 dic 2005Francesco Ronzon4

Quadro generale

Perché la statistica? difficoltà intrinseche all’analisi microbiologica (fattori della variabilità)

alta variabilità = bassa qualità Con la Statistica voglio:

– Tenere sotto controllo variabilità– Valutare metodi– Avere una misura dell’errore delle mie affermazioni

(valutazione quantitativa dell’incertezza) Quale parte della statistica si applica nel laboratorio di

microbiologia?

Oggi

vedremo

Lecco, 15 dic 2005Francesco Ronzon5

Argomenti affrontati

Statistica descrittiva e inferenziale Concetti di base Distribuzioni statistiche Stime, Intervalli di confidenza, Test La variabilità nel campione microbiologico Test specifici del laboratorio microbiologico Esercizi pratici

Lecco, 15 dic 2005Francesco Ronzon6

Iniziamo…

S ta tis t ica d esc rit t iva S ta tis t ica in fe ren z ia le

S ta tis t ica

Lecco, 15 dic 2005Francesco Ronzon7

Quando entra in gioco la probabilità?

S ta tis t ica d esc rit t iva S ta tis t ica in fe ren z ia le

S ta tis t ica

Conosco tutto Conosco parte (campione)! Certezza Incertezza ?

Lecco, 15 dic 2005Francesco Ronzon8

Quadro argomenti

in d ic i d ip os iz ion e

(e s . m e d ia )

in d ic i d id isp ers ion e

(e s . va ria n za )

In d ic i G ra fic i

S ta tis t ica d esc ritt iva

S tim aP u n tu a le

In te rva lli d icon fid en za(e s . 9 5 % )

S tim a interva llare

S tim e

Tes t S p ec ific id i m ic ro b io lo g ia

Tes t d i s ig n ifica tività(e s . 5 % )

S ta tis t ica in fe ren z ia le

S ta tis t ica

Lecco, 15 dic 2005Francesco Ronzon9

Statistica descrittiva - Grafici

0

20

40

60

80

100

120

140

2001 2002 2003 2004

0

20

40

60

80

100

120

140

A20

0220

0320

0120

0220

030

5

10

15

20

2001 2002 2003

Lecco, 15 dic 2005Francesco Ronzon10

Istogramma

Es. Confronto conteggio tra operatori

0

50

100

150

200

250

Capsula I Capsula II Capsula III

UFC Operatore A

Operatore B

Resp. Sez.

Lecco, 15 dic 2005Francesco Ronzon11

Grafico a torta

% Conteggi accettabili operatore x

14%

86%

Conteggi risultati accettabili

Conteggi risultati non accettabili

Lecco, 15 dic 2005Francesco Ronzon12

Grafici da evitare

0

50

100

150

200

250

Istogramma 3D

Lecco, 15 dic 2005Francesco Ronzon13

Grafici da evitare

0

50

100

150

200

250

Linee 3D

Lecco, 15 dic 2005Francesco Ronzon14

Grafici da evitare

Torte 3D

Conteggi risultati accettabili Conteggi risultati non accettabili

Lecco, 15 dic 2005Francesco Ronzon15

Statistica descrittiva - Indici

In d ic i d i p os iz ion e(o te n d e n za ce n tra le )

In d ic i d i d isp ers ion e(va ria b ilità )

S ta tis t ica d esc ritt ivaIndici

Lecco, 15 dic 2005Francesco Ronzon16

Statistica descrittiva - Indici

Indici di Posizione(ordine di grandezza)

Media– Aritmetica– Quadratica

Quartili, percentili Moda Mediana

Indici di Dispersione(variabilità)

Valore max, min Campo di variazione Varianza Deviazione Standard Coefficiente di

variazione (CV)

Lecco, 15 dic 2005Francesco Ronzon17

Indici di posizione(misure di tendenza centrale)

Media: è il valore “medio” dei miei datiMediana: è il valore centrale dei miei dati

(dopo che li ho ordinati, dal più piccolo al più grande)

Moda: è la caratteristica o valore che si presenta più frequentemente

Lecco, 15 dic 2005Francesco Ronzon18

Indici di posizione

Media aritmetica

N

ii

N

xN

N

xxx

1

21

1

...

In Excel: MEDIA(dati)

Lecco, 15 dic 2005Francesco Ronzon19

Indici di posizione

Media quadratica

Esempio:

la ripetibilità di conteggio totale del laboratorio è la media quadratica delle ripetibilità dei singoli operatori.

N

x

N

xxx

N

ii

q

Nq

1

2

222

21 ...

Lecco, 15 dic 2005Francesco Ronzon20

Indici di posizione

Mediana

È il valore “x” che mi permette di dire che il 50% dei valori sono maggiori di “x” ed il 50% sono più minori.

1, 3, 5, 7, 18

3, 5, 7, 9

Mediana = 5

Mediana = 6In Excel: MEDIANA(dati)

Lecco, 15 dic 2005Francesco Ronzon21

Quartili e percentili

Una volta ordinati i dati: Con la mediana li divide in due gruppi: 50% e 50% Con i quartili li divido in 4 gruppi (da 25%) Con i percentili li divido in 100 gruppi (da 1%)

– Il 25° percentile viene chiamato primo quartile,– il 50° coincide con il secondo quartile ovvero con la mediana– il 75° percentile viene detto terzo quartile.

Lecco, 15 dic 2005Francesco Ronzon22

Indici di posizione

Moda

È il valore + frequente(il punto più alto nei grafici di frequenze)Utile per descrivere dati in categorie

Es. (8,3,8,9,2,4,3,8,8,4,2,8,5,2,8,8,2,6,8)

Moda=8 (Mediana=6, Media=5,58)

In Excel: MODA(dati)

Lecco, 15 dic 2005Francesco Ronzon23

Media, moda e mediana - esempio

Media, moda e mediana

0

1

2

3

4

5

6

7

8

9

10

Dati

Media

Moda

Mediana

Lecco, 15 dic 2005Francesco Ronzon24

ma… la “posizione” non basta

distribuzioni con stessa media e “variabilità” diverse

Lecco, 15 dic 2005Francesco Ronzon25

Indici di dispersione(misure di variabilità)

Valore max, min Campo di variazione = max–min (ingl. Range) Deviazione Standard Varianza Coefficiente di variazione (CV)

Lecco, 15 dic 2005Francesco Ronzon26

Deviazione standard (popolazione)

In Excel: DEV.ST.POP(dati)

N

iiNx

1

21

Lecco, 15 dic 2005Francesco Ronzon27

Deviazione standard (popolazione)

È espressa nella stessa unità di misura dei dati Detta anche:

– Scarto tipo (fr. Écart type) – Scarto quadratico medio– Standard Deviation

Da non confondere con Devianza o Errore Standard:

N

iiNx

1

21

2

1

2 Nidevianza

N

i

x

.2. StErrorestimaconfidenzaInterv

Lecco, 15 dic 2005Francesco Ronzon28

Deviazione Standard suoi effetti

= 2

=3 =4

Lecco, 15 dic 2005Francesco Ronzon29

Varianza (popolazione)

In Excel: VAR.POP(dati)

N

iiNx

1

22 1

È il quadrato della deviazione standard È la “media” dei quadrati delle deviazioni dalla

media

Lecco, 15 dic 2005Francesco Ronzon30

Coefficiente di Variazione (popolazione)

CV

Misura la dispersione percentuale in rapporto alla media

Lecco, 15 dic 2005Francesco Ronzon31

Coefficiente di Variazione (popolazione)

E’ un numero senza unità di misura, quindi consente di confrontare la variabilità di fenomeni con unità di misura diverse.

Uso tipico con numeri positivi e media non nulla detto anche Scarto tipo relativo (fr. Écart type relatif),

o Incertezza tipo relativa (e coefficient of variation).

CV

Lecco, 15 dic 2005Francesco Ronzon32

Coefficiente di Variazione (popolazione)

Spesso viene espresso in percentuale: si moltiplica per cento e si aggiunge il segno di “%”

ma attenzione a non fare errori in Excel: si scrive solo DEV.ST.POP(dati)/MEDIA(dati)*100 oppure DEV.ST.POP(dati)/MEDIA(dati) e si fa clic su:

mai entrambe le operazioni!

2/4 è il 50%, …e non 5000%

%100%

CV

Lecco, 15 dic 2005Francesco Ronzon33

Campo di variazione (ingl. Range)

Campo di Variazione = MAX – MIN

Non confondere con il CV=Coefficiente di variazione Non con con Range (ingl) con “rango” (e quindi con la

funzione RANGE(.) in Excel).

In Excel: MAX(dati)-MIN(dati)

Lecco, 15 dic 2005Francesco Ronzon34

Grafici Box-Plot

Utili per una visualizzazione grafica della posizione e dispersione, ma… non c’è definizione univoca, quindi…attenzione alla legenda!

0

20

40

60

80

100

120

140

160

180 Valore max.

III percentile

Mediana

I percentile

Valore min.

Lecco, 15 dic 2005Francesco Ronzon35

Riassumendo

la statistica descrittiva mi “riassume” i dati con pochi indici che mi descrivono la posizione (della curva) e dispersione (“larghezza”)

Lecco, 15 dic 2005 Francesco Ronzon36

Le distribuzioni statistiche

Poisson, Normale, Chi quadrato…

modelli matematici utili a descrivere popolazioni

Lecco, 15 dic 2005Francesco Ronzon37

Distribuzioni statistiche

Alle volte l'uso di modelli matematici mi permette di riassumere tutti i miei dati in pochi parametri (es. regressione, y=a+bx).

Lecco, 15 dic 2005Francesco Ronzon38

Distribuzioni in microbiologia

Poisson Binomiale Normale Chi quadrato t di Student

Lecco, 15 dic 2005Francesco Ronzon39

Distribuzione Poisson

Famiglia di distribuzioni al variare di >0

Lecco, 15 dic 2005Francesco Ronzon40

Distribuzione Poisson

Distribuzione discreta Media=Varianza= “senza memoria” In Microbiologia descrive

bene conta UFC

Lecco, 15 dic 2005Francesco Ronzon41

Distribuzione Binomiale

Famiglia di distribuzioni al variare di n e p

Lecco, 15 dic 2005Francesco Ronzon42

Distribuzione Binomiale

Media=np Media>Varianza=np(1-p) In Microbiologia descrive

bene conta con MPN

tuttavia se n, p0 Bi (.) Poisson(.)

Lecco, 15 dic 2005Francesco Ronzon43

Distribuzione Normale

Famiglia di distribuzioni al variare di e

Lecco, 15 dic 2005Francesco Ronzon44

Distribuzione Normale

2,5%

Lecco, 15 dic 2005Francesco Ronzon45

Distribuzione Normale

Media = Deviazione

Standard= indipendente da È frequente in

“natura” In microbiologia…

Lecco, 15 dic 2005Francesco Ronzon46

Distribuzione Normale

…(anche) in microbiologia si usa per approssimare altre distribuzioni:

Se >15 Poisson() N(, )

Se n>12 Binom(n,p) N(np,np(1-p))

Se n , p0 Binom(n,p) Poisson(=np) N(np,np)

e vale anche:Se k Chi Q. N(k,2k)Se k t di Student N(0,1)

)25.0,()( NXPoissonX

Lecco, 15 dic 2005Francesco Ronzon47

Distribuzione Normalestandardizzata

Lecco, 15 dic 2005Francesco Ronzon48

Distribuzione Chi Quadrato

Famiglia di distribuzioni al variare di k=g.d.l.

Lecco, 15 dic 2005Francesco Ronzon49

Distribuzione Chi Quadrato

Media=k Varianza=2k ed inoltre:

21

2 ~(0,1)~ ZNZ

Lecco, 15 dic 2005Francesco Ronzon50

Distribuzione t di Student

Famiglia di distribuzioni al variare di k=g.d.l.

Lecco, 15 dic 2005Francesco Ronzon51

Distribuzione t di Student

Media=0 Se k allora:

t di Student N(0,1)

Lecco, 15 dic 2005Francesco Ronzon52

Chi mi dà percentili delle distribuzioni?

Tavole Computer Excel InternetEs. http://faculty.vassar.edu/lowry/tabs.html

Programmi specificiEs. DistCal

Lecco, 15 dic 2005Francesco Ronzon53

Percentili Chi Quadrato con Excel

1 2 3 4 5 p= 5% 3.84 5.99 7.81 9.49 11.07 p= 1% 6.63 9.21 11.34 13.28 15.09

Percentili Chi Quadratogradi di libertà (k)

=INV.CHI(0,01;2)=9,21

9,21

=DISTRIB.CHI(9,21;2)=0,01

1%

Lecco, 15 dic 2005Francesco Ronzon54

Percentili della t di Student in Excel

DISTRIB.T(Z;gdl;1)

Es. =DISTRIB.T(1,96;99999;1)=0,25

INV.T(p;gdl)Es. =INV.T(0,05;9999)=1,96

DISTRIB.T(Z;gdl;2)

Es. =DISTRIB.T(1,96;99999;2)=0,5

- Z Z

2 Code

Lecco, 15 dic 2005Francesco Ronzon55

Percentili della Normale in Excel

DISTRIB.NORM(z;;;VERO)

Es. =DISTRIB.NORM(1,96;0;1;VERO)=0,975

INV.NORM(p;;)Es. =INV.NORM(0,95;0;1)=1,96

Lecco, 15 dic 2005Francesco Ronzon56

Probabilità della Poisson in Excel

P(X=c)=POISSON(c;;FALSO)P(Xc)=POISSON(c;;VERO)

P(X>c)=1- P(Xc) P(a < X b)=P(Xb)- P(Xa)

Esercizio: P(6< X21)=POISSON(21;12;VERO)-POISSON(6;12;VERO)=0,948

(verifica intervalli confid. al 95% per conteggio su capsula Petri con n=12)

Attenzione al limite Excel (x max 150)

Lecco, 15 dic 2005Francesco Ronzon57

dove siamo arrivati?

in d ic i d ip os iz ion e

(e s . m e d ia )

in d ic i d id isp ers ion e

(e s . va ria n za )

In d ic i G ra fic i

S ta tis t ica d esc ritt iva

S tim aP u n tu a le

In te rva lli d icon fid en za(e s . 9 5 % )

S tim a interva llare

S tim e

Tes t S p ec ific id i m ic ro b io lo g ia

Tes t d i s ig n ifica tività(e s . 5 % )

S ta tis t ica in fe ren z ia le

S ta tis t ica

Lecco, 15 dic 2005 Francesco Ronzon58

Statistica inferenziale

Ovvero, come descrivere la popolazione partendo da un campione

Lecco, 15 dic 2005Francesco Ronzon59

Statistica inferenziale

Quando: Non possiamo o non vogliamo misurare tutta la

popolazione Vogliamo comunque descriverla Vogliamo avere una stima degli indici visti fino

ad ora, ma entra in gioco l’Incertezza e quindi la probabilità:

Probabilità = 0 ... 1 = 0% …100%

Lecco, 15 dic 2005Francesco Ronzon60

Metodo induttivo/deduttivo

InferenzaStima di C’è sovra-

dispersione?Test Kp Test G2

Lecco, 15 dic 2005Francesco Ronzon61

Campione Microbiologico

inoculi da stessa “popolazione” non danno stesso UFC

Componenti incertezza: Distribuzione casuale (di Poisson) delle cellule microbiche

Lettura delle piastre (ripetibilità conteggio)* Volume totale inoculato (ripetibilità dosaggio) * Fattore di diluizione (ripetibilità dosaggio diluente) *

*tenuta sotto controllo con valutazione sperimentale della ripetibilità (performance operatori e laboratorio)

Lecco, 15 dic 2005Francesco Ronzon62

Stimatori degli “indici descrittivi”

Popolazione

media pop.

2 varianza pop.

Campione

media campionaria

s2 varianza campionaria

xInferenza

Lecco, 15 dic 2005Francesco Ronzon63

Indici campionari

Media campionaria Varianza campionaria Deviazione Standard campionaria CV = Coefficiente di variazione campionario

Lecco, 15 dic 2005Francesco Ronzon64

Simbologia (convenzioni)

Lettere greche per parametri popolazione– con il cappelletto le relative stime

Lettere latine MAIUSCOLE per variabili casuali Lettere latine minuscole per campione (x,u) Media campionaria con trattino sopra

Es.

),(ˆ

),(21

2

nin Nxx

NXSe

2ˆˆ

Lecco, 15 dic 2005Francesco Ronzon65

Media campionaria

In Excel: MEDIA(dati)

n

iixn

x1

1

Lecco, 15 dic 2005Francesco Ronzon66

Deviazione standard campionaria

In Excel: DEV.ST(dati) DEV.ST.POP(dati)

n

i

xxins

1

2

1

1

Lecco, 15 dic 2005Francesco Ronzon67

Varianza campionaria

In Excel: VAR(dati)

n

i

xxins

1

22

1

1

Lecco, 15 dic 2005Francesco Ronzon68

Coefficiente di Variazione

x

sCV

In Excel: DEV.ST(dati)/MEDIA(dati)

%100% x

sCV

Lecco, 15 dic 2005Francesco Ronzon69

Lo statistico trova e dimostra che…

Stimatore della “vera” media è

Stimatore della “vera” varianza è

n

iixn

x1

1

n

i

xxin 1

22

1

1

Lecco, 15 dic 2005Francesco Ronzon70

Come valuto uno stimatore: ?

Mediamente deve…“indovinarci”

Deve avere “variabilità media piccola”

Si dimostra che:22)( sE)(xE

min)( xV min)( 2 sV

)ˆ(E

min)ˆ( V

Lecco, 15 dic 2005Francesco Ronzon71

Lo stimatore mi dà un solo valore!… è sufficiente?

Se un marziano ci chiedesse quanto sono alti mediamente gli esseri umani, e noi gli rispondessimo: - «mediamente 155cm»egli potrebbe immaginare esseri umani alti 5cm ed altri alti 3 metri!.

Ci vuole un “intervallo di confidenza”!

Lecco, 15 dic 2005Francesco Ronzon72

Teorema del limite centrale

La media campionaria di un campione si distribuisce come una normale con

media pari alla media della popolazione varianza pari a varianza popolazione su n=V(X)/n

),(ˆ

),(21

2

nin Nxxallora

DistribXse

Lecco, 15 dic 2005Francesco Ronzon73

Distribuzione uniformedecisamente diversa dallanormale! (grande )!

La distribuzione delle medie campionarie (distribuzione campionaria) da una distribuzione non normale dopo anche pochi campioni diventa normale con piccola dispersione!

TENDENZA VERO IL LIMITE CENTRALE

Intervallo

Teorema del limite centrale

Lecco, 15 dic 2005Francesco Ronzon74

Tlc e Intervalli di confidenza

Posso sempre costruire intervalli di confidenza sfruttando il TLC

StandardErrorex

xn

2ˆ ˆ

Lecco, 15 dic 2005Francesco Ronzon75

Tlc e Poisson (conteggi con c>15)

Nella Poisson media=varianza, quindi sfruttando il TLC

cc

cc

cc

nse

4,1

2

22

2

Es. Conta singola (n=1) con c=25 Risultato = 252*5 = 2510

Es. Conta doppia con c=18,32 Risultato = 251,4*5= 257

n

cc

cxnc

n

2

22 ˆ

ccnse 21

Lecco, 15 dic 2005Francesco Ronzon76

Intervalli di confidenza nella Poisson

si applica il TLC (e le tavole se a disposizione)

si guardano le tavole (ISO 7218) con intervalli di confidenza già calcolati.

ErrStc 215c

15c

Calcolo e verifica intervalli della

Poisson in Excel

Lecco, 15 dic 2005Francesco Ronzon77

Intervalli di confidenza al 95%

Metodo statistico che mi permette di costruire, a partire dai dati sperimentali, un intervallo di valori plausibili.

Se applicato a 100 analisi diverse, 95 intervalli (circa) conterranno il “vero” valore, ma 5 no!

…insomma, ci azzecca il 95% delle volte.

Lecco, 15 dic 2005Francesco Ronzon78

Intervalli di confidenzacorretta interpretazione

L’intervallo di confidenza del n° di batteri di un alimento risultano, nel nostro laboratorio, fuori legge. Prima di provvedere al sequestro un magistrato ci chiede:

“quale è la probabilità che le analisi siano giuste?”.

“Sig. Magistrato: il mio laboratorio stima, diciamo, 10000 intervalli di confidenza all’anno; 9500 sono giusti, ma 500 completamente errati. Ora, non so dirle se questo intervallo che le ho dato è esatto oppure no”.

Lecco, 15 dic 2005Francesco Ronzon79

Poisson?

Ma…sicuri che possiamo applicare ai nostri dati il modello matematico/statistico di Poisson (o la sua approssimazione alla normale?

Sì se: i microrganismi sono distribuiti in modo

casuale (non uniforme, né a gruppi) Se non ho SOVRADISPERSIONE

Lecco, 15 dic 2005Francesco Ronzon80

Poisson?

La Poisson prevede che i micro-organismi siano distribuiti in modo casuale

0

1

2

3

4

5

6

7

8

9

10

0 1 2 3 4 5 6 7 8 9 10

2

Lecco, 15 dic 2005Francesco Ronzon81

Sovradispersione nella Poisson

Accade quando conteggi mostrano una varianza maggiore della media (quindi una varianza troppo grande).Se Varianza>Media SovradispersioneSe Varianza<Media SottodispersioneSe Varianza=Media OK, distribuzione casuale

2 2 2

Lecco, 15 dic 2005Francesco Ronzon82

Come valuto la sovradispersione?

Con un Test statistico:

Test Kp

Test G2

Si distribuiscono entrambi come una Chi-quadratoNon c’è sovradispersione se il test da “valori piccoli (rifiuto per valori grandi).

Lecco, 15 dic 2005Francesco Ronzon83

Test di verifica d’Ipotesi

Un test mi aiuta a prendere una decisione.

…un po' come un giudice in un processo. L'incertezza implica la possibilità di fare due tipi di errore:

assolve condannaè veramente innocente OK Errore Iha veramento ucciso Errore II OK

Decisione giudice

Ogni decisione su una certa ipotesi (es. colpevole o innocente) implica due tipi di errori (che spesso non riteniamo di pari gravità).

Se qualcuno ci desse una procedura per decidere che tuttavia mi consenta di conoscere la probabilità di uno solo dei due errori: quale errore sceglierei di poter tenere sotto controllo?

Definiamo allora “Errore di I tipo” quell'errore (generalmente è il + grave, ma non è detto). L'ipotesi relativa è detta: Ipotesi nulla: H0

Lecco, 15 dic 2005Francesco Ronzon84

Test di livello di significatività =5%

assolve condanna

è veramente innocente OK Errore I

ha veramento ucciso Errore II OK

Decisione giudice

Definiamo con la probabilità dell’errore di I tipo. Questo valore, detto livello di significatività di un test per H0=innocente

=P(rifiutare Ipotesi nulla: H0 quando essa è “vera”)

non si possono diminuire entrambi gli errori…

Prima di fare un test si decide il valore di =0,05 (5%), =0,01 (1%)

varia a seconda dei contesti (vedi es. casa farmaceutica)

accetto Ho rifiuto Ho

in realtà è vera Ho OK Errore I

in realtà non è vera Ho Errore II OK

Decisione giudice

Lecco, 15 dic 2005Francesco Ronzon85

Test di verifica dell’Ipotesisignificato interpretativo

Un Test accetta o rifiuta H0, non dimostra mai che è H0 vera o falsa.

H1 è corroborata (sostenuta) o meno dai dati, mai accettata o rifiutata e tanto “vera” o “falsa”

Si dice “test di significatività al 5%”, ma …ho due tipi di errore… (ma abbiamo deciso di costruire il test per Ho, che vogliamo tenere “sotto controllo”).

= 5% = P(rifiutare H0 quando H0 è vera)=P(err I° tipo)

=P(accettare H0 quando H0 non è vera)=P(err. II° tipo)

Lecco, 15 dic 2005Francesco Ronzon86

Test di verifica dell’Ipotesipraticamente…

Il test è una formula che mi danno gli statistici (+/- complessa e con +/- senza senso logico/intuitivo)

premesso che ai dati si possa applicare certi modelli matematici, gli statistici mi dicono che: se l’ipotesi H0 è vera, il test deve assumere certi

valori (regione di accettazione) con una certa prob. se H0 è falsa deve assumerne altri (regione di rifiuto).

Ergo: calcolo il test con i miei dati e …decido!.

Lecco, 15 dic 2005Francesco Ronzon87

Test G2 (per valutare sovradispersione)

Gli statistici mi dicono di calcolare l’espressione:

e mi dicono che “sotto” H0 allora: se G2 < 3,84 accetto H0

se G2 > 3,84 rifiuto H0

Con H0= ipotesi di assenza di sovradispersione

Lecco, 15 dic 2005Francesco Ronzon88

Test che misurano la bontà di adattamento: G2 Chi2 di Pearson = Kp

Sono test “goodness of fit to a distribution” che valutano quanto i dati concordano con modello

facile ed intuitivo è il

H0= il modello si adatta

Se (foss fatt) allora Chi2 0 accetto H0

Rifiuto per valori grandi

att

attoss

fffPearsondiTest

2)(2

Lecco, 15 dic 2005Francesco Ronzon89

Test che misurano la bontà di adattamento: G2 Chi2 di Pearson = Kp

Chi2 è approssimazione di G2

H0= il modello si adatta ed entrambe

Se (foss fatt) allora G2 0 accetto H0

Rifiuto per valori grandi

Lecco, 15 dic 2005Francesco Ronzon90

Test Kp ?

Il test Kp è sempre un test di bontà di adattamento (la formula che si utilizza in laboratorio di micro- biologia è Kp anziché Kp)2 che va confrontato con la Chi quadrato con 1 grado di libertà.(si rifiuta per valori alti)

2)()(

)(2)(2

22)(2

1

22

222

22

)()()(

2

22

2

22

2

22

2

)()(

,

pbaba

baba

ba

babbaaba

bafff

baatteseosservate

K

abba

fbaf

ba

ba

ba

ba

att

attoss

Lecco, 15 dic 2005Francesco Ronzon91

Test di verifica dell’Ipotesi – Valore p

Quando comunico l’esito di un test ad altri: dico solo significativo/non significativo (accetto/rifiuto) o posso dire di più?

meglio riportare il:valore p= livello di significatività osservato

ovvero: il più alto valore di che mi farebbe rifiutare H0

Se p<0,01 rifiuto H0 Se 0,01<p<0,05 si tende a rifiutare p>0,05 accetto H0

E’ un indicatore della plausibilità dell’ipotesi H0

Lecco, 15 dic 2005 Francesco Ronzon92

Amen