PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa...

48
BILITA’: EVENTO si verifica in h modi diversi su bili (POPOLAZIONE) p = h/n definizione è talvolta applicabile ‘a priori’ (es. lanc , ma più spesso ‘a posteriori’, dopo un numero molto di prove (è il caso della distribuzione ‘normale’,

Transcript of PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa...

Page 1: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

PROBABILITA’:

se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE)

p = h/n

Questa definizione è talvolta applicabile ‘a priori’ (es. lancio dellamoneta), ma più spesso ‘a posteriori’, dopo un numero moltoelevato di prove (è il caso della distribuzione ‘normale’,..)

Page 2: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

DISTRIBUZIONI DISCRETE DI PROBABILITA:

1) lancio di moneta: p(testa) = p(croce) = 1/2

2) lancio di dado: p(1)=p(2)=…….=1/6

1 2 3 4 5 6

1/6

Page 3: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

3) lancio di 2 dadi:in questo caso la distribuzione di probabilità NON E’ uniforme:

1 2 3 4 5 6 7 8 9 10 11 12

1/36

Page 4: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Oltre a definire la probabilità di un evento, è possibile definire la PROBABILITA’ CUMULATIVA di ottenereun valore della variabile casuale x minore od uguale ad k:

es p(x<4) = F(4)= p(1)+….+p(4)= 1/36+2/36+3/36=7/36

Page 5: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

DISTRIBUZIONI CONTINUE DI PROBABILITA’

In questo caso la variabile casuale assume valori concontinuità in un certo range.E’ una situazione tipica di molti procedimenti di misura(in fisica, biologia,…) in cui le letture vengono eseguitecon strumenti di sufficiente sensibilità.La funzione di probabilità si esprime in genere tramitel’equazione di una curva, mentre la probabilità cumula-tiva rappresenta l’area sotto la curva.

Page 6: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Caso 1: le curve di sopravvivenza….

Page 7: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

….. vengono descritte con una distribuzione esponenziale

P(x)=1/ exp(-x/)

F(x)=1-exp (-x/ )

dove è la VITA MEDIA:

Es: Se la vita media dei pazienti dopo l’insorgere dei primi sintomi di una malattia è di 2 anni, qual è la probabilità che un certo paziente sopravviva 6 mesi? E 10 anni?P(t>0.5 anni) = 1-F(0.5) = exp(-0.5/2)= 0.779p(t>10 anni) = 1-F(10) = exp(-10/2)=0.07

Page 8: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Caso 2: le misure ripetute su una popolazione…...

Page 9: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Si tratta di una curva con due parametri:la media ,

che individua il massimo della curve, e la standard deviation

che rappresentala emilarghezza a metà altezza (o punto di flesso). L’area sottesa dalla curva vale 1 ( 100% di probabilità) .

Un dato che appartenga ad una popolazione gaussiana ha:

il 95% di probabilità di trovarsi compreso tra: - 1.96 e + 1.96

ildi probabilità di trovarsi compreso tra: - 2.58 e + 2.58 :

Page 10: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

se scommetto che un certo dato appartenga alla popolazionee il dato rientra nell’ intervallo - 1.96 e + 1.96 ho il 95% di probabilità di azzeccarci e il 5% di probabilità di sbagliare,viceversa se scommetto su di un dato che non appartiene all’intervallo ho il 5% di probabilità di azzeccare e il 95%di probabilità di sbagliare!.

Page 11: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

variabile casuale ridotta ostandardizzata:

z=(x-

ora la media è 0 e la standard deviation è 1,

e la probabilità cumulativa ètabulata.

p(-1<z<1) = 0.683p(-1.97<z<1.97) = 0.95p(-2<z<2) = 0.954p(-2.58<z<2.58) = 0.99p(-3<z<3) = 0.997

z-3 -2 -1 0 1 2 3

68%

95%

99.7%

E’ particolarmente conveniente fare un cambiamento divariabile:

Page 12: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Es: Sia y una variabile Normale con valor medio 1 e deviazionestandard 3. Con quale probabilità sarà compresa tra -1 e 4?

Z= (y-1)/3

p(-1<y<4) = p(-2/3<z<1)= p(0<z<2/3) + p(0<z<1)= = 0.5/2 + 0.68/2=0.59

Con quale probabilità sarà superiore a 4?P(y>4) = p( z>1)= 1-p(z<1)=1-p(-oo<z<0)-p(0<z<1)= = 1-1/2-0.68/2= = 1/2-0.34= 0.16Con quale probabilità sarà superiore a 7?P(y>7)=p(z>2) =…..= 1/2-0.95/2=0.025N.B: la probabilità del 2.5% è molto PICCOLA. Accetto un ‘rischio’ di errore ( o LIVELLO DI CONFIDENZA)del 2.5% dicendo che y non è praticamente mai maggiore di 7.

Page 13: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

ABBIAMO IMPARATO CHE:

1) ci sono variabili discrete e continue,

2) esistono distribuzioni di probabilità per queste variabili,

3) è possibile associare a intervalli di valori di queste variabili unaprobabilità, e viceversa, data una probabilità, determinare i limitidi variazione per le variabili.

Page 14: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Supponiamo ora di considerare una POPOLAZIONE, di cuisia nota la distribuzione di probabilità, e di estrarne unCAMPIONE.In che misura è rappresentativo della POPOLAZIONE?

Per capirlo proviamo ad estrarre n campioni diversi costituiticiascuno da k elementi.Per ciascun campione possiamo calcolare un certo numero di PARAMETRI che ci serviranno per il confronto con laPOPOLAZIONE.I più usati sono:

- la media- la varianza

Page 15: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Detti x1, x2,…..xk gli elementi del campione i-esimo

definiamo la media campionaria:

xm = (x1+x2+ xk)/k

e la varianza:

s2= ((x1-xm)2+(x2-xm)2+ (xk-xm)2)/(k-1)

Dagli n campioni avremo: xm1,xm2,…….xmn

e s21, s2

2,…….. s2n.

Page 16: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Soprattutto nel caso di distribuzioni non simmetriche vengonoanche usate la mediana, o 50° percentile, e il 25° e 75° percentili,che corrispondono rispettivamente ai punti che dividono la popo-lazione in due parti uguali, in un quarto superiore e in un quarto inferiore.

Nel caso della distribuzione gaussiana si usano talvolta i:

2.5 ° percentile 16 ° percentile 50 ° percentile (mediana) 84 ° percentile 97.5° percentile

Page 17: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Un teorema fondamentale della statistica afferma che: “ la media delle medie ottenute dai campioni

xmm= (xm1+xm2+…..+xmn)/n

coincide con la media della popolazione , e chela varianza stimata

s2m= ((xm1-xmm)2+…..+(xmk-xmm)2)/(n-1)

coincide con 2/n “

Page 18: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

In altri termini, estratto un campione da una popolazione normaledi media e varianza 2 , la media del campione xmè distribuita normalmente, con media e varianza 2/n

ossia che la variabile ridotta

z= (xm- )/(n

è distribuita in modo normale con media 0 e varianza 1!

Page 19: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Si tratta di un teorema di enorme portata perché ci dice che

- qualunque sia la distribuzione (nota) della popolazione

-qualunque sia il campione che estraggo dalla popolazione

mi basta calcolare il suo valore medio per conoscere la probabilità che il campione appartenga allapopolazione (dunque, in un certo senso, la sua ‘rappresentati-vità’!

Di qui l’idea di eseguire un TEST sul campione (test Z).

Page 20: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

E’ diventato convenzionale eseguire il TEST z definendo:

- l’IPOTESI NULLA:

IL CAMPIONE APPARTIENE ALLA POPOLAZIONE

OVVERO

la differenza tra campione e popolazione è dovuta al caso

Page 21: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

- il LIVELLO DI CONFIDENZA p,normalmente assunto pari alla probabilità 0.05 o 0.01

con cui si ACCETTA l’ipotesi nulla (p(z) > p)

ovvero si RIFIUTA (p(z) < p).

Page 22: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Sappiamo già che il valore trovato, se appartiene alla popolazione, ha il 95% di probabilità di trovarsi compreso tra -1.96 e 1.96 :

questi valori rappresentano l’intervallo di confidenza al 95%.

I valori che stanno fuori dell’intervallo hanno una probabilitàpari al 5% di appartenere alla popolazione:

con questo livello di confidenza posso scommettere che il dato non appartiene alla popolazione.

Page 23: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Es :E’ noto che il tempo di sopravvivenza ad un tumore è descritto da una distribuzione esponenziale con =38.3 mesi e mesiUn gruppo dipazienti affetti da quel tipo di tumore viene sottoposto a terapia, e per essi la vita media è pari a 46.9 mesi.La terapia è efficace al livello di confidenza dell’ 1%?

Z= (xm-)/(n

p(z)= 0.014 >0.01la probabilità di ottenere PER CASO questo valore è maggiore di p, dunque accetto l’ipotesi nulla : il campione appartienealla popolazione: la terapia NON E’ efficace.

Page 24: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Qual è il significato del livello di confidenza?Quanto è realmente AFFIDABILE il test?

P è la probabilità di sbagliare affermando che il trattamento è efficace quando in realtà non lo è(un caso su 20 o un caso su 100, a seconda della scelta).Si dice che corrisponde all’errore di primo tipo, o .E’ però possibile anche l’errore opposto, ossia il considerareinefficace una terapia che lo è: errore di secondo tipo o Oltre a p, gli altri fattori importanti per la determinazione di sono:

1) la dimensione del campione2) l’entità dell’effetto che si vuole rilevare e la variabilitàdella popolazione.

Page 25: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Il seguente esempio dimostra bene la dipendenza di ,o alternativamente della POTENZA P=1- dai fattori prima visti.

Si è somministrato un farmaco EFFICACE, che aumenta la diuresi in modo noto, ad una popolazione di 200 pazienti.

Si sono estratti dei campioni e si è effettuato il test, valutandone la potenza, al variare di alcuni parametri.

Page 26: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Caso 1:aumento medio della diuresi di 200 ml/g,campioni di 10 pz

prendendo p=0.05 it test ha affermato l’efficacia del farmaco in 111 casi su 200: =(200-111/200)=89/200=45%, P=0.55;

prendendo p=0.01, soltanto più in 89 casi: =111/200=55% , P=0.45.

DUNQUE SCEGLIERE UN LIVELLO DI CONFIDENZA PPIU’ GRANDE MIGLIORA LA POTENZA

Page 27: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Caso 2:p=0.05campioni di 10 pz

fornendo ai pazienti una dose di farmaco che induce unaumento di 200 ml/g di urina, l’efficacia è risultata in 111 casi,ma fornendo una dose doppia, con un effetto doppio, l’efficaciaè risultata in 198 casi, P

DUNQUE UN EFFETTO MAGGIORE DI PER SE’ PRODUCE UNA MAGGIOR POTENZA

Page 28: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Caso 3.Infine, scegliendo ancora p=0.05 e una singola dose, si è passatoa considerare campioni di 20 pazienti.In questo caso il farmaco è risultato efficace in 174 casi su 200,dunque P=87%.

INFINE, CAMPIONI PIU’ NUMEROSI AUMENTANO LAPOTENZA DEL TEST.

Page 29: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Gli epidemiologi definiscono gli errori e nel contestodei test diagnostici usando anche altri termini:

Se la malattia c’è, la probabilità che il test diagnosticosia positivo è detta SENSIBILITA’ del test. (coinciderebbe con la ns POTENZA)1-sens = % di falsi negativi

Se la malattia non c’è, la probabilità che il test diagno-stico sia negativo è la SPECIFICITA’ del test.(coinciderebbe con la ns 1-p).1-spec= % di falsi positivi

Page 30: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Abbiamo imparato:

-il concetto di popolazione e di CAMPIONE

- il concetto di IPOTESI NULLA

- il concetto di LIVELLO DI CONFIDENZA

-gli errori di primo e secondo tipo e la POTENZA di un test.

Page 31: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

IL TEST DI STUDENT (t-test)

Supponiamo di avere una variabile aleatoria QUANTITATIVA( UN NUMERO!!)

e di considerare un campione estratto da una popolazione GAUSSIANA di cui è noto il valore medio

detto xm il valore medio del campione ,n la sua dimensione es la deviazione standard:

1

)( 2

n

xmxs i

Page 32: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Si può dimostrare che la variabile

ns

xmt

Non segue una distribuzione gaussiana se non per n molto grande.Negli altri casi la forma della distribuzione dipende dal numerodi gradi di libertà = n-1ed è nota come curva di Student.Fissato un valore di p sarà pertanto possibile sottoporre a test l’ipotesi nulla.

Page 33: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Es:Si ritiene che il periodo di guarigione dopo un dato intervento sia30 gg. Un test condotto su 16 pazienti sottoposti ad una nuova terapiafornisce xm=28 gg con s=3 gg. La nuova terapia è efficace allivello di confidenza del 5%?

T= (28-30)/(3/4)=2.56

controllando le tabelle corrispondenti a =16 si ottiene un valorelimite al 5% pari a t*=1.75<t

Siamo pertanto autorizzati a rifiutare l’ipotesi nulla, affermando chela terapia è efficace.

Page 34: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

IL TEST t PER IL CONFRONTO DI CAMPIONI

Caso sperimentazione-controllo

Siano dati due campioni provenienti da una popolazionegaussiana:

C1=(n1,xm1,s1)C2=(n2,xm2,s2)

se usiamo come parametro la DIFFERENZA, avremo chela media stimata sarà pari a

xm1-xm2

Page 35: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Mentre, essendo l’ipotesi nulla quella che i campioni provengano dalla stessa popolazione, la differenza tra le medie delle popo-lazioni sarà 0.

Quanto all’errore standard, si assume che sia pari a:

2

)1()1(

11

21

2

2212

12

21

nnvdove

snsnsdove

nnses

Page 36: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

In definitiva dunque si studia la variabile:

21

21

11nn

s

xmxmt

Usando la distribuzione di Student corrispondente a è possibile testare l’ipotesi nulla al livello di confidenzaprescelto.

Page 37: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Es: Quale anestetico deprime meno la pressione arteriosa?Si confrontano due gruppi:

61 pz operati usando ALOTANO p=66.9±12.2 mmHg61 pz MORFINA p= 73.2 ±14.4

La differenza è significativa al 5%?

=2x61-2=120s=sqrt((60x(12.2)2+60x(14.4)2)/120)=13.34 mmHg

t=(73.2-66.9)/(13.34sqrt(2/61))=2.61

Il valore limite corrispondente è pari a t*=1.98<tl’ipotesi nulla va rifiutata: la morfina è migliore.

Page 38: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Caso pre-post trattamento(paired t-test)

Potrei procedere come prima, ma il test è più sensibile se si tiene conto delle variazioni del valore della variabile aleatoria nello stesso individuo (non c’è il mascheramento dovuto allavariabilità tra individui)In questo caso conviene assumere come variabilestimata il valore medio delle differenze pre-posttrattamento, come valore della popolazione siassume 0 (i due gruppi appartengono alla stessapopolazione, quindi non c’è differenza!) e comeerrore standard quello calcolato sulle differenze:

Page 39: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Dunque:

s

ns

dmt

ndmds i

/

).1/()( 22

Il numero di gradi di libertà sarà =n-1.

Page 40: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Esempio:Si misura la resistenza polmonare di un gruppo di ipertesipolmonari prima e dopo trattamento con idralazina.

Pz pre post d d-dm1 22.2 5.4 16.8 7.02 17.0 6.3 10.7 0.93 14.1 8.5 5.6 -4.34 17.0 10.7 6.3 -3.6

facendo i calcoli: dm=9.85; s=5.20dunquet=9.85/2.6=3.79; =3

il valore limite con p=0.01 è pari a t*=5.841>tdevo accettare l’ipotesi nulla. Con p=0.05 invece no (t*=3.182)

Page 41: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

LIMITI DEL TEST:

-NON VA BENE QUANDO SI CONFRONTANO PIU’DI DUE CAMPIONI(occorre apportare correzioni: t di Bonferroni, t di Student-Neumann-Keuls)

oppure USARE ANOVA

-NON VA BENE SE LA POPOLAZIONE NON E’GAUSSIANASi usano metodi basati sui RANGHI

Page 42: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Quando non si è certi della distribuzione gaussiana della popolazioneda cui si estrae il campione, si ricorre ai cosiddetti metodi NONPARAMETRICI.Tra i più usati vi sono quelli basati sui RANGHI, ossia sullapossibilità di attribuire un punteggio (rank) ai diversi valori assuntidalle variabile , nel confrontare il valore totale dei ranghi con tuttele possibilità e nel calcolare la probabilità che compete al totaleeffettivamente ottenuto.

L’equivalente del t-test per dati non appaiati si chiama test di Mann-Whitney,quello per i dati appaiati si chiama test di Wilcoxon.

Vediamoli con degli esempi:

Page 43: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Test di Mann-Whitney

Consideriamo due gruppi: controllo (placebo) e trattamento (diuretico)e valutiamo lka diuresi giornaliera:

CONTROLLO:1000 11380 51200 3

DIURETICO:1400 61600 71180 21220 4

attribuiamo il rango a partire dal più basso:avrò una variabile ‘rango’ variabile tra 1 e 7.

Page 44: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Consideriamo i totali dei ranghi:

CONTROLLO: Tcon=9TRATTAMENTO: Ttrat=19.

Tcon è significativamente più basso (p=0.05)?

Vediamo in quanti modi posso sommare 3 ranghi compresi tra 1 e 7:Il coefficiente binomiale di 7 su 3 vale 35: ho 35 modi diversi dicombinarli:

simmetrico

6 9 12

Page 45: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

La probabilità di ottenere un valore estremo, ad es T=6oppure T=18,è pari a 1/35,quindi la probabilità di ottenere T<=7 vale 2/35=5.7%.Ne deriva che T*=7.Poiché per noi Tcon=9>T* accetto l’ipotesi nulla. Nonposso concludere che la differenza sia significativa.

Se i campioni sono grandi esistono degli algoritmi piùefficienti, ma basati sul medesimo principio.

Page 46: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Esempio di test di Wilcoxon.

Supponiamo di considerare un caso pre-post trattamento semprerelativo alla diuresi giornaliera:

soggetto pre post diff R

1 1600 1490 -110 -52 1850 1300 -550 -63 1300 1400 +100 +44 1500 1410 -90 -35 1400 1350 -50 -26 1010 1000 -10 -1

ATTRIBUIAMO I RANGHI CON SEGNO ALLE DIFFERENZE.

Page 47: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Poiché i ranghi vanno da -6 a +6 ,il loro totale può variare tra1+2+3+4+5+6=21 a -1-2-3-4-5-6=-21, e il numero di possibilitàè 64.Nel nostro caso abbiamo trovato W=-13.

Poiché c’è un unico modo di ottenere -21 e -20 e due modi di trovare -19, e dunque P(W<=19)=4/64=6.25%,possiamo assumere W*=-19.

Poiché W<W* accettiamo l’ipotesi nulla: la differenza non è significativa.

Per campioni numerosi si usano algoritmi più pratici, ma basati sulla medesima logica.

Page 48: PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

ABBIAMO IMPARATO CHE:

1) se vogliamo confrontare due campioni provenienti da unapopolazione gaussiana usiamo il test di Student,mentre se non siamo sicuri che la popolazione di provenienzasia gaussiana usiamo i test non parametrici

2) usiamo test diversi a seconda che confrontiamo due campionidistinti oppure lo stesso campione prima e dopo un dato trattamento.Nel caso del test di Studenti distinguiamo tra dati appaiati e non,nel caso non parametrico tra test di Mann-Whitney e test diWilcoxon.