La verifica delle ipotesi. Verifica di ipotesi Il metodo scientifico prevede la costruzione di un...

La verifica delle ipotesi

Verifica di ipotesi

• Il metodo scientifico prevede la costruzione di un modello teorico su un fenomeno, la cui validità si fonda sulle informazioni desunte dalle osservazioni

• Il modello implica delle ipotesi da verificare: le ipotesi statistiche fanno riferimento alla associazione tra fenomeno reale e variabile casuale capace di descriverlo

• L’ipotesi statistica diviene un’assunzione riguardante generalmente il valore di un parametro incognito (media, misura di variabilità, indice di associazione tra variabili...)

L’ipotesi statistica

• Al fenomeno reale si associa una V.C. capace di descriverlo

• Un’ipotesi statistica diventa un’affermazione sulla distribuzione di probabilità della V.C. associata( il valore di un parametro incognito, o la frequenza di certe manifestazioni)

• Verificare l’ipotesi “una moneta è perfetta”

• Introduce la V.C. X che assume i valori 1 testa e 0 croce con probabilità p=1/2

• Accertare se veramente l’ammissione p=1/2 si conforma ai dati sperimentali di cui si dispone

Inferenza statistica e ipotesi sperimentale

• Solitamente il concetto di ipotesi viene usato per designare un’affermazione teorica che ha una certa possibilità di essere vera

• In ambito statistico si può affermare di aver sottoposto a verifica una ipotesi sperimentale solo se:

-tutti i possibili esiti dell’esperimento o dell’osservazione devono essere previsti

-prima dell’osservazione si è deciso quali risultati porteranno ad accettare l’ipotesi sotto verifica e a quali a rifiutarla

Verifica di ipotesi

• La teoria della verifica delle ipotesi consiste nello stabilire se l’assunzione fatta si possa accettare o no sulla base delle osservazioni svolte su una parte del collettivo considerato

• Un test per provare una ipotesi statistica è un criterio o una regola per accettare o respingere l’ipotesi in base alle risultanze di un determinato campione

• L’inferenza che risale dal particolare al generale non è probante in senso affermativo (come nella verifica delle ipotesi deterministiche) ma offre delle risposte unicamente in termini probabilistici (ipotesi statistiche)

Formulazione delle ipotesi

• Considerato un certo parametro θ (ignoto) l’insieme dei valori che esso può assumere viene distinto in due zone Ω1 e Ω2

- l’ipotesi formulata, ipotesi nulla(H0) riguarda i valori di θ compresi

in Ω1

-se θ assume un valore che ricade in Ω2 si rientra nell’ipotesi

alternativa (H1)

• H0 riflette la situazione conoscitiva precedente all’osservazione campionaria: accettando H0 essa non muta

• Il rifiuto di H0 comporta il modificare le acquisizione conoscitive ritenute valide

Formulazione delle ipotesi

• es. Verificare un’ipotesi sul valore di un parametro θ della popolazione sulla base dei dati di un campione estratto dalla popolazione stessa

- l’insieme Ω1 è formato dal valore θ=6 ; e Ω2 dai valori θ≠6

H0: θ = 6 e H1:θ≠6

- l’insieme Ω1 è formato dal valore θ > 6 ; e Ω2 dai valori θ ≤ 6

H0: θ > 6 e H1:θ ≤ 6

Ipotesi nulla e ipotesi alternativa

• Es. L’ipotesi nulla potrebbe essere ipotesi di uguale efficacia di trattamenti a confronto

• Confronto tra nuova terapia e terapia standard in due gruppi di pazienti:

H0 = la nuova terapia ha la stessa efficacia della terapia standard.

• L’efficacia della nuova terapia deve essere uguale a quella valutata nel gruppo che ha ricevuto la terapia standard

• μ (media nella popolazione obiettivo)

• μ0 (media riscontrata nella popolazione di confronto)

H1= ipotesi di diversa efficacia

• Nei due gruppi le risposte medie sono diverse

Verifica di una ipotesi

• La verifica di una ipotesi consiste nel formulare sulla base di dati campionari un giudizio che induca ad accettarla o a rifiutarla, ad un prefissato livello di probabilità e, quindi, con un prefissato livello di rischio

• A tal fine si utilizza un idoneo test, ovvero una funzione delle osservazioni campionarie, la cui distribuzione è nota sotto la condizione che l’ipotesi formulata sia vera

• I valori del test si traducono in regole di decisione coerenti con il prestabilito livello di rischio

Regione di accettazione e regione di rifiuto

• Precisare H0 e H1 fa riferimento a un test i cui valori,che dipendono dalle osservazioni del campione, vengono suddivisi in due regioni:

- regione di accettazione di H0 : se il valore del test ricade in essa, H0 verrà accolta, poiché i dati rilevati vi si conformano, è ragionevole accoglierla con un certo rischio precisabile

- regione critica di rifiuto di H0 : se il valore del test ricade in essa, H0 sarà rigettata,in quanto i dati osservati non vi si conformano, non è ragionevole accoglierla, anche se non accogliendola si corre un certo rischio di sbagliare

Regione di accettazione e regione di rifiuto

• Es. Si consideri il parametro μ(media della popolazione) e si assuma H0: μ= 10 attraverso la stima fornita da un campione. L’eventuale differenza tra il valore campionario e quello relativo all’universo è attribuibile a fluttuazioni campionarie e si accetta l’ipotesi nulla poiché

“in base alle informazioni in possesso la stima campionaria μ0 non differisce significativamente dal valore μ=10”

• Se la differenza è elevata si sospetta l’intervento di altri fattori non casuali (attribuibili al campionamento) quindi

“in base alle informazioni in possesso la stima μ0 differisce significativamente dal valore μ=10

Zona di accettazione e di rifiuto

• Stimato il parametro μ e definite H0 e H1 si dovrà identificare il test con la sua distribuzione campionaria

• Per definire un criterio circa la presenza o meno di fattori casuali si decide il livello di rischio che si vuole correre nel prendere la decisione sbagliata (rifiutare l’ipotesi nulla quando dovrebbe essere accolta)

• Il criterio si definisce soglia di significatività α ( di norma non superiore a 0,05=5%) che esprime il rischio che si vuole correre. Sulla sua base si decide di non attribuire il risultato conseguito all’influenza di fattori casuali ( rifiuto ipotesi nulla) quando la probabilità dell’evento cui è associato il risultato è inferiore alla soglia α

• Fissato il livello di significatività α è possibile precisare la regione critica di rifiuto dell’ipotesi nulla, tenuto conto dell’ipotesi alternativa

I test di significatività

• Quantificano i dati in senso di probabilità: i livelli del 5% e dell’1% sono livelli accettati come limiti del tutto convenzionali per stabilire la significatività di una differenza dall’ipotesi nulla (H0)

• Il livello di 5% sta ad indicare che ci sono 95 probabilità su 100 che il campione non derivi dalla popolazione, ovvero sia diverso

• Esistono sempre 5 probabilità su 100 che tali differenze siano casuali e che quindi il campione derivi dalla popolazione

Ipotesi unidirezionali e bidirezionali

• Es. Se oltre all’ipotesi H0: μ= 10 si definisce l’ipotesi alternativa H1: μ≠10, si ha un’ ipotesi alternativa bidirezionale

• Se oltre all’ipotesi H0: μ= 10 si afferma con H1:μ>10 si ha un’ipotesi alternativa unidirezionale

• L’ipotesi bidirezionale è detta a due code: nella distribuzione del test la zona di rifiuto è bilaterale occorre considerare sia la coda di destra ( valori molto grandi) sia quella di sinistra (valori molto piccoli)

• L’ipotesi unidirezionale detta a una coda considera come ipotesi

alternativa differenze in una sola direzione: nella distribuzione del test la regione critica ( zona di rifiuto) prende in considerazione valori molto piccoli o molto grandi

Errori di decisione I

• La verifica di ipotesi sulla base di dati campionari può determinare degli errori nel decidere l’accettazione o il rifiuto di H0 in base al valore del test scelto

- Errore di I tipo (errore alfa) che si commette, con probabilità α, rifiutando l’ipotesi nulla quando essa è in realtà vera. Ciò accade quando il valore del test cade nella zona di rifiuto pur essendo vera l’ipotesi nulla

-Corrisponde alla probabilità di commettere un errore falso-positivo che il ricercatore è disposto ad accettare

Errori di decisone II

- Errore di II tipo(errore beta), che si commette,con probabilità β, accettando l’ipotesi nulla quando essa è falsa: ciò accade quando il valore del test cade nella regione di accettazione, pur essendo l’ipotesi nulla non vera (errore falso- negativo). La probabilità 1- β di rigettare l’ipotesi nulla quando è falsa si definisce la potenza del test

- La potenza del test esprime la probabilità che se i trattamenti

sono diversamente efficaci, il test risulti significativo, cioè la

probabilità che, se i trattamenti hanno una differente efficacia ci si accorga di ciò

Popolazione (universo)

H0 H1

H0

Campione

H1

Esatto(vero negativo)

non ci sono differenze

Errore beta(falso negativo)

Errore alfa(falso positivo)

Esatto(vero positivo)

non ci sonodifferenze

Il valore p • Il valore p ottenuto da un test statistico fornisce la probabilità che

la differenza osservata possa essere stata osservata solo per caso

• Di solito se il valore p osservato è ≤ 0,05 la differenza viene accettata come reale

Come si procede

1. Per ottenere il valore p dei dati è necessario calcolare un rapporto critico (nei test) dai dati a disposizione

2. Si consulta la tabella standard dei possibili valori. Se il valore p riportato in tabella è ≤ al livello alfa predefinito(p ≤ 0,05) H0 viene rifiutata ed è accettata H1

3. Se il valore è maggiore del livello alfa (p>0,05) il ricercatore non è in grado di rifiutare H0

NB!Non essere in grado di rifiutare H0 non significa

accettarla

Interpretazione dei test statistici

• Il test statistico di significatività risponde alla domanda: è la fluttuazione di campionamento una spiegazione verosimile della differenza tra il risultato campionario ed il corrispondente valore della popolazione sotto l’ipotesi nulla?

• Una risposta affermativa indica che il risultato del campione è compatibile con l’asserzione che il campionamento è eseguito da una popolazione in cui è valida l’ipotesi nulla . Questo è il significato di “statisticamente non significativo”

• Una risposta negativa – una differenza che è inverosimile si verifichi per variazione casuale- indica che il risultato campionario non è compatibile con l’asserzione che il campionamento è eseguito da una popolazione in cui è valida l’ipotesi nulla. Questo è il significato di “statisticamente significativo”

Fasi nella verifica delle ipotesi

a. Precisazione dell’ipotesi nulla e dell’ipotesi alternativa in relazione al tipo di problema

b. Scelta del test statistico più adatto

c. Determinazione della statistica campionaria del test: consente di calcolare le probabilità e di identificare i valori critici

d. Precisazione della soglia di significatività e della regione di rifiuto del test: fissare la zona dei risultati campionari che si ritengono poco probabili e creare i presupposti per formulare una regola di decisione.

e. Formulazione della regola di decisione: fissare il valore o i valori critici del test in relazione alla soglia di significatività scelta e nello stabilire di respingere l’ipotesi nulla se il valore empirico del test , calcolato sui dati osservati, risulta maggiore o minore del valore o dei valori critici

Per esemplificare 1

• Vogliamo verificare se la pressione sistolica media(μ) di una popolazione abbia un particolare valore (μ0)

• Calcoliamo un valore medio attraverso un campione (m)

• Se la distribuzione della pressione sanguigna è normale avrà d. s. nota σ; se la media della popolazione è μ0 effettuando ripetuti campionamenti la media campionaria m sarà distribuita normalmente con media μ0 ed errore standard σ/ √n dove n è la numerosità campionaria

Quanto spesso osserveremo un valore quale quello osservato(m)o uno più lontano da μ0 ?

Per esemplificare 2

• Questa probabilità (p) può essere interpretata come una misura del supporto che i dati campionari danno all’ipotesi μ= μ0

• Più basso è tale valore minore sarà il supporto fornito dai dati

• Per convenzione si stabilisce che tale supporto è insufficiente quando il valore p cade sotto una predefinita soglia (livello di significatività del test)

• Se il valore osservato è ≤ al livello di significatività si decide che c’è sufficiente evidenza per rifiutare μ= μ0

• se il valore >p si deciderà che l’evidenza è insufficiente per rifiutare l’ipotesi

In sintesi

• Si parte da una media campionaria e una ipotesi a priori circa il valore della corrispondente media di popolazione e ci si chiede

“qual è la probabilità che prendendo a caso una media

campionaria questa sia così distante dalla media

della popolazione per solo effetto del caso?”

• Se questa probabilità è sotto il 5%, corrispondente a una distanza della media almeno pari ad 1.96 vote l’errore standard, rifiutiamo la nostra ipotesi

• In tal caso diciamo che il nostro risultato è statisticamente significativo

Test sul valore di una media

• es. tasso medio di acido urico in 52 uomini sia X = 7,3 mg. Conoscendo il tasso medio in una popolazione maschile adulta

sana è μ=5,7mg. con una DS = 1

Il valore riscontrato nei 52 soggetti campionati è da attribuire a semplici variazioni campionarie oppure a qualche patologia che ne altera con

sistematicità i valori?

H0: la differenza è attribuibile alla non completezza delle osservazioni sulle quali è stato stimato

H1: X è diversa perché esiste un fattore che altera l’uremia nei 52 soggetti selezionati

Test sul valore di una media(segue)

• Stabilita la distribuzione campionaria della statistica test si definisce il livello di significatività α = area di accettazione di H0 dove sono compresi tutti i valori di z che è molto probabile osservare quando X è diversa da μ a causa delle fluttuazioni delle osservazioni campionarie e l’area di rifiuto di H0 comprensiva di tutti i valori di z che è poco probabile osservare quando la differenza tra μ e X è dovuta alle fluttuazioni delle osservazioni campionarie

9,1214,0

8,1

52/1

)7,55,7(

/

n

xz

Test sul valore di una media (segue)

• Fissato α ad un livello dello 0,05 dalle tavole della curva normale standardizzata si desume z1=-1,96 e z2=+1,96

• Tutta l’area a sinistra e a destra di tali quantità costituisce l’area di rifiuto di H0 mentre l’area interna all’intervallo (-1,96;+1,96) rappresenta l’area di accettazione di H0

area

di

accettazione

-1,96 0 +1,96

Area dirifiuto

Area dirifiuto

Test sul valore di una media (segue)

• Poiché z=12,9 “cade” nella regione di rifiuto di H0 si può:

• Rifiutare H0 (H0 è falsa)

i 52 soggetti campionati che presentano un livello medio di acido urico pari a 7,5 mg. non appartengono alla popolazione di individui sani bensì ad una popolazione di soggetti affetti da una qualche patologia che ne altera la concentrazione

• Il test denominato “test Z” si basa sulla distribuzione normale standardizzata e viene utilizzato ogni qual volta il campione è abbastanza numeroso (n>50) e la Varianza della popolazione è nota

Il t test

• Con campioni piccoli le stime osservate delle medie e la varianza sono soggette ad errori più rilevanti si applica la distribuzione t (t di Student)

• La distribuzione t si applica a questi problemi: -calcolo dell’IC per una media campionaria -sono stati calcolati la media e la DS di un campione ed è noto il valore della media della popolazione. Quanto significativamente la media campionaria differisce dalla media della popolazione? -sono stati calcolati media e DS di due campioni. Potrebbero entrambi i campioni essere tratti dalla stessa popolazione?

-sono state rilevate osservazioni appaiate su due campioni (o in successione su un unico campione). Qual è la significatività della differenza tra le medie dei due insiemi di osservazioni?

Utilizzo del test t

• I valori critici di t sono tabulati e dipendono dal livello di fiducia con cui si rifiuta l’assenza di differenza e dalla dimensione del campione sotto forma dei gradi di libertà che sono uguali a 2(n-1), dove n è la numerosità di ciascun campione

• Se il t calcolato è maggiore di quello critico si colloca nella zona del rifiuto e la differenza osservata si definisce statisticamente significativa

I gradi di libertà

• Il termine gradi di libertà si riferisce al numero di osservazioni (N) che sono libere di variare. Si perde un g. l. ogni volta che viene calcolata un media

• La media è la stima più “solida” del valore atteso di una variabile, così da essere considerata “fissa”

• Ciò implica che anche il numeratore della media (la somma di xi ) che si basa su N osservazioni sia fisso.

• Raggiunte N-1 osservazioni (ciascuna libera di variare), l’ultima osservazione non è libera di variare poiché i valori totali delle N osservazioni devono raggiungere la somma xi.

• Per questo motivo ogni volta che si calcola la media si perde 1 g. l.

Differenza tra media campionaria e media della popolazione il t test per un campione

• La stima della concentrazione di calcio plasmatico in 18 pazienti ha dato una media di 3,2 μmol (millimoli)con DS 1,1. Precedenti studi hanno mostrato una media che solitamente si avvicina a 2,5 μmol nella popolazione sana . La media calcolata sui pazienti con sindrome di Everly è anormalmente alta?

I dati sono i seguenti

• Media della popolazione generale =2,5μmol

• Media del campione =3,2 μmol

• DS del campione =1,1μmol

• ES della media campionaria DS/ =1,1/ =0,26 μmol

• Differenza tra le medie =-0,7 μmol

• Gradi di libertà, n-1=18-1=17

n 18

69,2acampionari media della standard errore

medie le tradifferenzat

Differenza tra media campionaria e media della popolazione il t test per un campione

• Ignorando il segno del valore di t e utilizzando la tavola della distribuzione t (a due code) per 17 g.l. si verifica che 2,69 si colloca tra i valori di probabilità 0,02 e 0,01.

• È poco probabile che il campione con media 3,2 sia stato estratto dalla popolazione con la media 2,5 e si può concludere che la media campionaria dal punto di vista statistico è stranamente alta.

• Il clinico deciderà se considerarla alta anche dal punto di vista clinico

Differenze tra medie

• Anche la differenza tra le medie di due campioni ha un proprio ES

• La media della popolazione solitamente è sconosciuta: la media di uno dei campioni rappresenta una stima di essa

• È probabile(95%) che si collochi all’interno dell’intervallo definito da 1,96 volte il suo ES

• Se il secondo campione proviene dalla stessa popolazione anche la sua media avrà il 95% di probabilità di collocarsi nell’intervallo definito da 1,96 ES dalla media della popolazione

• Se vogliamo sapere se è verosimile che essi provengano dalla stessa popolazione dobbiamo chiederci se si collocano all’interno di un certo intervallo individuato dai loro ES

Intervalli di confidenza per la differenza tra le medie di due campioni

• Se σ1 è la d.s. del campione 1 σ2 è la d.s. del campione 2

n1 è la numerosità del campione 1 e n2 la numerosità del campione 2

• L’ES della differenza tra due medie sarà

2

22

1

21ES(diff)

nn

Intervalli di confidenza per la differenza tra le medie di due campioni

• Si vogliono confrontare la media della press. arteriosa dei tipografi con quella degli agricoltori

Pressione arteriosa diastolica media dei tipografi e degli agricoltori

numero press. media(mmHg) ds

Tipografi 72 88 4,5

Agricoltori 48 79 4,2

La differenza tra le medie è 88-79 mmHg= 9 mmHg

• Possiamo calcolare l’IC al 95% delle medie9 – 1,96 x 0,81 mmHg a 9 + 1,96 x 0,81 mmHg

da 7,41 mmHg a 10,59 mmHg

mmHg 805,048

2,4

72

4,5ES(diff.)

22

t di Student

• Calcolo del valore di t

-è calcolato prendendo la differenza osservata tra le medie dei due

gruppi (il numeratore) e dividendola per l’ES della differenza tra le

medie dei due gruppi (il denominatore)

• Si deve determinare l’ES della differenza tra le medie

• Stima dell’ES (x1-x2) =

• t=

2

22

1

21

N

s

N

s

2

22

1

21

21

N

s

N

s

xx

Test di confronto tra medie di campioni indipendenti

• Negli studi di confronto si vuole stimare se la differenza tra le medie dei due campioni è dovuta al caso o al fattore in esame.

• L’ipotesi nulla sarà che non vi è differenza: ovvero si sospetta che ci sia differenza e si intende rifiutare l’ipotesi nulla.”I valori riscontrati ci permettono di affermare che due campioni sono diversi? “

• Se H0 è vera i due campioni provengono da una stessa popolazione e le medie campionarie rappresentano due stime di una stessa media e la loro differenza è imputabile al campionamento

• Si verificherà dove si collochi la differenza osservata nella distribuzione teorica

• Quando si chiede se esiste una differenza significativa tra la media di due gruppi la statistica utilizzata è il test t di Student

Esercizio utilizzo test t • Due gruppi di 36 pazienti sono stati trattati rispettivamente con un farmaco e con placebo. Il gruppo trattato con il farmaco è stato ospedalizzato mediamente per 4.51 giorni. I gruppo trattato con placebo è stato ospedalizzato mediamente per 6.28 giorni. Le deviazioni standard sono rispettivamente di 1.98 giorni e 2.54 giorni.

La terapia farmacologica ha ridotto la degenza?

I due gruppi di pazienti hanno una diversa ospedalizzazione media statisticamente significativa?

Esercizio utilizzo test t

Poiché le dimensioni campionarie sono uguali viene utilizzata la stima combinata della varianza che si ottiene facendo la media delle due varianze s2=1/2(1.982+2.542)=5.18

g.l=2(n-1)=2(36-1)=70

La tabella dei valori critici di t mostra che per 70 gradi di libertà il valoreassoluto di t sarà maggiore di 1,994 solo il 5% delle volte. Poiché il valore di t calcolato con i nostri dati è maggiore, si può concludere che la terapia farmacologica ha ridotto la degenza dei pazienti (p<0.05)

30.3

36

18.5

36

18.5

28.651.4

t

Differenza tra medie di campioni dipendenti

• La caratteristica che definisce due campioni dipendenti è che ciascuna osservazione in un campione è accoppiata (appaiata) con una sola osservazione dell’altro

• La situazione più semplice è l’ autoaccoppiamento in cui il soggetto osservato serve da controllo di se stesso (es. prima e dopo)

• In altre situazioni il ricercatore realizza un appaiamento artificiale di soggetti attraverso caratteristiche importanti da rendere i membri di

una coppia più simili tra loro

Confronto tra campioni appaiati

• Il test di riferimento è il t di Student per dati appaiati - i dati sono quantitativi - la distribuzione delle differenze ( non dei dati originali) è normale - la dimensione del campione va riferita al numero di soggetti non al

numero di misurazioni

Dove d = media delle differenze campionarie s d = stima della deviazione standard delle differenze n = numero delle differenze

ns

d

n

sd

ES

dt

ddd

___

Esercizio t di Student per dati appaiati

• es. A un campione casuale di 12 pazienti vengono somministrati due trattamenti in due occasioni successive. Vengono rilevati i tempi di reazione al trattamento A, al trattamento B e calcolata la differenza tra i tempi dei due trattamenti (A-B)

• Procedura: calcolo della media delle differenze tra le due misurazioni (d) e la deviazione standard delle differenze (sd) per calcolare la ESd = sd/

d= -6.5 s= 15.1 ES(d)=D.S./ = 4.37 t=-6.5 / 4.37= -1.487

• Utilizzando la tavola di t per 11 g.l.(n-1) troviamo che il valore calcolato si colloca tra 0.697 e 1.796. L’ipotesi nulla di non differenza tra i tempi di reazione non può essere rifiutata

n

Interpretazione dei risultati 1

• Se il valore di t è ampio, il valore di p sarà piccolo perché è poco probabile che un rapporto t ampio venga ottenuto solo per caso

• Se il valore di p è 0,05 o inferiore si assume, solitamente, che vi sia una differenza reale

• Concettualmente il valore di p è la probabilità di essere in errore se viene rigettata l’ipotesi nulla che non vi sia nessuna differenza tra le medie e viene accettata l’ipotesi alternativa di una vera differenza

Interpretazione dei risultati 2

• Test t a una e a due code• Nel test a due code, alfa viene equamente diviso alla fine delle due

code della distribuzione• Il test a due code è generalmente consigliato perché di solito è

importante documentare le differenze in entrambe le direzioni• Es(a) :è importante se un nuovo trattamento è significativamente

migliore rispetto a un trattamento standard (o placebo),ma anche se è significativamente peggiore (da evitare!)

• Es(b): talvolta è necessario solo il test ad una coda

Una terapia costa molto di più di quella standard. Ovviamente non sarebbe impiegata se fosse peggiore di quella corrente, ma non sarebbe impiegata neppure se fosse altrettanto efficace della terapia attuale. Sarebbe usata soltanto se fosse significativamente migliore della terapia standard

• In questo caso la regione di rigetto (5%)sarebbe tutta spostata in una coda della distribuzione

Test di confronto per misure qualitative

• La distribuzione di una variabile categorica rilevata su un campione spesso deve essere confrontata con la distribuzione di una variabile categorica su un altro campione

• es. Uno psichiatra ha classificato per classe socio-economica le donne (età 20-64 anni) ricoverate nel suo reparto(campione A). Nel contempo ha classificato allo stesso modo le donne di pari età ricoverate presso il reparto di gastroenterologia (campione B).

Lo psichiatra voleva valutare eventuali differenze di classe sociale tra i due campioni. L’ipotesi nulla era “non differenza fra i due campioni”

• es. In una sperimentazione per la valutazione di due trattamenti si è riscontrato un miglioramento nell’86.2% dei casi con una nuova tecnica e nel 66.7% con tecnica tradizionale.

Il risultato ha significato solo per i casi sperimentali o può essere esteso a tutti i pazienti che necessitano di riabilitazione?

Test chi quadrato( )• È un esempio di analisi statistica che cerca di sviluppare una

espressione statistica (modello) che predice il comportamento di una variabile dipendente sulla base della conoscenza di una o più variabili indipendenti

• Il procedimento di paragonare i valori osservati con i valori attesi – paragonare O con E- è chiamato test della bontà di adattamento perchè l’obiettivo è di vedere quanto “si adattano” bene i valori osservati in una tabella di contingenza ai valori attesi sulla base del modello

• Se il valore del test del chi-quadrato è piccolo, l’adattamento è buono. Se è grande i dati non si adattano bene all’ipotesi

2

Test chi quadrato( )

• La verifica dell’ipotesi di indipendenza tra i due fenomeni(caratteri) si esplicita in un rifiuto o non rifiuto di H0: ipotesi di accidentalità nel divario tra frequenze osservate (valori empirici) e frequenze che si sarebbero dovute osservare secondo un modello di indipendenza (frequenze teoriche )

• La distribuzione di probabilità dei valori del chi-quadrato è nota e i valori tabulati secondo il livello di α e dei g l ( gradi di libertà)=(r-1) (c-1)

• Quando il valore del chi–quadrato calcolato sul campione supera il valore teorico di calcolato nell’ipotesi di indipendenza, è preferibile rifiutare H0 di accidentalità nel divario tra dati empirici e teorici

2

2

Tabella di contingenza 2 x 2

• Tabella di contingenza perché viene usata per determinare se la distribuzione di una variabile dipende in maniera condizionata (contingente) dall’altra variabile

tab. A numero pazientiGruppo campionario sviluppo trombi non sviluppo trombi

Placebo 18 7 Aspirina 6 13

Test statistico chi quadrato( )

• Il test si basa sulla differenza tra le frequenze assolute osservate nell’esperimento e le frequenze attese calcolate in base all’ipotesi nulla che il fattore studiato non ha influenzato la differenza osservata. L’ipotesi alternativa è che il risultato è causato dal fattore in studio. Il risultato è la variabile dipendente, il fattore studiato è la

variabile indipendente

Dove:

O = frequenze osservate A = frequenze attese Σ = sommatoria dei valori delle caselle della tabella di contingenza determinate da m modalità di riga e n modalità di colonna

2

A

AO 22 )(

Calcolo del valore atteso

• La formula generale per calcolare il valore atteso nella cella in alto a sinistra di una tabella di contingenza è:

• E1.1 = 11 riga di totale

studio dello totale

colonna totale

Calcolo del test

• Attraverso i dati sperimentali si costruisce una tabella (le più frequenti sono le 2x2). Per ogni numero osservato di eventi (O) riportato nella tabella si calcola il corrispondente numero atteso(E)

tab. A numero pazienti

Gruppo campionario sviluppo trombi non sviluppo trombi

Placebo 18 7 Aspirina 6 13

tab. B numero pazientiGruppo campionario sviluppo trombi non sviluppo trombi trattati Placebo 13.64 11.36 25Aspirina 10.36 8.64 19

Totale 24 20 44

2

Calcolo del test

• Si possono usare le informazioni contenute nelle Tab. A e B che contengono rispettivamente le frequenze osservate e quelle attese

=

Confrontando la tabella dei valori critici del per 1 g.l. si osserva che il valore ottenuto è superiore a 3.841 al livello di significatività 5%Pertanto si può affermare che l’aspirina è associata ad un tasso minoredi trombi

2

A

AO 22 )(

2 10.764.8

)64.813(

36.10

)36.106(

36.11

)36.117(

64.13

)64,1318( 2222

2

Statistica non parametrica

• Tutti i metodi che si basano su distribuzioni probabilistiche dei dati come la distribuzione normale sono definiti parametrici(media, deviazione standard, ecc. sono i parametri statistici)

• Anche se spesso la natura della distribuzione non è verificata si assume che i dati siano distribuiti normalmente

• In contrapposizione le tecniche non parametriche non si adattano alla distribuzione normale

• Nei casi in cui la normalità sia solo presunta si possono considerare i risultati di entrambe le tipologie di test

Statistica non parametrica

• Dati che non si adattano alla normale sono spesso quelli dei punteggi, votazioni, scores, ecc. utilizzati da un ricercatore per studiare fenomeni complessi

• Come la media è un dato parametrico, la mediana è l’analogo dato in campo non-parametrico

Quando applicare SNP

1. I dati non si conformano al tipo di distribuzione richiesto dalle procedure non parametriche

2. I dati si riferiscono a scale ordinali (punteggi, giudizi, graduatorie...)

3. Tra i dati vi sono alcuni molto piccoli o molto grandi( outliers ) anche se si sospetta causati da errore ma non escludibili dal campione

4. Piccoli campioni con meno di 50 dati

La verifica delle ipotesi. Verifica di ipotesi Il metodo scientifico prevede la costruzione di un...

Documents

Transcript of La verifica delle ipotesi. Verifica di ipotesi Il metodo scientifico prevede la costruzione di un...