Parte 2 : Tipi di studi Epidemiologiabrazzale/ftp/BioSan/A.A.2009-2010/lezioni/StatApp... ·...
Transcript of Parte 2 : Tipi di studi Epidemiologiabrazzale/ftp/BioSan/A.A.2009-2010/lezioni/StatApp... ·...
! Epidemiologia
! Disegno dello studio
! Misure di frequenza
! Misure di effetto e di associazione
! Validità
! Inferenza
Parte 2 : Tipi di studi
" L'epidemiologia è la disciplina che ha per oggetto lo studiodell'insorgenza delle malattie nelle popolazioni di esseri umani, con particolare riguardo allo studio delle condizioni e dei fattori che le determinano.
" L’epidemiologia, in particolare, studia con quale frequenza e per quali motivi le malattie colpiscono i diversi gruppi della popolazione umana.
!"# = epi = verso$%µ&' = demos = popolo(&)&' = logos = discorso
Epidemiologia
Epidemiologia – scopi
Intervento terapeutico
conoscere
PATOGENESI delle
malattie
Intervento preventivo
conoscere
EZIOLOGIA delle
malattie
Per PREVENIRE l'INSORGENZA delle MALATTIE
occorre intervenire, ovvero RIMUOVERE le CAUSE.
! Epidemiologia
! Disegno dello studio
! Misure di frequenza
! Misure di effetto e di associazione
! Validità
! Inferenza
Parte 2 : Tipi di studi
Un quadro più complesso ...
Disegno dello studio
Sperimentali
Osservazionali
Clinical trial
Field trial
* Community intervention trial
Caso-Controllo
Di coorte (cohort study)
Trasversali (cross-sectional)
Studi
Un quadro più complesso ...
Studi sperimentali
Idealmente, in uno studio sperimentale perfetto, varia solo il fattore oggetto dello studio, quello cioè che supponiamo influenzi la variabile d'interesse.
A causa della “variabilità biologica” questo è poco realistico. L’obiettivo dello studio sperimentale quindi è quello di minimizzare il più possibile l'influenza di possibili fattori estranei.
Clinical trial (esperimento clinico controllato): L’oggetto dello studio è generalmente la valutazione di uno o più trattamenti su una patologia d'interesse per un gruppo di pazienti.
Problemi etici - Esperimenti randomizzati
Problemi etici
In teoria, l’assegnazione di un trattamento dovrebbe essere fatto in modo da ridurre la variabilità tra i gruppi a confronto rispetto ad altre potenziali variabili che possono influire sulla patologia studiata.
L’assegnazione aiuta lo studio non il soggetto studiato.
Tutela del paziente:
• I trattamenti devono essere potenzialmente preventivi della malattia.
• Non ci devono essere altri potenziali trattamenti migliori di quello somministrato. • Ogni soggetto nello studio non deve essere privato di altri trattamenti migliori di quello studiato. (Placebo?). • I soggetti devono essere informati del piano sperimentale e dei suoi possibili effetti (consenso informato).
Randomizzazione
Il criterio guida di un buon campionamento, in linea teorica e a prescindere dai costi, prevede che ciascun membro della popolazione abbia la stessa probabilità di essere scelto.
campione "randomizzato" o "casuale"
Il campionamento per randomizzazione semplice si effettua estraendo n unità dalla popolazione attraverso un metodo che garantisce la casualità delle estrazioni. Questa viene ottenuta, ad esempio, con un generatore di numeri casuali.
Randomizzazione sistematica: Le n unità che costituiranno il campione sono scelte dalla popolazione ad intervalli regolari. Più pratico rispetto alla randomizzazione semplice, ed assicura anche che le singole unità del campione siano distribuite uniformemente all'interno della popolazione.
Randomizzazione stratificata: Trova applicazione quando si studia un carattere che è influenzato da un certo fattore presente nella popolazione. Prima di effettuare l'estrazione del campione la popolazione viene suddivisa in strati, all'interno di ciascuno strato si sceglie un campione con il metodo della randomizzazione semplice o sistematica.
Randomizzazione
Scopo: eliminazione di distorsioni e stima accurata delle variabilità casuale
Randomizzazione
Field trial: I soggetti non sono pazienti perché non sono malati. Si usa per malattie molto comuni (influenza della vitamina C nella prevenzione del raffreddore). I soggetti quindi devono essere seguiti sul campo (a casa, al lavoro, a scuola). Visto che la probabilità di contrarre la malattia è bassa necessita di numeri molto grandiimplicando quindi costi elevati.
Community intervention trial: È un’estensione del field trial. Quello che interessa è una comunità di persone (località, famiglia, ufficio, condominio) a cui è somministrato un certo trattamento.
Altri studi sperimentali
Studi osservazionali
" Trasversali (cross-sectional): I soggetti sono selezionati sulla
base della patologia.
" Di coorte (cohort study, follow-up study): I soggetti sono
selezionati sulla base della esposizione.
" Caso-Controllo: I soggetti sono selezioni sulla base della
presenza e assenza della patologia.
Architettura degli studi
Studi trasversali – cross-sectional
Trattasi di un tipo di studio che include tutti i soggetti di una popolazione in un certo istante temporale inclusi quelli malati.
L'informazione sulla presenza/assenza della malattia e dell'esposizione al fattore di rischio viene recuperata simultaneamente.
Fotografia della popolazione in un determinato momento.
Fanno generalmente riferimento a fattori di rischio che non possono cambiare (es. gruppo sanguigno) o a caratteristiche personali dei soggetti (es. sesso).
L’esposizione e la malattia sono stabilite e rilevate nello stesso istante, quindi non si può dire se l’esposizione precede la malattia o ne è la conseguenza.
Generalmente quindi si fanno delle assunzioni sulla correlazione tra esposizione attuale e passata o tra esposizione attuale e reale.
Studi trasversali
Assunzioni sul periodo di induzione
• Periodo di induzione: l'intervallo temporale tra l'esposizione e
l'insorgenza della malattia
Confrontiamo uno o due gruppi di soggetti non malati che differiscono per il grado di esposizione ad un fattore di rischio (es. fumo).
In questo senso, tutti gli studi sperimentali sono anche studi di coorte.
Domanda : l’incidenza della malattia è diversa tra esposti e non esposti?
Studi di coorte – cohort/follow-up study
Definizione della coorte: Un soggetto dovrebbe entrare nello studio solo dopo aver passato il periodo minimo di induzione e latenza.
Generalmente non si hanno informazioni sulla durata di questi periodi. Quello che si fa è assumere che siano entrambi nulli e quindi reclutare subito dopo l’esposizione.
Problemi:
- Esposizioni croniche
- Definizione dei non esposti
Studi di coorte
! Periodo di induzione: l'intervallo temporale tra l'esposizione e
l'insorgenza della malattia
!
! Periodo di latenza: l'intero intervallo temporale tra l'inizio del
processo patologico e la manifestazione clinica
Studi di coorte
Studi di coorte Tempo
a b c d einizioesposizione
inizio processopatologico
comparsa segni precocidiagnosi precoce
comparsa segni sintomi
diagnosi clinica
instaurarsicondizione finale;
esito
Fase di induzione Fase di latenzaFase clinica
EVOLUZIONE della MALATTIA
Costi: Sono studi generalmente molto ampi che seguono molte persone per molti anni (quindi generalmente molto costosi).
Limitare i costi:
• Usare sistemi di monitoraggio già esistenti (es. registri regionali dei tumori).
• Usare studi di coorte retrospettivi.
• Sostituire il gruppo non esposto con informazioni generali sulla popolazione
(Ha senso solo se una piccola porzione della popolazione è esposta all’agente
studiato.)
• Inserire uno studio caso-controllo all’interno dello studio di coorte (nested).
Vantaggi e svantaggi
Studi di coorte
Problema: Seguire le persone nel tempo
Nella società moderna è difficile seguire individui per molto tempo.
Studi di coorte che perdono più del 40% della coorte iniziale possono essere distorti!
Bisogna essere certi che la perdita non è correlata all’esposizione.
Studi di coorte
Studi caso-controllo (“retrospettivi”)
Studio osservazionale in cui un gruppo di soggetti malati e un gruppo di soggetti sani vengono confrontati sulla base del grado della loro esposizione ad un fattore di rischio
Domanda: La proporzione di esposti tra
malati è diversa dalla proporzione tra i sani ?
Il dato rispetto all’esposizione è retrospettivo. (L’esposizione è già avvenuta.)
Lo studio caso-controllo può essere visto come un follow-up in cui la variabile tempo-persona dell’esposizione è campionata, e il campionamento è indipendente dall’esposizione.
Visto in questa ottica, questo disegno sperimentale sembra più efficiente del follow-up perché ha un numero di casi uguali a quelli che un follow-up avrebbe identificato e i controlli rappresentano un veloce ed economico metodo per fare inferenza sulla variabile tempo-persona dell’esposizione nella popolazione che ha dato luogo poi alla malattia.
Studi caso-controllo
Selezione: Non è vero che i casi e i controlli debbano essere necessariamente rappresentativi dell’intera popolazione dei malati e dei sani.
Studi caso-controllo
Casi: Possono essere malati ma con particolari caratteristiche (solo anziani, solo di un certo luogo, solo maschi o solo femmine).
Controlli: Devono essere reclutati tra coloro che se avessero contratto la malattia sarebbero stati reclutati come malati.
La selezione deve essere fatta indipendentemente dall’esposizione.
Studi caso-controllo vs. di coorte
• Gli studi di tipo follow-up anche se più impegnativi e costosi possonovalutare molti aspetti e molti effetti dovuti ad un fattore di rischio. Gli studi caso-controllo, per come sono disegnati, posso valutare l’effetto di un fattore solo sulla malattia studiata.
• Al contrario uno studio caso-controllo può valutare diversi fattori di rischiosulla malattia mentre, di solito, uno studio di coorte si concentra solo su un tipo di esposizione.
• Uno studio di tipo follow-up non è efficace su malattie rare; uno studio caso-controllo non è efficace su esposizioni rare.
• Follow-up: problema del tracing dei soggetti; caso-controllo: problema dell’informazione raccolta in modo retrospettivo.
Un quadro più complesso ...
! Epidemiologia
! Disegno dello studio
! Misure di frequenza
! Misure di effetto e di associazione
! Validità
! Inferenza
Parte 2 : Tipi di studi
Misure di frequenza
! Prevalenza: Proporzione, o percentuale, di soggetti affetti da una malattia in un determinato momento sul totale dei soggetti appartenenti alla popolazione.È una misura che indica la proporzione/percentuale di soggetti che in un determinato momento temporale è malata.
!
ES: percentuale di donne con tumore alla mammella in Toscana al 31/12/ 2003
! Incidenza: Numero di nuovi casi di malattia verificatisi in una popolazione a
rischio in un determinato periodo di tempo. È una misura istantanea di occorrenza di una certa patologia studiata.
!
ES: tasso di insorgenza del tumore al pancreas per la popolazione maschile italiana
!
! Incidenza cumulata: È una misura che indica la proporzione di individui che, in un dato periodo di tempo, si ammala di una certa patologia.
ES: rischio di contrarre l'epatite B per la popolazione italiana nel decennio 1991-2000
Misure di frequenza
! La prevalenza e l!incidenza sono misurate su una scala relativa.
! Ovvero, il numero di eventi viene rapportato alla dimensione della popolazione.
Prevalenza (P) =numero di casi in un certo istante/popolazione nello stesso istante
Tasso di incidenza (I) =
numero di nuovi casi in un certo periodo/popolazione a metà periodo
Misure di frequenza
• casi incidenti: numero di nuovi casi di una patologia che si verificano in una popolazione osservata per in certo intervallo di tempo.
• casi prevalenti: numero di casi di una patologia che si verificano in una popolazione osservata per in certo intervallo di tempo (es. remissioni)
Prevalenza
Prevalenza =numero di casi in un certo istante /popolazione nello stesso istante
! La prevalenza non è un tasso, ma una proporzione.
ESEMPIO
Prevalenza
Prevalenza =numero di casi in un certo istante /popolazione nello stesso istante
! La prevalenza non è un tasso, ma una proporzione.
! L'istante temporale deve essere ben specificato.
ESEMPIO
Incidenza
Tasso di incidenza =numero di nuovi casi in un periodo/popolazione a metà periodo
• L'incidenza è un tasso.
• L'incidenza non è interpretabile se non viene riferita ad un intervallo temporale. L’unità di misura del tasso è tempo-1.
! L’unità di tempo è arbitraria: giorni-1, mesi-1, anni-1, …
! Il tasso viene poi generalmente moltiplicato per una costante di
convenienza (1.000, 10.000, …).
10 nuovi casi ogni 1.000 persone all’anno
Incidenza
I =10
1.000 persone#1 anno
I=3
10 anni#1.000=300#1.000 anni
$1
I =3
120 mesi#1.000=25#1.000 mesi
$1
ESEMPIO
ESEMPIO
Incidenza
Tasso di incidenza =numero di nuovi casi in un periodo/popolazione a metà periodo
• L'incidenza è un tasso.
• L’unità di misura del tasso è tempo-1.
• La popolazione di riferimento può essere fissa o dinamica.
Incidenza
time time
fissa dinamica
Person-time = somma dei periodi temporali per ciascun soggetto facente parte dello studio
L'unità di misura è l’inverso del tempo (tempo)-1.
La prevalenza è influenzata dall’incidenza e dalla durata stessa della malattia.
Prevalenza vs. incidenza
Prevalenza = Incidenza x Tempo
Malattie con tassi di incidenza elevati possono avere bassa prevalenza se sono molto fatali in tempi brevi.
ESEMPIO
Incidenza cumulata
Il rischio è la probabilità che un individuo sviluppi la malattia in un determinato periodo di tempo.
L’incidenza cumulata (R) è una misura di rischio medio.
Incidenza cumulata =numero di nuovi casi in un periodo/popolazione all'inzio del periodo
ESEMPIO
! Anche l'incidenza cumulata non è interpretabile se non viene associata ad un arco temporale.
! L'incidenza cumulata si basa sull’assunzione che non sono
presenti altri fattori di rischio competitivi a quello preso in considerazione.
! A lungo termine questo è molto improbabile. Incidenze cumulate calcolate su lunghi periodi non sono attendibili.
Incidenza cumulata
ESEMPIO
Un quadro più complesso ...
! Epidemiologia
! Disegno dello studio
! Misure di frequenza
! Misure di effetto e di associazione
! Validità
! Inferenza
Parte 2 : Tipi di studi
Misure di effetto
In senso generale, ogni manifestazione patologica è l’effetto di una certa causa.
In senso quantitativo, invece, un effetto è la misura della diversità nell'occorrenza di una patologia in due gruppi che differiscono per una certa caratteristica.
• Effetto assoluto = differenza tra prevalenze, tassi di incidenza, o tassi di incidenza cumulata
• Effetto relativo = rapporto tra P, I o R
• Proporzione attribuibile = proporzione di una popolazione affetta avente come possibile causa l’esposizione
Misure di effetto
Rate difference : differenza tra tassi di incidenza
Risk difference : differenza tra tassi di incidenza cumulata
I1$I
0
R1$R
0
RR=R
1
R0
Incidence rate ratio
Risk ratioI
1$ I
0
I0
=I
1
I0
$1Relative risk
Rate ratio
Misure di effetto
Rischio attribuibile o frazione eziologica :
I1$ I
0
I1
=1$1
IR=
IR$1
IR
dove IR = I1 / I0
frazione eziologica : percentuale di malati tra gli espostiattribuibile all’esposizione stessa
La misura (o quantificazione) di un'associazione rappresenta uno tra i passi più importanti nell'investigazione di un qualsiasi rapporto causa-effetto.
Misure di associazione
Nella valutazione dell'esistenza di un'associazione sono in gioco due variabili: la presunta causa (o variabile indipendente) e l'effetto (o variabile dipendente). L'effetto è rappresentato dalla comparsa della malattia.
L'esistenza dell'associazione si dimostra confrontando la frequenza della malattia in due popolazioni costituite rispettivamente da esposti e non esposti ad una presunta causa.
La misura fondamentale per quantificare il rischio è la probabilità che il soggetto sviluppi la malattia “entro un anno” data l‘esposizione E.
P %Y =1&E '=P %YE=1 '
Rischio tra gli esposti [0,1]
Rischio tra i non esposti [0,1]
Differenza tra i rischi [-1,+1]
Rapporto tra i rischi (RR) [0,+ + ]
Odds tra gli esposti [0,+ + ]
Odds tra i non esposti [0,+ + ]
Rapporto tra odds (OR) [0,+ + ]
P %YE=1'
P %YNE=1'
P %YE=1'$P %Y
NE=1 '
P %YE=1'/P %Y
NE=1 '
P %YE=1'/P %Y
E=0 '
P %YNE=1'/P %Y
NE=0 '
P %YE=1 '/P %Y
E=0 '
P %YNE=1 '/P %Y
NE=0 '
Misure di associazione
Tipi di studio e misure di associazione
Studio trasversale (cross-sectional)
Nb+da+cTotale
c+ddcNon Esposti
a+bbaEsposti
TotaleNon MalatiMalati
Fissato nel disegnoPrevalenza della malattia: SI * (a+c)/NPrevalenza dell’esposizione: SI * (a+b)/NPrevalenza tra esposti: SI * P1 = a/(a+b)Prevalenza tra i non esposti: SI * P0 = c/(c+d)Misure di associazione: SI * P1/P0 oppure OR
Tipi di studio e misure di associazione
Studio di coorte o follow-up (prospettico)
c+da+bTotale
b+ddbNon Esposti
a+ccaEsposti
TotaleNon MalatiMalati
Fissati nel disegno
Rischio di malattia nella popolazione: NOPrevalenza dell’esposizione nella popolazione: NORischio di malattia, R1, tra esposti: SI * a/(a+c)Rischio di malattia, R0, tra i non esposti: SI * b/(b+d)Misure di associazione: SI * RR = R1/R0, OR = ad/bc, RD = R1-R0
Tipi di studio e misure di associazione
Studio caso-controllo (retrospettivo)
b+da+cTotale
c+ddcNon Esposti
a+bbaEsposti
TotaleControlliCasi
Fissati nel disegno
Rischio di malattia nella popolazione: NOPrevalenza dell’esposizione nella popolazione: NORischio di malattia tra esposti: NORischio di malattia tra i non esposti: NOMisure di associazione: RR NO ma OR = ad/bc SI
ODDS ratio
Studio caso-controllo (retrospettivo)
b+da+cTotale
c+ddcNon Esposti
a+bbaEsposti
TotaleControlliCasi
Fissati nel disegno
OR=a/c
b/ d=
Odds dell'esposizione nei casi %1 '
Odds dell'esposizione nei controlli %2 '
%1 '=a/%a(c '
c/ %a(c '=
a
c
%2 '=b /%b(d '
d /%b(d '=
b
d
Se la malattia è relativamente rara nella popolazione (diciamo sotto il 5%), il rapporto tra i rischi può essere approssimato con l’odds ratio.
b+da+cTotale
c+ddcNon Esposti
a+bbaEsposti
TotaleControlliCasi
a(b)b
c(d)d
RR=a/ %a(b 'c /%c(d '
)a/b
c/ d=
a*dc*b
=OR
ODDS ratio
! Epidemiologia
! Disegno dello studio
! Misure di frequenza
! Misure di effetto e di associazione
! Validità
! Inferenza
Parte 2 : Tipi di studi
Validità di uno studio epidemiologico
precisione: ottenere gli stessi risultati in prove ripetute (riproducibilità)
accuratezza : centrare il vero valore del parametro (assenza di distorsione)
Obiettivo di uno studio epidemiologico
precisione : ottenere gli stessi risultati in prove ripetute
accuratezza : centrare il vero valore del parametro
Obiettivo di uno studio epidemiologico
Ridurre gli errori casuali e sistematici
Precisione: riduzione di errori casuali
Aumentare la numerosità
campionaria
Studi di potenza
Accuratezza: riduzione di errori sistematici
Validità interna: soggetti nello studio
Validità esterna: soggetti non nello studio
interna: bias, confondimento
esterna: processo di induzione
Test diagnostici
Confronto tra un nuovo esame diagnostico e un metodo di riferimento
Metodo di riferimentopresente assente
Test in esame
positivo a b a+b negativo c d c+d
a+c b+d N
a = veri positivi b = falsi positivid = veri negativi c = falsi negativi
Test diagnostici
Metodo di riferimentopresente assente
Test in esame
positivo a b a+b negativo c d c+d
a+c b+d N
a/(a+c) = sensibilità a/(a+b) = valore predittivo positivo*† d/(b+d) = specificità d/(c+d) = valore predittivo negativo*
(a+d)/N = accuratezza complessiva* * solo per campioni rappresentativi
(a+c)/N = prevalenza della malattia* † (detto anche “precisione”)
ESEMPIO
Test da sforzo e stenosi coronarica all'angiocardiografia
Stenosi > 75%presente assente
Test da sforzo
positivo 54 7 61 negativo 50 84 134
104 91 195
ESEMPIO
Test da sforzo e stenosi coronarica all'angiocardiografia
falsi positivi = 7falsi negativi = 50sensibilità = 54/104 x 100 = 52%specificità = 84/91 x 100 = 92%
valore predittivo positivo* = 54/61 x 100 = 87% valore predittivo negativo* = 84/134 x 100 = 63%accuratezza complessiva* = (54+84)/195 x 100 = 71%prevalenza della stenosi* = (54+50)/195 x 100 = 53%
*solo se il campione è rappresentativo della popolazione
Curve ROC
•performance:
• scarsa• scarsa• ottima
• aleatorio
In fase di interpretazione dei risultati, dobbiamo sempre tenere conto di 3 possibili fattori che possono avere dato luogo all'associazione osservata.
1. Il CASO
2. La presenza di BIAS (“distorsione” di selezione/informazione/risposta/...)3. La presenza di un CONFONDENTE (e/o di una modificazione d’effetto)
Queste possibilità non sono mutuamente esclusive. Le possiamo trovare nello stesso studio.
L'associazione è valida?
La variabile CONFONDENTE deve essere:
associata all’esposizione una determinante della malattia
CONFONDENTE
Esposizione proxy Malattia
Esposizione Malattia
Confondente
Confondimento presente
Confondimento non presente
CONFONDENTE: come tenerne conto ?
In fase di disegno (si eliminano potenziali confondenti):
• restrizione
• randomizzazione
• stratificazione/matching
In fase di analisi:
• stratificazione
• standardizzazione (diretta, indiretta)
• analisi multivariata
Restrizione: Elimino dallo studio i soggetti eterogenei per la potenziale variabile confondente. Es.: Considero solo soggetti di età maggiore di 40 anni.
Riduzione della numerosità e poca generalizzazione
Matching: Seleziono i casi e i controlli in modo che siano il più omogenei possibile per la potenziale variabile confondente.Es.: Appaio malati e sani per età.
Estremamente costoso per i follow-up
CONFONDENTE: come tenerne conto ?
Stratificazione: Analizzo i dati strato per strato separatamente.
Es.: Calcolo il RR nei giovani e nei soggetti di età avanzata (stratificazione per età).
Quando stratificando per una variabile, i RR risultano uguali nei gruppi di stratificazione e diversi dal RR grezzo ...
... quella variabile è un CONFONDENTE !
Quando invece stratificando per una variabile, i RR risultano molto diversi nei gruppi di stratificazione ... quella variabile è un MODIFICATORE D'EFFETTO.
CONFONDENTE: come tenerne conto ?
Quando ci sono molti confondenti e molte categorie, l’analisi stratificata diventa inefficiente.
Stratificazione con tante variabili
In questo caso, l’analisi multivariata rappresenta un’ alternativa che permette di mantenere la precisione controllando simultaneamente per molte variabili.
La tecnica che viene maggiormente usata è la regressione multipla.
Questo soprattutto grazie alla sua versatilità: generalized linear models.
! Epidemiologia
! Disegno dello studio
! Misure di frequenza
! Misure di effetto e di associazione
! Validità
! Inferenza
Parte 2 : Tipi di studi
Inferenza sul rischio relativo e ODDS ratioInferenza sul rischio relativo e ODDS ratio
Il rischio relativo e l’odds ratio sono dei rapporti. Di conseguenza, i valori di queste statistiche non si distribuiscono normalmente ...
… Tuttavia, il logaritmo di questi rapporti è asintoticamente normale. Quindi, si possono utilizzare dei testi simili a quelli visti nella PARTE 1
per log(RR) e log(OR) per poi ritornare in scala originale.
Quindi gli intervalli di confidenza calcolati saranno intervalli approssimati.
L’approssimazione con la distribuzione normale per il confronto tra rischi o odds fornisce livelli di significatività effettivi più piccoli rispetto al valore nominale ...
Questo perché una distribuzione a valori discreti è approssimata con una distribuzione continua.
… portando, quindi, a test più conservativi.
Correzione di YatesCorrezione di Yates
correzione di continuità di Yates
# confronti
3 0,026 0,01
10 0,0115 021 028 036 045 055 0
alphai
!g = 1 - (1 - !i) c
3 6 10 15 21 28 36 45 550
0
0
0
0
0,01
0,01
0,01
0,01
0,01
0,01
0,01
0,01
0,01
0,01
0,02
0,02
0,02
Confronti multipliConfronti multipli
c : # confronti!i : singificatività singoli!g : significatività globale
H0: µ1 = µ2
H1: µ1 ! µ2
!1 = 0.05 !2 = 0.05 !3 = 0.05
!g = P(A + B + C) , " !i
A B CH0: µ1 = µ3
H1: µ1 ! µ3
H0: µ2 = µ3
H1: µ2 ! µ3
(disuguaglianze di Bonferroni)
Correzione di Bonferroni
Dove -g è la probabilità di concludere che
esiste almeno una volta una differenza e -
il livello dei singoli test.
troppo conservativo per c grande ...
H0: µ1 = µ2
H1: µ1 ! µ2
!1 = 0.05 !2 = 0.05 !3 = 0.05
A B CH0: µ1 = µ3
H1: µ1 ! µ3
H0: µ2 = µ3
H1: µ2 ! µ3
= ! !g / c
Procedure di rifiuto ricorsive:
• Correzione di Holm semplicità computazione pari alla correzione di Bonferroni, ma maggiore potenza
• Correzione Holm-Sidak perfezionamento della correzione di Holm
Le differenze tra questi ultimi due metodi sono di entità lieve.
Confronti multipliConfronti multipli
Combinazione di Combinazione di p-valuep-value
La combinazione di p-value provenienti da test indipendenti è usata per riassumere risultati provenienti da studi e campioni diversi.
Meta-analisi
La combinazione di p-value è facile da calcolare e richiede la conoscenza solo dei valori di significatività. È una tecnica che può essere applicata a molti dataset, anche a quelli che provengono da disegni sperimentali diversi.
La combinazione indica se i test sui dataset dimostrano un effetto positivo, ma non quanti dataset o quali portano ad un effetto positivo.
! Sotto H0 i livelli di significatività osservata – i p-value – provenienti da test statistici continui, si distribuiscono in modo uniforme.
! Sotto H1 la distribuzione dei livelli di significatività osservata dipende dalla distribuzione della statistica test, dai valori dei parametri sotto H1 e dalla numerosità campionaria.
Meglio combinare le statistiche test …
L’ipotesi nulla che si vuole testare attraverso la combinazione dei p-value è che l’effetto studiato non sia presente in nessuno degli studi da combinare.
Combinazione di Combinazione di p-valuep-value