Parte 2 : Tipi di studi Epidemiologiabrazzale/ftp/BioSan/A.A.2009-2010/lezioni/StatApp... ·...

21
! Epidemiologia ! Disegno dello studio ! Misure di frequenza ! Misure di effetto e di associazione ! Validità ! Inferenza Parte 2 : Tipi di studi " L'epidemiologia è la disciplina che ha per oggetto lo studio dell'insorgenza delle malattie nelle popolazioni di esseri umani, con particolare riguardo allo studio delle condizioni e dei fattori che le determinano. " L’epidemiologia, in particolare, studia con quale frequenza e per quali motivi le malattie colpiscono i diversi gruppi della popolazione umana. !"# = epi = verso $%μ&’ = demos = popolo (&)&’ = logos = discorso Epidemiologia Epidemiologia – scopi Intervento terapeutico conoscere PATOGENESI delle malattie Intervento preventivo conoscere EZIOLOGIA delle malattie Per PREVENIRE l'INSORGENZA delle MALATTIE occorre intervenire, ovvero RIMUOVERE le CAUSE. ! Epidemiologia ! Disegno dello studio ! Misure di frequenza ! Misure di effetto e di associazione ! Validità ! Inferenza Parte 2 : Tipi di studi

Transcript of Parte 2 : Tipi di studi Epidemiologiabrazzale/ftp/BioSan/A.A.2009-2010/lezioni/StatApp... ·...

! Epidemiologia

! Disegno dello studio

! Misure di frequenza

! Misure di effetto e di associazione

! Validità

! Inferenza

Parte 2 : Tipi di studi

" L'epidemiologia è la disciplina che ha per oggetto lo studiodell'insorgenza delle malattie nelle popolazioni di esseri umani, con particolare riguardo allo studio delle condizioni e dei fattori che le determinano.

" L’epidemiologia, in particolare, studia con quale frequenza e per quali motivi le malattie colpiscono i diversi gruppi della popolazione umana.

!"# = epi = verso$%µ&' = demos = popolo(&)&' = logos = discorso

Epidemiologia

Epidemiologia – scopi

Intervento terapeutico

conoscere

PATOGENESI delle

malattie

Intervento preventivo

conoscere

EZIOLOGIA delle

malattie

Per PREVENIRE l'INSORGENZA delle MALATTIE

occorre intervenire, ovvero RIMUOVERE le CAUSE.

! Epidemiologia

! Disegno dello studio

! Misure di frequenza

! Misure di effetto e di associazione

! Validità

! Inferenza

Parte 2 : Tipi di studi

Un quadro più complesso ...

Disegno dello studio

Sperimentali

Osservazionali

Clinical trial

Field trial

* Community intervention trial

Caso-Controllo

Di coorte (cohort study)

Trasversali (cross-sectional)

Studi

Un quadro più complesso ...

Studi sperimentali

Idealmente, in uno studio sperimentale perfetto, varia solo il fattore oggetto dello studio, quello cioè che supponiamo influenzi la variabile d'interesse.

A causa della “variabilità biologica” questo è poco realistico. L’obiettivo dello studio sperimentale quindi è quello di minimizzare il più possibile l'influenza di possibili fattori estranei.

Clinical trial (esperimento clinico controllato): L’oggetto dello studio è generalmente la valutazione di uno o più trattamenti su una patologia d'interesse per un gruppo di pazienti.

Problemi etici - Esperimenti randomizzati

Problemi etici

In teoria, l’assegnazione di un trattamento dovrebbe essere fatto in modo da ridurre la variabilità tra i gruppi a confronto rispetto ad altre potenziali variabili che possono influire sulla patologia studiata.

L’assegnazione aiuta lo studio non il soggetto studiato.

Tutela del paziente:

• I trattamenti devono essere potenzialmente preventivi della malattia.

• Non ci devono essere altri potenziali trattamenti migliori di quello somministrato. • Ogni soggetto nello studio non deve essere privato di altri trattamenti migliori di quello studiato. (Placebo?). • I soggetti devono essere informati del piano sperimentale e dei suoi possibili effetti (consenso informato).

Randomizzazione

Il criterio guida di un buon campionamento, in linea teorica e a prescindere dai costi, prevede che ciascun membro della popolazione abbia la stessa probabilità di essere scelto.

campione "randomizzato" o "casuale"

Il campionamento per randomizzazione semplice si effettua estraendo n unità dalla popolazione attraverso un metodo che garantisce la casualità delle estrazioni. Questa viene ottenuta, ad esempio, con un generatore di numeri casuali.

Randomizzazione sistematica: Le n unità che costituiranno il campione sono scelte dalla popolazione ad intervalli regolari. Più pratico rispetto alla randomizzazione semplice, ed assicura anche che le singole unità del campione siano distribuite uniformemente all'interno della popolazione.

Randomizzazione stratificata: Trova applicazione quando si studia un carattere che è influenzato da un certo fattore presente nella popolazione. Prima di effettuare l'estrazione del campione la popolazione viene suddivisa in strati, all'interno di ciascuno strato si sceglie un campione con il metodo della randomizzazione semplice o sistematica.

Randomizzazione

Scopo: eliminazione di distorsioni e stima accurata delle variabilità casuale

Randomizzazione

Field trial: I soggetti non sono pazienti perché non sono malati. Si usa per malattie molto comuni (influenza della vitamina C nella prevenzione del raffreddore). I soggetti quindi devono essere seguiti sul campo (a casa, al lavoro, a scuola). Visto che la probabilità di contrarre la malattia è bassa necessita di numeri molto grandiimplicando quindi costi elevati.

Community intervention trial: È un’estensione del field trial. Quello che interessa è una comunità di persone (località, famiglia, ufficio, condominio) a cui è somministrato un certo trattamento.

Altri studi sperimentali

Studi osservazionali

" Trasversali (cross-sectional): I soggetti sono selezionati sulla

base della patologia.

" Di coorte (cohort study, follow-up study): I soggetti sono

selezionati sulla base della esposizione.

" Caso-Controllo: I soggetti sono selezioni sulla base della

presenza e assenza della patologia.

Architettura degli studi

Studi trasversali – cross-sectional

Trattasi di un tipo di studio che include tutti i soggetti di una popolazione in un certo istante temporale inclusi quelli malati.

L'informazione sulla presenza/assenza della malattia e dell'esposizione al fattore di rischio viene recuperata simultaneamente.

Fotografia della popolazione in un determinato momento.

Fanno generalmente riferimento a fattori di rischio che non possono cambiare (es. gruppo sanguigno) o a caratteristiche personali dei soggetti (es. sesso).

L’esposizione e la malattia sono stabilite e rilevate nello stesso istante, quindi non si può dire se l’esposizione precede la malattia o ne è la conseguenza.

Generalmente quindi si fanno delle assunzioni sulla correlazione tra esposizione attuale e passata o tra esposizione attuale e reale.

Studi trasversali

Assunzioni sul periodo di induzione

• Periodo di induzione: l'intervallo temporale tra l'esposizione e

l'insorgenza della malattia

Confrontiamo uno o due gruppi di soggetti non malati che differiscono per il grado di esposizione ad un fattore di rischio (es. fumo).

In questo senso, tutti gli studi sperimentali sono anche studi di coorte.

Domanda : l’incidenza della malattia è diversa tra esposti e non esposti?

Studi di coorte – cohort/follow-up study

Definizione della coorte: Un soggetto dovrebbe entrare nello studio solo dopo aver passato il periodo minimo di induzione e latenza.

Generalmente non si hanno informazioni sulla durata di questi periodi. Quello che si fa è assumere che siano entrambi nulli e quindi reclutare subito dopo l’esposizione.

Problemi:

- Esposizioni croniche

- Definizione dei non esposti

Studi di coorte

! Periodo di induzione: l'intervallo temporale tra l'esposizione e

l'insorgenza della malattia

!

! Periodo di latenza: l'intero intervallo temporale tra l'inizio del

processo patologico e la manifestazione clinica

Studi di coorte

Studi di coorte Tempo

a b c d einizioesposizione

inizio processopatologico

comparsa segni precocidiagnosi precoce

comparsa segni sintomi

diagnosi clinica

instaurarsicondizione finale;

esito

Fase di induzione Fase di latenzaFase clinica

EVOLUZIONE della MALATTIA

Costi: Sono studi generalmente molto ampi che seguono molte persone per molti anni (quindi generalmente molto costosi).

Limitare i costi:

• Usare sistemi di monitoraggio già esistenti (es. registri regionali dei tumori).

• Usare studi di coorte retrospettivi.

• Sostituire il gruppo non esposto con informazioni generali sulla popolazione

(Ha senso solo se una piccola porzione della popolazione è esposta all’agente

studiato.)

• Inserire uno studio caso-controllo all’interno dello studio di coorte (nested).

Vantaggi e svantaggi

Studi di coorte

Problema: Seguire le persone nel tempo

Nella società moderna è difficile seguire individui per molto tempo.

Studi di coorte che perdono più del 40% della coorte iniziale possono essere distorti!

Bisogna essere certi che la perdita non è correlata all’esposizione.

Studi di coorte

Studi caso-controllo (“retrospettivi”)

Studio osservazionale in cui un gruppo di soggetti malati e un gruppo di soggetti sani vengono confrontati sulla base del grado della loro esposizione ad un fattore di rischio

Domanda: La proporzione di esposti tra

malati è diversa dalla proporzione tra i sani ?

Il dato rispetto all’esposizione è retrospettivo. (L’esposizione è già avvenuta.)

Lo studio caso-controllo può essere visto come un follow-up in cui la variabile tempo-persona dell’esposizione è campionata, e il campionamento è indipendente dall’esposizione.

Visto in questa ottica, questo disegno sperimentale sembra più efficiente del follow-up perché ha un numero di casi uguali a quelli che un follow-up avrebbe identificato e i controlli rappresentano un veloce ed economico metodo per fare inferenza sulla variabile tempo-persona dell’esposizione nella popolazione che ha dato luogo poi alla malattia.

Studi caso-controllo

Selezione: Non è vero che i casi e i controlli debbano essere necessariamente rappresentativi dell’intera popolazione dei malati e dei sani.

Studi caso-controllo

Casi: Possono essere malati ma con particolari caratteristiche (solo anziani, solo di un certo luogo, solo maschi o solo femmine).

Controlli: Devono essere reclutati tra coloro che se avessero contratto la malattia sarebbero stati reclutati come malati.

La selezione deve essere fatta indipendentemente dall’esposizione.

Studi caso-controllo vs. di coorte

• Gli studi di tipo follow-up anche se più impegnativi e costosi possonovalutare molti aspetti e molti effetti dovuti ad un fattore di rischio. Gli studi caso-controllo, per come sono disegnati, posso valutare l’effetto di un fattore solo sulla malattia studiata.

• Al contrario uno studio caso-controllo può valutare diversi fattori di rischiosulla malattia mentre, di solito, uno studio di coorte si concentra solo su un tipo di esposizione.

• Uno studio di tipo follow-up non è efficace su malattie rare; uno studio caso-controllo non è efficace su esposizioni rare.

• Follow-up: problema del tracing dei soggetti; caso-controllo: problema dell’informazione raccolta in modo retrospettivo.

Un quadro più complesso ...

! Epidemiologia

! Disegno dello studio

! Misure di frequenza

! Misure di effetto e di associazione

! Validità

! Inferenza

Parte 2 : Tipi di studi

Misure di frequenza

! Prevalenza: Proporzione, o percentuale, di soggetti affetti da una malattia in un determinato momento sul totale dei soggetti appartenenti alla popolazione.È una misura che indica la proporzione/percentuale di soggetti che in un determinato momento temporale è malata.

!

ES: percentuale di donne con tumore alla mammella in Toscana al 31/12/ 2003

! Incidenza: Numero di nuovi casi di malattia verificatisi in una popolazione a

rischio in un determinato periodo di tempo. È una misura istantanea di occorrenza di una certa patologia studiata.

!

ES: tasso di insorgenza del tumore al pancreas per la popolazione maschile italiana

!

! Incidenza cumulata: È una misura che indica la proporzione di individui che, in un dato periodo di tempo, si ammala di una certa patologia.

ES: rischio di contrarre l'epatite B per la popolazione italiana nel decennio 1991-2000

Misure di frequenza

! La prevalenza e l!incidenza sono misurate su una scala relativa.

! Ovvero, il numero di eventi viene rapportato alla dimensione della popolazione.

Prevalenza (P) =numero di casi in un certo istante/popolazione nello stesso istante

Tasso di incidenza (I) =

numero di nuovi casi in un certo periodo/popolazione a metà periodo

Misure di frequenza

• casi incidenti: numero di nuovi casi di una patologia che si verificano in una popolazione osservata per in certo intervallo di tempo.

• casi prevalenti: numero di casi di una patologia che si verificano in una popolazione osservata per in certo intervallo di tempo (es. remissioni)

Prevalenza

Prevalenza =numero di casi in un certo istante /popolazione nello stesso istante

! La prevalenza non è un tasso, ma una proporzione.

ESEMPIO

Prevalenza

Prevalenza =numero di casi in un certo istante /popolazione nello stesso istante

! La prevalenza non è un tasso, ma una proporzione.

! L'istante temporale deve essere ben specificato.

ESEMPIO

Incidenza

Tasso di incidenza =numero di nuovi casi in un periodo/popolazione a metà periodo

• L'incidenza è un tasso.

• L'incidenza non è interpretabile se non viene riferita ad un intervallo temporale. L’unità di misura del tasso è tempo-1.

! L’unità di tempo è arbitraria: giorni-1, mesi-1, anni-1, …

! Il tasso viene poi generalmente moltiplicato per una costante di

convenienza (1.000, 10.000, …).

10 nuovi casi ogni 1.000 persone all’anno

Incidenza

I =10

1.000 persone#1 anno

I=3

10 anni#1.000=300#1.000 anni

$1

I =3

120 mesi#1.000=25#1.000 mesi

$1

ESEMPIO

ESEMPIO

Incidenza

Tasso di incidenza =numero di nuovi casi in un periodo/popolazione a metà periodo

• L'incidenza è un tasso.

• L’unità di misura del tasso è tempo-1.

• La popolazione di riferimento può essere fissa o dinamica.

Incidenza

time time

fissa dinamica

Person-time = somma dei periodi temporali per ciascun soggetto facente parte dello studio

L'unità di misura è l’inverso del tempo (tempo)-1.

La prevalenza è influenzata dall’incidenza e dalla durata stessa della malattia.

Prevalenza vs. incidenza

Prevalenza = Incidenza x Tempo

Malattie con tassi di incidenza elevati possono avere bassa prevalenza se sono molto fatali in tempi brevi.

ESEMPIO

Incidenza cumulata

Il rischio è la probabilità che un individuo sviluppi la malattia in un determinato periodo di tempo.

L’incidenza cumulata (R) è una misura di rischio medio.

Incidenza cumulata =numero di nuovi casi in un periodo/popolazione all'inzio del periodo

ESEMPIO

! Anche l'incidenza cumulata non è interpretabile se non viene associata ad un arco temporale.

! L'incidenza cumulata si basa sull’assunzione che non sono

presenti altri fattori di rischio competitivi a quello preso in considerazione.

! A lungo termine questo è molto improbabile. Incidenze cumulate calcolate su lunghi periodi non sono attendibili.

Incidenza cumulata

ESEMPIO

Un quadro più complesso ...

! Epidemiologia

! Disegno dello studio

! Misure di frequenza

! Misure di effetto e di associazione

! Validità

! Inferenza

Parte 2 : Tipi di studi

Misure di effetto

In senso generale, ogni manifestazione patologica è l’effetto di una certa causa.

In senso quantitativo, invece, un effetto è la misura della diversità nell'occorrenza di una patologia in due gruppi che differiscono per una certa caratteristica.

• Effetto assoluto = differenza tra prevalenze, tassi di incidenza, o tassi di incidenza cumulata

• Effetto relativo = rapporto tra P, I o R

• Proporzione attribuibile = proporzione di una popolazione affetta avente come possibile causa l’esposizione

Misure di effetto

Rate difference : differenza tra tassi di incidenza

Risk difference : differenza tra tassi di incidenza cumulata

I1$I

0

R1$R

0

RR=R

1

R0

Incidence rate ratio

Risk ratioI

1$ I

0

I0

=I

1

I0

$1Relative risk

Rate ratio

Misure di effetto

Rischio attribuibile o frazione eziologica :

I1$ I

0

I1

=1$1

IR=

IR$1

IR

dove IR = I1 / I0

frazione eziologica : percentuale di malati tra gli espostiattribuibile all’esposizione stessa

La misura (o quantificazione) di un'associazione rappresenta uno tra i passi più importanti nell'investigazione di un qualsiasi rapporto causa-effetto.

Misure di associazione

Nella valutazione dell'esistenza di un'associazione sono in gioco due variabili: la presunta causa (o variabile indipendente) e l'effetto (o variabile dipendente). L'effetto è rappresentato dalla comparsa della malattia.

L'esistenza dell'associazione si dimostra confrontando la frequenza della malattia in due popolazioni costituite rispettivamente da esposti e non esposti ad una presunta causa.

La misura fondamentale per quantificare il rischio è la probabilità che il soggetto sviluppi la malattia “entro un anno” data l‘esposizione E.

P %Y =1&E '=P %YE=1 '

Rischio tra gli esposti [0,1]

Rischio tra i non esposti [0,1]

Differenza tra i rischi [-1,+1]

Rapporto tra i rischi (RR) [0,+ + ]

Odds tra gli esposti [0,+ + ]

Odds tra i non esposti [0,+ + ]

Rapporto tra odds (OR) [0,+ + ]

P %YE=1'

P %YNE=1'

P %YE=1'$P %Y

NE=1 '

P %YE=1'/P %Y

NE=1 '

P %YE=1'/P %Y

E=0 '

P %YNE=1'/P %Y

NE=0 '

P %YE=1 '/P %Y

E=0 '

P %YNE=1 '/P %Y

NE=0 '

Misure di associazione

Tipi di studio e misure di associazione

Studio trasversale (cross-sectional)

Nb+da+cTotale

c+ddcNon Esposti

a+bbaEsposti

TotaleNon MalatiMalati

Fissato nel disegnoPrevalenza della malattia: SI * (a+c)/NPrevalenza dell’esposizione: SI * (a+b)/NPrevalenza tra esposti: SI * P1 = a/(a+b)Prevalenza tra i non esposti: SI * P0 = c/(c+d)Misure di associazione: SI * P1/P0 oppure OR

Tipi di studio e misure di associazione

Studio di coorte o follow-up (prospettico)

c+da+bTotale

b+ddbNon Esposti

a+ccaEsposti

TotaleNon MalatiMalati

Fissati nel disegno

Rischio di malattia nella popolazione: NOPrevalenza dell’esposizione nella popolazione: NORischio di malattia, R1, tra esposti: SI * a/(a+c)Rischio di malattia, R0, tra i non esposti: SI * b/(b+d)Misure di associazione: SI * RR = R1/R0, OR = ad/bc, RD = R1-R0

Tipi di studio e misure di associazione

Studio caso-controllo (retrospettivo)

b+da+cTotale

c+ddcNon Esposti

a+bbaEsposti

TotaleControlliCasi

Fissati nel disegno

Rischio di malattia nella popolazione: NOPrevalenza dell’esposizione nella popolazione: NORischio di malattia tra esposti: NORischio di malattia tra i non esposti: NOMisure di associazione: RR NO ma OR = ad/bc SI

ODDS ratio

Studio caso-controllo (retrospettivo)

b+da+cTotale

c+ddcNon Esposti

a+bbaEsposti

TotaleControlliCasi

Fissati nel disegno

OR=a/c

b/ d=

Odds dell'esposizione nei casi %1 '

Odds dell'esposizione nei controlli %2 '

%1 '=a/%a(c '

c/ %a(c '=

a

c

%2 '=b /%b(d '

d /%b(d '=

b

d

Se la malattia è relativamente rara nella popolazione (diciamo sotto il 5%), il rapporto tra i rischi può essere approssimato con l’odds ratio.

b+da+cTotale

c+ddcNon Esposti

a+bbaEsposti

TotaleControlliCasi

a(b)b

c(d)d

RR=a/ %a(b 'c /%c(d '

)a/b

c/ d=

a*dc*b

=OR

ODDS ratio

! Epidemiologia

! Disegno dello studio

! Misure di frequenza

! Misure di effetto e di associazione

! Validità

! Inferenza

Parte 2 : Tipi di studi

Validità di uno studio epidemiologico

precisione: ottenere gli stessi risultati in prove ripetute (riproducibilità)

accuratezza : centrare il vero valore del parametro (assenza di distorsione)

Obiettivo di uno studio epidemiologico

precisione : ottenere gli stessi risultati in prove ripetute

accuratezza : centrare il vero valore del parametro

Obiettivo di uno studio epidemiologico

Ridurre gli errori casuali e sistematici

Precisione: riduzione di errori casuali

Aumentare la numerosità

campionaria

Studi di potenza

Accuratezza: riduzione di errori sistematici

Validità interna: soggetti nello studio

Validità esterna: soggetti non nello studio

interna: bias, confondimento

esterna: processo di induzione

Test diagnostici

Confronto tra un nuovo esame diagnostico e un metodo di riferimento

Metodo di riferimentopresente assente

Test in esame

positivo a b a+b negativo c d c+d

a+c b+d N

a = veri positivi b = falsi positivid = veri negativi c = falsi negativi

Test diagnostici

Metodo di riferimentopresente assente

Test in esame

positivo a b a+b negativo c d c+d

a+c b+d N

a/(a+c) = sensibilità a/(a+b) = valore predittivo positivo*† d/(b+d) = specificità d/(c+d) = valore predittivo negativo*

(a+d)/N = accuratezza complessiva* * solo per campioni rappresentativi

(a+c)/N = prevalenza della malattia* † (detto anche “precisione”)

ESEMPIO

Test da sforzo e stenosi coronarica all'angiocardiografia

Stenosi > 75%presente assente

Test da sforzo

positivo 54 7 61 negativo 50 84 134

104 91 195

ESEMPIO

Test da sforzo e stenosi coronarica all'angiocardiografia

falsi positivi = 7falsi negativi = 50sensibilità = 54/104 x 100 = 52%specificità = 84/91 x 100 = 92%

valore predittivo positivo* = 54/61 x 100 = 87% valore predittivo negativo* = 84/134 x 100 = 63%accuratezza complessiva* = (54+84)/195 x 100 = 71%prevalenza della stenosi* = (54+50)/195 x 100 = 53%

*solo se il campione è rappresentativo della popolazione

Curve ROC

•performance:

• scarsa• scarsa• ottima

• aleatorio

In fase di interpretazione dei risultati, dobbiamo sempre tenere conto di 3 possibili fattori che possono avere dato luogo all'associazione osservata.

1. Il CASO

2. La presenza di BIAS (“distorsione” di selezione/informazione/risposta/...)3. La presenza di un CONFONDENTE (e/o di una modificazione d’effetto)

Queste possibilità non sono mutuamente esclusive. Le possiamo trovare nello stesso studio.

L'associazione è valida?

La variabile CONFONDENTE deve essere:

associata all’esposizione una determinante della malattia

CONFONDENTE

Esposizione proxy Malattia

Esposizione Malattia

Confondente

Confondimento presente

Confondimento non presente

CONFONDENTE: come tenerne conto ?

In fase di disegno (si eliminano potenziali confondenti):

• restrizione

• randomizzazione

• stratificazione/matching

In fase di analisi:

• stratificazione

• standardizzazione (diretta, indiretta)

• analisi multivariata

Restrizione: Elimino dallo studio i soggetti eterogenei per la potenziale variabile confondente. Es.: Considero solo soggetti di età maggiore di 40 anni.

Riduzione della numerosità e poca generalizzazione

Matching: Seleziono i casi e i controlli in modo che siano il più omogenei possibile per la potenziale variabile confondente.Es.: Appaio malati e sani per età.

Estremamente costoso per i follow-up

CONFONDENTE: come tenerne conto ?

Stratificazione: Analizzo i dati strato per strato separatamente.

Es.: Calcolo il RR nei giovani e nei soggetti di età avanzata (stratificazione per età).

Quando stratificando per una variabile, i RR risultano uguali nei gruppi di stratificazione e diversi dal RR grezzo ...

... quella variabile è un CONFONDENTE !

Quando invece stratificando per una variabile, i RR risultano molto diversi nei gruppi di stratificazione ... quella variabile è un MODIFICATORE D'EFFETTO.

CONFONDENTE: come tenerne conto ?

Quando ci sono molti confondenti e molte categorie, l’analisi stratificata diventa inefficiente.

Stratificazione con tante variabili

In questo caso, l’analisi multivariata rappresenta un’ alternativa che permette di mantenere la precisione controllando simultaneamente per molte variabili.

La tecnica che viene maggiormente usata è la regressione multipla.

Questo soprattutto grazie alla sua versatilità: generalized linear models.

! Epidemiologia

! Disegno dello studio

! Misure di frequenza

! Misure di effetto e di associazione

! Validità

! Inferenza

Parte 2 : Tipi di studi

Inferenza sul rischio relativo e ODDS ratioInferenza sul rischio relativo e ODDS ratio

Il rischio relativo e l’odds ratio sono dei rapporti. Di conseguenza, i valori di queste statistiche non si distribuiscono normalmente ...

… Tuttavia, il logaritmo di questi rapporti è asintoticamente normale. Quindi, si possono utilizzare dei testi simili a quelli visti nella PARTE 1

per log(RR) e log(OR) per poi ritornare in scala originale.

Quindi gli intervalli di confidenza calcolati saranno intervalli approssimati.

L’approssimazione con la distribuzione normale per il confronto tra rischi o odds fornisce livelli di significatività effettivi più piccoli rispetto al valore nominale ...

Questo perché una distribuzione a valori discreti è approssimata con una distribuzione continua.

… portando, quindi, a test più conservativi.

Correzione di YatesCorrezione di Yates

correzione di continuità di Yates

# confronti

3 0,026 0,01

10 0,0115 021 028 036 045 055 0

alphai

!g = 1 - (1 - !i) c

3 6 10 15 21 28 36 45 550

0

0

0

0

0,01

0,01

0,01

0,01

0,01

0,01

0,01

0,01

0,01

0,01

0,02

0,02

0,02

Confronti multipliConfronti multipli

c : # confronti!i : singificatività singoli!g : significatività globale

H0: µ1 = µ2

H1: µ1 ! µ2

!1 = 0.05 !2 = 0.05 !3 = 0.05

!g = P(A + B + C) , " !i

A B CH0: µ1 = µ3

H1: µ1 ! µ3

H0: µ2 = µ3

H1: µ2 ! µ3

(disuguaglianze di Bonferroni)

Correzione di Bonferroni

Dove -g è la probabilità di concludere che

esiste almeno una volta una differenza e -

il livello dei singoli test.

troppo conservativo per c grande ...

H0: µ1 = µ2

H1: µ1 ! µ2

!1 = 0.05 !2 = 0.05 !3 = 0.05

A B CH0: µ1 = µ3

H1: µ1 ! µ3

H0: µ2 = µ3

H1: µ2 ! µ3

= ! !g / c

Procedure di rifiuto ricorsive:

• Correzione di Holm semplicità computazione pari alla correzione di Bonferroni, ma maggiore potenza

• Correzione Holm-Sidak perfezionamento della correzione di Holm

Le differenze tra questi ultimi due metodi sono di entità lieve.

Confronti multipliConfronti multipli

Combinazione di Combinazione di p-valuep-value

La combinazione di p-value provenienti da test indipendenti è usata per riassumere risultati provenienti da studi e campioni diversi.

Meta-analisi

La combinazione di p-value è facile da calcolare e richiede la conoscenza solo dei valori di significatività. È una tecnica che può essere applicata a molti dataset, anche a quelli che provengono da disegni sperimentali diversi.

La combinazione indica se i test sui dataset dimostrano un effetto positivo, ma non quanti dataset o quali portano ad un effetto positivo.

! Sotto H0 i livelli di significatività osservata – i p-value – provenienti da test statistici continui, si distribuiscono in modo uniforme.

! Sotto H1 la distribuzione dei livelli di significatività osservata dipende dalla distribuzione della statistica test, dai valori dei parametri sotto H1 e dalla numerosità campionaria.

Meglio combinare le statistiche test …

L’ipotesi nulla che si vuole testare attraverso la combinazione dei p-value è che l’effetto studiato non sia presente in nessuno degli studi da combinare.

Combinazione di Combinazione di p-valuep-value