La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia...

54
La misclassificazione dello stato di esposizione: problema e soluzione Andrea Arfè [email protected] Anno accademico 2014-15 Lab

Transcript of La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia...

Page 1: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

La misclassificazione dello stato di

esposizione: problema e soluzione

Andrea Arfè

[email protected]

Anno accademico 2014-15

Lab

Page 2: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Introduzione

• Il problema della misclassificazione dello stato di esposizione negli studi di farmacoepidemiologia basati su healthcare utilization databases:

Figura tratta da:Schneeweiss S, Avorn J. A review of uses of health care utilization databases for epidemiologic research on therapeutics. J ClinEpidemiol 2005; 58:323-37.

Page 3: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Argomenti della lezione

Argomenti:1. Misclassificazione non-differenziale di una esposizione binaria

1.1 Definizione1.2 Impatto sulle misure di rischio relativo

2. Misclassificazione non-differenziale di una esposizione categorica2.1 Definizione2.2 Impatto sulle misure di rischio relativo

3. Metodi probabilistici per la valutazione quantitativa dell’impatto della misclassificazione non-differenziale: 3.1 Descrizione metodologia3.2 Applicazione: durata terapia antidiabetica e rischio di eventi avversi

4. Cenni alla misclassificazione differenziale dello stato di esposizione

Page 4: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Argomenti della lezione

Argomenti:1. Misclassificazione non-differenziale di una esposizione binaria

1.1 Definizione1.2 Impatto sulle misure di rischio relativo

2. Misclassificazione non-differenziale di una esposizione categorica2.1 Definizione2.2 Impatto sulle misure di rischio relativo

3. Metodi probabilistici per la valutazione quantitativa dell’impatto della misclassificazione non-differenziale: 3.1 Descrizione metodologia3.2 Applicazione: durata terapia antidiabetica e rischio di eventi avversi

4. Cenni alla misclassificazione differenziale dello stato di esposizione

Page 5: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.1 Misclassificazione non-differenziale di

una esposizione binaria: definizioni

• Variabili di interesse in un ipotetico studio di coorte (no confondenti):

𝑬 (vero stato di esposizione):

𝒀 (variabile di outcome):

𝐸 = 1 per gli esposti𝐸 = 0 per i non esposti

𝑌 = 1 per chi sperimenta l’outcome𝑌 = 0 per chi non sperimenta l’outcome

• Misura dell’associazione fra E e Y: rapporto fra rischi

𝑅𝑅 =Pr(𝑌 = 1|𝐸 = 1)

Pr 𝑌 = 1 𝐸 = 0

Page 6: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.1 Misclassificazione non-differenziale di

una esposizione binaria: definizioni

• Variabili di interesse in un ipotetico studio di coorte (no confondenti):

𝑬 (vero stato di esposizione):

𝒀 (variabile di outcome):

𝐸 = 1 per gli esposti𝐸 = 0 per i non esposti

𝑌 = 1 per chi sperimenta l’outcome𝑌 = 0 per chi non sperimenta l’outcome

• Misura dell’associazione fra E e Y: rapporto fra rischi

𝑅𝑅 =Pr(𝑌 = 1|𝐸 = 1)

Pr 𝑌 = 1 𝐸 = 0

Non osservato

Page 7: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.1 Misclassificazione non-differenziale di

una esposizione binaria: definizioni

• Variabili di interesse in un ipotetico studio di coorte (no confondenti):

𝑬 (vero stato di esposizione):

𝒀 (variabile di outcome):

𝐸 = 1 per gli esposti𝐸 = 0 per i non esposti

𝑌 = 1 per chi sperimenta l’outcome𝑌 = 0 per chi non sperimenta l’outcome

• Misura dell’associazione fra E e Y: rapporto fra rischi

Non osservato

𝑬∗ (proxy dello stato di esposizione):𝐸 = 1 per chi viene classificato come esposto𝐸 = 0 per chi viene classificato come non esposto

𝑅𝑅 =Pr(𝑌 = 1|𝐸 = 1)

Pr 𝑌 = 1 𝐸 = 0

Page 8: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.1 Misclassificazione non-differenziale di

una esposizione binaria: definizioni

• Variabili di interesse in un ipotetico studio di coorte (no confondenti):

𝑬 (vero stato di esposizione):

𝒀 (variabile di outcome):

𝐸 = 1 per gli esposti𝐸 = 0 per i non esposti

𝑌 = 1 per chi sperimenta l’outcome𝑌 = 0 per chi non sperimenta l’outcome

• Misura dell’associazione fra E e Y: rapporto fra rischi

Non osservato

𝐸 = 1 per chi viene classificato come esposto𝐸 = 0 per chi viene classificato come non esposto

In generale non stimabile tramite i dati osservati se può essere 𝑬 ≠ 𝑬∗𝑅𝑅 =

Pr(𝑌 = 1|𝐸 = 1)

Pr 𝑌 = 1 𝐸 = 0

𝑬∗ (proxy dello stato di esposizione):

Page 9: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.1 Misclassificazione non-differenziale di

una esposizione binaria: definizioni

• Variabili di interesse in un ipotetico studio di coorte (no confondenti):

𝑬 (vero stato di esposizione):

𝒀 (variabile di outcome):

𝐸 = 1 per gli esposti𝐸 = 0 per i non esposti

𝑌 = 1 per chi sperimenta l’outcome𝑌 = 0 per chi non sperimenta l’outcome

• Misura dell’associazione fra E* e Y: rapporto fra rischi apparente

Non osservato

𝐸 = 1 per chi viene classificato come esposto𝐸 = 0 per chi viene classificato come non esposto

Stimabile dai dati osservati.In generale può essere 𝑨𝑹𝑹 ≠ 𝑹𝑹𝐴𝑅𝑅 =

Pr(𝑌 = 1|𝐸∗ = 1)

Pr 𝑌 = 1 𝐸∗ = 0

𝑬∗ (proxy dello stato di esposizione):

Page 10: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.1 Misclassificazione non-differenziale di

una esposizione binaria: definizioni

Misclassificazione non-differenziale/differenziale (rispetto l’outcome):

La misclassificazione di E* come misura di E è non-differenziale (rispetto a Y) se

o equivalentemente

Buonaccorsi JP. Measurement error. Models, methods and applications. CRC Press, Boca Raton, Florida, 2010.

Pr 𝐸∗ = 1 𝐸 = 1, 𝒀 = 𝟏 = Pr 𝐸∗ = 1 𝐸 = 1, 𝒀 = 𝟎

Pr 𝐸∗ = 0 𝐸 = 0, 𝒀 = 𝟏 = Pr 𝐸∗ = 0 𝐸 = 0, 𝒀 = 𝟎

Sensibilità:

Specificità:

Misclassificazione non-differenziale e caratteristiche operative:

In caso contrario la misclassificazione è detta differenziale (rispetto Y).

Page 11: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Argomenti della lezione

Argomenti:1. Misclassificazione non-differenziale di una esposizione binaria

1.1 Definizione1.2 Impatto sulle misure di rischio relativo

2. Misclassificazione non-differenziale di una esposizione categorica2.1 Definizione2.2 Impatto sulle misure di rischio relativo

3. Metodi probabilistici per la valutazione quantitativa dell’impatto della misclassificazione non-differenziale: 3.1 Descrizione metodologia3.2 Applicazione: durata terapia antidiabetica e rischio di eventi avversi

4. Cenni alla misclassificazione differenziale dello stato di esposizione

Page 12: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

• Vogliamo valutare l’impatto della misclassificazione non-differenziale dello stato di esposizione sul rapporto fra rischi:

𝐴𝑅𝑅 = 𝑓 𝑅𝑅,misure intensitàdella misclassificazione

Flegal KM, Brownie C, Haas JD. The effects of exposure misclassification on estimates of relative risk. Am J Epidemiol 1986; 123:736-51.

Page 13: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

• Vogliamo valutare l’impatto della misclassificazione non-differenziale dello stato di esposizione sul rapporto fra rischi:

𝐴𝑅𝑅 = 𝑓 𝑅𝑅,misure intensitàdella misclassificazione

Valori predittivi:

(𝑖, 𝑗 = 0,1)

Flegal KM, Brownie C, Haas JD. The effects of exposure misclassification on estimates of relative risk. Am J Epidemiol 1986; 123:736-51.

𝑃𝑉𝑖𝑗 = Pr 𝐸 = 𝑖 𝐸∗ = 𝑗

Page 14: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

• Vogliamo valutare l’impatto della misclassificazione non-differenziale dello stato di esposizione sul rapporto fra rischi:

𝐴𝑅𝑅 = 𝑓 𝑅𝑅,misure intensitàdella misclassificazione

Valori predittivi:

𝑃𝑉𝑖𝑗 = Pr 𝐸 = 𝑖 𝐸∗ = 𝑗 (𝑖, 𝑗 = 0,1)

• Esempi:

𝑃𝑉11 = Pr 𝐸 = 1 𝐸∗ = 1 = 𝑷𝑷𝑽 (positive predictive value)

𝑃𝑉00 = Pr 𝐸 = 0 𝐸∗ = 0 = 𝑵𝑷𝑽 (negative predictive value)

𝑃𝑉01 = Pr 𝐸 = 0 𝐸∗ = 1 = 1 − 𝑃𝑃𝑉

𝑃𝑉10 = Pr 𝐸 = 1 𝐸∗ = 0 = 1 − 𝑁𝑃𝑉

Flegal KM, Brownie C, Haas JD. The effects of exposure misclassification on estimates of relative risk. Am J Epidemiol 1986; 123:736-51.

Page 15: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

• Vogliamo valutare l’impatto della misclassificazione non-differenziale dello stato di esposizione sul rapporto fra rischi:

𝐴𝑅𝑅 = 𝑓 𝑅𝑅,misure intensitàdella misclassificazione

Valori predittivi:

(𝑖, 𝑗 = 0,1)

Flegal KM, Brownie C, Haas JD. The effects of exposure misclassification on estimates of relative risk. Am J Epidemiol 1986; 123:736-51.

• Se la misclassificazione dello stato di esposizione (binaria) è non-differenziale, si può dimostrare che

𝐴𝑅𝑅 =1 + 𝑅𝑅 − 1 ⋅ 𝑃𝑉111 + 𝑅𝑅 − 1 ⋅ 𝑃𝑉10

𝑃𝑉𝑖𝑗 = Pr 𝐸 = 𝑖 𝐸∗ = 𝑗

Page 16: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

• Vogliamo valutare l’impatto della misclassificazione non-differenziale dello stato di esposizione sul rapporto fra rischi:

𝐴𝑅𝑅 = 𝑓 𝑅𝑅,misure intensitàdella misclassificazione

Valori predittivi:

(𝑖, 𝑗 = 0,1)

Flegal KM, Brownie C, Haas JD. The effects of exposure misclassification on estimates of relative risk. Am J Epidemiol 1986; 123:736-51.

• Se la misclassificazione dello stato di esposizione (binaria) è non-differenziale, si può dimostrare che

𝐴𝑅𝑅 =1 + 𝑅𝑅 − 1 ⋅ 𝑃𝑃𝑉

1 + 𝑅𝑅 − 1 ⋅ 1 − 𝑁𝑃𝑉

𝑃𝑉𝑖𝑗 = Pr 𝐸 = 𝑖 𝐸∗ = 𝑗

Page 17: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

Page 18: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

1 + 1 − 1 ⋅ 𝑃𝑃𝑉

1 + 1 − 1 ⋅ 1 − 𝑁𝑃𝑉= 1

Page 19: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

Page 20: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

Page 21: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

Page 22: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

Page 23: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

Y

1 0

E

1 100 100

0 100 100

• Esempio: sensibilità=80%, specificità=80%

𝑹𝑹 = 𝟏

Page 24: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

Y

1 0

E

1 100 100

0 100 100

• Esempio: sensibilità=80%, specificità=80%

Atteso:

Y

1 0

E*

1 80+20 80+20

0 20+80 20+80

𝑹𝑹 = 𝟏𝑹𝑹 = 𝟏

Page 25: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1.2 Misclassificazione non-differenziale di

una esposizione binaria: impatto

Y

1 0

E

1 100 100

0 100 100

• Esempio: sensibilità=80%, specificità=80%

Osservato per effetto del caso:

Y

1 0

E*

1 70+25 85+10

0 30+75 15+90

𝑹𝑹 = 𝟏.05>1𝑹𝑹 = 𝟏

Page 26: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Argomenti della lezione

Argomenti:1. Misclassificazione non-differenziale di una esposizione binaria

1.1 Definizione1.2 Impatto sulle misure di rischio relativo

2. Misclassificazione non-differenziale di una esposizione categorica2.1 Definizione2.2 Impatto sulle misure di rischio relativo

3. Metodi probabilistici per la valutazione quantitativa dell’impatto della misclassificazione non-differenziale: 3.1 Descrizione metodologia3.2 Applicazione: durata terapia antidiabetica e rischio di eventi avversi

4. Cenni alla misclassificazione differenziale dello stato di esposizione

Page 27: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

• Variabili di interesse:

𝐸 (vero stato di esposizione): 𝐸 = 0 (riferimento),1,2, … ,K

• Misure di associazione:

Non osservato

𝐸∗ (proxy dello stato di esposizione): 𝐸∗ = 0,1,2, … , 𝐾

𝑅𝑅𝒊 =Pr(𝑌 = 1|𝐸 = 𝒊)

Pr 𝑌 = 1 𝐸 = 0

Farmacoepidemiologia

Misclassificazione

dell’esposizione

2.1 Misclassificazione non-differenziale di

una esposizione categorica: definizioni

𝐴𝑅𝑅𝒊 =Pr(𝑌 = 1|𝐸∗ = 𝒊)

Pr 𝑌 = 1 𝐸∗ = 0

Page 28: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

• Variabili di interesse:

𝐸 (vero stato di esposizione): 𝐸 = 0 (riferimento),1,2, … ,K

• Misure di associazione:

Non osservato

𝐸∗ (proxy dello stato di esposizione): 𝐸∗ = 0,1,2, … , 𝐾

𝑅𝑅𝑖 =Pr(𝑌 = 1|𝐸 = 𝑖)

Pr 𝑌 = 1 𝐸 = 0

Farmacoepidemiologia

Misclassificazione

dell’esposizione

𝐴𝑅𝑅𝑖 =Pr(𝑌 = 1|𝐸∗ = 𝑖)

Pr 𝑌 = 1 𝐸∗ = 0

• Misclassificazione non-differenziale (rispetto l’outcome):

o equivalentemente

Pr 𝐸∗ = 𝑖 𝐸 = 𝑗, 𝑌 = 1 = Pr 𝐸∗ = 𝑖 𝐸 = 𝑗, 𝑌 = 0 per ogni i, j=0, 1, 2, … K

2.1 Misclassificazione non-differenziale di

una esposizione categorica: definizioni

Page 29: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Argomenti della lezione

Argomenti:1. Misclassificazione non-differenziale di una esposizione binaria

1.1 Definizione1.2 Impatto sulle misure di rischio relativo

2. Misclassificazione non-differenziale di una esposizione categorica2.1 Definizione2.2 Impatto sulle misure di rischio relativo

3. Metodi probabilistici per la valutazione quantitativa dell’impatto della misclassificazione non-differenziale: 3.1 Descrizione metodologia3.2 Applicazione: durata terapia antidiabetica e rischio di eventi avversi

4. Cenni alla misclassificazione differenziale dello stato di esposizione

Page 30: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

• Vogliamo valutare l’impatto della misclassificazione non-differenziale dello stato di esposizione sul rapporto fra rischi:

• Se la misclassificazione dello stato di esposizione (categorica) è non-differenziale, si può dimostrare che

𝐴𝑅𝑅𝑖 =1 + 𝑘=1𝐾 𝑅𝑅𝑖 − 1 ⋅ 𝑃𝑉𝑘𝑖

1 + 𝑘=1𝐾 𝑅𝑅𝑗 − 1 ⋅ 𝑃𝑉𝑘0

(𝑖 = 1, 2, … , 𝐾)

2.2 Misclassificazione non-differenziale di

una esposizione categorica: impatto

𝐴𝑅𝑅𝑖 = 𝑓 𝑅𝑅1, … , 𝑅𝑅𝐾 , 𝑃𝑉00, … , 𝑃𝑉𝐾𝐾

Valori predittiviRapporti fra rischi

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

Page 31: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

2.2 Misclassificazione non-differenziale di

una esposizione categorica: impatto

Page 32: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

2.2 Misclassificazione non-differenziale di

una esposizione categorica: impatto

Figura tratta da:Stayner L, Steenland K, Dosemeci M, Hertz-Picciotto I. Attenuation of exposure-response curves in occupational cohort studies at high exposure levels. Scand J Work Environ Health 2003; 29:317-24

Page 33: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Argomenti della lezione

Argomenti:1. Misclassificazione non-differenziale di una esposizione binaria

1.1 Definizione1.2 Impatto sulle misure di rischio relativo

2. Misclassificazione non-differenziale di una esposizione categorica2.1 Definizione2.2 Impatto sulle misure di rischio relativo

3. Metodi probabilistici per la valutazione quantitativa dell’impatto della misclassificazione non-differenziale: 3.1 Descrizione metodologia3.2 Applicazione: durata terapia antidiabetica e rischio di eventi avversi

4. Cenni alla misclassificazione differenziale dello stato di esposizione

Page 34: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

• Misclassificazione non-differenziale può inficiare i risultati a volte in maniera imprevedibile, specialmente per esposizioni categoriche.

• Necessità di valutare quantitativamente l’impatto sui risultati.

3.1 Metodi probabilistici per la misclassificazione non-

differenziale: descrizione della metodologia

Page 35: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

• Misclassificazione non-differenziale può inficiare i risultati a volte in maniera imprevedibile, specialmente per esposizioni categoriche.

• Necessità di valutare quantitativamente l’impatto sui risultati.

Problemi:1) Conoscendo i valori predittivi e gli ARR, come posso

ricavare il vero RR (aggiustato per la misclassificazione)?

𝑅𝑅 = 𝑓−1 𝐴𝑅𝑅, 𝑃𝑃𝑉,𝑁𝑃𝑉

2) Come posso tenere conto dell’incertezza sui valori predittivi?

3.1 Metodi probabilistici per la misclassificazione non-

differenziale: descrizione della metodologia

Page 36: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1) Conoscendo i valori predittivi e gli ARR, come posso ricavare il vero RR (aggiustato per la misclassificazione)?

Se la misclassificazione dello stato di esposizione (categorica) è non-differenziale, si può dimostrare che:

𝐴𝑅𝑅𝑖 =1 + 𝑘=1𝐾 𝑅𝑅𝑖 − 1 ⋅ 𝑃𝑉𝑘𝑖

1 + 𝑘=1𝐾 𝑅𝑅𝑖 − 1 ⋅ 𝑃𝑉𝑘0

=1 + 𝐏𝐕𝑖

𝑇 ⋅ 𝐑𝐑 − 𝟏

1 + 𝐏𝐕0𝑇 ⋅ 𝐑𝐑 − 𝟏

(𝑖 = 1, 2, … , 𝐾)

Dove: 𝐏𝐕𝑖 = 𝑃𝑉1𝑖 , … , 𝑃𝑉𝐾𝑖𝑇 , 𝐑𝐑 = 𝑅𝑅1, … , 𝑅𝑅𝐾

𝑇,

𝟏 = 1,… , 1 𝑇 il vettore 𝐾 × 1 unitario

3.1 Metodi probabilistici per la misclassificazione non-

differenziale: descrizione della metodologia

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

Page 37: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

1) Conoscendo i valori predittivi e gli ARR, come posso ricavare il vero RR (aggiustato per la misclassificazione)?

Se la misclassificazione dello stato di esposizione (categorica) è non-differenziale, si può dimostrare che:

𝐴𝑅𝑅𝑖 =1 + 𝑘=1𝐾 𝑅𝑅𝑖 − 1 ⋅ 𝑃𝑉𝑘𝑖

1 + 𝑘=1𝐾 𝑅𝑅𝑖 − 1 ⋅ 𝑃𝑉𝑘0

=1 + 𝐏𝐕𝑖

𝑇 ⋅ 𝐑𝐑 − 𝟏

1 + 𝐏𝐕0𝑇 ⋅ 𝐑𝐑 − 𝟏

(𝑖 = 1, 2, … , 𝐾)

Dove: 𝐏𝐕𝑖 = 𝑃𝑉1𝑖 , … , 𝑃𝑉𝐾𝑖𝑇 , 𝐑𝐑 = 𝑅𝑅1, … , 𝑅𝑅𝐾

𝑇,

𝟏 = 1,… , 1 𝑇 il vettore 𝐾 × 1 unitario

𝐑𝐑 = 𝟏 + 𝐏𝐕 − 𝐀𝐑𝐑 ∙ 𝐏𝐕0𝑇 −1 𝐀𝐑𝐑 − 𝟏

Dove: 𝐀𝐑𝐑 = 𝐴𝑅𝑅1, … , 𝐴𝑅𝑅𝐾𝑇

𝐏𝐕 = 𝑃𝑉𝑖𝑗 𝒊,𝒋=𝟏,…,𝑲 matrice 𝐾 × 𝐾 di valori predittivi.

3.1 Metodi probabilistici per la misclassificazione non-

differenziale: descrizione della metodologia

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

Page 38: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

2) Come posso tenere conto dell’incertezza sui valori predittivi?

3.1 Metodi probabilistici per la misclassificazione non-

differenziale: descrizione della metodologia

Lash TL, Fink AK. Semi-autometed sensitivity analysis to assess systematic errors in observational data. Epidemiology 2003; 14:451-8Phillips CV. Quantifying and reporting uncertainty from systematic errors. Epidemiology 2003; 14:459-66Greenland S. Interval estimation by simulation as an alternative to and extension of confidence intervals. Int J Epidemiol 2004; 33:1389-97Greenland S. Multiple-bias modeling for analysis of observational data. J Roy Stat Soc A 2005; 168:267-306

Probabilistic (Monte Carlo) Bias Analysis: uso distribuzioni di probabilità per quantificare l’incertezza totale, i.e. casuale + sistematica, sui parametri di interesse.

PVARR RR

Distribuzione sui parametri stimati

(incertezza casuale)

Distribuzione sui parametri del processo di bias

(incertezza sistematica)

Distribuzione sui parametri target

(incertezza totale)

Page 39: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

3.1 Metodi probabilistici per la misclassificazione non-

differenziale: descrizione della metodologia

In pratica:

1) Simulo PV dalla distribuzione multivariata Pr(PV) dei valori predittivi.

Greenland S. Interval estimation by simulation as an alternative to and extension of confidence intervals. Int J Epidemiol 2004; 33:1389-97

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

Page 40: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

3.1 Metodi probabilistici per la misclassificazione non-

differenziale: descrizione della metodologia

In pratica:

1) Simulo PV dalla distribuzione multivariata Pr(PV) dei valori predittivi.

2) Simulo ARR dalla distribuzione multivariata Pr(ARR) degli ARRi.

Greenland S. Interval estimation by simulation as an alternative to and extension of confidence intervals. Int J Epidemiol 2004; 33:1389-97

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

Page 41: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

3.1 Metodi probabilistici per la misclassificazione non-

differenziale: descrizione della metodologia

In pratica:

1) Simulo PV dalla distribuzione multivariata Pr(PV) dei valori predittivi.

2) Simulo ARR dalla distribuzione multivariata Pr(ARR) degli ARRi.

3) Calcolo 𝐑𝐑 = 𝟏 + 𝐏𝐕 − 𝐀𝐑𝐑 ∙ 𝐏𝐕0𝑇 −1 𝐀𝐑𝐑 − 𝟏 e ne memorizzo il valore.

Greenland S. Interval estimation by simulation as an alternative to and extension of confidence intervals. Int J Epidemiol 2004; 33:1389-97

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

Page 42: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

3.1 Metodi probabilistici per la misclassificazione non-

differenziale: descrizione della metodologia

In pratica:

1) Simulo PV dalla distribuzione multivariata Pr(PV) dei valori predittivi.

2) Simulo ARR dalla distribuzione multivariata Pr(ARR) degli ARRi.

3) Calcolo 𝐑𝐑 = 𝟏 + 𝐏𝐕 − 𝐀𝐑𝐑 ∙ 𝐏𝐕0𝑇 −1 𝐀𝐑𝐑 − 𝟏 e ne memorizzo il valore.

4) Ripeto 1)-3) in maniera indipendente un numero elevato di volte.

Greenland S. Interval estimation by simulation as an alternative to and extension of confidence intervals. Int J Epidemiol 2004; 33:1389-97

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

Page 43: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

3.1 Metodi probabilistici per la misclassificazione non-

differenziale: descrizione della metodologia

In pratica:

1) Simulo PV dalla distribuzione multivariata Pr(PV) dei valori predittivi.

2) Simulo ARR dalla distribuzione multivariata Pr(ARR) degli ARRi.

3) Calcolo 𝐑𝐑 = 𝟏 + 𝐏𝐕 − 𝐀𝐑𝐑 ∙ 𝐏𝐕0𝑇 −1 𝐀𝐑𝐑 − 𝟏 e ne memorizzo il valore.

4) Ripeto 1)-3) in maniera indipendente un numero elevato di volte.

5) La distribuzione multivariata dei valori 𝐑𝐑 simulati rappresenta l’incertezza totale sui

valori dei rapporti fra rischi aggiustati per l’impatto della misclassificazione.

Greenland S. Interval estimation by simulation as an alternative to and extension of confidence intervals. Int J Epidemiol 2004; 33:1389-97

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

Page 44: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

3.1 Metodi probabilistici per la misclassificazione non-

differenziale: descrizione della metodologia

In pratica:

1) Simulo PV dalla distribuzione multivariata Pr(PV) dei valori predittivi.

2) Simulo ARR dalla distribuzione multivariata Pr(ARR) degli ARRi.

3) Calcolo 𝐑𝐑 = 𝟏 + 𝐏𝐕 − 𝐀𝐑𝐑 ∙ 𝐏𝐕0𝑇 −1 𝐀𝐑𝐑 − 𝟏 e ne memorizzo il valore.

4) Ripeto 1)-3) in maniera indipendente un numero elevato di volte.

5) La distribuzione multivariata dei valori 𝐑𝐑 simulati rappresenta l’incertezza totale sui

valori dei rapporti fra rischi aggiustati per l’impatto della misclassificazione.

• Dalla distribuzione dei singoli 𝑅𝑅𝑖 simulati posso ottenere delle stime intervallari al 95% (e.g. tramite i corrispondenti quantili di livello 2.5% e 97.5%).

• Questi possono talvolta essere interpretati come intervalli di confidenza ma sono più propriamente degli intervalli di credibilità (in senso Bayesiano).

Greenland S. Interval estimation by simulation as an alternative to and extension of confidence intervals. Int J Epidemiol 2004; 33:1389-97

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

Page 45: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Argomenti della lezione

Argomenti:1. Misclassificazione non-differenziale di una esposizione binaria

1.1 Definizione1.2 Impatto sulle misure di rischio relativo

2. Misclassificazione non-differenziale di una esposizione categorica2.1 Definizione2.2 Impatto sulle misure di rischio relativo

3. Metodi probabilistici per la valutazione quantitativa dell’impatto della misclassificazione non-differenziale: 3.1 Descrizione metodologia3.2 Applicazione: durata terapia antidiabetica e rischio di eventi avversi

4. Cenni alla misclassificazione differenziale dello stato di esposizione

Page 46: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

3.2 Metodi probabilistici per la misclassificazione non-

differenziale: durata della terapia antidiabetica

• Studio di coorte per valutare impatto della misclassificazione della durata della terapia con antidiabetici quando le DDD sono usate al posto delle PDD.

• Fonte dei dati: database MMG HealthSearch(registra sia le DDD che la PDD).

• Pazienti inclusi: nuovi utilizzatori di farmaci antidiabetici non-insulinici orali con ≥40anni e che hanno iniziato la terapia per il diabete nel 2003-2010. Sono stati esclusitutti i pazienti con meno di un anno di osservazione dopo la data di ingresso (i.e. ladata della prima prescrizione di antidiabetici).

• Follow-up: tutti i pazienti inclusi hanno accumulato 1 anno di follow-up.

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

Page 47: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

3.2 Metodi probabilistici per la misclassificazione non-

differenziale: durata della terapia antidiabetica

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

• Durata terapia con farmaci anti-diabetici non-insulinici:

• Per ogni membro della coorte sono state identificate tutte le prescrizioni di farmaci antidiabetici non-insulinici ricevute durante il follow-up.

Durata calcolata tramite le PDD (esposizione vera, E):

E = 1-2, 3-4, …, 11-12 mesi

Durata calcolata tramite le DDD (esposizione proxy, E*):

E* = 1-2, 3-4, …, 11-12 mesi

• La classe 1-2 mesi è stata presa come riferimento.

Page 48: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

3.2 Metodi probabilistici per la misclassificazione non-

differenziale: durata della terapia antidiabetica

(E*)

(E)

• Matrice dei valori predittivi, mesi coperti dalla terapia con antidiabetici orali durante il primo

anno dopo l’inizio della terapia in base alla dose prescritta (PDD) e a quella stimata (DDD).

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

OAD: Oral Antidiabetic Drugs

Page 49: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

3.2 Metodi probabilistici per la misclassificazione non-

differenziale: durata della terapia antidiabetica

Distribuzioni considerate per la Probabilistic Bias Analysis:

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

• Pr(PV) = Distribuzione normale multivariata stimata empiricamente dai dati (i.e. quella asintotica degli stimatori di massima verosimiglianza degli PVij):

Pr 𝐏𝐕 = 𝑁 𝐏𝐕, Σ𝐏𝐕

Questa distribuzione è stata troncata per precludere valori impossibili (e.g. PVij < 0).

• Pr(ARR) = Distribuzione log-normale (compatibile con quella empirica corrispondente a comuni stimatori degli ARRi):

Pr log 𝐀𝐑𝐑 = 𝑁 log 𝐀𝐑𝐑 , Σlog 𝐀𝐑𝐑

Nelle nostre analisi abbiamo fissato dei possibili ARRi

Questi sono stati considerati come noti, i.e. abbiamo posto Σ𝐀𝐑𝐑 = 𝟎

Page 50: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

3.2 Metodi probabilistici per la misclassificazione non-

differenziale: durata della terapia antidiabetica

Misclassified ARR

Adjusted RR

95% Monte-Carlo bound

for RR

a) b)

c) Months with drug available

Months with drug available

Months with drug available

Arfè A, et al. A Monte-Carlo Sensitivity Analysis for misclassified categorical exposures, with application to oral anti-hyperglycaemic drugs. Sumbitted manuscript.

• Impatto degli errori di misclassificazione (assunta non differenziale) su degli ipotetici profili di

durata-risposta per l’associazione fra uso di farmaci antidiabetici ed un ipotetico evento avverso:

Page 51: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Argomenti della lezione

Argomenti:1. Misclassificazione non-differenziale di una esposizione binaria

1.1 Definizione1.2 Impatto sulle misure di rischio relativo

2. Misclassificazione non-differenziale di una esposizione categorica2.1 Definizione2.2 Impatto sulle misure di rischio relativo

3. Metodi probabilistici per la valutazione quantitativa dell’impatto della misclassificazione non-differenziale: 3.1 Descrizione metodologia3.2 Applicazione: durata terapia antidiabetica e rischio di eventi avversi

4. Cenni alla misclassificazione differenziale dello stato di esposizione

Page 52: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Argomenti della lezione4. Cenni alla misclassificazione

differenziale dello stato di esposizione

• Il bias dovuto alla misclassificazione differenziale è ancora più imprevedibile rispetto a quello associato alla misclassificazione differenziale (può essere sia conservativo che anti-conservativo).

• I metodi di Probabilistic Bias Analysis possono essere estesi anche al caso della misclassificazione differenziale (richiedono più informazioni rispetto i soli valori predittivi; c.f. referenza sotto).

La misclassificazione di E* come misura di E è differenziale (rispetto a Y) se

o equivalentemente

• Misclassificazione differenziale (rispetto l’outcome):

Pr 𝐸∗ = 𝑖 𝐸 = 𝑗, 𝑌 = 1 ≠ Pr 𝐸∗ = 𝑖 𝐸 = 𝑗, 𝑌 = 0 per dei qualche i, j=0, 1, 2, … K

Fox MP, Lash TL, Greenland S. A method to automate probabilistic sensitivity analyses of misclassified binary variables. Int J Epidemiol 2005; 34:1370-6

Page 53: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Argomenti della lezione4. Cenni alla misclassificazione

differenziale dello stato di esposizione

Page 54: La misclassificazione dello stato di esposizione: problema ......Farmacoepidemiologia Misclassificazione dell’esposizione Introduzione • Il problema della misclassificazione dello

Farmacoepidemiologia

Misclassificazione

dell’esposizione

Conclusioni

• L’impatto della misclassificazione di una variabile di esposizione categorica può essere complesso.

• Valutazione impatto della misclassificazione:Quantitativo > Euristico

• L’impiego di tecniche di Probabilistic Bias Analysis può essere di grande aiuto in questo contesto.