INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE...

24
1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona tempo ESPOSTI (D 1 ) NON ESPOSTI (D 0 ) 1. selezione di soggetti che non hanno l’outcome sulla base dello status di esposizione (D) 2. misurazione prospettica dell’occorrenza dell’outcome confronto degli esposti e dei non esposti rispetto alla distribuzione dell’outcome direzione dello studio momento dello studio OUTCOME OUTCOME DISEGNO DI COORTE

Transcript of INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE...

Page 1: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

1

INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA

Dott. Simone Accordini

Sezione di Epidemiologia & Statistica Medica

Università degli Studi di Verona

tempo

ESPOSTI (D1)

NON ESPOSTI (D0)

1. selezione di soggetti che non hanno l’outcome sulla base dello status di esposizione (D)

2. misurazione prospettica dell’occorrenza dell’outcome

���� confronto degli esposti e dei non esposti rispetto alla distribuzione dell’outcome

direzione dello studiomomento dello studio

OUTCOME

OUTCOME

DISEGNO DI COORTE

Page 2: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

2

• i soggetti possono entrare nello studio in momenti diversi

• alcuni soggetti vengono persi al follow-up

POICHE’ ...

• un soggetto è effettivamente a rischio solo fino a quando non sviluppa

la malattia

DISEGNO DI COORTE:

DATI COME PERSONE-TEMPO

PERSONE-TEMPO:

somma di tutti i tempi di osservazione dei soggetti a rischio

Esempio:

Persone-tempo = 3+2+4+4+3+2+2+6 = 26 persone-anno

Sviluppo della malattia1990

tempo

19961/1/1997 1/1/2003

Page 3: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

3

TASSO DI INCIDENZA (I): misura della velocità media di comparsa dei nuovieventi di malattia in una popolazione

1 -tempoPTr

I = PT = persone-tempo

r = numero di nuovi casi nel periodo tra t0 e t1

Tra t0 e t1:

PT = 26 persone-anno

numero di nuovi casi = 3

I = 3/26 persone-anno

= 0.115 casi per anno-1Sviluppo della malattia

1990

tempo

19961/1/1997 1/1/2003

Il tasso:

• è espresso come numero di casi per tempo-1

• viene generalmente moltiplicato per una costante di convenienza

(100; 1000; …)

) 1000(x 1151000*263 1−== anniI

115 casi ogni 1000 persone osservate per un anno

Page 4: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

4

• l’unità di tempo è arbitraria: il tasso può essere espresso in giorni-1, mesi-1,

anni-1, ...

)esi 1000(x 6.91000*312

3 1−== mmesi

I

9.6 casi ogni 1000 persone osservate per un mese

) 1000(x 1151000*26

3 1−== annianni

I

115 casi ogni 1000 persone osservate per un anno

Esempio:

In uno studio sulla relazione tra l’utilizzo di ormoni nella post-menopausa el’insorgenza di CHD, si sono evidenziati 90 nuovi casi tra 32317 donne in menopausa,per un periodo totale di follow-up di 105786 persone-anno.

1 x 0085.0105786

90 −== anniI

0.85 casi per 100 persone all’anno

oppure

8.5 casi per 1000 persone all’anno

oppure

85 casi per 10000 persone all’anno

Page 5: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

5

Esercizio:

Calcolate il tasso di incidenza sulla base dell’esperienza di malattia dei 14 soggetti tra l’1/1/1986 e l’1/1/1989 rappresentata nel seguente grafico.

������������������ ������� ������

OUTCOME DICOTOMICO

DATI COME PERSONE-TEMPO

num. di casi

r1r0

r

persone-tempo

PT1PT0

PT

Esposti (D1)Non Esposti (D0)

Totale

Page 6: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

6

Esempio:

Studio di coorte sulla relazione tra la somministrazione ripetuta di esami radiografici al torace e l’occorrenza del tumore al seno in donne con la tubercolosi (Boice & Monson. J Natl Cancer Inst 1977;59:823-32).

Radiazioni SI (D1)NO (D0)

Totale

Casi di tumore al seno

4115

56

Persone-anno

2801019017

47027

���� INFERENZA SU TASSI DI INCIDENZA

Esempio (continua):

Radiazioni SI (D1)NO (D0)

Totale

Casi di tumore al seno

4115

56

Persone-anno

2801019017

47027

I1 = 41 / 28010 persone-anno

= 0.00146 casi per persona-anno

= 146 casi per 100000 persone-anno

I0 = 15 / 19017 persone-anno

= 0.00079 casi per persona-anno

= 79 casi per 100000 persone-anno

Page 7: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

7

rischio relativo (RR) = I1 / I0

MISURA DELL’EFFETTO RELATIVO

RR > 1 l’esposizione è un fattore di rischio

RR < 1 l’esposizione è un fattore protettivo

RR = 1 l’esposizione non è un determinante

Esempio (continua):

Radiazioni SI (D1)NO (D0)

Totale

Casi di tumore al seno

4115

56

Persone-anno

2801019017

47027

RR = I1 / I0 = 1.86

Una malata di tubercolosi esposta a ripetuti esami radiografici al torace ha un rischio di sviluppare un tumore al seno superiore dell’86% del rischio per una malata di tubercolosi non esposta.

Page 8: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

8

DISEGNO DI COORTE:

ANALISI DELLA SOPRAVVIVENZA

• esposizione ad un potenziale determinante

• trattamento

‘survival time’(durata della sopravvivenza)

‘failure time’(tempo di insuccesso)

OUTCOME

tempo

EVENTO INIZIALEEVENTO CRITICO DI

INTERESSE (ENDPOINT)

SURVIVAL TIME

ENDPOINT:

• morte per qualsiasi causa ���� overall survival

• morte per causa specifica ���� survival

• progressione della malattia, mancata risposta, remissione parziale, recidiva locale e/o metastasi a distanza, grave tossicità, morte

���� event free survival

• ricorrenza della malattia (se in remissione all’inizio del follow-up)

���� disease free survival

EVENTO INIZIALE:

• studi clinici ���� diagnosi, randomizzazione, inizio trattamento

• studi epidemiologici ���� esposizione

Page 9: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

9

PERIODODI RECLUTAMENTO

PERIODO MINIMODI OSSERVAZIONE

WITHDRAWNALIVE

DROP-OUT

INIZIO DELLOSTUDIO

FINE DELRECLUTAMENTO

TEMPO DIENTRATA

TEMPO DI CALENDARIO TEMPO DI OSSERVAZIONE

PA

ZIE

NT

E

PA

ZIE

NT

E

FINE DELLOSTUDIO

1/1/1990 31/12/1993 31/12/1997 0

EVENTO

TEMPO MASSIMO DIOSSERVAZIONE

96 mesi

Censura informativa vs non informativa:

MECCANISMO DI CENSURA

DROP OUT INTERRUZIONE DELLA TERAPIA ASSEGNATA

FINE DELLO STUDIO

potenzialmente informativa

probabilmente non informativa

Page 10: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

10

CENSURA A DESTRA: sappiamo soltanto che il tempo di sopravvivenza supera

una certa durata

esempio: studio di mortalità per cancro (durata = 5 anni)

tempi di sopravvivenza censurati a destra per:

- pazienti vivi al termine dei 5 anni (withdrawn alive)

- pazienti persi durante il follow-up (drop out)

- pazienti morti per altre cause durante lo studio

CARATTERISTICHE DEI DATI DI SOPRAVVIVENZA:

coppia di variabili (T, δ) � T = tempo dall’entrata nello studio

1) T ≥ 0

2) T ha distribuzione con asimmetria positiva

� δ = indicatore di occorrenza dell’evento critico

(1 = evento osservato, 0 = tempo censurato)

Esempio (Freireich et al, 1963):

trial clinico multicentrico, 42 bambini con leucemia linfoblastica acuta in remissionecompleta, assegnazione randomizzata di 6-mercaptopurina o placebo, endpoint = ricorrenza della leucemia

Tempo di ricaduta perpazienti con placebo

(settimane)

Tempo di ricaduta perpazienti con 6-MP

(settimane)

1 61 62 62 6+3 74 9+4 105 10+5 11+8 138 168 17+8 19+11 20+11 2212 2312 25+15 32+17 32+22 34+23 35+

Page 11: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

11

T

censura (δδδδ=0)

δδδδ

evento (δδδδ=1)

DISTRIBUZIONE DEL TEMPO DI INSUCCESSO (T):

1. funzione distribuzione: F(t) = Prob(T≤≤≤≤ t)→→→→ probabilità che il tempo di insuccesso sia ≤≤≤≤ t

→→→→ F(0) = 0 e limt→∝→∝→∝→∝ F(t) = 1

2. funzione sopravvivenza: S(t) = 1 - F(t) = Prob(T > t)→→→→ probabilità di sopravvivenza al tempo t

→→→→ S(0) = 1 e limt→∝→∝→∝→∝ S(t) = 0

3. funzione rischio: λλλλ(t) = [dF(t)/dt] / S(t)→→→→ tasso istantaneo di insuccesso nell’intervallo infinitesimale (t,t+dt)

Page 12: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

12

OBIETTIVI DELL’ANALISI DELLA SOPRAVVIVENZA:

• stimare la distribuzione del tempo di insuccesso

• confrontare la sopravvivenza tra gruppi diversi di soggetti

• valutare l’effetto di differenti variabili (caratteristiche demografiche, cliniche, patologiche, fattori di rischio, trattamenti) sulla sopravvivenza

ASSUNZIONI DELL’ANALISI DELLA SOPRAVVIVENZA:

• indipendenza delle N osservazioni {{{{(ti,δδδδi), i=1,..,N}}}}

• censura non informativa ���� i soggetti ‘censurati’ hanno la stessaprobabilità d’insuccesso dei soggetti ‘non censurati’

1. STIMARE LA DISTRIBUZIONE DEL TEMPO DI INSUCCESSO:

MODELLI PARAMETRICI

• assumere una particolare forma funzionale per la distribuzione del tempo di insuccesso

• stimare i parametri della distribuzione

Page 13: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

13

DISTRIBUZIONE DI WEIBULL

λλλλ(t) = λγλγλγλγ (λλλλt)γγγγ-1 S(t) = exp[- (λλλλt)γγγγ]

0

1

2

3

4

5

0 1 2 3 4 5 6

λλλλ(t)

tempo

λλλλ = 1 γγγγ = 1.5

γγγγ = 1

γγγγ = 0.5

0

0,25

0,5

0,75

1

0 1 2 3 4 5 6

S(t)

tempo

DISTRIBUZIONE ESPONENZIALE

λλλλ(t) = λλλλ S(t) = exp(- λλλλt)

0

0,5

1

1,5

2

0 1 2 3 4 5 6

tempo

λλλλ(t)

λλλλ = 1

0

0,25

0,5

0,75

1

0 1 2 3 4 5 6

tempo

S(t)

1. STIMARE LA DISTRIBUZIONE DEL TEMPO DI INSUCCESSO:

METODO NON PARAMETRICO

• funzione sopravvivenza: S(t) = Prob(T > t)

→→→→ probabilità di sopravvivenza al tempo t

STIMATORE NON-PARAMETRICO DI S(t): KAPLAN-MEIER

assenza/scarsità di informazioni a priori sulla forma di S(t)

Page 14: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

14

STIMATORE NON-PARAMETRICO DI S(t): KAPLAN-MEIER (dati non censurati)

• N soggetti →→→→ k (≤≤≤≤ N) tempi di insuccesso ordinati: t(1), t(2), … , t(k)

• di = numero di eventi in t(i)

• ni = numero di soggetti a rischio in t(i)

d1

n1 = N

d2

n2 = n1 - d1 = N - d1

0 tempot(k)t(1) t(2) t(3)

d3

n3 = n2 - d2 = N - d1 - d2

prob. condizionale

sogg. a rischio: n2

sogg. a rischio: n3

S(0) = 1^

^

^S(t(k)) = Prob(T > t(k)) = (N - d1 - d2 - … - dk-1 - dk) / N

se N eventi ���� S(t(k)) = 0

S(t(3)) = Prob(T > t(3))

= Prob(T > t(1)) * Prob(T > t(2)T > t(1)) * Prob(T > t(3)T > t(2))

= [(N - d1 - d2) / N] * [(N - d1 - d2 - d3) / (N - d1 - d2)] = (N - d1 - d2 - d3) / N

S(t(2)) = Prob(T > t(2)) = Prob(T > t(1)) * Prob(T > t(2)T > t(1))

= [(N - d1) / N] * [(N - d1 - d2) / (N - d1)] = (N - d1 - d2) / N

S(t(1)) = Prob(T > t(1)) = (N - d1) / N

Page 15: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

15

Tempo(settimane)

No.eventi

No. soggettia rischio

Prob. condizionaledi remissione

Prob. cumulativa diremissione: S(t)

1 2 21 19/21 = 0.90476 0.9048

2 2 19 17/19 = 0.89474 0.9048 * 0.8947 = 0.8095

3 1 17 16/17 = 0.94118 0.8095 * 0.9412 = 0.7619

4 2 16 14/16 = 0.87500 0.7619 * 0.8750 = 0.6667

5 2 14 12/14 = 0.85714 0.6667 * 0.8571 = 0.5714

8 4 12 8/12 = 0.66667 0.5714 * 0.6667 = 0.3810

11 2 8 6/8 = 0.75000 0.3810 * 0.7500 = 0.2857

12 2 6 4/6 = 0.66667 0.2857 * 0.6667 = 0.1905

15 1 4 3/4 = 0.75000 0.1905 * 0.7500 = 0.1429

17 1 3 2/3 = 0.66667 0.1429 * 0.6667 = 0.0952

22 1 2 1/2 = 0.50000 0.0952 * 0.5000 = 0.0476

23 1 1 0/1 = 0.00000 0.0476 * 0.0000 = 0.0000

0

0,25

0,5

0,75

1

0 5 10 15 20 25 30 35

tempo (settimane)

S(t)^

Esempio:

gruppo con placebo

DATI NON CENSURATI

8

0.3810

5

0.5714

STIMATORE NON-PARAMETRICO DI S(t): KAPLAN-MEIER (dati censurati)

• N soggetti →→→→ k (≤≤≤≤ N) tempi di insuccesso ordinati: t(1), t(2), … , t(k)

• ci = numero di soggetti con censura tra t(i-1) e t(i)

• di = numero di eventi in t(i)

• ni = numero di soggetti a rischio in t(i)

tempo0

d1

n1 = N - c1

d2

n2 = n1 - d1 - c2

= N - c1 - d1 - c2

t(k)t(1) t(2) t(3)

d3

n3 = n2 - d2 - c3

= N - c1 - d1 - c2 - d2 - c3

nk = nk-1 - dk-1 - ck

dk

c1 c2 c3 ck

Page 16: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

16

S(0) = 1^

^

^

S(t(k)) = Prob(T > t(k)) = [(n1 - d1) / n1] * [(n2 - d2) / n2] * … * [(nk - dk) / nk]

se l’ultimo tempo osservato è di insuccesso ���� nk = dk ���� S(t(k)) = 0

^S(t(3)) = Prob(T > t(3))

= Prob(T > t(1)) * Prob(T > t(2)T > t(1)) * Prob(T > t(3)T > t(2))

= [(n1 - d1) / n1] * [(n2 - d2) / n2] * [(n3 - d3) / n3]

S(t(2)) = Prob(T > t(2)) = Prob(T > t(1)) * Prob(T > t(2)T > t(1))

= [(n1 - d1) / n1] * [(n2 - d2) / n2]

S(t(1)) = Prob(T > t(1)) = (n1 - d1) / n1

Esempio:

gruppo con 6-MP

0

0,25

0,5

0,75

1

0 5 10 15 20 25 30 35

S(t)^

tempo (settimane)

Tempo(settimane)

No. daticensurati

No.eventi

No. soggettia rischio

Prob. condizionaledi remissione

Prob. cumulativa diremissione: S(t)

6 1 3 21 18/21 = 0.85714 0.8571

7 1 17 16/17 = 0.94118 0.8571 * 0.9412 = 0.8067

9 1

10 1 1 15 14/15 = 0.93333 0.8067 * 0.9333 = 0.7529

11 1

13 1 12 11/12 = 0.91667 0.7529 * 0.9167 = 0.6902

16 1 11 10/11 = 0.90909 0.6902 * 0.9091 = 0.6275

17 1

19 1

20 1

22 1 7 6/7 = 0.85714 0.6275 * 0.8571 = 0.5378

23 1 6 5/6 = 0.83333 0.5378 * 0.8333 = 0.4482

25 1

32 2

34 1

35 1

Page 17: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

17

MODELLO PARAMETRICO VS STIMA NON PARAMETRICA

gruppo con placebo

gruppo con 6-MP

21

19

1716

14

12

8

6

43

21

0.00

0.25

0.50

0.75

1.00

0 5 10 15 20 25analysis time

Kaplan-Meier survival estimate

21

1716

13

11

10

6

5

0.00

0.25

0.50

0.75

1.00

0 10 20 30 40analysis time

Kaplan-Meier survival estimate

gruppo con placebo

gruppo con 6-MP

n°soggetti a rischio

n°soggetti a rischio all’inizio dell’intervallo di tempo

Page 18: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

18

VARIABILITA’ DELLE STIME DI KAPLAN-MEIER

• stime soggette a variazione casuale

• associare a ciascuna stima della probabilità cumulativa di sopravvivenza S(t) una misura di precisione →→→→ intervallo di confidenza (formula di Greenwood)

^

S(16) = 0.63 95%CI = [0.42, 0.79]^

0

0,25

0,5

0,75

1

0 5 10 15 20 25 30 35

tempo (settimane)

S(t)^

TEMPO DI SOPRAVVIVENZA MEDIANO

• tempo (t0.5) in corrispondenza del quale si ha S(t) = 0.5

• stima il tempo fino al quale il 50% dei soggetti è atteso sopravvivere

^

^

^• non è calcolabile se S(t) è sempre >0.5

• può essere molto inaccurato se S(t) non decresce rapidamente

t0.5 = 8 settimane 95%CI = [4,11]

Page 19: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

19

2. CONFRONTARE LA SOPRAVVIVENZA TRA GRUPPI DIVERSI DI SOGGETTI:

TEST DI MANTEL-HAENZEL (LOG-RANK TEST)

• confronto tra due (o più) gruppi

• permette di verificare il sistema di ipotesi

H0: λλλλ1(t) = λλλλ0(t)

H1: λλλλ1(t) = θθθθ λλλλ0(t) (rischi proporzionali)

se θθθθ < 1 ���� ‘migliore’ sopravvivenza nel gruppo esposto

se θθθθ > 1 ���� ‘migliore’ sopravvivenza nel gruppo non esposto

uguale sopravvivenza

RISCHI PROPORZIONALI

S(t)

RISCHI NON PROPORZIONALI

S(t)

• statistica test di Mantel-Haenzel:

{ ΣΣΣΣ [d1i - E(d1i)] }2

QM-H =ΣΣΣΣ VAR(d1i)

0.00

0.25

0.50

0.75

1.00

0 10 20 30 40analysis time

tratt = placebo tratt = 6-MP

Kaplan-Meier survival estimates, by tratt

QM-H = 16.8 p<0.001 ���� efficacia del farmaco 6-MP

numero di eventi attesi sotto H0nel gruppo esposto al tempo t(i)

numero di eventi osservati nel gruppo esposto al tempo t(i)

• sotto H0 (se è vera H0), QM-H ha distribuzione chi-quadrato con 1 grado di libertà

Page 20: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

20

3. ANALISI MULTIVARIATA MEDIANTE MODELLI DI REGRESSIONE

SCOPI:

• valutare l’effetto di più variabili sulla durata della sopravvivenza

• valutare l’interazione tra due o più variabili (i.e., modificazione di effetto)

• controllare il confondimento

→→→→ sbilanciamento di fattori rilevanti per la durata della sopravvivenza

nei gruppi di interesse

DATI DI SOPRAVVIVENZA:

• coppia di variabili (T, δδδδ)

• (X1, X2, … , Xr) = covariate

���� N osservazioni {{{{(ti,δδδδi,x1i,x2i, … ,xri), i=1,..,N}}}}

T δδδδ

placebo (X1=0)

6-MP (X1=1)

X1variabile dummy

Page 21: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

21

3. ANALISI MULTIVARIATA MEDIANTE MODELLI DI REGRESSIONE:

MODELLO DI COX (A RISCHI PROPORZIONALI)

funzione non esplicitata del tempo t uguale per tutti i soggetti

���� modello semi-parametrico

Xquantità che dipende dal valore delle covariate attraverso i coefficienti di regressione (ββββ1,ββββ2,..,ββββr), ma che nondipende dal tempo

ASSUNZIONI:

1. proporzionalità dei rischi

2. covariate costanti nel tempo

3. effetto moltiplicativo sul rischio di covariate indipendenti

λλλλ(t,xi) = λλλλ0(t) exp(ββββ1x1i + ββββ2x2i + .. + ββββrxri)

RISCHI PROPORZIONALI:

X1 = trattamento (0 = standard (A), 1 = sperimentale (B))

X2 = sesso (0 = femmina, 1 = maschio)

soggetto 1 (tratt. B, maschio) →→→→ (x11, x21) = (1,1)

λλλλ(t,x1) = λλλλ0(t) exp(ββββ1x11 + ββββ2x21) = λλλλ0(t) exp(ββββ1 + ββββ2)

soggetto 2 (tratt. A, maschio) →→→→ (x12, x22) = (0,1)

λλλλ(t,x2) = λλλλ0(t) exp(ββββ1x12 + ββββ2x22) = λλλλ0(t) exp(ββββ2)

Page 22: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

22

λλλλ(t,x1) λλλλ0(t) exp(ββββ1x11 + ββββ2x21)

λλλλ(t,x2) λλλλ0(t) exp(ββββ1x12 + ββββ2x22)=

= exp(ββββ1(x11 - x12) + ββββ2(x21 - x22))

= exp(ββββ1(1 - 0) + ββββ2(1 - 1))

= exp(ββββ1)non dipende da t

soggetto 3 (tratt. A, femmina) →→→→ (x13, x23) = (0,0)

λλλλ(t,0) = λλλλ0(t) exp(ββββ10 + ββββ20) = λλλλ0(t) exp(0) = λλλλ0(t)

funzione rischio ‘baseline’

ββββ1 > 0 ���� HR(B vs A) = exp(ββββ1) > 1 (‘peggiore’ sopravvivenza in B)

ββββ1 < 0 ���� 0 < HR(B vs A) = exp(ββββ1) < 1 (‘migliore’ sopravvivenza in B)

ββββ1 = 0 ���� HR(B vs A) = exp(ββββ1) = 1 (‘uguale’ sopravvivenza)

SIGNIFICATO DEI PARAMETRI:

Gruppo X1 λλλλ(t,x1) = λλλλ0(t) exp(ββββ1x1) lnλλλλ(t,x1) = lnλλλλ0(t) + ββββ1x1

A 0 λλλλ(t,0) = λλλλ0(t) lnλλλλ(t,0) = lnλλλλ0(t)

B 1 λλλλ(t,1) = λλλλ0(t) exp(ββββ1) lnλλλλ(t,1) = lnλλλλ0(t) + ββββ1

exp(ββββ1) = λλλλ(t,1) / λλλλ(t,0) ββββ1 = lnλλλλ (t,1) - lnλλλλ0(t)Hazard Ratio (HR)

ββββ1 < 0

Page 23: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

23

HR(B vs A) = exp(ββββ1)

= effetto del trattamento, al nettodell’effetto del sesso

HR(M vs F) = exp(ββββ2)

= effetto del sesso, al nettodell’effetto del trattamento

ββββ1 < 0ββββ2 > 0

Gruppo (X1,X2) λλλλ(t,x) = λλλλ0(t) exp(ββββ1x1 + ββββ2x2) lnλλλλ(t,x) = lnλλλλ0(t) + ββββ1x1 + ββββ2x2

A,F (0,0) λλλλ0(t) lnλλλλ0(t)

B,F (1,0) λλλλ0(t) exp(ββββ1) lnλλλλ0(t) + ββββ1

A,M (0,1) λλλλ0(t) exp(ββββ2) lnλλλλ0(t) + ββββ2

B,M (1,1) λλλλ0(t) exp(ββββ1 + ββββ2) = λλλλ0(t) exp(ββββ1) exp(ββββ2) lnλλλλ0(t) + ββββ1 + ββββ2

effetto moltiplicativoeffetto additivo

Esempio (Iacono et al, 2001):

studio clinico osservazionale, 25 pazienti con adenocarcinoma duttale pancreatico in R0, confronto tra pancreaticoduodenectomia standard (SPD) ed estesa (EPD)

Evento iniziale: trattamento (intervento chirurgico)

Endpoint: morte

HR Std. Err. P-value [95% Conf. Interval]

Treatment(SPD vs EPD) 4.82 2.62 0.004 1.66-14.00

Grading of tumor differentiation(poor vs moderate) 4.33 2.36 0.007 1.49-12.61

Type of resection(pylorus-preserving vs hemigastrectomy) 1.49 0.74 0.422 0.56-3.95

H0: ββββ = 0

H1: ββββ ≠≠≠≠ 0

H0: exp(ββββ) = 1

H1: exp(ββββ) ≠≠≠≠ 1

Page 24: INTRODUZIONE ALL’ANALISI DEI DATI DI …biometria.univr.it/sesm/files/teoria.pdf1 INTRODUZIONE ALL’ANALISI DEI DATI DI SOPRAVVIVENZA Dott. Simone Accordini Sezione di Epidemiologia

24

3. ANALISI MULTIVARIATA MEDIANTE MODELLI DI REGRESSIONE:

MODELLI PARAMETRICI (A RISCHI PROPORZIONALI)

funzione esplicitata del tempo t uguale per tutti i soggetti

WEIBULL: λλλλ0(t) = λγλγλγλγ (λλλλt)γγγγ-1

00,250,5

0,751

1,251,5

1,752

0 1 2 3 4 5 6

ESPONENZIALE: λλλλ0(t) = λλλλ

tempo

λλλλ0(t) = 1

λλλλ0(t)*exp(ββββ)

0

1

2

3

4

5

6

0 1 2 3 4 5 6

λλλλ0(t) = 1.5 t0.5

λλλλ0(t)*exp(ββββ)

HR = 1.5

tempo

λλλλ = 1 γγγγ = 1.5

λλλλ = 1

λλλλ(t,xi) = λλλλ0(t) exp(ββββ1x1i + ββββ2x2i + .. + ββββrxri)