Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della...

21
Analisi della sopravvivenza Grazia Vurro Anno Accademico 2010-2011 Indice 1 Introduzione 1 2 Sperimentazione clinica 2 3 Importanza di un’analisi time-to-event 3 4 Stima della funzione di sopravvivenza 6 4.1 Metodo di Kaplan-Meier ..................... 7 4.2 Fondamenti teorici del metodo di Kaplan-Meier ........ 11 5 Confronto tra due curve di sopravvivenza 15 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza pu`o essere interpretata come caso particolare dell’analisidell’affidabilit`a. Ricordiamo alcuni concetti chiave della teoria 1

Transcript of Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della...

Page 1: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

Analisi della sopravvivenza

Grazia Vurro

Anno Accademico 2010-2011

Indice

1 Introduzione 1

2 Sperimentazione clinica 2

3 Importanza di un’analisi time-to-event 3

4 Stima della funzione di sopravvivenza 6

4.1 Metodo di Kaplan-Meier . . . . . . . . . . . . . . . . . . . . . 7

4.2 Fondamenti teorici del metodo di Kaplan-Meier . . . . . . . . 11

5 Confronto tra due curve di sopravvivenza 15

6 Software statistico: SPSS 19

1 Introduzione

L’analisi della sopravvivenza puo essere interpretata come caso particolare

dell’analisi dell’affidabilita. Ricordiamo alcuni concetti chiave della teoria

1

Page 2: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

1 INTRODUZIONE

dell’affidabilita.

Collasso. Si definisce collasso del componente o del sistema lo stato in cui

esso cessa di funzionare.

Tempo necessario al collasso. Se un componente e messo in condizioni

di stress in un istante temporele t = 0 e viene osservato fino a quando

collassa, la durata della vita o il tempo necessario al collasso e una

variabile aleatoria indicata generalmente con T.

Guasto. Si definisce guasto la cessazione di un dispositivo ad adempiere

la funzione richiesta (guasto totale) oppure la variazione della sua

prestazione (guasto parziale).

Nell’analisi della sopravvivenza in sistema preso in considerazione e il paziente

e il guasto e rappresentato dal cosiddetto evento avverso indicato general-

mente con la sigla AE ( adverse event).

Evento avverso. Per evento avverso si intende ogni evento di interesse

per l’indagine clinica come la morte di un paziente, l’insorgere di effetti

collaterali dovuti all’assunzione di nuovi farmaci, la guarigione da una

determinata malattia oggetto di studio.

E’ chiaro, quindi, fin da subito che l’analisi della sopravvivenza non ha come

unico oggetto lo studio dell’evento morte, ma ogni evento di interesse. Per

usare termini anglosassoni diremo che la survival analysis rientra tra le time-

to-event analysis. In altri termini, l’analisi della sopravvivenza si occupa

dell’analisi dell’incidenza di un determinato evento in un determinato arco

temporale intendendosi con incidenza il numero dei pazienti che sviluppano

l’evento.

2

Page 3: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

3 IMPORTANZA DI UN’ANALISI TIME-TO-EVENT

2 Sperimentazione clinica

Per apprezzarne al meglio le sue potenzialita, prima di iniziare la costruzione

formale dell’analisi della sopravvivenza sarebbe utile capire il contesto medi-

co nel quale si applica . Supponiamo che un gruppo di ricercatori un’azienda

farmaceutica sintetizzi un nuovo farmaco per la cura di certa malattia. La

fase nella quale praticamente si testa la sua efficacia e chiamata sperimen-

tazione clinica o clinical trial. La sperimentazione clinica consta di quattro

fasi , in ognuna delle quali la statistica gioca un importante ruolo.

Fase 1: Farmacologia clinica e tossicita che ha come obiettivo l’accer-

tamento della tollerabilita e la determinazione di un dosaggio accetta-

bile del farmaco.

Fase 2: Indagine clinica iniziale dell’effetto del trattamento in cui si

testa il farmaco su in campione ridotto per valutarne l’efficacia.

Fase 3: Valutazione del trattamento su larga scala considerata la fase

piu importante e spesso identificata con il termine ricerca clinica, in cui

si testa il farmaco su campioni piu ampi, confrontandolo spesso con altri

trattamenti esistenti.

Fase 4: Farmacovigilanza in cui si valutano gli effetti collaterali a lungo

termine del farmaco e gli effetti dello stesso sulla mortalita.

3 Importanza di un’analisi time-to-event

. Mettere in relazione l’AE con il tempo e di fondamentale importanza, cosı

come mostra il seguente esempio.

3

Page 4: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

3 IMPORTANZA DI UN’ANALISI TIME-TO-EVENT

Supponiamo che un’azienda farmaceutica sia nella fase 3 o 4 della sperimen-

tazione clinica di un nuovo farmaco che dovrebbe favorire la guarigine da

una certa malattia, cioe ridurre il tempo di attesa necessario ad osservare

l’evento guarigione. Supponiamo che il campione di pazienti sia costituito da

20 unita e supponiamo di suddividerli in due gruppi omogenei ciascuno con

10 unita:

gruppo attivo al quale verra somministrato il nuovo farmaco;

gruppo placebo al quale verra somministrato placebo ovvero qualsiasi sostan-

za o terapia innocua somministrata al paziente facendogli credere che

sia un trattamento necessario.

Supponiamo di aver osservato i seguenti dati:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Active

Pla

ce

bo

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20 x

o

x

x

x

x

x

x

x

x

x

o

o

o

o

o

o

o

o

o

g

Id Paziente

Figura 1: Esempio

4

Page 5: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

3 IMPORTANZA DI UN’ANALISI TIME-TO-EVENT

In questo diagramma si e rappresentato sull’asse delle ascisse i tempi di

risposta, ovvero l’intervallo di tempo tra l’inizio dello studio, giorno 0, e il

verificarsi dell’ EA e sull’asse delle ordinate i pazienti oggetto dello studio

individuabili da un codice identificativo. Il verificarsi dell’ AE e indicato con

×, mentre i pazienti che alla fine dello studio non hanno verificato l’AE sono

contrassegnati da ◦.La domanda che ci poniamo e se in virtu di questi dati osservati possiamo

affermare che effettivamente il farmaco sia efficace. Operando un semplice

confronto tra i gruppi sulla base dei pazienti con evento, dovremmo dire

che, poiche in entrambi i gruppi i pazienti con AE sono 5 su 10, ovvero il

50%, e considerando per questa proporzione un intervallo di confidenza al

95%, non esiste una significativa differenza tra i due gruppi. Questo modo di

operare pecca palesemente di superficialita, perche se osserviamo i pazienti

con AE nei due gruppi e li mettiamo in relazione con i rispettivi tempi di

risposta riscontriamo che nel gruppo attivo l’evento avviene nei primi giorni

dello studio mentre nel gruppo placebo il verificarsi dell’AE e distribuito

uniformemente nella durata dello studio.

Id Paziente Gruppo Placebo Tempi di risposta

2 4

8 9

5 11

3 14

6 18

5

Page 6: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

3 IMPORTANZA DI UN’ANALISI TIME-TO-EVENT

Id Paziente Gruppo Attivo Tempi di risposta

20 1

11 2

15 4

17 5

14 6

Questo fa pensare ad una relazione nel gruppo attivo tra il verificarsi

dell’evento e il nuovo farmaco , relazione che il semplice confronto delle pro-

porzioni dell’AE non mette in risalto. Inoltre, se si pensa che se lo studio

fosse durato piu a lungo probabilmente altri pazienti avrebbero verificato

l’AE, si capisce l’estrema importanza di relazionare l’AE al tempo. Esiste

altresı un’ulteriore problematica che questo metodo non risolverebbe, ovvero

l’esistenza nella pratica di numerosi dati troncati o censurati. Infatti ac-

cade spesso che pazienti escano dallo studio (persi al follow-up )prima del

suo termine e prima che sviluppino l’AE. Per esempio, potremmo essere nella

seguente situazione:

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

Active

Pla

ce

bo

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20 x

o

x

x

x

x

x

x

x

x

x

o

o

o

o

o

o

o

x

x

g

Id Paziente

6

Page 7: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA

in cui i pazienti con ◦ in corrispondenza di un tempo minore della durata

dello studio sono quelli persi al follow-up. Dovremmo escludere dalle nostre

considerazioni tali pazienti , ma in effetti la loro presenza nello studio fino

alla data di uscita fornisce comunque un’informazione utile di cui bisogna

tener conto. L’analisi della sopravvivenza supera tutti questi limiti.

4 Stima della funzione di sopravvivenza

Sia T la variabile aleatoria che rappresenta i tempi di risposta. Sia F (t) :=

P (T ≤ t) la funzione di ripartizione che rappresenta la probabilita che l’AE si

verifichi in un intervallo di tempo minore o uguale a t. Sia S(t) := 1−F (t) =

P (T > t) la funzione di sopravvivenza ovvero la probabilita che l’ AE si ver-

ifichi dopo t.

La stima della funzione di sopravvivenza puo avvenire sia con metodi para-

metrici che con metodi non parametrici. E’ chiaro che se non si conosce

a priori la distribuzione teorica di T bisogna necessariamente ricorrere a

metodi non parametrici. Accade spesso in campo medico di non conoscere

la distribuzione di T ed e per questo che molto diffusi sono i metodi non

parametrici. Qui illustreremo il metodo di Kaplan-Meier per la stima della

funzione di sopravvivenza rientrante tre i metodi non parametrici.

Lo illustreremo prima in pratica senza formalismi e poi in teoria, mostran-

do come esso derivi da una particolare applicazione del metodo di massima

verosimiglianza.

7

Page 8: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA

4.1 Metodo di Kaplan-Meier

Sia N il numero dei soggetti ammessi allo studio e sia J il numero dei tempi

distinti di risposta ( J ≤ N) rilevati nel campione ed ordinati in modo cres-

cente: t1 ≤ t2 ≤ · · · ≤ tJ .

Sia dj il numero di soggetti che presentano l’evento al tempo tj. ( Ovvi-

amente dj > 1 solamente nel caso in cui piu soggetti presentano tempi di

risposta uguali.)

Sia nj il numero di soggetti esposti al rischio al tempo tj e cioe tutti quei

soggetti vivi e sotto osservazione appena prima di tj .

Se non vi sono evidenti ragioni contrarie, si assume che l’esperienza di vita

dei soggetti persi di vista o che terminano lo studio senza evento sia la stessa

di coloro che verificano l’ evento durante lo studio, dunque essi sono inclusi

nell’insieme degli esposti a rischio sino a che sono sotto osservazione. Si noti

che le quantita dj e nj sono definite soltanto in corrispondenza dei tempi di

risposta e non anche dei tempi troncati.

Una stima della probabilita condizionata di morire all’istante tj, che indicher-

emo con qj, e data da:

qj =dj

nj

j = 1, 2, · · ·, J

e quindi la probabilita condizionata di sopravvivere all’istante tj, che in-

dicheremo con pj, e stimata da:

pj = 1− qj =nj − dj

nj

j = 1, 2, · · ·, J.

Il prodotto delle stime delle probabilita pj ci fornisce la stima della probabilita

cumulativa di sopravvivere ad un istante fissato sapendo che si e vissuti

fino all’istante precedente. Indicando con Pj la probabilita di sopravvivere

8

Page 9: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA

all’istante tj e a ciascuno degli istanti precedenti a tj, avremo che:

Pj = p1 · p2 · · · pj,

da cui si ottiene la seguente formula di ricorrenza:

Pj = Pj−1 · pj.

Si assume che P0 = p0 = 1, intendendo con cio che la probabilita di sopravvi-

vere oltre l’istante di inizio studio e fino al primo tempo di risposta osservato

sia pari ad 1. Osserviamo che in ognuno dei punti tj dell’asse dei tempi la

curva di sopravvivenza varia di un fattore pari anj−dj

nj, anzi piu precisamente

tale variazione avviene appena prima tj ovvero la curva di sopravvivenza e

una funzione a gradini, che in corrispondenza dei tempi di risposta presenta

punti di discontinuita (essendo continua in tali punti solo da destra).

In accordo con Greenwood (1926), la varianza di Pj sara:

V ar(Pj) = Pj

2j∑

h=1

qh

nhph

= Pj

2j∑

h=1

dh

nh(nh − dh).

Assumendo che la statistica Pj sia distribuita approssimativamente in modo

gaussiano , l’intervallo di confidenza con coefficiente di confidenza 1−α sara:

Pj ± z1−α2

√V ar(Pj).

Torniamo all’esempio 2 e riassumiamo nella seguente tabella i calcoli relativi

alla probabilita di sopravvivenza:

9

Page 10: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA

Id Paz Gruppo Placebo ti ni di qi pi Pi

2 4 10 1 110

0.9 0.9

8 9 9 1 19

0.89 0.8

5 11 8 1 18

0.88 0.70

3 14 7 1 17

0.86 0.60

7 15∗ - - - - -

9 17 5 1 15

0.8 0.48

6 18 4 1 14

0.75 0.36

1 19∗ - - - - -

4 20∗ - - - - -

10 20∗ - - - - -

Id Paz Gruppo Attivo ti ni di qi pi Pi

20 1 10 1 110

0.9 0.9

11 2 9 1 19

0.89 0.8

12 4∗ - - - - -

15 4 7 1 17

0.86 0.69

17 5 6 1 16

0.83 0.57

14 6 5 1 15

0.80 0.46

19 9 4 1 14

0.75 0.34

16 10∗ - - - - -

13 20∗ - - - - -

18 20∗ - - - - -

Possiamo ora rappresentare la curva di sopravvivenza :

10

Page 11: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20

t i

0,60

0,69

0,8

0,9

1

0,57

0,46

0,34

0,8

0,9

0,48

0,36

S (t )i

0,70

0

Gruppo attivo

Gruppo placebo

Funzione di Sopravvivenza

Figura 2: Curva di sopravvivenza

4.2 Fondamenti teorici del metodo di Kaplan-Meier

Sia T la variabile casuale tempo di sopravvivenza. Si consideri una popo-

lazione omogenea in cui la v.c. T sia discreta e supponiamo che i valori che

essa assume siano: t1 ≤ t2 ≤ · · ·. La funzione di probabilita, la funzione di

distribuzione e la funzione di sopravvivenza sono rispettivamente:

f(tj) = Pr(T = t) F (tj) = Pr(T ≤ tj) S(tj) = Pr(T > tj).

La stima non parametrica della funzione di sopravvivenza fu motivata da

Kaplan e Meier nell’articolo del 1958 con un uso particolare del metodo della

11

Page 12: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA

massima verosimiglianza. Essi costruirono la funzione di verosimiglianza sen-

za riferirsi ad una specifica classe di funzioni di distribuzioni, ma sfruttando

solamente le proprieta di una generica funzione di sopravvivenza.

E’ necessario fare alcune precisazioni: una riguardante la continuita della

funzione e l’altra sulla notazione per i tempi troncati.

• La funzione di sopravvivenza e una funzione continua solo a destra nei

punti tj, ovvero

P (tj) 6= P (tj − 0) con P (tj − 0) = limx→0

P (tj − x)

e poiche la P (t) varia solo in corrispondenza dei valori tj, si ha che :

P (tj − 0) = P (tj−1).

• Poiche P (tj) esclude, mentre P (tj−0) include la probabilita che T = tj,

per ottenerla ne faremo la differenza ( ci servira per costruire la L)

• Sia cj il numero dei soggetti che in quanto persi di vista o terminato lo

studio senza l’AE forniscono tempi di osservazione troncati nell’inter-

vallo [tj, tj+1), dunque t∗i,j ∈ [tj, tj+1) con i = 1, 2, ..., cj e j = 0, 1, ..., J

e il generico tempo troncato che cade in detto intervallo. In particolare,

definiti t0 = 0 e tJ+1 = ∞, i tempi troncati rilevati prima di t1 sono

appartenenti all’intervallo [0, t1), mentre quelli rilevati dopo tJ saranno

appartenenti a [tJ ,∞).

Costruiamo la funzione di verosimiglianza , ricordandone la definizione.

Sia (X1, X2, ..., Xn) un campione casuale di v.c. i.i.d. con legge fϑ(x). In-

dichiamo con (x1, x2, ..., xn) il valore dell’osservazione. Chiamiamo funzione

12

Page 13: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA

di verosimiglianza la funzione

Lϑ(x1, x2, ..., xn) = fϑ(x1, x2, ..., xn) =n∏

i=1

fϑ(xi).

La funzione di verosimiglianza potra scriversi come il prodotto dei seguenti

fattori:c0∏

i=1

P (t∗i,0)

[P (t1 − 0)− P (t1)]d1 ·

c1∏i=1

P (t∗i,1)

...

[P (tJ − 0)− P (tJ)]dJ ·cJ∏i=1

P (t∗i,J)

Riscriviamo la L considerando che: P (tj − 0) = P (tj−1).

[P (tj − 0)− P (tj)]dj = [P (tj−1)− P (tj)]

dj

Obiettivo e determinare quei valori che massimizzano la funzione. Os-

serviamo che per rendere massima la funzione a P (t∗i,j)) deve essere associato

il valore piu grande possibile e lo si puo fare assegnandoli la probabilita di

sopravvivere oltre l’estremo inferiore dell’intervallo in cui il tempo troncato

si e verificato, cioe:

t∗i,j ∈ [tj, tj+1) → P (t∗i,j) = P (tj)

13

Page 14: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

4 STIMA DELLA FUNZIONE DI SOPRAVVIVENZA

Dunque avremo:

c0∏i=1

P (t∗i,0) = P (t0)c0 = 1

c1∏i=1

P (t∗i,1) = P (t1)c1

...

cJ∏i=1

P (t∗i,J) = P (tJ)cJ

La funzione di verosimiglianza diventa:

L =J∏

j=1

[P (tj+1)− P (tj)]djP (tj)

cj

Ricordando che:

P (tj) = p1 · p2 · ... · pj−1 · pj

P (tj−1) = p1 · p2 · ... · pj−1

avremo che:

P (tj−1)− P (tj) = (p1 · p2 · ... · pj−1)(1− pj)

Possiamo riscrivere L come :

L =J∏

j=1

(p1 · p2 · ... · pj−1 qj)dj(p1 · p2 · ... · pj)

cj =

J∏j=1

(p1 · p2 · ... · pj−1)dj+cj (1− pj)

cj qdj

j =

J∏j=1

(p1 · p2 · ... · pj−1)dj+cj q

dj+cj

j =

J∏j=1

pnj−dj

j qdj

j

14

Page 15: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

5 CONFRONTO TRA DUE CURVE DI SOPRAVVIVENZA

Osserviamo che pe ogni j fissato pnj−dj

j qdj

j rappresenta la probabilita di

ottenere una sequenza di dj successi con probabilita qj ed nj − dj insuccessi

con probabilita pj (v.c. binomiale) che risulta massima quando :

q =dj

nj

5 Confronto tra due curve di sopravvivenza

L’interesse di un ricercatore clinico non e solo rivolto alla stima della proba-

bilita cumulativa di sopravvivenza, ma anche al confronto dell’esperienza di

vita di due insiemi di soggetti sottoposti a differenti trattamenti. Purtrop-

po, in campo bio-medico e estremamente difficile avere a priori conoscenze

sufficienti per ipotizzare la forma delle sottostanti funzioni teoriche di so-

pravvivenza ( per esempio esponenziale, di Weibull, etc), pertanto anche per

il confronto di curve di sopravvivenza e spesso necessario far ricorso a metodi

non parametrici.

Qui illustreremo il metodo noto come Log-rank test proposto da Mantel nel

1966. Il fondamento logico di questo test e facilmente comprensibile a livello

intuitivo e cio giustifica il suo ampio uso nella ricerca clinica.

Sia N il numero di pazienti sotto osservazione.Si supponga di aver attribuito

con una procedura casuale (randomizzazione) la meta dei pazienti al tratta-

mento A e l’altra meta al trattamento B. Sotto l’ipotesi che i due trattamenti

abbiano la stessa efficacia, ci si attende che il numero di pazienti con AE in

un determinato giorno sia circa lo stesso in entrambi i gruppi, ma in realta

puo capitare che questo numero sia differente in ciascun gruppo, ossia che vi

sia uno scostamento tra eventi attesi ed eventi osservati. L’eventuale scosta-

mento tra queste quantita farebbe pensare alla possibilita che un trattamento

15

Page 16: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

5 CONFRONTO TRA DUE CURVE DI SOPRAVVIVENZA

sia piu efficace o meno dell’altro ed il ricorso al pertinente test, statistico con-

sente di determinare il livello di significativita di tale scostamento.

L’ipotesi attinente l’efficacia dei due trattamenti si esprime usualmente in

termini di rischio istantaneo di morte intendendo con cio quello che avevamo

precedentemente indicato con q.

Indicando con H0 l’ipotesi nulla e con H1 l’ipotesi alternativa si ha:

H0 : qA(t) = qB(t) ⇔ H0 : ϑ = 1

H1 : qA(t) = ϑqB(t) ⇔ H1 : ϑ 6= 1

dove ϑ e l’incognita costante di proporzionalita. Quando ϑ < 1 il trattamento

A e piu efficace di quello B, e vero il contrario quando ϑ > 1.

Le informazioni si possono riassumere nella seguente tabella di contingenza

2× 2:

Gruppi Paz. con AE a tj Paz. senza AE a tj Paz. a rischio prima di tj

A dAj nAj − dAj nAj

B dBj nBj − dBj nBj

Totali dj nj − dj nj

Benche dAj, dBj, nAj, nBj siano v.c. dipendenti dalla esperienza precedente

di sopravvivenza e dal processo di troncamento, il test di significativita puo

essere costruito solo considerandole fisse ad ogni tempo tj, cio comporta che

solo una di queste puo essere costruita condizionatamente ai volori marginali

osservati, generalmente si considera dAj e si dimostra che essa e una v.c.

ipergeometrica. Essendo una v.c. ipergeometrica, sotto H0, il valore atteso

E(dAj) di dAj e:

E(dAj) = nAjdj

nj

16

Page 17: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

5 CONFRONTO TRA DUE CURVE DI SOPRAVVIVENZA

e la sua varianza:

V ar(dAj) =[nAj

dj

nj

(1− dj

nj

)](nj − nAj

nj − 1

).

Osserviamo che la varianza e data dal prodotto di due termini: la parentesi

quadra che e la varianza di una v.c. binomiale e la parentesi tonda che e il

fattore di correzione per il campionamento da un insieme di dimensione nj.

La v.c.∑J

j=1

[dAj − E(dAj)

]e distribuita in modo gaussiano e la statistica:

Q =

∑Jj=1

[dAj − E(dAj)

]2

∑Jj=1 V ar(dAj)

e distribuita asintoticamente come una χ2 con un grado di liberta.

Applichiamo ora questo test all’esempio precedente per valutare l’efficienza

del trattamento somministrato al gruppo attivo rispetto a quello placebo.

Consideriamo le dieci tabelle di contingenza, una per ogni tempo di rispos-

ta. In riferimento ad ognuna di queste dobbiamo calcolare E(dP i) e V ar(dP i),

dove dP i indica il numero di pazienti del gruppo placebo con evento all’is-

tante ti.

t1 = 1 d n-d n

Placebo 0 10 10

Attivo 1 9 10

TOT 1 19 20

⇒ E(dP1) = 12

V ar(dP1) = 14

t2 = 2 d n-d n

Placebo 0 10 10

Attivo 1 8 9

TOT 1 18 19

⇒ E(dP2) = 1019

V ar(dP2) = 90361

17

Page 18: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

5 CONFRONTO TRA DUE CURVE DI SOPRAVVIVENZA

t3 = 4 d n-d n

Placebo 1 9 10

Attivo 1 7 8

TOT 2 16 18

⇒ E(dP3) = 109

V ar(dP3) = 6401377

t4 = 5 d n-d n

Placebo 0 9 9

Attivo 1 5 6

TOT 1 14 15

⇒ E(dP4) = 915

V ar(dP4) = 625

t5 = 6 d n-d n

Placebo 0 9 9

Attivo 1 4 5

TOT 1 13 14

⇒ E(dP5) = 914

V ar(dP5) = 45196

t6 = 9 d n-d n

Placebo 1 8 9

Attivo 1 3 4

TOT 2 11 13

⇒ E(dP6) = 1813

V ar(dP6) = 66169

t7 = 11 d n-d n

Placebo 1 7 8

Attivo 0 2 2

TOT 1 9 10

⇒ E(dP7) = 45

V ar(dP7) = 425

t8 = 14 d n-d n

Placebo 1 6 7

Attivo 0 2 2

TOT 1 8 9

⇒ E(dP8) = 79

V ar(dP8) = 1481

18

Page 19: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

6 SOFTWARE STATISTICO: SPSS

t9 = 17 d n-d n

Placebo 1 4 5

Attivo 0 2 2

TOT 1 6 7

⇒ E(dP9) = 57

V ar(dP9) = 57

t10 = 18 d n-d n

Placebo 1 3 4

Attivo 0 2 2

TOT 1 5 6

⇒ E(dP10) = 23

V ar(dP10) = 29

Calcolando il quadrato della somma gli scostamenti del valore osservato

dal valore atteso e la somma delle varianze ricaviamo la statisticaa test:

Q = 2,972,58

= 1, 15. Poiche Q < 3.841 ( valore della v.c. chi-quadrato con

un grado di liberta in corrispondenza di α = 0.05), l’ipotesi nulla non puo

essere rigettata e dunque le differenze osservate nei due gruppi non sono

significative.

6 Software statistico: SPSS

Esistono numerosi software statistici che permettono di condurre un’analisi

della sopravvivenza tra cui SPSS.

Il programma necessita di tre variabili: i tempi di risposta di tutti i pazienti

( non necessariamente ordinati) , l’indicazione dei dati troncati, l’indicazione

del gruppoo di appartenenza del paziente. L’output della procedura di anal-

isi mostra una tabella riepilogativa riguardante la stima delle probabilita di

sopravvivenza , l’esito del log-rank test e il plot della funzione di sopravviven-

za. Abbiamo utilizzato il software per testare i dati dell’esempio precedente.

Il risultato e il seguente:

19

Page 20: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

6 SOFTWARE STATISTICO: SPSS

Case Processing Summary

Censored

Gruppo Total N N of Events N Percent

0 10 6 4 40,0%

1 10 6 4 40,0%

Overall 20 12 8 40,0%

Estimate Std. Error

1 4,000 1 0,900 0,095 1 9

2 9,000 1 0,800 0,126 2 8

3 11,000 1 0,700 0,145 3 7

4 14,000 1 0,600 0,155 4 6

5 15,000 0 . . 4 5

6 17,000 1 0,480 0,164 5 4

7 18,000 1 0,360 0,161 6 3

8 19,000 0 . . 6 2

9 20,000 0 . . 6 1

10 20,000 0 . . 6 0

1 1,000 1 0,900 0,095 1 9

2 2,000 1 0,800 0,126 2 8

3 4,000 1 0,700 0,145 3 7

4 4,000 0 . . 3 6

5 5,000 1 0,583 0,161 4 5

6 6,000 1 0,467 0,166 5 4

7 9,000 1 0,350 0,160 6 3

8 10,000 0 . . 6 2

9 20,000 0 . . 6 1

10 20,000 0 . . 6 0

0

1

Survival Table

Gruppo Time Status

Cumulative Proportion Surviving at the Time N of Cumulative

Events

N of Remaining

Cases

Chi-Square df Sig.

Log Rank (Mantel-Cox) 1,150 1 0,284

Overall Comparisons

Test of equality of survival distributions for the different levels of Gruppo.

Kaplan-Meier

20

Page 21: Analisi della sopravvivenzaold · 6 Software statistico: SPSS 19 1 Introduzione L’analisi della sopravvivenza puµo essere interpretata come caso particolare dell’analisi dell’a–dabilitµa.

6 SOFTWARE STATISTICO: SPSS

21