LEZIONI DI STATISTICA MEDICA - biometria.univr.itbiometria.univr.it/sesm/files/STA_11_MED.pdf ·...

Post on 21-Jun-2020

8 views 0 download

Transcript of LEZIONI DI STATISTICA MEDICA - biometria.univr.itbiometria.univr.it/sesm/files/STA_11_MED.pdf ·...

LEZIONI DI STATISTICA MEDICA

������������������� �����������������������

���������� �� ������������������

������� ����

� �������������

�������

�������

��� �� �������� ���

��������������������� ����������������������������� � �����������������������������

� ������������ ��������������������������������������������������������������������������������������� �������������������������������������������������������������� ��������

������������������������������ ������ ������ ������ ����

�������������������������������������������������

��������������������������������������������������������������������������������������������������������������������������

��������������������������������������������������� ���������������������������������

����������

�������������������������������������������������������������������������������������������������������������������������������������������������������������������

������������������������������������������������������������������������ ������������������!������ ��������������������������������������������"""��#����������������������������������������������������

���������

$������������ �����������!�������������%

���� &'� �( ��)* � &'��� ���������������������������������������������������������� �����������������������������

+ ��������������������������������������������������������������������������������������� ������������������������������������������������ �������%�������

,������������� ���������������������������������������������������

���������������������������������������������������������

-������������� �����������������������������������������

�����������������������������������������������������������

.������������� ����������������������������

/ �������������%

,� �����������������������������������������������!�������������������������������������������������������������������������������0��������� �����1

-�$���������������������������������������������������2�������������������� ��������������3��4�������� ������!�����������������������������%

2 3���������������

3 2�������������

3 2��������������������������

3 2

�� � ���� � ��� �� ��� � �� ����� � �

)5* 3$&6 2�( &7�'�* / 2$&

�/ ( 28 �/ & �* �&')&5�6 &/ � *

5�'9 $�2� �

: ��������������������������2�������������������������������������������������������3;

: ����������������������������������������������������������������������� �����������������������

: ������������������������������������������������������������������������������ �

BA xx >

I risultati del trial ci permettono di decidere quale dei farmaci è più efficace, sapendo che la differenza osservata può essere dovuta semplicemente all’errore (var individuale + var. campionaria+errore di misura)?

La differenza osservata sperimentalmente è dovuta al caso o a fattori sistematici (tra cui il trattamento)?

Riformulazione del problema:

La differenza osservata è dovuta esclusivamente al caso (H0) !!

formulazione dell’ipotesi da verificare (ipotesi nulla)

Qual è la probabilità di ottenere una differenza come (o maggiore di ) quella osservata per soli motivi casuali;�

Misura del grado di attendibilità dell’ipotesi con i risultati sperimentali

Se la probabilità è piccola (p<0.05) si rifiuta l’ipotesi nulla e si dice che la differenza è significativa, altrimenti non si rifiuta H0

Test d’ipotesi

}|)({ 0HxxDP BA −≥

Criterio di decisione

'��� ���������������������������������������������������������������������������������������������������������������������������� ���.<�.��������������=�>.�.�

9 ������������������,??������������������������������������������� �� ���� ������� ���������� 2��� ����� ����� ��������������� ��������� ������ ��� ������������ ���� ������ ������ ��� �������� �������������>@�A������

�������

�� ��������� �� ������� ������ ������

������µµµµ��.<�.�����

$���������� ���� ���������������������������������������������������������������

�� ��� �!"� �#$%��&x

2��B? C ������������

��'��������(�)��

��������������������������������������������������������

$�������������������������������������������������������������������������µµµµ ��������������������������������������������������������������������������µµµµ0

���*+�(����,,�-�./�����-0+'��)����01'��+(�)+�

20 25 30 35 40 45 50 55

mesi

f(X

)

media=38.3

.<�.

>.�.DE,??

2. ��������� �� ������� ����� �����

��'����)���'+��������������������������������������������������������

% �%��µµµµ 2�µµµµ�3

4 �%��µµµµ 5�µµµµ�3

���� ����������%B,B,

F?=.<�.

B?

B,

B?

F30 35 40 45 50 55 60 65F?=.<�.

" �%��µµµµ ��6

� �%��µµµµ 7 µµµµ�

)������������� ������������

B,%�µµµµ �"�

$������������������������%: 1.���-�/�.+(� �,�-�>

:8���-�/�.+(� �.

20 25 30 35 40 45 50 55 60 65

f(X

)

B?B,

F?=.<�.

F?=.<�.

B,B,

B?

� � ������� �� ���� ���� �������

: $����������������������������������������������-��������

*(�+�)-�'�)+

��-�).0�./�.��

αααα� ?�?G

-? -G .? .G >? >G G? GG

����

,�9&

-? -G .? .G >? >G G? GG

����

,�9&

,��:�*�.��)-�'�)+��αααα&� ���������������������������������������������� ������������� ��������������������

-��:�*�.�����+))�''+/�.���%;αααα&� ���������������������������������B?

2�������B? 5 ������B?

<6

: ����������������������������!����������������������������������������������������������������������������H

><.<�.20 25 30 35 40 45 50 55 60 65

f(X

)

B,B?

$���������������������������� ����������%

� &'� �'�2� �'� �7*

4.4533.4

3.3864.105.0)3.38|( =→−=→==> k

kk x

xxXP µ

.<�.

>G�>

x ?

,�@>

z

4.453.38

==

soglia

media

64.10

==

soglia

media

nx

z/

0

σµ−=

������ �������� ������

'���������������0����������������1 �������������� ����� ������������������������������������B? ����������������������������

'����������������������������������������������������������������B?

���������������������������������B?

/ �����������������%

������������H����������������������=,�A<@ �����������������������������������=,�@>

'��������B?

$����������������=>@�A ����������������������������������>G�>

�=1�0+(�.'���.'�

986.133.4

3.389.46/

0 =−=−=n

xz

σµ

.<�.

,�@>

?

>G�>

>@�A,�A<@

x z

�� ��������������������������������������� ���

� ����������������

����µµµµ ��µµµµ�

�%��µµµµ 7 µµµµ�

αααα#4 αααα#4

-�*�.�����-�,�1'-�*�.�����

+))�''+/�.�

-�*�.�����-�,�1'

����µµµµ � µµµµ�

�%��µµµµ 2 µµµµ�

� ����������������

-�*�.�����+))�''+/�.�

-�*�.�����-�,�1'

αααα

��������� ��!���"#�$%&��%&�%��"�'&(�)��"(�$%&�'&�!(�()���%

,�������������%� B?%�µ=�µ?

B,%µ µ?µ µ?µIµ?

.��� ���%n

xz

/0

σµ−=

>��'�����������%� ������������ �α �������J�α

�������������� ±�αD-

G��5������������������ ������������

�������������� ����KL�αD-|

����K�α ����������I�J�α

-������������������%

Esercizio• L’emoglobina è un componente dei globuli rossi che porta l’ossigeno

dai polmoni ai vari tessuti. Valori inferiori ai 12 g/dl sono suggestivi di anemia.Un ricercatore sospetta che i bambini che vivono in una nazione in via di sviluppo abbiano livelli di emoglobina <12. Il ricercatore campiona 35 bambini che hanno una media di emoglobina =11.2 g/dl. Valutate l’ipotesi del ricercatore sapendo che l’emoglobina ha una distribuzione normale con media=12 g/dl e d.s=1.6 g/dl

• Il valore di colesterolo serico dei ragazzi degli USA è µ = 175 mg /ml con s = 50. Su un CCS di 39 ragazzi il cui padre aveva avuto una storia di infarto, la media di colesterolo era di 195 mg/ml. Utilizzando un test a due code, valutate se il campione studito è signficativamentediffferente dall’atteso.

• La prevalenza di asma è del 5%. Su un campione di 1000 bambini atopici, 98 avevano l’asma. Secondo voi esiste un associazione tra asma e atopia?

/ ��������������������������������������-���������������%

,� &�������������������%���������B? ������ �����$����������� ��������������������������������������� αααα

-� &���������������������%���������B? ������ ����B,��$����������� ����������������������������������������� ββββ

%;αααα� .�-�,�1'���

: �,�1'���

���0�-+ ���,+(�+�

� �)���.��)--�''+�ββββ

---��������'���

%; ββββ� �)���.��)--�''+�

αααα ---�������'���

20 25 30 35 40 45 50 55

20 25 30 35 40 45 50 55 60 65

B,

B?

αααα

2 0 2 5 3 0 3 5 4 0 4 5 5 0 5 5 6 0 6 5

f(X

)

B,B?

M,M-

M.M>

.<�.

><

ββββ

)���������������

$������������������� ������������ �����������B? ���������� �����,Jβ)

/ �����������������%

( 0.60) 0.27P Zβ = < − =

�� � � > ��� ��� � ��%;ββββ &�� ?�

60.033.4

484.45)48|4.45( −=−=→=<= zxP µβ

$�������� )* � &/ H2 ������������������������������� ����������������������������������

���������� �����������������������������������������

µµµµ� µµµµ

���� µµµµ

�����

����

����

����

����

���

�+��'�./+ @ ,1./�.���

2����� ���������� ���� ������� ������ �α ��β ���� ���������

3� ���� ��������� �����������

*(�+�)-�'�)+

ααααββββ

B? B,

ααααββββ

B,B?

*(�+�)-�'�)+

N����� α ������������� ���������������� ���

���������� ������������ ��������%

f(X

)

ααααββββ

f(X

)

αααα#4 ββββ αααα#4

� ����������%��������B?

�%��µµµµ 7 µµµµ�

�%��µµµµ 5 µµµµ�

� ������������%��������B?

> �)+()(+'�.�(�)+���.�

B?

B?

B,

B,

� � �� : ������ � A:� � � � �� ��B � �� � �� ����� ��� � �:����� � �B � ���:�� � :� �� ����

�� �� ��> �� �

� 0��

: =�����������������������

: θ? = ��������������B?

: &�'������� =�&�'������������������������B?

θ̂

θ̂

��� � � � ����� ���������� ����� ���

�� µ� σ������������� σ��� �� � π� ���� ��π���π���� ���� µ� σ��������������� ���� ����� � π� σ��������������� ��� ���

)ˆ.(.

ˆ0

θθθ

SEtest

−=

�� � A:� � � � �� :��� B ���� ��� � �

: ( �����������������������2���3����������������������������������������������������

: ����������������������������������������������������������2�� ������D���D����������������������������������3

: ���������� �����������������������������������������������������������������������������������������������������������

: �������������������� �������������D���������D���������������������� ����������������������

�/ N* 56 2H�* / ��'* $* �'9 $�726 )�* / & �& �/ * / �'9 $$2�)* )* $2H�* / &

* 3�&� � �# * %���������������������������������������

µ,Jµ-=δ)������������

������������������� '���������

�������21 xx −

1 2x x− � �� ����� ��� � �:���� �

��������������������������������������������������������������, ����-%

( �'� 5�39 H�* / & �����������726 )�* / 25�2

M,,��M,-��" ��M,�,→ �, ������������������������������������ O,

O, ∼ / ��� �µ,�σ,- �

M-,��M--��" ��M-�-→�- ������������������������������������ O-

O- ∼ / ��� �µ-�σ--

�� �µµµµ%!σσσσ%#$.%&1X

�� �µµµµ4!σσσσ4#$.4&2X

�/ � &5#2$$* �( ��7* / N�( &/ H2���AGP

������������������������������%

( �'� 5�39 H�* / & �726 )�* / 25�2

2121 )( µµ −=− xxE

2221

2121 //)( nnxxVar σσ +=−

)(96.1)( 2121 xxESxx −⋅±−

�������������% 2221

2121 //)( nnxxES σσ +=−

21 xx − � )//;( 2221

2121 nnN σσµµ +−

� � �� : ������ � A:� � � � �� :��� B �� � � ���� ��� � �:� �

��'����.1((+�

����µµµµ % ��µµµµ4����� µµµµ % ; µµµµ4��

�%��µµµµ % 7 µµµµ4 �%��µµµµ % 2�µµµµ4 �%��µµµµ % 5�µµµµ4

1�*-+.���)+���.�

:�*�.��)-�'�)+��

/2;/αααα#4��/5/αααα#4� /2;/αααα /5/αααα

��'����+('�-.+'�0+�� ������������

� ����������

:���σσσσ%4 ��σσσσ4

4!�.'�

:���σσσσ%4 ��σσσσ4

4!��*.'�

� +�.�*-+.��

2221

21

21

21

21

//)(0)(

nn

xxxxES

xxZ

σσ +−=

−−−= ∼∼∼∼ � ���!�%&

2221

21

21

21

21

//)(0)(

nsns

xxxxES

xxZ

+−=

−−−= ∼∼∼∼ � ���!�%&

: ���@ 0�-+�(���'����.1((+ ���&������� 9% ; 94 ∼∼∼∼ � ���!�$�σσσσ%4#.% C�σσσσ4

4#.4&&

&���������,%

������������������� ������������������������������������������������������������������������������������������������ �������������-,�����.?������������.,�����>?����%�

� ������������

������ ��������

������������

������ ��������

� �� ��

�� ��� ���

�� ���� �����

��� � ��� �����

'���!������������������ ��������� ������������������������ ������;�

����µµµµ % ��µµµµ4

�%��µµµµ % µµµµ4

'��������������������������������������������%

�=@�AG ������������� �������������������������������������������������� ��������� ��������������������� ����������������������������� �����

$��������������������������AGP ������������������������������������������ ����%

�,.�<<J,-�>- ±,�A@Q?�-,?,

95.62101.0

42.1288.13)(0)(

21

21 =−=−

−−=xxES

xxZ

)()( 212/21 xxESzxx −⋅±− α

���=�� I?�??,

)(96.1)( 2121 xxESxx −⋅±−

,�>@�±?�>,

��,�?G��,�<R����

&'�O,JO- =���,�A->D@@ S�,�,G@DR< =?�-,?,

� � �� : ������ � A:� � � � �� :��� B ��:� �� :> �� � �

� ��'�+��1��)��

����ππππ % ��ππππ 4�ππππ�%��ππππ % 7 ππππ 4

� ��'�+�1.+�)�+

����ππππ % ��ππππ 4

�%��ππππ % 5�ππππ 4

����ππππ % ��ππππ 4

�%��ππππ %2 ππππ 4

������B?� � &'���,J � - =

: '��+����ππππ�

B �� :�� � ����� ��� � �

:� ��'�����'�����

21

)1()1(nn

ππππ −+−

21

2211ˆnn

pnpn++=π

21

21

)ˆ1(ˆ)ˆ1(ˆ0)(

nn

ppZ

ππππ −+−−−=

: �.'�-0+((����).,���./+� )()( 212/21 ppESzpp −±− α

��-)�/��4������������� ������������������������������������������������2��������������������������������������������������������������������������������3���������������������������������������������������������

'�-GR��������������������2��>,���������������T ���

7�� ������������������ 2������ �����������3;

'�->>��������������������3��@>���������������T ���

�%�"%#4D?�� %DED

�4�F"#4""�� 4F4�

B?%�π , =�π -�=�πB,%�π , K�π -

:�������� ππππ���=�>,S@> D�-GRS->> =?�-,

������B?%

81.20364.0

)2623.01595.0()ˆ1(ˆ)ˆ1(ˆ

0)(

21

21 =−=−+−

−−=

nn

ppZ

ππππ

0364.0)2441

2571

)(79.0(21.0

)11

)(ˆ1(ˆ)ˆ1(ˆ)ˆ1(ˆ)(

212112

=+=

=+−=−+−=−nnnn

ppES ππππππ

��=?�??-G

��������������������

�� � :G���� �� ���� � A�� � > ���EDH &

�?�-@-.J?�,GAG ±,�A@Q?�?.@-����� �?�,?-<�±?�?R,?� ����7�AGP %�?�?.,<J?�,R.<

)����U �����������������������������&'��,J�- �������%

0362.0244

)26.01(26.0257

)16.01(16.0

)1()1()(

2

22

1

1112

=−+−

=−+−=−nn

ppESππππ

� &'� �)&5 ��$�7* / N5* / � * �� 52�( 9 & �6 &( �& �726 )�* / 25�& �

)�����������������������������������σ

��� � ��� : ���B � ���> > � �� ��� � �'

'����������������

/ �������!����������H ������

O, ∼ / ��� �µ,�σ-

O- ∼ / ��� �µ-�σ- ���������������������������������������������������������������

7�������������������

σ,- =�σ-

- =�σ- %�� � � �� � � � ���� ��

'�����B?% µ,�=�µ- =µ

σ,- =�σ-

- =�σ-

��������������������������������������������

�, ���- ����������������������σσσσ s12 = Σ (x1i - x1)2 / (n1 -1)

s22 = Σ (x2i - x2)2 / (n2 -1)

'� �6 2�)* * $&( �( &$$2�#25�2/ H2

� ����������B?%�µ , =�µ-�=�µB,%�µ , V µ-

� ������������

B?%�µ , =�µ-

B,%�µ , I�µ-

B?%�µ , =�µ-

B,%�µ , K�µ-

:�*�.���)-�'�)+��

�IJ�αD-����K�αD-��IJ�α �K�α

� ���%� ∼∼∼∼'.%C.4;4

)2()1()1(

)1()1()1()1(

21

222

211

21

222

2112

−+−+−=

−+−−+−=

nnsnsn

nnsnsn

sp

212

2

1

2

21

11)(

nns

n

s

n

sxxES p

pp +=+=−

)11

()(

21

2

21

21

21

nns

xxxxES

xxt

p +

−=−

−=

��-)�/����

2��������������������������������������������-��������������������������2���3��( ����><������ ���������������������������������������������������������������� ���������%

��������������������������������������������������������;

Punteggio della placca �����������

�����������

��

��� ����� ������ ������ ������ ���� ����� ����� ������ ����� ��

�,=,?� �-=,?M,=@@�< M-=,G�R�,

-=A>.�-A �--=,>-�@<

�, ���- ������������������������.?��������������������������������%

: ����������������������������������������������������������������������

:$��������������������� ����������������

:�������������������������������������������������������

'-������=�(A>.�-AQ�,?J, S,>-�@<�,?J, D�,?S,?J- =G>-�A<

&�'��O,JO- =�G>-�A<GQ�,D,?S,D,? =,?�>-

�= �@@�<J,G�R D,?�>-=G,�,D,?�>-=>�A

��∼��,S�-J- ��∼�,< �����,<��?�?-G=-�,

�������������������������������������%����������������������� �������������������������������������������������

Esercizi• E’ stato condotto uno studio per valutare l’effetto del fumo materno in

gravidanza sulla densità ossea dei neonati. Il contenuto medio di minerali in 77 neonati da madri fumatrici era di 0.098 g/cm3 (d.s=0.026). In un campione di 161 neonati da madri di non fumatrici, il contenuto medio era di 0.095 g/cm3 (d.s=0.025). Stabilite se c’è una differenza statisticamente significativa tra i due campioni e calcolate il IC95% per la vera differenza nel contenuto medio di minerali tra i due gruppi.

• La “scrapie” è un malattia degli ovini simile al morbo della mucca pazza. In una sperimentazione è stata utilizzata, su cavie, una sostanza per il trattamento della scrapie. In un gruppo di 10 cavie infettate e trattate con il farmaco sperimentale, il tempo medio di sopravvivenza era di 116 giorni (errore standard=5.6 giorni). In un gruppo di 10 cavie infettate di controllo, il tempo medio di sopravvivenza era di 85 giorni (errore standard=1,9giorni).C’è una differenza significativa nella sopravvivenza dei due gruppi?

La forma generale dell’intervallo di confidenza è:

���������������������������� �������

)ˆ(ˆ θαθ ESz ⋅/2±

La sua ampiezza (precisione) è data da :

θ̂ )�ES(2�zˆ

/+)�ES(2�zˆ

/−

)]ˆ([2)ˆ(ˆˆ)ˆ(ˆ θθθθθθ ααα ESzESzESz ⋅=⋅±+−⋅+ /2/2/2

Il margine d’errore d è definito da metà ampiezza:

d = )ˆ(θα ESz ⋅/2

Esempio 1- 9 �������� �������������������������������������� ������������������������������������������������������,?���� ������������������������������� �������������������������������������������������������

$��������������������������AGP ������������������������ ��������������� �������� ������������� ��������%

1.46 ±0.41 ��,�?G��,�<R����

0.41 anni rappresenta il margine d’errore

Esempio 2- 9 �������� �����������������������������������������������2'$����# ���������� �������������-?�����>>�������������������A>����������,A.?�����������$��������������������������������������

)= >�AP$��������������������������AGP ������������������������������������������������%�.�AP �J G�AP

��������������������������������=�,P

Quanti soggetti devo studiare se voglio ottenere una stima con un livello di confidenza 1-α e un margine d’errore che sia <= d?

������ ��� �������������������������

��������� ��� ���

d = )ˆ(θα ESz ⋅/2

A – Il caso di una media campionaria:

n

σ/2= αz

Quindi il valore minimo di n perché il margine d’errore stimato non sia superiore a d è:

2

���

����

� ⋅/2=d

zn

σα

Il calcolo della numerosità campionaria per uno studiofinalizzato alla stima di un parametro richiede informazioni sul valore della deviazione standard della variabile in studio (indagine pilota).

Esempio: se si vuole stimare il valore medio di una variabile(d.s=15) mediante intervallo di confidenza al 95% e con unmargine d’errore non superiore a 5, qual è il numero minimoDi soggetti da studiare?

n= (1.96)2 (15)2 / (5)2 = 36

npp

zd)1( −⋅= /2α

B – Il caso di una proporzione campionaria:

( )2

22

d

pqzn

a/=

Esempio : si vuole stimare con IC 95% la prevalenzadi asma con un margine d’errore non superiore al 1%.Quale deve essere la dimensione del campione? (Si sa che in Europa la prevalenza della malattia è del 5%)

n= (1.96)2 (0.05)(0.95)/(0.01)2 = 1900

B – Il caso della differenza tra medie:

2221

212/ // nnzd a σσ +=

Posto n1 =n2 =n( ) ( )

2

22

21

22

dssz

na/ +=

Si vuole stimare la differenza media di glicemia nei maschi enelle femmine con 95%CI con un margine d’errrore nonsuperiore a 3mg/ml. Quanti maschi e femmine dovrò campionare? (si assuma che la ds sia uguale nei maschi e nelle femmine e abbia valore di 10mg/ml)

N= (1.96)2 . 2(10)2/ (3)2 = 44 per sesso

Dimensione campionaria e potenza del test

Test per il confronto tra due medie campionarie: α=0.05 s2=60

δ =50 >> differenza attesa tra le medie Η0:µ1=µ2

Η0 Η1

n=12=12=12=121-ββββ =0.497

n=241-ββββ=0.807

n=481-ββββ=0.981

n=961-ββββ=1.00

La potenza del test (area blu) aumenta all’aumentare di n!!!!

In genere n dovrebbe essere tale da garantire una potenza di almeno 0.80

In genere,la numerosità campionaria necessaria per il confronto tra due medie (o la potenza del test) dipende dalle seguenti quantità:

• La differenza attesa tra le due medie: δδδδ . Tanto > δδδδ tanto < n a parità di potenza richiesta;

• La deviazione standard σσσσ della variabile.Tanto < σσσσ tanto < n a parità di potenza richiesta;

• La probabilità d’errore di I°tipo αααα.Tanto < αααα tanto < è la potenza del test;

• La probabilità d’errore di II tipo β.Tanto > 1- ββββ tanto > n .

<6><�

20 25 30 35 40 45 50 55 60 65

f(X

)

B,B?

δδδδ

δ =differenza attesa tra le medie

Ηο: µ1−µ2=0

nnnxxES ///)( 22221 σσσ =+=−

β α

nzxk /2.0 1 σα−+=nzxk /2.1 σδ β−−= 2

211 ).(2

δσβα −− +

=zz

n

Una compagnia farmaceutica vuole studiare l’effetto di un antidepressivo in pazienti con disturbi nevrotici di tipo ansiogeno.Un gruppo di controllo sarà confrontato a un gruppo sperimentale.La variabile di risposta primaria è uno score per l’ansia: HAM-A.Una differenza di 4 nello score è considerata clinicamente rilevante.Da precedenti studi si sa che la d.s. del HAM-A è 7.Quanti pazienti dovremo assegnare a ciascun gruppo se vogliamoUn potenza del 80% per un test a due code con α=0.05 ?

2

211 ).(2

δσβα −− +

=zz

n 49)4(

)842.096,1()7(22

22

=+=