Esercizio In un collettivo di studenti è stato rilevato il ...magnani/pdf/ost_ip_1_...

39
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 1 Distribuzioni di frequenza di due variabili Esercizio In un collettivo di studenti è stato rilevato il voto riportato all’esame di statistica e quello riportato all’esame di fisica Studente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Voto statistica 20 20 20 23 23 20 27 27 20 27 23 23 27 27 Voto fisica 25 27 30 25 27 27 28 25 28 25 25 25 30 28

Transcript of Esercizio In un collettivo di studenti è stato rilevato il ...magnani/pdf/ost_ip_1_...

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 1

Distribuzioni di frequenza di due variabili Esercizio In un collettivo di studenti è stato rilevato il voto riportato all’esame di statistica e quello riportato all’esame di fisica Studente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Voto statistica 20 20 20 23 23 20 27 27 20 27 23 23 27 27 Voto fisica 25 27 30 25 27 27 28 25 28 25 25 25 30 28

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 2

1) Riportare i risultati in una tabella specificando anche i totali di

riga e di colonna. Indicare chiaramente il titolo della tabella ed il significato delle righe e delle colonne

2) Calcolare il voto mediano dell’esame di statistica

3) Qual è la proporzione di studenti che hanno ottenuto un voto di

statistica pari a 23 sul totale degli studenti

4) Qual è la proporzione di studenti che hanno ottenuto un voto di statistica pari a 23 sul totale di studenti che hanno avuto un voto di fisica pari a 27?

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 3

1) Distribuzione di frequenza assoluta Voto fisica Voto statistica 25 27 28 30 Totale 20 1 2 1 1 5 23 3 1 0 0 4 27 2 0 2 1 5 Totale 6 3 3 2 14 2) N è pari quindi si devono considerare i voti riportati delle unità statistiche che occupano le posizioni: N/2 e (N/2) + 1 Ossia: N/2 = 14/2 = 7 e (N/2) +1 = 7+1 = 8 quindi: mediana = 23

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 4

3) 4 (n. di studenti con voto di statistica pari a 23) / 14 (totale studenti) = 0,29

4) 1 (n. di studenti con voto di statistica pari a 23 tra quelli con voto di fisica pari a 27)/

3 (totale studenti con voto di fisica pari a 27) = 0,33

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 5

Esercizio:

1) Costruire una tabella con i seguenti valori; i dati (fittizi) si

riferiscono all’associazione tra osteoporosi e peso rispetto al

peso forma in un gruppo di pazienti, di sesso femminile, di

oltre 65 anni visto in un reparto di medicina.

Il peso è definito come “sovrappeso” o “normopeso”.

L’osteoporosi come presente o assente.

75 pazienti nel reparto hanno evidenza radiologica di

osteoporosi, di cui 42 sovrappeso ed i restanti normopeso;

164 non hanno evidenza di osteoporosi, di cui 90 normopeso.

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 6

2) Definire la proporzione di pazienti con osteoporosi sul totale di

pazienti

3) Definire la proporzione di pazienti sovrappeso con osteoporosi

sul totale di pazienti con osteoporosi

4) Disegnate il diagramma a barre della distribuzione di

frequenza (assoluta) dei pazienti con osteoporosi. In questo

grafico non si considerino i pazienti senza osteoporosi

5) Calcolare l’odds ratio e l’intervallo di confidenza al 95%.

Valutare se esiste un’associazione statisticamente significativa

tra malattia e peso.

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 7

1)

2) 75/239 = 0,31

3) 42/75= 0,56

Osteoporosi Presente Assente Totale Sovrappeso 42 (a) 74 (b) 116 (a+b) Normopeso 33 (c) 90 (d) 123 (c+d)

Totale 75 (a+c) 164 (b+d) 239

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 8

4)

Pazienti con osteoporosi

0

5

10

15

20

25

30

35

40

45

sovrapeso normopeso

freq

uenz

a as

solu

ta

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 9

5) Odds ratio = (42*90)/(74*33) = 3780/2442 = 1,5

eORESOR

ORIC))(ln()ln(

)(*

2Ζ±= α

dcbaORES

1111))(ln( +++=

eORIC 901

331

741

421

*96,15,1ln)(

+++±=

IC95% (OR) =(e-0,14; e0,96)

IC95%(OR) = (0,9 ; 2,6)

Conclusione: I soggetti sovrappeso hanno un rischio 1,5 volte

superiore di contrarre malattia rispetto ai normopeso, anche se

questo valore non è statisticamente significativo.

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 10

( )∑

−=

attattoss

2

H0: non esiste associazione tra malattia e peso

Osteoporosi Presente Assente Totale Sovrappeso 42 (attesi = 75*116/239 =

36,4) 74 (attesi = 79,6) 116 (a+b)

Normopeso 33 (attesi = 38,6) 90 (attesi = 84,4) 123 (c+d)

Totale 75 (a+c) 164 (b+d) 239

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 11

χ2 = (42-36,4)2 + (74-79,6) 2 + (33-38,6) 2 + (90-84,4) 2 = 2,4

36,4 79,6 38,6 84,4

sulle tavole trovo per (1 grado di libertà) χ2 = 3,84

2,4 < 3,84 quindi non rifiuto H0

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 12

2,4

Rifiuto

H0

Non rifiuto

H0

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 13

Distribuzione chi-quadro (l’area compresa tra un dato valore di χ2 e ∞)

Distribuzione Chi quadrato

1 coda 2 code Probabilità 0,001 0,01 0,025 0,05 0,1 0,002 0,02 0,05 0,1 gradi libertà 1 10,83 6,64 5,02 3,84 2,71 10,83 6,64 5,02 3,84

2 13,82 9,21 7,38 5,99 4,61 13,82 9,21 7,38 5,99 3 16,27 11,35 9,35 7,82 6,25 16,27 11,35 9,35 7,82 4 18,47 13,28 11,14 9,49 7,78 18,47 13,28 11,14 9,49 5 20,52 15,09 12,83 11,07 9,24 20,52 15,09 12,83 11,07 6 22,46 16,81 14,45 12,59 10,65 22,46 16,81 14,45 12,59 7 24,32 18,48 16,01 14,07 12,02 24,32 18,48 16,01 14,07 8 26,13 20,09 17,54 15,51 13,36 26,13 20,09 17,54 15,51 9 27,88 21,67 19,02 16,92 14,68 27,88 21,67 19,02 16,92 10 29,59 23,21 20,48 18,31 15,99 29,59 23,21 20,48 18,31 11 31,26 24,73 21,92 19,68 17,28 31,26 24,73 21,92 19,68 12 32,91 26,22 23,34 21,03 18,55 32,91 26,22 23,34 21,03 13 34,53 27,69 24,74 22,36 19,81 34,53 27,69 24,74 22,36 14 36,12 29,14 26,12 23,69 21,06 36,12 29,14 26,12 23,69 15 37,70 30,58 27,49 25,00 22,31 37,70 30,58 27,49 25,00 16 39,25 32,00 28,85 26,30 23,54 39,25 32,00 28,85 26,30 17 40,79 33,41 30,19 27,59 24,77 40,79 33,41 30,19 27,59 18 42,31 34,81 31,53 28,87 25,99 42,31 34,81 31,53 28,87 19 43,82 36,19 32,85 30,14 27,20 43,82 36,19 32,85 30,14 20 45,32 37,57 34,17 31,41 28,41 45,32 37,57 34,17 31,41

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 14

Esercizio

Il rilevamento dei gruppi sanguigni effettuato in tre località diverse

ha dato i seguenti risultati:

Gruppo sanguigno

Località I Località II Località III

A 100 70 122 B 70 38 80

AB 15 20 48

0 185 122 176

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 15

1) Qual è il gruppo sanguigno più frequente?

2) Qual è la frequenza relativa del gruppo sanguigno B nella

località I?

3) Rispetto al totale complessivo, che percentuale rappresenta il

gruppo AB della località III

4) Tra i soggetti con gruppo 0, quale quota percentuale va

attribuita alla località II?

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 16

1) Il gruppo sanguigno più frequente è il gruppo 0.

2) 70/370= 0,19

3) 48/1046 = 0,05 = 5%

4) 122/483 = 0,25 =25%

Gruppo sanguigno Località I % Località II % Località III % Totale

A 100 27 70 28 122 29 292 B 70 19 38 15 80 19 188

AB 15 4 20 8 48 11 83

0 185 50 122 49 176 41 483 Totale 370 100 250 100 426 100 1046

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 17

Esercizio

In un ospedale piemontese nell’ultimo anno sono stati registrati 512

parti. Sono nati 260 maschi e 252 femmine. Il peso del neonato è

stato tra 1 e 2 kg per 59 maschi e 81 femmine, tra 2 e 3 kg per 102

maschi e 114 femmine, tra 3 e 4 kg per 72 maschi e 50 femmine,

tra 4 e 5 kg per i restanti neonati.

1) Riportate i risultati in una tabella, completando i dati mancanti.

Indicate chiaramente il titolo della tabella e il significato delle righe e

delle colonne. Calcolate sia la frequenza assoluta sia la frequenza

relativa percentuale sul totale di 512 neonati

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 18

2) Stabilire la tipologia delle variabili “peso” e “sesso” motivandone

la risposta

3) Disegnate l’istogramma con la frequenza assoluta dei diversi

pesi tra i soli maschi

4) Qual è la proporzione di femmine con peso tra 1 e 2 kg sul totale

delle femmine nate?

5) Indicate a parole il significato del simbolo >=

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 19

1)

2) La variabile “peso” è di tipo numerico continuo; è il risultato di

un’operazione di misura e può assumere tutti i valori all’interno di

un intervallo.

La variabile “sesso” è di tipo categorico nominale. Non è possibile

effettuare un ordinamento tra le modalità.

Maschi Femmine Totale n Frequenza relativa

percentuale n Frequenza relativa

percentuale

1<=x<2 59 12% 81 16% 140 2<=x<3 102 20% 114 22% 216 3<=x<4 72 14% 50 10% 122 4<=x<5 27 5% 7 1% 34

Totale 260 51% 252 49% 512

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 20

3)

Frequenza assoluta dei pesi dei neonati maschi

0

20

40

60

80

100

120

1<=x<2 2<=x<3 3<=x<4 4<=x<5

peso del neonato

freq

uenz

a as

solu

ta

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 21

4) Proporzione di femmine con peso tra 1 e 2 kg sul totale delle

femmine nate:

81/252=0,32

5) >= significa maggiore o uguale

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 22

Esercizio

In un reparto di un ospedale, nell’ultimo mese sono stati ricoverati

230 pazienti. Si sono registrati 98 fumatori e 132 non fumatori.

Per i soggetti con età (in anni compiuti) tra 0 e 20 anni, i fumatori

sono stati 4 e i non fumatori 22; tra i 20 e i 40 anni I fumatori erano

45 e i non fumatori 47; tra i 40 e 60 anni 39 fumatori e 45 non

fumatori; tra i 60 e gli 80 anni 10 fumatori e 16 non fumatori. I

soggetti rimanenti avevano un’età compresa tra gli 80 e i 100 anni.

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 23

a. Riportare i risultati in una tabella, completando i dati mancanti.

Indicate chiaramente il titolo della tabella ed il significato delle

righe e delle colonne. Calcolate sia la frequenza assoluta, sia

la proporzione, sul totale di 230 ricoveri.

b. Stabilire la tipologia della variabile “età” e motivarne la risposta.

c. Disegnare l’istogramma con la proporzione dei fumatori nelle

diverse età sul totale di soggetti

d. Qual è la proporzione di fumatori con età compresa tra 40 e 60

anni sul totale dei fumatori? E sul totale dei soggetti?

e. Qual è la percentuale di non fumatori con età compresa tra i 60

e gli 80 anni sul totale dei soggetti?

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 24

1)

2. L’età è una variabile discreta in quanto risulta da un conteggio e

assume valori interi

Fumatori Non fumatori Totale n Proporzione n Proporzione n

0<=x<20 4 0,02 22 0,10 26 20<=x<40 45 0,20 47 0,20 92 40<=x<60 39 0,17 45 0,19 84 60<=x<80 10 0,04 16 0,07 26

80<=x<100 0 0 2 0,01 2 Totale 98 0,43 132 0,57 230

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 25

3.

Proporzione di fumatori nelle diverse classi d'età

0

0,05

0,1

0,15

0,2

0,25

0<=x<20 20<=x<40 40<=x<60 60<=x<80 80<=x<100età

freq

uenz

a re

lativ

a

4. Proporzione di fumatori tra i 40 e i 60 anni sul totale dei fumatori:

39/98 =0,40. Proporzione di fumatori tra i 40 e i 60 anni sul totale

dei soggetti: 39/230 =0,17

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 26

5. Percentuale di non fumatori con età compresa tra i 60 e gli 80

anni sul totale dei soggetti: 16/230 = 0,07

0,07*100 = 7%

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 27

Esercizio: L’elenco seguente comprende i pazienti ricoverati nel vostro reparto nell’ultimo mese (n=neoplasia; a=altro)

età durata della degenza sesso tipo di malattia 25 5 M A 33 16 M A 34 8 M A 37 2 M N 37 8 M A 39 7 M N 45 18 F N 48 5 F N età durata della degenza sesso tipo di malattia 50 4 F A 52 7 F N 55 8 F N 59 8 F A 75 12 F N

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 28

a) Sintetizzate i risultati completando la seguente tabella. Inserite i

dati mancanti, seguendo le indicazioni fornite dal titolo della tabella

e dalle intestazioni delle righe e delle colonne.

Distribuzione di frequenza dei ricoveri nel reparto , per

sesso e durata del ricovero

Durata del ricovero

<= 7 giorni

> 7 giorni TOTALE

Maschi Sesso

Femmine

TOTALE

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 29

b) Calcolate: media, deviazione standard e coefficiente di

variazione dell’età. Indicate chiaramente le formule. c) Disegnare un istogramma con le frequenze della durata di

ricovero tra maschi e femmine.

d) Rappresentare le variabili età e durata della degenza con un

diagramma di dispersione e) Valutare se esiste un’associazione statisticamente significativa

tra sesso e tipo di malattia. Calcolare l’odds ratio e il relativo I.C

95%

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 30

a)

b) Media = Σ xi /n = 45,3

DS = [Σ (xi- x )2 / (n-1)] ½ = 13,3 Coefficiente di variazione % = DS/Media = 29 %

Distribuzione di frequenza dei ricoveri nel reparto , per sesso e durata del ricovero

Durata del ricovero

<= 7 giorni > 7 giorni TOTALE

Maschi 3 (2,8) 3 6 Sesso

Femmine 3 4 7

TOTALE 6 7 13

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 31

c)

Frequenza assoluta del numero di ricoveri per sesso

0

1

2

3

4

maschi femmine

<=7 giorni>7 giorni

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 32

d)

Durata della degenza in funzione dell'età

02468

101214161820

20 30 40 50 60 70 80

Età

Dur

ata

della

deg

enza

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 33

H0: non esiste associazione tra tipo di malattia e sesso

χ2 = (2-3,2)2 + (4-2,8) 2 + (5-3,8) 2 + (2-3,2) 2 =

3,2 2,8 3,8 3,2

= 0,45 + 0,51 + 0,38 + 0,45 = 1,79

sulle tavole trovo (1 grado di libertà) χ2 = 3,84

1,79 < 3,84 quindi non rifiuto H0

Distribuzione di frequenza dei ricoveri nel reparto , per sesso e tipo di malattia

Tipo di malattia

neoplasia altro TOTALE

Femmine 5 (attesi: 3,8) 2 (attesi: 3,2) 7 Sesso

Maschi 2 (attesi: 3,2) 4 (attesi:2,8) 6

TOTALE 7 6 13

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 34

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 35

OR = 20/4 = 5 I.C. 95% : (0,47;52,96) Le femmine hanno un rischio 5 volte superiore rispetto ai maschi di sviluppare una neoplasia.

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 36

I risultati di uno studio (di tipo caso-controllo) sono riassunti nella

seguente tabella:

Casi di tumore del

polmone

Controlli Totale

Fumatori ed ex

fumatori

86 120 206

Non Fumatori 14 80 94

Totale 100 200 300

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 37

a. Come indicatore di associazione decidete di calcolare l’Odds

Ratio. Scrivete la formula ed il risultato che ottenete.

b. Come interpretate il valore di Odds Ratio che avete ottenuto? c. Indicate il test statistico che ritenete appropriato nel caso dato,

tra i seguenti.

Chi-quadrato Test z Test t per dati appaiati Test t per dati non appaiati

d. Avete fissato l’errore di 1° tipo al 5%. Defini te l’errore di 1° tipo

(anche detto errore alfa) e. Applicate il test che avevate scelto, effettuando i calcoli

necessari. Presentate chiaramente formule e risultati. Indicate il valore di probabilità corrispondente al risultato del test, avvalendovi delle tabelle allegate.

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 38

a. OR = 4,1

b. I soggetti fumatori ed ex fumatori hanno un rischio 4,1 volte superiore di sviluppare tumore del polmone rispetto ai non fumatori

c. Chi quadrato d. Alfa è la probabilità di rifiutare l’ipotesi nulla quando è vera e. H0: non esiste associazione tra fumo e malattia

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 39

χ2 = (86-68,7)2/ 68,7+ (120-137,3) 2 / 137,3 + (14-31,3) 2 / 31,3+

(80-62,7) 2 / 62,7 = 4,4 + 2,2 + 9,6 + 4,8 = 21

sulle tavole trovo (1 grado di libertà) χ2 = 3,84

21 > 3,84 quindi rifiuto H0

Casi di tumore del

polmone

Controlli Totale

Fumatori ed ex

fumatori

86 (attesi: 68,7) 120 (attesi: 137,3) 206

Non Fumatori 14 (attesi: 31,3) 80 (attesi: 62,7) 94

Totale 100 200 300