Esercizio In un collettivo di studenti è stato rilevato il ...magnani/pdf/ost_ip_1_...
Transcript of Esercizio In un collettivo di studenti è stato rilevato il ...magnani/pdf/ost_ip_1_...
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 1
Distribuzioni di frequenza di due variabili Esercizio In un collettivo di studenti è stato rilevato il voto riportato all’esame di statistica e quello riportato all’esame di fisica Studente 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Voto statistica 20 20 20 23 23 20 27 27 20 27 23 23 27 27 Voto fisica 25 27 30 25 27 27 28 25 28 25 25 25 30 28
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 2
1) Riportare i risultati in una tabella specificando anche i totali di
riga e di colonna. Indicare chiaramente il titolo della tabella ed il significato delle righe e delle colonne
2) Calcolare il voto mediano dell’esame di statistica
3) Qual è la proporzione di studenti che hanno ottenuto un voto di
statistica pari a 23 sul totale degli studenti
4) Qual è la proporzione di studenti che hanno ottenuto un voto di statistica pari a 23 sul totale di studenti che hanno avuto un voto di fisica pari a 27?
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 3
1) Distribuzione di frequenza assoluta Voto fisica Voto statistica 25 27 28 30 Totale 20 1 2 1 1 5 23 3 1 0 0 4 27 2 0 2 1 5 Totale 6 3 3 2 14 2) N è pari quindi si devono considerare i voti riportati delle unità statistiche che occupano le posizioni: N/2 e (N/2) + 1 Ossia: N/2 = 14/2 = 7 e (N/2) +1 = 7+1 = 8 quindi: mediana = 23
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 4
3) 4 (n. di studenti con voto di statistica pari a 23) / 14 (totale studenti) = 0,29
4) 1 (n. di studenti con voto di statistica pari a 23 tra quelli con voto di fisica pari a 27)/
3 (totale studenti con voto di fisica pari a 27) = 0,33
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 5
Esercizio:
1) Costruire una tabella con i seguenti valori; i dati (fittizi) si
riferiscono all’associazione tra osteoporosi e peso rispetto al
peso forma in un gruppo di pazienti, di sesso femminile, di
oltre 65 anni visto in un reparto di medicina.
Il peso è definito come “sovrappeso” o “normopeso”.
L’osteoporosi come presente o assente.
75 pazienti nel reparto hanno evidenza radiologica di
osteoporosi, di cui 42 sovrappeso ed i restanti normopeso;
164 non hanno evidenza di osteoporosi, di cui 90 normopeso.
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 6
2) Definire la proporzione di pazienti con osteoporosi sul totale di
pazienti
3) Definire la proporzione di pazienti sovrappeso con osteoporosi
sul totale di pazienti con osteoporosi
4) Disegnate il diagramma a barre della distribuzione di
frequenza (assoluta) dei pazienti con osteoporosi. In questo
grafico non si considerino i pazienti senza osteoporosi
5) Calcolare l’odds ratio e l’intervallo di confidenza al 95%.
Valutare se esiste un’associazione statisticamente significativa
tra malattia e peso.
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 7
1)
2) 75/239 = 0,31
3) 42/75= 0,56
Osteoporosi Presente Assente Totale Sovrappeso 42 (a) 74 (b) 116 (a+b) Normopeso 33 (c) 90 (d) 123 (c+d)
Totale 75 (a+c) 164 (b+d) 239
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 8
4)
Pazienti con osteoporosi
0
5
10
15
20
25
30
35
40
45
sovrapeso normopeso
freq
uenz
a as
solu
ta
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 9
5) Odds ratio = (42*90)/(74*33) = 3780/2442 = 1,5
eORESOR
ORIC))(ln()ln(
)(*
2Ζ±= α
dcbaORES
1111))(ln( +++=
eORIC 901
331
741
421
*96,15,1ln)(
+++±=
IC95% (OR) =(e-0,14; e0,96)
IC95%(OR) = (0,9 ; 2,6)
Conclusione: I soggetti sovrappeso hanno un rischio 1,5 volte
superiore di contrarre malattia rispetto ai normopeso, anche se
questo valore non è statisticamente significativo.
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 10
( )∑
−=
attattoss
2
2χ
H0: non esiste associazione tra malattia e peso
Osteoporosi Presente Assente Totale Sovrappeso 42 (attesi = 75*116/239 =
36,4) 74 (attesi = 79,6) 116 (a+b)
Normopeso 33 (attesi = 38,6) 90 (attesi = 84,4) 123 (c+d)
Totale 75 (a+c) 164 (b+d) 239
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 11
χ2 = (42-36,4)2 + (74-79,6) 2 + (33-38,6) 2 + (90-84,4) 2 = 2,4
36,4 79,6 38,6 84,4
sulle tavole trovo per (1 grado di libertà) χ2 = 3,84
2,4 < 3,84 quindi non rifiuto H0
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 12
2,4
Rifiuto
H0
Non rifiuto
H0
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 13
Distribuzione chi-quadro (l’area compresa tra un dato valore di χ2 e ∞)
Distribuzione Chi quadrato
1 coda 2 code Probabilità 0,001 0,01 0,025 0,05 0,1 0,002 0,02 0,05 0,1 gradi libertà 1 10,83 6,64 5,02 3,84 2,71 10,83 6,64 5,02 3,84
2 13,82 9,21 7,38 5,99 4,61 13,82 9,21 7,38 5,99 3 16,27 11,35 9,35 7,82 6,25 16,27 11,35 9,35 7,82 4 18,47 13,28 11,14 9,49 7,78 18,47 13,28 11,14 9,49 5 20,52 15,09 12,83 11,07 9,24 20,52 15,09 12,83 11,07 6 22,46 16,81 14,45 12,59 10,65 22,46 16,81 14,45 12,59 7 24,32 18,48 16,01 14,07 12,02 24,32 18,48 16,01 14,07 8 26,13 20,09 17,54 15,51 13,36 26,13 20,09 17,54 15,51 9 27,88 21,67 19,02 16,92 14,68 27,88 21,67 19,02 16,92 10 29,59 23,21 20,48 18,31 15,99 29,59 23,21 20,48 18,31 11 31,26 24,73 21,92 19,68 17,28 31,26 24,73 21,92 19,68 12 32,91 26,22 23,34 21,03 18,55 32,91 26,22 23,34 21,03 13 34,53 27,69 24,74 22,36 19,81 34,53 27,69 24,74 22,36 14 36,12 29,14 26,12 23,69 21,06 36,12 29,14 26,12 23,69 15 37,70 30,58 27,49 25,00 22,31 37,70 30,58 27,49 25,00 16 39,25 32,00 28,85 26,30 23,54 39,25 32,00 28,85 26,30 17 40,79 33,41 30,19 27,59 24,77 40,79 33,41 30,19 27,59 18 42,31 34,81 31,53 28,87 25,99 42,31 34,81 31,53 28,87 19 43,82 36,19 32,85 30,14 27,20 43,82 36,19 32,85 30,14 20 45,32 37,57 34,17 31,41 28,41 45,32 37,57 34,17 31,41
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 14
Esercizio
Il rilevamento dei gruppi sanguigni effettuato in tre località diverse
ha dato i seguenti risultati:
Gruppo sanguigno
Località I Località II Località III
A 100 70 122 B 70 38 80
AB 15 20 48
0 185 122 176
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 15
1) Qual è il gruppo sanguigno più frequente?
2) Qual è la frequenza relativa del gruppo sanguigno B nella
località I?
3) Rispetto al totale complessivo, che percentuale rappresenta il
gruppo AB della località III
4) Tra i soggetti con gruppo 0, quale quota percentuale va
attribuita alla località II?
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 16
1) Il gruppo sanguigno più frequente è il gruppo 0.
2) 70/370= 0,19
3) 48/1046 = 0,05 = 5%
4) 122/483 = 0,25 =25%
Gruppo sanguigno Località I % Località II % Località III % Totale
A 100 27 70 28 122 29 292 B 70 19 38 15 80 19 188
AB 15 4 20 8 48 11 83
0 185 50 122 49 176 41 483 Totale 370 100 250 100 426 100 1046
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 17
Esercizio
In un ospedale piemontese nell’ultimo anno sono stati registrati 512
parti. Sono nati 260 maschi e 252 femmine. Il peso del neonato è
stato tra 1 e 2 kg per 59 maschi e 81 femmine, tra 2 e 3 kg per 102
maschi e 114 femmine, tra 3 e 4 kg per 72 maschi e 50 femmine,
tra 4 e 5 kg per i restanti neonati.
1) Riportate i risultati in una tabella, completando i dati mancanti.
Indicate chiaramente il titolo della tabella e il significato delle righe e
delle colonne. Calcolate sia la frequenza assoluta sia la frequenza
relativa percentuale sul totale di 512 neonati
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 18
2) Stabilire la tipologia delle variabili “peso” e “sesso” motivandone
la risposta
3) Disegnate l’istogramma con la frequenza assoluta dei diversi
pesi tra i soli maschi
4) Qual è la proporzione di femmine con peso tra 1 e 2 kg sul totale
delle femmine nate?
5) Indicate a parole il significato del simbolo >=
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 19
1)
2) La variabile “peso” è di tipo numerico continuo; è il risultato di
un’operazione di misura e può assumere tutti i valori all’interno di
un intervallo.
La variabile “sesso” è di tipo categorico nominale. Non è possibile
effettuare un ordinamento tra le modalità.
Maschi Femmine Totale n Frequenza relativa
percentuale n Frequenza relativa
percentuale
1<=x<2 59 12% 81 16% 140 2<=x<3 102 20% 114 22% 216 3<=x<4 72 14% 50 10% 122 4<=x<5 27 5% 7 1% 34
Totale 260 51% 252 49% 512
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 20
3)
Frequenza assoluta dei pesi dei neonati maschi
0
20
40
60
80
100
120
1<=x<2 2<=x<3 3<=x<4 4<=x<5
peso del neonato
freq
uenz
a as
solu
ta
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 21
4) Proporzione di femmine con peso tra 1 e 2 kg sul totale delle
femmine nate:
81/252=0,32
5) >= significa maggiore o uguale
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 22
Esercizio
In un reparto di un ospedale, nell’ultimo mese sono stati ricoverati
230 pazienti. Si sono registrati 98 fumatori e 132 non fumatori.
Per i soggetti con età (in anni compiuti) tra 0 e 20 anni, i fumatori
sono stati 4 e i non fumatori 22; tra i 20 e i 40 anni I fumatori erano
45 e i non fumatori 47; tra i 40 e 60 anni 39 fumatori e 45 non
fumatori; tra i 60 e gli 80 anni 10 fumatori e 16 non fumatori. I
soggetti rimanenti avevano un’età compresa tra gli 80 e i 100 anni.
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 23
a. Riportare i risultati in una tabella, completando i dati mancanti.
Indicate chiaramente il titolo della tabella ed il significato delle
righe e delle colonne. Calcolate sia la frequenza assoluta, sia
la proporzione, sul totale di 230 ricoveri.
b. Stabilire la tipologia della variabile “età” e motivarne la risposta.
c. Disegnare l’istogramma con la proporzione dei fumatori nelle
diverse età sul totale di soggetti
d. Qual è la proporzione di fumatori con età compresa tra 40 e 60
anni sul totale dei fumatori? E sul totale dei soggetti?
e. Qual è la percentuale di non fumatori con età compresa tra i 60
e gli 80 anni sul totale dei soggetti?
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 24
1)
2. L’età è una variabile discreta in quanto risulta da un conteggio e
assume valori interi
Fumatori Non fumatori Totale n Proporzione n Proporzione n
0<=x<20 4 0,02 22 0,10 26 20<=x<40 45 0,20 47 0,20 92 40<=x<60 39 0,17 45 0,19 84 60<=x<80 10 0,04 16 0,07 26
80<=x<100 0 0 2 0,01 2 Totale 98 0,43 132 0,57 230
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 25
3.
Proporzione di fumatori nelle diverse classi d'età
0
0,05
0,1
0,15
0,2
0,25
0<=x<20 20<=x<40 40<=x<60 60<=x<80 80<=x<100età
freq
uenz
a re
lativ
a
4. Proporzione di fumatori tra i 40 e i 60 anni sul totale dei fumatori:
39/98 =0,40. Proporzione di fumatori tra i 40 e i 60 anni sul totale
dei soggetti: 39/230 =0,17
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 26
5. Percentuale di non fumatori con età compresa tra i 60 e gli 80
anni sul totale dei soggetti: 16/230 = 0,07
0,07*100 = 7%
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 27
Esercizio: L’elenco seguente comprende i pazienti ricoverati nel vostro reparto nell’ultimo mese (n=neoplasia; a=altro)
età durata della degenza sesso tipo di malattia 25 5 M A 33 16 M A 34 8 M A 37 2 M N 37 8 M A 39 7 M N 45 18 F N 48 5 F N età durata della degenza sesso tipo di malattia 50 4 F A 52 7 F N 55 8 F N 59 8 F A 75 12 F N
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 28
a) Sintetizzate i risultati completando la seguente tabella. Inserite i
dati mancanti, seguendo le indicazioni fornite dal titolo della tabella
e dalle intestazioni delle righe e delle colonne.
Distribuzione di frequenza dei ricoveri nel reparto , per
sesso e durata del ricovero
Durata del ricovero
<= 7 giorni
> 7 giorni TOTALE
Maschi Sesso
Femmine
TOTALE
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 29
b) Calcolate: media, deviazione standard e coefficiente di
variazione dell’età. Indicate chiaramente le formule. c) Disegnare un istogramma con le frequenze della durata di
ricovero tra maschi e femmine.
d) Rappresentare le variabili età e durata della degenza con un
diagramma di dispersione e) Valutare se esiste un’associazione statisticamente significativa
tra sesso e tipo di malattia. Calcolare l’odds ratio e il relativo I.C
95%
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 30
a)
b) Media = Σ xi /n = 45,3
DS = [Σ (xi- x )2 / (n-1)] ½ = 13,3 Coefficiente di variazione % = DS/Media = 29 %
Distribuzione di frequenza dei ricoveri nel reparto , per sesso e durata del ricovero
Durata del ricovero
<= 7 giorni > 7 giorni TOTALE
Maschi 3 (2,8) 3 6 Sesso
Femmine 3 4 7
TOTALE 6 7 13
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 31
c)
Frequenza assoluta del numero di ricoveri per sesso
0
1
2
3
4
maschi femmine
<=7 giorni>7 giorni
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 32
d)
Durata della degenza in funzione dell'età
02468
101214161820
20 30 40 50 60 70 80
Età
Dur
ata
della
deg
enza
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 33
H0: non esiste associazione tra tipo di malattia e sesso
χ2 = (2-3,2)2 + (4-2,8) 2 + (5-3,8) 2 + (2-3,2) 2 =
3,2 2,8 3,8 3,2
= 0,45 + 0,51 + 0,38 + 0,45 = 1,79
sulle tavole trovo (1 grado di libertà) χ2 = 3,84
1,79 < 3,84 quindi non rifiuto H0
Distribuzione di frequenza dei ricoveri nel reparto , per sesso e tipo di malattia
Tipo di malattia
neoplasia altro TOTALE
Femmine 5 (attesi: 3,8) 2 (attesi: 3,2) 7 Sesso
Maschi 2 (attesi: 3,2) 4 (attesi:2,8) 6
TOTALE 7 6 13
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 34
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 35
OR = 20/4 = 5 I.C. 95% : (0,47;52,96) Le femmine hanno un rischio 5 volte superiore rispetto ai maschi di sviluppare una neoplasia.
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 36
I risultati di uno studio (di tipo caso-controllo) sono riassunti nella
seguente tabella:
Casi di tumore del
polmone
Controlli Totale
Fumatori ed ex
fumatori
86 120 206
Non Fumatori 14 80 94
Totale 100 200 300
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 37
a. Come indicatore di associazione decidete di calcolare l’Odds
Ratio. Scrivete la formula ed il risultato che ottenete.
b. Come interpretate il valore di Odds Ratio che avete ottenuto? c. Indicate il test statistico che ritenete appropriato nel caso dato,
tra i seguenti.
Chi-quadrato Test z Test t per dati appaiati Test t per dati non appaiati
d. Avete fissato l’errore di 1° tipo al 5%. Defini te l’errore di 1° tipo
(anche detto errore alfa) e. Applicate il test che avevate scelto, effettuando i calcoli
necessari. Presentate chiaramente formule e risultati. Indicate il valore di probabilità corrispondente al risultato del test, avvalendovi delle tabelle allegate.
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 38
a. OR = 4,1
b. I soggetti fumatori ed ex fumatori hanno un rischio 4,1 volte superiore di sviluppare tumore del polmone rispetto ai non fumatori
c. Chi quadrato d. Alfa è la probabilità di rifiutare l’ipotesi nulla quando è vera e. H0: non esiste associazione tra fumo e malattia
Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno - a.a 2007-2008 39
χ2 = (86-68,7)2/ 68,7+ (120-137,3) 2 / 137,3 + (14-31,3) 2 / 31,3+
(80-62,7) 2 / 62,7 = 4,4 + 2,2 + 9,6 + 4,8 = 21
sulle tavole trovo (1 grado di libertà) χ2 = 3,84
21 > 3,84 quindi rifiuto H0
Casi di tumore del
polmone
Controlli Totale
Fumatori ed ex
fumatori
86 (attesi: 68,7) 120 (attesi: 137,3) 206
Non Fumatori 14 (attesi: 31,3) 80 (attesi: 62,7) 94
Totale 100 200 300