Post on 14-Jul-2020
1
LM Biologia Sperimentale ed Applicata.
Anno accademico 2014-2015
BIOSTATISTICA Prima parte
2
INTR ODUZIONE
3
• STATISTICA DESCRITTIVA Insieme di metodi per la raccolta, l’organizzazione, la sintesi di dati. • STATISTICA INFERENZIALE Insieme di metodi che permettono di analizzare i dati estratti da un campione limitato per arrivare a conclusioni applicabili all’intera popolazione. I dati provengono dall’area biologico-sperimentale
STATISTICA
4
Finalità di uno studio statistico
• Rispondere a quesiti scientifici come: Le osservazioni che ho fatto hanno portato a risultati diversi dal caso e significativi ? L’esperimento che ho condotto ha portato a risultati diversi dal caso e significativi ? Es: Vi e’ associazione fra un determinato gene e una specifica malattia? Es: Diverse condizioni di allevamento determinano variazioni significative di questo carattere del fenotipo? Es: Quale antibiotico funziona meglio nei confronti di questo ceppo batterico? ……
• Predire quantità non osservate o non osservabili: Es: L’incidenza dell’influenza nella prossima stagione invernale; Es: Il numero di animali nati in allevamento nel prossimo anno; Es: La variazione in biomassa in rapporto al cambio climatico .
STUDI STATISTICI
5
1 Individuazione del problema
2 Formulazione dell’ipotesi
5 Verifica delle
ipotesi
4 Raccolta e analisi dei
dati
3 Elaborazione del piano di ricerca
FASI DI UNO STUDIO
6
• STUDI SPERIMENTALI Il ricercatore interviene direttamente sul valore delle variabili primarie negli casi-individui studiati (tipico esperimento di laboratorio o di studi clinici in cui si controlla il trattamento). Limitato impiego uomo-animale per fattori etici.
• STUDI OSSERVAZIONALI Il ricercatore non interviene direttamente, non manipola le variabili primarie, ma osserva ciò che accade naturalmente, spontaneamente (effetto della dieta, dell’inquinamento , delle stagioni….). Largo impiego: non esistono problemi etici
7
DESCRITTIVI: ECOLOGICI
STUDI OSSERVAZIONALI TRASVERSALI ANALITICI PROSPETTIVI CASO-CONTROLLO
8
LA RACCOLTA DEI DATI
può essere effettuata: • Indirettamente Da banche dati, da dati interni (registri, siti web, cartelle cliniche, archivi museali, lavori precedenti…). • Direttamente Mediante sperimentazione o con indagine anche retrospettiva tramite questionario.
9
GLOSSARIO MINIMO
10
POPOLAZIONE
Totalità di elementi cui il ricercatore è interessato in un dato studio.
POPOLAZIONE FINITA Gli elementi sono in numero finito e quindi potrebbero essere tutti osservati.
• I residenti nel Comune di Pavia nell’anno 1950; • gli studenti iscritti a questo corso.
POPOLAZIONE INFINITA Gli elementi sono una successione infinita.
• I soggetti affetti da AIDS; • Il numero di batteri del genere…”Clostridium,
Bacillus, Escherichia….”
È una popolazione infinita perché non limitata né nel tempo né nello spazio.
11
CAMPIONE Parte di popolazione selezionata per la raccolta dei dati. Un campione è un sottoinsieme di una popolazione. Popolazione
Campione ⊂ Popolazione
Campione
12
UNITA’ STATISTICA
Minima unità da cui si raccolgono i dati in un’indagine
o, in altre parole, ciascuno dei componenti il campione su cui si rilevano i dati. Esempio Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo.
Le unità statistiche sono i singoli animali del parco faunistico, nell’arco di tempo considerato. La natura dell’unità statistica è varia, ma è costante nello studio.
13
VARIABILE Caratteristica rilevata su ogni unità statistica, che può assumere valori diversi nelle diverse unità statistiche. • Statura degli studenti maschi iscritti al 1o anno
del Corso di Laurea in Ingegneria nel corrente a.a.;
• Gruppo sanguigno A, B, AB, 0 dei soggetti
campionati; • Intensità di reazione, ad un antigene (nulla,
bassa, alta) nei soggetti studiati.
14
OSSERVAZIONE Valore assunto da una variabile in una determinata unità statistica.
UNITÀ VARIABILE STATISTICA (PESO)
Individuo 1 80 kg \ Individuo 2 75 kg — OSSERVAZIONI Individuo 3 78 kg /
15
• QUALITATIVE
� NOMINALI - DICOTOMICHE - POLITOMICHE
� ORDINALI
• QUANTITATIVE
� DISCRETE � CONTINUE
CLASSIFICAZIONE DELL E VARIABILI
16
VARIABILI QUALITATIV E Sono classificate in categorie.
1. QUALITATIVE NOMIN ALI Solo il nome della modalità è importante e non esiste concetto di ordine tra le diverse modalità. a. DICOTOMICHE: presentano solo 2 modalità, non ordinabili.
• Sesso = M/F • Sopravvivenza = Vivo/Morto • Positivo –negativo al virus HIV
………….. b. POLITOMICHE: presentano più di 2 modalità, non ordinabili.
• Colore dei capelli •Gruppo sanguigno (A, B, AB, 0) •Razza di una specie (cocker, terrier, bassotto….)
17
2. QUALITATIVE ORDIN ALI È possibile stabilire un ordine tra le modalità:
• Livello socio-economico (basso-medio-alto) • Livelli di obesità (sovrappeso- Obesità I- Obesità II- Obesità III) • Abitudine all’uso di un presidio medico (mai-talvolta-sempre) • Intensità di reazione ad un antigene (nulla, media, elevata) La differenza-distanza tra i livelli non è costante ed esattamente determinata ( la distanza tra livello basso e medio non è uguale o confrontabile con la distanza tra livello medio ed alto e viceversa).
18
VARIABILI QUANTITATIVE Sono espresse da numeri.
1. DISCRETE Possono assumere solo particolari valori entro un determinato intervallo (corrispondenza biunivoca con l’insieme dei numeri naturali *1). Sono derivate da conteggi.
• Numero di figli per donna • Numero di colonie di E. coli su piastra • Numero di cromosomi di una specie
2. CONTINUE Possono assumere qualsiasi valore entro un determinato intervallo (corrispondenza biunivoca con i numeri reali*2). Non sono derivate da conteggi, ma da misure.
• Peso • Altezza • Colesterolo ematico • Pressione arteriosa (PAS e PAD)
19
*1
Numeri naturali
In matematica, l'espressione "numeri naturali" indica l'insieme {0, 1, 2, 3, 4,
...}. Esso viene fatto corrispondere biunivocamente all'insieme dei "numeri
interi non negativi" {0, +1, +2, +3, +4, ...}. Talvolta viene, impropriamente,
usata anche per indicare l'insieme { 1, 2, 3, 4, ...}, corrispondente
biunivocamente all'insieme dei numeri interi positivi {+1, +2, +3, +4, ...} .
*2
Numeri reali
In matematica, i numeri reali possono essere descritti in maniera non formale
come numeri ai quali è possibile attribuire uno sviluppo decimale finito o
infinito, come π = 3,141592... I numeri reali possono essere positivi, negativi
o nulli e comprendono, come casi particolari, i numeri interi (come 12),
i numeri razionali (come −22⁄7) e i numeri irrazionali algebrici (come la radice
quadrata di 2) .
20
• NOMINALE
• ORDINALE
• INTERVALLARE
• DI RAPPORTI
SCALE DI MISURA
21
SCALA NOMINALE Per variabili qualitative nominali. Consiste in due o più categorie, mutuamente esclusive. Esempi: • genere sessuale (1= maschio 2=femmina);
• stato civile (1=celibe- 2=nubile-3=coniugato);
• attività economica (1=…2=...3=…k=…) I numeri sono utilizzati per identificare le categorie: sono solo codifiche, non riflettono una sottostante scala quantitativa. .
22
SCALA ORDINALE Per variabili qualitative ordinali. (Ma anche per variabili quantitative che sono state misurate o raggruppate in maniera ordinale). Consiste in due o più categorie, mutuamente esclusive, tra cui è possibile stabilire un ordinamento lineare, una gerarchia. Esempio: livelli di una patologia lieve (1)
moderata (2) grave (3)
Il valore numerico associato ad ogni categoria differenzia i soggetti con diverse entità della patologia; a valori elevati della scala corrispondono intensità maggiori di malattia.
23
SCALA INTERVALLA RE
Per variabili quantitative. E’ possibile stabilire un ordinamento tra le classi; è possibile calcolare la distanza tra due osservazioni, ma non il rapporto. Esempio: temperatura Si utilizza per quelle variabili quantitative per le quali è possibile stabilire uno ZERO ARBITRARIO: lo zero della scala non indica assenza dell’attributo.
24
SCALA DI RAPPORTI Per variabili quantitative. E’ possibile eseguire tutte le operazioni matematiche. Esempi: peso, altezza, velocità Si utilizza per quelle variabili quantitative per le quali è possibile stabilire uno ZERO ASSOLUTO.
B pesa il doppio di A in entrambe le scale.
PESO A B Kg 10 20 Libbre 22.04 44.08
25
26
27
• TRASFORMAZIONE E STANDARDIZZAZIONE
• RAGGRUPPAMENTO IN CLASSI ORDINALI DI UNA VARIABILE
CONTINUA
• TRASFORMAZIONE IN SC ALA A RANGHI
TRASFORMAZIONE DI VARIABILI PER ESIGEN ZE
DI ANALISI
28
STANDARDIZZAZIONE E TRASFORMAZIONE
Una variabile quantitativa continua può essere ulteriormente standardizzata o trasformata per esigenze di: • confronto tra variabili o campioni da effettuarsi con la medesima una scala di misurazione ( es. test Z confronto medie);
• analisi multivariate con variabili a diversa scala
di misurazione (es. analisi componenti principali); • riduzione della asimmetria dei valori di una variabile per test che la necessitano (es. trasformazione di Cox-Box);
• esigenze di presentazione e rappresentazione
grafica ( es. tassi epidemiologici: x100000, LogX );
29
con la Standardizzazione si attua una modifica dei dati utilizzando statistiche calcolate dai dati stessi.
Centratura : Xi = X - X
La media aritmetica della variabile è sottratta ad ogni valore, centra i dati attorno alla media=0. Normalizzazione: Ad ogni valore è sottratta la media aritmetica e quindi diviso per la deviazione standard; centra i dati attorno alla media=0 con una deviazione standard =1 per tutte le variabili od i campioni standardizzati.
n X Y X normalizzato Y normalizzato 1 0.30 120.50 -1.25 1.57 2 1.50 110.10 -0.90 1.29 3 1.50 89.70 -0.90 0.74 4 2.90 81.20 -0.50 0.51 5 3.50 69.30 -0.33 0.18 6 4.90 45.30 0.08 -0.47 7 5.20 31.40 0.16 -0.85 8 6.50 31.40 0.54 -0.85 9 8.50 31.40 1.11 -0.85 10 11.50 15.20 1.98 -1.29
media 4.63 62.55 0 0 Dev. st. 3.48 36.82 1 1
30
Trasformazione lineare:
X i = X*b Tutti i valori sono moltiplicati per una costante b, cambia i valori assoluti ma non l’essenza dei risultati, Trasformazione Logaritmica :
X i = logc X Ogni valore è sostituito dal suo logaritmo in base c, riduce le grandi differenze assolute ovvero “distorce”aumentando i valori più bassi rispetto a quelli più alti. Se è presente il valore X =0 si utilizza Xi = logc (X+1) Trasformazione con elevamento a potenza
X i = Xc
I valori originali sono elevati a potenza, se il valore c è > 1 vengono aumentati i valori più alti, se c < 1 (es. c= 0.5 trasformazione per radice quadrata) si riduce il peso dei valori più alti.
31
a: trasformazione logaritmica dei dati
asse x= dati originali, asse Y dati trasformati
b: trasformazione con elevamento a potenza dei dati asse x= dati originali, asse Y dati trasformati
32
• RAGGRUPPAMENTO IN CLASSI ORDINALI
DI UNA VARIABILE CON TINUA
I valori di una variabile continua sono raggruppati in classi ordinali per esigenze di sintesi. Si utilizza ad esempio per i valori di un indice (biologico, ecologico, biochimico, antropometrico…) che pur assumendo tutti i valori di una variabile quantitativa è tuttavia meglio espresso in poche classi ordinali. Esempio: BMI (Body Mass Index) e classi di obesità
BMI <18.5 BMI classi =0 sottopeso
BMI 18.5-24.9 BMI classi = 1 normopeso
BMI 25-29,9 BMI classi = 2 sovrappeso
BMI 30-34,9 BMI classi = 3 obesità I lieve
BMI 35-39,9 BMI classi = 4 obesità II media
BMI >40 BMI classi = 5 obesità III grave
33
I valori di BMI sono riassunti in classi ed appaiono
BMI (Kg/ m2)
BMI classi
Condizione
24.32 1 normopeso 22.03 1 normopeso 29.58 2 sovrappeso 28.57 2 sovrappeso 34.21 3 obesità I lieve 32.5 3 obesità I lieve
37.88 4 obesità II media 36.35 4 obesità II media 41.56 5 Obesità III grave 42.25 5 obesità III grave
Var. continua Var. qualitativa ordinale Sebbene le variabili continue siano più informative il raggruppamento in classi ordinali permette valutazioni descrittive di sintesi : o conteggi %, analisi e grafici di frequenza, test di
differenza di proporzione; o tabelle di contingenza con misure di associazione (es.
Chi2); o analisi di una variabile non raggruppata per gruppi-
strati di una seconda variabile raggruppata (es. valori glicemia per età raggruppata in giovane-media-anziana).
34
TRASFORMAZIONE IN SC ALA A RANGHI La scala a ranghi ordina gli elementi di un gruppo dal maggiore al minore in accordo alla grandezza delle osservazioni, assegna i numeri d'ordine corrispondenti alla posizione occupata (rango) e trascura le distanze tra gli elementi ordinati. Questa trasformazione permette di applicare test statistici quando le variabili originarie non soddisfano le assunzioni dei test parametrici più usati (es. analisi non parametriche test Mann-Whitney, ANOVA Kruskal Wallis, correlazione di Spearman). Procedura: o Le n1, n2,…nk osservazioni provenienti da k
campioni (ma anche da un solo campione) sono aggregate in unica serie di dati di dimensioni n e messe in ordine crescente.
o Alle osservazioni vengono poi assegnati dei ranghi partendo da1, che viene dato alla più piccola, fino ad n che viene dato alla più grande.
o Quando due o più osservazioni hanno lo stesso valore ad ogni osservazione viene assegnata la media dei ranghi di tutte le osservazioni con lo stesso valore.
35
Esempio:
Variabile: contenuto nucleare di DNA in pg ( Rattus norvegicus)
Campione 1 Campione 2 Campione 3 2.98 3.33 2.95 3.15 2.86 3.05 3.5 3.12 3.42
2.89 3.02 2.9 3.05 2.98 2.87 3.15 3.12
Raggruppamento ed assegnazione dei ranghi
n Variabile originale
Rango
campione
1 2.86 1 2 2 2.87 2 3 3 2.89 3 1 4 2.9 4 3 5 2.95 5 3 6 2.98 6.5 1 7 2.98 6.5 2 8 3.02 8 2 9 3.05 9.5 1
10 3.05 9.5 3 11 3.12 11.5 2 12 3.12 11.5 3 13 3.15 13.5 1 14 3.15 13.5 1 15 3.33 15 2 16 3.42 16 3 17 3.5 17 1
36
• MATRICE DATI • TABELLE SEMPLICI
• TABELLE A DOPPIA ENTRATA
• FREQUENZE • GRAFICI
RACCOLTA E ORGANIZZAZIONE DEI DATI
37
Immaginiamo di compiere una ricerca sulle abitudini alimentari degli studenti iscritti al quarto anno dei Corsi di Laurea dell’Università di Pavia nel corrente a.a. E’ necessario raccogliere dati-informazioni specifiche che poi sono elaborate ed analizzate:
• dalla popolazione d interesse si estrae un campione ( * tecniche di estrazione, * dimensioni del
campione) sufficientemente grande, es. 500 soggetti
• viene somministrato un questionario con
domande:
38
ID_________________________ Sesso ( 1= M, 2=F)____________ (var qualitativa nominale dicotomica)
Età (anni compiuti)____________ (var quantitativa continua) Peso ( Kg)___________________ (var quantitativa continua) Statura (cm)__________________ (var quantitativa continua) Quante volte mangi alla settimana (var quantitativa discreta)
Pasta_________________
Pesce_________________
Dolci _________________
Quante volte alla settimana salti i pasti principali
(var qualitativa ordinale)
(colazione, pranzo, cena)?
-mai – (=1)
-talvolta (=2)
- spesso (=3)
- sempre (=4)
Quante ore alla settimana fa attività fisica/sport?
(var qualitativa ordinale)
-mai (1) (=1) -meno di 1 ora(=2)
-1/2 ore (=3) -3/4 ore (=4)
-4/5 ore (=5) -6/7 ore (=6)
ecc….
36
E’ necessaria una
prima SINTESI delle informazioni raccolte
MATRICE DEI DATI
ID Sesso Età (anni)
Peso (kg)
Statura (cm)
Quante pasta
Quante pesce
Quante dolci
Quanto salta pasti
Quanto sport
1 M 21 70 165 1 2 1 mai 0
2 M 22 80 180 2 2 1 talvolta 1
3 F 19 60 169 3 1 2 mai 2
4 M 26 68 170 1 2 1.5 spesso 5
... … … … … … … … … …
500 F 24 45 155 3 1 2 sempre 3
I dati sono quindi esplorati e controllati mediante metodi di sintesi che, a seconda del tipo di variabile, calcolano misure di tendenza centrale e dispersione (variabili quantitative), realizzano tabelle calcolano frequenze e distribuzioni di frequenze realizzano grafici ( tutte le variabili).
37
TABELLE • TABELLE SEMPLICI Unità statistiche classificate secondo UNA delle variabili rilevate. • TABELLE A DOPPIA ENTRATA Unità statistiche classificate secondo DUE delle variabili rilevate.
38
TABELLA SEMPLICE (variabile qualitativa nominale)
Sesso Frequenza assoluta M 280 F 220
Totale 500
Legenda: M = maschio, F = femmina
39
TABELLA A DOPPIA ENTRATA Incrociamo le variabili “Sesso” e “Quanto salta i pasti (volte/settimana)”.
Sesso Salta i pasti
(volte/settimana) M F Totale
Mai -1 40 10 50 Talvolta-2 200 50 250 Spesso-3 30 100 130 Sempre-4 10 60 70
Totale 280 220 500
40
TABELLA SEMPLICE (variabile quantitativa continua)
Statura (cm)
FREQUENZA ASSOLUTA
152 3 153 4 154 6 155 6 … … … … 192 6 193 4 194 2
Totale 500
41
È NECESSARIO RAGGRUPPARE I DATI IN CLASSI
• MUTUAMENTE ESCLUSIVE • ESAUSTIVE
• QUANTE CLASSI?
- Regola del buon senso: non meno di 6 non più di 15.
- Formula di Sturges: k=1+3,322 (log10n)
dove k= numero di classi n= numero di osservazioni
• DI QUALE AMPIEZZA?
- Regole del buon senso: � sono consigliabili classi di ampiezza 5, 10 o multipli di 10 e
terminanti con 0 o con 5; � se è possibile, formare classi di uguale ampiezza
- Formula per il calcolo dell’ampiezza w=R/k
dove R= range k= numero di classi
• COME INDICARLE?
42
DISTRIBUZIONE DI FREQUENZA
DATI RAGGRUPPATI IN CLASSI 9 CLASSI di AMPIEZZA 5
Altezza (cm) Frequenza assoluta [150 - 155) 13 [155 - 160) 26 [160 - 165) 58 [165 - 170) 99 [170 - 175) 88 [175 - 180) 82 [180 - 185) 95 [185 - 190) 22 [190 - 195) 17
Totale 500
1a classe → [150 - 155) 150 estremo inferiore 155 estremo superiore aperto
155 è, in realtà, l’estremo inferiore della classe successiva. Pertanto la 1a classe raggruppa le osservazioni comprese nell’intervallo (150 - 154,9999…). 2a classe → [155 - 160) 155 estremo inferiore 160 estremo superiore aperto
160 è, in realtà, l’estremo inferiore della classe successiva. Pertanto la 2a classe raggruppa le osservazioni comprese nell’intervallo (155 - 159,9999…). .... e così via ….
43
FREQUENZE
ASSOLUTA N° di volte in cui si osserva ciascuna modalità (o valore) di una variabile.
RELATIVA Frequenza assoluta / numero totale casi
0 ≤ freq. rel. ≤ 1
PERCENTUALE Frequenza relativa*100 0 ≤ frequenza% ≤ 100
CUMULATIVA Fornisce, per ogni valore x della variabile X di interesse, la frequenza delle osservazioni con
valore minore o uguale a x.
44
RIEPILOG O
Per una variabile continua definiamo la frequenza:
• assoluta (n) • relativa (f) • percentuale (p) • percentuale cumulata (P)
Statura (cm)
n Frequenza assoluta
f Frequenza
relativa
p Frequenza
%
P Frequenza %
cumulata
[150-155) 13 13/500=0.026 2.6 2.6 [155-160) 26 26/500=0.052 5.2 2.6+5.2=7.8 [160-165) 58 58/500=0.116 11.6 2.6+…+11.6=19.4 [165-170) 99 99/500=0.198 19.8 2.6+…+19.8=39.2 [170-175) 88 88/500=0.176 17.6 2.6+…+17.6=56.8 [175-180) 82 82/500=0.164 16.4 2.6+…+16.4=73.2 [180-185) 95 95/500=0.190 19.0 2.6+…+19.0=92.2 [185-190) 22 22/500=0.044 4.4 2.6+…+4.4=96.6 [190-195] 17 17/500=0.034 3.4 2.6+…+3.4=100
Totale 500 1 100
45
Per una variabile nominale:
Stato civile
n f p
0 3 0.3 30% 1 4 0.4 40% 2 2 0.2 20% 3 1 0.1 10%
Totale 10 1 100% Legenda: 0 = non coniugato/a
1 = coniugato/a 2 = separato/a 3 = vedovo/a
N.B. Per le variabili qualitative nominali non ha senso calcolare le frequenze cumulate, perché tra le loro modalità non è possibile stabilire una gerarchia.
46
GRAFICI
47
GRAFICI
DI VARIABILI QUALITATIVE (e QUANTITATIVE DISCRETE)
• DIAGRAMMA A BARRE O COLONNE La base delle colonne è uguale, l’altezza è proporzionale alla frequenza. • DIAGRAMMA CIRCOLARE Ad ogni modalità della variabile corrisponde un settore circolare la cui area è proporzionale alla frequenza della modalità considerata.
L’ampiezza di ogni settore circolare è data da: 360:αi=100:fi
L’uso di diagrammi a colonne distanziate e di diagrammi circolari enfatizza il fatto che i dati vengono considerati in categorie discrete, distinte e separate.
48
DIAGRAMMA A COLONNE
Sesso280
220
050
100150200250300
M F
Fre
quen
za
DIAGRAMMA CIRCOLARE
Sesso
280220 M
F
Sesso Frequenza assoluta M 280 F 220
Totale 500
49
GRAFICI DI VARIABILI QUANT ITATIVE
CONTINUE • ISTOGRAMMA
Colonne non distanziate* di area proporzionale alla frequenza.
*colonne non distanziate, perché i dati sono misurati su scala continua. • POLIGONO DI FREQUENZA Ogni punto, corrispondente a un intervallo, ha coordinata orizzontale data dal valore centrale dell’intervallo e coordinata verticale data dalla frequenza delle osservazioni comprese in quell’intervallo.
50
ISTOGRAMMA
0
20
40
60
80
100
120
[150-155)
[155-160)
[160-165)
[165-170)
[170-175)
[175-180)
[180-185)
[185-190)
[190-195)
Altezza (cm)
Fre
quen
za
Altezza (cm) Frequenza assoluta [150 - 155) 13 [155 - 160) 26 [160 - 165) 58 [165 - 170) 99 [170 - 175) 88 [175 - 180) 82 [180 - 185) 95 [185 - 190) 22 [190 - 195) 17
Totale 500
51
POLIGONO DI FREQUENZ A
0
20
40
60
80
100
120
[150-155)
[155-160)
[160-165)
[165-170)
[170-175)
[175-180)
[180-185)
[185-190)
[190-195)
Altezza (cm)
Fre
quen
za
Altezza (cm) xk Frequenza assoluta [150 - 155) 152.5 13 [155 - 160) 157.5 26 [160 - 165) 162.5 58 [165 - 170) 167.5 99 [170 - 175) 172.5 88 [175 - 180) 177.5 82 [180 - 185) 182.5 95 [185 - 190) 187.5 22 [190 - 195) 192.5 17
Totale 500
52
GRAFICI DI FREQUENZA CUMULATIVA :
a. VARIABILE DISCRETA: DIAGRAMMA A GRADINI
0
5
10
15
20
25
30
1 2 3 4 5 6
n° di componenti familiari
Fre
quen
za c
umul
ata
n° di componenti familiari
Frequenza assoluta Frequenza assoluta cumulativa
1 4 4 2 3 7 3 8 15 4 9 24 5 2 26 6 1 27
27
53
b. VARIABILE CONTINUA SIGMOIDE
0
20
40
60
80
100
120
155 160 165 170 175 180 185 190 195
Altezza (cm)
Fre
quen
za %
cum
ulat
a
Altezza
(cm) Frequenza assoluta
Frequenza relativa
Frequenza %
Frequenza % cumulata
[150-155) 13 13/500=0.026 2.6 2.6 [155-160) 26 26/500=0.052 5.2 2.6+5.2=7.8 [160-165) 58 58/500=0.116 11.6 2.6+…+11.6=19.4 [165-170) 99 99/500=0.198 19.8 2.6+…+19.8=39.2 [170-175) 88 88/500=0.176 17.6 2.6+…+17.6=56.8 [175-180) 82 82/500=0.164 16.4 2.6+…+16.4=73.2 [180-185) 95 95/500=0.190 19.0 2.6+…+19.0=92.2 [185-190) 22 22/500=0.044 4.4 2.6+…+4.4=96.6 [190-195) 17 17/500=0.034 3.4 2.6+…+3.4=100
Totale 500 1 100