BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un...

Post on 14-Jul-2020

2 views 0 download

Transcript of BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un...

1

LM Biologia Sperimentale ed Applicata.

Anno accademico 2014-2015

BIOSTATISTICA Prima parte

2

INTR ODUZIONE

3

• STATISTICA DESCRITTIVA Insieme di metodi per la raccolta, l’organizzazione, la sintesi di dati. • STATISTICA INFERENZIALE Insieme di metodi che permettono di analizzare i dati estratti da un campione limitato per arrivare a conclusioni applicabili all’intera popolazione. I dati provengono dall’area biologico-sperimentale

STATISTICA

4

Finalità di uno studio statistico

• Rispondere a quesiti scientifici come: Le osservazioni che ho fatto hanno portato a risultati diversi dal caso e significativi ? L’esperimento che ho condotto ha portato a risultati diversi dal caso e significativi ? Es: Vi e’ associazione fra un determinato gene e una specifica malattia? Es: Diverse condizioni di allevamento determinano variazioni significative di questo carattere del fenotipo? Es: Quale antibiotico funziona meglio nei confronti di questo ceppo batterico? ……

• Predire quantità non osservate o non osservabili: Es: L’incidenza dell’influenza nella prossima stagione invernale; Es: Il numero di animali nati in allevamento nel prossimo anno; Es: La variazione in biomassa in rapporto al cambio climatico .

STUDI STATISTICI

5

1 Individuazione del problema

2 Formulazione dell’ipotesi

5 Verifica delle

ipotesi

4 Raccolta e analisi dei

dati

3 Elaborazione del piano di ricerca

FASI DI UNO STUDIO

6

• STUDI SPERIMENTALI Il ricercatore interviene direttamente sul valore delle variabili primarie negli casi-individui studiati (tipico esperimento di laboratorio o di studi clinici in cui si controlla il trattamento). Limitato impiego uomo-animale per fattori etici.

• STUDI OSSERVAZIONALI Il ricercatore non interviene direttamente, non manipola le variabili primarie, ma osserva ciò che accade naturalmente, spontaneamente (effetto della dieta, dell’inquinamento , delle stagioni….). Largo impiego: non esistono problemi etici

7

DESCRITTIVI: ECOLOGICI

STUDI OSSERVAZIONALI TRASVERSALI ANALITICI PROSPETTIVI CASO-CONTROLLO

8

LA RACCOLTA DEI DATI

può essere effettuata: • Indirettamente Da banche dati, da dati interni (registri, siti web, cartelle cliniche, archivi museali, lavori precedenti…). • Direttamente Mediante sperimentazione o con indagine anche retrospettiva tramite questionario.

9

GLOSSARIO MINIMO

10

POPOLAZIONE

Totalità di elementi cui il ricercatore è interessato in un dato studio.

POPOLAZIONE FINITA Gli elementi sono in numero finito e quindi potrebbero essere tutti osservati.

• I residenti nel Comune di Pavia nell’anno 1950; • gli studenti iscritti a questo corso.

POPOLAZIONE INFINITA Gli elementi sono una successione infinita.

• I soggetti affetti da AIDS; • Il numero di batteri del genere…”Clostridium,

Bacillus, Escherichia….”

È una popolazione infinita perché non limitata né nel tempo né nello spazio.

11

CAMPIONE Parte di popolazione selezionata per la raccolta dei dati. Un campione è un sottoinsieme di una popolazione. Popolazione

Campione ⊂ Popolazione

Campione

12

UNITA’ STATISTICA

Minima unità da cui si raccolgono i dati in un’indagine

o, in altre parole, ciascuno dei componenti il campione su cui si rilevano i dati. Esempio Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo.

Le unità statistiche sono i singoli animali del parco faunistico, nell’arco di tempo considerato. La natura dell’unità statistica è varia, ma è costante nello studio.

13

VARIABILE Caratteristica rilevata su ogni unità statistica, che può assumere valori diversi nelle diverse unità statistiche. • Statura degli studenti maschi iscritti al 1o anno

del Corso di Laurea in Ingegneria nel corrente a.a.;

• Gruppo sanguigno A, B, AB, 0 dei soggetti

campionati; • Intensità di reazione, ad un antigene (nulla,

bassa, alta) nei soggetti studiati.

14

OSSERVAZIONE Valore assunto da una variabile in una determinata unità statistica.

UNITÀ VARIABILE STATISTICA (PESO)

Individuo 1 80 kg \ Individuo 2 75 kg — OSSERVAZIONI Individuo 3 78 kg /

15

• QUALITATIVE

� NOMINALI - DICOTOMICHE - POLITOMICHE

� ORDINALI

• QUANTITATIVE

� DISCRETE � CONTINUE

CLASSIFICAZIONE DELL E VARIABILI

16

VARIABILI QUALITATIV E Sono classificate in categorie.

1. QUALITATIVE NOMIN ALI Solo il nome della modalità è importante e non esiste concetto di ordine tra le diverse modalità. a. DICOTOMICHE: presentano solo 2 modalità, non ordinabili.

• Sesso = M/F • Sopravvivenza = Vivo/Morto • Positivo –negativo al virus HIV

………….. b. POLITOMICHE: presentano più di 2 modalità, non ordinabili.

• Colore dei capelli •Gruppo sanguigno (A, B, AB, 0) •Razza di una specie (cocker, terrier, bassotto….)

17

2. QUALITATIVE ORDIN ALI È possibile stabilire un ordine tra le modalità:

• Livello socio-economico (basso-medio-alto) • Livelli di obesità (sovrappeso- Obesità I- Obesità II- Obesità III) • Abitudine all’uso di un presidio medico (mai-talvolta-sempre) • Intensità di reazione ad un antigene (nulla, media, elevata) La differenza-distanza tra i livelli non è costante ed esattamente determinata ( la distanza tra livello basso e medio non è uguale o confrontabile con la distanza tra livello medio ed alto e viceversa).

18

VARIABILI QUANTITATIVE Sono espresse da numeri.

1. DISCRETE Possono assumere solo particolari valori entro un determinato intervallo (corrispondenza biunivoca con l’insieme dei numeri naturali *1). Sono derivate da conteggi.

• Numero di figli per donna • Numero di colonie di E. coli su piastra • Numero di cromosomi di una specie

2. CONTINUE Possono assumere qualsiasi valore entro un determinato intervallo (corrispondenza biunivoca con i numeri reali*2). Non sono derivate da conteggi, ma da misure.

• Peso • Altezza • Colesterolo ematico • Pressione arteriosa (PAS e PAD)

19

*1

Numeri naturali

In matematica, l'espressione "numeri naturali" indica l'insieme {0, 1, 2, 3, 4,

...}. Esso viene fatto corrispondere biunivocamente all'insieme dei "numeri

interi non negativi" {0, +1, +2, +3, +4, ...}. Talvolta viene, impropriamente,

usata anche per indicare l'insieme { 1, 2, 3, 4, ...}, corrispondente

biunivocamente all'insieme dei numeri interi positivi {+1, +2, +3, +4, ...} .

*2

Numeri reali

In matematica, i numeri reali possono essere descritti in maniera non formale

come numeri ai quali è possibile attribuire uno sviluppo decimale finito o

infinito, come π = 3,141592... I numeri reali possono essere positivi, negativi

o nulli e comprendono, come casi particolari, i numeri interi (come 12),

i numeri razionali (come −22⁄7) e i numeri irrazionali algebrici (come la radice

quadrata di 2) .

20

• NOMINALE

• ORDINALE

• INTERVALLARE

• DI RAPPORTI

SCALE DI MISURA

21

SCALA NOMINALE Per variabili qualitative nominali. Consiste in due o più categorie, mutuamente esclusive. Esempi: • genere sessuale (1= maschio 2=femmina);

• stato civile (1=celibe- 2=nubile-3=coniugato);

• attività economica (1=…2=...3=…k=…) I numeri sono utilizzati per identificare le categorie: sono solo codifiche, non riflettono una sottostante scala quantitativa. .

22

SCALA ORDINALE Per variabili qualitative ordinali. (Ma anche per variabili quantitative che sono state misurate o raggruppate in maniera ordinale). Consiste in due o più categorie, mutuamente esclusive, tra cui è possibile stabilire un ordinamento lineare, una gerarchia. Esempio: livelli di una patologia lieve (1)

moderata (2) grave (3)

Il valore numerico associato ad ogni categoria differenzia i soggetti con diverse entità della patologia; a valori elevati della scala corrispondono intensità maggiori di malattia.

23

SCALA INTERVALLA RE

Per variabili quantitative. E’ possibile stabilire un ordinamento tra le classi; è possibile calcolare la distanza tra due osservazioni, ma non il rapporto. Esempio: temperatura Si utilizza per quelle variabili quantitative per le quali è possibile stabilire uno ZERO ARBITRARIO: lo zero della scala non indica assenza dell’attributo.

24

SCALA DI RAPPORTI Per variabili quantitative. E’ possibile eseguire tutte le operazioni matematiche. Esempi: peso, altezza, velocità Si utilizza per quelle variabili quantitative per le quali è possibile stabilire uno ZERO ASSOLUTO.

B pesa il doppio di A in entrambe le scale.

PESO A B Kg 10 20 Libbre 22.04 44.08

25

26

27

• TRASFORMAZIONE E STANDARDIZZAZIONE

• RAGGRUPPAMENTO IN CLASSI ORDINALI DI UNA VARIABILE

CONTINUA

• TRASFORMAZIONE IN SC ALA A RANGHI

TRASFORMAZIONE DI VARIABILI PER ESIGEN ZE

DI ANALISI

28

STANDARDIZZAZIONE E TRASFORMAZIONE

Una variabile quantitativa continua può essere ulteriormente standardizzata o trasformata per esigenze di: • confronto tra variabili o campioni da effettuarsi con la medesima una scala di misurazione ( es. test Z confronto medie);

• analisi multivariate con variabili a diversa scala

di misurazione (es. analisi componenti principali); • riduzione della asimmetria dei valori di una variabile per test che la necessitano (es. trasformazione di Cox-Box);

• esigenze di presentazione e rappresentazione

grafica ( es. tassi epidemiologici: x100000, LogX );

29

con la Standardizzazione si attua una modifica dei dati utilizzando statistiche calcolate dai dati stessi.

Centratura : Xi = X - X

La media aritmetica della variabile è sottratta ad ogni valore, centra i dati attorno alla media=0. Normalizzazione: Ad ogni valore è sottratta la media aritmetica e quindi diviso per la deviazione standard; centra i dati attorno alla media=0 con una deviazione standard =1 per tutte le variabili od i campioni standardizzati.

n X Y X normalizzato Y normalizzato 1 0.30 120.50 -1.25 1.57 2 1.50 110.10 -0.90 1.29 3 1.50 89.70 -0.90 0.74 4 2.90 81.20 -0.50 0.51 5 3.50 69.30 -0.33 0.18 6 4.90 45.30 0.08 -0.47 7 5.20 31.40 0.16 -0.85 8 6.50 31.40 0.54 -0.85 9 8.50 31.40 1.11 -0.85 10 11.50 15.20 1.98 -1.29

media 4.63 62.55 0 0 Dev. st. 3.48 36.82 1 1

30

Trasformazione lineare:

X i = X*b Tutti i valori sono moltiplicati per una costante b, cambia i valori assoluti ma non l’essenza dei risultati, Trasformazione Logaritmica :

X i = logc X Ogni valore è sostituito dal suo logaritmo in base c, riduce le grandi differenze assolute ovvero “distorce”aumentando i valori più bassi rispetto a quelli più alti. Se è presente il valore X =0 si utilizza Xi = logc (X+1) Trasformazione con elevamento a potenza

X i = Xc

I valori originali sono elevati a potenza, se il valore c è > 1 vengono aumentati i valori più alti, se c < 1 (es. c= 0.5 trasformazione per radice quadrata) si riduce il peso dei valori più alti.

31

a: trasformazione logaritmica dei dati

asse x= dati originali, asse Y dati trasformati

b: trasformazione con elevamento a potenza dei dati asse x= dati originali, asse Y dati trasformati

32

• RAGGRUPPAMENTO IN CLASSI ORDINALI

DI UNA VARIABILE CON TINUA

I valori di una variabile continua sono raggruppati in classi ordinali per esigenze di sintesi. Si utilizza ad esempio per i valori di un indice (biologico, ecologico, biochimico, antropometrico…) che pur assumendo tutti i valori di una variabile quantitativa è tuttavia meglio espresso in poche classi ordinali. Esempio: BMI (Body Mass Index) e classi di obesità

BMI <18.5 BMI classi =0 sottopeso

BMI 18.5-24.9 BMI classi = 1 normopeso

BMI 25-29,9 BMI classi = 2 sovrappeso

BMI 30-34,9 BMI classi = 3 obesità I lieve

BMI 35-39,9 BMI classi = 4 obesità II media

BMI >40 BMI classi = 5 obesità III grave

33

I valori di BMI sono riassunti in classi ed appaiono

BMI (Kg/ m2)

BMI classi

Condizione

24.32 1 normopeso 22.03 1 normopeso 29.58 2 sovrappeso 28.57 2 sovrappeso 34.21 3 obesità I lieve 32.5 3 obesità I lieve

37.88 4 obesità II media 36.35 4 obesità II media 41.56 5 Obesità III grave 42.25 5 obesità III grave

Var. continua Var. qualitativa ordinale Sebbene le variabili continue siano più informative il raggruppamento in classi ordinali permette valutazioni descrittive di sintesi : o conteggi %, analisi e grafici di frequenza, test di

differenza di proporzione; o tabelle di contingenza con misure di associazione (es.

Chi2); o analisi di una variabile non raggruppata per gruppi-

strati di una seconda variabile raggruppata (es. valori glicemia per età raggruppata in giovane-media-anziana).

34

TRASFORMAZIONE IN SC ALA A RANGHI La scala a ranghi ordina gli elementi di un gruppo dal maggiore al minore in accordo alla grandezza delle osservazioni, assegna i numeri d'ordine corrispondenti alla posizione occupata (rango) e trascura le distanze tra gli elementi ordinati. Questa trasformazione permette di applicare test statistici quando le variabili originarie non soddisfano le assunzioni dei test parametrici più usati (es. analisi non parametriche test Mann-Whitney, ANOVA Kruskal Wallis, correlazione di Spearman). Procedura: o Le n1, n2,…nk osservazioni provenienti da k

campioni (ma anche da un solo campione) sono aggregate in unica serie di dati di dimensioni n e messe in ordine crescente.

o Alle osservazioni vengono poi assegnati dei ranghi partendo da1, che viene dato alla più piccola, fino ad n che viene dato alla più grande.

o Quando due o più osservazioni hanno lo stesso valore ad ogni osservazione viene assegnata la media dei ranghi di tutte le osservazioni con lo stesso valore.

35

Esempio:

Variabile: contenuto nucleare di DNA in pg ( Rattus norvegicus)

Campione 1 Campione 2 Campione 3 2.98 3.33 2.95 3.15 2.86 3.05 3.5 3.12 3.42

2.89 3.02 2.9 3.05 2.98 2.87 3.15 3.12

Raggruppamento ed assegnazione dei ranghi

n Variabile originale

Rango

campione

1 2.86 1 2 2 2.87 2 3 3 2.89 3 1 4 2.9 4 3 5 2.95 5 3 6 2.98 6.5 1 7 2.98 6.5 2 8 3.02 8 2 9 3.05 9.5 1

10 3.05 9.5 3 11 3.12 11.5 2 12 3.12 11.5 3 13 3.15 13.5 1 14 3.15 13.5 1 15 3.33 15 2 16 3.42 16 3 17 3.5 17 1

36

• MATRICE DATI • TABELLE SEMPLICI

• TABELLE A DOPPIA ENTRATA

• FREQUENZE • GRAFICI

RACCOLTA E ORGANIZZAZIONE DEI DATI

37

Immaginiamo di compiere una ricerca sulle abitudini alimentari degli studenti iscritti al quarto anno dei Corsi di Laurea dell’Università di Pavia nel corrente a.a. E’ necessario raccogliere dati-informazioni specifiche che poi sono elaborate ed analizzate:

• dalla popolazione d interesse si estrae un campione ( * tecniche di estrazione, * dimensioni del

campione) sufficientemente grande, es. 500 soggetti

• viene somministrato un questionario con

domande:

38

ID_________________________ Sesso ( 1= M, 2=F)____________ (var qualitativa nominale dicotomica)

Età (anni compiuti)____________ (var quantitativa continua) Peso ( Kg)___________________ (var quantitativa continua) Statura (cm)__________________ (var quantitativa continua) Quante volte mangi alla settimana (var quantitativa discreta)

Pasta_________________

Pesce_________________

Dolci _________________

Quante volte alla settimana salti i pasti principali

(var qualitativa ordinale)

(colazione, pranzo, cena)?

-mai – (=1)

-talvolta (=2)

- spesso (=3)

- sempre (=4)

Quante ore alla settimana fa attività fisica/sport?

(var qualitativa ordinale)

-mai (1) (=1) -meno di 1 ora(=2)

-1/2 ore (=3) -3/4 ore (=4)

-4/5 ore (=5) -6/7 ore (=6)

ecc….

36

E’ necessaria una

prima SINTESI delle informazioni raccolte

MATRICE DEI DATI

ID Sesso Età (anni)

Peso (kg)

Statura (cm)

Quante pasta

Quante pesce

Quante dolci

Quanto salta pasti

Quanto sport

1 M 21 70 165 1 2 1 mai 0

2 M 22 80 180 2 2 1 talvolta 1

3 F 19 60 169 3 1 2 mai 2

4 M 26 68 170 1 2 1.5 spesso 5

... … … … … … … … … …

500 F 24 45 155 3 1 2 sempre 3

I dati sono quindi esplorati e controllati mediante metodi di sintesi che, a seconda del tipo di variabile, calcolano misure di tendenza centrale e dispersione (variabili quantitative), realizzano tabelle calcolano frequenze e distribuzioni di frequenze realizzano grafici ( tutte le variabili).

37

TABELLE • TABELLE SEMPLICI Unità statistiche classificate secondo UNA delle variabili rilevate. • TABELLE A DOPPIA ENTRATA Unità statistiche classificate secondo DUE delle variabili rilevate.

38

TABELLA SEMPLICE (variabile qualitativa nominale)

Sesso Frequenza assoluta M 280 F 220

Totale 500

Legenda: M = maschio, F = femmina

39

TABELLA A DOPPIA ENTRATA Incrociamo le variabili “Sesso” e “Quanto salta i pasti (volte/settimana)”.

Sesso Salta i pasti

(volte/settimana) M F Totale

Mai -1 40 10 50 Talvolta-2 200 50 250 Spesso-3 30 100 130 Sempre-4 10 60 70

Totale 280 220 500

40

TABELLA SEMPLICE (variabile quantitativa continua)

Statura (cm)

FREQUENZA ASSOLUTA

152 3 153 4 154 6 155 6 … … … … 192 6 193 4 194 2

Totale 500

41

È NECESSARIO RAGGRUPPARE I DATI IN CLASSI

• MUTUAMENTE ESCLUSIVE • ESAUSTIVE

• QUANTE CLASSI?

- Regola del buon senso: non meno di 6 non più di 15.

- Formula di Sturges: k=1+3,322 (log10n)

dove k= numero di classi n= numero di osservazioni

• DI QUALE AMPIEZZA?

- Regole del buon senso: � sono consigliabili classi di ampiezza 5, 10 o multipli di 10 e

terminanti con 0 o con 5; � se è possibile, formare classi di uguale ampiezza

- Formula per il calcolo dell’ampiezza w=R/k

dove R= range k= numero di classi

• COME INDICARLE?

42

DISTRIBUZIONE DI FREQUENZA

DATI RAGGRUPPATI IN CLASSI 9 CLASSI di AMPIEZZA 5

Altezza (cm) Frequenza assoluta [150 - 155) 13 [155 - 160) 26 [160 - 165) 58 [165 - 170) 99 [170 - 175) 88 [175 - 180) 82 [180 - 185) 95 [185 - 190) 22 [190 - 195) 17

Totale 500

1a classe → [150 - 155) 150 estremo inferiore 155 estremo superiore aperto

155 è, in realtà, l’estremo inferiore della classe successiva. Pertanto la 1a classe raggruppa le osservazioni comprese nell’intervallo (150 - 154,9999…). 2a classe → [155 - 160) 155 estremo inferiore 160 estremo superiore aperto

160 è, in realtà, l’estremo inferiore della classe successiva. Pertanto la 2a classe raggruppa le osservazioni comprese nell’intervallo (155 - 159,9999…). .... e così via ….

43

FREQUENZE

ASSOLUTA N° di volte in cui si osserva ciascuna modalità (o valore) di una variabile.

RELATIVA Frequenza assoluta / numero totale casi

0 ≤ freq. rel. ≤ 1

PERCENTUALE Frequenza relativa*100 0 ≤ frequenza% ≤ 100

CUMULATIVA Fornisce, per ogni valore x della variabile X di interesse, la frequenza delle osservazioni con

valore minore o uguale a x.

44

RIEPILOG O

Per una variabile continua definiamo la frequenza:

• assoluta (n) • relativa (f) • percentuale (p) • percentuale cumulata (P)

Statura (cm)

n Frequenza assoluta

f Frequenza

relativa

p Frequenza

%

P Frequenza %

cumulata

[150-155) 13 13/500=0.026 2.6 2.6 [155-160) 26 26/500=0.052 5.2 2.6+5.2=7.8 [160-165) 58 58/500=0.116 11.6 2.6+…+11.6=19.4 [165-170) 99 99/500=0.198 19.8 2.6+…+19.8=39.2 [170-175) 88 88/500=0.176 17.6 2.6+…+17.6=56.8 [175-180) 82 82/500=0.164 16.4 2.6+…+16.4=73.2 [180-185) 95 95/500=0.190 19.0 2.6+…+19.0=92.2 [185-190) 22 22/500=0.044 4.4 2.6+…+4.4=96.6 [190-195] 17 17/500=0.034 3.4 2.6+…+3.4=100

Totale 500 1 100

45

Per una variabile nominale:

Stato civile

n f p

0 3 0.3 30% 1 4 0.4 40% 2 2 0.2 20% 3 1 0.1 10%

Totale 10 1 100% Legenda: 0 = non coniugato/a

1 = coniugato/a 2 = separato/a 3 = vedovo/a

N.B. Per le variabili qualitative nominali non ha senso calcolare le frequenze cumulate, perché tra le loro modalità non è possibile stabilire una gerarchia.

46

GRAFICI

47

GRAFICI

DI VARIABILI QUALITATIVE (e QUANTITATIVE DISCRETE)

• DIAGRAMMA A BARRE O COLONNE La base delle colonne è uguale, l’altezza è proporzionale alla frequenza. • DIAGRAMMA CIRCOLARE Ad ogni modalità della variabile corrisponde un settore circolare la cui area è proporzionale alla frequenza della modalità considerata.

L’ampiezza di ogni settore circolare è data da: 360:αi=100:fi

L’uso di diagrammi a colonne distanziate e di diagrammi circolari enfatizza il fatto che i dati vengono considerati in categorie discrete, distinte e separate.

48

DIAGRAMMA A COLONNE

Sesso280

220

050

100150200250300

M F

Fre

quen

za

DIAGRAMMA CIRCOLARE

Sesso

280220 M

F

Sesso Frequenza assoluta M 280 F 220

Totale 500

49

GRAFICI DI VARIABILI QUANT ITATIVE

CONTINUE • ISTOGRAMMA

Colonne non distanziate* di area proporzionale alla frequenza.

*colonne non distanziate, perché i dati sono misurati su scala continua. • POLIGONO DI FREQUENZA Ogni punto, corrispondente a un intervallo, ha coordinata orizzontale data dal valore centrale dell’intervallo e coordinata verticale data dalla frequenza delle osservazioni comprese in quell’intervallo.

50

ISTOGRAMMA

0

20

40

60

80

100

120

[150-155)

[155-160)

[160-165)

[165-170)

[170-175)

[175-180)

[180-185)

[185-190)

[190-195)

Altezza (cm)

Fre

quen

za

Altezza (cm) Frequenza assoluta [150 - 155) 13 [155 - 160) 26 [160 - 165) 58 [165 - 170) 99 [170 - 175) 88 [175 - 180) 82 [180 - 185) 95 [185 - 190) 22 [190 - 195) 17

Totale 500

51

POLIGONO DI FREQUENZ A

0

20

40

60

80

100

120

[150-155)

[155-160)

[160-165)

[165-170)

[170-175)

[175-180)

[180-185)

[185-190)

[190-195)

Altezza (cm)

Fre

quen

za

Altezza (cm) xk Frequenza assoluta [150 - 155) 152.5 13 [155 - 160) 157.5 26 [160 - 165) 162.5 58 [165 - 170) 167.5 99 [170 - 175) 172.5 88 [175 - 180) 177.5 82 [180 - 185) 182.5 95 [185 - 190) 187.5 22 [190 - 195) 192.5 17

Totale 500

52

GRAFICI DI FREQUENZA CUMULATIVA :

a. VARIABILE DISCRETA: DIAGRAMMA A GRADINI

0

5

10

15

20

25

30

1 2 3 4 5 6

n° di componenti familiari

Fre

quen

za c

umul

ata

n° di componenti familiari

Frequenza assoluta Frequenza assoluta cumulativa

1 4 4 2 3 7 3 8 15 4 9 24 5 2 26 6 1 27

27

53

b. VARIABILE CONTINUA SIGMOIDE

0

20

40

60

80

100

120

155 160 165 170 175 180 185 190 195

Altezza (cm)

Fre

quen

za %

cum

ulat

a

Altezza

(cm) Frequenza assoluta

Frequenza relativa

Frequenza %

Frequenza % cumulata

[150-155) 13 13/500=0.026 2.6 2.6 [155-160) 26 26/500=0.052 5.2 2.6+5.2=7.8 [160-165) 58 58/500=0.116 11.6 2.6+…+11.6=19.4 [165-170) 99 99/500=0.198 19.8 2.6+…+19.8=39.2 [170-175) 88 88/500=0.176 17.6 2.6+…+17.6=56.8 [175-180) 82 82/500=0.164 16.4 2.6+…+16.4=73.2 [180-185) 95 95/500=0.190 19.0 2.6+…+19.0=92.2 [185-190) 22 22/500=0.044 4.4 2.6+…+4.4=96.6 [190-195) 17 17/500=0.034 3.4 2.6+…+3.4=100

Totale 500 1 100