BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un...

56
1 LM Biologia Sperimentale ed Applicata. Anno accademico 2014-2015 BIOSTATISTICA Prima parte

Transcript of BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un...

Page 1: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

1

LM Biologia Sperimentale ed Applicata.

Anno accademico 2014-2015

BIOSTATISTICA Prima parte

Page 2: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

2

INTR ODUZIONE

Page 3: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

3

• STATISTICA DESCRITTIVA Insieme di metodi per la raccolta, l’organizzazione, la sintesi di dati. • STATISTICA INFERENZIALE Insieme di metodi che permettono di analizzare i dati estratti da un campione limitato per arrivare a conclusioni applicabili all’intera popolazione. I dati provengono dall’area biologico-sperimentale

STATISTICA

Page 4: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

4

Finalità di uno studio statistico

• Rispondere a quesiti scientifici come: Le osservazioni che ho fatto hanno portato a risultati diversi dal caso e significativi ? L’esperimento che ho condotto ha portato a risultati diversi dal caso e significativi ? Es: Vi e’ associazione fra un determinato gene e una specifica malattia? Es: Diverse condizioni di allevamento determinano variazioni significative di questo carattere del fenotipo? Es: Quale antibiotico funziona meglio nei confronti di questo ceppo batterico? ……

• Predire quantità non osservate o non osservabili: Es: L’incidenza dell’influenza nella prossima stagione invernale; Es: Il numero di animali nati in allevamento nel prossimo anno; Es: La variazione in biomassa in rapporto al cambio climatico .

STUDI STATISTICI

Page 5: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

5

1 Individuazione del problema

2 Formulazione dell’ipotesi

5 Verifica delle

ipotesi

4 Raccolta e analisi dei

dati

3 Elaborazione del piano di ricerca

FASI DI UNO STUDIO

Page 6: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

6

• STUDI SPERIMENTALI Il ricercatore interviene direttamente sul valore delle variabili primarie negli casi-individui studiati (tipico esperimento di laboratorio o di studi clinici in cui si controlla il trattamento). Limitato impiego uomo-animale per fattori etici.

• STUDI OSSERVAZIONALI Il ricercatore non interviene direttamente, non manipola le variabili primarie, ma osserva ciò che accade naturalmente, spontaneamente (effetto della dieta, dell’inquinamento , delle stagioni….). Largo impiego: non esistono problemi etici

Page 7: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

7

DESCRITTIVI: ECOLOGICI

STUDI OSSERVAZIONALI TRASVERSALI ANALITICI PROSPETTIVI CASO-CONTROLLO

Page 8: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

8

LA RACCOLTA DEI DATI

può essere effettuata: • Indirettamente Da banche dati, da dati interni (registri, siti web, cartelle cliniche, archivi museali, lavori precedenti…). • Direttamente Mediante sperimentazione o con indagine anche retrospettiva tramite questionario.

Page 9: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

9

GLOSSARIO MINIMO

Page 10: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

10

POPOLAZIONE

Totalità di elementi cui il ricercatore è interessato in un dato studio.

POPOLAZIONE FINITA Gli elementi sono in numero finito e quindi potrebbero essere tutti osservati.

• I residenti nel Comune di Pavia nell’anno 1950; • gli studenti iscritti a questo corso.

POPOLAZIONE INFINITA Gli elementi sono una successione infinita.

• I soggetti affetti da AIDS; • Il numero di batteri del genere…”Clostridium,

Bacillus, Escherichia….”

È una popolazione infinita perché non limitata né nel tempo né nello spazio.

Page 11: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

11

CAMPIONE Parte di popolazione selezionata per la raccolta dei dati. Un campione è un sottoinsieme di una popolazione. Popolazione

Campione ⊂ Popolazione

Campione

Page 12: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

12

UNITA’ STATISTICA

Minima unità da cui si raccolgono i dati in un’indagine

o, in altre parole, ciascuno dei componenti il campione su cui si rilevano i dati. Esempio Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo.

Le unità statistiche sono i singoli animali del parco faunistico, nell’arco di tempo considerato. La natura dell’unità statistica è varia, ma è costante nello studio.

Page 13: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

13

VARIABILE Caratteristica rilevata su ogni unità statistica, che può assumere valori diversi nelle diverse unità statistiche. • Statura degli studenti maschi iscritti al 1o anno

del Corso di Laurea in Ingegneria nel corrente a.a.;

• Gruppo sanguigno A, B, AB, 0 dei soggetti

campionati; • Intensità di reazione, ad un antigene (nulla,

bassa, alta) nei soggetti studiati.

Page 14: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

14

OSSERVAZIONE Valore assunto da una variabile in una determinata unità statistica.

UNITÀ VARIABILE STATISTICA (PESO)

Individuo 1 80 kg \ Individuo 2 75 kg — OSSERVAZIONI Individuo 3 78 kg /

Page 15: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

15

• QUALITATIVE

� NOMINALI - DICOTOMICHE - POLITOMICHE

� ORDINALI

• QUANTITATIVE

� DISCRETE � CONTINUE

CLASSIFICAZIONE DELL E VARIABILI

Page 16: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

16

VARIABILI QUALITATIV E Sono classificate in categorie.

1. QUALITATIVE NOMIN ALI Solo il nome della modalità è importante e non esiste concetto di ordine tra le diverse modalità. a. DICOTOMICHE: presentano solo 2 modalità, non ordinabili.

• Sesso = M/F • Sopravvivenza = Vivo/Morto • Positivo –negativo al virus HIV

………….. b. POLITOMICHE: presentano più di 2 modalità, non ordinabili.

• Colore dei capelli •Gruppo sanguigno (A, B, AB, 0) •Razza di una specie (cocker, terrier, bassotto….)

Page 17: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

17

2. QUALITATIVE ORDIN ALI È possibile stabilire un ordine tra le modalità:

• Livello socio-economico (basso-medio-alto) • Livelli di obesità (sovrappeso- Obesità I- Obesità II- Obesità III) • Abitudine all’uso di un presidio medico (mai-talvolta-sempre) • Intensità di reazione ad un antigene (nulla, media, elevata) La differenza-distanza tra i livelli non è costante ed esattamente determinata ( la distanza tra livello basso e medio non è uguale o confrontabile con la distanza tra livello medio ed alto e viceversa).

Page 18: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

18

VARIABILI QUANTITATIVE Sono espresse da numeri.

1. DISCRETE Possono assumere solo particolari valori entro un determinato intervallo (corrispondenza biunivoca con l’insieme dei numeri naturali *1). Sono derivate da conteggi.

• Numero di figli per donna • Numero di colonie di E. coli su piastra • Numero di cromosomi di una specie

2. CONTINUE Possono assumere qualsiasi valore entro un determinato intervallo (corrispondenza biunivoca con i numeri reali*2). Non sono derivate da conteggi, ma da misure.

• Peso • Altezza • Colesterolo ematico • Pressione arteriosa (PAS e PAD)

Page 19: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

19

*1

Numeri naturali

In matematica, l'espressione "numeri naturali" indica l'insieme {0, 1, 2, 3, 4,

...}. Esso viene fatto corrispondere biunivocamente all'insieme dei "numeri

interi non negativi" {0, +1, +2, +3, +4, ...}. Talvolta viene, impropriamente,

usata anche per indicare l'insieme { 1, 2, 3, 4, ...}, corrispondente

biunivocamente all'insieme dei numeri interi positivi {+1, +2, +3, +4, ...} .

*2

Numeri reali

In matematica, i numeri reali possono essere descritti in maniera non formale

come numeri ai quali è possibile attribuire uno sviluppo decimale finito o

infinito, come π = 3,141592... I numeri reali possono essere positivi, negativi

o nulli e comprendono, come casi particolari, i numeri interi (come 12),

i numeri razionali (come −22⁄7) e i numeri irrazionali algebrici (come la radice

quadrata di 2) .

Page 20: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

20

• NOMINALE

• ORDINALE

• INTERVALLARE

• DI RAPPORTI

SCALE DI MISURA

Page 21: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

21

SCALA NOMINALE Per variabili qualitative nominali. Consiste in due o più categorie, mutuamente esclusive. Esempi: • genere sessuale (1= maschio 2=femmina);

• stato civile (1=celibe- 2=nubile-3=coniugato);

• attività economica (1=…2=...3=…k=…) I numeri sono utilizzati per identificare le categorie: sono solo codifiche, non riflettono una sottostante scala quantitativa. .

Page 22: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

22

SCALA ORDINALE Per variabili qualitative ordinali. (Ma anche per variabili quantitative che sono state misurate o raggruppate in maniera ordinale). Consiste in due o più categorie, mutuamente esclusive, tra cui è possibile stabilire un ordinamento lineare, una gerarchia. Esempio: livelli di una patologia lieve (1)

moderata (2) grave (3)

Il valore numerico associato ad ogni categoria differenzia i soggetti con diverse entità della patologia; a valori elevati della scala corrispondono intensità maggiori di malattia.

Page 23: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

23

SCALA INTERVALLA RE

Per variabili quantitative. E’ possibile stabilire un ordinamento tra le classi; è possibile calcolare la distanza tra due osservazioni, ma non il rapporto. Esempio: temperatura Si utilizza per quelle variabili quantitative per le quali è possibile stabilire uno ZERO ARBITRARIO: lo zero della scala non indica assenza dell’attributo.

Page 24: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

24

SCALA DI RAPPORTI Per variabili quantitative. E’ possibile eseguire tutte le operazioni matematiche. Esempi: peso, altezza, velocità Si utilizza per quelle variabili quantitative per le quali è possibile stabilire uno ZERO ASSOLUTO.

B pesa il doppio di A in entrambe le scale.

PESO A B Kg 10 20 Libbre 22.04 44.08

Page 25: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

25

Page 26: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

26

Page 27: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

27

• TRASFORMAZIONE E STANDARDIZZAZIONE

• RAGGRUPPAMENTO IN CLASSI ORDINALI DI UNA VARIABILE

CONTINUA

• TRASFORMAZIONE IN SC ALA A RANGHI

TRASFORMAZIONE DI VARIABILI PER ESIGEN ZE

DI ANALISI

Page 28: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

28

STANDARDIZZAZIONE E TRASFORMAZIONE

Una variabile quantitativa continua può essere ulteriormente standardizzata o trasformata per esigenze di: • confronto tra variabili o campioni da effettuarsi con la medesima una scala di misurazione ( es. test Z confronto medie);

• analisi multivariate con variabili a diversa scala

di misurazione (es. analisi componenti principali); • riduzione della asimmetria dei valori di una variabile per test che la necessitano (es. trasformazione di Cox-Box);

• esigenze di presentazione e rappresentazione

grafica ( es. tassi epidemiologici: x100000, LogX );

Page 29: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

29

con la Standardizzazione si attua una modifica dei dati utilizzando statistiche calcolate dai dati stessi.

Centratura : Xi = X - X

La media aritmetica della variabile è sottratta ad ogni valore, centra i dati attorno alla media=0. Normalizzazione: Ad ogni valore è sottratta la media aritmetica e quindi diviso per la deviazione standard; centra i dati attorno alla media=0 con una deviazione standard =1 per tutte le variabili od i campioni standardizzati.

n X Y X normalizzato Y normalizzato 1 0.30 120.50 -1.25 1.57 2 1.50 110.10 -0.90 1.29 3 1.50 89.70 -0.90 0.74 4 2.90 81.20 -0.50 0.51 5 3.50 69.30 -0.33 0.18 6 4.90 45.30 0.08 -0.47 7 5.20 31.40 0.16 -0.85 8 6.50 31.40 0.54 -0.85 9 8.50 31.40 1.11 -0.85 10 11.50 15.20 1.98 -1.29

media 4.63 62.55 0 0 Dev. st. 3.48 36.82 1 1

Page 30: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

30

Trasformazione lineare:

X i = X*b Tutti i valori sono moltiplicati per una costante b, cambia i valori assoluti ma non l’essenza dei risultati, Trasformazione Logaritmica :

X i = logc X Ogni valore è sostituito dal suo logaritmo in base c, riduce le grandi differenze assolute ovvero “distorce”aumentando i valori più bassi rispetto a quelli più alti. Se è presente il valore X =0 si utilizza Xi = logc (X+1) Trasformazione con elevamento a potenza

X i = Xc

I valori originali sono elevati a potenza, se il valore c è > 1 vengono aumentati i valori più alti, se c < 1 (es. c= 0.5 trasformazione per radice quadrata) si riduce il peso dei valori più alti.

Page 31: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

31

a: trasformazione logaritmica dei dati

asse x= dati originali, asse Y dati trasformati

b: trasformazione con elevamento a potenza dei dati asse x= dati originali, asse Y dati trasformati

Page 32: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

32

• RAGGRUPPAMENTO IN CLASSI ORDINALI

DI UNA VARIABILE CON TINUA

I valori di una variabile continua sono raggruppati in classi ordinali per esigenze di sintesi. Si utilizza ad esempio per i valori di un indice (biologico, ecologico, biochimico, antropometrico…) che pur assumendo tutti i valori di una variabile quantitativa è tuttavia meglio espresso in poche classi ordinali. Esempio: BMI (Body Mass Index) e classi di obesità

BMI <18.5 BMI classi =0 sottopeso

BMI 18.5-24.9 BMI classi = 1 normopeso

BMI 25-29,9 BMI classi = 2 sovrappeso

BMI 30-34,9 BMI classi = 3 obesità I lieve

BMI 35-39,9 BMI classi = 4 obesità II media

BMI >40 BMI classi = 5 obesità III grave

Page 33: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

33

I valori di BMI sono riassunti in classi ed appaiono

BMI (Kg/ m2)

BMI classi

Condizione

24.32 1 normopeso 22.03 1 normopeso 29.58 2 sovrappeso 28.57 2 sovrappeso 34.21 3 obesità I lieve 32.5 3 obesità I lieve

37.88 4 obesità II media 36.35 4 obesità II media 41.56 5 Obesità III grave 42.25 5 obesità III grave

Var. continua Var. qualitativa ordinale Sebbene le variabili continue siano più informative il raggruppamento in classi ordinali permette valutazioni descrittive di sintesi : o conteggi %, analisi e grafici di frequenza, test di

differenza di proporzione; o tabelle di contingenza con misure di associazione (es.

Chi2); o analisi di una variabile non raggruppata per gruppi-

strati di una seconda variabile raggruppata (es. valori glicemia per età raggruppata in giovane-media-anziana).

Page 34: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

34

TRASFORMAZIONE IN SC ALA A RANGHI La scala a ranghi ordina gli elementi di un gruppo dal maggiore al minore in accordo alla grandezza delle osservazioni, assegna i numeri d'ordine corrispondenti alla posizione occupata (rango) e trascura le distanze tra gli elementi ordinati. Questa trasformazione permette di applicare test statistici quando le variabili originarie non soddisfano le assunzioni dei test parametrici più usati (es. analisi non parametriche test Mann-Whitney, ANOVA Kruskal Wallis, correlazione di Spearman). Procedura: o Le n1, n2,…nk osservazioni provenienti da k

campioni (ma anche da un solo campione) sono aggregate in unica serie di dati di dimensioni n e messe in ordine crescente.

o Alle osservazioni vengono poi assegnati dei ranghi partendo da1, che viene dato alla più piccola, fino ad n che viene dato alla più grande.

o Quando due o più osservazioni hanno lo stesso valore ad ogni osservazione viene assegnata la media dei ranghi di tutte le osservazioni con lo stesso valore.

Page 35: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

35

Esempio:

Variabile: contenuto nucleare di DNA in pg ( Rattus norvegicus)

Campione 1 Campione 2 Campione 3 2.98 3.33 2.95 3.15 2.86 3.05 3.5 3.12 3.42

2.89 3.02 2.9 3.05 2.98 2.87 3.15 3.12

Raggruppamento ed assegnazione dei ranghi

n Variabile originale

Rango

campione

1 2.86 1 2 2 2.87 2 3 3 2.89 3 1 4 2.9 4 3 5 2.95 5 3 6 2.98 6.5 1 7 2.98 6.5 2 8 3.02 8 2 9 3.05 9.5 1

10 3.05 9.5 3 11 3.12 11.5 2 12 3.12 11.5 3 13 3.15 13.5 1 14 3.15 13.5 1 15 3.33 15 2 16 3.42 16 3 17 3.5 17 1

Page 36: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

36

• MATRICE DATI • TABELLE SEMPLICI

• TABELLE A DOPPIA ENTRATA

• FREQUENZE • GRAFICI

RACCOLTA E ORGANIZZAZIONE DEI DATI

Page 37: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

37

Immaginiamo di compiere una ricerca sulle abitudini alimentari degli studenti iscritti al quarto anno dei Corsi di Laurea dell’Università di Pavia nel corrente a.a. E’ necessario raccogliere dati-informazioni specifiche che poi sono elaborate ed analizzate:

• dalla popolazione d interesse si estrae un campione ( * tecniche di estrazione, * dimensioni del

campione) sufficientemente grande, es. 500 soggetti

• viene somministrato un questionario con

domande:

Page 38: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

38

ID_________________________ Sesso ( 1= M, 2=F)____________ (var qualitativa nominale dicotomica)

Età (anni compiuti)____________ (var quantitativa continua) Peso ( Kg)___________________ (var quantitativa continua) Statura (cm)__________________ (var quantitativa continua) Quante volte mangi alla settimana (var quantitativa discreta)

Pasta_________________

Pesce_________________

Dolci _________________

Quante volte alla settimana salti i pasti principali

(var qualitativa ordinale)

(colazione, pranzo, cena)?

-mai – (=1)

-talvolta (=2)

- spesso (=3)

- sempre (=4)

Quante ore alla settimana fa attività fisica/sport?

(var qualitativa ordinale)

-mai (1) (=1) -meno di 1 ora(=2)

-1/2 ore (=3) -3/4 ore (=4)

-4/5 ore (=5) -6/7 ore (=6)

ecc….

Page 39: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

36

E’ necessaria una

prima SINTESI delle informazioni raccolte

MATRICE DEI DATI

ID Sesso Età (anni)

Peso (kg)

Statura (cm)

Quante pasta

Quante pesce

Quante dolci

Quanto salta pasti

Quanto sport

1 M 21 70 165 1 2 1 mai 0

2 M 22 80 180 2 2 1 talvolta 1

3 F 19 60 169 3 1 2 mai 2

4 M 26 68 170 1 2 1.5 spesso 5

... … … … … … … … … …

500 F 24 45 155 3 1 2 sempre 3

I dati sono quindi esplorati e controllati mediante metodi di sintesi che, a seconda del tipo di variabile, calcolano misure di tendenza centrale e dispersione (variabili quantitative), realizzano tabelle calcolano frequenze e distribuzioni di frequenze realizzano grafici ( tutte le variabili).

Page 40: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

37

TABELLE • TABELLE SEMPLICI Unità statistiche classificate secondo UNA delle variabili rilevate. • TABELLE A DOPPIA ENTRATA Unità statistiche classificate secondo DUE delle variabili rilevate.

Page 41: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

38

TABELLA SEMPLICE (variabile qualitativa nominale)

Sesso Frequenza assoluta M 280 F 220

Totale 500

Legenda: M = maschio, F = femmina

Page 42: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

39

TABELLA A DOPPIA ENTRATA Incrociamo le variabili “Sesso” e “Quanto salta i pasti (volte/settimana)”.

Sesso Salta i pasti

(volte/settimana) M F Totale

Mai -1 40 10 50 Talvolta-2 200 50 250 Spesso-3 30 100 130 Sempre-4 10 60 70

Totale 280 220 500

Page 43: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

40

TABELLA SEMPLICE (variabile quantitativa continua)

Statura (cm)

FREQUENZA ASSOLUTA

152 3 153 4 154 6 155 6 … … … … 192 6 193 4 194 2

Totale 500

Page 44: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

41

È NECESSARIO RAGGRUPPARE I DATI IN CLASSI

• MUTUAMENTE ESCLUSIVE • ESAUSTIVE

• QUANTE CLASSI?

- Regola del buon senso: non meno di 6 non più di 15.

- Formula di Sturges: k=1+3,322 (log10n)

dove k= numero di classi n= numero di osservazioni

• DI QUALE AMPIEZZA?

- Regole del buon senso: � sono consigliabili classi di ampiezza 5, 10 o multipli di 10 e

terminanti con 0 o con 5; � se è possibile, formare classi di uguale ampiezza

- Formula per il calcolo dell’ampiezza w=R/k

dove R= range k= numero di classi

• COME INDICARLE?

Page 45: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

42

DISTRIBUZIONE DI FREQUENZA

DATI RAGGRUPPATI IN CLASSI 9 CLASSI di AMPIEZZA 5

Altezza (cm) Frequenza assoluta [150 - 155) 13 [155 - 160) 26 [160 - 165) 58 [165 - 170) 99 [170 - 175) 88 [175 - 180) 82 [180 - 185) 95 [185 - 190) 22 [190 - 195) 17

Totale 500

1a classe → [150 - 155) 150 estremo inferiore 155 estremo superiore aperto

155 è, in realtà, l’estremo inferiore della classe successiva. Pertanto la 1a classe raggruppa le osservazioni comprese nell’intervallo (150 - 154,9999…). 2a classe → [155 - 160) 155 estremo inferiore 160 estremo superiore aperto

160 è, in realtà, l’estremo inferiore della classe successiva. Pertanto la 2a classe raggruppa le osservazioni comprese nell’intervallo (155 - 159,9999…). .... e così via ….

Page 46: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

43

FREQUENZE

ASSOLUTA N° di volte in cui si osserva ciascuna modalità (o valore) di una variabile.

RELATIVA Frequenza assoluta / numero totale casi

0 ≤ freq. rel. ≤ 1

PERCENTUALE Frequenza relativa*100 0 ≤ frequenza% ≤ 100

CUMULATIVA Fornisce, per ogni valore x della variabile X di interesse, la frequenza delle osservazioni con

valore minore o uguale a x.

Page 47: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

44

RIEPILOG O

Per una variabile continua definiamo la frequenza:

• assoluta (n) • relativa (f) • percentuale (p) • percentuale cumulata (P)

Statura (cm)

n Frequenza assoluta

f Frequenza

relativa

p Frequenza

%

P Frequenza %

cumulata

[150-155) 13 13/500=0.026 2.6 2.6 [155-160) 26 26/500=0.052 5.2 2.6+5.2=7.8 [160-165) 58 58/500=0.116 11.6 2.6+…+11.6=19.4 [165-170) 99 99/500=0.198 19.8 2.6+…+19.8=39.2 [170-175) 88 88/500=0.176 17.6 2.6+…+17.6=56.8 [175-180) 82 82/500=0.164 16.4 2.6+…+16.4=73.2 [180-185) 95 95/500=0.190 19.0 2.6+…+19.0=92.2 [185-190) 22 22/500=0.044 4.4 2.6+…+4.4=96.6 [190-195] 17 17/500=0.034 3.4 2.6+…+3.4=100

Totale 500 1 100

Page 48: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

45

Per una variabile nominale:

Stato civile

n f p

0 3 0.3 30% 1 4 0.4 40% 2 2 0.2 20% 3 1 0.1 10%

Totale 10 1 100% Legenda: 0 = non coniugato/a

1 = coniugato/a 2 = separato/a 3 = vedovo/a

N.B. Per le variabili qualitative nominali non ha senso calcolare le frequenze cumulate, perché tra le loro modalità non è possibile stabilire una gerarchia.

Page 49: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

46

GRAFICI

Page 50: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

47

GRAFICI

DI VARIABILI QUALITATIVE (e QUANTITATIVE DISCRETE)

• DIAGRAMMA A BARRE O COLONNE La base delle colonne è uguale, l’altezza è proporzionale alla frequenza. • DIAGRAMMA CIRCOLARE Ad ogni modalità della variabile corrisponde un settore circolare la cui area è proporzionale alla frequenza della modalità considerata.

L’ampiezza di ogni settore circolare è data da: 360:αi=100:fi

L’uso di diagrammi a colonne distanziate e di diagrammi circolari enfatizza il fatto che i dati vengono considerati in categorie discrete, distinte e separate.

Page 51: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

48

DIAGRAMMA A COLONNE

Sesso280

220

050

100150200250300

M F

Fre

quen

za

DIAGRAMMA CIRCOLARE

Sesso

280220 M

F

Sesso Frequenza assoluta M 280 F 220

Totale 500

Page 52: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

49

GRAFICI DI VARIABILI QUANT ITATIVE

CONTINUE • ISTOGRAMMA

Colonne non distanziate* di area proporzionale alla frequenza.

*colonne non distanziate, perché i dati sono misurati su scala continua. • POLIGONO DI FREQUENZA Ogni punto, corrispondente a un intervallo, ha coordinata orizzontale data dal valore centrale dell’intervallo e coordinata verticale data dalla frequenza delle osservazioni comprese in quell’intervallo.

Page 53: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

50

ISTOGRAMMA

0

20

40

60

80

100

120

[150-155)

[155-160)

[160-165)

[165-170)

[170-175)

[175-180)

[180-185)

[185-190)

[190-195)

Altezza (cm)

Fre

quen

za

Altezza (cm) Frequenza assoluta [150 - 155) 13 [155 - 160) 26 [160 - 165) 58 [165 - 170) 99 [170 - 175) 88 [175 - 180) 82 [180 - 185) 95 [185 - 190) 22 [190 - 195) 17

Totale 500

Page 54: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

51

POLIGONO DI FREQUENZ A

0

20

40

60

80

100

120

[150-155)

[155-160)

[160-165)

[165-170)

[170-175)

[175-180)

[180-185)

[185-190)

[190-195)

Altezza (cm)

Fre

quen

za

Altezza (cm) xk Frequenza assoluta [150 - 155) 152.5 13 [155 - 160) 157.5 26 [160 - 165) 162.5 58 [165 - 170) 167.5 99 [170 - 175) 172.5 88 [175 - 180) 177.5 82 [180 - 185) 182.5 95 [185 - 190) 187.5 22 [190 - 195) 192.5 17

Totale 500

Page 55: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

52

GRAFICI DI FREQUENZA CUMULATIVA :

a. VARIABILE DISCRETA: DIAGRAMMA A GRADINI

0

5

10

15

20

25

30

1 2 3 4 5 6

n° di componenti familiari

Fre

quen

za c

umul

ata

n° di componenti familiari

Frequenza assoluta Frequenza assoluta cumulativa

1 4 4 2 3 7 3 8 15 4 9 24 5 2 26 6 1 27

27

Page 56: BIOSTATISTICA...Si vuole condurre un’indagine statistica su animali di un parco faunistico, in un dato arco di tempo. Le unità statistiche sono i singoli animali del parco faunistico,

53

b. VARIABILE CONTINUA SIGMOIDE

0

20

40

60

80

100

120

155 160 165 170 175 180 185 190 195

Altezza (cm)

Fre

quen

za %

cum

ulat

a

Altezza

(cm) Frequenza assoluta

Frequenza relativa

Frequenza %

Frequenza % cumulata

[150-155) 13 13/500=0.026 2.6 2.6 [155-160) 26 26/500=0.052 5.2 2.6+5.2=7.8 [160-165) 58 58/500=0.116 11.6 2.6+…+11.6=19.4 [165-170) 99 99/500=0.198 19.8 2.6+…+19.8=39.2 [170-175) 88 88/500=0.176 17.6 2.6+…+17.6=56.8 [175-180) 82 82/500=0.164 16.4 2.6+…+16.4=73.2 [180-185) 95 95/500=0.190 19.0 2.6+…+19.0=92.2 [185-190) 22 22/500=0.044 4.4 2.6+…+4.4=96.6 [190-195) 17 17/500=0.034 3.4 2.6+…+3.4=100

Totale 500 1 100