INTRODUZIONE ALLA STATISTICA (parte 2) -...

143
INTRODUZIONE ALLA STATISTICA (parte 2) A.A.2017/2018 1/1

Transcript of INTRODUZIONE ALLA STATISTICA (parte 2) -...

INTRODUZIONE ALLA STATISTICA (parte 2)

A.A.2017/2018

1 / 1

Grafici: variabili qualitative

Diagramma a torta: è un cerchio in cui a ciascunamodalità corrisponde uno ”spicchio di torta”.L’ampiezza di ogni fetta corrisponde solitamente allapercentuale che compete a ciascuna modalità.

Grafico a barre: mostra delle barre verticali di ugualebase per ogni categoria. L’altezza di ciascunrettangolo è la percentuale di ogni modalità. Irettangoli sono di solito uniformemente distanziati.

2 / 1

Grafici: variabili qualitative

Diagramma a torta: è un cerchio in cui a ciascunamodalità corrisponde uno ”spicchio di torta”.L’ampiezza di ogni fetta corrisponde solitamente allapercentuale che compete a ciascuna modalità.

Grafico a barre: mostra delle barre verticali di ugualebase per ogni categoria. L’altezza di ciascunrettangolo è la percentuale di ogni modalità. Irettangoli sono di solito uniformemente distanziati.

2 / 1

Diagramma a torta

3 / 1

Diagramma a barre

4 / 1

Grafici per variabili qualitative: esercizio

Data la seguente tabella di frequenze per una variabilequalitativa:

Giudizio ni Ni fi Fi pi Pi

Insuff. 3 3 0.125 0.125 12.5% 12.5%Scarso 4 7 0.167 0.292 16.7% 29.2%Suff. 6 13 0.25 0.542 25% 54.2%

Discreto 1 14 0.042 0.583 4.2% 58.3%Buono 7 21 0.292 0.875 29.2% 87.5%Ottimo 3 24 0.125 1 12.5% 100%

costruire il diagramma a torta e a barre.

5 / 1

Grafici: variabili quantitative

Per variabili quantitative possiamo costruire i seguenti grafici:

Istogramma: è un grafico che utilizza dei rettangoliper visualizzare graficamente le frequenze assolute ole frequenze relative di una variabile quantitativacontinua.

Boxplot: è un grafico che permette di rappresentarela forma della distribuzione dei dati.

6 / 1

Grafici: variabili quantitative

Per variabili quantitative possiamo costruire i seguenti grafici:

Istogramma: è un grafico che utilizza dei rettangoliper visualizzare graficamente le frequenze assolute ole frequenze relative di una variabile quantitativacontinua.Boxplot: è un grafico che permette di rappresentarela forma della distribuzione dei dati.

6 / 1

Istogramma

Figure: Istogramma per il contenuto di sodio in 20 cereali dacolazione, abbiamo considerato 9 classi. 7 / 1

Costruire un istogramma

• Dividi l’intervallo dei valori osservati in sottointervallidi uguale ampiezza.

• Costruisci la tabella delle frequenze per classi.

• Sull’asse delle ascisse, etichetta con il valorecorrispondente gli estremi di ciascun intervallo.

• Per ogni classe, disegna un rettangolo alto come lafrequenza (o la percentuale) il cui valore saràriportato sull’asse delle ordinate.

8 / 1

Costruire un istogramma

• Dividi l’intervallo dei valori osservati in sottointervallidi uguale ampiezza.

• Costruisci la tabella delle frequenze per classi.

• Sull’asse delle ascisse, etichetta con il valorecorrispondente gli estremi di ciascun intervallo.

• Per ogni classe, disegna un rettangolo alto come lafrequenza (o la percentuale) il cui valore saràriportato sull’asse delle ordinate.

8 / 1

Costruire un istogramma

• Dividi l’intervallo dei valori osservati in sottointervallidi uguale ampiezza.

• Costruisci la tabella delle frequenze per classi.

• Sull’asse delle ascisse, etichetta con il valorecorrispondente gli estremi di ciascun intervallo.

• Per ogni classe, disegna un rettangolo alto come lafrequenza (o la percentuale) il cui valore saràriportato sull’asse delle ordinate.

8 / 1

Costruire un istogramma

• Dividi l’intervallo dei valori osservati in sottointervallidi uguale ampiezza.

• Costruisci la tabella delle frequenze per classi.

• Sull’asse delle ascisse, etichetta con il valorecorrispondente gli estremi di ciascun intervallo.

• Per ogni classe, disegna un rettangolo alto come lafrequenza (o la percentuale) il cui valore saràriportato sull’asse delle ordinate.

8 / 1

Costruire un istogrammaCome si determina l’ampiezza degli intervalli per diseg-nare un istogramma?

Si può usare la seguente regola:

w=Ampiezza intervallo=Valore massimo−Valore minimo

Numero di classi

• La scelta del numero di classi è lasciata all’esperienzadello scienziato. L’istogramma deve essere non tropposegmentato nè a blocchi troppo grossi. È preferibilescegliere almeno 5 classi ma meno di 20.

• Gli intervalli non devono mai sovrapporsi.

• Arrotondare per eccesso l’ampiezza delle classi e mai perdifetto, in modo da evitare buchi nell’istogramma.

9 / 1

Costruire un istogrammaCome si determina l’ampiezza degli intervalli per diseg-nare un istogramma?

Si può usare la seguente regola:

w=Ampiezza intervallo=Valore massimo−Valore minimo

Numero di classi

• La scelta del numero di classi è lasciata all’esperienzadello scienziato. L’istogramma deve essere non tropposegmentato nè a blocchi troppo grossi. È preferibilescegliere almeno 5 classi ma meno di 20.

• Gli intervalli non devono mai sovrapporsi.

• Arrotondare per eccesso l’ampiezza delle classi e mai perdifetto, in modo da evitare buchi nell’istogramma.

9 / 1

Costruire un istogrammaCome si determina l’ampiezza degli intervalli per diseg-nare un istogramma?

Si può usare la seguente regola:

w=Ampiezza intervallo=Valore massimo−Valore minimo

Numero di classi

• La scelta del numero di classi è lasciata all’esperienzadello scienziato. L’istogramma deve essere non tropposegmentato nè a blocchi troppo grossi. È preferibilescegliere almeno 5 classi ma meno di 20.

• Gli intervalli non devono mai sovrapporsi.

• Arrotondare per eccesso l’ampiezza delle classi e mai perdifetto, in modo da evitare buchi nell’istogramma.

9 / 1

Costruire un istogrammaCome si determina l’ampiezza degli intervalli per diseg-nare un istogramma?

Si può usare la seguente regola:

w=Ampiezza intervallo=Valore massimo−Valore minimo

Numero di classi

• La scelta del numero di classi è lasciata all’esperienzadello scienziato. L’istogramma deve essere non tropposegmentato nè a blocchi troppo grossi. È preferibilescegliere almeno 5 classi ma meno di 20.

• Gli intervalli non devono mai sovrapporsi.

• Arrotondare per eccesso l’ampiezza delle classi e mai perdifetto, in modo da evitare buchi nell’istogramma.

9 / 1

Costruire un istogrammaCome si determina l’ampiezza degli intervalli per diseg-nare un istogramma?

Si può usare la seguente regola:

w=Ampiezza intervallo=Valore massimo−Valore minimo

Numero di classi

• La scelta del numero di classi è lasciata all’esperienzadello scienziato. L’istogramma deve essere non tropposegmentato nè a blocchi troppo grossi. È preferibilescegliere almeno 5 classi ma meno di 20.

• Gli intervalli non devono mai sovrapporsi.

• Arrotondare per eccesso l’ampiezza delle classi e mai perdifetto, in modo da evitare buchi nell’istogramma.

9 / 1

Distribuzione in classi:esercizio

Le seguenti quantità rappresentano, in parti per milione(ppm), la componente di nitrogeno rilevata in 60 campionidi terreno.

3.6 3.2 3.3 3.6 2.7 3.4 4.5 3.3 2.8 5.4

6.1 3.4 2.9 2.7 4.1 4.7 5.1 4.7 3.2 3.6

5.1 2.6 3.6 3.8 3.8 3.1 3.7 5.5 3.2 3.7

4.2 4.5 4.3 3.7 3.6 3.9 3.5 4.4 2.8 3.3

3.9 4.4 5.1 4.6 3.4 2.6 4.5 3.1 2.5 3.1

3.7 3.4 4.1 2.7 5.7 3.5 4.7 4.4 4.4 5.0

Costruire la tabella di frequenza e disegnare l’istogramma.

10 / 1

Costruire un istogramma

Se gli intervalli in un istogramma hanno ampiezze diversetra loro, l’altezza dei rettangoli sarà determinata in modoche l’area del rettangolo sia pari alla frequenza della classestessa:

frequenza = base×altezza

da cui

altezza =frequenza

base.

Si parla in questo caso di densità di frequenza.

11 / 1

Costruire un istogramma

Se gli intervalli in un istogramma hanno ampiezze diversetra loro, l’altezza dei rettangoli sarà determinata in modoche l’area del rettangolo sia pari alla frequenza della classestessa:

frequenza = base×altezza

da cui

altezza =frequenza

base.

Si parla in questo caso di densità di frequenza.

11 / 1

Costruire un istogramma

Se gli intervalli in un istogramma hanno ampiezze diversetra loro, l’altezza dei rettangoli sarà determinata in modoche l’area del rettangolo sia pari alla frequenza della classestessa:

frequenza = base×altezza

da cui

altezza =frequenza

base.

Si parla in questo caso di densità di frequenza.

11 / 1

Costruire un istogramma

Se gli intervalli in un istogramma hanno ampiezze diversetra loro, l’altezza dei rettangoli sarà determinata in modoche l’area del rettangolo sia pari alla frequenza della classestessa:

frequenza = base×altezza

da cui

altezza =frequenza

base.

Si parla in questo caso di densità di frequenza.

11 / 1

Esempio

I valori della pressione sistolica del sangue di una persona adultasono classificati nel modo seguente:

Classificazione P. sistolica

Ottimale < 120Normale 120−129

Normale alta 130−139Alta lieve 140−159

Alta moderata 160−179Alta grave > 180

Osserviamo che l’ampiezza delle classi risulta diversa in basealla classificazione, ci sono classi più ampie di altre.

12 / 1

Esempio

Su un campione di 100 pazienti sono state osservate le seguentimisurazioni per la pressione sistolica

P = {110,110,110,110,111,112,113,114,115,115,115,115,117,

118,119,119,119,119,120,120,121,121,121,121,121,122,122,

122,124,124,125,125,125,125,126,126,126,128,128,129,129,

130,131,132,134,134,135,135,136,136,136,137,137,137,137,

137,137,137,138,138,138,138,138,139,139,139,139,140,140,

140,143,144,145,146,146,149,153,153,153,156,157,157,158,

162,163,163,165,165,166,168,170,170,173,175,178,185,185,

186,186,187}

13 / 1

Esempio

Costruiamo la tabella delle frequenze

P. sistolica ni fi pi Densità freq

< 120 18 0.18 18% 18/10 = 1.8120−129 23 0.23 23% 23/10 = 2.3130−139 26 0.26 26% 26/10 = 2.6140−159 16 0.16 16% 16/20 = 0.8160−179 12 0.12 12% 12/20 = 0.6> 180 5 0.05 5% 5/7 = 0.7Totale 100 1 100%

14 / 1

Esempio

La distribuzione corretta dei dati è quella rappresentata con ledensità di frequenza.

15 / 1

Diagramma a bastonciniPer variabil quantitative discrete, non ha senso costruireun istogramma con rettangoli adiacenti. Si utilizza un graficoad aste in cui ad ogni valore corrisponde un’asta lungaquanto la frequenza osservata per quel valore.

Figure: Si considera il numero di insetti trattati con un pesticidain diversi esperimenti

16 / 1

Forma della distribuzioneLa forma della distribuzione si dice simmetrica se la parte delladistribuzione che precede un valore centrale è sovrapponibile,come un’immagine allo specchio, alla parte che segue quel val-ore centrale.

In una distribuzione simmetrica le modalità posizionate alla stessadistanza dal centro presentano la stessa frequenza.

17 / 1

Forma della distribuzioneLa forma della distribuzione si dice simmetrica se la parte delladistribuzione che precede un valore centrale è sovrapponibile,come un’immagine allo specchio, alla parte che segue quel val-ore centrale.In una distribuzione simmetrica le modalità posizionate alla stessadistanza dal centro presentano la stessa frequenza.

17 / 1

Forma della distribuzioneLa distribuzione si dice asimmetrica quando una parte delladistribuzione si presenta più allungata dell’altra.

18 / 1

Forma della distribuzioneLa distribuzione si dice asimmetrica quando una parte delladistribuzione si presenta più allungata dell’altra.

18 / 1

Misure tendenza centraleLe statistiche che ci permettono di descrivere i dati os-servando un valore rappresentativo del centro della dis-tribuzione, sono le misure di tendenza centrale.

• La media (aritmetica) è la somma delle osservazionidivisa per il numero delle osservaioni stesse.

• La media geometrica, se si considerano nosservazioni, è la radice n-sima del prodotto delle nosservazioni.

• La mediana è il valore centrale delle osservazioniordinate in senso non decrescente. Ossia è il valoreche lascia alla sua sinistra il 50% dei dati.

• La moda è il valore, o la classe, che ricorre piùfrequentemente.

19 / 1

Misure tendenza centraleLe statistiche che ci permettono di descrivere i dati os-servando un valore rappresentativo del centro della dis-tribuzione, sono le misure di tendenza centrale.

• La media (aritmetica) è la somma delle osservazionidivisa per il numero delle osservaioni stesse.

• La media geometrica, se si considerano nosservazioni, è la radice n-sima del prodotto delle nosservazioni.

• La mediana è il valore centrale delle osservazioniordinate in senso non decrescente. Ossia è il valoreche lascia alla sua sinistra il 50% dei dati.

• La moda è il valore, o la classe, che ricorre piùfrequentemente.

19 / 1

Misure tendenza centraleLe statistiche che ci permettono di descrivere i dati os-servando un valore rappresentativo del centro della dis-tribuzione, sono le misure di tendenza centrale.

• La media (aritmetica) è la somma delle osservazionidivisa per il numero delle osservaioni stesse.

• La media geometrica, se si considerano nosservazioni, è la radice n-sima del prodotto delle nosservazioni.

• La mediana è il valore centrale delle osservazioniordinate in senso non decrescente. Ossia è il valoreche lascia alla sua sinistra il 50% dei dati.

• La moda è il valore, o la classe, che ricorre piùfrequentemente.

19 / 1

Misure tendenza centraleLe statistiche che ci permettono di descrivere i dati os-servando un valore rappresentativo del centro della dis-tribuzione, sono le misure di tendenza centrale.

• La media (aritmetica) è la somma delle osservazionidivisa per il numero delle osservaioni stesse.

• La media geometrica, se si considerano nosservazioni, è la radice n-sima del prodotto delle nosservazioni.

• La mediana è il valore centrale delle osservazioniordinate in senso non decrescente. Ossia è il valoreche lascia alla sua sinistra il 50% dei dati.

• La moda è il valore, o la classe, che ricorre piùfrequentemente.

19 / 1

Misure tendenza centraleLe statistiche che ci permettono di descrivere i dati os-servando un valore rappresentativo del centro della dis-tribuzione, sono le misure di tendenza centrale.

• La media (aritmetica) è la somma delle osservazionidivisa per il numero delle osservaioni stesse.

• La media geometrica, se si considerano nosservazioni, è la radice n-sima del prodotto delle nosservazioni.

• La mediana è il valore centrale delle osservazioniordinate in senso non decrescente. Ossia è il valoreche lascia alla sua sinistra il 50% dei dati.

• La moda è il valore, o la classe, che ricorre piùfrequentemente.

19 / 1

Misure tendenza centrale: media aritmeticaLa media aritmetica è la misura di tendenza centrale piùcomune, si calcola come segue.

20 / 1

Misure tendenza centrale: media aritmetica eproprietà

• La media è fortemente influenzata dalla presenza diun outlier, cioè un’osservazione eccessivamentepiccola o eccessivamente grande.

• La media può essere calcolata solo per datiquantitativi.

21 / 1

Misure tendenza centrale: media aritmetica eproprietà

• La media è fortemente influenzata dalla presenza diun outlier, cioè un’osservazione eccessivamentepiccola o eccessivamente grande.

• La media può essere calcolata solo per datiquantitativi.

21 / 1

Misure tendenza centrale: media aritmetica eproprietà

• La media è fortemente influenzata dalla presenza diun outlier, cioè un’osservazione eccessivamentepiccola o eccessivamente grande.

• La media può essere calcolata solo per datiquantitativi.

21 / 1

Misure tendenza centrale: media geometrica

Esistono alcune situazioni in cui la media aritmetica nonfornisce una sintesi dei dati corretta.

EsempioIn una popolazione di batteri si osservano degli aumentidegli effettivi. Si supponga che ad un istante iniziale lapopolazione sia composta da 2.7 · 106 unità. Dopo un’orasi osserva che la popolazione è aumentata del 30% e dopoun’altra ora del 50%.Qual è l’aumento medio?

L’aumento medio dovrebbe essere l’aumento p tale che, seogni ora vi fosse stato un aumento sempre pari a p alloral’aumento totale sarebbe stato quello osservato alla fine.

22 / 1

Misure tendenza centrale: media geometrica

Esistono alcune situazioni in cui la media aritmetica nonfornisce una sintesi dei dati corretta.

EsempioIn una popolazione di batteri si osservano degli aumentidegli effettivi. Si supponga che ad un istante iniziale lapopolazione sia composta da 2.7 · 106 unità. Dopo un’orasi osserva che la popolazione è aumentata del 30% e dopoun’altra ora del 50%.

Qual è l’aumento medio?

L’aumento medio dovrebbe essere l’aumento p tale che, seogni ora vi fosse stato un aumento sempre pari a p alloral’aumento totale sarebbe stato quello osservato alla fine.

22 / 1

Misure tendenza centrale: media geometrica

Esistono alcune situazioni in cui la media aritmetica nonfornisce una sintesi dei dati corretta.

EsempioIn una popolazione di batteri si osservano degli aumentidegli effettivi. Si supponga che ad un istante iniziale lapopolazione sia composta da 2.7 · 106 unità. Dopo un’orasi osserva che la popolazione è aumentata del 30% e dopoun’altra ora del 50%.Qual è l’aumento medio?

L’aumento medio dovrebbe essere l’aumento p tale che, seogni ora vi fosse stato un aumento sempre pari a p alloral’aumento totale sarebbe stato quello osservato alla fine.

22 / 1

Misure tendenza centrale: media geometrica

Esistono alcune situazioni in cui la media aritmetica nonfornisce una sintesi dei dati corretta.

EsempioIn una popolazione di batteri si osservano degli aumentidegli effettivi. Si supponga che ad un istante iniziale lapopolazione sia composta da 2.7 · 106 unità. Dopo un’orasi osserva che la popolazione è aumentata del 30% e dopoun’altra ora del 50%.Qual è l’aumento medio?

L’aumento medio dovrebbe essere l’aumento p tale che, seogni ora vi fosse stato un aumento sempre pari a p alloral’aumento totale sarebbe stato quello osservato alla fine.

22 / 1

Misure tendenza centrale: media geometrica

Se il numero iniziale di batteri è N0 = 2.7 ·106, allora dopola prima ora avremo

N1 = N0 +30

100N0 =

(1+

30100

)N0 = 3.5 ·106

e dopo 2 ore

N2 = N1 +50100

N1 =

(1+

50100

)(1+

30100

)N0 = 5.26 ·106

23 / 1

Misure tendenza centrale: media geometrica

Se il numero iniziale di batteri è N0 = 2.7 ·106, allora dopola prima ora avremo

N1 = N0 +30

100N0 =

(1+

30100

)N0 = 3.5 ·106

e dopo 2 ore

N2 = N1 +50100

N1 =

(1+

50100

)(1+

30100

)N0 = 5.26 ·106

23 / 1

Misure tendenza centrale: media geometricaCalcoliamo la media aritmetica dei due incrementi i1 e i2:

i1 = 1+30100

= 1.3 i2 = 1+50

100= 1.5

per cui l’incremento medio i corrisponde a:

i =i1 + i2

2=

1.3+1.52

= 1.4

ossia un incremento del 40%.Applichiamo questo incremento medio due volte alla popolazioneiniziale e dopo due ore otteniamo:

N2 =

(1+

40100

)(1+

40100

)N0 = 5.29 ·106

Ma5.29 ·106 > 5.26 ·106

24 / 1

Misure tendenza centrale: media geometricaCalcoliamo la media aritmetica dei due incrementi i1 e i2:

i1 = 1+30100

= 1.3 i2 = 1+50

100= 1.5

per cui l’incremento medio i corrisponde a:

i =i1 + i2

2=

1.3+1.52

= 1.4

ossia un incremento del 40%.Applichiamo questo incremento medio due volte alla popolazioneiniziale e dopo due ore otteniamo:

N2 =

(1+

40100

)(1+

40100

)N0 = 5.29 ·106

Ma5.29 ·106 > 5.26 ·106

24 / 1

Misure tendenza centrale: media geometricaCalcoliamo la media aritmetica dei due incrementi i1 e i2:

i1 = 1+30100

= 1.3 i2 = 1+50

100= 1.5

per cui l’incremento medio i corrisponde a:

i =i1 + i2

2=

1.3+1.52

= 1.4

ossia un incremento del 40%.

Applichiamo questo incremento medio due volte alla popolazioneiniziale e dopo due ore otteniamo:

N2 =

(1+

40100

)(1+

40100

)N0 = 5.29 ·106

Ma5.29 ·106 > 5.26 ·106

24 / 1

Misure tendenza centrale: media geometricaCalcoliamo la media aritmetica dei due incrementi i1 e i2:

i1 = 1+30100

= 1.3 i2 = 1+50

100= 1.5

per cui l’incremento medio i corrisponde a:

i =i1 + i2

2=

1.3+1.52

= 1.4

ossia un incremento del 40%.Applichiamo questo incremento medio due volte alla popolazioneiniziale e dopo due ore otteniamo:

N2 =

(1+

40100

)(1+

40100

)N0 = 5.29 ·106

Ma5.29 ·106 > 5.26 ·106

24 / 1

Misure tendenza centrale: media geometrica

Proviamo allora ad applicare la definizione considerata inizial-mente, ossia consideriamo come aumento medio quel p taleche, se ogni ora vi fosse stato un aumento sempre pari a p alloral’aumento totale sarebbe stato quello osservato alla fine:

(1+p)2N0 =(

1+p1

100

)(1+

p2

100

)N0

dove p1 è l’aumento dopo la prima ora e p2 l’aumento dopo laseconda. Indichiamo con iM = (1+p) l’incremento medio e coni1 = 1+p1 e i2 = 1+p2 gli incrementi effettivi.Ma allora

1+p =[(

1+p1

100

)(1+

p2

100

)] 12

25 / 1

Misure tendenza centrale: media geometrica

Proviamo allora ad applicare la definizione considerata inizial-mente, ossia consideriamo come aumento medio quel p taleche, se ogni ora vi fosse stato un aumento sempre pari a p alloral’aumento totale sarebbe stato quello osservato alla fine:

(1+p)2N0 =(

1+p1

100

)(1+

p2

100

)N0

dove p1 è l’aumento dopo la prima ora e p2 l’aumento dopo laseconda. Indichiamo con iM = (1+p) l’incremento medio e coni1 = 1+p1 e i2 = 1+p2 gli incrementi effettivi.

Ma allora

1+p =[(

1+p1

100

)(1+

p2

100

)] 12

25 / 1

Misure tendenza centrale: media geometrica

Proviamo allora ad applicare la definizione considerata inizial-mente, ossia consideriamo come aumento medio quel p taleche, se ogni ora vi fosse stato un aumento sempre pari a p alloral’aumento totale sarebbe stato quello osservato alla fine:

(1+p)2N0 =(

1+p1

100

)(1+

p2

100

)N0

dove p1 è l’aumento dopo la prima ora e p2 l’aumento dopo laseconda. Indichiamo con iM = (1+p) l’incremento medio e coni1 = 1+p1 e i2 = 1+p2 gli incrementi effettivi.Ma allora

1+p =[(

1+p1

100

)(1+

p2

100

)] 12

25 / 1

Misure tendenza centrale: media geometrica

Formalmente

Dati n numeri x1,x2, . . .xn definiamo la media geometricacome

xG = n√

x1 · x2 · . . . · xn

Dalla definizione data discende che l’applicazione dellamedia geometrica intressa maggiormente tutti quei fenomeninei quali un certo risultato dipende dalla moltiplicazione diuna serie di valori associati ai dati statistici.

26 / 1

Misure tendenza centrale: media geometrica

Formalmente

Dati n numeri x1,x2, . . .xn definiamo la media geometricacome

xG = n√

x1 · x2 · . . . · xn

Dalla definizione data discende che l’applicazione dellamedia geometrica intressa maggiormente tutti quei fenomeninei quali un certo risultato dipende dalla moltiplicazione diuna serie di valori associati ai dati statistici.

26 / 1

Misure tendenza centrale: media geometrica

Nell’esempio dei batteri avevamo

• incremento dopo un’ora i1 = 1.3

• incremento dopo due ore i2 = 1.5

da cuixG =

√1.3 ·1.5 =

√1.95 = 1.3964

Applicando due volte questo incremento del 39.64% al numeroiniziale di batteri otteniamo il risultato finale N2 = 5.26 ·106.

27 / 1

Misure tendenza centrale: media geometrica

Nell’esempio dei batteri avevamo

• incremento dopo un’ora i1 = 1.3

• incremento dopo due ore i2 = 1.5

da cuixG =

√1.3 ·1.5 =

√1.95 = 1.3964

Applicando due volte questo incremento del 39.64% al numeroiniziale di batteri otteniamo il risultato finale N2 = 5.26 ·106.

27 / 1

Misure tendenza centrale: media geometrica

Nell’esempio dei batteri avevamo

• incremento dopo un’ora i1 = 1.3

• incremento dopo due ore i2 = 1.5

da cuixG =

√1.3 ·1.5 =

√1.95 = 1.3964

Applicando due volte questo incremento del 39.64% al numeroiniziale di batteri otteniamo il risultato finale N2 = 5.26 ·106.

27 / 1

Proprietà media geometricaData

xG = n√

x1 · x2 · . . . · xn

allora

loga(xG) = loga(n√

x1 · x2 · . . . · xn) = loga(x1 · x2 · . . . · xn)1n =

=1n

loga(x1 ·x2 · . . . ·xn) =1n[loga(x1)+ loga(x2)+ . . .+ loga(xn)]

Quindi il logaritmo della media geometrica è la media arit-metica del logaritmo dei singoli dati.

Poichè la risposta ad uno stimolo non è proporzionale allostimolo stesso ma al suo logaritmo (legge di Weber), lamedia geometrica trova applicazioni in farmacologia e inaltri contesti.

28 / 1

Proprietà media geometricaData

xG = n√

x1 · x2 · . . . · xn

allora

loga(xG) = loga(n√

x1 · x2 · . . . · xn) = loga(x1 · x2 · . . . · xn)1n =

=1n

loga(x1 ·x2 · . . . ·xn) =1n[loga(x1)+ loga(x2)+ . . .+ loga(xn)]

Quindi il logaritmo della media geometrica è la media arit-metica del logaritmo dei singoli dati.

Poichè la risposta ad uno stimolo non è proporzionale allostimolo stesso ma al suo logaritmo (legge di Weber), lamedia geometrica trova applicazioni in farmacologia e inaltri contesti.

28 / 1

Proprietà media geometricaData

xG = n√

x1 · x2 · . . . · xn

allora

loga(xG) = loga(n√

x1 · x2 · . . . · xn) = loga(x1 · x2 · . . . · xn)1n =

=1n

loga(x1 ·x2 · . . . ·xn) =1n[loga(x1)+ loga(x2)+ . . .+ loga(xn)]

Quindi il logaritmo della media geometrica è la media arit-metica del logaritmo dei singoli dati.

Poichè la risposta ad uno stimolo non è proporzionale allostimolo stesso ma al suo logaritmo (legge di Weber), lamedia geometrica trova applicazioni in farmacologia e inaltri contesti.

28 / 1

Proprietà media geometricaData

xG = n√

x1 · x2 · . . . · xn

allora

loga(xG) = loga(n√

x1 · x2 · . . . · xn) = loga(x1 · x2 · . . . · xn)1n =

=1n

loga(x1 ·x2 · . . . ·xn) =1n[loga(x1)+ loga(x2)+ . . .+ loga(xn)]

Quindi il logaritmo della media geometrica è la media arit-metica del logaritmo dei singoli dati.

Poichè la risposta ad uno stimolo non è proporzionale allostimolo stesso ma al suo logaritmo (legge di Weber), lamedia geometrica trova applicazioni in farmacologia e inaltri contesti.

28 / 1

Proprietà media geometricaData

xG = n√

x1 · x2 · . . . · xn

allora

loga(xG) = loga(n√

x1 · x2 · . . . · xn) = loga(x1 · x2 · . . . · xn)1n =

=1n

loga(x1 ·x2 · . . . ·xn) =1n[loga(x1)+ loga(x2)+ . . .+ loga(xn)]

Quindi il logaritmo della media geometrica è la media arit-metica del logaritmo dei singoli dati.

Poichè la risposta ad uno stimolo non è proporzionale allostimolo stesso ma al suo logaritmo (legge di Weber), lamedia geometrica trova applicazioni in farmacologia e inaltri contesti.

28 / 1

Misure tendenza centrale: mediana• In una lista ordinata la mediana è il valore centrale

(50% prima e 50% dopo)

• La mediana non è per niente influenzata dallapresenza di un outlier dato che essa tiene contoesclusivamente dell’ordine dei dati.

• La mediana può essere calcolata sia per datiquantitativi che per dati qualitativi ordinali.

29 / 1

Misure tendenza centrale: mediana• In una lista ordinata la mediana è il valore centrale

(50% prima e 50% dopo)• La mediana non è per niente influenzata dalla

presenza di un outlier dato che essa tiene contoesclusivamente dell’ordine dei dati.

• La mediana può essere calcolata sia per datiquantitativi che per dati qualitativi ordinali.

29 / 1

Misure tendenza centrale: mediana• In una lista ordinata la mediana è il valore centrale

(50% prima e 50% dopo)• La mediana non è per niente influenzata dalla

presenza di un outlier dato che essa tiene contoesclusivamente dell’ordine dei dati.

• La mediana può essere calcolata sia per datiquantitativi che per dati qualitativi ordinali.

29 / 1

Misure tendenza centrale: mediana• In una lista ordinata la mediana è il valore centrale

(50% prima e 50% dopo)• La mediana non è per niente influenzata dalla

presenza di un outlier dato che essa tiene contoesclusivamente dell’ordine dei dati.

• La mediana può essere calcolata sia per datiquantitativi che per dati qualitativi ordinali.

29 / 1

Misure tendenza centrale: calcolare lamediana

Per calcolare la mediana si individua la sua posizione nellasequenza ordinata dei dati in senso non decrescente.

• Se il numero di valori è dispari, la mediana è il valorecentrale nella sequenza ordinata e la sua posizione sipuò calcolare come

(n+1)2

;

• se il numero di valori è pari, la mediana è la mediaaritmetica tra le osservazioni che occupano leposizioni n

2 e n2 +1.

30 / 1

Misure tendenza centrale: calcolare lamediana

Per calcolare la mediana si individua la sua posizione nellasequenza ordinata dei dati in senso non decrescente.

• Se il numero di valori è dispari, la mediana è il valorecentrale nella sequenza ordinata e la sua posizione sipuò calcolare come

(n+1)2

;

• se il numero di valori è pari, la mediana è la mediaaritmetica tra le osservazioni che occupano leposizioni n

2 e n2 +1.

30 / 1

Misure tendenza centrale: calcolare lamediana

Per calcolare la mediana si individua la sua posizione nellasequenza ordinata dei dati in senso non decrescente.

• Se il numero di valori è dispari, la mediana è il valorecentrale nella sequenza ordinata e la sua posizione sipuò calcolare come

(n+1)2

;

• se il numero di valori è pari, la mediana è la mediaaritmetica tra le osservazioni che occupano leposizioni n

2 e n2 +1.

30 / 1

Misure tendenza centrale: calcolare lamediana

Per calcolare la mediana si individua la sua posizione nellasequenza ordinata dei dati in senso non decrescente.

• Se il numero di valori è dispari, la mediana è il valorecentrale nella sequenza ordinata e la sua posizione sipuò calcolare come

(n+1)2

;

• se il numero di valori è pari, la mediana è la mediaaritmetica tra le osservazioni che occupano leposizioni n

2 e n2 +1.

30 / 1

Misure tendenza centrale: la modaLa moda è una misura di tendenza centrale per dati siaqualitativi che quantitativi.

• È il valore, o la classe, che ricorre più frequentemente

• non è influenzata da outliers

• può non esserci una moda

• ci può essere più di una moda.

31 / 1

Misure tendenza centrale: la modaLa moda è una misura di tendenza centrale per dati siaqualitativi che quantitativi.

• È il valore, o la classe, che ricorre più frequentemente

• non è influenzata da outliers

• può non esserci una moda

• ci può essere più di una moda.

31 / 1

Misure tendenza centrale: la modaLa moda è una misura di tendenza centrale per dati siaqualitativi che quantitativi.

• È il valore, o la classe, che ricorre più frequentemente

• non è influenzata da outliers

• può non esserci una moda

• ci può essere più di una moda.

31 / 1

Misure tendenza centrale: la modaLa moda è una misura di tendenza centrale per dati siaqualitativi che quantitativi.

• È il valore, o la classe, che ricorre più frequentemente

• non è influenzata da outliers

• può non esserci una moda

• ci può essere più di una moda.

31 / 1

Misure tendenza centrale: la modaLa moda è una misura di tendenza centrale per dati siaqualitativi che quantitativi.

• È il valore, o la classe, che ricorre più frequentemente

• non è influenzata da outliers

• può non esserci una moda

• ci può essere più di una moda.

31 / 1

Misure tendenza centrale: la modaLa moda è una misura di tendenza centrale per dati siaqualitativi che quantitativi.

• È il valore, o la classe, che ricorre più frequentemente

• non è influenzata da outliers

• può non esserci una moda

• ci può essere più di una moda.

31 / 1

Misure tendenza centrale: la modaLa moda è una misura di tendenza centrale per dati siaqualitativi che quantitativi.

• È il valore, o la classe, che ricorre più frequentemente

• non è influenzata da outliers

• può non esserci una moda

• ci può essere più di una moda.

31 / 1

Misure tendenza centrale: esercizio

In sette città in Canada il 14 gennaio 2006 sono state reg-istrate le seguenti temperature.Calcolarne moda, media e mediana.

−12 −5 2 2 0 −3 5

32 / 1

Misure tendenza centrale: esercizioCalcolarne moda, media e mediana.

−12 −5 2 2 0 −3 5

Moda = 2

x =−12−5+2+2+0−3+5

7=−11

7=−1.57

Riordiniamo i dati per calcolare la mediana:

−12,−5,−3,0,2,2,5

i dati sono dispari prendo il valore alla posizione n+12 , ossia

82 = 4

Me = 0

33 / 1

Misure tendenza centrale: esercizioCalcolarne moda, media e mediana.

−12 −5 2 2 0 −3 5

Moda = 2

x =−12−5+2+2+0−3+5

7=−11

7=−1.57

Riordiniamo i dati per calcolare la mediana:

−12,−5,−3,0,2,2,5

i dati sono dispari prendo il valore alla posizione n+12 , ossia

82 = 4

Me = 0

33 / 1

Misure tendenza centrale: esercizioCalcolarne moda, media e mediana.

−12 −5 2 2 0 −3 5

Moda = 2

x =−12−5+2+2+0−3+5

7=−11

7=−1.57

Riordiniamo i dati per calcolare la mediana:

−12,−5,−3,0,2,2,5

i dati sono dispari prendo il valore alla posizione n+12 , ossia

82 = 4

Me = 0

33 / 1

Misure tendenza centrale: esercizioCalcolarne moda, media e mediana.

−12 −5 2 2 0 −3 5

Moda = 2

x =−12−5+2+2+0−3+5

7=−11

7=−1.57

Riordiniamo i dati per calcolare la mediana:

−12,−5,−3,0,2,2,5

i dati sono dispari prendo il valore alla posizione n+12 , ossia

82 = 4

Me = 0

33 / 1

Misure tendenza centrale: esercizioCalcolarne moda, media e mediana.

−12 −5 2 2 0 −3 5

Moda = 2

x =−12−5+2+2+0−3+5

7=−11

7=−1.57

Riordiniamo i dati per calcolare la mediana:

−12,−5,−3,0,2,2,5

i dati sono dispari prendo il valore alla posizione n+12 , ossia

82 = 4

Me = 033 / 1

Misure tendenza centrale: esercizio

In 20 marche di cereali è stato analizzato il contenuto di so-dio in mg in una porzione standard, secondo quanto codi-ficato dal National Labelling and educational Act.Calcolare moda media e mediana delle 20 misurazioni:

0 340 70 140 200 180 210 150 100 130

140 180 190 160 290 50 220 180 200 210

34 / 1

Misure tendenza centrale: esercizioDato il contenuto di sodio in mg in 20 cereali calcolare modamedia e mediana delle 20 misurazioni:

x = 167 Moda = 180

Per calcolare la mediana riordiniamo i dati:

0 50 70 100 130 140 140 150 160 180

180 180 190 200 200 210 210 220 290 340

le osservazioni sono paria, alla posizione n2 = 20

2 = 10 troviamol’osservazione 180, alla posizione n

2 + 1 = 202 + 1 = 10+ 1 = 11

troviamo l’osservazione 180. La loro media risulta

180+1802

= 180

dunqueMe = 180

.

35 / 1

Misure tendenza centrale: esercizioDato il contenuto di sodio in mg in 20 cereali calcolare modamedia e mediana delle 20 misurazioni:

x = 167 Moda = 180

Per calcolare la mediana riordiniamo i dati:

0 50 70 100 130 140 140 150 160 180

180 180 190 200 200 210 210 220 290 340

le osservazioni sono paria, alla posizione n2 = 20

2 = 10 troviamol’osservazione 180, alla posizione n

2 + 1 = 202 + 1 = 10+ 1 = 11

troviamo l’osservazione 180. La loro media risulta

180+1802

= 180

dunqueMe = 180

.

35 / 1

Misure tendenza centrale: esercizioDato il contenuto di sodio in mg in 20 cereali calcolare modamedia e mediana delle 20 misurazioni:

x = 167 Moda = 180

Per calcolare la mediana riordiniamo i dati:

0 50 70 100 130 140 140 150 160 180

180 180 190 200 200 210 210 220 290 340

le osservazioni sono paria, alla posizione n2 = 20

2 = 10 troviamol’osservazione 180, alla posizione n

2 + 1 = 202 + 1 = 10+ 1 = 11

troviamo l’osservazione 180. La loro media risulta

180+1802

= 180

dunqueMe = 180

.

35 / 1

Misure tendenza centrale: esercizioDato il contenuto di sodio in mg in 20 cereali calcolare modamedia e mediana delle 20 misurazioni:

x = 167 Moda = 180

Per calcolare la mediana riordiniamo i dati:

0 50 70 100 130 140 140 150 160 180

180 180 190 200 200 210 210 220 290 340

le osservazioni sono paria, alla posizione n2 = 20

2 = 10 troviamol’osservazione 180, alla posizione n

2 + 1 = 202 + 1 = 10+ 1 = 11

troviamo l’osservazione 180. La loro media risulta

180+1802

= 180

dunqueMe = 180

.

35 / 1

Confronto media e mediana

Se la forma della distribuzione è:

• perfettamente simmetrica: media e medianacoincidono;

• asimmetrica a destra: media più grande dellamediana;

• asimmetrica a sinistra: media più piccola dellamediana;

36 / 1

Confronto media e mediana

Se la forma della distribuzione è:

• perfettamente simmetrica: media e medianacoincidono;

• asimmetrica a destra: media più grande dellamediana;

• asimmetrica a sinistra: media più piccola dellamediana;

36 / 1

Confronto media e mediana

Se la forma della distribuzione è:

• perfettamente simmetrica: media e medianacoincidono;

• asimmetrica a destra: media più grande dellamediana;

• asimmetrica a sinistra: media più piccola dellamediana;

36 / 1

Confronto media e mediana

Se la forma della distribuzione è:

• perfettamente simmetrica: media e medianacoincidono;

• asimmetrica a destra: media più grande dellamediana;

• asimmetrica a sinistra: media più piccola dellamediana;

36 / 1

Confronto media e mediana

Preferiamo usare la mediana:• quando i dati sono fortemente asimmetrici;

• in presenza di outliers.

E’ sconsigliato usare la mediana:• quando i dati sono fortemente discreti;• i dati sono abbastanza simmetrici.

37 / 1

Confronto media e mediana

Preferiamo usare la mediana:• quando i dati sono fortemente asimmetrici;• in presenza di outliers.

E’ sconsigliato usare la mediana:• quando i dati sono fortemente discreti;• i dati sono abbastanza simmetrici.

37 / 1

Confronto media e mediana

Preferiamo usare la mediana:• quando i dati sono fortemente asimmetrici;• in presenza di outliers.

E’ sconsigliato usare la mediana:• quando i dati sono fortemente discreti;

• i dati sono abbastanza simmetrici.

37 / 1

Confronto media e mediana

Preferiamo usare la mediana:• quando i dati sono fortemente asimmetrici;• in presenza di outliers.

E’ sconsigliato usare la mediana:• quando i dati sono fortemente discreti;• i dati sono abbastanza simmetrici.

37 / 1

Confronto media e mediana

Preferiamo usare la mediana:• quando i dati sono fortemente asimmetrici;• in presenza di outliers.

E’ sconsigliato usare la mediana:• quando i dati sono fortemente discreti;• i dati sono abbastanza simmetrici.

37 / 1

Misure di variabilità per dati quantitativi

Per descrivere in modo completo la distribuzione dei dati siintroducono delle misure di sintesi sulla variabilità, le qualipermettono di studiare l’attitudine di un fenomeno ad as-sumere diverse modalità.

Gli indici standard sono:• Il range o campo di variazione;

• La deviazione;

• La varianza;

• La deviazione standard;

38 / 1

Misure di variabilità per dati quantitativi

Per descrivere in modo completo la distribuzione dei dati siintroducono delle misure di sintesi sulla variabilità, le qualipermettono di studiare l’attitudine di un fenomeno ad as-sumere diverse modalità. Gli indici standard sono:• Il range o campo di variazione;

• La deviazione;

• La varianza;

• La deviazione standard;

38 / 1

Misure di variabilità per dati quantitativi

Per descrivere in modo completo la distribuzione dei dati siintroducono delle misure di sintesi sulla variabilità, le qualipermettono di studiare l’attitudine di un fenomeno ad as-sumere diverse modalità. Gli indici standard sono:• Il range o campo di variazione;

• La deviazione;

• La varianza;

• La deviazione standard;

38 / 1

Misure di variabilità per dati quantitativi

Per descrivere in modo completo la distribuzione dei dati siintroducono delle misure di sintesi sulla variabilità, le qualipermettono di studiare l’attitudine di un fenomeno ad as-sumere diverse modalità. Gli indici standard sono:• Il range o campo di variazione;

• La deviazione;

• La varianza;

• La deviazione standard;

38 / 1

Misure di variabilità per dati quantitativi

Per descrivere in modo completo la distribuzione dei dati siintroducono delle misure di sintesi sulla variabilità, le qualipermettono di studiare l’attitudine di un fenomeno ad as-sumere diverse modalità. Gli indici standard sono:• Il range o campo di variazione;

• La deviazione;

• La varianza;

• La deviazione standard;

38 / 1

Misure di variabilità per dati quantitativi

Per descrivere in modo completo la distribuzione dei dati siintroducono delle misure di sintesi sulla variabilità, le qualipermettono di studiare l’attitudine di un fenomeno ad as-sumere diverse modalità. Gli indici standard sono:• Il range o campo di variazione;

• La deviazione;

• La varianza;

• La deviazione standard;

38 / 1

Misure di variabilità per dati quantitativi

Un indice per la misura della variabilità deve avere le seguenticaratteristiche:

• un indice di variabilità deve assumere valori maggiorio uguali a 0

• un indice di variabilità calcolato su una distribuzionedi costanti è uguale a 0

• aggiungendo una costante alla variabile osservata, ilvalore dell’indice non deve cambiare.

39 / 1

Misure di variabilità per dati quantitativi

Un indice per la misura della variabilità deve avere le seguenticaratteristiche:

• un indice di variabilità deve assumere valori maggiorio uguali a 0

• un indice di variabilità calcolato su una distribuzionedi costanti è uguale a 0

• aggiungendo una costante alla variabile osservata, ilvalore dell’indice non deve cambiare.

39 / 1

Misure di variabilità per dati quantitativi

Un indice per la misura della variabilità deve avere le seguenticaratteristiche:

• un indice di variabilità deve assumere valori maggiorio uguali a 0

• un indice di variabilità calcolato su una distribuzionedi costanti è uguale a 0

• aggiungendo una costante alla variabile osservata, ilvalore dell’indice non deve cambiare.

39 / 1

Misure di variabilità per dati quantitativi

Un indice per la misura della variabilità deve avere le seguenticaratteristiche:

• un indice di variabilità deve assumere valori maggiorio uguali a 0

• un indice di variabilità calcolato su una distribuzionedi costanti è uguale a 0

• aggiungendo una costante alla variabile osservata, ilvalore dell’indice non deve cambiare.

39 / 1

Misure di variabilità per dati quantitativi

Un indice per la misura della variabilità deve avere le seguenticaratteristiche:

• un indice di variabilità deve assumere valori maggiorio uguali a 0

• un indice di variabilità calcolato su una distribuzionedi costanti è uguale a 0

• aggiungendo una costante alla variabile osservata, ilvalore dell’indice non deve cambiare.

39 / 1

Range o campo di variazione

• È la più semplice misura di variabilità

• è la differenza tra la più grande e la più piccolaosservazione

range = xmassimo− xminimo

Il range non tiene conto del modo in cui i dati sono distribuiti, percui non sintetizza bene la variabilità.

40 / 1

Range o campo di variazione

• È la più semplice misura di variabilità

• è la differenza tra la più grande e la più piccolaosservazione

range = xmassimo− xminimo

Il range non tiene conto del modo in cui i dati sono distribuiti, percui non sintetizza bene la variabilità.

40 / 1

Range o campo di variazione

• È la più semplice misura di variabilità

• è la differenza tra la più grande e la più piccolaosservazione

range = xmassimo− xminimo

Il range non tiene conto del modo in cui i dati sono distribuiti, percui non sintetizza bene la variabilità.

40 / 1

Range o campo di variazione

• È la più semplice misura di variabilità

• è la differenza tra la più grande e la più piccolaosservazione

range = xmassimo− xminimo

Il range non tiene conto del modo in cui i dati sono distribuiti, percui non sintetizza bene la variabilità.

40 / 1

Altre misure di variabilità

Una buona misura di variabilità dovrebbe usare tutti i valoriosservati e dovrebbe fornire in modo sintetico una distanzadi quanto lontani (o dispersi) sono i dati rispetto alla media.

Tale misura dovrebbe quindi sintetizzare le deviazioni dallamedia.

41 / 1

Altre misure di variabilità

Una buona misura di variabilità dovrebbe usare tutti i valoriosservati e dovrebbe fornire in modo sintetico una distanzadi quanto lontani (o dispersi) sono i dati rispetto alla media.

Tale misura dovrebbe quindi sintetizzare le deviazioni dallamedia.

41 / 1

Altre misure di variabilità

Una buona misura di variabilità dovrebbe usare tutti i valoriosservati e dovrebbe fornire in modo sintetico una distanzadi quanto lontani (o dispersi) sono i dati rispetto alla media.

Tale misura dovrebbe quindi sintetizzare le deviazioni dallamedia.

41 / 1

Altre misure di variabilità: scarto• La deviazione o scarto di una osservazione x dalla media xè la differenza tra l’osservazione e la media campionaria:

scarto = x− x

• Una deviazione è positiva quando l’osservazione cadeoltre la media.

• Una deviazione è negativa quando l’osservazione cadeprima della media.

• La somma delle deviazioni è sempre pari a zero.

42 / 1

Altre misure di variabilità: scarto• La deviazione o scarto di una osservazione x dalla media xè la differenza tra l’osservazione e la media campionaria:

scarto = x− x

• Una deviazione è positiva quando l’osservazione cadeoltre la media.

• Una deviazione è negativa quando l’osservazione cadeprima della media.

• La somma delle deviazioni è sempre pari a zero.

42 / 1

Altre misure di variabilità: scarto• La deviazione o scarto di una osservazione x dalla media xè la differenza tra l’osservazione e la media campionaria:

scarto = x− x

• Una deviazione è positiva quando l’osservazione cadeoltre la media.

• Una deviazione è negativa quando l’osservazione cadeprima della media.

• La somma delle deviazioni è sempre pari a zero.

42 / 1

Altre misure di variabilità: scarto• La deviazione o scarto di una osservazione x dalla media xè la differenza tra l’osservazione e la media campionaria:

scarto = x− x

• Una deviazione è positiva quando l’osservazione cadeoltre la media.

• Una deviazione è negativa quando l’osservazione cadeprima della media.

• La somma delle deviazioni è sempre pari a zero.

42 / 1

Altre misure di variabilità: scarto• La deviazione o scarto di una osservazione x dalla media xè la differenza tra l’osservazione e la media campionaria:

scarto = x− x

• Una deviazione è positiva quando l’osservazione cadeoltre la media.

• Una deviazione è negativa quando l’osservazione cadeprima della media.

• La somma delle deviazioni è sempre pari a zero.42 / 1

Altre misure di variabilità: varianza

A partire dagli scarti si può costruire la varianza come la mediaaritmetica delle deviazioni al quadrato.

• Varianza della popolazione

σ2 =

∑ni=1(xi−µ)2

Ncon µ media della popolazione

• Varianza campionaria

s2 =∑

ni=1(xi− x)2

n−1con x media campionaria.

43 / 1

Altre misure di variabilità: varianza

A partire dagli scarti si può costruire la varianza come la mediaaritmetica delle deviazioni al quadrato.

• Varianza della popolazione

σ2 =

∑ni=1(xi−µ)2

N

con µ media della popolazione

• Varianza campionaria

s2 =∑

ni=1(xi− x)2

n−1con x media campionaria.

43 / 1

Altre misure di variabilità: varianza

A partire dagli scarti si può costruire la varianza come la mediaaritmetica delle deviazioni al quadrato.

• Varianza della popolazione

σ2 =

∑ni=1(xi−µ)2

Ncon µ media della popolazione

• Varianza campionaria

s2 =∑

ni=1(xi− x)2

n−1con x media campionaria.

43 / 1

Altre misure di variabilità: varianza

A partire dagli scarti si può costruire la varianza come la mediaaritmetica delle deviazioni al quadrato.

• Varianza della popolazione

σ2 =

∑ni=1(xi−µ)2

Ncon µ media della popolazione

• Varianza campionaria

s2 =∑

ni=1(xi− x)2

n−1con x media campionaria.

43 / 1

Altre misure di variabilità: varianza

A partire dagli scarti si può costruire la varianza come la mediaaritmetica delle deviazioni al quadrato.

• Varianza della popolazione

σ2 =

∑ni=1(xi−µ)2

Ncon µ media della popolazione

• Varianza campionaria

s2 =∑

ni=1(xi− x)2

n−1

con x media campionaria.

43 / 1

Altre misure di variabilità: varianza

A partire dagli scarti si può costruire la varianza come la mediaaritmetica delle deviazioni al quadrato.

• Varianza della popolazione

σ2 =

∑ni=1(xi−µ)2

Ncon µ media della popolazione

• Varianza campionaria

s2 =∑

ni=1(xi− x)2

n−1con x media campionaria.

43 / 1

Altre misure di variabilità: varianza

La varianza gode di alcune importanti proprietà:

• la varianza è sempre un numero non negativo (≥ 0)

• la varianza di una costante è nulla

• se a una variabile aggiungiamo una costante lavarianza non cambia.

44 / 1

Altre misure di variabilità: varianza

La varianza gode di alcune importanti proprietà:

• la varianza è sempre un numero non negativo (≥ 0)

• la varianza di una costante è nulla

• se a una variabile aggiungiamo una costante lavarianza non cambia.

44 / 1

Altre misure di variabilità: varianza

La varianza gode di alcune importanti proprietà:

• la varianza è sempre un numero non negativo (≥ 0)

• la varianza di una costante è nulla

• se a una variabile aggiungiamo una costante lavarianza non cambia.

44 / 1

Altre misure di variabilità: varianza

La varianza gode di alcune importanti proprietà:

• la varianza è sempre un numero non negativo (≥ 0)

• la varianza di una costante è nulla

• se a una variabile aggiungiamo una costante lavarianza non cambia.

44 / 1

Altre misure di variabilità: deviazionestandard

La varianza non è di facile interpretazione dato che la sua unitàdi misura non coincide con quella dei dati. Per questo mo-tivo, a livello interpretativo, si preferisce considerarne la radicequadrata.

Si definisce deviazione standard il quadrato della varianza

• deviazione standard della popolazione

σ =

√∑

ni=1(xi−µ)2

N

• deviazione standard campionaria

s =

√∑

ni=1(xi− x)2

n−1.

45 / 1

Altre misure di variabilità: deviazionestandard

La varianza non è di facile interpretazione dato che la sua unitàdi misura non coincide con quella dei dati. Per questo mo-tivo, a livello interpretativo, si preferisce considerarne la radicequadrata.

Si definisce deviazione standard il quadrato della varianza

• deviazione standard della popolazione

σ =

√∑

ni=1(xi−µ)2

N

• deviazione standard campionaria

s =

√∑

ni=1(xi− x)2

n−1.

45 / 1

Altre misure di variabilità: deviazionestandard

La varianza non è di facile interpretazione dato che la sua unitàdi misura non coincide con quella dei dati. Per questo mo-tivo, a livello interpretativo, si preferisce considerarne la radicequadrata.

Si definisce deviazione standard il quadrato della varianza

• deviazione standard della popolazione

σ =

√∑

ni=1(xi−µ)2

N

• deviazione standard campionaria

s =

√∑

ni=1(xi− x)2

n−1.

45 / 1

Altre misure di variabilità: deviazionestandard

La varianza non è di facile interpretazione dato che la sua unitàdi misura non coincide con quella dei dati. Per questo mo-tivo, a livello interpretativo, si preferisce considerarne la radicequadrata.

Si definisce deviazione standard il quadrato della varianza

• deviazione standard della popolazione

σ =

√∑

ni=1(xi−µ)2

N

• deviazione standard campionaria

s =

√∑

ni=1(xi− x)2

n−1.

45 / 1

Altre misure di variabilità: deviazionestandard

La varianza non è di facile interpretazione dato che la sua unitàdi misura non coincide con quella dei dati. Per questo mo-tivo, a livello interpretativo, si preferisce considerarne la radicequadrata.

Si definisce deviazione standard il quadrato della varianza

• deviazione standard della popolazione

σ =

√∑

ni=1(xi−µ)2

N

• deviazione standard campionaria

s =

√∑

ni=1(xi− x)2

n−1.

45 / 1

Altre misure di variabilità: deviazionestandard

A livello interpretativo la deviazione standard gode di al-cune importanti proprietà:

• fornisce una misura della dispersione ”media” attornoalla media

• più elevato è il valore assunto dalla deviazionestandard maggiore è la variabilità dei dati

• poichè dipende dalla media essa è influenzata dallapresenza di eventuali outlier.

46 / 1

Altre misure di variabilità: deviazionestandard

A livello interpretativo la deviazione standard gode di al-cune importanti proprietà:

• fornisce una misura della dispersione ”media” attornoalla media

• più elevato è il valore assunto dalla deviazionestandard maggiore è la variabilità dei dati

• poichè dipende dalla media essa è influenzata dallapresenza di eventuali outlier.

46 / 1

Altre misure di variabilità: deviazionestandard

A livello interpretativo la deviazione standard gode di al-cune importanti proprietà:

• fornisce una misura della dispersione ”media” attornoalla media

• più elevato è il valore assunto dalla deviazionestandard maggiore è la variabilità dei dati

• poichè dipende dalla media essa è influenzata dallapresenza di eventuali outlier.

46 / 1

Altre misure di variabilità: deviazionestandard

A livello interpretativo la deviazione standard gode di al-cune importanti proprietà:

• fornisce una misura della dispersione ”media” attornoalla media

• più elevato è il valore assunto dalla deviazionestandard maggiore è la variabilità dei dati

• poichè dipende dalla media essa è influenzata dallapresenza di eventuali outlier.

46 / 1

Interpretazione della variabilità

47 / 1

Calcolare le misure di variabilità

In sette città in Canada il 14 gennaio 2006 sono state reg-istrate le seguenti temperature.

−12 −5 2 2 0 −3 5

Calcolare il range, gli scarti dalla media, la varianza e ladeviazione standard.

48 / 1