SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili –...

25
SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere i dati a causa di un numero di categorie elevato (nel caso di valori discreti NdE>18) o perché la variabile è di tipo continuo. Raccogliere i valori in Intervalli di Classe

Transcript of SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili –...

Page 1: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

SCALA INTERVALLO / A RAPPORTO

STATISTICHE:

Moda - Mediana - MediaNdE – Quartili – Quantili – Range – Varianza – Deviazione standard

Difficoltà nel riassumere i dati a causa di un numero di categorie elevato (nel caso di valori discreti NdE>18) o perché la variabile è di tipo continuo.

Raccogliere i valori in Intervalli di Classe

Page 2: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

SCALA INTERVALLO / A RAPPORTO

• Possibili rapporti di uguaglianza (livello nominale).• Possibili rapporti di ordine (livello ordinale).• Esiste un’unità di misura (intervallo) che permette di

stabilire la distanza fra 2 categorie.• Per definire le statistiche bisogna definire se le variabili

sono di tipo discreto o continuo.

STATISTICHE:• Moda - Mediana – Media• Quartili – Quantili • NdE –– Range – Varianza – Deviazione standard

Page 3: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Tre misure di tendenza centrale

MEDIA

MEDIANA

MODA

Page 4: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Indici di tendenza centrale

1 2 3 4 5 6 7 8 9

0

0,5

1

1,5

2

2,5

3

3,5

4

4,5

5

f

Voto

Casi

1 2 3 4 5 6 7 8 9

0

0,5

1

1,5

2

2,5

3

3,5

4

4,5

5

5,5

6

f

Voto

Casi

Qual è il punto centrale della distribuzione?

1 2 3 4 5 6 7 8 9

0

1

2

3

4

5

6

7

8

9

10

11

12

Voto

Page 5: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Indici di tendenza centrale: la media aritmetica

Maritmetica = xi / n

n

XfXM aritmetica Ponderata

Page 6: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Indici di tendenza centrale: la media aritmetica

Allora potremmo estrapolare una grandezza M tale che

 

Xtot = M + M + M + ….. + M

Per cui

M + M + M + ….. + M = x1 + x2 + x3 +……+ xn

Da qui:

nM = xi

  Maritmetica= xi / n

Page 7: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

La media• La media di una distribuzione è la somma

dei valori osservati divisa dal numero delle osservazioni

NX

nXX

Popolazione

N: La grandezza della popolazione

Campione

n: La grandezza del campione

Page 8: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

La media

Codice_studente Voto7 258 259 253 265 261 276 2710 294 292 30

9,2610

26910

)30292927272626252525(

X

Page 9: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Perché si chiama così?

Essa si chiama aritmetica perché se applicata ad una progressione aritmetica, costituita da un numero dispari di elementi, ne costituisce l’elemento centrale.

 

Esempio: 13, 16, 19, 22, 25

 

Media = (13+16+19+22+25)/5= 19 (valore centrale della progressione)

Indici di tendenza centrale: la media aritmetica

Page 10: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Il concetto di SCARTO: Data una successione di dati x1, x2, x3, x4, ….. , xn si chiamano scarti dalla media i valori pari a

l = xi- M (scarto semplice dalla media)

Indici di tendenza centrale: la media aritmetica

Page 11: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

PROPRIETA’ IMPORTANTE DELLA MEDIA ARITMETICA

Indici di tendenza centrale: la media aritmetica

DIMOSTRAZIONE:

Page 12: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Media aritmetica ponderata Quando i dati statistici si ripetono allora succede che  x1, x1, x1, x1 n1 volte x2, x2, x2, x2, x2, x2 n2 volte Valori Frequenze  x1 n1 x2 n2 x3 n3…… ……. xi ni

Indici di tendenza centrale: la media aritmetica ponderata

f

Xf

n

XfX

Page 13: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Esempio: Media aritmetica di voti di esami

 

Voti di esame: 18; 22: 22; 24; 24; 24; 25; 25; 25;25; 27; 27.

 

Potrei fare:

 Media aritmetica = (18+22+22+24+24+24+25+25+25+25+27+27) / 12 = 24

 

Però è più semplice e veloce fare:

 Media aritmetica ponderata = (18 + 222 +243+ 254+ 272) / 12 = 24

Indici di tendenza centrale: la media aritmetica ponderata

Page 14: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Media aritmetica ponderata per dati continui suddivisi in intervalli di classi.

Indici di tendenza centrale: la media aritmetica ponderata

Page 15: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

La media

• La media è una buona misura di tendenza di misura centrale per le distribuzioni “normalmente” distribuite

1 2 3 4 5 6 7 8 9

0

0,5

1

1,5

2

2,5

3

3,5

4

4,5

5

f

Voto

Casi

21,5X

Page 16: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

La mediaLa media è una misura inadatta per le distribuzioni che contengono un numero esiguo di valori estremi

Media = 88.72

Page 17: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

MEDIE DI POSIZIONE

MEDIANA

MODA

Page 18: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

La moda il valore x cui corrisponde la massima frequenza. Esistono distribuzioni di frequenza che, oltre alla moda principale, hanno una o più mode secondarie.

La moda per variabili intervallari

Page 19: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

La mediana per variabili intervallari discreti

Mediana: data una successione ordinata crescente (che va dal valore più piccolo a quello più grande) si chiama Mediana, o termine centrale, quel valore che è preceduto o seguito dallo stesso numero di dati. 

Determinazione della mediana per i valori discreti di x.

Numero dei valori DISPARI:

x1, x2, x3, x4, x5, x6, x7 Mdn = x4

Numero dei valori PARI:

per convenzione è definita mediana la semisomma dei due termini centrali.

x1, x2, x3, x4, x5, x6, x7,x8 Mdn= (x4+x5)/2

Page 20: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

La mediana per variabili intervallari discreti

Mediana: data una successione ordinata crescente (che va dal valore più piccolo a quello più grande) si chiama Mediana, o termine centrale, quel valore che è preceduto o seguito dallo stesso numero di dati.

 

Determinazione della mediana per i valori discreti di x.

x1, x2, x3, x4, x5, x6, x7 Mdn = x4

  Esempio:

Valori: 18, 21, 3, 7, 35.

Serie ordinata: 3, 7, 18, 21, 35.

Mediana: 18.

 

Questo è valido quando il numero dei termini è dispari per cui si può scrivere: 

N = 2n + 1 = n + 1 + n 

E quindi il termine mediano è n + 1.

Page 21: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Qualora il numero dei termini sia pari: 

N= n + n Per cui non esiste un termine mediano, ma per convenzione è definita mediana la semisomma dei due termini centrali.  Esempio. Valori: 23, 35, 11, 7Serie ordinata: 7, 11, 23, 35Mediana = (11+23) / 2 = 17

La mediana per variabili intervallari discreti

Page 22: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

La mediana per variabili intervallari continui (cenni)

X F Fc Lim.inf Lim.sup

A 1-3 6 6 0.5 3.5

B 4-6 6 12 3.5 6.5

C 7-9 8 20 6.5 9.5

D 10-12 7 27 9.5 12.5

E 13-15 3 30 12.5 15.5

N 30

Per calcolare indici di posizione con variabili intervallari continue si usa l’interpolazione lineare: le ferquenze che cadono in un intervallo si considerano “uniformemente distribuite” all’interno dell’intervallo. Ogni valore xi che cade all’interno dell’intervallo occupa uno spazio pari a 1/fi.

La mediana si trova in posizione 15 ossia in classe C (tra la 13ima e la 20ima posizione). La classe C è costituita da 8 elementi per cui l’ampiezza di ogni elemento è pari a 1/8 (1/fi) che è 0.375.La posizione 15 è la terza all’interno dell’intervallo (15-12) per cui: 0.375+0.375+0.375=1.125. Questo valore va sommato al limite inferiore della classe C:6.5 + 1.125 = 7.625 - Posizione 15 o MEDIANA

Page 23: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

La moda il valore x cui corrisponde la massima frequenza. Esistono distribuzioni di frequenza che, oltre alla moda principale, hanno una o più mode secondarie.

La moda per variabili intervallari

Page 24: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Confronto Media – Mediana – Moda

Page 25: SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere.

Confronto Media – Mediana – Moda

www.quadernodiepidemiologia.it