9 - Scostamenti medi e sqm - Scostamenti medi e sqm.pdf · Prof.ssa Paola Zuccolotto -Statistica...

39
Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità Scostamenti medi Gli scostamenti medi sono indici basati sulla differenza tra i valori della distribuzione e una media. Poichè le differenze tra i valori e una media sono positive e negative, tipicamente vengono considerate in valore assoluto o elevate al quadrato. Si possono calcolare solo se il carattere è quantitativo.

Transcript of 9 - Scostamenti medi e sqm - Scostamenti medi e sqm.pdf · Prof.ssa Paola Zuccolotto -Statistica...

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamenti medi

Gli scostamenti medi sono indici basati sulladifferenza tra i valori della distribuzione euna media.

Poichè le differenze tra i valori e una mediasono positive e negative, tipicamentevengono considerate in valore assoluto oelevate al quadrato.

Si possono calcolare solo se il carattere èquantitativo.

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamenti medi

Gli scostamenti medi differiscono a secondadel trattamento delle differenze e a secondadella media utilizzata. I più comuni sono

Tipo di media Mediana Media aritmetica

Trattamento differenze

valore assoluto scostamento medio assoluto dalla mediana

scostamento medio assoluto dalla media

elevamento al quadrato - scarto quadratico medio

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla mediana

∑ −= MexN

1S iMe

iiMe fMexS ⋅−= ∑

iiMe nMexN

1S ⋅−= ∑

semplice

ponderato

Scostamento medio dalla mediana

Ricordiamo la tabella relativa agli 11 vini«Dolcetto» presenti nel datasetAltroconsumo, descritti secondo trecaratteri.

Denominazione Analisi totTitolo alcolometrico

(% vol)

Zuccheri riduttori

(g/l)

Den Val_chim Grado Chim1

Dolcetto1 7 12.50 3.4

Dolcetto2 9 13.00 2.8

Dolcetto3 8 12.5 2.2

Dolcetto4 8 12.5 2.7

Dolcetto5 9 13 2.5

Dolcetto6 9 12.5 2.1

Dolcetto7 8 12.5 2.2

Dolcetto8 9 12 2.3

Dolcetto9 8 12 5.7

Dolcetto10 8 12.5 5.3

Dolcetto11 8 13.5 1.7

Scostamento medio dalla mediana

Nelle lezioni precedenti avevamo calcolatola mediana del carattere Grado, che erarisultata pari a Me=12.5

Denominazione Analisi totTitolo alcolometrico

(% vol)

Zuccheri riduttori

(g/l)

Den Val_chim Grado Chim1

Dolcetto1 7 12.50 3.4

Dolcetto2 9 13.00 2.8

Dolcetto3 8 12.5 2.2

Dolcetto4 8 12.5 2.7

Dolcetto5 9 13 2.5

Dolcetto6 9 12.5 2.1

Dolcetto7 8 12.5 2.2

Dolcetto8 9 12 2.3

Dolcetto9 8 12 5.7

Dolcetto10 8 12.5 5.3

Dolcetto11 8 13.5 1.7

Scostamento medio dalla mediana

Ora calcoliamo lo scostamento medio dallamediana per il carattere Grado.

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Denominazione Titolo alcolometrico

(% vol)

Den Grado Grado - Me |Grado - Me|

Dolcetto1 12.5 0 0

Dolcetto2 13 0.5 0.5

Dolcetto3 12.5 0 0

Dolcetto4 12.5 0 0

Dolcetto5 13 0.5 0.5

Dolcetto6 12.5 0 0

Dolcetto7 12.5 0 0

Dolcetto8 12 -0.5 0.5

Dolcetto9 12 -0.5 0.5

Dolcetto10 12.5 0 0

Dolcetto11 13.5 1 1

Scostamento medio dalla mediana

Ora calcoliamo lo scostamento medio dallamediana per il carattere Grado.

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Denominazione Titolo alcolometrico

(% vol)

Den Grado Grado - Me |Grado - Me|

Dolcetto1 12.5 0 0

Dolcetto2 13 0.5 0.5

Dolcetto3 12.5 0 0

Dolcetto4 12.5 0 0

Dolcetto5 13 0.5 0.5

Dolcetto6 12.5 0 0

Dolcetto7 12.5 0 0

Dolcetto8 12 -0.5 0.5

Dolcetto9 12 -0.5 0.5

Dolcetto10 12.5 0 0

Dolcetto11 13.5 1 1

Somma = 3

Denominazione Titolo alcolometrico

(% vol)

Den Grado Grado - Me |Grado - Me|

Dolcetto1 12.5 0 0

Dolcetto2 13 0.5 0.5

Dolcetto3 12.5 0 0

Dolcetto4 12.5 0 0

Dolcetto5 13 0.5 0.5

Dolcetto6 12.5 0 0

Dolcetto7 12.5 0 0

Dolcetto8 12 -0.5 0.5

Dolcetto9 12 -0.5 0.5

Dolcetto10 12.5 0 0

Dolcetto11 13.5 1 1

Somma = 3

Scostamento medio dalla mediana

Ora calcoliamo lo scostamento medio dallamediana per il carattere Grado.

2727.011

3Mex

N

1S iMe ==−= ∑

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla mediana

Se disponiamo della distribuzione difrequenze per un carattere quantitativoraggruppato in classi, lo scostamentomedio dalla mediana si calcola facendoriferimento alla formula ponderata.

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla mediana

Ricordiamo l’esempio della distribuzione delcarattere SO2 totale in mg/l (Chim5), per ilquale la mediana era risultata pari aMe=73.7358

Chim5 ni fi

20 |- 40 mg/l 15 0.053

40 |- 80 mg/l 150 0.530

80 |- 100 mg/l 76 0.269

100 |- 120 mg/l 32 0.113

120 |- 150 mg/l 10 0.035

Totale 283 1.000

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla mediana

Ricordiamo l’esempio della distribuzione delcarattere SO2 totale in mg/l (Chim5), per ilquale la mediana era risultata pari aMe=73.7358

Chim5 vc |vc - Me| |vc - Me|∙ni |vc - Me|∙fi ni fi

20 |- 40 mg/l 30 43.7358 656.0370 2.3182 15 0.053

40 |- 80 mg/l 60 13.7358 2060.3700 7.2805 150 0.530

80 |- 100 mg/l 90 16.2642 1236.0792 4.3678 76 0.269

100 |- 120 mg/l 100 26.2642 840.4544 2.9698 32 0.113

120 |- 150 mg/l 135 61.2642 612.6420 2.1648 10 0.035

Totale 5405.5826 19.1010 283 1.000

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla mediana

Ricordiamo l’esempio della distribuzione delcarattere SO2 totale in mg/l (Chim5), per ilquale la mediana era risultata pari aMe=73.7358

Chim5 vc |vc - Me| |vc - Me|∙ni |vc - Me|∙fi ni fi

20 |- 40 mg/l 30 43.7358 656.0370 2.3182 15 0.053

40 |- 80 mg/l 60 13.7358 2060.3700 7.2805 150 0.530

80 |- 100 mg/l 90 16.2642 1236.0792 4.3678 76 0.269

100 |- 120 mg/l 100 26.2642 840.4544 2.9698 32 0.113

120 |- 150 mg/l 135 61.2642 612.6420 2.1648 10 0.035

Totale 5405.5826 19.1010 283 1.000

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla mediana

Ricordiamo l’esempio della distribuzione delcarattere SO2 totale in mg/l (Chim5), per ilquale la mediana era risultata pari aMe=73.7358

Chim5 vc |vc - Me| |vc - Me|∙ni |vc - Me|∙fi ni fi

20 |- 40 mg/l 30 43.7358 656.0370 2.3182 15 0.053

40 |- 80 mg/l 60 13.7358 2060.3700 7.2805 150 0.530

80 |- 100 mg/l 90 16.2642 1236.0792 4.3678 76 0.269

100 |- 120 mg/l 100 26.2642 840.4544 2.9698 32 0.113

120 |- 150 mg/l 135 61.2642 612.6420 2.1648 10 0.035

Totale 5405.5826 19.1010 283 1.000

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla mediana

Chim5 vc |vc - Me| |vc - Me|∙ni |vc - Me|∙fi ni fi

20 |- 40 mg/l 30 43.7358 656.0370 2.3182 15 0.053

40 |- 80 mg/l 60 13.7358 2060.3700 7.2805 150 0.530

80 |- 100 mg/l 90 16.2642 1236.0792 4.3678 76 0.269

100 |- 120 mg/l 100 26.2642 840.4544 2.9698 32 0.113

120 |- 150 mg/l 135 61.2642 612.6420 2.1648 10 0.035

Totale 5405.5826 19.1010 283 1.000

1010.19fMexS iiMe =⋅−= ∑

1010.19283

5826.5405nMex

N

1S iiMe ==⋅−= ∑

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla media

Lo scostamento medio dalla media(aritmetica) si calcola in modo del tuttoanalogo.

L’unica differenza è che gli scarti vengonocalcolati dalla media aritmetica anzichèdalla mediana.

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla media

∑ −= MxN

1S iM

iiM fMxS ⋅−= ∑

iiM nMxN

1S ⋅−= ∑

semplice

ponderato

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla media

L’idea di base è molto chiara da un punto divista grafico. Ricordiamo l’esempio delledue aziende proprietarie di terreni.

Azienda 1

terreno 1 4terreno 2 3terreno 3 4.2terreno 4 2.8

Azienda 2

terreno 1 7terreno 2 6.5terreno 3 0.3terreno 4 0.2

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla media

media

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla media

media

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla media

Calcolare lo scostamento medio dallamedia equivale a fare la media dellelunghezze dei segmenti tratteggiati.

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla media

media=3.50.5

0.5

0.7

0.7

6.04

4.2Mx

N

1S iM ==−= ∑

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scostamento medio dalla media

media=3.5

3.53

3.23.3

25.34

13Mx

N

1S iM ==−= ∑

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scarto quadratico medio

Lo scarto quadratico medio (odeviazione standard) è sicuramente ilpiù noto ed utilizzato indice di variabilitàper caratteri quantitativi.

Il concetto su cui si basa è analogo alloscostamento medio dalla media, solo che lelunghezze dei segmenti tratteggiativengono elevate al quadrato.

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scarto quadratico medio o deviazione standard

( )∑ −=σ2

i MxN

1

( )∑ −=σ i

2

i fMx

( )∑ −=σ i

2

i nMxN

1

semplice

ponderato

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scarto quadratico medio o deviazione standard

media=3.50.25

0.25

0.49

0.49

( ) 6083.037.04

48.1Mx

N

1 2

i ===−=σ ∑

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scarto quadratico medio o deviazione standard

media=3.5

12.259

10.2410.89

( )

2550.3595.10

4

38.42Mx

N

1 2

i

==

=−=σ ∑

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scarto quadratico medio o deviazione standard

Calcoliamo lo scarto quadratico medio delladistribuzione dei prezzi dei 283 vini.

Prezzo ni fi

1 |− 3 € 37 0.131

3 |− 5 € 100 0.353

5 |− 7 € 62 0.219

7 |− 9 € 39 0.138

9 |− 11 € 15 0.053

11 |− 13 € 14 0.049

13 |− 15 € 12 0.042

15 |− 17 € 3 0.011

17 |− 19 € 1 0.004

Totale 283 1.000

Prezzo vc ni vc∙ni (vc-M)^2∙ni

1 |- 3 € 2 37 74 604.617

3 |- 5 € 4 100 400 417.140

5 |- 7 € 6 62 372 0.111

7 |- 9 € 8 39 312 149.456

9 |- 11 € 10 15 150 234.939

11 |- 13 € 12 14 168 496.902

13 |- 15 € 14 12 168 759.881

15 |- 17 € 16 3 48 297.461

17 |- 19 € 18 1 18 142.984

Totale 283 1710 3103.491

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scarto quadratico medio o deviazione standard

Prima di tutto calcoliamo la mediaaritmetica.

0424.6283

1710M ==

Prezzo vc ni vc∙ni (vc-M)^2∙ni

1 |- 3 € 2 37 74 604.617

3 |- 5 € 4 100 400 417.140

5 |- 7 € 6 62 372 0.111

7 |- 9 € 8 39 312 149.456

9 |- 11 € 10 15 150 234.939

11 |- 13 € 12 14 168 496.902

13 |- 15 € 14 12 168 759.881

15 |- 17 € 16 3 48 297.461

17 |- 19 € 18 1 18 142.984

Totale 283 1710 3103.491

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scarto quadratico medio o deviazione standard

Poi possiamo calcolare lo scarto quadraticomedio.

Prezzo vc ni vc∙ni (vc-M)^2∙ni

1 |- 3 € 2 37 74 604.617

3 |- 5 € 4 100 400 417.140

5 |- 7 € 6 62 372 0.111

7 |- 9 € 8 39 312 149.456

9 |- 11 € 10 15 150 234.939

11 |- 13 € 12 14 168 496.902

13 |- 15 € 14 12 168 759.881

15 |- 17 € 16 3 48 297.461

17 |- 19 € 18 1 18 142.984

Totale 283 1710 3103.491

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Scarto quadratico medio o deviazione standard

Poi possiamo calcolare lo scarto quadraticomedio.

( )

3116.39664.10

283

491.3103nMx

N

1i

2

i

==

=−=σ ∑

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Il dataset: caratteri relativi a giudizi sensoriali

Sat

co

l

Rif

l vio

l

Rif

l G

ran

Int

olf

Flo

r

Fru

tt

Sp

ez

Veg

et

Str

utt

Perc

sfe

rica

Acid

Am

aro

Astr

ing

Ric

c a

rom

Pers

ist

AT

TR

AE

NZ

A

FR

AN

CH

EZ

ZA

OL

FA

TT

IVA

QU

AL

ITA

’ O

LF

AT

TIV

A

AR

MO

NIA

GU

ST

AT

IVA

FR

AN

CH

EZ

ZA

RE

TR

OL

F

QU

AL

ITA

’ R

ET

RO

LF

GIU

DIZ

IO G

LO

BA

LE

V1 V2 V3 O1 O2 O3 O4 O5 G1 G2 G3 G4 G5 GO PAI ATT FO QO AG FRO QRO Val_fin

7 6 2 7 4 5.5 4 3 6.5 5.5 4 2.5 4.5 7 6.5 7.5 6.5 6.5 6.5 7 7 6.5

8 7 1.5 7 4.5 6 4 3 7 6.5 3 2 5 7 7 7.5 7 7 6.5 7 7 7

7 6 4 7 3.5 6 4 3 7 6.5 3 2 4 7 6.5 7 7 7 7 7 7 7

7 6.5 1 7 4.5 5 3 3 6 6.5 4 1.5 3.5 6 6 7 6.5 6.5 7 7 6.5 7

7 6.5 1.5 7 4 6.5 4 4 6.5 6 4 3 3.5 6 6.5 7 7 7 6.5 6 6 6

8 6.5 3 7.5 4 6 4.5 3 7 6 4 2.5 5 6.5 7 8 7 7 6.5 7 6.5 6.5

8 7 2 7 3 5 3 4 6 6 4 3 3 6 6 7 6 7 7 7 7 7

8 7 3 6 4 5 3 5 7 7 4 3 4 6 7 7 6 7 6 7 6 7

8 7 2 7 4 5 5 2 7 6 5 3 4 6 7 7 6 7 7 7 7 7

7 4 4 7 4 5 4 3 7 6 3 3 4 6 6 7 7 7 6 7 7 6

7 3.5 5 7 3.5 5.5 4.5 4 6 6 3 2.5 5 7 7 7 6 6.5 7 6.5 6.5 6.5

6 4.5 4 7 2 5 4 4 6.5 6 3 3 4 6.5 6 6.5 6 6 6 6 6 6

7.5 6 4 7 3.5 5.5 4.5 3 6.5 6 4 2 4.5 6.5 6.5 7 7 7 7 7 6.5 7

7 4 4 7 3 5 4 4 7 6 4 2 4 7 7 7 7 7 6 7 7 7

7 5 3 7 3 4 2 4 6 5 4 3 5 6 7 7 6 6 5 7 6 6

7 5 2 7 4 4 2 4 7 6 5 2 4 7 6 7 7 7 6 7 7 7

Giu

diz

i vis

ivi

Giu

diz

i o

lfatt

ivi

Giu

diz

i g

usta

tivi

Normalmente si chiede di esprimere un giudizio su una scala con un numero dispari di modalità (ad es. da 1 a 9)

� ��� � ���

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Profilo sensoriale medio

Nelle lezioni precedenti avevamo calcolatole medie dei giudizi sensoriali (leggeraforzatura)

Sat col Rifl viol Rifl Gran Int olf Flor Frutt Spez Veget Strutt Perc sferica Acid Amaro Astring

V1 V2 V3 O1 O2 O3 O4 O5 G1 G2 G3 G4 G51 8 8 2 7 3 3 6 5 7 5 2 1 4

2 6 6 4 9 6 4 5 5 8 8 1 1 1

3 8 7 3 9 6 3 5 4 6 7 1 1 4

4 7 5 5 8 6 4 5 5 5 6 3 3 1

5 9 5 4 7 3 3 4 2 7 5 1 3 3

6 8 6 2 7 4 2 3 3 6 5 4 1 2

7 6 5 4 9 3 2 6 3 7 6 4 1 1

8 7 9 2 8 2 4 2 3 6 8 3 4 1

9 5 8 3 8 4 4 5 6 7 6 4 2 2

10 7 9 1 9 2 5 5 3 5 6 3 1 3

11 9 5 3 6 5 2 3 2 5 5 3 2 3

12 7 6 5 7 4 4 2 2 5 6 3 3 3

13 6 5 4 9 6 2 2 4 9 6 1 2 1

media 7.15 6.46 3.23 7.92 4.15 3.23 4.08 3.62 6.38 6.08 2.54 1.92 2.23

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Profilo sensoriale medio

Quindi utilizzando le medie avevamotracciato un grafico radiale perrappresentare il profilo sensoriale mediodel vino

Sat col Rifl viol Rifl Gran Int olf Flor Frutt Spez Veget Strutt Perc sferica Acid Amaro Astring

media 7.15 6.46 3.23 7.92 4.15 3.23 4.08 3.62 6.38 6.08 2.54 1.92 2.23

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Profilo sensoriale medio

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Profilo sensoriale medio e sua variabilità

Anche in questo caso ha senso valutarenon solo la media dei giudizi, ma anche laloro variabilità. Ancora una volta,trattandosi di caratteri qualitativi ordinali,calcolare lo scarto quadratico medio è unaforzatura, ma spesso è ammessa.

Sat col Rifl viol Rifl Gran Int olf Flor Frutt Spez Veget Strutt Perc sferica Acid Amaro Astring

media 7.15 6.46 3.23 7.92 4.15 3.23 4.08 3.62 6.38 6.08 2.54 1.92 2.23

sqm 1.17 1.50 1.19 1.00 1.46 0.97 1.44 1.27 1.21 1.00 1.15 1.00 1.12

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Profilo sensoriale medio e sua variabilità

Spesso si usa rappresentare le oscillazioniattorno alla media calcolando gli indici

media - σ

media + σ

Sat col Rifl viol Rifl Gran Int olf Flor Frutt Spez Veget Strutt Perc sferica Acid Amaro Astring

media 7.15 6.46 3.23 7.92 4.15 3.23 4.08 3.62 6.38 6.08 2.54 1.92 2.23

sqm 1.17 1.50 1.19 1.00 1.46 0.97 1.44 1.27 1.21 1.00 1.15 1.00 1.12

media + sqm 8.32 7.96 4.42 8.92 5.61 4.20 5.52 4.89 7.60 7.07 3.69 2.92 3.35

media - sqm 5.99 4.96 2.04 6.93 2.69 2.26 2.64 2.34 5.17 5.08 1.39 0.93 1.11

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Profilo sensoriale medio e sua variabilità

Spesso si usa rappresentare le oscillazioniattorno alla media calcolando gli indici

media - σ

media + σ

Sat col Rifl viol Rifl Gran Int olf Flor Frutt Spez Veget Strutt Perc sferica Acid Amaro Astring

media 7.15 6.46 3.23 7.92 4.15 3.23 4.08 3.62 6.38 6.08 2.54 1.92 2.23

sqm 1.17 1.50 1.19 1.00 1.46 0.97 1.44 1.27 1.21 1.00 1.15 1.00 1.12

media + sqm 8.32 7.96 4.42 8.92 5.61 4.20 5.52 4.89 7.60 7.07 3.69 2.92 3.35

media - sqm 5.99 4.96 2.04 6.93 2.69 2.26 2.64 2.34 5.17 5.08 1.39 0.93 1.11

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Profilo sensoriale medio e sua variabilità

Il grafico radiale può essere rappresentatosovrapponendo due grafici:

quello relativo ai valori di media - σ

quello relativo ai valori di media + σ

La fascia compresa tra i due profili mostrala variabilità dei singoli giudizi.

Prof.ssa Paola Zuccolotto - Statistica - Indici di variabilità

Profilo sensoriale medio e sua variabilità