ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA...

26
ELABORAZIONE DEI DATI QUESTA FASE SERVE AD ESPRIMERE IN MODO SINTETICO I RISULTATI DELL’INDAGINE SVOLTA CALCOLANDO DEGLI INDICI: VALORI MEDI INDICI DI VARIABILITA’

Transcript of ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA...

Page 1: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

ELABORAZIONE DEI DATI

� QUESTA FASE SERVE AD ESPRIMERE IN

MODO SINTETICO I RISULTATI

DELL’INDAGINE SVOLTA CALCOLANDO

DEGLI INDICI:

� VALORI MEDI

� INDICI DI VARIABILITA’

Page 2: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

I valori medi

Il valore medio è un valore che esprime una tendenza centrale

ed è un valore compreso tra il minimo e il massimo.

Medie di calcolo : sono quelle che si calcolano

tenendo conto di tutti i valori della distribuzione

� Media aritmetica e sue proprietà

o Media Geometrica

o Media quadratica

o Media armonica

Medie di posizione : sono quelle che si calcolano

tenendo conto solo di alcuni valori della distribuzione

o Mediana

o Moda o valore normale

Page 3: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

MEDIA ARITMETICA

Questa viene chiamata media ponderata ed èutilizzata quando i valori rilevati hanno frequenze o pesi diversi

Questa viene chiamata media semplice ed è utilizzata quando i valori rilevati non sono riportati con le frequenze

=

=⋅

=++

⋅+⋅+⋅=

n

1ii

n

1iii

n21

nn2211

p

px

p.....pp

px........pxpxM

N

x

N

x........xxM

n

1ii

n21∑==

++=

Page 4: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

PROPRIETA’ DELLA MEDIA

ARITMETICA

Si definisce scarto della media aritmetica

la differenza tra il valore osservato e la media stessa xi – M

Si può dimostrare (vedi pag. 32 del libro di testo) che ∑ ( xi – M ) = 0

cioè che la somma degli scarti dalla media aritmetica è uguale a zero.

n

x........xxM n21 ++

= n21 x........xxMn ++=⋅

n21volten

x........xxM..........MM ++=+++��� ���� ��

La media aritmetica semplice rappresenta quel valore che, sostituito a ciascuno dei dati, non ne altera la somma. Infatti

da cui si ricava

cioè

SCARTO

Page 5: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

MEDIA GEOMETRICA

nn21g x.........xxM ⋅⋅=

p pn

p2

p1g

n21 x.........xxM ⋅⋅=

Se i valori sono tutti positivi e non nulli si può calcolare la media geometrica.Si definisce media geometrica dei valori x1, x2, …, xn,

quel numero Mg che sostituito ai valori xi lascia invariato il loro prodotto:

che è la media geometrica semplice.Nel caso di valori xi con frequenze o pesi pi, si ha:

Page 6: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

USO DELLA MEDIA GEOMETRICA

� La media geometrica viene utilizzata quando si vuole

analizzare il variare di un fenomeno nel tempo , per

esempio il tasso di variazione dei prezzi o i tassi di

rendimento di capitali.

� ESEMPIO

Un capitale è stato impiegato per 4 anni al tasso del 2%,

per altri 3 anni al tasso del 3 % ed in fine per 2 anni al

tasso del 5%.

Per il calcolo del tasso medio si può impiegare la Media

Geometrica Ponderata:

9 234 05,003,002,0 ⋅⋅=i

Page 7: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

MEDIA QUADRATICA

n

x......xxM

2n

22

21

2+++

=

n21

n2

n22

212

12

p........pp

px....pxpxM

+++⋅⋅+⋅+⋅

=

Media quadratica semplice

Media quadratica ponderata, dove i pi sono i pesi

La media quadratica è quella con valore maggiorecon valore maggiorerispetto alle altre medie e viene usata per mettere in evidenza i valori che si scostano molto dai valori centrali

Page 8: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

MEDIA ARMONICA

∑=

=+++

=n

1i in21

a

x

1

n

x

1...

x

1

x

1

nM

n

n

2

2

1

1a

x

p...

x

p

x

p

NM

+++=

Media armonica semplice

Media armonica ponderata dove, come al solito, i pi sono i pesi

Page 9: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

QUANDO USARE LA MEDIA ARMONICA

Questa media è utilizzata quando ha significato il calcolo

del reciproco di una certa grandezza.

Si definisce potere di acquisto di una moneta la quantità

di beni acquistabile con una unità di tale moneta. Se,

per esempio un prodotto costa 0,85 euro il potere di

acquisto riferito a tale bene è: 1/0,85.

Ora supponiamo che uno stesso prodotto in 4 città

differenti abbia i seguenti prezzi:

Milano 0,85 euro Torino 0,90 Roma 0,75 Bari 0,70

70,0

1

75,0

1

90,0

1

85,0

14

+++

Potere acquisto medio =

Page 10: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

MEDIANA

Dati un insieme di valori x1, x2, x3,…. xn ordinati si definisce Mediana il valore che bipartisce la successione, dopo che i termini sono stati posti in ordine crescente. Ovvero :

� il valore centrale, se il numero dei termini è dispari

� la media aritmetica dei due valori centrali, se il numero dei termini èpari.

Esempio:

Calcolare la Mediana dei seguenti valori:

Il valore 9 è quello che sta in centro ed è pertanto la mediana

Esempio:

Calcolare la Mediana dei seguenti valori:

5512109874

464441383633228

La mediana è la media aritmetica dei due valori centrali (36+38)/2 = 37

Page 11: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

MEDIANASe si ha invece una distribuzione di frequenze, occorre calcolare le

frequenze cumulate.

Indicando con N la somma delle frequenze, la Mediana è il valore corrispondente ….

� a N/2 se N è pari

� a (N+1)/2 se N è dispari

Tot 25Tot 25

2516

2415

2314

2243

1872

1181

330

Frequenze

cumulate

Frequenze

assolute

N.Figli

N =25 quindi la mediana è il valore corrispondente a

(N+1)/2 = (25+1)/2 = 13

cioè il valore 2

Indagine sul numero di figli su un campione di famiglie

Page 12: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

MEDIANA

�� Se i dati sono raggruppati in classi si determina la Se i dati sono raggruppati in classi si determina la classe medianamediante le frequenze cumulate; quindi si procede con unmediante le frequenze cumulate; quindi si procede con un’’interpolazione interpolazione lineare mediante una proporzione. (vedere il libro di testo pag.lineare mediante una proporzione. (vedere il libro di testo pag. 4444--45)45)

2500Tot

2500

25001002500-3000

24002002000-2500

22003051600-2000

18959551200-1600

940840800-1200

1001000-800

F. cum.F.ass.Classi

cilindrata(cc)

Esempio: è stata condotta una ricerca sulla cilindrata delle auto possedute da un campione di persone (2500):

Poiché N è pari N/2 =1250 che corrisponde alla Classe Mediana 1200-1600

Per giungere ad un valore preciso della Mediana si deve impostare una proporzione:

1200 940

x 1250

1600 1895 cioè

(x-1200) : (1600-1200) =

(1250-940) : (1895 -940)

Da cui x=……..

Page 13: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

MODA

� Si dice Moda o Valore Modale di una distribuzione di frequenze il valore corrispondente alla massima frequenza

Esempio

110

19

28

47

56

75

14

23

F.ass.Voti

matematicaLa Moda è il valore 5 poiché èil valore corrispondente alla frequenza più alta

Page 14: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

MODA

� Se i valori sono raggruppati in classi si determina

la Classe Modale:

� Se l’ampiezza delle classi è costante si dirà classe

modale quella con frequenza maggiore;

� Se l’ampiezza delle classi non è costante si divide

ogni frequenza per l’ampiezza della rispettiva

classe calcolando così la densità di frequenza; il il

valore pivalore piùù alto di densitalto di densitàà definisce la classe definisce la classe

modalemodale

N.B. esistono delle distribuzione di frequenza che presentano piùvalori della moda( distribuzioni plurimodali)

Page 15: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

COME SI SCEGLIE UNA MEDIA ?

Si possono solo fare considerazioni a carattere generale:

� La media aritmetica è più utilizzata per esprimere un concetto di equidistribuzione

� La media geometrica è utilizzata quando i dati si susseguono in progressione geometrica

� La media quadratica quando si vuole eliminare l’influenza dei segni e quando si vuole dare importanza a valori piuttosto grandi

� La moda si usa quando è importante rilevare il valore che ha maggior probabilità di presentarsi

� La mediana è caratterizzata dal fatto di non essere influenzata dalla rilevante differenza tra i dati

Page 16: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

RELAZIONI TRA LE MEDIE

Con riferimento ad una medesima distribuzione, si trova

che tra le medie appena introdotte intercorre la

seguente relazione:

2ga MMMM <<<

Le dimostrazioni si trovano a pagina 46 del libro di testo

Page 17: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

LA VARIABILITA’

� I valori medi sono indici importanti per la descrizione sintetica di un fenomeno statistico, però non forniscono informazioni sulla dispersione dei dati cioè sulla loro variabilità

� Esempio

� Due gruppi di studenti hanno sostenuto una prova di matematica con i seguenti risultati:

676652° Gruppo

1085431°Gruppo

La media dei voti per entrambi i gruppi vale 6, ma èevidente che i dati del 1° gruppo sono molto più dispersi

Page 18: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

INDICI DI VARIABILITA’

�Campo di variazione

�Scarto quadratico medio

�Varianza

�Coefficiente di variazione

�Scostamento semplice medio

Per stimare la variabilità si ricorre ad alcuni indici:

Page 19: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

CAMPO DI VARIAZIONE( RANGE)

E’ il più semplice degli indici di variazione e si

calcola facendo la differenza tra il dato più

grande e il dato più piccolo

Campo variazione R = x max – x min

Il range è molto semplice da calcolare però è poco significativo poichétiene conto solo del valore più piccolo e di quello più grande trascurando tutti gli altri valori. Può essere utile ad es. in campo meteorologico quando viene indicata l’escursione termica

Il campo di variazione dà informazioni sulla distribuzione dei dati: più R è piccolo più i dati sono concentrati; più R è grande più i dati sono dispersi

Page 20: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

SCARTO QUADRATICO MEDIO E

VARIANZASono gli indici di variabilità più utilizzati, e tengono conto della

distribuzione di tutti i dati.

( ) ( ) ( )( )

n

Mx

n

Mx.........MxMx

n

1i

2i2

n2

22

1 ∑

== =−

−++−+−σ

Scarto quadratico medio (o deviazione standard)Scarto quadratico medio (o deviazione standard)

Rappresenta la media quadratica degli scarti dei dati dalla media aritmetica M

=

=⋅−

=σn

1ii

n

1ii

2i

p

p)Mx(

semplice

ponderata

Page 21: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

VarianzaE’ definita come il quadrato dello scarto quadratico

medio e viene indicata con σ2

2n

1ii

n

1ii

2i

2

2

n

1i

2i

2

M

p

px

Mn

x

−=σ

=

=

=

Per il calcolo della varianza e dello scarto quadratico medio si preferisce adottare la seguente formula facilmente dimostrabile (pag. 60) :

Se la distribuzione èponderata

Se i dati sono senza frequenze

Questa formula importantissima ci dice che la varianza si ottiene facendo la media dei quadrati – il quadrato della media.L’uso di questa formula ci permette di evitare il c alcolo degli scarti e dei loro quadrati

Page 22: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

OSSERVAZIONI

Lo scarto quadratico medio σ� è nullo in caso di variabilità nulla;

� è positivo in qualsiasi altro caso

� è tanto più grande quanto maggiore è il grado di

variabilità, cioè più i dati sono “dispersi”

� è tanto più piccolo quanto minore è il grado di

variabilità, cioè più i dati sono “concentrati”

Lo stesso dicasi per la varianza σ2 .

Page 23: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

Esempio:

411

28

14

32

frequenzavalore

2

n

1ii

n

1i

2i

2 M

p

px

=

710

411281432M =⋅+⋅+⋅+⋅=

15710

411281432 22222

=−⋅+⋅+⋅+⋅=

Calcolare varianza e scarto quadratico medio

87,315 ==σ

Media dei quadrati Quadrato della media

Page 24: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

IL COEFFICIENTE DI VARIAZIONE

CV

� Il CV è una misura relativa di dispersione (le precedenti sono misure assolute) ed è una grandezza adimensionale.

�E’ particolarmente utile quando si devono confrontare le distribuzioni di due gruppi con medie molto diverse o con dati espressi in scale differenti (es. confronto tra variazione del peso e variazione dell’altezza).

%

⋅⋅⋅⋅==== 100M

CVσσσσ

Page 25: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

SCOSTAMENTO SEMPLICE MEDIO

Un altro modo per calcolare la variabilità dei dati (tenendo conto di tutti i dati) consiste nel calcolare la distanza di tutti i dati dalla media e fare la media aritmetica di tali distanze

=

=

=

⋅−

=

=

n

1ii

n

1iii

M

n

1ii

M

p

pMx

S

n

Mx

S

In alcuni casi in tali formule è possibile sostituire alla Media aritmetica M la Mediana Me

Scostamento semplice medio = Distanza media dei dati dalla media

Se i dati sono senza frequenze

Se i dati sono “pesati”

Page 26: ELABORAZIONE DEI DATI - liceomeda.it moda mediana.pdf · o Mediana o Moda o valore normale. MEDIA ARITMETICA Questa viene chiamata ... In alcuni casi in tali formule è possibile

� Lo scostamento semplice medio dalla media dàinformazioni sulla distribuzione dei dati:

� più SM è piccolo più i dati sono concentrati;

� più SM è grande più i dati sono dispersi