1/4 Capitolo 4 - Libero Communitydigilander.libero.it/rosarb/Descrittiva3.pdf · Il coefficiente di...
Transcript of 1/4 Capitolo 4 - Libero Communitydigilander.libero.it/rosarb/Descrittiva3.pdf · Il coefficiente di...
1/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
Capitolo 4Capitolo 4
La variabilità di una distribuzioneIntervalli di variabilitàBox-plotIndici basati sullo scostamento dalla mediaConfronti di variabilità Standardizzazione
2/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
La variabilitàLa variabilità
La variabilità di una distribuzione esprime la tendenza delle unità di un collettivo ad assumere diverse modalità della variabile
Un indice di variabilità deve soddisfare almeno due requisiti:
deve assumere il valore minimo se e solo se tutte le unità della distribuzione presentano uguale modalitàdella variabileDeve aumentare all’aumentare della “diversità” tra le modalità assunte dalle varie unità.
Osservazione
Osservazione
5/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
Intervalli di variabilitàIntervalli di variabilità
Il campo di variazioneDati n valori e ordinati in senso crescente,
si considera la differenza tra il più grande e il più piccolo valore:
nxxx ≤≤≤ L21
1xxR n −=
6/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
La differenza interquartilica
Dati n valori consideriamo la differenza tra il terzo e il primo quartile:
13 QQW −=
Oss: rappresenta il campo di variazione per il 50% delle unità più vicine alla mediana.
Intervalli di variabilitàIntervalli di variabilità
7/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
Box-plotBox-plot
Un modo per rappresentare graficamente la variabilità di una distribuzione è dato dal box-plot.
Il box-plot è un grafico caratterizzato da tre elementi:una linea o punto, che indicano la posizione
della media della distribuzione;Un rettangolo (box) la cui altezza indica la variabilità dei valori “prossimi” alla media;Due segmenti che partono dal rettangolo e i cui estremi sono determinati in base ai valori estremi della distribuzione.
Ad esempio, come media si può prendere la mediana, come altezza del box la distanza interquartile e come estremi dei segmenti il valore minimo e massimo osservati.
8/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
Max = 10Min = 1Q3=5Q1=3Valore mediano:Me=40
2
4
6
8
10
12125101222453083frequenza
10987654321N° atti aggressivi
Box-plot: esempioBox-plot: esempio
Esempio
RangeRange
interquartile
Medianahttp://www.istat.it/servizi/studenti/valoredati/Cap4/Cap4_5_2.htm
http://www.istat.it/servizi/studenti/valoredati/Cap4/Cap4_5_2.htm
11/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
La varianzaLa varianzaUn indice basato sugli scostamenti dalla media aritmetica è la varianza.
La varianza di valori di una variabile con media aritmetica è:
n nx,...,x,x 21 X x
( )∑=
−=n
ii xx
n 1
22 1σ
Il numeratore è detto devianza: ( )∑=
−n
ii xx
1
2
Calcolo semplificato della varianza
( )∑=
−=n
ii xx
n 1
222 1σ
( )∑=
−=n
ii xx
n 1
22 1σ
13/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
La deviazione standardLa deviazione standard
Osservazione: la varianza non possiede la stessa unità di misura dei valori della distribuzione (èespressa nel quadrato dell’unità di misura della variabile).Si può utilizzare quindi come indice di variabilità la deviazione standard o scarto quadratico medioche è espresso nella stessa unità di misura della variabile:
2σσ =
17/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
EsempioEsempio
Numero di imprese (migliaia) nel 1991 in cinque regioni italiane: 268, 106, 76, 238, 88
2155,x =
( )
766557
215551 5
1
22
,
,xi
i
=
=−= ∑=
σ
9880766557 ,, ==σ
http://www.istat.it/servizi/studenti/valoredati/Cap4/Cap4_5_2.htm
21/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
Altri indici di variabilitàAltri indici di variabilità
Lo scostamento semplice medio dalla media aritmetica:
Lo scostamento semplice medio dalla mediana:
∑=
−=n
iix xx
nS
1
1
∑=
−=n
ieiM Mx
nS
e1
1
100/3=33
23/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
Il coefficiente di variazioneIl coefficiente di variazione
Osservazione: la varianza e la deviazione standard sono indici che risentono dell’unità di misura e dell’ordine di grandezza dei dati. Pertanto il confronto della variabilità tra due distribuzioni risulta compromesso per:
Per confrontare la variabilità di due distribuzioni per la variabile con può essere utilizzato il coefficiente di variazione:
0>x
100x
CVσ
=
24/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
Un esempio di confronto della variabilitàUn esempio di confronto della variabilità
9 industrie con dispositivo anti-inquinante di tipo A e 9 di tipo B.
254022283023436235B
667786545452448069AQuantità di pulviscoloTipo
6764,xA =2234,xB =
6513,A =σ0212,B =σ
%CVA 21=%CVB 35=
Si può concludere che è la distribuzione B ad essere più variabile della distribuzione A.
http://www.istat.it/servizi/studenti/valoredati/Cap4/Cap4_5_2.htm
26/4
Statistica - Metodologie per le scienze economiche e sociali 2/edS. Borra, A. Di Ciaccio Copyright © 2008 – The McGraw-Hill Companies srl
La standardizzazioneLa standardizzazione
La standardizzazione è una particolare trasformazione lineare che applicata ai dati originali riconduce qualsiasi variabile con media e deviazione standard a una nuova variabile con media nulla e varianza unitaria.Ogni osservazione viene trasformata in un nuovo valore:
Xx σ
σxx
y ii
−=
ix
La distribuzione risultante ha media nulla e varianza unitaria.