Statistica sociale

59
Statistica Sociale Giorgio Garau Valutazione e implementazione strategica di politiche

description

Slide del corso di statistica sociale del Prof. Giorgio Garau, per la laurea in Assistente sociale. Indici di posizione, variabilità e mutua variabilità: concentrazione ed eterogeneità. Il ruolo della statistica nell'informazione a cura di Lucia Schirru

Transcript of Statistica sociale

Page 1: Statistica sociale

Statistica Sociale

Giorgio Garau

Valutazione e implementazione strategica di politiche

Page 2: Statistica sociale

2

Programma

Presentazione del corso di statistica sociale

Il ruolo della statistica nell’informazione

Indici di posizione e misure di variabilità (ripasso)

Indicatori di mutua variabilità

• concentrazione

• eterogeneità

Comunicazione efficace

Statistica sociale

Page 3: Statistica sociale

3

Suddivisione in settimane di corso

Statistica sociale

Programma date lezioni

Presentazione del corso di statistica sociale

mercoledì 8 ottobre

Indici di posizione e misure di variabilità giovedì 9 ottobre

Concentrazione mercoledì 15 e giovedì 16 ottobre

Eterogeneità mercoledì 22 ottobre

Esercitazione in aula giovedì 23 ottobre

Il ruolo della statistica nell’informazione mercoledì 29 e giovedì 30 ottobre

Page 4: Statistica sociale

Statistica Sociale

Lucia Schirru

Valutazione e implementazione strategica di politiche

@luciaschirru

Page 5: Statistica sociale

5

Alcuni esempi di utilizzo della statistica:

Nel lavoro quotidiano dell’assistente sociale

Il Data journalism (mappe e grafici interattivi)

La comunicazione sul web: blog e social media

Il ruolo della statistica nell’informazione

Statistica sociale

Page 6: Statistica sociale

6

L’Assistente sociale

Statistica sociale

Attività lavorativa quotidiana:elaborazione dati per predisporre report, tabelle di sintesi dei servizi offerti, somme spese per destinazione d’uso, conoscenza delle caratteristiche della popolazione e così via

Relazione con le parti sociali e con i mezzi di comunicazione:leggere e interpretare i bisogni della comunità in cui opera e cogliere le possibilità offerte dalle politiche locali, regionali e nazionali.

Page 7: Statistica sociale

7

Informazione sulla stampa

Statistica sociale

Page 8: Statistica sociale

8

Informazione sui quotidiani cartacei

Statistica sociale

Page 9: Statistica sociale

9

Le infografiche e mappe navigabili

Statistica sociale

Page 10: Statistica sociale

10

Le inchieste

Statistica sociale

Page 11: Statistica sociale

11

Le inchieste

Statistica sociale

Page 12: Statistica sociale

12

Le inchieste

Statistica sociale

Page 13: Statistica sociale

13

Per poter comunicare correttamente

bisogna avere delle basi di statistica

Statistica sociale

alcune nozioni di partenza

Page 14: Statistica sociale

14

• Media

• Moda

• Mediana

• Varianza e scarto quadratico semplice

Indici di posizione e misure di variabilità

Statistica sociale

Page 15: Statistica sociale

Gli indici di posizione

La rappresentazione grafica dei fenomeni non è sufficiente, una buona analisi dei dati richiede anche che le caratteristiche principali delle osservazioni siano sintetizzate con opportune misure e che tali misure siano adeguatamente analizzate e interpretate.

Gli indici di posizione sintetizzano la posizione di una distribuzione di frequenza mediante un valore reale rappresentativo della globalità del fenomeno e tale da riassumere gli aspetti ritenuti più importanti.

Esaminano le misure di posizione: MEDIA

MODA

MEDIANA

15Statistica sociale

Page 16: Statistica sociale

La media

Nella media aritmetica la relazione è la somma:

Si dice che M è la media di n dati (xi, … xn,), se il risultato della funzione che delinea il tipo di

media, assume lo stesso valore quando al posto di xi, … xn, si pone M. La media è quella

quantità che, sostituita a ciascuna modalità del carattere, lascia inalterata una proprietà.

16Statistica sociale

Page 17: Statistica sociale

La media aritmetica

La media aritmetica si calcola facendo la somma delle modalità e dividendo il totale per in numero di modalità.

Se però le modalità si ripetono più volte si utilizza la media aritmetica ponderata, che si calcola moltiplicando le modalità per le rispettive frequenze e dividendo il valore ottenuto per il totale delle frequenze.

n

nxM

ii

n

xMMnx i

n

ii

cui da ;1

ii fxM

Utilizzando le frequenze assolute

Utilizzando le frequenze relative

n

1i

e iii ffn

nperché la somma delle frequenze relative è uguale ad 1.

17Statistica sociale

Page 18: Statistica sociale

EsempioLa tabella seguente riporta i tempi (in minuti) registrati da 20 operai per la riparazione di una componente meccanica. Calcolare la media aritmetica:

xi ni

2 3

3 3

4 5

5 4

6 3

8 2

tot 20

Se si usano le frequenze assolute:

Se si usano le frequenze relative … occorre prima calcolarle:

xi ni fi

2 3 0.153 3 0.154 5 0.255 4 0.26 3 0.158 2 0.1

N=20

1

N

nf ii

45,420

89

)234543(

)28()36()45()54()33()32(

i

ii

n

nxM

45,48,09,01145,03,0

)10,08()15,06()20,05()25,04()15,03()15,02(

ii fxM

18Statistica sociale

Page 19: Statistica sociale

Media per valori raggruppati in classi.

(xi + xi+1] ni

[0 – 2] 40

(2 – 3] 80

(3 – 5] 60

(5 – 7] 20

La distribuzione presenta il tempo di attesa di un operaio (in minuti), presso la fermata Y della metropolitana, in 200 giornate lavorative.

Calcolare il tempo medio di attesa.

In questo caso, in cui la distribuzione di frequenze ha le modalità ripartite in classi, la prima operazione da fare è calcolare il valore centrale (o valore medio) delle singole classi.

(xi + xi+1]

ni xc

[0 – 2] 40 1

(2 – 3] 80 2,5

(3 – 5] 60 4

(5 – 7] 20 6

Una volta calcolati i valori centrali (indicati con xc) si procede al calcolo della media aritmetica ponderata, così come presentato nella precedente slide.

3200

600

)20608040(

)206()604()805,2()401(

i

ii

n

nxM

19Statistica sociale

Page 20: Statistica sociale

Alcune proprietà della media

La media è un operatore lineare per il quale valgono le seguenti proprietà:

PROPRIETA’ DIMOSTRAZIONI

20Statistica sociale

Page 21: Statistica sociale

La moda Il valore modale, o moda:

La classe modale:

Si calcola per i caratteri qualitativi o quantitativi discreti e corrisponde alla modalità a cui è associata la massima frequenza.

Si calcola per i caratteri raggruppati in classi (siano quantitativi discreti o continui).

Se le classi hanno la stessa ampiezza, si individua la classe modale in corrispondenza della massima frequenza.

Se le classi hanno la ampiezze diverse, si assume come classe modale quella con la massima densità di frequenza.

La moda corrisponde a 4

21Statistica sociale

Page 22: Statistica sociale

La mediana

In una sequenza di dati ordinati dal più piccolo al più grande la mediana, o valore mediano, occupa la posizione intermedia, nel senso che è quel valore che bipartisce in parti uguali la totalità delle frequenze.

Nel caso di dati quantitativi discreti:

Se n (totale delle osservazioni) è dispari, la mediana corrisponde all’osservazione di rango (o posizione

2

)1( n

Me

Se n (totale delle osservazioni) è pari, sia n=2h, allora la mediana è, per convenzione, uguale alla media aritmetica dei due termini in posizione centrale:

2 quindi 1

21 ;

21

hh xxMe

nh

nh

Nel caso di dati raggruppati in classi

Si individua la classe mediana, quella cui corrisponde il 50% delle frequenze, e poi si ottiene il valore mediano, interpolando all’interno della classe mediana (si ipotizza che, all’interno delle classi, vi sia ripartizione uniforme delle frequenze).

22Statistica sociale

Page 23: Statistica sociale

Esempio

Partendo dalla seguente distribuzione per classi di età, fornire una adeguata rappresentazione grafica e calcolare la classe mediana, la classe modale e la media aritmetica:

Trattandosi di dati quantitativi raggruppati in classi l’adeguata rappresentazione grafica è l’Istogramma, che si può costruire se si hanno a disposizione le densità di frequenza e le ampiezze di classe, riportati nella seguente tabella.

Con queste informazioni si può ora costruire l’istogramma.

relativa frequenza di densità

assoluta. frequenza di densità

i

ii

i

ii

a

fh

a

nd

23Statistica sociale

Page 24: Statistica sociale

La media, per dati raggruppati in classi, si calcola utilizzando come xi i valori centrali delle classi, xc:

N.B. Da adesso in poi si utilizzeranno, indifferentemente, i simboli M, ẋ e μ per indicare la media. Il simbolo μ si utilizza solitamente per indicare il valore medio della popolazione, e il simbolo ẋ per indicare il valore medio di dati campionari.

24Statistica sociale

Page 25: Statistica sociale

Calcolo della mediana mediante interpolazione.

Per le variabili continue, il raggruppamento in classi delle modalità consente di determinare solo la classe mediana nella quale ricade l’unità statistica che bipartisce la distribuzione ordinata delle modalità.

Un singolo indice sintetico può essere ottenuto approssimando la funzione di ripartizione attorno alla mediana.

mediana. classe della cumulata frequenza la e inferiore valoreil invece, indicano 1 e 1

mediana; classe della cumulata frequenza la e superiore valoreil mente,rispettiva indicano e

MeMe

MeMe

Fx

Fx

25Statistica sociale

Page 26: Statistica sociale

Per concludere l’esercizio precedente calcoliamo il valore mediano della distribuzione per classi di età.

26Statistica sociale

Page 27: Statistica sociale

Le misure di variabilità

Una caratteristica importante di una distribuzione statistica è la sua variabilità. La variabilità è, infatti, la quantità di dispersione presente nei dati. Come gli indici di posizione, anche gli indici di dispersione o variabilità servono per descrivere sinteticamente (o caratterizzare) le distribuzioni statistiche quantitative (per le variabili qualitative si usano gli indici di diversità).

o ancora, come mostra questa figura, possono avere lo stesso valore centrale, ma avere una diversa variabilità

Dati due insiemi di dati, questi possono differire sia nella posizione del valore centrale (media) che nella variabilità; oppure, come mostrato in figura, possono essere caratterizzati dalla stessa variabilità, ma da diverso valore centrale;

27Statistica sociale

Page 28: Statistica sociale

Il range o campo di variazione

Il range è la differenza tra l’osservazione più grande e quella più piccola in un insieme di dati. E’ importante sottolineare che il range deve assumere sempre valori maggiori di zero. Quindi dobbiamo considerare il valore assoluto.

Sebbene il range sia una misura della dispersione totale, non tiene conto di come le osservazioni si distribuiscano o si concentrino intorno a una misura di tendenza centrale, come ad esempio la media. Presentiamo perciò altre misure di variabilità più appropriate.

28Statistica sociale

Page 29: Statistica sociale

La varianza e lo scarto quadratico medio.

Si considerino perciò due misure della variabilità, la varianza (σ2) e lo scarto quadratico medio (σ, radice quadrata della varianza), che sintetizzano la dispersione dei valori osservati attorno alla loro media

Una difficoltà nella interpretazione della varianza deriva dal fatto che essa è espressa nell’unità di misura del fenomeno elevato al quadrato.

Per questo motivo si usa lo scarto quadratico medio, o deviazione standard che è così definito

Calcolato utilizzando le frequenze assolute

Nel caso in cui le modalità si ripetano più volte (media ponderata)

Calcolato utilizzando le frequenze relative

29Statistica sociale

Page 30: Statistica sociale

EsempioSi confrontino le due distribuzioni di voti conseguiti dagli studenti A e B. Cosa si può dedurre?

Se si confrontano queste distribuzioni per il valore assunto dalla media, si noterà che entrambe assumono come valore medio 3.5; si dovrebbe quindi concludere che le distribuzioni sono identiche.

La rappresentazione grafica, fornita in figura, indica però, che la distribuzione B è più dispersadella distribuzione A, ma non fornisce una misura della distanza tra le due dispersioni. Tale misura è fornita dagli indicatori di variabilità.

VOTI

Range A = |1-6| =5Range B = |1-6| =5

Anche il Range delle due distribuzioni coincide, per cui è necessario calcolare la varianza e lo scarto quadratico medio per verificare l’effettiva differenza tra le due distribuzioni.

30Statistica sociale

Page 31: Statistica sociale

Calcolo della varianza e dello scarto quadratico medio

Per comodità si riportano tutti i dati in tabella

Sommando i quadrati degli scarti dalla media (pesati per le rispettive frequenze) si ottiene il valore della varianza.

Per la distribuzione A corrisponde a 0.8502 Per la distribuzione B corrisponde a 2.25.

Il valore dello scarto quadratico medio è pari a: 0.9221 per la distribuzione A mentre per la distribuzione B è pari a 1.5.Questo significa che, come già si intuiva graficamente, nella Classe B i voti sono maggiormente dispersi intorno alla media.

31Statistica sociale

Page 32: Statistica sociale

Il coefficiente di variazione

La varianza e lo scarto quadratico medio sono indici assoluti per cui è opportuno introdurre indici relativi o normalizzati.

Un indice relativo molto usato, purché la media sia maggiore di zero (M > 0), è il rapporto tra lo scarto quadratico medio σ e la media aritmetica M. Si tratta del coefficiente di variazione CV.

32Statistica sociale

Page 33: Statistica sociale

33

Variabili quantitative: indice di concentrazione

Variabili qualitative: indice di eterogeneità

Gli indici di mutua variabilità

Statistica sociale

Page 34: Statistica sociale

34

Concentrazione

Statistica sociale

Page 35: Statistica sociale

Concentrazione

Statistica sociale

Page 36: Statistica sociale

36

Concentrazione

Statistica sociale

Page 37: Statistica sociale

37

Concentrazione

Statistica sociale

Page 38: Statistica sociale

Gli indici di concentrazione

La concentrazione è una misura della mutua variabilità, cioè della variabilità tra ogni possibile modalità di una variabile e tutte le altre.

L’analisi di concentrazione si può applicare alle variabili quantitative (es. reddito e popolazione) perché queste variabili sono “trasferibili” da un possessore ad un altro (es. persona, nazione)

il totale posseduto da n unità statistiche.

n

iiyT

1Si indica con

La concentrazione studia il modo in cui l’ammontare totale T si distribuisce fra le n classi.

Si possono considerare due situazioni estreme

- concentrazione minima (equidistribuzione): le n unità statistiche possiedono uguale quantità della variabile.

-concentrazione massima: una unità possiede il totale e le altre n−1 possiedono un ammontare nullo della variabile.

yn

y

n

Ty

n

i

i

i

1

)1 ... ,1( 0

niy

Ty

i

n

38Statistica sociale

Page 39: Statistica sociale

La rappresentazione grafica: Lorenz e Gini

Si consideri una distribuzione unitaria i cui termini sono non negativi e disposti in ordine crescente:

Prendendo le prime unità (i), che saranno le più povere e confrontando ciò che esse possiedono con ciò che ad esse spetterebbe in una situazione di equidistribuzione, in cui ai = μ (ogni unità possiede esattamente il valore medio)

totaliunità

unità delle numeroiP

Se si divide per l’ammontare complessivo del carattere, An

si ottiene

Dove:

Qi = % del carattere posseduto dalle prime i unità.

Vale la relazione: Che può essere così trasformata:

Qi è tanto più vicino a Pi quanto più si è prossimi alla situazione di equidistribuzione

iaa

aaiaa

iii

n

...A e ...A

......0

*1

21

*1 ......A nnin Anaaa

n

i

n

i

A

AP

A

A

ni

ini

i *

Q

generale mediai ad sino median

A

i

A ni

39Statistica sociale

Page 40: Statistica sociale

Esempio 1: Costruzione di una Spezzata di Lorenz per distribuzioni unitarie.

Sulla bisettrice si trovano i punti tali che pi = qi.

-L’area tra la bisettrice e la spezzata di Lorenz è la curva di concentrazione.

-Interpretazione dell’area: più è grande, maggiore è la concentrazione.

- Nelle 3 province più piccole, ad esempio, risiede il 17.4% contro il 60% (equidistribuzione).

Riportando in un grafico i valori di Pi e Qi si ottiene la spezzata di Lorenz.

La tabella riporta la Popolazione del Lazio suddivisa per provincia di residenza (1990)

40Statistica sociale

Page 41: Statistica sociale

41

Concentrazione: esercizio

0,174

Concentrazione della popolazione tra le 5 province del Lazio

Statistica sociale

Page 42: Statistica sociale

Esempio 2: Costruzione della spezzata di Lorenz per distribuzioni in classi

Si consideri ora il caso in cui il carattere (trasferibile) sia ripartito in classi:è cioè noto l’ammontare xi del carattere

posseduto congiuntamente dalle ni unità che

appartengono alla classe i.

Le aziende della prima classe (cioè il 15.8% delle aziende totali) contribuiscono solo al 1.58% del fatturato totale.

42Statistica sociale

Page 43: Statistica sociale

L’indice di concentrazione per distribuzioni unitarieOltre alla rappresentazione grafica è necessario utilizzare un indicatore per costruire della concentrazione e in questo caso pare naturale una misura dell’area compresa tra la retta di equidistribuzione e la spezzata di Lorenz.

Effettuando i vari passaggi si ottiene la seguente formula:

Utilizzando i dati dell’Esempio 1 si costruisce l’indice di concentrazione della popolazione del Lazio.

Questo valore indica un grado di concentrazione molto elevato, pari al 72% della concentrazione massima.

Nel caso di distribuzioni unitarie l’area può essere scomposta nella somma di n trapezi, in particolare l’i−esimo trapezio ha basi pari a Pi−1 − Qi−1 e Pi − Qi e altezza costante pari a 1/n.

2

11))()((: Area

basi due delle somma

11

altezza

iiiii nQPQPS

)(1

21

1

i

n

i

i QPn

g

43Statistica sociale

Page 44: Statistica sociale

44

Concentrazione: esercizio

A partire dai dati della popolazione e dei redditi dichiarati per comune nel 2013, si confronti la distribuzione delle 8 province sarde e si valuti il livello di concentrazione delle due variabili.

I dati della popolazione sono stati estratti dall’archivio Istat (http://demo.istat.it/)

I dati sui redditi dichiarati invece sono stati presi dal sito del Ministero delle Finanze (http://www1.finanze.gov.it/pagina_dichiarazioni/dichiarazioni.html)

Statistica sociale

Page 45: Statistica sociale

45

Concentrazione: esercizio

Statistica sociale

Carbonia Iglesias ai Ai Pi Qi Pi-Qi1 Piscinas 880 880 0,04348 0,00688 0,03660

2 Villaperuccio 1.100 1980 0,08696 0,01547 0,07148

3 Tratalias 1.105 3085 0,13043 0,02411 0,10633

4 Buggerru 1.108 4193 0,17391 0,03277 0,14114

5 Masainas 1.342 5535 0,21739 0,04326 0,17413

6 Perdaxius 1.475 7010 0,26087 0,05478 0,20609

7 Musei 1.541 8551 0,30435 0,06683 0,23752

8 Nuxis 1.614 10165 0,34783 0,07944 0,26839

9 Giba 2.097 12262 0,39130 0,09583 0,29548

10 Sant'Anna Arresi 2.703 14965 0,43478 0,11695 0,31783

11 Calasetta 2.810 17775 0,47826 0,13891 0,33935

12 Fluminimaggiore 2.957 20732 0,52174 0,16202 0,35972

13 Narcao 3.321 24053 0,56522 0,18798 0,37724

14 Santadi 3.550 27603 0,60870 0,21572 0,39298

15 Villamassargia 3.663 31266 0,65217 0,24435 0,40783

16 Gonnesa 5.120 36386 0,69565 0,28436 0,41129

17 Portoscuso 5.239 41625 0,73913 0,32530 0,41383

18 San Giovanni Suergiu 6.097 47722 0,78261 0,37295 0,40966

19 Carloforte 6.237 53959 0,82609 0,42169 0,40439

20 Domusnovas 6.353 60312 0,86957 0,47134 0,39822

21 Sant'Antioco 11.430 71742 0,91304 0,56067 0,35238

22 Iglesias 27.532 99274 0,95652 0,77583 0,18069

23 Carbonia 28.684 127958 1,00000 1,00000 0,00000

Totale 127.958 0,57

A titolo di esempio si riporta la tabella costruita per la provincia di Carbonia Iglesias in cui si presentano i vari passaggi per il calcolo dell’indice di concentrazione

Page 46: Statistica sociale

46

Concentrazione della popolazione

Statistica sociale

Page 47: Statistica sociale

47

Concentrazione dei redditi

Statistica sociale

Page 48: Statistica sociale

48

Concentrazione: province a confronto

Indice di concentrazione

Popolazione Reddito

Sassari 0,76 0,81

Nuoro 0,63 0,63

Cagliari 0,67 0,73

Oristano 0,61 0,66

Olbia Tempio 0,59 0,63

Ogliastra 0,41 0,46

Medio Campidano 0,57 0,58

Carbonia Iglesias 0,57 0,63

Statistica sociale

Page 49: Statistica sociale

Nel caso di distribuzioni in classi si avrà invece un’area, scomposta in un numero di trapezi uguale al numero delle classi considerate. L’altezza non sarà più costante ma sarà uguale a

L’indice di concentrazione per distribuzioni in classi

S sarà quindi uguale a:

Riprendendo i dati del secondo esempio:

In questo secondo caso la concentrazione è pari al 55% della concentrazione massima.

B1 B2

iiNiN fPP )1()(

iiNiN

k

i

iNiN fQPQPS )]()[(2

1)1()1(

1

)()(

49Statistica sociale

Page 50: Statistica sociale

50

Concentrazione dei redditi

Statistica sociale

Analisi statistiche - Dichiarazioni 2013 - Anno d'imposta 2012

Tipo di imposta : IRPEFModello : Persone fisiche totaliTipologia contribuente : Tutte le tipologie di contribuentiTematica : Caratteristiche dei contribuentiClassificazione : Classi di reddito complessivo in euroData ultimo aggiornamento : 9 Luglio 2014

2012

Classi di reddito complessivo in euro Numero contribuenti Frequenza Percentuale

minore di -1.000 166.984 0,40da -1.000 a 0 48.830 0,12 fizero 883.388 2,13 0,02da 0 a 1.000 2.022.386 4,88 0,05da 1.000 a 1.500 597.557 1,44 0,01da 1.500 a 2.000 550.503 1,33 0,01da 2.000 a 2.500 496.058 1,20 0,01da 2.500 a 3.000 453.497 1,10 0,01da 3.000 a 3.500 404.167 0,98 0,01da 3.500 a 4.000 399.952 0,97 0,01da 4.000 a 5.000 784.346 1,89 0,02da 5.000 a 6.000 774.468 1,87 0,02da 6.000 a 7.500 3.178.332 7,67 0,08da 7.500 a 10.000 3.086.003 7,45 0,07da 10.000 a 12.000 2.473.990 5,97 0,06da 12.000 a 15.000 3.592.400 8,67 0,09da 15.000 a 20.000 6.486.667 15,66 0,16da 20.000 a 26.000 6.000.649 14,49 0,15da 26.000 a 29.000 2.036.649 4,92 0,05da 29.000 a 35.000 2.589.189 6,25 0,06da 35.000 a 40.000 1.219.016 2,94 0,03da 40.000 a 50.000 1.216.056 2,94 0,03da 50.000 a 55.000 340.568 0,82 0,01da 55.000 a 60.000 259.554 0,63 0,01da 60.000 a 70.000 375.101 0,91 0,01da 70.000 a 75.000 144.318 0,35 0,00da 75.000 a 80.000 120.603 0,29 0,00da 80.000 a 90.000 178.398 0,43 0,00da 90.000 a 100.000 122.829 0,30 0,00da 100.000 a 120.000 151.250 0,37 0,00da 120.000 a 150.000 109.978 0,27 0,00da 150.000 a 200.000 74.969 0,18 0,00da 200.000 a 300.000 45.259 0,11 0,00oltre 300.000 30.240 0,07 0,00TOTALE 41.414.154 100,00

Page 51: Statistica sociale

51

Concentrazione dei redditi

Statistica sociale

Classi di reddito complessivo in euro

Numero contribuenti

Frequenza fi xc ai Ai Pi Pi Qi Pi-Qi (A) Pi-1 - Qi-1 (B) (A+B)*fi

zero 883.388 0,02 - - 0 883.388 0,0214 - 0,021442 0 0,00046da 0 a 1.000 2.022.386 0,05 500 1.011.193.000 1.011.193.000 2.905.774 0,0705 0,001262 0,069269 0,021442 0,00445da 1.000 a 1.500 597.557 0,01 1.250 746.946.250 1.758.139.250 3.503.331 0,0850 0,002195 0,082841 0,069269 0,00221da 1.500 a 2.000 550.503 0,01 1.750 963.380.250 2.721.519.500 4.053.834 0,0984 0,003398 0,095000 0,082841 0,00238da 2.000 a 2.500 496.058 0,01 2.250 1.116.130.500 3.837.650.000 4.549.892 0,1104 0,004791 0,105648 0,095000 0,00242da 2.500 a 3.000 453.497 0,01 2.750 1.247.116.750 5.084.766.750 5.003.389 0,1214 0,006348 0,115098 0,105648 0,00243da 3.000 a 3.500 404.167 0,01 3.250 1.313.542.750 6.398.309.500 5.407.556 0,1313 0,007988 0,123269 0,115098 0,00234da 3.500 a 4.000 399.952 0,01 3.750 1.499.820.000 7.898.129.500 5.807.508 0,1410 0,009860 0,131104 0,123269 0,00247da 4.000 a 5.000 784.346 0,02 4.500 3.529.557.000 11.427.686.500 6.591.854 0,1600 0,014267 0,145736 0,131104 0,00527da 5.000 a 6.000 774.468 0,02 5.500 4.259.574.000 15.687.260.500 7.366.322 0,1788 0,019584 0,159217 0,145736 0,00573da 6.000 a 7.500 3.178.332 0,08 6.750 21.453.741.000 37.141.001.500 10.544.654 0,2559 0,046367 0,209581 0,159217 0,02845da 7.500 a 10.000 3.086.003 0,07 8.750 27.002.526.250 64.143.527.750 13.630.657 0,3309 0,080078 0,250777 0,209581 0,03448da 10.000 a 12.000 2.473.990 0,06 11.000 27.213.890.000 91.357.417.750 16.104.647 0,3909 0,114052 0,276853 0,250777 0,03168da 12.000 a 15.000 3.592.400 0,09 13.500 48.497.400.000 139.854.817.750 19.697.047 0,4781 0,174597 0,303506 0,276853 0,05061da 15.000 a 20.000 6.486.667 0,16 17.500 113.516.672.500 253.371.490.250 26.183.714 0,6356 0,316313 0,319240 0,303506 0,09805da 20.000 a 26.000 6.000.649 0,15 23.000 138.014.927.000 391.386.417.250 32.184.363 0,7812 0,488613 0,292592 0,319240 0,08911da 26.000 a 29.000 2.036.649 0,05 27.500 56.007.847.500 447.394.264.750 34.221.012 0,8306 0,558534 0,272106 0,292592 0,02792da 29.000 a 35.000 2.589.189 0,06 32.000 82.854.048.000 530.248.312.750 36.810.201 0,8935 0,661971 0,231517 0,272106 0,03165da 35.000 a 40.000 1.219.016 0,03 37.500 45.713.100.000 575.961.412.750 38.029.217 0,9231 0,719040 0,204037 0,231517 0,01289da 40.000 a 50.000 1.216.056 0,03 45.000 54.722.520.000 630.683.932.750 39.245.273 0,9526 0,787356 0,165237 0,204037 0,01090da 50.000 a 55.000 340.568 0,01 52.500 17.879.820.000 648.563.752.750 39.585.841 0,9609 0,809678 0,151183 0,165237 0,00262da 55.000 a 60.000 259.554 0,01 57.500 14.924.355.000 663.488.107.750 39.845.395 0,9672 0,828309 0,138851 0,151183 0,00183da 60.000 a 70.000 375.101 0,01 65.000 24.381.565.000 687.869.672.750 40.220.496 0,9763 0,858748 0,117517 0,138851 0,00233da 70.000 a 75.000 144.318 0,00 72.500 10.463.055.000 698.332.727.750 40.364.814 0,9798 0,871810 0,107958 0,117517 0,00079da 75.000 a 80.000 120.603 0,00 77.500 9.346.732.500 707.679.460.250 40.485.417 0,9827 0,883479 0,099217 0,107958 0,00061da 80.000 a 90.000 178.398 0,00 85.000 15.163.830.000 722.843.290.250 40.663.815 0,9870 0,902409 0,084616 0,099217 0,00080da 90.000 a 100.000 122.829 0,00 95.000 11.668.755.000 734.512.045.250 40.786.644 0,9900 0,916977 0,073030 0,084616 0,00047da 100.000 a 120.000 151.250 0,00 110.000 16.637.500.000 751.149.545.250 40.937.894 0,9937 0,937747 0,055931 0,073030 0,00047da 120.000 a 150.000 109.978 0,00 135.000 14.847.030.000 765.996.575.250 41.047.872 0,9963 0,956283 0,040065 0,055931 0,00026da 150.000 a 200.000 74.969 0,00 175.000 13.119.575.000 779.116.150.250 41.122.841 0,9982 0,972661 0,025506 0,040065 0,00012da 200.000 a 300.000 45.259 0,00 250.000 11.314.750.000 790.430.900.250 41.168.100 0,9993 0,986787 0,012479 0,025506 0,00004oltre 300.000 30.240 0,00 350.000 10.584.000.000 801.014.900.250 41.198.340 1,0000 1,000000 - 0,012479 0,00001

41.198.340 0,456

Page 52: Statistica sociale

52Statistica sociale

Eterogeneità

L’indice di eterogeneità si applica in caso di variabili qualitative, che non possono essere trasferite tra soggetti. Es. qualifica funzionale, livello retributivo, valutazioni di merito, ecc.

Page 53: Statistica sociale

53Statistica sociale

Eterogeneità

Page 54: Statistica sociale

54Statistica sociale

Eterogeneità

dividendo per k

Page 55: Statistica sociale

55Statistica sociale

Eterogeneità

Page 56: Statistica sociale

56

Eterogeneità: esercizi

ID Stipendio Età Anni servizio Qualifica funzionale Regime di impiego1 2650 40 15 Operaio Tempo pieno2 2600 43 5 Operaio Part time3 2050 35 6 Impiegato Tempo pieno4 3500 27 6 Dirigente Part time5 1400 36 3 Dirigente Collaboratori esterni6 2400 30 12 Impiegato Tempo pieno7 1900 41 13 Operaio Tempo pieno8 2100 35 4 Impiegato Tempo pieno9 2100 27 7 Operaio Tempo pieno

10 3050 38 18 Dirigente Tempo pieno11 2800 38 20 Operaio Collaboratori esterni12 2950 41 11 Operaio Collaboratori esterni13 1900 36 4 Dirigente Collaboratori esterni14 1650 29 11 Impiegato Collaboratori esterni15 2550 40 4 Impiegato Collaboratori esterni16 2000 23 10 Impiegato Tempo pieno17 2150 26 8 Operaio Collaboratori esterni18 2900 41 9 Dirigente Tempo pieno19 2450 35 12 Operaio Collaboratori esterni20 1950 31 8 Dirigente Collaboratori esterni

Statistica sociale

Nella tabella che segue si riportano le caratteristiche degli addetti di un'azienda. Calcolare l'indice di eterogeneità della qualifica funzionale e del regime di impiego.

Page 57: Statistica sociale

57

Eterogeneità: esercizi

Regime d’impiego ni fi fi^2Collaboratori esterni 9 0,45 0,2025Part time 2 0,1 0,01Tempo pieno 9 0,45 0,2025

Totale addetti 20 1 0,415

indice di eterogeneità 0,59

G (max) 0,67

Indice di eterogeneità normalizzato 0,8775

Statistica sociale

Qualifica funzionale ni fi fi^2Dirigente 6 0,3 0,09

Impiegato 6 0,3 0,09

Operaio 8 0,4 0,16

Totale addetti 20 1 0,34

indice di eterogeneità 0,66

G (max) 0,67

Indice di eterogeneità normalizzato 0,99

Page 58: Statistica sociale

58

Esercizio completo con indici di posizione, di variabilità e di mutua variabilità

Statistica sociale

Page 59: Statistica sociale

59

Il Data journalism (mappe e grafici interattivi)

La comunicazione sul web: blog e social media

Comunicazione efficace. L’utilizzo della statistica nei nuovi media e nei social network

Statistica sociale