S. Casacci, A. Pareto - La costruzione di indicatori soggettivi mediante indici di dissomiglianza:...

21
La costruzione di indicatori soggettivi mediante indici di dissomiglianza: un’applicazione all’indagine sugli aspetti della vita quotidiana Sara Casacci e Adriano Pareto Istituto Nazionale di Statistica

Transcript of S. Casacci, A. Pareto - La costruzione di indicatori soggettivi mediante indici di dissomiglianza:...

La costruzione di indicatori soggettivi mediante indici di dissomiglianza: un’applicazione all’indagine sugli aspetti della vita quotidiana

Sara Casacci e Adriano ParetoIstituto Nazionale di Statistica

Sommario

1. Introduzione

2. I metodi classici

3. Il metodo basato sull’indice di dissomiglianza

4. Un’applicazione ai dati di soddisfazione per la vita

5. Conclusioni

La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015

istat
In questo lavoro prenderemo in considerazione i dati di soddisfazione per la vita, rilevati nell'ambito dell'Indagine sugli Aspetti della Vita quotidiana, e analizzeremo gli strumenti che consentono di realizzare, in modo sintetico, confronti nel tempo e nello spazio.

La costruzione di indicatori soggettivi riguardanti:- giudizi;- percezioni;- atteggiamenti;- ecc.nei confronti di un fenomeno, secondo le modalità di una variabile qualitativa ordinale, è una questione di particolare interesse in statistica.

Si pensi, in particolare, all’analisi dei dati riguardanti le opinioni dei cittadini, rilevate attraverso le indagini Multiscopo sulle famiglie condotte dall’Istat.

In tal caso, il problema è duplice e riguarda due aspetti:- la quantificazione;- la sintesi.

Introduzione

1La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015

La quantificazione

Come passare da una misura su scala ordinale (per esempio, molto, abbastanza, poco, per niente) a una misura su scala di intervallo.

Introduzione

2La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015

Perché quantificare?

Fase descrittiva

Fase investigativa

Introduzione

3La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015

Ai fini della descrizione, la quantificazione è inutile e può essere fuorviante.

Per lo studio delle relazioni e i confronti, la quantificazione consente di superare i limiti degli strumenti per scale ordinali.

Esempio

Moda e mediana delle due distribuzioni sono uguali.

Per evidenziare lo ‘spostamento’ verso le modalità più basse, è necessario quantificare.

t0 t1

Molto 25 5Abbastanza 20 10Poco 50 45Per niente 5 40

Livello di soddisfazione

Frequenza (%)

La sintesi

Come passare da una misura su singoli individui (per esempio, l’insieme dei maschi) a una misura complessiva.

Introduzione

4La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015

In questo lavoro, si propone un metodo per la costruzione di un indicatore soggettivo per gruppi di individui (per esempio, per regione).

Introduzione

5La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015

REGIONE Molto Abbastanza Poco Per nienteIndicatore di

soddisfazione

Piemonte 1,9 40,1 39,2 18,8 ?Valle d'Aosta 4,6 53,9 29,7 11,8 ?Liguria 1,0 45,1 38,6 15,4 ?Lombardia 2,3 47,1 35,5 15,1 ?Bolzano/Bozen 8,2 63,3 22,0 6,6 ?Trento 2,6 61,0 25,7 10,7 ?Veneto 2,0 42,5 35,9 19,6 ?Friuli-Venezia Giulia 2,6 48,1 33,7 15,5 ?Emilia-Romagna 3,0 43,5 38,8 14,8 ?Toscana 2,4 41,7 39,7 16,2 ?Umbria 2,8 42,1 37,1 17,9 ?Marche 1,4 41,3 40,4 16,9 ?Lazio 1,7 38,0 40,8 19,5 ?Abruzzo 2,2 39,9 39,7 18,2 ?Molise 1,0 39,8 38,4 20,8 ?Campania 0,8 31,5 45,8 21,9 ?Puglia 1,6 30,8 45,9 21,7 ?Basilicata 1,4 41,0 39,5 18,2 ?Calabria 1,2 26,7 48,3 23,8 ?Sicilia 1,2 24,9 46,3 27,5 ?Sardegna 1,2 29,9 40,6 28,2 ?Italia 1,9 38,9 40,1 19,1 ?

Persone di 14 anni e oltre per livello di soddisfazione rispetto alla situazioneeconomica per regione - Anno 2013 (valori percentuali)

Metodo della percentuale (PERC): Si calcola la proporzione di tutti gli individui ‘soddisfatti’, a prescindere dal livello di soddisfazione.

I metodi classici

6La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015

Gruppo MoltoAbba-stanza

Poco Per niente Totale PERC

A 100 0 0 0 100 1,00B 50 50 0 0 100 1,00C 0 100 0 0 100 1,00D 25 20 50 5 100 0,45E 5 10 45 40 100 0,15F 0 0 100 0 100 0,00G 0 0 50 50 100 0,00H 0 0 0 100 100 0,00

Quantificazione diretta (EQUI): Si assegnano dei valori ordinati ed equidistanti ai livelli di soddisfazione e si calcola la media ponderata.

I metodi classici

7La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015

Gruppo MoltoAbba-stanza

Poco Per niente Totale EQUI

A 100 0 0 0 100 1,00B 50 50 0 0 100 0,83C 0 100 0 0 100 0,67D 25 20 50 5 100 0,55E 5 10 45 40 100 0,27F 0 0 100 0 100 0,33G 0 0 50 50 100 0,17H 0 0 0 100 100 0,00

Quantif. 1,00 0,67 0,33 0,00

Si calcola l’indice quadratico relativo di dissomiglianza della distribuzione di ciascun gruppo dalla distribuzione di massima insoddisfazione.

Il metodo basato sull’indice di dissomiglianza (DISS)

8La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015

Gruppo MoltoAbba-stanza

Poco Per niente Totale DISS

A 100 0 0 0 100 1,00B 50 50 0 0 100 0,87C 0 100 0 0 100 0,82D 25 20 50 5 100 0,62E 5 10 45 40 100 0,36F 0 0 100 0 100 0,58G 0 0 50 50 100 0,29H 0 0 0 100 100 0,00

Rif. 0 0 0 100 100

In formule, si ha:

dove: = freq. cumulata della modalità k nella distribuzione del gruppo G; = freq. cumulata della modalità k nella distribuzione di riferimento R;m = numero di modalità.

Poiché: = 0 (k=1, …, m-1) e = 1 (k=m)

si ottiene:

Il metodo basato sull’indice di dissomiglianza (DISS)

9La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015

1

)F(FDISS

1-

1

2RG

2

mz

m

kkk

GFkRFk

1

)(FDISS

1-

1

2G

m

m

kk

RFkRFk

Un’applicazione ai dati di soddisfazione per la vita

I dati utilizzati sono tratti dall’Indagine sugli Aspetti della vita quotidiana.

10

Un’applicazione ai dati di soddisfazione per la vita

Le variabili analizzate riguardano la soddisfazione per l’anno trascorso rispetto ad alcuni aspetti della vita quotidiana:

Per queste informazioni sono disponibili le serie storiche dal 1993 a oggi.

11

Un’applicazione ai dati di soddisfazione per la vita

12

DISS

1992

1994

1996

1998

2000

2002

2004

2006

2008

2010

2012

2014

0 ,4

0 ,5

0 ,6

0 ,7

0 ,8

0 ,9

1 ,0In

dic

e d

i so

dd

isfa

zio

ne

EQUI

S ituaz ione_ec onomic a Sa lu te Re laz ion i_ f amilia r i Re laz ion i_c on_amic i Tempo_ libero

1992

1994

1996

1998

2000

2002

2004

2006

2008

2010

2012

2014

Anno

0 ,4

0 ,5

0 ,6

0 ,7

0 ,8

0 ,9

1 ,0

PERC

1992

1994

1996

1998

2000

2002

2004

2006

2008

2010

2012

2014

0 ,4

0 ,5

0 ,6

0 ,7

0 ,8

0 ,9

1 ,0

DISS è una via di mezzo e riesce a cogliere le differenze

tra ‘molto’ e ‘abbastanza’, senza quantificare

esplicitamente

PERC tende a separare i

‘soddisfatti’ dagli ‘insoddisfatti’,

perché aggrega

EQUI tende a ‘equidistanziare’

le ‘serie’, a causa della quantifica-

zione diretta

Risultati coerenti: tutti i metodi ricostruiscono gli

stessi andamenti nel tempoLe scale

sono uguali, ma i valori non sono

direttamente confrontabili

:PERC è una frequenza;EQUI è una

media;DISS è una

distanza

Un’applicazione ai dati di soddisfazione per la vita

13

DISS EQUI PERC DISS EQUI PERCDISS-EQUI

DISS-PERC

EQUI-PERC

Piemonte 0,528 0,417 0,420 14 14 14 0 0 0Valle d'Aosta 0,612 0,504 0,585 3 3 3 0 0 0Liguria 0,556 0,439 0,461 7 7 7 0 0 0Lombardia 0,567 0,455 0,494 5 5 5 0 0 0Bolzano/Bozen 0,680 0,577 0,714 1 1 1 0 0 0Trento 0,633 0,518 0,636 2 2 2 0 0 0Veneto 0,531 0,423 0,445 13 11 9 2 4 2Friuli-Venezia Giulia 0,569 0,460 0,508 4 4 4 0 0 0Emilia-Romagna 0,561 0,449 0,464 6 6 6 0 0 0Toscana 0,547 0,435 0,441 8 8 10 0 -2 -2Umbria 0,540 0,433 0,450 9 9 8 0 1 1Marche 0,539 0,424 0,427 10 10 11 0 -1 -1Lazio 0,519 0,407 0,398 15 15 16 0 -1 -1Abruzzo 0,531 0,420 0,421 12 12 13 0 -1 -1Molise 0,514 0,403 0,408 16 16 15 0 1 1Campania 0,488 0,371 0,323 18 18 18 0 0 0Puglia 0,490 0,375 0,325 17 17 17 0 0 0Basilicata 0,532 0,419 0,424 11 13 12 -2 -1 1Calabria 0,469 0,351 0,279 19 19 20 0 -1 -1Sicilia 0,445 0,333 0,262 21 21 21 0 0 0Sardegna 0,452 0,347 0,311 20 20 19 0 1 1Italia 0,524 0,413 0,409

Diff. media assoluta 0,2 0,7 0,6Rho di Spearman 0,995 0,982 0,990

Indice di soddisfazione sulla situazione economica per metodo di quantificazione - Anno 2013

Rango

Regione

Valore Differenza di rango

Le distribuzioni regionali sono concentrate, per circa l’80%, su ‘abbastanza’ e ‘poco’

(‘molto’ soddisfatti = 2%)

L’effetto ‘aggregazione’

di PERC è trascurabile

Per la situazione

economica, non ci sono differenze

rilevanti tra i metodi

Un’applicazione ai dati di soddisfazione per la vita

14

DISS EQUI PERC DISS EQUI PERCDISS-EQUI

DISS-PERC

EQUI-PERC

Piemonte 0,730 0,643 0,816 13 13 12 0 1 1Valle d'Aosta 0,755 0,670 0,853 3 3 3 0 0 0Liguria 0,738 0,654 0,830 8 9 6 -1 2 3Lombardia 0,748 0,666 0,847 4 4 4 0 0 0Bolzano/Bozen 0,801 0,749 0,918 1 1 1 0 0 0Trento 0,773 0,699 0,882 2 2 2 0 0 0Veneto 0,739 0,657 0,828 6 7 7 -1 -1 0Friuli-Venezia Giulia 0,745 0,666 0,841 5 5 5 0 0 0Emilia-Romagna 0,739 0,658 0,825 7 6 8 1 -1 -2Toscana 0,736 0,652 0,823 9 10 9 -1 0 1Umbria 0,735 0,655 0,821 10 8 10 2 0 -2Marche 0,733 0,645 0,819 11 12 11 -1 0 1Lazio 0,728 0,635 0,812 16 17 15 -1 1 2Abruzzo 0,732 0,648 0,815 12 11 14 1 -2 -3Molise 0,729 0,637 0,809 15 14 16 1 -1 -2Campania 0,730 0,636 0,815 14 16 13 -2 1 3Puglia 0,711 0,626 0,778 19 19 19 0 0 0Basilicata 0,721 0,627 0,799 17 18 18 -1 -1 0Calabria 0,701 0,610 0,758 20 20 20 0 0 0Sicilia 0,721 0,637 0,803 18 15 17 3 1 -2Sardegna 0,692 0,602 0,745 21 21 21 0 0 0Italia 0,732 0,646 0,817

Diff. media assoluta 0,8 0,6 1,0Rho di Spearman 0,983 0,990 0,968

Indice di soddisfazione sulla salute per metodo di quantificazione - Anno 2013

Rango

Regione

Valore Differenza di rango

Lievi differenze tra

i metodi

Le distribuzioni

regionali sono concentrate,

per oltre il 60%, su

‘abbastanza’ (‘per niente’ soddisfatti =

5%) Al max.

3 ranghi di diff.

Un’applicazione ai dati di soddisfazione per la vita

15

DISS EQUI PERC DISS EQUI PERCDISS-EQUI

DISS-PERC

EQUI-PERC

Piemonte 0,808 0,757 0,928 10 11 9 -1 1 2Valle d'Aosta 0,803 0,745 0,923 14 14 11 0 3 3Liguria 0,809 0,757 0,931 8 9 6 -1 2 3Lombardia 0,812 0,769 0,923 5 5 13 0 -8 -8Bolzano/Bozen 0,843 0,815 0,948 1 1 1 0 0 0Trento 0,830 0,796 0,942 2 2 2 0 0 0Veneto 0,812 0,769 0,921 4 4 15 0 -11 -11Friuli-Venezia Giulia 0,810 0,768 0,918 7 6 16 1 -9 -10Emilia-Romagna 0,807 0,760 0,914 12 8 19 4 -7 -11Toscana 0,811 0,767 0,922 6 7 14 -1 -8 -7Umbria 0,824 0,780 0,942 3 3 3 0 0 0Marche 0,808 0,751 0,934 9 12 4 -3 5 8Lazio 0,793 0,730 0,914 18 17 18 1 0 -1Abruzzo 0,807 0,757 0,923 11 10 12 1 -1 -2Molise 0,803 0,743 0,929 15 15 7 0 8 8Campania 0,785 0,708 0,909 20 21 20 -1 0 1Puglia 0,782 0,713 0,891 21 20 21 1 0 -1Basilicata 0,791 0,722 0,916 19 19 17 0 2 2Calabria 0,798 0,729 0,929 17 18 8 -1 9 10Sicilia 0,801 0,737 0,927 16 16 10 0 6 6Sardegna 0,805 0,745 0,932 13 13 5 0 8 8Italia 0,803 0,749 0,920

Diff. media assoluta 0,8 4,2 4,9Rho di Spearman 0,978 0,566 0,470

Indice di soddisfazione sulle relazioni familiari per metodo di quantificazione - Anno 2013

Rango

Regione

Valore Differenza di rango Le distribuzioni

sono concentrate, per il 90%, su ‘molto’ e

‘abbastanza’

Per le relazioni familiari, si registrano

sensibili differenze

PERC porta a risultati molto diversi

dagli altri metodi

Un’applicazione ai dati di soddisfazione per la vita

16

DISS EQUI PERC DISS EQUI PERCDISS-EQUI

DISS-PERC

EQUI-PERC

Piemonte 0,762 0,693 0,858 7 10 7 -3 0 3Valle d'Aosta 0,775 0,703 0,885 2 4 2 -2 0 2Liguria 0,769 0,704 0,862 4 3 5 1 -1 -2Lombardia 0,755 0,697 0,838 12 8 15 4 -3 -7Bolzano/Bozen 0,802 0,756 0,911 1 1 1 0 0 0Trento 0,768 0,710 0,871 5 2 3 3 2 -1Veneto 0,756 0,695 0,838 10 9 14 1 -4 -5Friuli-Venezia Giulia 0,759 0,702 0,838 8 5 13 3 -5 -8Emilia-Romagna 0,752 0,687 0,834 15 12 17 3 -2 -5Toscana 0,756 0,689 0,845 9 11 11 -2 -2 0Umbria 0,762 0,699 0,859 6 7 6 -1 0 1Marche 0,752 0,680 0,840 16 14 12 2 4 2Lazio 0,746 0,671 0,837 17 18 16 -1 1 2Abruzzo 0,770 0,699 0,868 3 6 4 -3 -1 2Molise 0,743 0,672 0,826 18 16 18 2 0 -2Campania 0,725 0,638 0,791 21 21 21 0 0 0Puglia 0,732 0,654 0,805 20 20 20 0 0 0Basilicata 0,755 0,673 0,855 13 15 9 -2 4 6Calabria 0,755 0,671 0,850 14 17 10 -3 4 7Sicilia 0,737 0,663 0,817 19 19 19 0 0 0Sardegna 0,755 0,683 0,858 11 13 8 -2 3 5Italia 0,749 0,680 0,835

Diff. media assoluta 1,8 1,7 2,9Rho di Spearman 0,936 0,921 0,800

Indice di soddisfazione sulle relazioni con amici per metodo di quantificazione - Anno 2013

Rango

Regione

Valore Differenza di rango

Anche per le relazioni con gli amici, i risultati

differiscono sensibilmente

Le distribuzioni sono simili a quelle delle

relazioni familiari,

concentrate, per l'80%, su

'molto' e 'abbastanza'

Un’applicazione ai dati di soddisfazione per la vita

17

DISS EQUI PERC DISS EQUI PERCDISS-EQUI

DISS-PERC

EQUI-PERC

Piemonte 0,661 0,573 0,659 14 12 12 2 2 0Valle d'Aosta 0,684 0,598 0,686 5 5 6 0 -1 -1Liguria 0,690 0,605 0,715 3 3 2 0 1 1Lombardia 0,678 0,597 0,686 6 6 5 0 1 1Bolzano/Bozen 0,750 0,686 0,831 1 1 1 0 0 0Trento 0,693 0,618 0,712 2 2 3 0 -1 -1Veneto 0,663 0,581 0,661 12 11 11 1 1 0Friuli-Venezia Giulia 0,667 0,584 0,653 9 9 14 0 -5 -5Emilia-Romagna 0,668 0,589 0,670 8 8 9 0 -1 -1Toscana 0,662 0,581 0,669 13 10 10 3 3 0Umbria 0,687 0,605 0,700 4 4 4 0 0 0Marche 0,676 0,590 0,678 7 7 7 0 0 0Lazio 0,647 0,552 0,623 18 17 17 1 1 0Abruzzo 0,664 0,570 0,658 10 14 13 -4 -3 1Molise 0,663 0,572 0,674 11 13 8 -2 3 5Campania 0,620 0,521 0,573 19 21 20 -2 -1 1Puglia 0,616 0,529 0,600 21 19 19 2 2 0Basilicata 0,651 0,556 0,652 15 16 15 -1 0 1Calabria 0,649 0,551 0,625 16 18 16 -2 0 2Sicilia 0,620 0,529 0,568 20 20 21 0 -1 -1Sardegna 0,647 0,557 0,617 17 15 18 2 -1 -3Italia 0,654 0,567 0,644

Diff. media assoluta 1,0 1,3 1,1Rho di Spearman 0,966 0,955 0,953

Indice di soddisfazione sul tempo libero per metodo di quantificazione - Anno 2013

Rango

Regione

Valore Differenza di rango

Risultati simili a quelli per la

salute

Le distribuzioni

sono concentrate,

per circa l’80%, su

‘abbastanza’ e ‘poco’

(‘per niente’ soddisfatti =

8%)

Conclusioni

18

I risultati forniti dai diversi metodi sono concordanti nel tempo ed evidenziano un ‘crollo’ della soddisfazione per la situazione economica personale a partire dall’anno 2001.

Dal punto di vista territoriale, invece, le maggiori differenze riguardano il livello di soddisfazione per le relazioni familiari e amicali, a causa dell’effetto ‘aggregazione’ del metodo PERC.

Nel complesso, il metodo basato sull’indice di dissomiglianza sembra collocarsi a metà strada tra i due metodi classici, senza averne gli inconvenienti.

Il metodo DISS, infatti, non comporta perdita di informazione (come avviene in PERC) e non richiede una quantificazione arbitraria ‘esplicita’ (come avviene in EQUI).

Inoltre, l’uso di un indicatore soggettivo di soddisfazione consente di superare i limiti di indici di posizione, come la moda e la mediana.

La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015

Bibliografia

Casacci C., Pareto A. (2014). Methods for Quantifying Ordinal Variables: A Comparative Study. Quality & Quantity, doi: 10.1007/s11135-014-0063-2

Hensler C., Stipak B. (1979). Estimating Interval Scale Values for Survey Item Response Categories. Am. J. Polit. Sci., 23, pp. 627-648

Herzel A. (1974). Un criterio di quantificazione. Aspetti statistici. Metron, 32, pp. 3-54

Istat (2006). Il sistema di indagini sociali multiscopo. Contenuti e metodologia delle indagini. Metodi e norme, n. 31

Istat (2013). La soddisfazione dei cittadini per le condizioni di vita. Statistiche report, 20 novembre 2013

Jamieson S. (2004). Likert scales: how to (ab)use them. Med. Educ., 38, pp. 1212-1218

Leti G. (1983). Statistica descrittiva. Il Mulino, Bologna

La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015