Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

20
Statistiche per misurare il progresso sociale e lo sviluppo sostenibile Dai dati, ai modelli, alla policy: progetti di tirocinio Ivano Repetto -Michela Pastorino Corso di Laurea in Statistica Matematica e trattamento Informatico dei Dati

Transcript of Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Page 1: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Statistiche per misurare il progresso sociale e lo sviluppo sostenibile

Dai dati, ai modelli, alla policy: progetti di tirocinio

Ivano Repetto -Michela Pastorino

Corso di Laurea in Statistica Matematica e trattamento

Informatico dei Dati

Page 2: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Arianna Vilardi

INCIDENTI STRADALI CON LESIONI A PERSONE

IN LIGURIA 2001-2010

Arianna

Vilardi

Statistiche per misurare il progresso sociale e lo sviluppo sostenibile

Page 3: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Il progetto di tirocinio prevedeva di analizzare tutti gli incidenti stradali che hanno causato lesioni a persone nel decennio 2001-2010 in Liguria. I dati provengono dalla rilevazione -tramite il modello Istat CTT/INC- da parte dell’autorità che è intervenuta sul luogo per ogni incidente stradale in cui è coinvolto almeno un veicolo in circolazione sulla rete

stradale e che comporti danni alle persone.

Page 4: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

A chi servono queste

analisi e quale utilizzo ne è previsto

Servizi sociali e sanitari per la valutazione del «costo sociale» degli infortunati

Servizi del Territorio per l’individuazione dei punti critici e per il miglioramento della circolazione stradale

Page 5: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Anni Incide

nti

variazione % annua

Feriti variazio

ne % annua

Morti

variazione %

annua

variazione %

rispetto al 2001

2001 9310 - 12481 - 166 - -

2002 9378 0.73 12575 0.75 148 -12.16 -12.16

2003 9152 -2.47 11962 -5.13 123 -20.33 -34.96

2004 9132 -0.22 11850 -0.95 119 -3.36 -39.50

2005 9877 7.54 12981 8.71 110 -8.18 -50.91

2006 10085 2.06 13166 1.41 118 6.78 -40.68

2007 9987 -0.98 12902 -2.05 91 -29.67 -82.42

2008 9426 -5.95 12056 -7.02 87 -4.59 -90.80

2009 9652 2.34 12389 2.69 76 -14.47 -118.42

2010 9702 0.52 12360 -0.24 84 9.52 -97.62

Liguria

8000

18000

2000 2002 2004 2006 2008 2010 2012

Regione Liguria Numero incidenti e feriti per anno

Incidenti Feriti

0

50

100

150

200

2000 2002 2004 2006 2008 2010 2012

Regione Liguria Numero morti in incidenti per anno

Page 6: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Italia Anni

Numero Incident

i

variazione % annua

Numero Feriti

variazione

% annu

a

Numero

Morti

variazione %

annua

2001 263100 - 373286 - 7096 -

2002 265402 0.87 378492 1.38 6980 -1.66

2003 252271 -5.21 356475 -6.18 6563 -6.35

2004 243490 -3.61 343179 -3.87 6122 -7.20

2005 240011 -1.45 334858 -2.49 5818 -5.23

2006 238124 -0.79 332955 -0.57 5669 -2.63

2007 230871 -3.14 325850 -2.18 5131 -10.49

2008 218963 -5.44 310745 -4.86 4725 -8.59

2009 215405 -1.65 307258 -1.14 4237 -11.52

2010 212997 -1.13 304720 -0.83 4114 -2.99

170000

220000

270000

320000

370000

420000

2000 2002 2004 2006 2008 2010 2012

Italia: Numero incidenti e feriti per anno

Incidenti Feriti

4000

4500

5000

5500

6000

6500

7000

7500

2000 2002 2004 2006 2008 2010 2012

Italia: Numero morti in incidenti per anno

Page 7: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

-14,00

-12,00

-10,00

-8,00

-6,00

-4,00

-2,00

0,00

2,00

4,00

2002 2003 2004 2005 2006 2007 2008 2009 2010

Variazione % 2001-2010 ITALIA

variazione % annua incidenti variazione % annua feriti

variazione % annua morti

-35,00

-30,00

-25,00

-20,00

-15,00

-10,00

-5,00

0,00

5,00

10,00

15,00

2002 2003 2004 2005 2006 2007 2008 2009 2010

Variazione % 2001-2010 LIGURIA

variazione % annua incidenti variazione % annua feriti variazione % annua morti

Page 8: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Numero degli incidenti in Liguria - STAGIONALITÁ

Page 9: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Anni % una

carreggiata senso unico

% una carreggiata

doppio senso

% due o più

carreggiate

2001 15.03 68.93 16.05

2002 14.69 68.84 16.46

2003 23.74 65.49 10.76

2004 23.37 65.06 11.57

2005 16.03 70.77 13.20

2006 24.19 64.41 11.39

2007 23.61 65.75 10.64

2008 24.17 65.23 10.60

2009 24.88 65.50 9.62

2010 24.72 64.95 10.34

Percentuale incidenti per tipo di strada

Page 10: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

Percentuale annua degli

incidenti suddivisi per

tipologia Fra veicoli in marcia Fra veicolo e pedoni Fra veicolo in marcia che urta veicolo fermo o altro Veicolo in marcia senza urto

Page 11: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Percentuale annua degli incidenti per tipologia dei

veicoli coinvolti

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

2001 2002 2003 2004 2005 2006 2007 2008 2009 2010

Autovettura privata Autocarro Velocipede Ciclomotore Motociclo Altro

Page 12: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Anni

Costo Sociale

per decessi (mln €)

Costo Sociale

per feriti

(mln €)

Totale

Costo Sociale

pro capite

(€)

2001 232 337 569 362

2002 205 323 528 335

2003 172 323 495 314

2004 168 322 490 307

2005 162 371 533 331

2006 165 356 521 324

2007 127 348 475 295

2008 120 322 442 274

2009 106 335 441 273

2010 118 334 452 280

Costo Sociale degli incidenti in Liguria

Valori dei costi sociali, indicati in milioni di euro, per feriti e per decessi. I dati sono calcolati da Istat e ACI, sulla base di costi sociale medi per decesso. Il costo sociale medio di un decesso nel decennio 2001-2010 ammonta a € 1.400.000 e il costo sociale medio di un ferito nel decennio 2001-2010 ammonta a € 27.000.

Page 13: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Analisi dati del sistema elimina-code ARGO

per effettuare previsioni sui tempi di attesa presso l’Agenzia delle

Entrate di Genova

Statistiche per misurare il progresso sociale e lo sviluppo sostenibile

Page 14: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

A chi servono queste

analisi e quale utilizzo

è previsto

Agenzia delle Entrate per ottimizzare i tempi di servizio e gestire gli sportelli

Utenti dei servizi per evitare lunghe attese

Page 15: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Scopo di questo tirocinio è stato cercare di trovare un modello, riconducibile a quelli già noti nella teoria delle code, ben adattabile ai dati disponibili rilevati da ARGO, dal 12 gennaio al 29 maggio 2015, per fare predizioni sul tempo medio di attesa che dovrà sostenere ogni contribuente in base alla tipologia di servizio (fra i 10 monitorati) di cui vuole usufruire presso gli sportelli delle sedi dell’Agenzia delle Entrate.

Le variabili prese in esame sono:

Data Prenotazione

Chiamata

Inizio Fine Tipo evasione

Numero sportello

Biglietto Codice fiscale

Descrizione del servizio

Page 16: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Si vuole utilizzare la «Teoria delle code» per valutare: → come si distribuiscono gli arrivi degli utenti → come si distribuiscono i tempi di servizio In particolare si cerca di stabilire se esiste una distribuzione che si adatta ai tempi di servizio e agli interarrivi.

0

0,005

0,01

0,015

0,02

0,025

0 50 100 150 200 250 300 350

De

nsi

InterArrivi

Istogramma (InterArrivi)

Gli interarrivi corrispondono al tempo che intercorre tra l’arrivo di un cliente e quello del successivo.

Page 17: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Dopo una pulizia dei dati si è effettuata una suddivisione dei dati (per mese, per settimana, per giorno, per fascia oraria,..) per cercare di capire se esiste una distribuzione «comune». I risultati ottenuti sono: •Gli interarrivi si distribuiscono

giornalmente come una log-normale. • I tempi di servizio assumono, a

secondo della tipologia, quattro diverse distribuzioni: log-normale, Gamma, Weibull e GEV.

Page 18: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

• Avendo quindi individuato la distribuzione degli inter-tempi di arrivo durante la giornata e quella di ciascun servizio bisogna cercare se ci sono delle formule chiuse per ricavare le probabilità che un cliente debba aspettare un numero di minuti X sapendo che in coda per quel servizio ci sono Y persone.

• La soluzione ottimale sarebbe forse riuscire a

sapere in ogni momento quanti sportelli sono aperti per ogni servizio ed il numero dei clienti in coda; con queste informazioni non sarebbe più necessario l’utilizzo dei dati relativi agli inter-arrivi e le formule dipenderebbero unicamente dalla distribuzione dei tempi di servizio e si potrebbero ottenere risultati più attendibili e precisi.

Page 19: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Il risultato di questa attività è che se i dati non sono raccolti coerentemente con quello che è lo scopo dell’analisi ma si utilizzano i dati «a disposizione» non è possibile ottenere risultati attendibili.

In questi casi l’analisi statistica può però fornire utili consigli per migliorare i metodi di acquisizione dei dati.

Page 20: Dai dati, ai modelli, alla policy: progetti di tirocinio - Ivano Repetto - Michela Pastorino

Grazie per l’attenzione