Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi...

14
Soluzioni operative ed aspetti qualitativi per la geo-codifica di popolazioni in ambito sanitario Sebastiano Pollina A. 3 , Paolo Carnà 1 , Mauro Ferrante 2 , Alfredo Pontillo 1 , Alessandro Migliardi 1 , Salvatore Scondotto 3 1 Servizio Sovrazonale di Epidemiologia, ASL TO3 2 Università di Palermo 3 Dipartimento Attività Sanitarie ed Osservatorio Epidemiologico, Regione Siciliana Regione Siciliana Assessorato alla Salute Dipartimento per le Attività Sanitarie ed Osservatorio Epidemiologico

Transcript of Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi...

Page 1: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Soluzioni operative ed aspetti qualitativi per la geo-codifica di popolazioni in ambito sanitario

Sebastiano Pollina A.3, Paolo Carnà1, Mauro Ferrante2, Alfredo Pontillo1,

Alessandro Migliardi1, Salvatore Scondotto3

1 Servizio Sovrazonale di Epidemiologia, ASL TO3 2 Università di Palermo 3 Dipartimento Attività Sanitarie ed Osservatorio Epidemiologico, Regione Siciliana

Regione Siciliana

Assessorato alla Salute

Dipartimento per le Attività Sanitarie

ed Osservatorio Epidemiologico

Page 2: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Schema

―Geocodifica nella ricerca sanitaria

―Principali obiettivi

―Materiali e metodi

―Risultati

―Prospettive future e conclusioni

Page 3: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Le geocodifica nella ricerca sanitaria

― Il geocoding è la trasformazione di un indirizzo testuale in informazioni geografiche ― consente il posizionamento di un individuo, gruppo e

servizio sanitario in un contesto geografico

― Rende possibile effettuare analisi statistiche spaziali circa: ― Cause di patologia

― Adeguatezza ed equità nell’accesso ai servizi

― Sorveglianza Epidemiologica

― Sviluppo degli obiettivi delle politiche di prevenzione

Page 4: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Obiettivi

― Proporre un indice di qualità delle procedure di geocoding utilizzate:

― per valutare la qualità dei risultati

― per tenerne conto nelle fasi di analisi (ad esempio attraverso le stratificazione)

Page 5: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Materiali e Metodi

― Per la Geocodifica sono stati selezionati gli indirizzi residenziali di 13 Comuni Siciliani con popolazione superiore ai 50.000 abitanti

― I comuni di Palermo, Catania e Siracusa sono stati esclusi dall’analisi

― Per il comune di Messina la toponomastica ISTAT degli indirizzi non è disponibile

Trapani

Marsala

Mazara d.V.

Agrigento

Caltanissetta

Bagheria

Gela

Acireale

Misterbianco

Paternò

Messina

Ragusa

Vittoria

Modica

Page 6: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Materiali e Metodi

― La procedura di geocodifica è stata effettuata in tre fasi:

― Normalizzazione degli indirizzi

― Linkage con lo stradario ISTAT

― La localizzazione

Page 7: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Materiali e Metodi ― Sono stati usati due differenti approcci ― Normalizzazione

― standardizzazione basata su GIS ― Sviluppo di algoritmi basati su ricorrenza di espressioni regolari

― Linkage ― Gli indirizzi delle residenza sono stati linkati con la toponomastica

ufficiale dello stradario ISTAT ― La prima procedure è un Matching probabilistico basato sul punteggio di

similarità di Jaccard ― Per la seconda procedura è stato implementato un apposito algoritmo

basato su una ricerca Boolean fulltext

― Localizzazione ― Per la prima procedura è stato usato il software ArcGIS ― Per la seconda procedura si utilizzato un servizio web server (Google

geocoding API)

― È stato implementato un Indice di qualità del Geocoding ― I risultati ottenuti dai due metodi sono stati poi confrontati in

termini di distanza tra le coppie di punti trovati con i due sistemi

Page 8: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Qualità dei dati geocodificati

― Match Rate ― percentuale di record che possono essere geocodificati con un

sufficiente livello di qualità

― Match score ― la confidenza associata ad un particole record descrive il livello

di affidabilità su quanto l’indirizzo in input è associato al corretto output in termini di geocoding

― Match type ― quindi il livello di match geografico

― Spatial accuracy ― una misura di quanto le coordinate spaziali ottenute

corrispondono al luogo reale che si intendeva geocodificare

Page 9: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Geocoding Quality Index (GQI)

,

A BJ A B

A B

Page 10: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Risultati

― In totale sono stati selezionati 263.837 indirizzi univoci

di residenza associati ad 1.112.014 abitanti (circa 22% dei residenti in Sicilia)

Page 11: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Risultati

― La% degli indirizzi con qualità medio-alta con almeno una delle due procedure è superiore al 80%

― La tecnica basata su API google è migliore di quella basate su ARC-GIS (75% vs 41%)

Page 12: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Risultati

― 90% dei risultati con qualità medio-alta ha una distanza inferiore a 600 m

― 10% degli outliers è stato considerato come bassa qualità (in questa fase)

Page 13: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Prospettive future e conclusioni

― Determinare la sezione censuaria per ogni indirizzo geocodificato

― Possibilità di compiere analisi aggiungendo le informazioni dell’unità censuaria inclusi l’indice di deprivazione

― Aumentare la qualità dei risultati, però lavorando contemporaneamente al database dei residenti e alla toponomastica degli indirizzi ISTAT

― Implementare procedure di analisi epidemiologica capaci di tener conto di eventuali errori sistematici derivanti dal geocoding incompleto

― Sviluppare ricerche su base spaziale che considerino la relazione per effetti ambientali e condizioni socio-economiche per i decisori dell’assistenza sanitaria

Page 14: Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi ― Linkage con lo stradario ISTAT ... ― Gli indirizzi delle residenza sono stati

Gli autori dichiarano di non avere conflitti di interesse

Grazie per l’attenzione

[email protected]