Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi...
Transcript of Soluzioni operative ed aspetti qualitativi per la geo ... · ― Normalizzazione degli indirizzi...
Soluzioni operative ed aspetti qualitativi per la geo-codifica di popolazioni in ambito sanitario
Sebastiano Pollina A.3, Paolo Carnà1, Mauro Ferrante2, Alfredo Pontillo1,
Alessandro Migliardi1, Salvatore Scondotto3
1 Servizio Sovrazonale di Epidemiologia, ASL TO3 2 Università di Palermo 3 Dipartimento Attività Sanitarie ed Osservatorio Epidemiologico, Regione Siciliana
Regione Siciliana
Assessorato alla Salute
Dipartimento per le Attività Sanitarie
ed Osservatorio Epidemiologico
Schema
―Geocodifica nella ricerca sanitaria
―Principali obiettivi
―Materiali e metodi
―Risultati
―Prospettive future e conclusioni
Le geocodifica nella ricerca sanitaria
― Il geocoding è la trasformazione di un indirizzo testuale in informazioni geografiche ― consente il posizionamento di un individuo, gruppo e
servizio sanitario in un contesto geografico
― Rende possibile effettuare analisi statistiche spaziali circa: ― Cause di patologia
― Adeguatezza ed equità nell’accesso ai servizi
― Sorveglianza Epidemiologica
― Sviluppo degli obiettivi delle politiche di prevenzione
Obiettivi
― Proporre un indice di qualità delle procedure di geocoding utilizzate:
― per valutare la qualità dei risultati
― per tenerne conto nelle fasi di analisi (ad esempio attraverso le stratificazione)
Materiali e Metodi
― Per la Geocodifica sono stati selezionati gli indirizzi residenziali di 13 Comuni Siciliani con popolazione superiore ai 50.000 abitanti
― I comuni di Palermo, Catania e Siracusa sono stati esclusi dall’analisi
― Per il comune di Messina la toponomastica ISTAT degli indirizzi non è disponibile
Trapani
Marsala
Mazara d.V.
Agrigento
Caltanissetta
Bagheria
Gela
Acireale
Misterbianco
Paternò
Messina
Ragusa
Vittoria
Modica
Materiali e Metodi
― La procedura di geocodifica è stata effettuata in tre fasi:
― Normalizzazione degli indirizzi
― Linkage con lo stradario ISTAT
― La localizzazione
Materiali e Metodi ― Sono stati usati due differenti approcci ― Normalizzazione
― standardizzazione basata su GIS ― Sviluppo di algoritmi basati su ricorrenza di espressioni regolari
― Linkage ― Gli indirizzi delle residenza sono stati linkati con la toponomastica
ufficiale dello stradario ISTAT ― La prima procedure è un Matching probabilistico basato sul punteggio di
similarità di Jaccard ― Per la seconda procedura è stato implementato un apposito algoritmo
basato su una ricerca Boolean fulltext
― Localizzazione ― Per la prima procedura è stato usato il software ArcGIS ― Per la seconda procedura si utilizzato un servizio web server (Google
geocoding API)
― È stato implementato un Indice di qualità del Geocoding ― I risultati ottenuti dai due metodi sono stati poi confrontati in
termini di distanza tra le coppie di punti trovati con i due sistemi
Qualità dei dati geocodificati
― Match Rate ― percentuale di record che possono essere geocodificati con un
sufficiente livello di qualità
― Match score ― la confidenza associata ad un particole record descrive il livello
di affidabilità su quanto l’indirizzo in input è associato al corretto output in termini di geocoding
― Match type ― quindi il livello di match geografico
― Spatial accuracy ― una misura di quanto le coordinate spaziali ottenute
corrispondono al luogo reale che si intendeva geocodificare
Geocoding Quality Index (GQI)
,
A BJ A B
A B
Risultati
― In totale sono stati selezionati 263.837 indirizzi univoci
di residenza associati ad 1.112.014 abitanti (circa 22% dei residenti in Sicilia)
Risultati
― La% degli indirizzi con qualità medio-alta con almeno una delle due procedure è superiore al 80%
― La tecnica basata su API google è migliore di quella basate su ARC-GIS (75% vs 41%)
Risultati
― 90% dei risultati con qualità medio-alta ha una distanza inferiore a 600 m
― 10% degli outliers è stato considerato come bassa qualità (in questa fase)
Prospettive future e conclusioni
― Determinare la sezione censuaria per ogni indirizzo geocodificato
― Possibilità di compiere analisi aggiungendo le informazioni dell’unità censuaria inclusi l’indice di deprivazione
― Aumentare la qualità dei risultati, però lavorando contemporaneamente al database dei residenti e alla toponomastica degli indirizzi ISTAT
― Implementare procedure di analisi epidemiologica capaci di tener conto di eventuali errori sistematici derivanti dal geocoding incompleto
― Sviluppare ricerche su base spaziale che considerino la relazione per effetti ambientali e condizioni socio-economiche per i decisori dell’assistenza sanitaria