Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

50
Dalle licenze ai grafici: riusare, pulire, esplorare e visualizzare i dati Alessio Cimarelli @jenkin27 Andrea Nelson Mauro @nelsonmau www.dataninja.it Agenda Digitale - Comune di Bologna , 16 e 17 giugno 2014

description

Open Data & Data Visualization. Dalle licenze ai grafici: riusare, pulire, esplorare e visualizzare i dati. Lezione in due giorni nell'ambito di un progetto di formazione interna del Comune di Bologna - 16 e 17 giugno 2014.

Transcript of Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Page 1: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Dallelicenzeaigrafici:riusare,pulire,esplorareevisualizzareidati

AlessioCimarelli@jenkin27

AndreaNelsonMauro@nelsonmau

www.dataninja.it

AgendaDigitale-ComunediBologna

,16e17giugno2014

Page 2: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

IdatieilcontestoLelicenzeAggiornamentisulleLineeguidaAGID

Iformatideidatidatistrutturatienonstrutturatifarescrapingpercrearedatistrutturati

UsareletabelleconifoglidicalcoloPulireidati:leregoleprincipaliTecnicheavanzate:l'usodiOpenRefineAnalisi:ordinare,filtrareeraggruppareidatiAggregaredatidatabellediverse:CercaVertealtrefunzioniutili

Page 3: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

IntroduzioneallaDataVisualizationrisorse,strumenti,principaliriferimentiLavisualizzazionecomestrumentidianalisideidati

Graficidibasecon :comescegliereGraficiavanzaticon :visualizzareconnessioniegerarchieMappecon :punti,bolle,choropleth,timemapReticon :elementidisocialnetworkanalysisVisualizzazione con un'overviewgenerale

Page 4: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

IlsitodiDataninjaconinostriprogettiprincipali

Page 5: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014
Page 6: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014
Page 7: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Informazioni,slides,esperimenti,tutorialetoolperidatajournalist

Page 8: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014
Page 9: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

EricSchmidt,Google’sexecutivechairman

Page 10: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Percercarli,trovarli,riusarliedarelorocontesto

Peranalizzarlieverificaresepossonoessereutili

Percostruireinformazionimaggiormenteaccurateebasatesuelementistatistici

Page 11: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014
Page 12: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Cominciamodaunadefinizione

Singolipezzidiinformazionediogninatura,descrizionidifattiriproducibilisenzaambiguità,partidiinformazionistrutturate

chepossonoesserearchiviateinformatodigitale

MaurizioNapolitano,TechnologistpressoFondazioneBrunoKessler(Trento)

Page 13: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Cominciamodaunadefinizione

Undatoèapertosechiunqueèliberodiusarlo,riutilizzarlo,ridistribuirlo,edèsoggettotutt’alpiùall’obbligodicitazioneo

condivisioneallostessomodoOpenDefinition:http://opendefinition.org/od

Page 14: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014
Page 15: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014
Page 16: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

http://opendefinition.org/

Page 17: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Sevogliopubblicaredeidatiin"OpenData"devo: deidati(chilihaprodotti?Ilclassico

esempiodeidatidelturismo,generalmenteraccoltiediffusidalleCamerediCommercio)

dirittialtruio ilsegretostatisticoleverifichenecessarieepreliminari

allapubblicazione.

Einoltredevotenereamenteche:NonpossoconcedereunalicenzacherilascipiùdirittidiquantinonneabbianoidatidiprovenienzaDevosempretenereinconsiderazionelapossibilitàdirimuoveredeidati(omodificarnelalicenza)seemergechelatitolaritànonèmia.

Page 18: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

LelicenzeutilizzabiliperilrilasciodeidatisecondoAGID

http://www.agid.gov.it/sites/default/files/linee_guida/patrimoniopubblicolg2014_v0.6.pdf

Page 19: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

,giurista,espertodidirittodigitale| http://goo.gl/zmjbY7

Page 20: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014
Page 21: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Formatideidatidigitaligiàutilizzabili,solodapulireecontrollare

SipossonoanalizzareconMsExceleLibreOfficeCalc,mysql(...)Èbuonanormapubblicarliconi

Page 22: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Sonodatinonstrutturati senonèpossibileanalizzarlitramiteun'applicazionedifogliodicalcolo

Paginewebinformatohtml

Documentiditesto

Documentiinformatopdf

Page 23: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

L'artedelloscraping:sempliceocomplessa?

(datidaestrarredapdf)

(datidaestrarredapaginehtml)

sviluppateadhocconPython/Javascript/Java

Page 24: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014
Page 25: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Ilnostropuntodipartenzaèunatabelladidatistrutturati

http://dati.comune.bologna.it/node/340

Page 26: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Difronteall’enormevarietàdelmondo,ilcomputercomprendepochitipidivariabili:

numeriinteri(consegno,inclusolo0)numeridecimali(consegno)dateeoraristringhedicaratteri(casesensitive)valoremancante(oNULL)

Page 27: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Verificare,individuareerrori,correggere

Premessesbagliateportano(quasi)sempreaconclusionisbagliate,ancheseilragionamentoècorretto.

Pureseaffidabile,anchelafontepuòsbagliare.Cosìcomepuòbarare,truccare,mentire,nascondere,omettere,ecc.

Dacontrollaresempreprimaditutto:coerenzainterna,completezza,verosimiglianza.

Nonbuttarviamainienteeteneretracciadiquellochesifa...

Page 28: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Verificare,individuareerrori,correggere

Strumentideifoglidicalcolo(comeMicrosoftExcel,LibreOfficeCalc):filtriefunzionidiordinamento;formattazionecondizionale;definizioneesplicitadeitipi(stringa,numero,data,...);semplicigrafici.

SipuòfareconMicrosoftOfficeoLibreOfficeCalcOppureconunostrumentoadhoc:OpenRefine( ).openrefine.org

Page 29: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Ognicolonnarappresentaecontieneunoeunsolotipodidato.

Ognirigarappresentaecontieneunoeunsolooggetto

Nonpossonoesistererigheperfettamentevuoteoidentiche.

Controllachelastrutturadeidatisiacorretta:ognicolonnadevecontenerevaloridellostessotipo(date,luoghi)

Controllacheidatisitrovinoinformatoomogeneo(adesempiolaformattazionedelladataoimaiuscoli/minuscoli)

Controllaqualesistemadinumerazionestaiusando.Europeooanglosassone?Controllaiseparatoridimigliaiaedecimali

Page 30: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Controllacheleintestazionisianosemprenellaprimariga

Lerighevuotenondevonoesistere.Lecellevuotepossonoinveceindicarevalorimancanti(tutteindicanosemprevalorimancanti).

Attenzioneacellefintamentevuote:ilcaratterespazioc’è,anchesenonsivede!

Controllalesommeselavorisutabellenumericheelestaimodificando

Suddividileinformazioniinpiùcolonnepossibile(peresempiosesihannonomicompleti,megliodividerliin“nome”e“cognome”)

Page 31: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014
Page 32: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Possosceglierel'ordinamentoalfabetico(A-ZoZ-A)onumerico(min-maxoviceversa).Inquestocasoordinodalpiùgrandealpiùpiccolo

Page 33: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014
Page 34: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Raggruppoidatiperquartierecalcolandoiltotaledegliiscritti

Page 35: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Quandosihannodiversetabellechedescrivonoglistessielementi,spessoprovenientidafontidiverse,èpossibileunirleearricchirecosìil

miodatasetscoprendonuoverelazionetraidati.

Neifoglidicalcolo: , , .

Page 36: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Datisulladisoccupazioneosuicostideiservizi:quellidellatuacittà/regionesonopiùaltiopiùbassirispettoadaltriterritori?

-Lefontiufficialitendonoaconcentrarsisudatidelquartotrimestre.Ilcontestoelaprospettivacambianoosservandodatichemostranolosviluppodiunfenomenonegliultimi5o10anni.

-Un'istituzioneannunciamilionidieurodiinvestimentiperlescuole.Faiqualcheconto:quantistudentipotrannobeneficiarne,suqualeperiododitempo?Ricalcolareilvaloreprocapitediprogrammidiinvestimentospessopuòchiarireilrealesignificato.

-Provaadeseguiresemplicicontrollidisommeetotali.Verificalemodalitàconlequaliidatisonostatiraccoltieconqualiipotesiomodelli.Qualèiltassodidisoccupazioneneltuopaese?Controllaloeconfrontaloconaltripaesiomodellialternativi.

Page 37: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014
Page 38: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Comenoneramaisuccessonellenostrevite,oggiabbiamoaccessoaun’infinitàdiinformazionilibereegratuite.Conglistrumentigiustipossiamocominciareadareunsensoaquestidatipervedereschemietrendchealtrimentipernoisarebberoinvisibili.Trasformandoinumeriinformagrafica,permetteremoailettoridiconoscerelestoriechequeinumeri

nascondono.

AlbertoCairo,"ThefunctionalArt"

Page 39: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Principalistrumentivisualizzazione:graficibase(linee,barre,torte):mappegeografiche:graficigerarchici:grafi(dettianchereti):timeline:

Maonlinecisonotantissimialtristrumenti:l'importanteèaverechiaroilproprioobiettivoenonaverepauradisperimentare!

http://datawrapper.ithttp://cartodb.com

http://raw.densitydesign.org/http://gephi.org

http://timeline.knightlab.com/

Page 40: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

ConDatawrapperèpossibilerealizzaregraficiinterattiviinpochiminuti(graficiabarre,torte,istogrammi,graficialinee,equalchemappa)

Page 41: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

CartoDBpermettedicrearemappeinterattiveinpochiistanti.L'importanteèchelatuatabellaabbiadeidatigeografici.

Page 42: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

RAWpermettedigestirebenelerelazionitraidatielalorogerarchia.E'faciledausareprovandogliesempigiàpresenti(esempiodiqualiingredientisonofattiicocktail?).

Page 43: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Costruireunacronistoriadeglieventipuòesseremoltoutile.SipuòfareconTimeline.JS,adesempioinserendoinunatabellavariarticoliinsuccessionetemporale(guardalatimelinedelterremotoinEmilia).

Page 44: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Qualisonolerelazionitraidati?E'possibilevisualizzarleconGEPHI,unsoftwarediNetworlAnalysis(basatosuigrafi).E'spessousatopervedereleconnessionitragliutentisuTwitteroleamiciziesuFacebook.

Page 45: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Spessovisualizzareidatipuòaiutarcia"scoprire"dellenotizie

Quantoègrandeladifferenzadeltassodidisoccupazionetradueopiùterritori?Com'ècambiatounfenomenoneltempo?

Visualizzarequestidatipuòaiutarciacomprendereinmanierapiùimmediataunfenomenoefareprenderealnostrolavorogiornalisticoun'altradirezione:torniamoindietro,cerchiamoaltridati,limettiamoaconfronto.

Page 46: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

LebestpracticesdelDataJournalismprevedonocheinsiemealleinchiestevenganopubblicatiidatirelativi,perpermetterediverificarelevisualizzazionieirisultati.Noiabbiamocostruito

Page 47: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

AndreaNelsonMauro/"nelsonmau"[email protected]

@nelsonmau

www.dataninja.ithttp://school.dataninja.it

http://dataninja.it/newsletter

http://datamediahub.it

Page 48: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

Violazionivarchitelecontrollati,SIRIOeRITA

Page 49: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

(SOD)

Dati.gov.itOpenDataCensusLicenzeCreativeCommonsAgendaDigitaleItalianaSpaghettiOpenDataMailinglistpubblicadiSpaghettiOpenDataOpenBilanciOpenCoesioneCIRSFID-UniversitàdiBolognaCodicedell'AmministrazioneDigitaleOpenDefinitionConfiscatiBeneTheMigrants'FilesOpenDataBolognaFivestaropendata

Page 50: Open Data & Data Visualization: dalle licenze ai grafici | Bologna, 16 giugno 2014

(estrazionetabelledapdf)(puliziadati)

TabulaOpenRefine