Web scraping e Datawrapper per giornalisti locali

20
Assostampa della Basilicata - Matera - 17/01/2014 MAPPE, INFOGRAFICHE E VISUALIZZAZIONI INTERATTIVE - 2 Alessio Cimarelli @ | jenkin27 Dataninja.it forMedia®

description

Giornata di formazione per giornalisti dedicata al data journalism e organizzata da Assostampa Basilicata e forMedia. Workshop su web scraping (Data Miner) e visualizzazioni interattive su web (Datawrapper). Dati di lavoro: inchiesta Slot Invaders su dataset dell'AAMS.

Transcript of Web scraping e Datawrapper per giornalisti locali

Page 1: Web scraping e Datawrapper per giornalisti locali

AssostampadellaBasilicata-Matera-17/01/2014

MAPPE,INFOGRAFICHEEVISUALIZZAZIONIINTERATTIVE-2

AlessioCimarelli@ |jenkin27 Dataninja.it

forMedia®

Page 2: Web scraping e Datawrapper per giornalisti locali

DATAJOURNALISM&DATAVIZMADEINITALY

nascedall'incontrotraungiornalistadellacartastampata(AndreaNelsonMauro|@ )eunricercatore/giornalistascientifico/sviluppatore(io).

Dataninjanelsonmau

Trattiincomune:passione,curiosità,vogliadiimparare...

Page 3: Web scraping e Datawrapper per giornalisti locali

QUANDOIDATIRACCONTANOSTORIE

ImmaginediMassimoGentile|@ |tmaxgentile bolditalic.com

Page 4: Web scraping e Datawrapper per giornalisti locali

QUANDOIDATIRACCONTANOSTORIEdelcomunediBagnocavallo(Ravenna)

analizzatoevisualizzatodaFrancoMorelli|@Bilancio2013

eccolimoro

Page 5: Web scraping e Datawrapper per giornalisti locali

QUANDOIDATIRACCONTANOSTORIEedellatassadisoggiornonellaprovinciadi

SienaprodottadaAndreaAngeli|@Mappadelturismo

AndAngeli

Page 6: Web scraping e Datawrapper per giornalisti locali

QUANTIPASSIDEVOFARE...Perarrivarealtuocastelloconlafedeeconl'anello,conlapuntadelcoltello?

1. Trovareidatieannusarelanotizia2. Scaricarlietrasformarneilformatoperrenderliutilizzabili3. Pulirli!4. Analizzarli,confrontarlieincrociarliconaltri5. Isolareleinformazionirilevantiescoprirelanotizia6. Comunicarelanotizia(testo,infografiche,viz,app)

Neldatajournalism,infindeiconti,c'èpiùjournalismchedata...

Page 7: Web scraping e Datawrapper per giornalisti locali

GIOCOD'AZZARDO# èun'inchiestacongiunta - sulfenomenodelleslotmachineinItalia...slotinvaders Dataninja f5

...pubblicatainpiùpuntatesu e econunospin-offsu e .

Wired IlSecoloXIXDomaniAndriese CoratoLive

Page 8: Web scraping e Datawrapper per giornalisti locali

PROFUMODINOTIZIEGrandeattenzioneperletematichedelgiocod'azzardo:proteste(NoSlot,SlotMob),regolamenticomunalieregionali,discussionipolitico/fiscali,ecc.

MECCANISMIEREGOLEUn'attivitàcommercialechevogliainstallareslotmachinedevechiederel'autorizzazioneall'AgenziadeiMonopolidiStato.

OPENDATAL'AAMSpubblical' on-line...elencodelleautorizzazioni

Page 9: Web scraping e Datawrapper per giornalisti locali

DOVESONO'STESLOT?Quandosiparladigiocod'azzardo,difontisenetrovanotante,maspessosonoinformazioniglobali,complessive,aggregate.

Nel2013gliitalianihannospesocirca17miliardidieuro

Nel2013inItaliasonostaterilasciatecirca110milaautorizzazioniainstallareslot

Ilnumerodiitalianichesoffronodiludopatiaarrivaaunmilioneemezzo

Macomerispondereaunadomandalocalmenterilevante?

Page 10: Web scraping e Datawrapper per giornalisti locali

IDATIDELL'AAMSEccocosarilascial'AAMSsulsuosito:

Denominazione(WineBarIlVizio)Indirizzo(ViaLoperfido,28)Tipologia(Bar)Dimensione(74mq)Titolare(FabrizioGiandomenico)

Page 11: Web scraping e Datawrapper per giornalisti locali

BELLI,MA...AMateranel2013piùdi100esercizicommercialisonostatiautorizzatidalloStatoainstallareNewsloteVLT.

Tuttiidatisonopubblicatiintretabelleinseriteinaltrettantepagineweb:anchesolocontarlièdifficile!

WEBSCRAPINGÈl'artediestrarreinformazionistrutturatedallepagineweb:

daunatabellaHTMLaunfogliodicalcolo...concuifareicalcoli!

Page 12: Web scraping e Datawrapper per giornalisti locali

PILLOLEDITECNOLOGIEWEBTuttociòchesivededelwebèilrisultatoditrelinguaggi.

HTML<html><head><title>Box</title></head><body><divid="box"></div></body></html>

CSSbody{width:50%;margin:auto;font-family:Arial,sans-serif;color:black;}

JAVASCRIPTdocument.getElementById("box").onclick=function(e){alert("Boxclicked!");}

Ilprimodescrivelastruttura,ilsecondolostile,ilterzoilcomportamento...uncomputercapiscesoloquestilinguaggi!

Page 13: Web scraping e Datawrapper per giornalisti locali

UNATABELLAINUNAPAGINAWEB<table><!--Iniziotabella--><thead><!--Iniziointestazione--><tr><!--Inizioriga--><th>Titolo1</th><th>Titolo2</th></tr><!--Fineriga--></thead><!--Fineintestazione--><tbody><!--Iniziocorpo--><tr><!--Inizioriga--><td>Contenuto1</td><!--Cella1--><td>Contenuto2</td><!--Cella2--><tr><!--Fineriga--></tbody></table>

Page 14: Web scraping e Datawrapper per giornalisti locali

UNATABELLAINUNAPAGINAWEB

Titolo1 Titolo2

Contenuto1 Contenuto2Contenuto3 Contenuto4Contenuto5 Contenuto6

http://www.w3schools.com/html/html_tables.asp

Sitrattadiimparareaparlareconilcomputernellasualingua...ancheagestieconunapessimapronuncia,bastacapirsi!

Page 15: Web scraping e Datawrapper per giornalisti locali

GRATGRATVoglioquellochedicoio,comelodicoio...

madevifare(quasi)tuttotu!

C'èunlinguaggiospecificopernavigareunastrutturaHTML,incuiindicareedacuiestrarreconprecisionechirurgicaleinformazionichesidesiderano

XPATHhttp://www.w3schools.com/xpath/

Page 16: Web scraping e Datawrapper per giornalisti locali

ILMINATOREDEIDATI

PluginperChrome: .http://dtnj.it/dataminer

Page 17: Web scraping e Datawrapper per giornalisti locali

MINATORIALLESLOTApplicando

http://dtnj.it/dataminera

http://dtnj.it/ddjmateraaams

siottiene

http://dtnj.it/ddjmaterasheete

http://dtnj.it/ddjmateragft

Page 18: Web scraping e Datawrapper per giornalisti locali

SCRIVIAMOILPEZZOOcchiello

TitoloSommarioAttaccoNotiziaCorpoChiusa

Tuttocomealsolito,peròquestavoltaabbiamodatienumeri.

Lipossiamoraccontareaparoleoppurevisualizzarli.

Page 19: Web scraping e Datawrapper per giornalisti locali

DATAWRAPPERIdeatoesviluppatodagiornalistitedeschi(etradottoinitalianodadataninja),èunserviziogratuitoperprodurregraficiinterattiviinsoli4passi:

1. Caricaidati2. Verificaedescrivi3. Visualizza4. Pubblicaedesporta

Ottimotutorial: .

http://datawrapper.it/

http://docs.datawrapper.de/it/tutorial/

Page 20: Web scraping e Datawrapper per giornalisti locali

THAT'SALL,FOLKS!

@[email protected]

http://about.me/alessio.cimarelli

WWW.DATANINJA.IT| https://slid.es/dataninja http://slideshare.net/dataninja