Data Driven Innovation: sfide e opportunità

20
Data Driven Innovation: sfide e opportunità Paolo Atzeni Dipartimento di Ingegneria Università Roma Tre

Transcript of Data Driven Innovation: sfide e opportunità

Page 1: Data Driven Innovation: sfide e opportunità

Data Driven Innovation: sfide e opportunità

Paolo AtzeniDipartimento di Ingegneria

Università Roma Tre

Page 2: Data Driven Innovation: sfide e opportunità

Dati e Big Data

• Perché ci interessano?

George H.L. Mallory (Mobberley, 1886 – Everest, 1924)

20/05/2016 2

Page 3: Data Driven Innovation: sfide e opportunità

Big data: i dati sono proprio tanti

• Quanti dati ci sono al mondo?(fonte: IDC)– 160 Exabyte, 2006 (1EB = 1018B)– 4.4 Zettabyte, 2013 (1ZB = 1021B)– 44 Zettabyte previsti nel 2020

• Zettabyte: 1,000,000,000,000,000,000,000 byte– Un miliardo di dischi da 1TB, se li mettiamo uno sull'altro (e

ognuno è alto 1cm) abbiamo una pila alta 10mila km• Quanti dati sono prodotti in un giorno?

– Facebook (ricerche varie su Internet): 500 TB

20/05/2016 3

Page 4: Data Driven Innovation: sfide e opportunità

Le quattro V dei Big Data

• Volume• Velocity• Variety• Veracity

20/05/2016 4

Page 5: Data Driven Innovation: sfide e opportunità

Le cinque V dei Big Data

• Volume• Velocity• Variety• Veracity• Value

• "Data is not information, information is not knowledge, knowledge is not understanding, understanding is not wisdom" (Cliff Stoll)

20/05/2016 5

Page 6: Data Driven Innovation: sfide e opportunità

20/05/2016 6

Dati e informazioni

• Interessano alle persone curiose• Mi hanno sempre affascinato, fin da quando ero bambino …

Page 7: Data Driven Innovation: sfide e opportunità

La mia prima fonte di informazioni (1962-63)

20/05/2016 7

Page 8: Data Driven Innovation: sfide e opportunità

Le prime informazioni che ho memorizzato

20/05/2016 8

Page 9: Data Driven Innovation: sfide e opportunità

E ho continuato così per anni

20/05/2016 9

Page 10: Data Driven Innovation: sfide e opportunità

I dati nello sport

• I dati che io raccoglievo non servivano a niente, se non alla mia curiosità (e alla mia mente contorta …)

• Negli anni, le statistiche si sono sempre più diffuse nello sport e hanno superato il livello della curiosità e raggiunto quello del valore:– Moneyball, libro e film

20/05/2016 10

Page 11: Data Driven Innovation: sfide e opportunità

Moneyball

• Le squadre di baseball, fino al 2002, utilizzavano, per valutare i giocatori, alcune statistiche (batting average, RBI, stolen bases)

• Il protagonista intuisce (e verifca analiticamente) che altre statistiche (slugging percentage, on-base percentage) sono più strettamente correlate al risultato e ingaggia giocatori meno costosi, ottenendo risultati straordinari spendendo poco

• Morale:– I dati si possono utilizzare, ma si deve

sapere quali e come

20/05/2016 11

Page 12: Data Driven Innovation: sfide e opportunità

Qualche anno dopo

• Sono diventato professore (di basi di dati, e quindi i dati sono almeno serviti a darmi da vivere … )

• Nel 1998 ho organizzato un convegno (WebDB) e con la pubblicazione degli atti con una prestigiosa casa editrice

• Uno degli autori, un giovane dottorando di Stanford, era in ritardo con il suo contributo e lo ho sollecitato

20/05/2016 12

Page 13: Data Driven Innovation: sfide e opportunità

20/05/2016 13

• "A company":– Google!

• Morale:– Algoritmi e dati possono avere valore, molto valore, ma si

deve saperlo cogliere

Page 14: Data Driven Innovation: sfide e opportunità

Il valore dei dati

• Capacità di utilizzo e di analisi• Interpretazione:

– eterogeneità di formato, supporto, convenzioni, ...

20/05/2016 14

Page 15: Data Driven Innovation: sfide e opportunità

Supporto e codifica

• Quipu (Inca), da un museo di Lima

20/05/2016 15

Page 16: Data Driven Innovation: sfide e opportunità

20/05/2016 16

Interpretazione dei dati

• che cosa significano questi numeri?• cartelli stradali (in Finlandia, ad esempio); sono orari• ma la differenza?• senza "interpretazione," il dato serve a ben poco

Lun-Ven Sabato Festivo

Page 17: Data Driven Innovation: sfide e opportunità

Il mio tempo è finito, vi ho annoiato ...

• Diamo spazio ai protagonisti veri dell'evento e parliamo davvero di big data (non solo di dati)

• Ascolteremo tante cose interessanti– tecniche, metodologiche, interdisciplinari

• Ne aggiungo una importante:– La gestione dei dati e dei Big data richiede competenze

variegate e interdisciplinari, fra cui quelle fondate su solide basi tecniche

– Le aziende lamentano mancanza di competenze – Le università possono contribuire e molto (e con una visione

a lungo termine, più di altri soggetti)

20/05/2016 17

Page 18: Data Driven Innovation: sfide e opportunità

Percorso Big Data

• Nel Corso di Laurea Magistrale in Ingegneria Informatica dell’Università Roma Tre • Tematiche:

– tecnologie avanzate per le basi di dati– intelligenza artificiale– machine learning– architetture e le tecnologie per i big data– analisi dell’informazione su Web– sicurezza dei sistemi informatici– sviluppo di applicazioni mobili – strumenti per la visualizzazione dell’informazione

• Alcuni corsi in inglese con docenti internazionali di elevata qualificazione • Tutti i corsi prevedono esercitazioni pratiche svolte in laboratori all’avanguardia. • Le aziende più qualificate del settore contribuiscono con progetti congiunti e seminari• Le attività didattiche si svolgono in un campus organizzato e piacevole • Gli studenti hanno a disposizione una nuova biblioteca ed ampi spazi per lo studio. • La mensa universitaria è efficiente e vicina, così come gli impianti sportivi.

20/05/2016 18

Page 19: Data Driven Innovation: sfide e opportunità

Un appello

• Gli investimenti in tecnologia e in formazione, a medio e lungo termine, hanno un ritorno incalcolabile, ma le discontinuità generano danno enormi.

• Le Università del nostro paese (che hanno potenzialità indiscusse, come testimoniato dagli apprezzamenti che molti di noi ricevono in sedi internazionali) sono state oggetto di tagli pesanti negli ultimi anni (potrei mostrarvi i dati …)

• La conseguenza principale è stata l’impossibilità di assumere giovani e questo avrà gravi conseguenze fra qualche anno se non si pone rimedio. Stiamo perdendo una generazione:  abbiamo pochissimi docenti  sotto i quarant’anni.

• L'opinione pubblica sembra non essere consapevole dei rischi che il paese corre, aiutateci a farlo capire!

20/05/2016 19

Page 20: Data Driven Innovation: sfide e opportunità

Buon convegno!

Ringraziamenti

20/05/2016 20