1 Facoltà di Ingegneria dellInformazione, Informatica e Statistica Dip. di Informatica e...

Post on 01-May-2015

215 views 0 download

Transcript of 1 Facoltà di Ingegneria dellInformazione, Informatica e Statistica Dip. di Informatica e...

1

Facoltà di Ingegneria dell’Informazione, Facoltà di Ingegneria dell’Informazione, Informatica e StatisticaInformatica e Statistica

Dip. di Informaticae Sistemistica A. Ruberti

Dip. di Ing. Dell’Informazione,

Elettronica e Telecomunicazioni

Dipartimento diInformatica

Dipartimento diScienze Statistiche

Paolo Franciosapaolo.franciosa@uniroma1.it

2

Sai ched'è la statistica? E' 'na cosache serve pe' fa' un conto in generalede la gente che nasce, che sta male,che more, che va in carcere e che sposa.

Ma pe'  me la statistica curiosaè dove c'entra la percentuale,pe' via che, lì, la media è sempre egualepuro c'o' la persona bisognosa.

Me spiego, da li conti che se fannoseconno le statistiche d'adessorisurta che te tocca un pollo all'anno:

e, se nun entra ne le spese tue,t'entra ne la statistica lo stessoperchè c'é un antro che se ne magna due.

Trilussa

La StatisticaLa StatisticaNON è solo questo!NON è solo questo!

Elaborare informazione

Comunicare informazione

Assumere decisioni

Gestire operazioni complesse

–Strumento di decisione in condizioni di incertezza

Raccogliere, organizzare, “far parlare” le informazioni

Statistica:

Offerta formativaOfferta formativa

Laurea

Laurea specialistica

Dottorato di ricerca

Master

I livello

Master

II livello

Corsi di laurea inCorsi di laurea inStatisticaStatistica

• Lauree

• Statistica, economia, finanza e assicurazioni

• Statistica, economia e società

• Statistica gestionale

• Lauree magistrali

• Scienze attuariali e finanziarie

• Scienze statistiche demografiche e sociali

• Scienze statistiche e decisionali

• Scienze statistiche ed economiche

• Scienze statistiche per le strategie aziendali

Ambiti professionali dello statistico (1)

–analisi dei processi demografici

– struttura della popolazione, – logiche della produzione e del consumo, della integrazione e dell’esclusione sociale,– sistemi di protezione socio-sanitari,– previdenza sociale

Profili professionali (2)

– nel settore assicurativo, previdenziale e bancario

– gestione di sistemi assicurativi e previdenziali privati e sociali

– analisi dei mercati finanziari– analisi dei sistemi economici

Riassumendo:

Analisi dei datiper il

supporto alle decisioni

Profili professionali

–analisi dei processi demografici

– struttura della popolazione,

– logiche della produzione e del consumo, della integrazione e dell’esclusione sociale

– sui sistemi di protezione socio-sanitari

– sulla sicurezza sociale

–in grado di inserirsi in

–amministrazioni, aziende, servizi, agenzie ed istituti di ricerca in attività di raccolta di dati ed informazioni di tipo quantitativo e qualitativo necessari alla soluzione di problemi specifici; di utilizzare i sistemi informativi e gli archivi esistenti, redigere rapporti di sintesi di supporto alle decisioni.

Attività principaliAttività principalidello statisticodello statistico

• Analisi dei dati• “Data mining” (identificare relazioni

nascoste)• Gestione del rischio• Misurare significatività esperimenti• Ottimizzare processi

StrumentiStrumenti

• Matematica• Calcolo delle probabilità• Informatica• Scienze applicate (Economia,

sociologia, finanza, …)

Analisi dei dati - Data MiningAnalisi dei dati - Data MiningIndividuare regolaritàPresentare risultati

Statistica “spaziale”Statistica “spaziale”

• Studio di dati e fenomeni legati al territorio

L’impatto del moto ondoso L’impatto del moto ondoso sulla costa è importante per sulla costa è importante per le dinamiche litoranee, le dinamiche litoranee, nonché per la valutazione nonché per la valutazione delle sollecitazioni sui porti e delle sollecitazioni sui porti e le strutture costiere.le strutture costiere.

Le ondeLe onde

Inoltre il moto ondoso è il maggior responsabile dell’erosione costiera e delle sollecitazioni che avvengono sulle strutture marine fisse o flottanti

Dinamica delle ondeDinamica delle ondeLe altezze d’onda si misurano in acque profonde per evitare gli effetti dovuti alla batimetria, sotto costa l’onda frange e aumenta la propria altezza….

Modello di previsioneModello di previsionedell’intensità delle ondedell’intensità delle onde

Modelli spaziali: distribuzione dei giovanili (Kriging Bayesiano)

Medits 1996

Medits 2004

Grund 1996

Grund 2004

Sviluppo applicazioni GIS: PESCA

““Modelli” ….Modelli” ….La matematica per descrivere fenomeni!La matematica per descrivere fenomeni!

Modello lineare generalizzato

Modello additivo generalizzato

Modello additivo generalizzato Bayesiano

Esempio: contare …Esempio: contare …

–Quanti esemplari di una specie animale ci sono in una certa zona?

–Non possiamo osservarli tutti!

“stimiamo”il numero

Modello:Modello:urna di contenuto ignotourna di contenuto ignoto

–Quanti biglie ci sono nell’urna?• estraggo 10 biglie• le contrassegno e le reinserisco nell’urna• mescolo ….• riestraggo 10 biglie e le osservo

cosa deduco?

L’InformaticaL’InformaticaNON è solo questo!NON è solo questo!

InformaticaInformatica

Gestione dell’informazione:

• Basi di dati• Sviluppo di sistemi software• Sicurezza• Robotica• Trasmissione dell’informazione (reti di computer)• Rappresentazione dell’informazione• Aspetti teorici (decidibiità, complessità)

Esempio: rappresentare una Esempio: rappresentare una rete stradalerete stradale

Struttura:

• punti (piazze, incroci, …)• segmenti che uniscono punti

Altre “reti”Altre “reti”

• internet - computer uniti da collegamenti• web - pagine web con link ipertestuali• reti sociali (p.es. Facebook) - persone unite da “amicizia”• traffico telefonico - utenti uniti dalle chiamate• …….

Problema: trovare cammino più Problema: trovare cammino più breve tra due punti della retebreve tra due punti della rete

Come calcolare il cammino più Come calcolare il cammino più breve da A a B?breve da A a B?

Soluzione ingenua:tento tutti i percorsi possibili da A a Be scelgo il migliore

Quanto tempo impiego? (ho 1.000.000 di PC a 100 GHz!!!!!)Se la rete stradale ha 100 puntie da ogni punto partono 5 strade …

1.000.000.000.000.000.000.000. 000.000.000.000.000.000.000.000 anni

Come calcolare il cammino più Come calcolare il cammino più breve?breve?

a

b

Come calcolare il cammino più Come calcolare il cammino più breve da A a B?breve da A a B?

a

b

Metodo (leggermente) più astuto:Algoritmo di Dijkstra

Motori di ricercaMotori di ricerca

Un motore di ricerca (Google, Yahoo, …)permette di trovare le pagine web che contengono le parole richieste …

… ordinate per “utilità” (autorevolezza)

Come si determina l’Come si determina l’autorevolezzaautorevolezza di una pagina web?di una pagina web?

Si deve risolvere un

ENORME sistema di equazioni lineari

36

Problema: verificare se due Problema: verificare se due filefile sono identicisono identici

archivio

Sede di Roma

Sede di Milano

Sono uguali? archivio

37

SoluzioniSoluzioni

Trasferisco il file da Roma a Milano e lo confronto• tempo di trasferimento elevato• possibili errori di trasmissione (se il file è grande …)

Scelgo dei frammenti a caso, trasferisco i frammenti e li confronto• se le differenze sono altrove non me ne accorgo

Calcolo un “numero” sufficientemente grande X a partire dal file A (a Roma)Applicando lo stesso procedimento, calcolo il numero Y a partire dal file B (a Milano)Trasferisco il numero X da Roma a Milano e lo confronto con Y

• trasferisco solo il numero (p.es. 100 cifre)• se X e Y sono uguali, allora quasi sicuramente A e B sono uguali

38

Quasi sicuramente …Quasi sicuramente …

Se il numero derivato dal file ha 100 cifre, la probabilità di dare una risposta non corretta è

1 su 10100