Gestione e condivisione di basi di dati e conoscenzacena/materiale/GestioneDB/Intro.pdf2 7 Data...

5
1 Gestione e condivisione di basi di dati e conoscenza Modulo 2 Federica Cena [email protected] Federica Cena 2 Orario del corso p martedi o mercoledi (A SECONDA DEL GRUPPO) 10.00-13.00 AULA li5 p Mercoledi 16.00-19.00 AULA H1 p Da mercoledi 7 novembre 2018 a mercoledi 19 dicembre p TOTALE ORE 36 Federica Cena 3 Esame n Presentazione di un progetto: discussione n Domande di teoria su tutto il programma n gruppi di due persone massimo n dividervi già adesso in gruppi in modo da seguire piu’ agilmente il corso (progetto costruito via via durante il corso) n à possibilità di consegne di parte del progetto durante il corso Federica Cena 4 Testi p A. Rezzani, Business Intelligence, Apogeo à capitoli 1-5-9 p C. Berry, B. Linoff: Data mining, Apogeo 2003 à capitolo 1 e 5 oppure Tan, Steinbach, Kumar: Introduction to Data Mining, AddisonWesley, 2006. http://www.uokufa.edu.iq/staff/ehsanali/Tan.pdf Cap 1, Cap 4: fino a sez 4.3, Cap 9: sez 9.1 Federica Cena 5 Slides p http://www.di.unito.it/~cena/teaching.html Federica Cena 6 Ricevimento p su appuntamento via email p [email protected]

Transcript of Gestione e condivisione di basi di dati e conoscenzacena/materiale/GestioneDB/Intro.pdf2 7 Data...

Page 1: Gestione e condivisione di basi di dati e conoscenzacena/materiale/GestioneDB/Intro.pdf2 7 Data Science pl'insieme di principi metodologici e tecniche multidisciplinari volto a interpretare

1

Gestione e condivisione di basi di dati e conoscenza

Modulo 2

Federica [email protected]

Federica Cena2

Orario del corsop martedi o mercoledi (A SECONDA DEL GRUPPO)

10.00-13.00 AULA li5p Mercoledi 16.00-19.00 AULA H1p Da mercoledi 7 novembre 2018 a mercoledi 19

dicembrep TOTALE ORE 36

Federica Cena3

Esame

n Presentazione di un progetto: discussionen Domande di teoria su tutto il programma

n gruppi di due persone massimon dividervi già adesso in gruppi in modo da seguire piu’

agilmente il corso (progetto costruito via via durante il corso)

n à possibilità di consegne di parte del progetto durante il corso

Federica Cena4

Testip A. Rezzani, Business Intelligence, Apogeoà capitoli 1-5-9

p C. Berry, B. Linoff: Data mining, Apogeo 2003à capitolo 1 e 5 oppure Tan, Steinbach, Kumar: Introduction to

Data Mining, AddisonWesley, 2006. http://www.uokufa.edu.iq/staff/ehsanali/Tan.pdfCap 1, Cap 4: fino a sez 4.3, Cap 9: sez 9.1

Federica Cena5

Slidesp http://www.di.unito.it/~cena/teaching.html

Federica Cena6

Ricevimento

p su appuntamento via email

p [email protected]

Page 2: Gestione e condivisione di basi di dati e conoscenzacena/materiale/GestioneDB/Intro.pdf2 7 Data Science pl'insieme di principi metodologici e tecniche multidisciplinari volto a interpretare

2

7

Data Sciencep l'insieme di principi metodologici e tecniche

multidisciplinari volto a interpretare ed estrarre conoscenza dai dati.

p I metodi della scienza dei dati si basano su tecniche proveniente da varie discipline, principalmente da statistica e informatica, in particolar modo nei seguenti sottodomini: intelligenza artificiale (machinelearning), basi di dati e data visualization.

8

Data Science

p Il ruolo di scienziato dei dati è stato definito dalla «Harvard Business Review» come "la professione più sexy del ventunesimo secolo" ed è considerato uno dei quattro ruoli chiave preposti all'utilizzo sistematico dei big data nelle aziende.

9

Chi è il Data Scientist?p Data Analyst: le competenze richieste

sono in primis la capacità di estrarre dati da database MySQL, gestire tabelle pivot in Excel (OLAP), produrre visualizzazioni di base, gestire gli Analytics.

p base di ingegneria del software, competenze statistiche, metodi di data minng e Machine Learning

10

Claudio Schifanella - Informatica applicata alla comunicazione multimediale

11

Computational social sciencep concerned with computational approaches to

the social sciences. This means that computers are used to model, simulate, and analyze social phenomena. Fields include computational economics, computational sociology, , and the automated analysis of contents, in social and traditional media. It focuses on investigating social and behavioral relationships and interactions through social simulation, modeling, network analysis, and media analysis

12

Page 3: Gestione e condivisione di basi di dati e conoscenzacena/materiale/GestioneDB/Intro.pdf2 7 Data Science pl'insieme di principi metodologici e tecniche multidisciplinari volto a interpretare

3

Computational social sciencep un nuovo approccio allo studio dei fenomeni

sociali, che utilizza molteplici tecniche computazionali quali data mining, l’elaborazione del linguaggio naturale, il e la visualizzazione dei dati. L’obiettivo e’ quello di comprendere le interazioni sociali attraverso l’utilizzo massivo e computazionale dei big data: un approccio emergente, che sfrutta le milioni di tracce digitali che quotidianamente lasciamo in rete per esplorare in modo esplicativo, ma anche predittivo, la realta’

p https://www.youtube.com/watch?v=SekFnluOOmc 13

Data Sciencep l'insieme di principi metodologici e tecniche

multidisciplinari volto a interpretare ed estrarre conoscenza dai dati.

14

Corsi collegatip Analisi dei Dati à Renzo Carriero 3 anno

ICTp SOCIAL MEDIA ANALYSIS E BIG DATA à

Giuseppe Tipaldo, 2 anno CIMEp Apprendimento automatico à Rosa Meo,

Specialistica a informaticap Master UNITO in Analisi Dati per la

Business Intelligence e Data Science

15

Dati Informazione Conoscenzap Dati: elemento conoscitivo minimo

costituito da simboli (Shannon, 1948) àderivano dall’osservazione10138

p Informazione: risultato dell’elaborazione di piu’ dati à acquisizione di un significato sulla base di un contesto

p 10138 à cap, numero abitanti di una citta, PIN ..

16

Dati Informazione Conoscenzap Conoscenza: uso di un certo numero di

informazioni per attuare certe azioni dopo interpretazione, valutazione(ad esempio, risolvere un problema, rispondere ad una domanda)10138 à quanti abitanti ci sono nel quartiere con cap?

p à in base all’esperienza la conoscenza viene rivisitata

17

p Gestione e condivisione di basi di dati e di conoscenza

p Gestione:acquisizione, modellazione, elaborazione, conservazione di dati in forma strutturata

p Condivisione: rendere i dati fruibili ad altre persone (open) e macchine (semantic web)

18

Page 4: Gestione e condivisione di basi di dati e conoscenzacena/materiale/GestioneDB/Intro.pdf2 7 Data Science pl'insieme di principi metodologici e tecniche multidisciplinari volto a interpretare

4

Federica Cena19

Business Intelligencemetodi e strumenti per convertirep dati in informazioni p informazioni in conoscenzap conoscenza in piani di sviluppo

(D. Loshin 2003)

20

21 22

Federica Cena23

Gestione e condivisione di basi di dati e di conoscenza

L'obiettivo del corso è quello di fornire una panoramica delle metodologie e applicazioni informatiche avanzate maggiormente utilizzate

n per strutturare datip Data base (Microsoft access, Mysql) (CORSO

CONSOLE)p Data warehouse (Microsoft access, Mysql)

n per analizzare datip OLAP (Online Analytical Processing) (SPSS, Excell,

SQL Server analitics, etc)p DATA MINING (Weka)

Federica Cena-

24

Gestione e condivisione di basi di dati e di conoscenzaConoscere e saper applicare le tecniche di

modellizzazione semantica della conoscenza

Conoscere gli open data ed essere in grado di pubblicare dati come open, oltre che usare le banche dati open esistenti

Page 5: Gestione e condivisione di basi di dati e conoscenzacena/materiale/GestioneDB/Intro.pdf2 7 Data Science pl'insieme di principi metodologici e tecniche multidisciplinari volto a interpretare

5

Federica Cena25

Programma del corsop Prima parte

nData warehousing e analisi OLAPnData mining

Federica Cena26

Programma del corsop Seconda parte

nSemantic web, ontologie n linked open data

pVisualizzazione di dati

Schematizzando il corso

27

data base(1 modulo)

data warehouse OLAP data mining

Strutturazione dei dati Analisi dei dati

Schematizzando il corso

28

Linked (open) data (rdf) Ontologie

(Owl)

Strutturazione dati à conoscenza

Visualizzazione di dati