Gestione e condivisione di basi di dati e conoscenzacena/materiale/GestioneDB/Intro.pdf2 7 Data...
Transcript of Gestione e condivisione di basi di dati e conoscenzacena/materiale/GestioneDB/Intro.pdf2 7 Data...
1
Gestione e condivisione di basi di dati e conoscenza
Modulo 2
Federica [email protected]
Federica Cena2
Orario del corsop martedi o mercoledi (A SECONDA DEL GRUPPO)
10.00-13.00 AULA li5p Mercoledi 16.00-19.00 AULA H1p Da mercoledi 7 novembre 2018 a mercoledi 19
dicembrep TOTALE ORE 36
Federica Cena3
Esame
n Presentazione di un progetto: discussionen Domande di teoria su tutto il programma
n gruppi di due persone massimon dividervi già adesso in gruppi in modo da seguire piu’
agilmente il corso (progetto costruito via via durante il corso)
n à possibilità di consegne di parte del progetto durante il corso
Federica Cena4
Testip A. Rezzani, Business Intelligence, Apogeoà capitoli 1-5-9
p C. Berry, B. Linoff: Data mining, Apogeo 2003à capitolo 1 e 5 oppure Tan, Steinbach, Kumar: Introduction to
Data Mining, AddisonWesley, 2006. http://www.uokufa.edu.iq/staff/ehsanali/Tan.pdfCap 1, Cap 4: fino a sez 4.3, Cap 9: sez 9.1
Federica Cena5
Slidesp http://www.di.unito.it/~cena/teaching.html
Federica Cena6
Ricevimento
p su appuntamento via email
2
7
Data Sciencep l'insieme di principi metodologici e tecniche
multidisciplinari volto a interpretare ed estrarre conoscenza dai dati.
p I metodi della scienza dei dati si basano su tecniche proveniente da varie discipline, principalmente da statistica e informatica, in particolar modo nei seguenti sottodomini: intelligenza artificiale (machinelearning), basi di dati e data visualization.
8
Data Science
p Il ruolo di scienziato dei dati è stato definito dalla «Harvard Business Review» come "la professione più sexy del ventunesimo secolo" ed è considerato uno dei quattro ruoli chiave preposti all'utilizzo sistematico dei big data nelle aziende.
9
Chi è il Data Scientist?p Data Analyst: le competenze richieste
sono in primis la capacità di estrarre dati da database MySQL, gestire tabelle pivot in Excel (OLAP), produrre visualizzazioni di base, gestire gli Analytics.
p base di ingegneria del software, competenze statistiche, metodi di data minng e Machine Learning
10
Claudio Schifanella - Informatica applicata alla comunicazione multimediale
11
Computational social sciencep concerned with computational approaches to
the social sciences. This means that computers are used to model, simulate, and analyze social phenomena. Fields include computational economics, computational sociology, , and the automated analysis of contents, in social and traditional media. It focuses on investigating social and behavioral relationships and interactions through social simulation, modeling, network analysis, and media analysis
12
3
Computational social sciencep un nuovo approccio allo studio dei fenomeni
sociali, che utilizza molteplici tecniche computazionali quali data mining, l’elaborazione del linguaggio naturale, il e la visualizzazione dei dati. L’obiettivo e’ quello di comprendere le interazioni sociali attraverso l’utilizzo massivo e computazionale dei big data: un approccio emergente, che sfrutta le milioni di tracce digitali che quotidianamente lasciamo in rete per esplorare in modo esplicativo, ma anche predittivo, la realta’
p https://www.youtube.com/watch?v=SekFnluOOmc 13
Data Sciencep l'insieme di principi metodologici e tecniche
multidisciplinari volto a interpretare ed estrarre conoscenza dai dati.
14
Corsi collegatip Analisi dei Dati à Renzo Carriero 3 anno
ICTp SOCIAL MEDIA ANALYSIS E BIG DATA à
Giuseppe Tipaldo, 2 anno CIMEp Apprendimento automatico à Rosa Meo,
Specialistica a informaticap Master UNITO in Analisi Dati per la
Business Intelligence e Data Science
15
Dati Informazione Conoscenzap Dati: elemento conoscitivo minimo
costituito da simboli (Shannon, 1948) àderivano dall’osservazione10138
p Informazione: risultato dell’elaborazione di piu’ dati à acquisizione di un significato sulla base di un contesto
p 10138 à cap, numero abitanti di una citta, PIN ..
16
Dati Informazione Conoscenzap Conoscenza: uso di un certo numero di
informazioni per attuare certe azioni dopo interpretazione, valutazione(ad esempio, risolvere un problema, rispondere ad una domanda)10138 à quanti abitanti ci sono nel quartiere con cap?
p à in base all’esperienza la conoscenza viene rivisitata
17
p Gestione e condivisione di basi di dati e di conoscenza
p Gestione:acquisizione, modellazione, elaborazione, conservazione di dati in forma strutturata
p Condivisione: rendere i dati fruibili ad altre persone (open) e macchine (semantic web)
18
4
Federica Cena19
Business Intelligencemetodi e strumenti per convertirep dati in informazioni p informazioni in conoscenzap conoscenza in piani di sviluppo
(D. Loshin 2003)
20
21 22
Federica Cena23
Gestione e condivisione di basi di dati e di conoscenza
L'obiettivo del corso è quello di fornire una panoramica delle metodologie e applicazioni informatiche avanzate maggiormente utilizzate
n per strutturare datip Data base (Microsoft access, Mysql) (CORSO
CONSOLE)p Data warehouse (Microsoft access, Mysql)
n per analizzare datip OLAP (Online Analytical Processing) (SPSS, Excell,
SQL Server analitics, etc)p DATA MINING (Weka)
Federica Cena-
24
Gestione e condivisione di basi di dati e di conoscenzaConoscere e saper applicare le tecniche di
modellizzazione semantica della conoscenza
Conoscere gli open data ed essere in grado di pubblicare dati come open, oltre che usare le banche dati open esistenti
5
Federica Cena25
Programma del corsop Prima parte
nData warehousing e analisi OLAPnData mining
Federica Cena26
Programma del corsop Seconda parte
nSemantic web, ontologie n linked open data
pVisualizzazione di dati
Schematizzando il corso
27
data base(1 modulo)
data warehouse OLAP data mining
Strutturazione dei dati Analisi dei dati
Schematizzando il corso
28
Linked (open) data (rdf) Ontologie
(Owl)
Strutturazione dati à conoscenza
Visualizzazione di dati