Post on 15-Jan-2015
description
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semantiche
Relatore:Chiar.mo Prof. Giovanni SemeraroLaureando:dott. Marco de Gemmis Cataldo Mustodott. Pasquale LopsUniversità degli Studi di Bari – Facoltà di Scienze MM.FF.NN.
Corso di Laurea Specialistica in Informatica – a.a 2006/2007
Sommario Estensione di un sistema di
raccomandazione Motivazioni
Web 2.0 Folksonomie
Implementazione del modello Estensione del modello di training Integrazione delle folksonomie nei profili
utente Sperimentazione
Commenti e sviluppi futuri
2/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Sistemi di raccomandazione Obiettivo
Apprendere i gusti dell’utente in uno specifico dominio e suggerirgli altri “oggetti” cui potrebbe essere interessato
ITR – Item Recommender Realizzato dall’Università di Bari Approccio Content-Based
Accuratezza predittiva soddisfacente Eredita alcuni limiti dei modelli content-based
3/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Motivazioni Limiti
In assenza di contenuto testuale, il sistema non può fornire raccomandazioni
Contenuto testuale di cattiva qualità può portare a un peggioramento dell’accuratezza predittiva
Raccomandazioni simili a contenuti precedentemente graditi dall’utente Bassa probabilità di ottenere raccomandazioni “sorprendenti”
Necessità di migliorare il modello originario del sistema di raccomandazione Eliminazione dei limiti del modello content-
based Integrazione di elementi di innovatività
Ricerca di sovrapposizioni con l’area del Web 2.0
4/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Annotazione dei contenuti della Rete Web 2.0
Sistemi di Tagging Collaborativo
Concetto chiave: Tagging L’utente fruisce contenuti (foto, video, audio, testi,
ecc.) Associa a queste risorse delle parole chiave, dette tag Tag
Vocabolario libero Informazione sul contenuto, sul contesto o percezione
soggettiva
La stessa risorsa può essere annotata da vari utenti Al crescere degli utenti, cresce anche il numero dei tag
associati ad una risorsa
5/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Folksonomie (1) L’insieme dei tag associati ad una risorsa
prende il nome di folksonomia La folksonomia è una struttura lessicale Emerge dalle annotazioni collaborative degli utenti
es) Immaginiamo come risorsa un brano musicale
6/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Folksonomie (2) Punti di forza
Ci fornisce informazioni sul modello mentale degli utenti Cosa gli utenti “vedono” in ciò che fruiscono
Associa una semantica ai contenuti della Rete Semantica collaborativa, non espressa formalmente
Una folksonomia ci permette di acquisire delle informazioni sul contenuto associato ad una risorsa
Riflessione La correlazione tra tag e contenuto associato ad una
risorsa ci riporta alle motivazioni che avevano giustificato la necessità di estendere il modello
7/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Estensione del modello di ITR Assunzione
I tag non sono dei semplici metadati, forniscono informazioni sul contenuto
Intuizione Quando il contenuto non è disponibile o non è affidabile,
si può sfruttare l’informazione lessicale fornita dai tag
Vantaggi Ci permette di ovviare al problema dell’assenza di
contenuti testuali Si utilizzano i tag forniti dalla comunità come “contenuto” che descriva
gli oggetti raccomandabili Riduce il “peso” di contenuti testuali di cattiva
qualità Probabile miglioramento dell’accuratezza predittiva
Diversifica potenzialmente le raccomandazioni Il set di termini che descrivono l’oggetto è dinamico, si evolve
assieme alle annotazioni fornite dagli utenti
8/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Scenario Raccomandazione di beni museali
Pinacoteca Vaticana Oggetti descritti da contenuto testuale
Titolo, Autore, Descrizione Necessità di raccogliere un set di tag che modelli le
opere
Come raccogliere una massa sufficiente di tag? Integrando dei meccanismi di collaboratività nel
modello di raccomandazione Coinvolgendo gli utenti nell’annotazione degli oggetti Estensione del modello di addestramento
9/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Modello di addestramento
Si è previsto che l’utente, assieme al
voto, potesse assegnare dei tag
descrittivi
Si è previsto che l’utente, assieme al
voto, potesse assegnare dei tag
descrittivi
10/16
Assegnazione del rating – Classico modello di
addestramento
Assegnazione del rating – Classico modello di
addestramento
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Contenuti testualiContenuti testuali
Disambiguazione dei contenuti Terminata la procedura di addestramento,
abbiamo a disposizione l’insieme dei tag con cui l’utente ha annotato le opere gradite
Per eliminare problemi di sinonimia, polisemia, ecc. il set dei tag è stato sottoposto ad una procedura di disambiguazione Passaggio dal Tag al concetto espresso da
quel tag Passaggio da Folksonomie a Folksonomie
Semantiche
11/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Integrazione delle folksonomie Come integrare nei profili l’informazione
aggiuntiva ? Individuazione di due modelli di profilazione
Personal Tags Confluiscono nel profilo dell’utente 1 i tag virgin, crowning, christ
Social Tags Il profilo viene arricchito dai tag utilizzati dalla comunità, al
profilo vengono aggiunti i tag madonna, panel, cross, deposition
12/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Integrazione delle folksonomie13/16 Intuizione
Se a due utenti piacciono gli stessi oggetti, per certi versi condividono lo stesso modello mentale
L’informazione lessicale fornita da utenti con lo stesso modello mentale può essere condivisa collaborativamente
Si sfrutta il lessico fornito da utenti con gusti simili per arricchire la terminologia contenuta nel proprio profilo
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Sperimentazione Campione di trenta utenti Valutazione del nuovo modello di ITR Confronto tra tre classi di profili
Content-based Titolo, Autore, Descrizione dell’opera
Content + Personal Tags, Content + Social Tags
Metriche adottate: Precision e Recall
Quesito Un modello di raccomandazione content-
based può trarre vantaggio dall’integrazione di elementi di collaboratività ?
14/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
Risultati emersi 15/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto
L’informazione lessicale proveniente dai tag migliora la precision di ITR del 2.5%
L’approccio basato sui Social Tag, su training set piccoli, migliora la recall di ITR del 13%
+2,5%
+13%
Conclusioni L’integrazione in un modello di
raccomandazione dell’informazione proveniente da annotazioni collaborative è un fattore in grado di migliorare l’accuratezza predittiva del sistema Modello innovativo, mai sperimentato finora I primi riscontri hanno sottolineato la bontà
dell’approccio presentato
Modello proposto nell’ambito delle attività del progetto CHAT Sviluppo di una piattaforma per la fruizione
personalizzata di beni museali
16/16
Estensione di un modello di raccomandazione content-based mediante integrazione di folksonomie semanticheCorso di Laurea Specialistica in Informatica – 23 aprile 08 – Cataldo Musto