D2I- Integrazione, Warehousing e Mining di sorgenti eterogenee Francesco Buccafurri, Luigi Palopoli,...

download D2I- Integrazione, Warehousing e Mining di sorgenti eterogenee Francesco Buccafurri, Luigi Palopoli, Domenico Rosaci, Giorgio Terracina, Domenico Ursino.

If you can't read please download the document

Transcript of D2I- Integrazione, Warehousing e Mining di sorgenti eterogenee Francesco Buccafurri, Luigi Palopoli,...

  • Slide 1
  • D2I- Integrazione, Warehousing e Mining di sorgenti eterogenee Francesco Buccafurri, Luigi Palopoli, Domenico Rosaci, Giorgio Terracina, Domenico Ursino SIPE Prototipo per lestrazione di propriet inter-sorgente
  • Slide 2
  • Estrazione di Propriet inter-sorgente Le propriet intersorgente considerate sono: Sinonimie Omonimie Similarit tra sotto-sorgenti
  • Slide 3
  • Rappresentazione delle sorgenti Data una sorgente S, la SDR-Network Net(S) associate Net(S) = N(S) rappresenta linsieme dei nodi; ciascun nodo e associato ad un concetto ed e caratterizzato dal nome del concetto che rappresenta A(S) indica un insieme di archi; ciascun arco rappresentato dalla tripletta ed indica una relazione tra concetti x il nodo sorgente, y il nodo target, L xy = [d xy, r xy ] unetichetta associata allarco d xy rappresenta la distanza semantica r xy indica la rilevanza semantica
  • Slide 4
  • Esempio
  • Slide 5
  • Estrazione delle propriet inter-sorgente Estrazione di Sinonimie ed omonimie Per derivare la similarit tra due concetti C1 and C2, si analizzano i due concetti ed i loro vicinati Linfluenza della similarit tra i vicinati di C1 e C2 nel calcolo della similarit tra C1 e C2 inversamente proporzionale alla distanza dei vicinati dai concetti in considerazione La similarit tra i vicinati ottenuta calcolando una funzione obiettivo associata ad un problema di maximum weight matching; il matching calcolato su un grafo bipartito costruito a partire dallinsieme dei nodi appartenenti ai vicinati I coefficienti di distanza semantica e di rilevanza semantica sono utilizzati per pesare limportanza (relativa) di ciascun concetto allinterno della sorgente
  • Slide 6
  • Estrazione di propriet inter-sorgente Estrazione di similarit tra sotto-sorgenti La similarit tra due sotto-sorgenti ottenuta calcolando una funzione obiettivo associata ad un problema di maximum weight matching; il matching calcolato su un grafo bipartito costruito a partire dai nodi che compongono la sotto-sorgente Tuttavia, il numero di possibili sotto-sorgenti esponenziale nel numero dei nodi in Net(S) Attraverso luso di tecniche che tengono conto delle similarit tra i singoli concetti delle sorgenti si seleziona un numero polinomiale di sotto-sorgenti promettenti da analizzare
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14