Grosso batini

78
Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali Riccardo Grosso Trattamento dati nelle imprese Università degli studi di Torino – Corso di laurea in Fisica maggio 2006

Transcript of Grosso batini

Page 1: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Riccardo Grosso

Trattamento dati nelle imprese

Università degli studi di Torino – Corso di laurea in Fisicamaggio 2006

Page 2: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Le attività di recupero e integrazione della

conoscenza concettuale sui dati PAAzioni di medio termine

Prof. Carlo BatiniUniversità Bicocca - Milano

Page 3: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

ContenutiContenuti

Perché la modellazione concettuale dei dati è importante nei processi produttivi del CSI-Piemonte

Attività in corso

Primi risultati

Page 4: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

IL CSI Piemonte …

Gestisce circa 500 basi di dati di interesse di un vasto insieme di amministrazioni del PiemonteLe 500 basi di dati sono rappresentate nella grande generalita’ con schemi logici o fisici relazionaliPercio’:

La risorsa informazione e’ nascosta, in quanto rappresentata solo nei suoi aspetti tecnologiciLa risorsa informazione e’ rappresentata in modo non integrato ed eterogeneo nelle 500 basi di dati.

Page 5: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

L’informazione negli schemi e’ nascosta ……

DATA DIVISION.WORKING-STORAGE SECTION.01 PERSONA.05 UOMo.10 COD-UOMO PIC X(5).10 DESC-UOMO PIC X(80).05 DONNA REDEFINES UOMO.10 TIPO-RECORD PIC X.10 COD-DONNA PIC 9(5).10 DESC-DONNA PIC X(80).01 AMMINISTRAZIONE.05 REGIONE.10 COD-REGIONE PIC X(3).10 COD-DUMMY PIC X(6).10 DES-REGIONE PIC X(80).05 PROVINCIA REDEFINES REGIONE.10 COD-REGIONE PIC X(3).10 COD-PROVINCIA PIC X(3).10 COD-DUMMY2 PIC X(3).10 DES-PROVINCIA PIC X(80).05 COMUNE REDEFINES REGIONE.10 COD-REGIONE PIC X(3).10 COD-PROVINCIA PIC X(3).10 COD-COMUNE PIC X(3).10 DES-COMUNE PIC X(80).01 PERSONA-AMMINISTRAZIONE.05 LEGAME.10 COD-PERSONA PIC X(5).10 COD-AMMIN PIC X(3).

Page 6: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Gli schemi sono non integrati ed eterogenei

Anagrafe residenti

Anagrafe assistiti

Anagrafe soggettifiscali

Archivio dipendenti

Archivio cacciatori

Persona

Codiceprogres-sivo

Codicefiscale

Codicefiscale

Numero tessera sanitaria

Codiceinterno

Page 7: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Visione

Il CSI Piemonte e le Amministrazioni del piemonte sono coinvolte nei processi di eGovernment, sia a livello locale (Piemonte) sia a livello nazionale (cooperazione con le Amministrazioni centrali)Sono percio’ protagonisti nel disegno di cambiamento

Page 8: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Per attuare questo disegno abbiamo bisogno di

1. Un modello per rappresentare gli schemi dati2. Una struttura con cui organizzare gli schemi in un repository3. Una metodologia con cui creare e manutenere il repository in maniera efficiente a partire dalla conoscenza disponibile4. Uno scenario di utilizzazione della conoscenza accumulata5. Uno strumento di supporto

Page 9: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

1. Il modelloIl modello Entita’ Relazione

Page 10: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Generalizzazione

Esempio di schema nel modello Entita’ Relazione

PersonaCodice

Cognome

UomoDonna

ComuneCodiceNomenato

ProvinciaCodiceNome

in in

Le persone si dividono in donne e uomini. Le persone sono descritte da codice e cognomeLe persone sono nate in Comuni, i Comuni sono localizzati in Province e le Province in RegioniComuni, Province e Regioni hanno codice e nome

RegioneCodiceNome

Entita’Relazione Attributo

Page 11: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Dal Cobol,al modello Entita’ Relazione

al linguaggio naturale

PersonaCodice

Cognome

UomoDonna

ComuneCodiceNomenato

ProvinciaCodiceNome

In inRegioneCodiceNome

DATA DIVISION.WORKING-STORAGE SECTION.01 PERSONA.05 UOMo.10 COD-UOMO PIC X(5).10 DESC-UOMO PIC X(80).05 DONNA REDEFINES UOMO.10 TIPO-RECORD PIC X .10 COD-DONNA PIC 9(5).10 DESC-DONNA PIC X(80).01 AMMINISTRAZIONE.05 REGIONE.10 COD-REGIONE PIC X(3).10 COD-DUMMY PIC X(6).10 DES-REGIONE PIC X(80).05 PROVINCIA REDEFINES REGIONE.10 COD-REGIONE PIC X(3).10 COD-PROVINCIA PIC X(3).10 COD-DUMMY2 PIC X(3).10 DES-PROVINCIA PIC X(80).05 COMUNE REDEFINES REGIONE.10 COD-REGIONE PIC X(3).10 COD-PROVINCIA PIC X(3).10 COD-COMUNE PIC X(3).10 DES-COMUNE PIC X(80).01 PERSONA-AMMINISTRAZIONE.05 LEGAME.10 COD-PERSONA PIC X(5).10 COD-AMMIN PIC X(3).

Le persone si dividono in donne e uomini. Le persone sono descritte da codice e cognomeLe persone sono nate in Comuni, i Comuni sono localizzati in Province e le Province in RegioniComuni, Province e Regioni hanno codice e nome

Page 12: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

2. La struttura del repository di schemi

Page 13: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Studio CSI Assinform

Organizzazione

Flusso di dati

Fornisce Fruisce

Riguarda Materia

Page 14: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Noi siamo interessati sia ai flussi che alle basi di dati

OrganizzazioneBase Dati

Flusso di dati

Fornisce Fruisce

AggiornaUsa

Materia

Page 15: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Schema concettuale

Concetto di schema(Entita’/Rel/Generalizzazione)

Metaschema – Versione dettagliata - 1

Organizzazione Schema logicofisico

Flusso di dati

FruisceUsa

Materia/Argomento CSI

Aggiorna

Fornisce

Page 16: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Ma se io ho tanti schemi concettuali, come faccio a dar loro una struttura? Non li posso certo integrare in un unico schema….

Page 17: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Due strumenti concettuali

Integrazione, per “mettere insieme” e “riconciliare”Astrazione, per “capire” e “sintetizzare”

Page 18: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Integrazione (linguaggio naturale)

Schema 1Lavoratori e loro organizzazioniSchema 2Lavoratori, loro citta’ di nascita e relativa area regionaleSchema 3Organizzazioni e regioni dove sono localizzate

•Lavoratori, loro citta’ di nascita e relativa regione•Lavoratori e loro organizzazioni, e, delle organizzazioni, •regioni dove sono localizzate

Page 19: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

L’integrazione: modello Entita’ Relazione

Lavoratore Citta’ Regione

Organizzazione

lavora

nato

in

in

Lavoratore

Organizzazione

Lavoratore Citta’ RegioneArea

Organizzazione

in

in

lavoranato

Page 20: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

L’astrazione (linguaggio naturale)

•Lavoratori, loro citta’ di nascita e relativa regione•Lavoratori e loro organizzazioni, e delle organizzazioni •Regioni dove sono localizzate

•Lavoratori, organizzazioni dove lavorano e riferimenti •geografici di nascita e di localizzazione.

Page 21: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

L’astrazione: modello Entita’ Relazione

LavoratoreRiferimentogeografico

Organizzazione

lavora

in

nato

Lavoratore Citta’ Regione

Organizzazione

lavora

in

nato in

Page 22: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Se le usiamo insieme: integrazione + astrazione

Lavoratore

Organizzazione

Lavoratore Citta’ Regione

Area

Organizzazione

lavora

nato in in

IntegrazioneLavoratore Citta’ Regione

Organizzazione

in

in

in

nato

LavoratoreRiferimentogeografico

Organizzazione

Astrazione

in

in

nato

Page 23: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

La struttura di integrazione - astrazione

Integrazione –Astrazione

LavoratoreRiferimentogeografico

Organizzazione

nato

in

lavora

Lavoratore

Organizzazione

Lavoratore Citta’ Regione

Regione

Organizzazione

lavorain innato

Page 24: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Le abbiamo usate iterativamente ottenendo il repository

Previdenza Giustizia Ambiente Salute

Page 25: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Schemi base e schemi astratti

Schemi astratti

Schemi base

Page 26: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

3. Una metodologia per costruire il repository a partire dalla conoscenza disponibile

Page 27: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Conoscenza disponibile per popolare il repository

Gli schemi logici e fisici della PA Piemontese (PAP) gestiti da Infodir

Circa 500 schemi logici conCirca 18.000 tabelle con Circa 200.000 campi

Gli schemi concettuali della PA centrale (PAC) censiti e organizzati dall’Aipa in un Repository analogo

Circa 5.000 entita’ Circa 10.000 attributiCirca 50 schemi astratti della PA Centrale, organizzati

secondo le operazioni di integrazione astrazione

Page 28: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Facendo cio’ con basso utilizzo di risorse

Se procediamo con una metodologia tradizionale di reverse engineering sui 500 schemi PAP, assumendo due settimane persona a schema, si ha:

Risorse con procedura tradizionale = 0,5 mesi persona * 500 = 25 anni persona

Dovevamo inventarci una metodologia approssimata che ci permetta di ridurre l’uso delle risorse di un ordine di grandezza

Page 29: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Repository PAC – struttura completa

TRASPORTI COMUNICAZIONIPRODUZIONELAVOROCULTURAEDILIZIA

AMBIENTEISTRUZIONESANITA'SICUREZZA GIUSTIZIADIFESAAFFARI ESTERI

ASSICURAZIO- NE SOCIALE

CERTIFICA-

SCHEMA INTEGRATO DELLE BASI DI DATI DELLA PA DI 1° LIVELLO

SCHEMA INTEGRATO DELLE BASI DI DATI DELLA PA DI 2° LIVELLO

SCHEMA INTEGRATO DELLE BASI DI DATI DELLA PA DI 3° LIVELLO

SERVIZI

SERVIZI GENERALI SERVIZI DIRETTISERVIZI SOCIALI ED ECONOMICI

CA

TA

STO

PR

EV

IDE

NZ

A

RE

LA

ZIO

NI

ES

TE

RE

IN

IT

AL

IA

RE

LA

ZIO

NI

ITA

LIA

NE

AL

L' E

ST

ER

O

AT

TIV

ITA

' GIU

RID

ICA

CR

IMIN

AL

ITA

'

SIC

UR

EZ

ZA

IN

TE

RN

A

AS

SIS

TE

NZ

A

SE

RV

IZIO

SA

NIT

AR

IO

IST

RU

ZIO

NE

AM

BIE

NT

E

BE

NI

CU

LT

UR

AL

I

LA

VO

RO

AZ

IEN

DE

AG

RIC

OL

E

AZ

IEN

DE

IN

DU

ST

RA

LI

TR

AS

PO

RT

I

SERVIZI SOCIALI SERVIZI ECONOMICI

TR

ASF

ER

IME

NT

O F

ON

DI

A

EN

TI

LO

CA

LI

PER

EN

TI

PUIB

BL

ICI

CA

PIT

OL

I D

I SP

ESA

STATISTICARISORSE DI SUPPORTO

RISORSE FINANZIARIE

RISORSE STRUMENTALI E IMMOBILIARI

RISORSE UMANE

PRO

TO

CO

LL

O

OR

GA

NI

CO

LL

EG

IAL

I

FISC

O

DO

GA

NE

RISORSE

STR

UM

EN

TI

AU

TO

ME

ZZ

I

BE

NI

IMM

OB

ILI

DIP

EN

DE

NT

I

FOR

MA

ZIO

NE

RA

PPR

ESE

NT

AN

ZE

2/93

2/12 8/

293

6/69

3/18

23/

30

2/89

3/59

2/65

37/3

36

3/75

3/66

9/11

8

4/36

6/53 10

/76 6/

76

6/13

0 5/56

6/15

5 3/13

4

8/21

3

10/1

00 9/11

8

3/53

9/11

2 10/1

78

Page 30: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Lo schema piu’ astratto

BeneSoggetto

Documento

Unitàorganizzativa

Riferimentoterritoriale

Page 31: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

In sintesi

18.000 tabelle

Rappresentazione logico fisica

550 schemiRappresentazione concettuale

Pubblica Amministrazione locale

Pubblica Amministrazione centrale

Page 32: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Schemi descritti nel Repository

Soggetto

Bene Soggetto

Documento

Unitàorganizzativa

Riferimentoterritoriale

S. fisico S. giuridico

Page 33: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Soggetto fisico

pensionato

di guerra

invalidità civile

Ricorrente per invalidità civile

casalinga

volontario

studentestraniero

con handicap

borsista

candidato

Segretario comunale

assistito

tossicodipendente contribuente

utente anagrafetributaria

Contribuente ufficio iva

appartenente catasto

fisco

scuola

giustizia

affari esteri

lavoro

pensioni

Salute ed assistenza

politica

vita sociale

lavoratore

disoccupato

autonomodipendente

Alla ricerca di nuova occupazione

Alla ricerca di prima occupazione

detenuto

condannato

in attesa di giudizio

segnalato

Tossicodipendente segnalato

straniero italiano

residente all’estero

Richiedente cittadinanza

Richiedente visto

47

164

91

161

520

162

163MI, MT, MD

363739

38

40

8289

153

MF, MT

35

48

5998

110

165

174

180526

650

MGG, MI,MIBCA , MT, MTN

MI, MS

6

16

63

72

80

600

66

81

99

1827

735

90

132

142

MAE, MURST, MPI

MAE, MGG,MI

MAE, MI, MLPS

MI

601

507602

1902

453

54

71

74

88

101

104105

160

171603

653

654

663

5292

111170

7

910

1112

20 24 25

4551

5564

65

68

87

93 9697

108120

131137

173

501

506515516

651

19

86136

172

531

656

MAE, MF, MGG, MI,

MIBCA, MLP, MLPS, MT,MTN, MCE,MD, MURST

21

109

Schemi base e Gerachie di generalizzazioneCaso Soggetto fisico

Page 34: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

La gerarchia di soggetto

–soggetto fisico•Lavoro

•lavoratore–lavoratore autonomo–dipendente pubblico

•disoccupato•……

–soggetto giuridico•impresa•istituzione p.a.•Istituzione sociale privata•……

Page 35: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Utlizzeremo percio’ una conoscenza piu’ sintetica: le gerarchie di generalizzazione

Schemi logici

Schemi

concettuali

Pubblica AmministrazioneLocale

Pubblica Amministrazione Centrale

Gerarchie diGeneralizzazione:-Cittadino-Impresa-Organizzazione-Documento-Luogo-Bene

Page 36: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Sintesi della metodologia

Scopo della metodologia: semplificare il compito del referente dati, utilizzando il piu’ possibile strumenti automatici, a costo di una certa approssimazione nelle scelte.Assunzione: ad un certo livello di astrazione gli schemi della PAL Piemontese sono “simili” a quelli della PA Centrale. Si differenziano nei livelli di astrazione piu’ bassi.

Page 37: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Le due fasi della metodologia

Fase automatica

Schemascheletro

Schemafinale

Fasemanuale

Referente dati competentesul dominio

Page 38: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Fase automatica: generazione entita’1-GENERAZIONE ENTITA'

input:a) le entita' delle ontologieb) le tavole della base dati

output:x) le tavole "pescate" dall'algoritmoy) le entita' delle ontologie corrispondenti alle tavole pescate in x

ALGORITMO: - PER OGNI ENTITA' DELLE ONTOLOGIE (LOOP) - PER OGNI TAVOLA DELLA BASE DATI - SE C'E' ALMENO 1 ATTRIBUTO DELLA TAVOLA CHE SIA"SOMIGLIANTE" AL NOME DELL'ENTITA' DELL'ONTOLOGIA - SCELGO L'ENTITA' - ENDIF - END LOOP - END LOOP

SOMIGLIANTE = LIKE "STRINGA" IN NOME E/O DESCRIZIONE ATTRIBUTO

Page 39: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Passo 1: Generazione entita’

…..Attributi eTabelle

Gerarchie

E1

PA Piemontese

PA Centrale

Page 40: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Generazione entita’Ricerca per somiglianza

…..

Attributi eTabelle degliSchemi logici

Gerarchie

E1

PA Piemontese

PA Centrale

Page 41: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Generazione entita’passo finale

E1

E2

E3

Attributi eTabelle

E1

E2

E3

…..

PA Centrale

PA Piemontese

Page 42: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Generazione generalizzazioni2-GENERAZIONE GENERALIZZAZIONI

input:a) le entita' trovate in generazione entita'b) le tavole trovate in generazione entita'

output:x) le generalizzazioni delle entita'y) le generalizzazioni delle tavole

algoritmo:- osservando le generalizzazioni complete delle entita' delle ontologie,riporto quelle presenti nelle entita' selezionate in generazione entita'- per analogia, le tavole corrispondenti alle entita' "sposano" le medesimegeneralizzazioniCon un esempio astratto, se ho una ontologia completaA B C D E

Page 43: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Generazione generalizzazionise precedentemente ho selezionato A, B, D le generalizzazioni trovatesarannoA B D

Se avevamo corrispondenza tra A e TAV1, B e TAV2, D e TAV4, avremo lagerarchia di generalizzazione tavole:TAV1 TAV2 TAV4

Page 44: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Generazione relazioni3-GENERAZIONE RELAZIONI

input:a) le entita' selezionate ai passi precedenti

output:x) le relazioni tra le entita' selezionate

algoritmo:- per ogni entita' delle ontolologie selezionata (loop) - cerco nei 500 schemi le entita' (dei 500 schemi) - con riferimento all'esempio astratto di cui sopra avremo adesempio: per A: A1,A2,...AN per B: B1,B2,..BN per C: C1,C2,...CN per D: D1,D2,...DN per E: E1,E2,...EN

Page 45: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Generazione relazioni - supponiamo di trovare A1-B4 (A-B) A7-B5 (A-B) B3-D9 (B-D) C8-C4 (C-C) C6-D2 (C-D) C1-E8 (C-E) - in casi di molteplicita' scelgo 1 sola relazione, piu' o menoarbitrariamente... - nell'esempio scegliero': A-B (una delle 2 relazioni trovate) B-D C-D C-E non scelgo ma potrei farlo C-C - il cammino relazionale selezionato sara' A-B-D-C-E

Page 46: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Generazione attributi4-GENERAZIONE ATTRIBUTI

input:a) le entita' selezionate in passo 1b) le tavole selezionate in passo 1c) gli attributi delle tavole selezionate in passo 1 (vedasi algoritmo delpasso 1)

output:x) per ciascuna entita' i suoi attributi

algoritmo:importo IN ciascuna entita' gli attributi delle tavole corrispondentiCon il solito esempio, se avevamoA corrisponde a TAV1 (CAMPO1, CAMPO2)B corrisponde a TAV2 (CAMPO3, CAMPO4)D corrisponde a TAV4 (CAMPO5, CAMPO6)l'output sara'A (CAMPO1, CAMPO2)B (CAMPO3, CAMPO4)D (CAMPO5, CAMPO6)

Page 47: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Infer constraints5-GENERAZIONE RELAZIONI (PASSO ADDITIVO FATTO SUI CONSTRAINTS FISICI)input:a) le tavole pescate al punto 1 di generazione entita'output:x) le tavole selezionate unite dagli eventuali constraints, piu' eventualitavole che si frappongono per costituire il cammino dei constraintsalgoritmo:- con un tool (generalmente erwin) si effettuano sulla base dati operazionidi "infer relationship" considerando: - chiavi primarie e chiavi straniere esistenti - indici univoci - somiglianza di nomi campi- si derivano i constraints (relazioni fisiche)Con un esempio, se avevamo individuato precedentemente le tavole TAV1, TAV2e TAV4, il cammino relazionale fisico ottenuto dai constraints potrebbeessere: TAV1-tav5-TAV4-TAV2 (tav5 viene introdotto perche' necessaria alcammino per unire TAV1 e TAV4)

Page 48: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Verifica col referente dati6-VERIFICA CON REFERENTE DATI

input:a) tutto il materiale prodotto nei passi precedentib) le indicazioni del referente dati che in generale saranno di 2 tipi: - mi aspettavo venisse pescata ANCHE questa tavola - NON mi aspettavo venisse pescata quest'altra tavola

output:x) il modello dati con i concetti in piu' e/o in meno verificati colreferente dati

algoritmo:- per ogni entita' pescata impropriamente, la rimuovo (il criterio disomiglianza spara nel mucchio)- per ogni entita' mancante, la aggiungo con la consulenza del referentedati, corredandola di attributi e relazioni

Page 49: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Passo Manuale: Verifica del referente dati

Page 50: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Esempio simbolicoSchema “automatico” Schema

dopo verifica referente

Page 51: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Sperimentazione

Page 52: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Matrice Basi di dati selezionate - Domini - Organizzazioni

xSanita’

xImprese

xxxTerritorio

Citta’ di TorinoProvincia di Torino

Regione Piemonte

Dominio/ Organizzazione

Page 53: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Basi di dati selezionate - 2

Regione Piemonte

Argomento imprese • Dominio agricoltura

– Registro aziende agricole• Dominio lavoro e imprese

– Attivita’ produttive – Finanziamenti alle imprese

Argomento sanita’ • Dominio sanita’

– Statistiche interruzioni di gravidanzaArgomento territorio

• Dominio territoriale – Legislazione su risorse idriche– Rete idrogeologica– Stradario

Page 54: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Basi di dati selezionate - 2

Citta’ di Torino

•Argomento territorio –Dominio territoriale »Toponomastica citta’

Provincia di Torino •Argomento territorio

–Dominio catasto »Registro strade provinciali

Page 55: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Contesto

Soggetto fisico /

persona fisica

Documento

Soggetto

Luogo

Riferimento catastale

Page 56: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Organizzazione Città di Torino

Soggetto Soggetto

fisico/ persona fisica

Riferimento catastale

Luogo

Page 57: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Argomento territorio

Luogo Soggetto

fisico/ persona fisica

Documento

Soggetto

Page 58: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Dominio territoriale

Documento

Soggetto

Riferimento catastale

Luogo

Soggetto fisico/ persona

fisica

Page 59: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Toponomastica Città

Soggetto fisico / Persona fisica

Contribuente

Soggetto

Appartenente catasto

Luogo

Sede

Località

Riferimento catastale

Unità immobiliare

urbana

Page 60: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Organizzazione Provincia di Torino

Riferimento catastale

Soggetto fisico/ persona

fisicaSoggetto

Luogo

Page 61: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Argomento territorio

Luogo Soggetto

fisico/ persona fisica

Documento

Soggetto

Impresa

Soggetto giuridico

Page 62: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Dominio catasto

Documento Soggetto

Riferimento catastale

Impresa

Italiano

Luogo Soggetto giuridico

Soggetto fisico/ persona

fisica

Page 63: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Cspvto Registro strade provinciali

Documento

Località

Sede

Soggetto

Contribuente

Soggetto giuridico

Luogo

Soggetto fisico/Persona fisica

Impresa

Responsabili

Elementi

Volumi di traffico

Traverse

Diario Diario

elemento

Strutture

Page 64: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Organizzazione Regione Piemonte

Documento Soggetto

Luogo

Soggetto fisico/ persona

fisica

Page 65: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Argomento imprese

Documento Soggetto

Riferimento catastale

Luogo

Page 66: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Dominio agricoltura

Riferimento catastale

Luogo

Localita

Sede

Soggetto

Soggetto fisico/ persona

fisica

Contribuente

Appartenente catasto

Page 67: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Smrgaa Registro aziende agricole

Tipo AreaIntermediario

Procedimento azienda

Luogo

Tipo TipologiaAzienda

Particella Catastale

Foglio

Particella Import

Riferimento Catastale

Soggetto

Soggetto fisico –

Persona fisica

Soggetto giuridico

Contribuente Italiano

Appartente Catasto

Impresa

Provincia

Regione

Sezione

Bene Privato

Immobile

Bene

Tipo Forma Fabbricato

Documento

Tipo zona Altimetrica

UTE

Conduzione particella

Versamento con delega

Tipo utilizzo Import

Utente Iride

Profilo

Profilo Funzione

Componente Livello

Tipologia Profilo

ComponenteLivello

Abitazione Accesso

Page 68: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Dominio lavoro e imprese

Luogo

Localita

Sede

Soggetto

Soggetto fisico/ persona

fisica

Contribuente Soggetto giuridico

Impresa

Documento

Page 69: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Aaep Attività Produttive

Luogo

Località

Riferimento Catastale

Soggetto

Soggetto fisico –

Persona fisica Soggetto giuridico

Impresa

Documento

Sede

Aaep azienda

fonte

Aaep t causale

cess

Abia azienda

Abia sede

Aaep azienda

Infoc persona ri

Infoc azspe

Infoc oggetto sociale

Infoc procedura

concorsuale

Fp azienda

Tt comune

Aaep rappr legaleAb04

legami

Tt tipo legame

Ab01 impresa

Tt tipo impresa

Tt attivita

Tt ateco91

Infocamere attività

Atp aaep att econom

produttive

aaep dati azienda

Ateco inail

Inail azienda

Inail pat

Inail cliente

Page 70: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Moni Finanziamenti alle Imprese

Soggetto fisico / Persona

fisica

Italiano

Soggetto giuridico

Contributo

Generatore invio file

Norma agevolazione

Spesa progetto

Attuazione normativaFonte

Contributo revocato

Contributo liquidato

Contributo concesso

SoggettoUtente

Documento

Atto registro

Impresa

Page 71: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Argomento sanità

Impresa

Contribuente

Appartenente catasto

Italiano

Soggetto giuridico

Immobile

Soggetto

Luogo

Soggetto fisico/ persona

fisica

Bene

Bene privato

Documento

Riferimento catastale

Page 72: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Dominio sanità

Riferimento catastale

Documento

Impresa

Soggetto giuridico

Italiano Luogo

Sede

Località

SoggettoSoggetto

fisico/ persona fisica

Page 73: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Asivg Statistiche interruzioni di gravidanza

Soggetto fisico / Persona

fisica

Tossicodipendente

Luogo

Ass-t-ssRiabilitativa

Ass-d-tiposstassistenza

Asi-tStruttre 1998

Ass-d -tiposs ospedaliera

Ass-t-ssospedaliera

Ass-t-ssoAssetto

organizzativo

Ass-tAnagrafe ss

Rata di pensione emessa

Assistito

SoggettoDocumento

Ass-s-tipossriabilitativa

Ass-r-ssrAssistenza

Ass-t-ssTerritoriale

Ass-t dipartimento

Ass-t-u ospedaliera

Page 74: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Argomento territorio

Soggetto fisico/ persona

fisica

Documento

Soggetto

Tossicodipendente

Luogo

Page 75: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Dominio territoriale

Documento

Località

Luogo

Riferimento catastale

Soggetto

Bene privatoSede

Immobile

Bene

Stradario

Page 76: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Giuridr Legislazione su risorse idriche

Documento

PubblicazioneEnte emanante

File normativa

Normativa

L-doc-sett-tem

Settore termico

Tipologia

Bibliografia Sentenza

L fileriass sen biblio File riassuntivo

Organo giurisdizionale

Page 77: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Siri Rete Idrogeologica

Bene

Soggetto

Mobile

Documento

Immobile

Aqcuedotto

Località

Terreno

Luogo

Demanio necessario

idrico

Sede

Riferimento catastale

StradarioComuni Italia

Province Italia

Page 78: Grosso batini

Direzione Atenei, Cultura, Banche Dati e Sistemi Decisionali

Sitad Stradario

Stradario storico Stradario VAR

Stradario

Luogo

L1 Tipo Nome Via

Località

Tipo Via

Nome Via