Post on 05-Dec-2014
description
A Cura di:
Vincenzo Patruno, Marina Venturi
Sistemi informativi Statistici
Università “La Sapienza”
Facoltà di Scienze Statistiche
23 Febbraio 2004
Dalle Fonti ai Sistemi Informativi
Crescita della domanda di informazione statistica
Dati aggiornati e dettagliati
Riduzione del carico sui rispondenti
Sfruttamento dei giacimenti informativi esistenti
Sviluppo tecnologico e informatico (es. DB, Internet) per la fruibilità immediata dei dati
Dalle Fonti ai Sistemi Informativi
Necessità di individuare soluzioni metodologiche e organizzative efficienti che consentono di:
•Integrare le informazioni raccolte da indagini diverse organizzandole e inquadrandole in uno schema coerente •Passare da una visione per singola fonte, singola indagine e quindi singolo processo di produzione ad una visione di sistema di fonti, sistema di indagini
SISTEMA INFORMATIVO STATISTICO
Dalle Fonti ai Sistemi Informativi
La nozione di Sistemi Informativi nasce in ambito aziendale.
Si intende l’insieme di strumenti automatici di memorizzazione, scambio, acquisizione, elaborazione, interrogazione e diffusione di informazioni raccolte da una azienda per soddisfare i propri scopi di esercizio, controllo e pianificazione basato su una architettura
informatica di tipo Data Base
Dalle Fonti ai Sistemi Informativi
Ciclo di gestione della produzione statistica
Processi: insieme di procedure di acquisizione, correzione, validazione, produzione di dati elementari, di
elaborazione, trasformazione e diffusione di dati aggregati.
Prodotti: archivi di microdati validati e tavole di pubblicazione (in formato cartaceo o elettronico)
Dalle Fonti ai Sistemi Informativi
SIS: E’ la naturale evoluzione del ciclo di gestione della produzione statistica
•Esistenza di una base dati in linea
•Esistenza di un livello di integrazione orizzontale e verticale
Dalle Fonti ai Sistemi Informativi
Sistema Informativo Statistico
•Estendibilità
•Flessibilità
•Semplicità d’uso
•Integrità e robustezza
Dalle Fonti ai Sistemi Informativi
Standard di qualità su Web
Accessibilità
Un sito è “accessibile” se i contenuti, le modalità di
navigazione e le funzioni interattive sono accessibili a
tutti gli utenti, indipendentemente contesto tecnologico e
culturale e dal livello di competenze degli utenti
Dalle Fonti ai Sistemi Informativi
Standard di qualità su Web
Usabilità
un sito web è effettivamente “usabile” se è “orientato
all’utente”, cioè se garantisce un
set di requisiti che riguardano:
» efficienza
» efficacia
» soddisfazione
Dalle Fonti ai Sistemi Informativi
Standard di qualità su Web
Efficienza
Un sito è “efficiente” se è in grado di soddisfare le
esigenze degli utenti attraverso un impiego razionale
delle risorse disponibili (economiche, tecnologiche e
informative)
Dalle Fonti ai Sistemi Informativi
Standard di qualità su Web
Efficacia
Un sito web è “efficace” se è in grado di soddisfare i
bisogni informativi degli utenti in modo accurato e
completo
Dalle Fonti ai Sistemi Informativi
Standard di qualità su Web
Soddisfazione
Un sito è “di soddisfazione” per gli utenti se è
liberamente accessibile, non implica vincoli e condizioni
all’accesso e invoglia gli utenti ad un utilizzo non
occasionale
Dalle Fonti ai Sistemi Informativi
Standard di qualità su Web
Mission
Le finalità del sito, gli obiettivi informativi fondamentali e i
principali target di riferimento devono essere esplicitati in
modo evidente
Dalle Fonti ai Sistemi Informativi
Standard di qualità su Web
Linearità e Sinteticità
Un sito è “lineare” se le funzioni sono programmate in
modo da ridurre il numero di modi in cui certe attività
operative possono essere svolte, in modo da
semplificare l’utilizzo da parte degli utenti
I contenuti testuali devono essere essenziali e non
ridondanti
Dalle Fonti ai Sistemi Informativi
Standard di qualità su Web
Organizzazione per Grappoli
Le informazioni devono essere organizzate in modo logico e consequenziale e distribuiti per “grappoli” e “nidificazioni”, per tema, ordine cronologico o fonte
in funzione del tipo di informazioni, degli obiettivi e delle caratteristiche tecniche del sito e del livello di conoscenza degli utenti
Dalle Fonti ai Sistemi Informativi
Standard di qualità su Web
Nidificazioni GerarchicheI grappoli di informazioni devono essere organizzati gerarchicamente in modo che l’articolazione sia:
•logica, internamente coerente, adeguata al modello concettuale
•facilmente comprensibile e gestibile dagli utenti
Dalle Fonti ai Sistemi Informativi
Standard di qualità su Web
Layout delle pagine
Ciascuna pagina deve essere autosufficiente: coprire un dominio specifico senza dover ricorrere a pagine differenti per cogliere l’informazione chiave.
Quando una pagina contiene troppe informazioni si deve adottare una organizzazione per grappoli e una struttura gerarchica dei contenuti (cfr.)
Dalle Fonti ai Sistemi Informativi
Tipologie di Sistemi Informativi Statistici
•Sistemi di metadati (per la gestione di definizioni, classificazioni, nomenclature comuni a tutte le indagini)•Sistemi strumentali (sistemi di supporto alla produzione statistica)•Sistemi di produzione (insieme dei sottosistemi per la gestione delle fasi relative al ciclo di produzione delle indagini)
•Sottosistemi di acquisizione dei dati (tecniche CAI)
•Sottosistemi di diffusione (dedicati al ritrovamento e alla presentazione delle informazioni statistiche per l’utente finale)
Dalle Fonti ai Sistemi Informativi
Tipologie di Sistemi Informativi Statistici
Esempio di sistema integrato di produzione dati di indagini sulla popolazione
http://modem.istat.it
http://demo.istat.it
DEMO-GEODEMO:I dati diffusi
•Movimento e calcolo della popolazione residente (Rilevazione P.2)
•Cittadini stranieri iscritti in Anagrafe: Bilancio Demografico e Popolazione residente per sesso e cittadinanza (Rilevazione P.3)
•Popolazione residente per sesso, età e stato civile (Rilevazione POSAS)
•Tavole di mortalità
•Previsioni della popolazione residente
Interfaccia utente Programmi Strutture Dati
Interfaccia utente
Interfaccia utente
E’ la “porta di accesso” ai dati
L’obiettivo di demo.istat.it è stato quello di ottenere una interfaccia per consentire:
•Facile accesso ai dati
•Facile selezione dei parametri di input
•Veloci interrogazioni sul Data Base
Interfaccia utente
Sul Web questo significa:
•Costruire l’interfaccia utente come pagina HTML
•Usando le tecnologie disponibili (DHTML)
•Utilizzando il protocollo HTTP per inviare query e per ottenere i risultati
Problemi: Compatibilità tra browser, limiti di DHTML, natura di HTTP
Interfaccia utente
1 3
2
Interfaccia utente
L’utente utilizza la stessa finestra
•Per effettuare interrogazioni
•Per ottenere i risultati
•Per salvare i dati
Strutture dati
OLTP: On line Transaction Processing
E’ una classe di programmi per la gestione di sistemi di tipo transazionale (tipicamente data entry e retrieval transactions)
OLAP: On Line Analytical Processing
Permette all’utente di estrarre dati in modo facile e selettivo e di vedere i dati da differenti punti di vista.
•Il modello ER è basato su una rappresentazione della realtà oggetto di studio sulla base di oggetti chiamati Entità e delle relazioni tra questi oggetti.
•Ad ogni entità è associato un insieme di attributi che la caratterizzano
Modello Entità-Relazioni (ER)
Modello Entità-Relazioni (ER)
Famiglia IndividuoAppartiene
N. Componenti
Struttura
Sesso Età
Titolo di StudioCondizione
professionale
1 n
Schema E-R di un c/c bancario
•Un Data Warehouse è un repository per tutti o una parte dei dati che vengono raccolti dai vari sistemi aziendali
•Un Data warehouse è una raccolta di dati disegnati e organizzati per il supporto decisionale
•Un Data Warehouse è un sistema informatico disegnato per supportare coloro che hanno il compito di prendere decisioni strategiche costruito copiando i dati da sistemi esistenti e memorizzandoli in maniera opportuna per il loro utilizzo da parte dei dirigenti
Un Data Warehouse è una copia dei dati esistenti opportunamente strutturati per consentire sia interrogazioni che la generazione di report.
(Ralph Kimball's pag. 310 of The Data Warehouse Toolkit - John Wiley & Sons 1996)
Data Warehouse
•Il DM è la tecnica di analisi e rappresentazione concettuale dei dati più adatta nella costruzione di sistemi di warehouse
•Nel DM, un modello di tavole e relazioni è costruito con lo scopo di massimizzare la velocità di accesso ai dati e di osservarli secondo più dimensioni
Modello dimensionale (DM)
Modello dimensionale (DM)
•DM è costruito attorno ad un “business subject”
•Ciò significa identificare il soggetto da modellare e tutte le misure che descrivono quel soggetto.
•Nello stesso tempo vanno identificati tutti quei parametri da cui le misure possono essere viste.
Modello dimensionale (DM)
Popolazione Residente
Maschi
Femmine
Celibi
Nubili
……
Età_FK
Territorio_FK
Territorio
Territorio_PK
Comune
Provincia
Regione
Ripartizione
Età
Età_PK
Età_desc
•Il DM non cambia se implementato in un Data Base Relazionale. (Il DM viene chiamato Star Schema)
•Ogni dimensione diventa una tabella nel data base (Dimension Table)
•La tavola dei Fatti diventa una tavola di dimensioni ragguardevoli, contenente un gran numero di righe. Contiene infatti le misure più le chiavi esterne per il collegamento con le Dimension Table.
Modello dimensionale (DM)
Modello dimensionale (DM)
Le misure vengono dette FATTI
I parametri da cui un fatto può essere visto vengono detti DIMENSIONI
Il livello di dettaglio delle misure nella Fact Table è detto GRANULOSITA’
Il DM è orientato alla facile gestione delle gerarchie
Modello dimensionale (DM)
Popolazione Residente
AGG_BY_PROVINCE
Maschi
Femmine
Celibi
Nubili
……
Età_FK
Territorio_FK
Territorio
Territorio_PK
Provincia
Età
Età_PK
Età_desc
Popolatione Residente AGG_BY_ITALY
Popolatione Residente
AGG_BY_GEOGRAPHICAL_AREA
Popolatione Residente
AGG_BY_REGION
Popolatione Residente
AGG_BY_PROVINCE
BASE Popolatione Residente
Modello dimensionale (DM)
M. C. Escher
Relativity
Client
HTTP
Architettura
Linux RedHatApache HTTP ServerPHP4PostgreSQLPostGISMapserverMapscript
Spatial and Statistical DataData Warehouse
PHP pages
PHP interpreter
PostgreSQL
PHP pages
PHP interpreter
PostgreSQL
PostGIS
MAPSCRIPT
MAPSERVER
Server
Marina VenturiISTAT - Direzione centrale per le statistiche e le indagini sulle istituzioni sociali Viale Liegi n. 13 00198 Romamarina.venturi@istat.it
Vincenzo PatrunoISTAT - Direzione centrale per le metodologie statistiche e le tecnologie informatiche Via C. Balbo,16 00184 Romavincenzo.patruno@istat.it