Importanza della rappresentazione dei dati
Prof. Giovanni Capelli
Cattedra di Igiene Dipartimento di Scienze Motorie e della Salute
Facoltà di Scienze Motorie - Università di Cassino
Epidemiologia e flusso di dati nella prevenzionePescara, 14 settembre2009
Epidemiologia e flusso di dati nella prevenzionePescara, 14 settembre2009
Dati Elementari
il DATO è una descrizione originaria e non interpretata di un evento è la materia prima del processo di costruzione
delle informazioni è costituito da gruppi di simboli (lettere,
numeri, caratteri speciali) che rappresentano quantità, azioni, cose, ecc.
il DATO INIZIALE o ELEMENTARE è la rappresentazione oggettiva di fenomeni o eventi reali
Dati sintetici i dati sintetici si possono considerare
equivalenti ad un “prodotto semilavorato intermedio” di un processo produttivo il processo di sintesi che permette di generare
un dato sintetico a partire da più dati elementari modifica il potenziale informativo iniziale
Informazioni E’ INFORMAZIONE tutto ciò che
produce variazione nel patrimonio conoscitivo di un soggetto Il concetto di informazione fa riferimento al suo
percettore, al suo utilizzatore L’ INFORMAZIONE è un dato che è stato
sottoposto ad un processo che lo ha reso significativo per il destinatario e realmente importante per il suo processo decisionale presente o futuro
L’ INFORMAZIONE è relativa: sussiste solo se destinata a qualcuno per qualche scopo
Decisioni Definizione: una particolare classe di
INFORMAZIONI che ha lo scopo di provocare AZIONI determinate; Perchè ciò avvenga, si richiede:
la definizione di una SITUAZIONE FINALE da raggiungere
la definizione di una SITUAZIONE PRESENTE, che è quella riferita dal sistema informativo
L’identificazione delle AZIONI DA COMPIERSI in conformità ad una “politica” prestabilita
L’uso delle informazioni appare finalizzato all’attività decisionale;
Perché la rappresentazione sintetica dei dati è importante?
Visual e Statistical Thinking
Quando si ragiona su prove quantitative, certi metodi di rappresentazione ed analisi dei dati sono meglio di altri.
I metodi migliori sono anche quelli che hanno le maggiori opportunità di produrre risultati veritieri, credibili e precisi
La differenza tra una analisi eccellente e una sbagliata qualche volta comporta conseguenze importantiTufte ER, Visual Explanations. Images and Quantities, Evidence and Narrative,
1997
John Snow e il Colera a Londra
Londra, UK
settembre 1854
La mappa di John Snow
Mettere i dati nel contesto appropriato per valutare causa ed
effetto I dati che Snow aveva a disposizione erano
una lista di nomi dei deceduti, i loro indirizzi, le date del loro decesso
La più naturale delle descrizioni era la rappresentazione della serie temporale, la “curva epidemica” dei decessi
Ma la narrazione descrittiva non è spiegazione il solo passare del tempo non sempre spiega tutto
e John Snow decise di usare una mappa dove presentava gli EFFETTI, i decessi ma anche le ESPOSIZIONI, le pompe
l’ aggregarsi di esposizioni ed effetti nello spazio, il clustering, indicava associazione
Lezioni da questo caso
Snow ebbe una “buona idea” una teoria causale sulla diffusione della malattia che
lo guidò nella raccolta dei dati
Snow aveva studiato le epidemie precedenti
conosceva la situazione ed era preparato a raccogliere i dati “giusti”
Snow usò un metodo giusto, basato su: Mettere i dati nel contesto appropriato per valutare
causa ed effetto Fare comparazioni quantitative Considerare spiegazioni alternative e casi contrari Valutare i possibili errori nei numeri riportati sui
grafici
Il lancio dello Space Shuttle Challenger
Kennedy Space Center, Cape Canaveral, FL, USA
27 gennaio 1986
La 25a missione Shuttle
Il tragico lancio dello Shuttle Challenger
Il giorno prima del lancio, la temperatura prevista per il giorno successivo era tra 26 e 29° F (tra -3 e -1 °C) preoccupati che ad una simile temperatura le guarnizioni
ad O potessero non isolare, gli ingegneri della Morton Tiokol (costruttrice dei motori a propellente solido) si erano opposti al lancio
per sostenere la loro posizione, inviarono via fax alla NASA 13 lucidi
un alto ufficiale della NASA rispose che era “terrorizzato” dalla raccomandazione di non lanciare, e invitò la Morton Tiokol a rivedere la sua posizione nonostante fosse la prima volta in 12 anni, che la casa
sconsigliava un lancio Altri ufficiali della NASA evidenziarono punti di debolezza nel
materiale presentato dalla Tiokol
I dati dei lanci di Shuttle
precedenti al Challenger
Il tragico lancio dello Shuttle Challenger
Di fronte a queste posizioni, i Manager della Morton Tiokol cambiano idea e decidono che sono a favore del lancio per il giorno successivo
La domanda era dunque stata sollevata la notte prima del lancio
Ce la faranno domani ad isolare le guarnizioni ad O nonostante il freddo? Gli ingegneri avevano a disposizione tutti i dati
necessari per stimare che la probabilità di un evento disastroso era altissima,
Tuttavia il materiale da loro presentato non coglieva nel segno, non evidenziava l’ importanza della temperatura nel comportamento delle guarnizioni
Un grafico costruito male non aiuta a capire i dati…
Sarebbe bastato spostare la visuale nella zona con meno dati (le temperature basse) e proporre un modello di previsione di probabilità (a destra) per valutare correttamente il rischio!
Thinking and Design: Prima pensare e poi rappresentare
La logica della rappresentazione dei dati deve rispecchiare la logica dell’analisi: la rappresentazione grafica dei risultati deve seguire i principi del ragionamento quantitativo tipica della scienza. La struttura grafica deve riassumere il ragionamento quantitativo utilizzato per raggiungere i risultati. E allora dovremo:
Avere ben presenti le fonti e le caratteristiche dei dati utilizzati
Proporre appropriati confronti
Prendere in esame e presentare meccanismi di causa ed effetto
Esprimere le relazioni causa-effetto in modo quantitativo
Riconoscere la intrinseca natura multivariata dei fenomeni analizzati
Valutare spiegazioni alternativeTufte ER, Visual Explanations. Images and Quantities, Evidence and Narrative,
1997
Tabelle e Grafici: due mondi o un continuum?
TABELLE Organizzazione spazio
righe e colonne discreto
Elementi testo, numeri
Quantità numeri
Vantaggi comparazioni
simultanee
GRAFICI Organizzazione spazio
piano “cartesiano” (piani angolari)
continui
Elementi grafici 2 dimensioni
punto, linea, area
testo, numeri Quantità
posizione area
Vantaggi immediatezza
Elting LS, Martin CG, Cantor SB, et al., Influence of data display formats on physician investigator’s decisions to stop clinical trials: prospective trial with repeated measures - BMJ 1999, 318:1527-1531
Graphical excellence
Una buona rappresentazione dei dati dovrà: mostrare i dati indurre chi guarda a riflettere sulla sostanza
piuttosto che sui metodi, il disegno grafico, la tecnologia di produzione grafica
evitare di distorcere ciò che i dati hanno da dire presentare molti numeri in poco spazio rendere coerenti grandi set di dati incoraggiare l’occhio a comparare diversi aspetti dei dati presentare i dati a diversi livelli di dettaglio
da una visione d’insieme fino alla struttura fine servire un obiettivo ragionevole:
descrivere, esplorare, tabulare, decorare essere fortemente integrata con le descrizioni verbali e
statistiche dei dati
Edward E. Tufte, The visual display of quantitative information, Graphics Press, 1983
Graphical elegance is often found in simplicity of design and complexity of
data Rappresentazioni di dati statistici attraenti:
sono realizzate con schema e formato appropriati utilizzano parole, numeri e disegni insieme sono il risultato di un bilanciamento, una valutazione
delle proporzioni, una riflessione sulla scala dei fenomeni mostrano un dettaglio di complessità accessibile hanno spesso qualità narrativa
hanno una storia da raccontare sui dati sono realizzati in maniera professionale
con attenzione e cura ai dettagli tecnici evitano la decorazione fine a sè stessa
inclusa la “spazzatura grafica” di retinati, colori sgargianti, ecc.
Edward E. Tufte, The visual display of quantitative information, Graphics Press, 1983
Quanto è veloce l’uomo?
Ecco il disastro della campagna di Russia di Napoleone:
Spazio Tempo Numerosità
dell’esercito Andata
(chiaro) Ritorno
(nero)
da EJ Marey, La methode graphique, Paris, 1885 (Carte Figurative de M.
Minard)
da EJ Marey, La methode graphique, Paris, 1885 (Carte Figurative de M.
Minard)
Le tabelle: qualche esempio
Qual è il criterio di ordinamento di questa tabella?
Qual è il criterio di ordinamento di questa tabella?
Non sempre grafica e colori vogliono dire una buona presentazione dei dati:
in questo grafico è impossibile distinguere a prima vista i totali delle diverse ASL della provincia di Bolzano
Dalla distinzione delle caselle alla continuità dei fenomeni: I
grafici
Piano cartesiano = spazio bidimensionale
Rappresentare posizioni nello spazio: le 1000 anime delle mappe
Mappe per punti: collocare un fenomeno nello
spazio13
0000
1400
0015
0000
1600
0017
0000
Latit
udi
ne N
ord
(sec
ondi
)
20000 30000 40000 50000 60000 70000Longitudine da Greenwich (sec.)
Dati ISTAT 1998
Coordinate geograficheI comuni d'Italia
Mappe areali: utilizzare un confine
“amministrativo” (integrazione spaziale)
Relazione Stato
Sanitario Italia 2003-
2004
Relazione sullo stato di salute della popolazione pugliese, 2005
Indici di vecchiaia a Roma(Quintili)
Per analizzare bacini d’utenza
(Da: Vitullo, Carinci, Lepore, Tognoni, Aziende sanitarie e
modello di uso dei DRG, Il Pensiero Scientifico Editore,
1997)
Il piano cartesiano “scorre”per rappresentare il tempo
Rappresentare variazioni nel tempo: serie temporali, grafici lineari, grafici “ciclici”
Variazioni della glicemia nel tempo
da SM Powsner, ER Tufte, Graphical summary of patient status, Lancet, 344: 386-389, 1994
da SM Powsner, ER Tufte, Graphical summary of patient status, Lancet, 344: 386-389, 1994
Diagrammi lineari
Ciascun punto sul grafico rappresenta una coppia di modalità
Ciascun valore sull’ asse x ha un solo valore sull’ asse y
I punti adiacenti sono collegati da linee rette
In genere, la scala sull’ asse x rappresenta il tempo è così possibile seguire il
comportamento del carattere riportato in y in un determinato periodo
Relazione sullo stato di salute della popolazione
pugliese, 2005
Pertosse" - ROMA"
Tass
o pe
r 10
0.00
0 ab
.
Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97
0
5
10
15
Pertosse" - Distretto A"
Tass
o pe
r 10
0.00
0 ab
.
Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97
0
5
10
15
Pertosse" - ASL RME"
Tass
o pe
r 10
0.00
0 ab
.
Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97
0
5
10
15
Pertosse" - Distretto B"
Tass
o pe
r 10
0.00
0 ab
.
Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97
0
5
10
15
Pertosse - RM/E (1991-1997)
Salmonellosi" - ROMA"
Tass
o pe
r 10
0.00
0 ab
.
Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97
0
8
16
24
Salmonellosi" - Distretto A"
Tass
o pe
r 10
0.00
0 ab
.
Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97
0
8
16
24
Salmonellosi" - ASL RME"
Tass
o pe
r 10
0.00
0 ab
.
Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97
0
8
16
24
Salmonellosi" - Distretto B"
Tass
o pe
r 10
0.00
0 ab
.
Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97
0
8
16
24
Salmonellosi - RM/E (1994-1997)
Anche la pausa è musica!
Se non ci sono dati, è bene saperlo…
Usare l’ “indicizzazione”
1985: anno “indice”1985: anno “indice”
Come far vedere una crescita che non c’è…
Anche con le scale indicizzate si può giocare…
Serie cicliche: i “coxcombs”
Tempo ciclico e tempo lineare a confronto
Attività settimanale di ricovero
0
50
100
150
200
250
300
350
400
Domenica Lunedi' Martedi' Mercoledi' Giovedi' Venerdi' Sabato
Rico
veri
Cardiochirurgia
Emodinamica
Attività settimanale di ricovero
0
50
100
150
200
250
300
350Domenica
Lunedi'
Martedi'
Mercoledi'Giovedi'
Venerdi'
Sabato
Cardiochirurgia
Emodinamica
E… se lo spazio cartesianofosse uno spazio “virtuale”?
Gli infiniti universi dei grafici a dispersione (scatterplot)
DIAGRAMMI DI DISPERSIONEA DUE DIMENSIONI
Sono utili per illustrare la relazione tra due diversi caratteri che assumono modalità numeriche
Ogni punto del grafico rappresenta una unità statistica
la scala per un carattere è riportata nell’ asse x e la scala per l’ altro nell’ asse y
Se i due caratteri non sono correlati, i punti si distribuiscono casualmente su tutto il piano cartesiano
STATA: twoway (scatter marriage pop, msize(medium)), xlabel(, angle(forty_five)) caption(1980 U.S. census data, size(small))
050
,000
100,
000
150,
000
200,
000
Num
ber o
f mar
riage
s
0
5,000
,000
10,00
0,000
15,00
0,000
20,00
0,000
25,00
0,000
Population1980 U.S. census data
DIAGRAMMI DI DISPERSIONEA DUE DIMENSIONI
STATA: twoway (scatter marriage pop, msize(small) mlabel(state) mlabsize(small) mlabcolor(red)), xlabel(, angle(forty_five)) caption(1980 U.S. census data, size(small))
STATA: twoway (scatter marriage pop, msize(small) mlabel(state) mlabsize(small) mlabcolor(red)), xlabel(, angle(forty_five)) caption(1980 U.S. census data, size(small))
Alabama
Alaska
ArizonaArkansas
California
ColoradoConnecticut
Delaware
Florida
Georgia
HawaiiIdaho
Illinois
Indiana
IowaKansasKentucky
Louisiana
Maine
MarylandMassachusetts
Michigan
MinnesotaMississippi
Missouri
MontanaNebraska
Nevada
New Hampshire
New Jersey
New Mex ico
New York
N. Carolina
N. Dakota
Ohio
Oklahoma
Oregon
Pennsylvania
Rhode Island
S. Carolina
S. Dakota
Tennessee
Tex as
UtahVermont
VirginiaWashington
W. Virginia
Wisconsin
Wyoming
050
,000
100,
000
150,
000
200,
000
Num
ber o
f mar
riage
s
0
5,000
,000
10,00
0,000
15,00
0,000
20,00
0,000
25,00
0,000
Population1980 U.S. census data
Num
ber o
f mar
riage
s
Population0 5.0e+06 1.0e+07 1.5e+07 2.0e+07 2.5e+07
0
50,000
100000
150000
200000
DIAGRAMMI DI DISPERSIONEA DUE DIMENSIONI
STATA: gr7 marriage pop, oneway twoway xlab(0 (0.5e+07) 2.5e+07) ylab(0 (50000) 200000)STATA: gr7 marriage pop, oneway twoway xlab(0 (0.5e+07) 2.5e+07) ylab(0 (50000) 200000)
TrendTrend
OutliersOutliers
ClusteringClustering
DIAGRAMMI DI DISPERSIONEA DUE DIMENSIONI
STATA: twoway (scatter marriage pop), by( region)STATA: twoway (scatter marriage pop), by( region)
050
,000
100,
00015
0,00
0200,
000
050
,000
100,
00015
0,00
0200,
000
0 10,000,000 20,000,000 30,000,0000 10,000,000 20,000,000 30,000,000
NE N Cntrl
South West
Num
ber o
f mar
riage
s
PopulationGraphs by Census region
ICP
---
>
ICM --->.33 .5 1 2 3
.33
.5
1
2
3
Med.GeneraleEndocrino
Ematologia
Ch.Generale1
Ch.Generale2
Ch.Urgenza
Ginec.Ostet.2
UTIC
Rianimaz.
Mal.Infett.
Pneumologia
Ortopedia
Oculistica
Pediatria
Neonatol.
Nido
ORL
Geriatria
PsichiatriaGinec.Ostet.1
Cardio Medica
Cardio Emodinam.
Urologia
Cardiochirurgia
Litotrissia
Nefrologia
Neurochir.
Neurologia
Oncologia Med.
ICP
---
>
ICM --->.33 .5 1 2 3
.33
.5
1
2
3
Med.Generale
Endocrino
Ematologia
Ch.Generale1Ch.Generale2
Ch.Urgenza
Ginec.Ostet.2
UTIC
Rianimaz.
Mal.Infett.
Pneumologia
Ortopedia
Oculistica
Pediatria
Neonatol.
Nido
ORLGeriatria
Psichiatria
Ginec.Ostet.1
Cardio Medica
Cardio Emodinam.
UrologiaCardiochirurgiaLitotrissia
Nefrologia
Neurochir.
Neurologia
ICP
---
>
ICM --->.33 .5 1 2 3
.33
.5
1
2
3
Med.Generale
Endocrino
EmatologiaCh.Generale1
Ch.Generale2Ch.Urgenza
Ginec.Ostet.2
UTIC
Rianimaz.
Mal.Infett.Pneumologia
Ortopedia
Oculistica
Pediatria
Neonatol.
Nido
ORL
Geriatria
Psichiatria
Ginec.Ostet.1
Cardio MedicaCardio Emodinam.
UrologiaCardiochirurgia
Litotrissia
Nefrologia
Neurochir.
Neurologia
Oncologia Med.
ICP
---
>
ICM --->.33 .5 1 2 3
.33
.5
1
2
3
Med.Generale
Endocrino
EmatologiaCh.Generale1
Ch.Generale2
Ch.Urgenza
Ginec.Ostet.2
UTIC
Rianimaz.
Mal.Infett.
PneumologiaOrtopedia
Oculistica
Pediatria
Neonatol.
NidoORL
GeriatriaPsichiatria
Ginec.Ostet.1
Cardio Medica
Cardio Emodinam.
Urologia
Cardiochirurgia
Litotrissia
Nefrologia
Neurochir.
Neurologia
Oncologia Med.
1996 1997
1998 1999
Standard diriferimento
Complessità della casistica (ICM) 0
1 0
1
Effi
cien
za (
ICP)
QuadrantePROBLEMATICO
Complessità: SCARSAEfficienza: SCARSA
TranquillaComplessità
Complessità: ELEVATAEfficienza: SCARSA
EfficienteSemplicità
Complessità: SCARSAEfficienza: ELEVATA
Quadrante VIRTUOSO
Complessità: ELEVATAEfficienza: ELEVATA
ICP
Graphs by RepartoIC M
Cardio Emodinam.
.5
.66
1
1.5
2
1 9 9 6
1 9 9 71 9 9 8
1 9 9 9
Cardio Medica
.5 .66 1 1.5 2
1 9 9 6
1 9 9 7
1 9 9 81 9 9 9
Cardiochirurgia
.5 .66 1 1.5 2
.5
.66
1
1.5
21 9 9 6
1 9 9 71 9 9 8
1 9 9 9
ICP
Graphs by RepartoICM
Neurochir.
.5
.66
1
1.5
21996
1997
1998
1999
Neurologia
19961997
1998
1999
ORL
.5 .66 1 1.5 2
.5
.66
1
1.5
2
1996
1997
1998
1999
Oculistica
.5 .66 1 1.5 2
1996
1997
1998
1999
Infine, qualcosa di più semplice: e se studiassimo la distribuzione di
frequenza di singole “variabili”?
Dati numerici continui: istogrammi, diagrammi a scatola (box-plot)
Dati categorici: Grafici a barre, Grafici a torta
Sono il pane quotidiano -> MA: non sempre la farina è buona!
Istogrammi e altre modi per presentare la frequenza di classi di
valori continui
ISTOGRAMMI
Modalità numericheModalità numeriche
Frequenza
delle
oss
erv
azi
oni
Frequenza
delle
oss
erv
azi
oni
00
nn
I dati vengono divisi in classi
in questo caso 6 classi con un intervallo non costante
Per ogni gruppo si costruisce un rettangolo:
la posizione della base del rettangolo corrisponde ai margini dell’ intervallo (è quantitativa)
l’ area del rettangolo è proporzionale alla frequenza rilevata per il gruppo
La scala utilizzata per gli assi deve consentire la visualizzazione dei rettangoli interi
00
11
44
1313
5.55.5
77
1616
Mod
alità
num
eric
he
Frequenza delle osservazioni
0n01
4
13
5.5
7
16
STATA:graph twoway (histogram eta)STATA:graph twoway (histogram eta)
Un utilizzo dell’istogramma: la Piramide di età
Un altro utilizzo dell’istogramma: la valutazione di “normalità” (distribuzione
gaussiana)Fr
actio
n
Psychomotor Development Index at45 55 65 75 85 95 105 115 125 135 145 155
0
.1
.2
.3
DistribuzioniF
rac
tio
n
Peso alla nascita (grammi)1000 2000 3000 4000 5000
0
.1
.2
.3
Fra
cti
on
Peso alla nascita (grammi)1000 2000 3000 4000 5000
0
.1
.2
.3
Normale
Fra
cti
on
Eta' del padre (anni)20 30 40 50
0
.05
.1
.15
.2
Fra
cti
on
Eta' del padre (anni)20 30 40 50
0
.05
.1
.15
.2
Non normaleasimmetrica a destra
1 istogramma, 2 sottogruppi
05
1015
2025
Perc
ent
0 10 20 30 40 50 60 70 80 90 100 110Duration of circulatory arrest (minutes)
histogram minutes, width(10) start(0) percent bfcolor(yellow) blcolor(gold) normal normopts( clcolor(red) clpat(dot) ) kdensity kdenopts( clcolor(blue) ) xlabel( 0 (10) 110) plotregion(margin(zero))
histogram minutes, width(10) start(0) percent bfcolor(yellow) blcolor(gold) normal normopts( clcolor(red) clpat(dot) ) kdensity kdenopts( clcolor(blue) ) xlabel( 0 (10) 110) plotregion(margin(zero))
Frac
tion
Histograms by Deep Hypothermic Circulatory Arrest (1=yes; 2=low-Duration of circulatory arrest (
dhca==0
0 20 40 60 80 100 1200
.2
.4
.6
dhca==1
0 20 40 60 80 100 120
Distribuzioni
SimmetricaAsimmetrica a destra
Durata dell’intervento chirurgico (minuti)Durata dell’intervento chirurgico (minuti)
Come presentare indici numerici in modo grafico: il diagramma a
scatola o box-plot
Il diagramma a scatola (Box-Plot)
0
7
14
30
Degenza preoperatoria
Prof. Uno Prof. Due Prof. Tre
Mediana(50° percentile)
Intervallo Interquartile (IQR)(75°-25° percentile)
Valori adiacenti(estremi ma di non
più di 1,5 IQR)
Conta la leggibilità, non l’orientamento…
0 7 14 30Degenza preoperatoria
Prof. Tre
Prof. Due
Prof. Uno
Presentare categorie: le mille anime del diagramma a barre
Diagrammi a barre Le modalità qualitative sono
riportate in ascissa asse X qualitativo
Per ogni gruppo si costruisce un rettangolo:
la posizione della base del rettangolo (di larghezza costante) è centrata sul nome della modalità
l’ area del rettangolo è proporzionale alla frequenza rilevata per il gruppo
La scala utilizzata per gli assi deve consentire la visualizzazione dei rettangoli interi
AA BB CC DD
Modalità qualitatitiveModalità qualitatitive
Frequenza
delle
oss
erv
azi
oni
Frequenza
delle
oss
erv
azi
oni
00
nn
Relative frequency of bacterial species/groups encountered in clinical specimens from inpatients
Diagrammi a barre sovrapposte
In un diagramma a barre possono essere rappresentate anche più variabili
Nell’esempio, le variabili prese in esame sono: Lo status di fumatore
Non fumatore, fumatore e forte fumatore La presenza di un ev. coronarico acuto, evidenziata in rosso
05
1015
num
ero
di s
ogge
tti
non fumatore fumatore forte fumatore
Diagrammi a barre sovrapposte
In questo esempio, sono riportati i valori di frequenza relativa (percentuale) di un ev. coronarico acuto, evidenziati in rosso
020
4060
8010
0P
erce
ntua
le d
i sog
getti
non fumatore fumatore forte fumatore
Barre affiancate
020
4060
Num
ber o
f chi
ldre
n
Low Flow By-Pass Deep Hypothermic Circulatory Arrest
EEG seizure activity within 48 h since surgery
EEG seizures No EEG seizures
Alameda County, Oakland, USA, Report 2006
Generalidad de Catalunya, LA SALUT I ELS SERVEIS SANITARIS A CATALUNYA La visió dels ciutadans l’any 2002
Trento
Barre a 3 dimensioni?
NO, grazie
Barre a 3 dimensioni?
NO, grazie
Ancora sul 3D…
Handle with care!
Nobiltà e miserie dei grafici a torta
1 sola variabile, dato dicotomico
. tabulate eegseiz
EEG seizure |
activity |
within 48 |
postoperati |
ve hours | Freq. Percent Cum.
------------+-----------------------------------
0 | 109 80.15 80.15
1 | 27 19.85 100.00
------------+-----------------------------------
Total | 136 100.00
graph pie, over(eegseiz) angle(90) pie( 1, color(ltblue))pie( 2, color(blue)) title(EEG seizure activity) subtitle(within 48 hours since surgery) legend(rows(2)) legend(position(3) region(lcolor(none))) graphregion(fcolor(white))
graph pie, over(eegseiz) angle(90) pie( 1, color(ltblue))pie( 2, color(blue)) title(EEG seizure activity) subtitle(within 48 hours since surgery) legend(rows(2)) legend(position(3) region(lcolor(none))) graphregion(fcolor(white))
DIAGRAMMI A TORTA
Può essere rappresentato un solo carattere
Le modalità sono rappresentate da spicchi della torta
L’ area della torta è proporzionale alla frequenza relativa della modalitàSTATA: graph <5 5_17 18_64 >65, pie
STATA: graph <5 5_17 18_64 >65, pie
Torte 2D e torte 3D
Locri 2002
Torte affiancate
graph pie eegseiz noeegseiz, angle(90) by(dhca) pie( 2, color(ltblue))
Low Flow By-pass Deep Hypothermic Circulatory Arrest
EEG seizure activity within 48 postoperative hours noeegseiz
Graphs by Deep Hypothermic Circulatory Arrest (1=yes; 2=low-flow bypass)
Torte con aree ridimensionate
LFB (n=62) DHCA (n=74)
2*r=2*RADQ(n/PI.GRECO())
2*RADQ(62/3.14)=8.885
2*r=2*RADQ(n/PI.GRECO())
2*RADQ(62/3.14)=8.885
rr
2*RADQ(74/3.14)=9.7072*RADQ(74/3.14)=9.707
Molte variabili da presentare insieme?
I grafici “mutivariati”
DIAGRAMMI POLARI o A STELLA Sono grafici multivariati
da usare per piu’ variabili o per rappresentare andamenti temporali
ciclici
A ciascun braccio della stella corrisponde un diverso carattere numerico
Le braccia adiacenti sono collegate da linee rette
La forma generale delle stelle vuole evidenziare a prima vista deviazioni dalla regolarità
Il diverso sviluppo delle braccia per raggruppamenti diversi fa risaltare le caratteristiche distintive
Rapporti standardizzati di mortalita' - per causa - 1996
Circ XVII
Circ XVIII
Circ XIX
Circ XX
Tutte Infettive Tumori Leucemie
Diabete M. Circolator Ipertensione Infarto
IMA Cirrosi Traumatismi
Star plot multivariato(Da: Vitullo, Carinci, Lepore, Tognoni, Aziende sanitarie e
modello di uso dei DRG, Il Pensiero Scientifico Editore, 1997)
Starplot multivariato
0
20
40
60
80
100
120
140
N. medio dimessi/ die
% DRG Chirurgici
% DRG Specialistici
I CM (solo ricoveri >1 gg)
I CP (solo ricoveri >1 gg)% da provincia (>1gg)
% da regione, altra prov. (>1gg)
% da prov. confine (>1gg)
% altre provincie (>1 gg)
Primario 1 (valori indice=100)
Primario 2
Primario 3
Starplot multivariato
0
20
40
60
80
100
120
140
160
% DRG Chirurgici
% DRG Specialistici
I CM (anche ricoveri 0-1 gg)
I CM (solo ricoveri >1 gg)
I CP (anche ricoveri 0-1 gg)
I CP (solo ricoveri >1 gg)
N. medio dimessi/ die
% da provincia (tutti)% da provincia (>1gg)
% da regione, altra prov. (tutti)
% da regione, altra prov. (>1gg)
% da prov. confine (tutti)
% da prov. confine (>1gg)
% da altre provincie (tutti)
% altre provincie (>1 gg)
Primario 1 (valori indice=100)
Primario 2
Primario 3
ERA, Epidemiologia e Ricerca Applicata, Atlante 2006, Mortalità evitabile e contesto demografico per ASL
Small multiples – Regione Piemonte, La salute in Piemonte, maggio 2006
Small multiples
Relazione Sanitaria
2004OER Abruzzo
DISTRETTO CIRCOSCRIZIONE
Mortalità evitabile con prevenzione primaria - Sesso M(Età: 5-64 anni; Tumori maligni prime vie aerodigestive, Tumori fegato, Tumori polmone, Tumori
vescica, Disturbi circolatori dell’ encefalo, Cirrosi epatica, Morti violente)
CLUSTER
Dati Ufficio di Statistica, Comune
di Roma, anni 1995/96
SM
R
Suddivisione territorialeRME A B XVII XVIII XIX XX Cl. 1 Cl. 2 Cl. 3 Cl. 4
.5
.6
.75
1
1.33
1.66
1.99
.5
.85
1
1.17
1.991.99
1.17
0.85
0.50
RSM
1 = Comune di Roma
Mortalità evitabile con diagnosi precoce e terapia - Sesso F(Età: 5-64 anni;Tumori della mammella, Tumori del collo utero, Tumori corpo utero, Tumori della cute escluso
melanoma, Malattia di Hodgkin)
DISTRETTO CIRCOSCRIZIONE CLUSTER
Dati Ufficio di Statistica, Comune
di Roma, anni 1995/96
2.30
1.23
0.90
0.43
RSM
1 = Comune di Roma
Suddivisione territorialeRME A B XVII XVIII XIX XX Cl. 1 Cl. 2 Cl. 3 Cl. 4
.43
.53
.69
1
1.44
1.87
2.3
Top Related