Importanza della rappresentazione dei dati Prof. Giovanni Capelli Cattedra di Igiene Dipartimento di...

Post on 01-May-2015

216 views 0 download

Transcript of Importanza della rappresentazione dei dati Prof. Giovanni Capelli Cattedra di Igiene Dipartimento di...

Importanza della rappresentazione dei dati

Prof. Giovanni Capelli

Cattedra di Igiene Dipartimento di Scienze Motorie e della Salute

Facoltà di Scienze Motorie - Università di Cassino

Epidemiologia e flusso di dati nella prevenzionePescara, 14 settembre2009

Epidemiologia e flusso di dati nella prevenzionePescara, 14 settembre2009

Dati Elementari

il DATO è una descrizione originaria e non interpretata di un evento è la materia prima del processo di costruzione

delle informazioni è costituito da gruppi di simboli (lettere,

numeri, caratteri speciali) che rappresentano quantità, azioni, cose, ecc.

il DATO INIZIALE o ELEMENTARE è la rappresentazione oggettiva di fenomeni o eventi reali

Dati sintetici i dati sintetici si possono considerare

equivalenti ad un “prodotto semilavorato intermedio” di un processo produttivo il processo di sintesi che permette di generare

un dato sintetico a partire da più dati elementari modifica il potenziale informativo iniziale

Informazioni E’ INFORMAZIONE tutto ciò che

produce variazione nel patrimonio conoscitivo di un soggetto Il concetto di informazione fa riferimento al suo

percettore, al suo utilizzatore L’ INFORMAZIONE è un dato che è stato

sottoposto ad un processo che lo ha reso significativo per il destinatario e realmente importante per il suo processo decisionale presente o futuro

L’ INFORMAZIONE è relativa: sussiste solo se destinata a qualcuno per qualche scopo

Decisioni Definizione: una particolare classe di

INFORMAZIONI che ha lo scopo di provocare AZIONI determinate; Perchè ciò avvenga, si richiede:

la definizione di una SITUAZIONE FINALE da raggiungere

la definizione di una SITUAZIONE PRESENTE, che è quella riferita dal sistema informativo

L’identificazione delle AZIONI DA COMPIERSI in conformità ad una “politica” prestabilita

L’uso delle informazioni appare finalizzato all’attività decisionale;

Perché la rappresentazione sintetica dei dati è importante?

Visual e Statistical Thinking

Quando si ragiona su prove quantitative, certi metodi di rappresentazione ed analisi dei dati sono meglio di altri.

I metodi migliori sono anche quelli che hanno le maggiori opportunità di produrre risultati veritieri, credibili e precisi

La differenza tra una analisi eccellente e una sbagliata qualche volta comporta conseguenze importantiTufte ER, Visual Explanations. Images and Quantities, Evidence and Narrative,

1997

John Snow e il Colera a Londra

Londra, UK

settembre 1854

La mappa di John Snow

Mettere i dati nel contesto appropriato per valutare causa ed

effetto I dati che Snow aveva a disposizione erano

una lista di nomi dei deceduti, i loro indirizzi, le date del loro decesso

La più naturale delle descrizioni era la rappresentazione della serie temporale, la “curva epidemica” dei decessi

Ma la narrazione descrittiva non è spiegazione il solo passare del tempo non sempre spiega tutto

e John Snow decise di usare una mappa dove presentava gli EFFETTI, i decessi ma anche le ESPOSIZIONI, le pompe

l’ aggregarsi di esposizioni ed effetti nello spazio, il clustering, indicava associazione

Lezioni da questo caso

Snow ebbe una “buona idea” una teoria causale sulla diffusione della malattia che

lo guidò nella raccolta dei dati

Snow aveva studiato le epidemie precedenti

conosceva la situazione ed era preparato a raccogliere i dati “giusti”

Snow usò un metodo giusto, basato su: Mettere i dati nel contesto appropriato per valutare

causa ed effetto Fare comparazioni quantitative Considerare spiegazioni alternative e casi contrari Valutare i possibili errori nei numeri riportati sui

grafici

Il lancio dello Space Shuttle Challenger

Kennedy Space Center, Cape Canaveral, FL, USA

27 gennaio 1986

La 25a missione Shuttle

Il tragico lancio dello Shuttle Challenger

Il giorno prima del lancio, la temperatura prevista per il giorno successivo era tra 26 e 29° F (tra -3 e -1 °C) preoccupati che ad una simile temperatura le guarnizioni

ad O potessero non isolare, gli ingegneri della Morton Tiokol (costruttrice dei motori a propellente solido) si erano opposti al lancio

per sostenere la loro posizione, inviarono via fax alla NASA 13 lucidi

un alto ufficiale della NASA rispose che era “terrorizzato” dalla raccomandazione di non lanciare, e invitò la Morton Tiokol a rivedere la sua posizione nonostante fosse la prima volta in 12 anni, che la casa

sconsigliava un lancio Altri ufficiali della NASA evidenziarono punti di debolezza nel

materiale presentato dalla Tiokol

I dati dei lanci di Shuttle

precedenti al Challenger

Il tragico lancio dello Shuttle Challenger

Di fronte a queste posizioni, i Manager della Morton Tiokol cambiano idea e decidono che sono a favore del lancio per il giorno successivo

La domanda era dunque stata sollevata la notte prima del lancio

Ce la faranno domani ad isolare le guarnizioni ad O nonostante il freddo? Gli ingegneri avevano a disposizione tutti i dati

necessari per stimare che la probabilità di un evento disastroso era altissima,

Tuttavia il materiale da loro presentato non coglieva nel segno, non evidenziava l’ importanza della temperatura nel comportamento delle guarnizioni

Un grafico costruito male non aiuta a capire i dati…

Sarebbe bastato spostare la visuale nella zona con meno dati (le temperature basse) e proporre un modello di previsione di probabilità (a destra) per valutare correttamente il rischio!

Thinking and Design: Prima pensare e poi rappresentare

La logica della rappresentazione dei dati deve rispecchiare la logica dell’analisi: la rappresentazione grafica dei risultati deve seguire i principi del ragionamento quantitativo tipica della scienza. La struttura grafica deve riassumere il ragionamento quantitativo utilizzato per raggiungere i risultati. E allora dovremo:

Avere ben presenti le fonti e le caratteristiche dei dati utilizzati

Proporre appropriati confronti

Prendere in esame e presentare meccanismi di causa ed effetto

Esprimere le relazioni causa-effetto in modo quantitativo

Riconoscere la intrinseca natura multivariata dei fenomeni analizzati

Valutare spiegazioni alternativeTufte ER, Visual Explanations. Images and Quantities, Evidence and Narrative,

1997

Tabelle e Grafici: due mondi o un continuum?

TABELLE Organizzazione spazio

righe e colonne discreto

Elementi testo, numeri

Quantità numeri

Vantaggi comparazioni

simultanee

GRAFICI Organizzazione spazio

piano “cartesiano” (piani angolari)

continui

Elementi grafici 2 dimensioni

punto, linea, area

testo, numeri Quantità

posizione area

Vantaggi immediatezza

Elting LS, Martin CG, Cantor SB, et al., Influence of data display formats on physician investigator’s decisions to stop clinical trials: prospective trial with repeated measures - BMJ 1999, 318:1527-1531

Graphical excellence

Una buona rappresentazione dei dati dovrà: mostrare i dati indurre chi guarda a riflettere sulla sostanza

piuttosto che sui metodi, il disegno grafico, la tecnologia di produzione grafica

evitare di distorcere ciò che i dati hanno da dire presentare molti numeri in poco spazio rendere coerenti grandi set di dati incoraggiare l’occhio a comparare diversi aspetti dei dati presentare i dati a diversi livelli di dettaglio

da una visione d’insieme fino alla struttura fine servire un obiettivo ragionevole:

descrivere, esplorare, tabulare, decorare essere fortemente integrata con le descrizioni verbali e

statistiche dei dati

Edward E. Tufte, The visual display of quantitative information, Graphics Press, 1983

Graphical elegance is often found in simplicity of design and complexity of

data Rappresentazioni di dati statistici attraenti:

sono realizzate con schema e formato appropriati utilizzano parole, numeri e disegni insieme sono il risultato di un bilanciamento, una valutazione

delle proporzioni, una riflessione sulla scala dei fenomeni mostrano un dettaglio di complessità accessibile hanno spesso qualità narrativa

hanno una storia da raccontare sui dati sono realizzati in maniera professionale

con attenzione e cura ai dettagli tecnici evitano la decorazione fine a sè stessa

inclusa la “spazzatura grafica” di retinati, colori sgargianti, ecc.

Edward E. Tufte, The visual display of quantitative information, Graphics Press, 1983

Quanto è veloce l’uomo?

Ecco il disastro della campagna di Russia di Napoleone:

Spazio Tempo Numerosità

dell’esercito Andata

(chiaro) Ritorno

(nero)

da EJ Marey, La methode graphique, Paris, 1885 (Carte Figurative de M.

Minard)

da EJ Marey, La methode graphique, Paris, 1885 (Carte Figurative de M.

Minard)

Le tabelle: qualche esempio

Qual è il criterio di ordinamento di questa tabella?

Qual è il criterio di ordinamento di questa tabella?

Non sempre grafica e colori vogliono dire una buona presentazione dei dati:

in questo grafico è impossibile distinguere a prima vista i totali delle diverse ASL della provincia di Bolzano

Dalla distinzione delle caselle alla continuità dei fenomeni: I

grafici

Piano cartesiano = spazio bidimensionale

Rappresentare posizioni nello spazio: le 1000 anime delle mappe

Mappe per punti: collocare un fenomeno nello

spazio13

0000

1400

0015

0000

1600

0017

0000

Latit

udi

ne N

ord

(sec

ondi

)

20000 30000 40000 50000 60000 70000Longitudine da Greenwich (sec.)

Dati ISTAT 1998

Coordinate geograficheI comuni d'Italia

Mappe areali: utilizzare un confine

“amministrativo” (integrazione spaziale)

Relazione Stato

Sanitario Italia 2003-

2004

Relazione sullo stato di salute della popolazione pugliese, 2005

Indici di vecchiaia a Roma(Quintili)

Per analizzare bacini d’utenza

(Da: Vitullo, Carinci, Lepore, Tognoni, Aziende sanitarie e

modello di uso dei DRG, Il Pensiero Scientifico Editore,

1997)

Il piano cartesiano “scorre”per rappresentare il tempo

Rappresentare variazioni nel tempo: serie temporali, grafici lineari, grafici “ciclici”

Variazioni della glicemia nel tempo

da SM Powsner, ER Tufte, Graphical summary of patient status, Lancet, 344: 386-389, 1994

da SM Powsner, ER Tufte, Graphical summary of patient status, Lancet, 344: 386-389, 1994

Diagrammi lineari

Ciascun punto sul grafico rappresenta una coppia di modalità

Ciascun valore sull’ asse x ha un solo valore sull’ asse y

I punti adiacenti sono collegati da linee rette

In genere, la scala sull’ asse x rappresenta il tempo è così possibile seguire il

comportamento del carattere riportato in y in un determinato periodo

Relazione sullo stato di salute della popolazione

pugliese, 2005

Pertosse" - ROMA"

Tass

o pe

r 10

0.00

0 ab

.

Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97

0

5

10

15

Pertosse" - Distretto A"

Tass

o pe

r 10

0.00

0 ab

.

Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97

0

5

10

15

Pertosse" - ASL RME"

Tass

o pe

r 10

0.00

0 ab

.

Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97

0

5

10

15

Pertosse" - Distretto B"

Tass

o pe

r 10

0.00

0 ab

.

Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97

0

5

10

15

Pertosse - RM/E (1991-1997)

Salmonellosi" - ROMA"

Tass

o pe

r 10

0.00

0 ab

.

Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97

0

8

16

24

Salmonellosi" - Distretto A"

Tass

o pe

r 10

0.00

0 ab

.

Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97

0

8

16

24

Salmonellosi" - ASL RME"

Tass

o pe

r 10

0.00

0 ab

.

Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97

0

8

16

24

Salmonellosi" - Distretto B"

Tass

o pe

r 10

0.00

0 ab

.

Jan91 Jul91 Jan92 Jul92 Jan93 Jul93 Dec93 Jun94 Dec94 Jun95 Dec95 Jun96 Dec96 Jun97 Dec97

0

8

16

24

Salmonellosi - RM/E (1994-1997)

Anche la pausa è musica!

Se non ci sono dati, è bene saperlo…

Usare l’ “indicizzazione”

1985: anno “indice”1985: anno “indice”

Come far vedere una crescita che non c’è…

Anche con le scale indicizzate si può giocare…

Serie cicliche: i “coxcombs”

Tempo ciclico e tempo lineare a confronto

Attività settimanale di ricovero

0

50

100

150

200

250

300

350

400

Domenica Lunedi' Martedi' Mercoledi' Giovedi' Venerdi' Sabato

Rico

veri

Cardiochirurgia

Emodinamica

Attività settimanale di ricovero

0

50

100

150

200

250

300

350Domenica

Lunedi'

Martedi'

Mercoledi'Giovedi'

Venerdi'

Sabato

Cardiochirurgia

Emodinamica

E… se lo spazio cartesianofosse uno spazio “virtuale”?

Gli infiniti universi dei grafici a dispersione (scatterplot)

DIAGRAMMI DI DISPERSIONEA DUE DIMENSIONI

Sono utili per illustrare la relazione tra due diversi caratteri che assumono modalità numeriche

Ogni punto del grafico rappresenta una unità statistica

la scala per un carattere è riportata nell’ asse x e la scala per l’ altro nell’ asse y

Se i due caratteri non sono correlati, i punti si distribuiscono casualmente su tutto il piano cartesiano

STATA: twoway (scatter marriage pop, msize(medium)), xlabel(, angle(forty_five)) caption(1980 U.S. census data, size(small))

050

,000

100,

000

150,

000

200,

000

Num

ber o

f mar

riage

s

0

5,000

,000

10,00

0,000

15,00

0,000

20,00

0,000

25,00

0,000

Population1980 U.S. census data

DIAGRAMMI DI DISPERSIONEA DUE DIMENSIONI

STATA: twoway (scatter marriage pop, msize(small) mlabel(state) mlabsize(small) mlabcolor(red)), xlabel(, angle(forty_five)) caption(1980 U.S. census data, size(small))

STATA: twoway (scatter marriage pop, msize(small) mlabel(state) mlabsize(small) mlabcolor(red)), xlabel(, angle(forty_five)) caption(1980 U.S. census data, size(small))

Alabama

Alaska

ArizonaArkansas

California

ColoradoConnecticut

Delaware

Florida

Georgia

HawaiiIdaho

Illinois

Indiana

IowaKansasKentucky

Louisiana

Maine

MarylandMassachusetts

Michigan

MinnesotaMississippi

Missouri

MontanaNebraska

Nevada

New Hampshire

New Jersey

New Mex ico

New York

N. Carolina

N. Dakota

Ohio

Oklahoma

Oregon

Pennsylvania

Rhode Island

S. Carolina

S. Dakota

Tennessee

Tex as

UtahVermont

VirginiaWashington

W. Virginia

Wisconsin

Wyoming

050

,000

100,

000

150,

000

200,

000

Num

ber o

f mar

riage

s

0

5,000

,000

10,00

0,000

15,00

0,000

20,00

0,000

25,00

0,000

Population1980 U.S. census data

Num

ber o

f mar

riage

s

Population0 5.0e+06 1.0e+07 1.5e+07 2.0e+07 2.5e+07

0

50,000

100000

150000

200000

DIAGRAMMI DI DISPERSIONEA DUE DIMENSIONI

STATA: gr7 marriage pop, oneway twoway xlab(0 (0.5e+07) 2.5e+07) ylab(0 (50000) 200000)STATA: gr7 marriage pop, oneway twoway xlab(0 (0.5e+07) 2.5e+07) ylab(0 (50000) 200000)

TrendTrend

OutliersOutliers

ClusteringClustering

DIAGRAMMI DI DISPERSIONEA DUE DIMENSIONI

STATA: twoway (scatter marriage pop), by( region)STATA: twoway (scatter marriage pop), by( region)

050

,000

100,

00015

0,00

0200,

000

050

,000

100,

00015

0,00

0200,

000

0 10,000,000 20,000,000 30,000,0000 10,000,000 20,000,000 30,000,000

NE N Cntrl

South West

Num

ber o

f mar

riage

s

PopulationGraphs by Census region

ICP

---

>

ICM --->.33 .5 1 2 3

.33

.5

1

2

3

Med.GeneraleEndocrino

Ematologia

Ch.Generale1

Ch.Generale2

Ch.Urgenza

Ginec.Ostet.2

UTIC

Rianimaz.

Mal.Infett.

Pneumologia

Ortopedia

Oculistica

Pediatria

Neonatol.

Nido

ORL

Geriatria

PsichiatriaGinec.Ostet.1

Cardio Medica

Cardio Emodinam.

Urologia

Cardiochirurgia

Litotrissia

Nefrologia

Neurochir.

Neurologia

Oncologia Med.

ICP

---

>

ICM --->.33 .5 1 2 3

.33

.5

1

2

3

Med.Generale

Endocrino

Ematologia

Ch.Generale1Ch.Generale2

Ch.Urgenza

Ginec.Ostet.2

UTIC

Rianimaz.

Mal.Infett.

Pneumologia

Ortopedia

Oculistica

Pediatria

Neonatol.

Nido

ORLGeriatria

Psichiatria

Ginec.Ostet.1

Cardio Medica

Cardio Emodinam.

UrologiaCardiochirurgiaLitotrissia

Nefrologia

Neurochir.

Neurologia

ICP

---

>

ICM --->.33 .5 1 2 3

.33

.5

1

2

3

Med.Generale

Endocrino

EmatologiaCh.Generale1

Ch.Generale2Ch.Urgenza

Ginec.Ostet.2

UTIC

Rianimaz.

Mal.Infett.Pneumologia

Ortopedia

Oculistica

Pediatria

Neonatol.

Nido

ORL

Geriatria

Psichiatria

Ginec.Ostet.1

Cardio MedicaCardio Emodinam.

UrologiaCardiochirurgia

Litotrissia

Nefrologia

Neurochir.

Neurologia

Oncologia Med.

ICP

---

>

ICM --->.33 .5 1 2 3

.33

.5

1

2

3

Med.Generale

Endocrino

EmatologiaCh.Generale1

Ch.Generale2

Ch.Urgenza

Ginec.Ostet.2

UTIC

Rianimaz.

Mal.Infett.

PneumologiaOrtopedia

Oculistica

Pediatria

Neonatol.

NidoORL

GeriatriaPsichiatria

Ginec.Ostet.1

Cardio Medica

Cardio Emodinam.

Urologia

Cardiochirurgia

Litotrissia

Nefrologia

Neurochir.

Neurologia

Oncologia Med.

1996 1997

1998 1999

Standard diriferimento

Complessità della casistica (ICM) 0

1 0

1

Effi

cien

za (

ICP)

QuadrantePROBLEMATICO

Complessità: SCARSAEfficienza: SCARSA

TranquillaComplessità

Complessità: ELEVATAEfficienza: SCARSA

EfficienteSemplicità

Complessità: SCARSAEfficienza: ELEVATA

Quadrante VIRTUOSO

Complessità: ELEVATAEfficienza: ELEVATA

ICP

Graphs by RepartoIC M

Cardio Emodinam.

.5

.66

1

1.5

2

1 9 9 6

1 9 9 71 9 9 8

1 9 9 9

Cardio Medica

.5 .66 1 1.5 2

1 9 9 6

1 9 9 7

1 9 9 81 9 9 9

Cardiochirurgia

.5 .66 1 1.5 2

.5

.66

1

1.5

21 9 9 6

1 9 9 71 9 9 8

1 9 9 9

ICP

Graphs by RepartoICM

Neurochir.

.5

.66

1

1.5

21996

1997

1998

1999

Neurologia

19961997

1998

1999

ORL

.5 .66 1 1.5 2

.5

.66

1

1.5

2

1996

1997

1998

1999

Oculistica

.5 .66 1 1.5 2

1996

1997

1998

1999

Infine, qualcosa di più semplice: e se studiassimo la distribuzione di

frequenza di singole “variabili”?

Dati numerici continui: istogrammi, diagrammi a scatola (box-plot)

Dati categorici: Grafici a barre, Grafici a torta

Sono il pane quotidiano -> MA: non sempre la farina è buona!

Istogrammi e altre modi per presentare la frequenza di classi di

valori continui

ISTOGRAMMI

Modalità numericheModalità numeriche

Frequenza

delle

oss

erv

azi

oni

Frequenza

delle

oss

erv

azi

oni

00

nn

I dati vengono divisi in classi

in questo caso 6 classi con un intervallo non costante

Per ogni gruppo si costruisce un rettangolo:

la posizione della base del rettangolo corrisponde ai margini dell’ intervallo (è quantitativa)

l’ area del rettangolo è proporzionale alla frequenza rilevata per il gruppo

La scala utilizzata per gli assi deve consentire la visualizzazione dei rettangoli interi

00

11

44

1313

5.55.5

77

1616

Mod

alità

num

eric

he

Frequenza delle osservazioni

0n01

4

13

5.5

7

16

STATA:graph twoway (histogram eta)STATA:graph twoway (histogram eta)

Un utilizzo dell’istogramma: la Piramide di età

Un altro utilizzo dell’istogramma: la valutazione di “normalità” (distribuzione

gaussiana)Fr

actio

n

Psychomotor Development Index at45 55 65 75 85 95 105 115 125 135 145 155

0

.1

.2

.3

DistribuzioniF

rac

tio

n

Peso alla nascita (grammi)1000 2000 3000 4000 5000

0

.1

.2

.3

Fra

cti

on

Peso alla nascita (grammi)1000 2000 3000 4000 5000

0

.1

.2

.3

Normale

Fra

cti

on

Eta' del padre (anni)20 30 40 50

0

.05

.1

.15

.2

Fra

cti

on

Eta' del padre (anni)20 30 40 50

0

.05

.1

.15

.2

Non normaleasimmetrica a destra

1 istogramma, 2 sottogruppi

05

1015

2025

Perc

ent

0 10 20 30 40 50 60 70 80 90 100 110Duration of circulatory arrest (minutes)

histogram minutes, width(10) start(0) percent bfcolor(yellow) blcolor(gold) normal normopts( clcolor(red) clpat(dot) ) kdensity kdenopts( clcolor(blue) ) xlabel( 0 (10) 110) plotregion(margin(zero))

histogram minutes, width(10) start(0) percent bfcolor(yellow) blcolor(gold) normal normopts( clcolor(red) clpat(dot) ) kdensity kdenopts( clcolor(blue) ) xlabel( 0 (10) 110) plotregion(margin(zero))

Frac

tion

Histograms by Deep Hypothermic Circulatory Arrest (1=yes; 2=low-Duration of circulatory arrest (

dhca==0

0 20 40 60 80 100 1200

.2

.4

.6

dhca==1

0 20 40 60 80 100 120

Distribuzioni

SimmetricaAsimmetrica a destra

Durata dell’intervento chirurgico (minuti)Durata dell’intervento chirurgico (minuti)

Come presentare indici numerici in modo grafico: il diagramma a

scatola o box-plot

Il diagramma a scatola (Box-Plot)

0

7

14

30

Degenza preoperatoria

Prof. Uno Prof. Due Prof. Tre

Mediana(50° percentile)

Intervallo Interquartile (IQR)(75°-25° percentile)

Valori adiacenti(estremi ma di non

più di 1,5 IQR)

Conta la leggibilità, non l’orientamento…

0 7 14 30Degenza preoperatoria

Prof. Tre

Prof. Due

Prof. Uno

Presentare categorie: le mille anime del diagramma a barre

Diagrammi a barre Le modalità qualitative sono

riportate in ascissa asse X qualitativo

Per ogni gruppo si costruisce un rettangolo:

la posizione della base del rettangolo (di larghezza costante) è centrata sul nome della modalità

l’ area del rettangolo è proporzionale alla frequenza rilevata per il gruppo

La scala utilizzata per gli assi deve consentire la visualizzazione dei rettangoli interi

AA BB CC DD

Modalità qualitatitiveModalità qualitatitive

Frequenza

delle

oss

erv

azi

oni

Frequenza

delle

oss

erv

azi

oni

00

nn

Relative frequency of bacterial species/groups encountered in clinical specimens from inpatients

Diagrammi a barre sovrapposte

In un diagramma a barre possono essere rappresentate anche più variabili

Nell’esempio, le variabili prese in esame sono: Lo status di fumatore

Non fumatore, fumatore e forte fumatore La presenza di un ev. coronarico acuto, evidenziata in rosso

05

1015

num

ero

di s

ogge

tti

non fumatore fumatore forte fumatore

Diagrammi a barre sovrapposte

In questo esempio, sono riportati i valori di frequenza relativa (percentuale) di un ev. coronarico acuto, evidenziati in rosso

020

4060

8010

0P

erce

ntua

le d

i sog

getti

non fumatore fumatore forte fumatore

Barre affiancate

020

4060

Num

ber o

f chi

ldre

n

Low Flow By-Pass Deep Hypothermic Circulatory Arrest

EEG seizure activity within 48 h since surgery

EEG seizures No EEG seizures

Alameda County, Oakland, USA, Report 2006

Generalidad de Catalunya, LA SALUT I ELS SERVEIS SANITARIS A CATALUNYA La visió dels ciutadans l’any 2002

Trento

Barre a 3 dimensioni?

NO, grazie

Barre a 3 dimensioni?

NO, grazie

Ancora sul 3D…

Handle with care!

Nobiltà e miserie dei grafici a torta

1 sola variabile, dato dicotomico

. tabulate eegseiz

EEG seizure |

activity |

within 48 |

postoperati |

ve hours | Freq. Percent Cum.

------------+-----------------------------------

0 | 109 80.15 80.15

1 | 27 19.85 100.00

------------+-----------------------------------

Total | 136 100.00

graph pie, over(eegseiz) angle(90) pie( 1, color(ltblue))pie( 2, color(blue)) title(EEG seizure activity) subtitle(within 48 hours since surgery) legend(rows(2)) legend(position(3) region(lcolor(none))) graphregion(fcolor(white))

graph pie, over(eegseiz) angle(90) pie( 1, color(ltblue))pie( 2, color(blue)) title(EEG seizure activity) subtitle(within 48 hours since surgery) legend(rows(2)) legend(position(3) region(lcolor(none))) graphregion(fcolor(white))

DIAGRAMMI A TORTA

Può essere rappresentato un solo carattere

Le modalità sono rappresentate da spicchi della torta

L’ area della torta è proporzionale alla frequenza relativa della modalitàSTATA: graph <5 5_17 18_64 >65, pie

STATA: graph <5 5_17 18_64 >65, pie

Torte 2D e torte 3D

Locri 2002

Torte affiancate

graph pie eegseiz noeegseiz, angle(90) by(dhca) pie( 2, color(ltblue))

Low Flow By-pass Deep Hypothermic Circulatory Arrest

EEG seizure activity within 48 postoperative hours noeegseiz

Graphs by Deep Hypothermic Circulatory Arrest (1=yes; 2=low-flow bypass)

Torte con aree ridimensionate

LFB (n=62) DHCA (n=74)

2*r=2*RADQ(n/PI.GRECO())

2*RADQ(62/3.14)=8.885

2*r=2*RADQ(n/PI.GRECO())

2*RADQ(62/3.14)=8.885

rr

2*RADQ(74/3.14)=9.7072*RADQ(74/3.14)=9.707

Molte variabili da presentare insieme?

I grafici “mutivariati”

DIAGRAMMI POLARI o A STELLA Sono grafici multivariati

da usare per piu’ variabili o per rappresentare andamenti temporali

ciclici

A ciascun braccio della stella corrisponde un diverso carattere numerico

Le braccia adiacenti sono collegate da linee rette

La forma generale delle stelle vuole evidenziare a prima vista deviazioni dalla regolarità

Il diverso sviluppo delle braccia per raggruppamenti diversi fa risaltare le caratteristiche distintive

Rapporti standardizzati di mortalita' - per causa - 1996

Circ XVII

Circ XVIII

Circ XIX

Circ XX

Tutte Infettive Tumori Leucemie

Diabete M. Circolator Ipertensione Infarto

IMA Cirrosi Traumatismi

Star plot multivariato(Da: Vitullo, Carinci, Lepore, Tognoni, Aziende sanitarie e

modello di uso dei DRG, Il Pensiero Scientifico Editore, 1997)

Starplot multivariato

0

20

40

60

80

100

120

140

N. medio dimessi/ die

% DRG Chirurgici

% DRG Specialistici

I CM (solo ricoveri >1 gg)

I CP (solo ricoveri >1 gg)% da provincia (>1gg)

% da regione, altra prov. (>1gg)

% da prov. confine (>1gg)

% altre provincie (>1 gg)

Primario 1 (valori indice=100)

Primario 2

Primario 3

Starplot multivariato

0

20

40

60

80

100

120

140

160

% DRG Chirurgici

% DRG Specialistici

I CM (anche ricoveri 0-1 gg)

I CM (solo ricoveri >1 gg)

I CP (anche ricoveri 0-1 gg)

I CP (solo ricoveri >1 gg)

N. medio dimessi/ die

% da provincia (tutti)% da provincia (>1gg)

% da regione, altra prov. (tutti)

% da regione, altra prov. (>1gg)

% da prov. confine (tutti)

% da prov. confine (>1gg)

% da altre provincie (tutti)

% altre provincie (>1 gg)

Primario 1 (valori indice=100)

Primario 2

Primario 3

ERA, Epidemiologia e Ricerca Applicata, Atlante 2006, Mortalità evitabile e contesto demografico per ASL

Small multiples – Regione Piemonte, La salute in Piemonte, maggio 2006

Small multiples

Relazione Sanitaria

2004OER Abruzzo

DISTRETTO CIRCOSCRIZIONE

Mortalità evitabile con prevenzione primaria - Sesso M(Età: 5-64 anni; Tumori maligni prime vie aerodigestive, Tumori fegato, Tumori polmone, Tumori

vescica, Disturbi circolatori dell’ encefalo, Cirrosi epatica, Morti violente)

CLUSTER

Dati Ufficio di Statistica, Comune

di Roma, anni 1995/96

SM

R

Suddivisione territorialeRME A B XVII XVIII XIX XX Cl. 1 Cl. 2 Cl. 3 Cl. 4

.5

.6

.75

1

1.33

1.66

1.99

.5

.85

1

1.17

1.991.99

1.17

0.85

0.50

RSM

1 = Comune di Roma

Mortalità evitabile con diagnosi precoce e terapia - Sesso F(Età: 5-64 anni;Tumori della mammella, Tumori del collo utero, Tumori corpo utero, Tumori della cute escluso

melanoma, Malattia di Hodgkin)

DISTRETTO CIRCOSCRIZIONE CLUSTER

Dati Ufficio di Statistica, Comune

di Roma, anni 1995/96

2.30

1.23

0.90

0.43

RSM

1 = Comune di Roma

Suddivisione territorialeRME A B XVII XVIII XIX XX Cl. 1 Cl. 2 Cl. 3 Cl. 4

.43

.53

.69

1

1.44

1.87

2.3