Università del Piemonte Orientale Corso di Laurea in...

61
Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 1 Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Statistica Descrittiva

Transcript of Università del Piemonte Orientale Corso di Laurea in...

Page 1: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 1

Università del Piemonte Orientale

Corso di Laurea in Medicina e Chirurgia

Corso di Statistica Medica

Statistica Descrittiva

Page 2: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 2

I dati costituiscono la ‘materia prima’ su cui lavora lo statistico.

I dati vengono forniti dai soggetti che sono coinvolti nella ricerca.

I dati vengono raccolti, elaborati e sintetizzati al fine di ottenere:

- un messaggio sintetico (statistica descrittiva)

- leggi generali ottenute da un numero limitato di osservazioni

ma valide per tutti i soggetti con caratteristiche analoghe

(statistica inferenziale).

Page 3: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 3

Tipi di dati

- Categorici Binari

Nominali

Ordinali

- Quantitativi o numerici

Attenzione: Il tipo di dato condiziona la scelta del

metodo statistico!

Page 4: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 4

Dati categorici

Binari presentano due soli valori: presente (codificato di regola come 1)

ed assente (codificato di regola come 0). [P&G, Tab.2.1]

Nominali Solo classificazione, senza ordinamento

Es sesso, specie, area geografica, scuola, tipo istologico, tipo

di neoplasia, codice di malattia, immunofenotipo di

leucemia…..

Ordinali Classificazione con ordinamento, ma distanza tra i valori non

misurabile o ignota

Es. Punteggio scolastico, valutazione clinica di gravità di un

sintomo, codice TNM, punteggio APGAR.

Page 5: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 5

Esempio di dati ordinali: Graduazione del performance status proposto dall’Eastern Cooperative Oncology

Group / ECOG.

Grado Descrizione

0 Paziente fisicamente attivo, in grado di svolgere senza restrizioni la normale attività

preterapia.

1 Paziente limitato nell’attività fisica massima; può essere seguito in ambulatorio e

svolgere un lavoro di entità leggera o di tipo sedentario.

2 Paziente in grado di accudire se stesso, ma incapace di svolgere ogni attività

lavorativa. Resta alzato per più del 50% delle ore di veglia.

3 Paziente in grado di accudire se stesso solo parzialmente e costretto a letto o seduto

per più del 50% delle ore di veglia

4 Paziente inabile, costretto permanentemente a letto o seduto e non più in grado di

accudire a se stesso.

5 Paziente morto

Fonte: Oken MM et al. Toxicity and response criteria of the Eastern Cooperative Oncology Group. Am

J Clin Oncol 5: 649-655; 1982.

Page 6: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 6

Esempio di dati ordinali: Graduazione del performance status secondo Karnofsky

Capace di esplicare attività

normale e di lavorare. Non è

necessaria alcuna particolare

assistenza.

100

90

80

Normale. Non ha sintomi o segni di malattia

Capace di attività normale. Lievi sintomi o segni di malattia

Attività normale con sforzo. Alcuni sintomi o segni di malattia

Incapace di lavorare. In grado

di vivere a casa e di occuparsi

delle proprie necessità

personali. E’ richiesto un certo

grado di assistenza

70

60

50

Può accudire se stesso. Incapace di condurre attività normale o

lavoro attivo.

Richiede assistenza occasionalmente, ma è in grado di

provvedere alla maggior parte delle proprie necessità.

Richiede notevole assistenza e frequenti prestazioni mediche.

Incapace di accudire a se

stesso. E’ richiesto il ricovero

ospedaliero. Progressione

rapida della malattia.

40

30

20

10

Costretto a letto. Richiede assistenza e cure speciali.

In condizioni serie. E’indicata l’ospedalizzazione.

In condizioni gravi. Sono necessari l’ospedalizzazione ed un

intenso trattamento generale di supporto.

In condizioni gravissime. Progressione rapida della malattia.

0 Paziente morto

Page 7: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 7

Dati Quantitativi o Numerici

Continui: possono assumere tutti i valori in un intervallo,

di regola sono prodotti da operazioni di misura (altezza, peso, valori

di laboratorio.

Discreti: quando solo alcuni valori sono possibili,

esempi:

- i valori corrispondenti a numeri reali interi come l’età in anni

compiuti

- il risultato di un conteggio.

In pratica, i dati numerici discreti e quelli continui vengono trattati in modo

analogo

Page 8: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 8

Obiettivo della statistica descrittiva:

Sintetizzare ed organizzare le informazioni contenute in una serie

di dati, al fine di:

o presentazione

o esame preliminare ad analisi più complesse

Requisiti

o Mirare agli aspetti essenziali

o Sintesi

o Facilità di comprensione

Page 9: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 9

Nel linguaggio statistico alla parola DATO viene spesso sostituita con la

parola VARIABILE I dati di interesse vengono raccolti (misurati) per tutti i soggetti inclusi

nella popolazione o nel campione. Il termine ‘variabile’ sottolinea che il

valore cambia da un soggetto all’altro. I dati che non cambiano di valore

sono denominati ‘costanti’.

Alcune definizioni di ‘variabile’:

- ‘una caratteristica che varia da un’entità biologica ad un’altra’ (J.H.Zar)

- ‘qualunque genere di misura di cui si eseguano rilievi individuali è detta

variabile’ (P.Armitage)

Page 10: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 10

In modo analogo a quanto detto per i tipi di dati parliamo di tipo delle

variabili.

Page 11: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 11

Distribuzione di frequenza

La distribuzione di frequenza può essere calcolata per

- dati / variabili nominali

- dati / variabili ordinali

- dati / variabili numeriche

Page 12: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 12

Tabella con distribuzione di frequenza univariata. Tipo di dato/variabile: nominale Distribuzione di frequenza per immunofenotipo dei casi di leucemia linfoblastica acuta infantile diagnosticati in Piemonte (1979-98).

N %

Immunofenotipo

Non specificato

T

B

B precursor

35

54

12

397

7.0

10.8

2.4

79.7

Totale 498 100

Page 13: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 13

Tabella con distribuzione di frequenza univariata. Tipo di dato/variabile: numerica continua Esempio G.B. ( / ml) N (%)

Numero di globuli bianchi (G.B.) alla diagnosi

Non noto

<=9.999

10.000 - <50.000

>=50.000

5 (1.0)

235 (47.2)

167 (33.5)

91 (18.3)

Totale 498 (100)

Page 14: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 14

Costruzione di una distribuzione di frequenza: procedure Variabili categoriche:

1. definire i possibili valori della variabile

2. predisporre l’elenco dei possibili valori

3. contare quante osservazioni per ciascun valore (frequenza)

4. calcolare le corrispondenti proporzioni / percentuali) (frequenza

relativa)

Totalecategorianellaniosservazionumerooporzione ___Pr =

100*eproporzionePercentual =

Page 15: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 15

1. e 2.

Risultato scolastico Frequenza Proporzione

(frequenza relativa)

%

Insufficiente

Sufficiente

Buono

Distinto

Ottimo

Totale

n: numero di soggetti in ciascuna categoria della variabile

Proporzione: n / numero totale di soggetti

% = proporzione * 100

Page 16: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 16

3 e 4.

Risultato

scolastico

Frequenza Proporzione

(frequenza relativa)

%

Insufficiente 4 0.14 14 %

Sufficiente 8 0.28 28 %

Buono 7 0.25 25 %

Distinto 4 0.14 14 %

Ottimo 5 0.19 19 %

Totale 28 1.0 100 %

Page 17: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 17

www.man.deakin.edu.au/rodneyc/xlstats.htm

Page 18: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 18

http://cast.massey.ac.nz

Page 19: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 19

Page 20: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 20

Lettura di una tabella Prestare attenzione a: - Valori mancanti N (%)

Immunophenotype

Not specified

T

B

B precursor

35 (7.0)

54 (10.8)

12 (2.4)

397 (79.7)

Total 498 (100)

Page 21: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 21

- Intervalli aperti G.B. ( / ml) N (%)

GLOBULI BIANCHI missing

<=9999

10 000- 49 999

>=50 000

5 (1.0)

235 (47.2)

167 (33.5)

91 (18.3)

Total 498 (100)

Page 22: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 22

- Indicazione del totale

N (%)

Immunophenotype

Not specified

T

B

B precursor

35 (7.0)

54 (10.8)

12 (2.4)

397 (79.7)

Total 498 (100)

Page 23: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 23

- Intestazioni (della tabella, delle righe , delle colonne)

Distribuzione di frequenza per immunofenotipo dei casi di leucemia linfoblastica acuta infantile diagnosticati in Piemonte (1979-98). G.B. ( / ml) N (%)

GLOBULI BIANCHI missing

<=9999

10 000- 49 999

>=50 000

5 (1.0)

235 (47.2)

167 (33.5)

91 (18.3)

Total 498 (100)

Page 24: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 24

La rappresentazione grafica di una distribuzione di frequenza è un valido aiuto per migliorarne la leggibilità. Rappresentazione grafica della distribuzione di frequenza di una variabile nominale Dato / Variabile: diagnosi di dimissione, tipo nominale.

diagnosi di dimissione N %Colelitiasi 12 25Ernia inguinale 9 19Tumore del colon 9 19Ulcera duodenale 4 8Tumore del pancreas 4 8Tumore del retto 3 6Ulcera gastrica 2 4Tumore dello stomaco 2 4Tumore dell’esofago 2 4Stenosi esofagea 1 2

Totale 48 100

Page 25: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 25

Diagramma a barre, corrispondente alla distribuzione di frequenza

Attività operatoria

0

2

4

6

8

10

12

14

Colelitiasi Ernia inguinale Tumore delcolon

Ulceraduodenale

Tumore delpancreas

Tumore delretto

Ulcera gastrica Tumore dellostomaco

Tumoredell’esofago

Stenosiesofagea

Diagnosi

Num

ero

inte

rven

ti

Page 26: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 26

Diagramma a torta, corrispondente alla distribuzione di frequenza

Attività operatoria

12

9

9

4

4

3

2

22 1

ColelitiasiErnia inguinaleTumore del colonUlcera duodenaleTumore del pancreasTumore del rettoUlcera gastricaTumore dello stomacoTumore dell’esofagoStenosi esofagea

Page 27: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 27

Evitate un numero eccessivo di decimali: - nelle proporzioni usate 2 decimali - nelle percentuali usate 1 decimale o l’intero

Page 28: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 28

Distribuzione di frequenza cumulativa

La frequenza cumulativa è somma della frequenza delle osservazioni

con valore della variabile inferiore od uguale al valore considerato.

Può essere calcolata per

- dati / variabili ordinali

- dati / variabili numeriche

Calcolata la frequenza cumulativa si può calcolare la corrispondente

proporzione o percentuale cumulativa.

Page 29: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 29

Risultato

scolastico

Frequenza Frequenza

cumulativa

Frequenza relativa

cumulativa (in %)

Ottimo 5

Distinto 4

Buono 7

Sufficiente 8

Insufficiente 4

Totale 28

Page 30: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 30

Risultato

scolastico

Frequenza Frequenza

cumulativa

Frequenza relativa

cumulativa (in %)

Ottimo 5 5

Distinto 4 9

Buono 7 16

Sufficiente 8 24

Insufficiente 4 28

Totale 28 28

Page 31: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 31

Risultato

scolastico

Frequenza Frequenza

cumulativa

Frequenza relativa

cumulativa (in %)

Ottimo 5 5 19%

Distinto 4 9 33 %

Buono 7 16 58 %

Sufficiente 8 24 86 %

Insufficiente 4 28 100 %

Totale 28 28 100 %

Page 32: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 32

Risultato scolastico

0

1

2

3

4

5

6

7

8

9

Ottimo Distinto Buono Sufficiente Insufficiente

Freq

uenz

a (a

ssol

uta)

Page 33: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 33

Risultato scolastico

0

5

10

15

20

25

30

Ottimo Distinto Buono Sufficiente Insufficiente

freq

uenz

a (a

ssol

uta)

Page 34: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 34

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Ottimo Distinto Buono Sufficiente Insufficiente

Freq

uenz

a re

lativ

a (p

erce

ntua

le)

Risultato scolastico

Page 35: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 35

Distribuzione di frequenza di dati (variabili) numerici Se le variabili sono numeriche (continue o discrete con molti valori) occorre definire gli intervalli dei valori della variabile (classi di valori) 1. gli intervalli debbono essere definiti in modo che tutte le possibili

osservazioni cadano in uno ed uno solo di essi. 2. è opportuno che gli intervalli siano di uguale ampiezza

Esempio: ETA (variabile indicata con il simbolo x ) ƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 00<= x <10 10<= x <20 20<= x <30 30<= x <40 40<= x <50 50<= x <60 60<= x <70 70<= x <80 80<= x <90 90<= x <100

Page 36: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 36

3. calcolare le corrispondenti distribuzioni di frequenza e proporzioni semplici e cumulative

Cumulative Cumulative ETA Frequency Percent Frequency Percent ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 00<= x <10 0 0.0 0 0.0 10<= x <20 0 0.0 0 0.0 20<= x <30 0 0.0 0 0.0 30<= x <40 2 0.5 2 0.5 40<= x <50 38 8.8 40 9.3 50<= x <60 70 16.3 110 25.6 60<= x <70 212 49.3 322 74.9 70<= x <80 104 24.2 426 99.1 80<= x <90 2 0.5 428 99.5 90<= x <100 2 0.5 430 100.0

Page 37: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 37

I segni per definire un intervallo sono:

= es x=1 include solo i soggetti con variabile X di valore 1

>= x>=1 include i soggetti con variabile X di valore 1 (incluso) o superiore ad 1

> x>1 include solo i soggetti con variabile X di valore superiore

ad 1

<

<=

Page 38: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 38

Istogrammi : rappresentazione grafica di distribuzioni di frequenza di

variabili numeriche.

Vengono disegnati su un grafico dei rettangoli contigui, uno per

ciascun valore o intervallo (classe) di valori della variabile.

L’area dei rettangoli è proporzionale alla frequenza di osservazioni,

E’ opportuno che gli intervalli siano della stessa ampiezza e quindi

che i rettangoli corrispondenti abbiano tutti base uguale: semplifica

sia la preparazione sia la lettura.

Come disporre i valori

Ascisse: valori della variabile

Ordinate: Frequenza (assoluta o percentuale, semplice o cumulativa,

a scelta).

Page 39: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 39

0,0%

10,0%

20,0%

30,0%

40,0%

50,0%

60,0%

70,0%

80,0%

90,0%

100,0%

00<=

eta<1

010

<=eta

<20

20<=

eta<3

0

30<=

eta<4

040

<=eta

<50

50<=

eta<6

060

<=eta

<70

70<=

eta<8

0

80<=

eta<9

090

<=eta

<100

classe di età

%

Frequenza relativa %

Page 40: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 40

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

00<=

eta<10

10<=e

ta<20

20<=e

ta<30

30<=

eta<4

0

40<=

eta<5

0

50<=

eta<60

60<=

eta<70

70<=

eta<80

80<=

eta<90

90<=e

ta<10

0

classe di età

%

Frequenza cumulativa relativa

Page 41: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 41

Poligono di Frequenza

Si ottiene unendo con una linea i punti mediani della parte superiore dei rettangoli

dell'istogramma

0.0%

10.0%

20.0%

30.0%

40.0%

50.0%

60.0%

00<=

eta<1

0

10<=

eta<2

0

20<=

eta<3

0

30<=

eta<4

0

40<=

eta<5

0

50<=

eta<6

0

60<=

eta<7

0

70<=

eta<8

0

80<=

eta<9

0

90<=

eta<1

00

Page 42: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 42

Page 43: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 43

Page 44: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 44

Rappresentazioni alternative di distribuzioni di frequenza:

o Diagrammi a torta (pie chart, vedi esempio seguente)

o Poligoni di frequenza

o Diagrammi di dispersione (a punti) ad una dimensione

o Istogrammi a barre orizzontali

o Figure con area proporzionale alla frequenza (attenzione, la

lettura può essere poco immediata).

Page 45: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 45

I diagrammi a punti sono adatti solo quando il numero di osservazioni è limitato

n Hb1 1112 1073 1244 1415 1316 1057 968 1259 135

10 14011 15112 13913 16214 16315 16816 17117 16618 16919 15720 165

Page 46: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 46

Il risultato non è particolarmente soddisfacente, soprattutto quando le

osservazioni sono molte ed i punti si sovrappongono !

Page 47: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 47

Diagrammi a torta (pie chart). La frequenza è proporzionale

all’angolo al centro, quindi all’area dello spicchio

Esempio di diagramma a torta o Pie chartDistribuzione di frequenza del numero di globuli bianchi tra i casi di leucemia linfoblastica acuta (LLA) rilevati dal RTI

Piemonte, 1979-98

missing<=9999.103/l10 000- 49 999.103/l>=50 000.103/l

Page 48: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 48

Statistica descrittiva - metodi per analisi bivariata (2 variabili contemporaneamente).

Analizziamo separatamente i seguenti casi:

o Due variabili nominali

o Una variabile nominale e l’altra ordinale

o Due variabili ordinali

o Una variabile quantitativa (discreta o continua) e l’altra

nominale / ordinale

o Due variabili quantitative (discrete o continue)

Page 49: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 49

Statistica descrittiva - bivariata

Due variabili nominali

Una variabile nominale e l’altra ordinale

Due variabili ordinali

-> Distribuzione di frequenza

Page 50: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 50

Distribuzione di frequenza di 2 variabili

Il procedimento è analogo a quanto descritto per una sola variabile,

complicato solo dalla necessità di classificare ciascun soggetto per

due variabili contemporaneamente.

1. definire i possibili valori di ciascuna delle due variabili

2. scrivere una tabella con le due variabili a definire le righe e le

colonne

3. scrivere i valori delle variabili in ordine crescente

4. contare quante osservazioni per ciascuna combinazione di valori

5. calcolare i totali di riga, colonna e tabella

6. calcolare le corrispondenti proporzioni (eventualmente come

percentuali) riferite a: totale generale, totale di riga, tot. di colonna

Page 51: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 51

Problema: descrivere l’associazione tra arteriopatia ed abitudine al

fumo (due variabili categoriche) in uno studio su 200 pazienti:

1. identifico le variabili ed i valori possibili

Var. A (arteriopatia), nominale, valori possibili = 2 (malato, sano).

Var. B (fumo), nominale, valori possibili = 3 (mai fumatore, ex

fumatore, attuale fumatore).

2. preparo una tabella con le due variabili a definire le righe e le

colonne

Page 52: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 52

Arteriopatia

Malato Sano

Totale

Mai

Ex

Fumo

Attuale

Totale

Queste tabelle sono anche chiamate:

tabelle di contingenza

tabelle crociate (o crosstabs)

tabelle a doppia entrata

Page 53: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 53

Arteriopatia

Malato Sano

Totale

Mai 8

43 51

Ex 26

45 71

Fumo

Attuale 30

48 78

Totale 64

136 200

Page 54: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 54

Percentuali sul totale delle osservazioni

Arteriopatia % totale

Malati Sani Totale Malati Sani

% %

Mai 8 43 4,0 21,5

Ex 26 45 13,0 22,5

attuale 30 48 15,0 24,0

F

U

M

O Totale 200 100,0

Page 55: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 55

Istogrammi da tabella con 2 variabiliPercentuali sul totale delle osservazioni

0,0

5,0

10,0

15,0

20,0

25,0

30,0

Fumo

%

MalatiSani

Malati 4,0 13,0 15,0

Sani 21,5 22,5 24,0

Mai Ex attuale

Page 56: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 56

MaiEx

attuale

Malati

Sani0,0

5,0

10,0

15,0

20,0

25,0

%

Fumo

Istogrammi da tabella con 2 variabiliPercentuali sul totale delle osservazioni

MalatiSani

Malati 4,0 13,0 15,0

Sani 21,5 22,5 24,0

Mai Ex attuale

Page 57: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 57

Percentuali sul totale di riga

Arteriopatia %riga

Malati Sani Totale Malati Sani

% % %

Mai 8 43 51 15,7 84,3 100,0

Ex 26 45 71 36,6 63,4 100,0

attuale 30 48 78 38,5 61,5 100,0

F

U

M

O Totale 200

Page 58: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 58

Istogrammi da tabella con 2 variabili Percentuali di malati per ciascuna categoria di fumo

0,0

10,0

20,0

30,0

40,0

50,0

60,0

70,0

80,0

90,0

Fumo

% MalatiSani

Malati 15,7 36,6 38,5 32,0

Sani 84,3 63,4 61,5 68,0

Mai Ex attuale Totale

Page 59: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 59

Percentuali sul totale di colonna

Arteriopatia %colonna

Malati Sani Totale Malati Sani

Mai 8 43 12,5 31,6

Ex 26 45 40,6 33,1

Attuale 30 48 46,9 35,3

F

U

M

O Totale 64 136 200 100,0 100,0

Page 60: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 60

Istogrammi da tabella con 2 variabili Percentuali di fumatori tra malati e sani

0,0

5,0

10,0

15,0

20,0

25,0

30,0

35,0

40,0

45,0

50,0

Fumo

%MalatiSani

Malati 12,5 40,6 46,9

Sani 31,6 33,1 35,3

Mai Ex attuale

Page 61: Università del Piemonte Orientale Corso di Laurea in ...magnani/pdf/medicina_novara_2006_L_1_Statistic... · Università del Piemonte Orientale ... Diagnosi Numero interventi. Corso

Corso di laurea in medicina e chirurgia - Statistica Medica – Statistica descrittiva 61

Esercizi consigliati, tratti da: M.Pagano & K.Gauvreau. Biostatistica (II edizione

italiana). ed. Idelson Gnocchi, Napoli 2003.

1. Partendo dai dati presentati nella tabella 2.10:

a) Indicare di quale tipo di variabili si tratta.

b) Qual’è la percentuale di nati di peso inferiore a 2 kg?

c) Calcolare la frequenza relativa del numero di neonati per classe di peso alla nascita

d) Disegnare l’istogramma del numero di neonati per classe di peso alla nascita

e) Calcolare la frequenza cumulativa (assoluta e relativa) del numero di neonati per classe di

peso alla nascita

f) Disegnare l’istogramma della frequenza cumulativa relativa del numero di neonati per classe

di peso alla nascita.

g) Accorpare i dati della tabella 2.10 in classi di 1000 g e ripetere gli esercizi da c a f.

2. Svolgere i seguenti esercizi tratti dalle pag.26-27: 1, 2, 3, 4, 5, 6, 7.

3. Svolgere i seguenti esercizi tratti dalle pag.26-27: 8, 16 (nel caso sia richiesto un poligono di

frequenza, disegnate un istogramma).

4. Svolgere i seguenti esercizi tratti dalle pag.26-27: 12, 13, 14 (id.).

Gli esercizi saranno corretti in classe