Università del Piemonte Orientale Corso di Laurea in Medicina e...

90
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 1 Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare

Transcript of Università del Piemonte Orientale Corso di Laurea in Medicina e...

Page 1: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 1

Università del Piemonte OrientaleCorso di Laurea in Medicina e Chirurgia

Corso di Statistica Medica

Correlazione

Regressione Lineare

Page 2: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 2

Campo di applicazione

• Analisi della relazione tra due variabilicontinue.

• Es: relazione tra altezza e peso

Page 3: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 3

Campo di applicazione

• Le variabili sono associate? -> correlazione

• Come varia il valore di una variabile inconseguenza del variare di un’altra variabile? -> regressione

Page 4: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 4

Correlazione

Dato un insieme di osservazioni definite da duevariabili continue,

valutiamo la forza dell’associazione tra le duevariabili

•disegnando il diagramma di dispersione e

•calcolando il coefficiente di correlazione.

Page 5: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 5

Il diagramma di dispersione si disegnariportando i valori delle osservazioni su unsistema di assi cartesiani, in cui l’asse xrappresenta una delle due variabili el’asse y l’altra variabile.

Il diagramma consente di collocare ogniosservazione nello spazio definito daivalori possibili delle due variabili.

Page 6: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 6

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 24 29 34 39 44 49

lunghezza

circ

onfe

renz

a cr

anic

a

Relazione alla nascita tra circonferenza cranica e lunghezza

Page 7: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 7

La forma della nuvola di punti così ottenutaconsente una valutazione visiva del grado diassociazione tra le due variabili.

Page 8: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 8

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

10 15 20 25 30 35 40 45

età materna

circ

onfe

renz

a cr

anic

a

Relazione tra circonferenza cranica alla nascita ed età materna

Page 9: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 9

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 24 29 34 39 44 49

lunghezza

circ

onfe

renz

a cr

anic

a

Relazione alla nascita tra circonferenza cranica e lunghezza

Page 10: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 10

Il coefficiente di correlazione di Pearson (r) consente lavalutazione formale del grado di associazione.

L’intervallo dei valori possibili di r è: -1 <= r <=1

Se r=1 o r=-1 tutti i punti giacciono su una retta

Page 11: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 11

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

10 15 20 25 30 35 40 45

età materna

circ

onfe

renz

a cr

anic

a

r = 0,15

Relazione tra circonferenza cranica alla nascita ed età materna

Page 12: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 12

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 24 29 34 39 44 49

lunghezza

circ

onfe

renz

a cr

anic

a

r = 0,72

Relazione alla nascita tra circonferenza cranica e lunghezza

Page 13: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 13

( )( )

( ) ( )∑ ∑

= =

=

−−

−−=

n

i

n

iii

n

iii

yyxx

yyxxr

1 1

22

1

La formula del coefficiente di correlazione di Pearson (r)

Page 14: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 14

Colesterolo (x)

Trigliceridi (y)

1 3,45 6,242 3,5 6,183 2,95 5,24 3,77 6,115 3,67 6,366 5,31 5,677 5,1 5,488 7,85 5,679 8,79 9,4

10 12,3 8,4

medie: 5,669 6,471

Relazione tra concentrazione plasmatica i colesterolo e trigliceridi

Page 15: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 15

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi

0

1

2

3

4

5

6

7

8

9

10

0 2 4 6 8 10 12 14

colesterolo

trig

licer

idi

Page 16: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 16

Colesterolo (x)

Trigliceridi (y)

( )xxi − ( )yyi −1 3,45 6,24 -2,459 -0,4932 3,5 6,18 -2,409 -0,5533 2,95 5,2 -2,959 -1,5334 3,77 6,11 -2,139 -0,6235 3,67 6,36 -2,239 -0,3736 5,31 5,67 -0,599 -1,0637 5,1 5,48 -0,809 -1,2538 7,85 5,67 1,941 -1,0639 8,79 9,4 2,881 2,667

10 12,3 8,4 6,391 1,667

medie: 5,669 6,471

Relazione tra concentrazione plasmatica i colesterolo e trigliceridi

Page 17: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 17

Colesterolo (x)

Trigliceridi (y)

( )xxi − ( )yyi − ( ) ( )yx yx ii −− * ( )xxi−2 ( )yyi−

2

3,45 6,24 -2,459 -0,493 1,212287 6,046681 0,243049 3,5 6,18 -2,409 -0,553 1,332177 5,803281 0,305809

2,95 5,2 -2,959 -1,533 4,536147 8,755681 2,350089 3,77 6,11 -2,139 -0,623 1,332597 4,575321 0,388129 3,67 6,36 -2,239 -0,373 0,835147 5,013121 0,139129 5,31 5,67 -0,599 -1,063 0,636737 0,358801 1,129969 5,1 5,48 -0,809 -1,253 1,013677 0,654481 1,570009

7,85 5,67 1,941 -1,063 -2,063283 3,767481 1,129969 8,79 9,4 2,881 2,667 7,683627 8,300161 7,112889 12,3 8,4 6,391 1,667 10,653797 40,844881 2,778889

Sommatorie: 26,54411 83,54389 16,46149

r= 0,715774547

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi

Page 18: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 18

EserciziCorrelazione

• Pag. 304 n. 1

• Pag. 304 n. 5

Page 19: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 19

Regressione

Stima della variazione mediadi una variabile in conseguenzadella variazione unitaria di un’altra variabile

Page 20: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 20

• Variabile indipendente -> causa-> (sulle ascisse)

• Variabile dipendente -> effetto-> (sulle ordinate)

Page 21: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 21

x

y

Var. indipendente

V.dipendente

causa

effetto

Page 22: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 22

Obiettivo dell’analisi di regressione:

Individuare la retta che meglio predice il

valore di y (variabile dipendente), noto il

valore di x (variabile indipendente).

y=a+bx

Page 23: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 23

y=a+bx

a -> intercetta

b -> pendenza

Come stimiamo i valori dei due coefficienti?

Page 24: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 24

x

y

Media di x

Il valore atteso di x è la sua media

Page 25: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 25

x

Med

ia d

i y

Il valore atteso di y è la sua media

Page 26: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 26

x

y

Media di x e media di y

La retta che meglio predice y|x passa per la media di x e di y

Page 27: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 27

x

y

Per un punto passano infinite rette!Quale retta scegliamo? Con quale criterio?

Page 28: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 28

x

y

Page 29: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 29

x

y

Residuo (o scarto) = valore y_osservato – valore y_predetto

La retta migliore minimizza la somma dei quadrati dei residui

valore y_osservato

valore y_predetto

Metodo detto ‘dei minimi quadrati’

Page 30: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 30

( )( )( )∑ −

∑ −−=

xxyyxx

i

iib 2

Page 31: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 31

xbya −=

Page 32: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 32

Colesterolo (x)

Trigliceridi (y)

( )xxi − ( )yyi − ( ) ( )yx yx ii −− * ( )xxi−2

1 3,45 6,24 -2,219 -0,231 0,512589 4,923961

2 3,5 6,18 -2,169 -0,291 0,631179 4,704561

3 2,95 5,2 -2,719 -1,271 3,455849 7,392961

4 3,77 6,11 -1,899 -0,361 0,685539 3,606201

5 3,67 6,36 -1,999 -0,111 0,221889 3,996001

6 5,31 5,67 -0,359 -0,801 0,287559 0,128881

7 5,1 5,48 -0,569 -0,991 0,563879 0,323761

8 7,85 5,67 2,181 -0,801 -1,746981 4,756761

9 8,79 9,4 3,121 2,929 9,141409 9,740641

10 12,3 8,4 6,631 1,929 12,791199 43,970161

medie: 5,669 6,471 26,54411 83,54389

b= 0,31772653

a= 4,66980832

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi

Page 33: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 33

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)

Page 34: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 34

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)

b = 0,32

Page 35: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 35

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)

a=4,67

Page 36: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 36

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)trigliceridi=4,67 + 0,32* colesterolo

Page 37: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 37

Formule abbreviate

( )( ) ( )( )( ) ( )∑−

−=

∑∑∑∑∑xx

yxyxyin

iai

iiii22

2

( ) ( )( )( ) ( )∑−

−=

∑∑∑∑xxyxyx

inin

bi

iii22

Queste formule sono più convenienti per il calcolo a manoSi basano sulle formule abbreviate per il calcolo della varianza

Page 38: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 38

Y è una variabile casuale

Omoscedasticità(omogeneità della varianza di y|x)

Distribuzione normale di y|x

Linearità della relazione tra x ed y

Requisiti dell’analisi di regressione

Page 39: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 39

In questo esempio abbiamo dati campionati da una popolazione incui le tre assunzioni sono soddisfatte

Page 40: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 40

Variabilità della retta di regressione.

• y è una variabile casuale

• x di solito non è una variabile casuale. Ilricercatore può scegliere soggetti con i valoridella x più adatti per lo studio.

• siamo interessati a valutare la variabilità di y,non quella di x.

Page 41: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 41

Varianza intorno alla retta di regressione (stima campionaria)

( )2

2

2 ˆ−−

= ∑n

s yy ii

Page 42: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 42

x

y

Residuo (o scarto) = valore y_osservato – valore y_predetto

Varianza = scarti ^ 2 / g.l.

valore y_osservato

valore y_predetto

scarto

Page 43: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 43

( )2

2

2 ˆ−−

= ∑n

s yy ii ii bxay +=ˆ

( )2

2

2

−−−= ∑

nbxays ii

Sostituisco:

Page 44: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 44

Colesterolo (x)

Trigliceridi (y)

att(y) y-att(y) (y-att(y))^2

1 3,45 6,24 5,765965 0,474035 0,224709

2 3,5 6,18 5,781851 0,398149 0,158522

3 2,95 5,2 5,607102 -0,4071 0,165732

4 3,77 6,11 5,867637 0,242363 0,05874

5 3,67 6,36 5,835865 0,524135 0,274718

6 5,31 5,67 6,356936 -0,68694 0,471881

7 5,1 5,48 6,290214 -0,81021 0,656446

8 7,85 5,67 7,163962 -1,49396 2,231921

9 8,79 9,4 7,462624 1,937376 3,753424

10 12,3 8,4 8,577845 -0,17784 0,031629

somma degli

scarti^2 8,027722

b= 0,31772653 s(b)^2= 1,003465

a= 4,66980832

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi

Page 45: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 45

Omoscedasticità: la varianza di y è costante per tutto l’intervallo x.E’ un requisito per la corretta applicazione della regressione lineare

(v.oltre)

Page 46: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 46

Errore standard di b

( )2

2

)(∑ −

=xx

sbESi

Page 47: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 47

Colesterolo (x)

Trigliceridi (y) ( )xxi−

2 att(y) y-att(y) (y-att(y))^2

1 3,45 6,24 4,923961 5,765965 0,474035 0,224709

2 3,5 6,18 4,704561 5,781851 0,398149 0,158522

3 2,95 5,2 7,392961 5,607102 -0,4071 0,165732

4 3,77 6,11 3,606201 5,867637 0,242363 0,05874

5 3,67 6,36 3,996001 5,835865 0,524135 0,274718

6 5,31 5,67 0,128881 6,356936 -0,68694 0,471881

7 5,1 5,48 0,323761 6,290214 -0,81021 0,656446

8 7,85 5,67 4,756761 7,163962 -1,49396 2,231921

9 8,79 9,4 9,740641 7,462624 1,937376 3,753424

10 12,3 8,4 43,970161 8,577845 -0,17784 0,031629

83,54389

somma degli

scarti^2 8,027722

b= 0,31772653 s(b)^2= 1,003465

a= 4,66980832 ES(b)= 0,109596

Page 48: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 48

Errore standard di b

L’errore standard di b si riduce, a parità di s, quando lavariabilità di x è maggiore !

( )2

2

)(∑ −

=xx

sbESi

Page 49: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 49

t = distanza tra il valore di b stimato (b) e quello previsto dall’ipotesi nulla (ß, di solito

H0: ß =0), in unità di errore standard di b (SE(b))

Intervallo di Confidenza e tests t per ilcoefficiente di regressione

)(bSEbt β−=

Page 50: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 50

L’intervallo di confidenza si calcola nel modoconsueto (v. lezione precedente)

t ha (n-2) gradi di libertà ed il valore è scelto inmodo corrispondente all’errore di I tipo, contest a 2 code

)(bSEtbCI crit ×±=

Intervallo di Confidenza del coefficiente diregressione

Page 51: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 51

Colesterolo (x)

Trigliceridi (y) ( )xxi−

2 att(y) y-att(y) (y-att(y))^2

1 3,45 6,24 4,923961 5,765965 0,474035 0,224709

2 3,5 6,18 4,704561 5,781851 0,398149 0,158522

3 2,95 5,2 7,392961 5,607102 -0,4071 0,165732

4 3,77 6,11 3,606201 5,867637 0,242363 0,05874

5 3,67 6,36 3,996001 5,835865 0,524135 0,274718

6 5,31 5,67 0,128881 6,356936 -0,68694 0,471881

7 5,1 5,48 0,323761 6,290214 -0,81021 0,656446

8 7,85 5,67 4,756761 7,163962 -1,49396 2,231921

9 8,79 9,4 9,740641 7,462624 1,937376 3,753424

10 12,3 8,4 43,970161 8,577845 -0,17784 0,031629

83,54389 somma degli scarti^2 8,027722

b= 0,31772653 s(b)^2= 1,003465

a= 4,66980832 ES(b)= 0,109596

IC(95%)_b= 0,064998 -0,570455

Page 52: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 52

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)trigliceridi=4,67 + 0,32* colesteroloIC(95%)_b= 0,06 -0,57

Page 53: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 53

18,0

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 22 25 28 31 34 37 40 43 46

lunghezza

circ

onfe

renz

a cr

anic

a

a=8,02b= 0,51ES(b)=0,05021(IC 95%_b: 0,41 - 0,61)y= 8,02 + 0,51x

Relazione alla nascita tra circonferenza cranica e lunghezza

Page 54: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 54

Valore di y predetto dalla retta di regressione

data y=a+bx, dopo aver ricavato a e bpossiamo predire il valore atteso di y,

corrispondente ad un dato valore di x.

• Il calcolo si effettua sostituendo il valore di xnella formula, noti a e b e risolvendol’equazione.

Page 55: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 55

Valore di y predetto dalla retta di regressione

• Es. il valore di circonferenza cranica predettoper un bambino di lunghezza 41 cm è

=8,02+0,513 * x

=8,02+0,513 * 41

=29,05

y

y

y

Page 56: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 56

Intervallo di confidenza dei valori predetti

( )( )∑ −

−′++±= 2

2

2,

11ˆxxxx

nstyPI

i

i

gl α

Page 57: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 57

=29,05

IC( )= 25,47 - 32,63

y

y

Relazione alla nascita tra circonferenza cranica e lunghezza

Es. il valore di circonferenza cranica predettoper un bambino di lunghezza 41 cm è

Page 58: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 58

Intervallo di confidenza dei valori predetti

( )( )∑ −

−′++±= 2

2

2,

11ˆxxxx

nstyPI

i

i

gl α

La predizione ha unerrore maggioreallontanandosi dallamedia di x

La predizione ha un erroreminore con un’ampiavariabilità di x

Page 59: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 59

Page 60: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 60

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14

atteso_y

Page 61: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 61

Cautele nella predizione

• La predizione non è valida fuori dell’intervalloosservato di x

• La predizione è più incerta agli estremi delladistribuzione di x

• Per migliorare la precisione della predizionedebbo aumentare la somma dei quadratidegli scarti (devianza) di x

Page 62: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 62

Outliers ed osservazioni ‘influenti’

Page 63: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 63

18,0

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 22 25 28 31 34 37 40 43 46

lunghezza

circ

onfe

renz

a cr

anic

a

1

2

Relazione alla nascita tra circonferenza cranica e lunghezza

Ho due outliers, indicati come: 1 e 2

Page 64: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 64

18,0

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 22 25 28 31 34 37 40 43 46

lunghezza

circ

onfe

renz

a cr

anic

a

1

Relazione alla nascita tra circonferenza cranica e lunghezza

Se escludo outlier 1

Page 65: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 65

18,0

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 22 25 28 31 34 37 40 43 46

lunghezza

circ

onfe

renz

a cr

anic

a

1

2

Relazione alla nascita tra circonferenza cranica e lunghezza

Se escludo outliers 1 e 2

Page 66: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 66

Tutti i dati:

a=8,02b= 0,51

Escluso outlier 1:a=4,91b=0,60

Esclusi outlier 1 e 2:a=4,46b=0,61

Relazione alla nascita tra circonferenza cranica e lunghezza

Page 67: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 67

Valutazione del modello

• R2 : proporzione della varianza che èspiegata dal modello di regressione

• = (coefficiente di correlazione) ^2

Page 68: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 68

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)trigliceridi=4,67 + 0,32* colesterolo

r =0,716R2 =0,51

Page 69: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 69

Omoscedasticità (omogeneità della varianza)

Distribuzione normale degli errori

Linearità

Verifica dei modelli

Page 70: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 70

Omoscedasticità (omogeneità della varianza)

Distribizione normale degli errori

Linearità

Verifica dei modelli

Page 71: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 71

Omoscedasticità (omogeneità della varianza)

Page 72: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 72

Verifica delle assunzioni del modello

La verifica delle assunzioni del modello vienecondotta esaminando la distribuzione deiresidui

Se la varianza è costante per tutta ladistribuzione della x,anche i residui sarannodistribuiti in modo uniforme.

Page 73: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 73

x

y

Residuo (o scarto) = valore y_osservato – valore y_predetto

valore y_osservato

valore y_predetto

Page 74: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 74

Verifica delle assunzioni del modello

Distribuzione uniforme dei residui

Page 75: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 75

Distribuzione uniforme dei residui

Page 76: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 76

Distribuzione non uniforme dei residui

Page 77: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 77

Distribuzione non uniforme dei residui

Page 78: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 78

Omoscedasticità (omogeneità della varianza)

Distribuzione normale degli errori

Linearità

Verifica dei modelli

Page 79: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 79

Distribuzione normale dei residui (errori)

Page 80: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 80

Distribuzione non normale dei residui (errori)

Page 81: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 81

Distribuzione non normale dei residui (errori)

Page 82: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 82

Omoscedasticità (omogeneità della varianza)

Distribizione normale degli errori

Linearità

Verifica dei modelli

Page 83: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 83

Perchè parliamo di regressionelineare?

• La variazione lineare è spesso unaspiegazione adeguata

• Variazioni non lineari diventano tali dopo unatrasformazione matematica di una dellevariabili

• La variazione lineare è un punto di partenza

Page 84: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 84

Non-linearità

Page 85: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 85

Non-linearità

Page 86: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 86

Non-linearità

Page 87: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 87

Trasformazioni normalizzanti e linearizzanti

• Radice quadrata

• Logaritmo

• Inversa (meglio se ulteriormente moltiplicataper -1)

Page 88: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 88

Inversa negativa

Log

Radice

Dati originali

Dati

trasformati

Trasformazioni normalizzanti e linearizzanti

Page 89: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 89

FREQUENCY

0

10

20

30

40

50

60

70

80

90

100

110

120

130

140

150

CORPUSCO MIDPOINT

0 250

500

750

1000

1250

1500

1750

2000

2250

2500

2750

3000

3250

3500

3750

4000

4250

4500

4750

5000

5250

5500

5750

6000

6250

6500

6750

7000

7250

7500

7750

8000

8250

8500

8750

9000

9250

9500

9750

10000

FREQUENCY

0

10

20

30

40

50

L_c MIDPOINT

0.00

0.25

0.50

0.75

1.00

1.25

1.50

1.75

2.00

2.25

2.50

2.75

3.00

3.25

3.50

3.75

4.00

4.25

4.50

4.75

5.00

5.25

5.50

5.75

6.00

6.25

6.50

6.75

7.00

7.25

7.50

7.75

8.00

8.25

8.50

8.75

9.00

9.25

9.50

9.75

10.00

10.25

10.50

10.75

11.00

11.25

11.50

11.75

12.00

12.25

12.50

12.75

13.00

13.25

13.50

13.75

14.00

Page 90: Università del Piemonte Orientale Corso di Laurea in Medicina e …magnani/pdf/medicina_novara_2005_L... · 2009-12-15 · Corso di laurea in medicina e chirurgia - Statistica Medica

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 90

Esercizi regressione

• Pag.326 n 1• Pag.326 n 3• Pag.326 n 4• Pag.326 n 6• Pag.326 n 10