Università del Piemonte Orientale Corso di Laurea in Medicina e...

Post on 30-Jul-2020

0 views 0 download

Transcript of Università del Piemonte Orientale Corso di Laurea in Medicina e...

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 1

Università del Piemonte OrientaleCorso di Laurea in Medicina e Chirurgia

Corso di Statistica Medica

Correlazione

Regressione Lineare

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 2

Campo di applicazione

• Analisi della relazione tra due variabilicontinue.

• Es: relazione tra altezza e peso

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 3

Campo di applicazione

• Le variabili sono associate? -> correlazione

• Come varia il valore di una variabile inconseguenza del variare di un’altra variabile? -> regressione

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 4

Correlazione

Dato un insieme di osservazioni definite da duevariabili continue,

valutiamo la forza dell’associazione tra le duevariabili

•disegnando il diagramma di dispersione e

•calcolando il coefficiente di correlazione.

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 5

Il diagramma di dispersione si disegnariportando i valori delle osservazioni su unsistema di assi cartesiani, in cui l’asse xrappresenta una delle due variabili el’asse y l’altra variabile.

Il diagramma consente di collocare ogniosservazione nello spazio definito daivalori possibili delle due variabili.

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 6

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 24 29 34 39 44 49

lunghezza

circ

onfe

renz

a cr

anic

a

Relazione alla nascita tra circonferenza cranica e lunghezza

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 7

La forma della nuvola di punti così ottenutaconsente una valutazione visiva del grado diassociazione tra le due variabili.

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 8

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

10 15 20 25 30 35 40 45

età materna

circ

onfe

renz

a cr

anic

a

Relazione tra circonferenza cranica alla nascita ed età materna

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 9

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 24 29 34 39 44 49

lunghezza

circ

onfe

renz

a cr

anic

a

Relazione alla nascita tra circonferenza cranica e lunghezza

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 10

Il coefficiente di correlazione di Pearson (r) consente lavalutazione formale del grado di associazione.

L’intervallo dei valori possibili di r è: -1 <= r <=1

Se r=1 o r=-1 tutti i punti giacciono su una retta

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 11

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

10 15 20 25 30 35 40 45

età materna

circ

onfe

renz

a cr

anic

a

r = 0,15

Relazione tra circonferenza cranica alla nascita ed età materna

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 12

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 24 29 34 39 44 49

lunghezza

circ

onfe

renz

a cr

anic

a

r = 0,72

Relazione alla nascita tra circonferenza cranica e lunghezza

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 13

( )( )

( ) ( )∑ ∑

= =

=

−−

−−=

n

i

n

iii

n

iii

yyxx

yyxxr

1 1

22

1

La formula del coefficiente di correlazione di Pearson (r)

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 14

Colesterolo (x)

Trigliceridi (y)

1 3,45 6,242 3,5 6,183 2,95 5,24 3,77 6,115 3,67 6,366 5,31 5,677 5,1 5,488 7,85 5,679 8,79 9,4

10 12,3 8,4

medie: 5,669 6,471

Relazione tra concentrazione plasmatica i colesterolo e trigliceridi

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 15

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi

0

1

2

3

4

5

6

7

8

9

10

0 2 4 6 8 10 12 14

colesterolo

trig

licer

idi

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 16

Colesterolo (x)

Trigliceridi (y)

( )xxi − ( )yyi −1 3,45 6,24 -2,459 -0,4932 3,5 6,18 -2,409 -0,5533 2,95 5,2 -2,959 -1,5334 3,77 6,11 -2,139 -0,6235 3,67 6,36 -2,239 -0,3736 5,31 5,67 -0,599 -1,0637 5,1 5,48 -0,809 -1,2538 7,85 5,67 1,941 -1,0639 8,79 9,4 2,881 2,667

10 12,3 8,4 6,391 1,667

medie: 5,669 6,471

Relazione tra concentrazione plasmatica i colesterolo e trigliceridi

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 17

Colesterolo (x)

Trigliceridi (y)

( )xxi − ( )yyi − ( ) ( )yx yx ii −− * ( )xxi−2 ( )yyi−

2

3,45 6,24 -2,459 -0,493 1,212287 6,046681 0,243049 3,5 6,18 -2,409 -0,553 1,332177 5,803281 0,305809

2,95 5,2 -2,959 -1,533 4,536147 8,755681 2,350089 3,77 6,11 -2,139 -0,623 1,332597 4,575321 0,388129 3,67 6,36 -2,239 -0,373 0,835147 5,013121 0,139129 5,31 5,67 -0,599 -1,063 0,636737 0,358801 1,129969 5,1 5,48 -0,809 -1,253 1,013677 0,654481 1,570009

7,85 5,67 1,941 -1,063 -2,063283 3,767481 1,129969 8,79 9,4 2,881 2,667 7,683627 8,300161 7,112889 12,3 8,4 6,391 1,667 10,653797 40,844881 2,778889

Sommatorie: 26,54411 83,54389 16,46149

r= 0,715774547

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 18

EserciziCorrelazione

• Pag. 304 n. 1

• Pag. 304 n. 5

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 19

Regressione

Stima della variazione mediadi una variabile in conseguenzadella variazione unitaria di un’altra variabile

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 20

• Variabile indipendente -> causa-> (sulle ascisse)

• Variabile dipendente -> effetto-> (sulle ordinate)

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 21

x

y

Var. indipendente

V.dipendente

causa

effetto

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 22

Obiettivo dell’analisi di regressione:

Individuare la retta che meglio predice il

valore di y (variabile dipendente), noto il

valore di x (variabile indipendente).

y=a+bx

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 23

y=a+bx

a -> intercetta

b -> pendenza

Come stimiamo i valori dei due coefficienti?

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 24

x

y

Media di x

Il valore atteso di x è la sua media

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 25

x

Med

ia d

i y

Il valore atteso di y è la sua media

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 26

x

y

Media di x e media di y

La retta che meglio predice y|x passa per la media di x e di y

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 27

x

y

Per un punto passano infinite rette!Quale retta scegliamo? Con quale criterio?

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 28

x

y

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 29

x

y

Residuo (o scarto) = valore y_osservato – valore y_predetto

La retta migliore minimizza la somma dei quadrati dei residui

valore y_osservato

valore y_predetto

Metodo detto ‘dei minimi quadrati’

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 30

( )( )( )∑ −

∑ −−=

xxyyxx

i

iib 2

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 31

xbya −=

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 32

Colesterolo (x)

Trigliceridi (y)

( )xxi − ( )yyi − ( ) ( )yx yx ii −− * ( )xxi−2

1 3,45 6,24 -2,219 -0,231 0,512589 4,923961

2 3,5 6,18 -2,169 -0,291 0,631179 4,704561

3 2,95 5,2 -2,719 -1,271 3,455849 7,392961

4 3,77 6,11 -1,899 -0,361 0,685539 3,606201

5 3,67 6,36 -1,999 -0,111 0,221889 3,996001

6 5,31 5,67 -0,359 -0,801 0,287559 0,128881

7 5,1 5,48 -0,569 -0,991 0,563879 0,323761

8 7,85 5,67 2,181 -0,801 -1,746981 4,756761

9 8,79 9,4 3,121 2,929 9,141409 9,740641

10 12,3 8,4 6,631 1,929 12,791199 43,970161

medie: 5,669 6,471 26,54411 83,54389

b= 0,31772653

a= 4,66980832

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 33

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 34

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)

b = 0,32

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 35

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)

a=4,67

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 36

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)trigliceridi=4,67 + 0,32* colesterolo

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 37

Formule abbreviate

( )( ) ( )( )( ) ( )∑−

−=

∑∑∑∑∑xx

yxyxyin

iai

iiii22

2

( ) ( )( )( ) ( )∑−

−=

∑∑∑∑xxyxyx

inin

bi

iii22

Queste formule sono più convenienti per il calcolo a manoSi basano sulle formule abbreviate per il calcolo della varianza

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 38

Y è una variabile casuale

Omoscedasticità(omogeneità della varianza di y|x)

Distribuzione normale di y|x

Linearità della relazione tra x ed y

Requisiti dell’analisi di regressione

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 39

In questo esempio abbiamo dati campionati da una popolazione incui le tre assunzioni sono soddisfatte

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 40

Variabilità della retta di regressione.

• y è una variabile casuale

• x di solito non è una variabile casuale. Ilricercatore può scegliere soggetti con i valoridella x più adatti per lo studio.

• siamo interessati a valutare la variabilità di y,non quella di x.

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 41

Varianza intorno alla retta di regressione (stima campionaria)

( )2

2

2 ˆ−−

= ∑n

s yy ii

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 42

x

y

Residuo (o scarto) = valore y_osservato – valore y_predetto

Varianza = scarti ^ 2 / g.l.

valore y_osservato

valore y_predetto

scarto

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 43

( )2

2

2 ˆ−−

= ∑n

s yy ii ii bxay +=ˆ

( )2

2

2

−−−= ∑

nbxays ii

Sostituisco:

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 44

Colesterolo (x)

Trigliceridi (y)

att(y) y-att(y) (y-att(y))^2

1 3,45 6,24 5,765965 0,474035 0,224709

2 3,5 6,18 5,781851 0,398149 0,158522

3 2,95 5,2 5,607102 -0,4071 0,165732

4 3,77 6,11 5,867637 0,242363 0,05874

5 3,67 6,36 5,835865 0,524135 0,274718

6 5,31 5,67 6,356936 -0,68694 0,471881

7 5,1 5,48 6,290214 -0,81021 0,656446

8 7,85 5,67 7,163962 -1,49396 2,231921

9 8,79 9,4 7,462624 1,937376 3,753424

10 12,3 8,4 8,577845 -0,17784 0,031629

somma degli

scarti^2 8,027722

b= 0,31772653 s(b)^2= 1,003465

a= 4,66980832

Relazione tra concentrazione plasmatica di colesterolo e trigliceridi

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 45

Omoscedasticità: la varianza di y è costante per tutto l’intervallo x.E’ un requisito per la corretta applicazione della regressione lineare

(v.oltre)

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 46

Errore standard di b

( )2

2

)(∑ −

=xx

sbESi

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 47

Colesterolo (x)

Trigliceridi (y) ( )xxi−

2 att(y) y-att(y) (y-att(y))^2

1 3,45 6,24 4,923961 5,765965 0,474035 0,224709

2 3,5 6,18 4,704561 5,781851 0,398149 0,158522

3 2,95 5,2 7,392961 5,607102 -0,4071 0,165732

4 3,77 6,11 3,606201 5,867637 0,242363 0,05874

5 3,67 6,36 3,996001 5,835865 0,524135 0,274718

6 5,31 5,67 0,128881 6,356936 -0,68694 0,471881

7 5,1 5,48 0,323761 6,290214 -0,81021 0,656446

8 7,85 5,67 4,756761 7,163962 -1,49396 2,231921

9 8,79 9,4 9,740641 7,462624 1,937376 3,753424

10 12,3 8,4 43,970161 8,577845 -0,17784 0,031629

83,54389

somma degli

scarti^2 8,027722

b= 0,31772653 s(b)^2= 1,003465

a= 4,66980832 ES(b)= 0,109596

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 48

Errore standard di b

L’errore standard di b si riduce, a parità di s, quando lavariabilità di x è maggiore !

( )2

2

)(∑ −

=xx

sbESi

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 49

t = distanza tra il valore di b stimato (b) e quello previsto dall’ipotesi nulla (ß, di solito

H0: ß =0), in unità di errore standard di b (SE(b))

Intervallo di Confidenza e tests t per ilcoefficiente di regressione

)(bSEbt β−=

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 50

L’intervallo di confidenza si calcola nel modoconsueto (v. lezione precedente)

t ha (n-2) gradi di libertà ed il valore è scelto inmodo corrispondente all’errore di I tipo, contest a 2 code

)(bSEtbCI crit ×±=

Intervallo di Confidenza del coefficiente diregressione

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 51

Colesterolo (x)

Trigliceridi (y) ( )xxi−

2 att(y) y-att(y) (y-att(y))^2

1 3,45 6,24 4,923961 5,765965 0,474035 0,224709

2 3,5 6,18 4,704561 5,781851 0,398149 0,158522

3 2,95 5,2 7,392961 5,607102 -0,4071 0,165732

4 3,77 6,11 3,606201 5,867637 0,242363 0,05874

5 3,67 6,36 3,996001 5,835865 0,524135 0,274718

6 5,31 5,67 0,128881 6,356936 -0,68694 0,471881

7 5,1 5,48 0,323761 6,290214 -0,81021 0,656446

8 7,85 5,67 4,756761 7,163962 -1,49396 2,231921

9 8,79 9,4 9,740641 7,462624 1,937376 3,753424

10 12,3 8,4 43,970161 8,577845 -0,17784 0,031629

83,54389 somma degli scarti^2 8,027722

b= 0,31772653 s(b)^2= 1,003465

a= 4,66980832 ES(b)= 0,109596

IC(95%)_b= 0,064998 -0,570455

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 52

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)trigliceridi=4,67 + 0,32* colesteroloIC(95%)_b= 0,06 -0,57

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 53

18,0

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 22 25 28 31 34 37 40 43 46

lunghezza

circ

onfe

renz

a cr

anic

a

a=8,02b= 0,51ES(b)=0,05021(IC 95%_b: 0,41 - 0,61)y= 8,02 + 0,51x

Relazione alla nascita tra circonferenza cranica e lunghezza

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 54

Valore di y predetto dalla retta di regressione

data y=a+bx, dopo aver ricavato a e bpossiamo predire il valore atteso di y,

corrispondente ad un dato valore di x.

• Il calcolo si effettua sostituendo il valore di xnella formula, noti a e b e risolvendol’equazione.

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 55

Valore di y predetto dalla retta di regressione

• Es. il valore di circonferenza cranica predettoper un bambino di lunghezza 41 cm è

=8,02+0,513 * x

=8,02+0,513 * 41

=29,05

y

y

y

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 56

Intervallo di confidenza dei valori predetti

( )( )∑ −

−′++±= 2

2

2,

11ˆxxxx

nstyPI

i

i

gl α

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 57

=29,05

IC( )= 25,47 - 32,63

y

y

Relazione alla nascita tra circonferenza cranica e lunghezza

Es. il valore di circonferenza cranica predettoper un bambino di lunghezza 41 cm è

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 58

Intervallo di confidenza dei valori predetti

( )( )∑ −

−′++±= 2

2

2,

11ˆxxxx

nstyPI

i

i

gl α

La predizione ha unerrore maggioreallontanandosi dallamedia di x

La predizione ha un erroreminore con un’ampiavariabilità di x

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 59

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 60

0

2

4

6

8

10

12

14

0 2 4 6 8 10 12 14

atteso_y

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 61

Cautele nella predizione

• La predizione non è valida fuori dell’intervalloosservato di x

• La predizione è più incerta agli estremi delladistribuzione di x

• Per migliorare la precisione della predizionedebbo aumentare la somma dei quadratidegli scarti (devianza) di x

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 62

Outliers ed osservazioni ‘influenti’

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 63

18,0

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 22 25 28 31 34 37 40 43 46

lunghezza

circ

onfe

renz

a cr

anic

a

1

2

Relazione alla nascita tra circonferenza cranica e lunghezza

Ho due outliers, indicati come: 1 e 2

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 64

18,0

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 22 25 28 31 34 37 40 43 46

lunghezza

circ

onfe

renz

a cr

anic

a

1

Relazione alla nascita tra circonferenza cranica e lunghezza

Se escludo outlier 1

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 65

18,0

20,0

22,0

24,0

26,0

28,0

30,0

32,0

34,0

36,0

19 22 25 28 31 34 37 40 43 46

lunghezza

circ

onfe

renz

a cr

anic

a

1

2

Relazione alla nascita tra circonferenza cranica e lunghezza

Se escludo outliers 1 e 2

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 66

Tutti i dati:

a=8,02b= 0,51

Escluso outlier 1:a=4,91b=0,60

Esclusi outlier 1 e 2:a=4,46b=0,61

Relazione alla nascita tra circonferenza cranica e lunghezza

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 67

Valutazione del modello

• R2 : proporzione della varianza che èspiegata dal modello di regressione

• = (coefficiente di correlazione) ^2

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 68

variazione del livello di trigliceridi con il livello di colesterolo

0

2

4

6

8

10

0 2 4 6 8 10 12 14

colesterolo (x)

trigl

icer

idi (

y)trigliceridi=4,67 + 0,32* colesterolo

r =0,716R2 =0,51

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 69

Omoscedasticità (omogeneità della varianza)

Distribuzione normale degli errori

Linearità

Verifica dei modelli

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 70

Omoscedasticità (omogeneità della varianza)

Distribizione normale degli errori

Linearità

Verifica dei modelli

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 71

Omoscedasticità (omogeneità della varianza)

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 72

Verifica delle assunzioni del modello

La verifica delle assunzioni del modello vienecondotta esaminando la distribuzione deiresidui

Se la varianza è costante per tutta ladistribuzione della x,anche i residui sarannodistribuiti in modo uniforme.

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 73

x

y

Residuo (o scarto) = valore y_osservato – valore y_predetto

valore y_osservato

valore y_predetto

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 74

Verifica delle assunzioni del modello

Distribuzione uniforme dei residui

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 75

Distribuzione uniforme dei residui

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 76

Distribuzione non uniforme dei residui

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 77

Distribuzione non uniforme dei residui

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 78

Omoscedasticità (omogeneità della varianza)

Distribuzione normale degli errori

Linearità

Verifica dei modelli

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 79

Distribuzione normale dei residui (errori)

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 80

Distribuzione non normale dei residui (errori)

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 81

Distribuzione non normale dei residui (errori)

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 82

Omoscedasticità (omogeneità della varianza)

Distribizione normale degli errori

Linearità

Verifica dei modelli

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 83

Perchè parliamo di regressionelineare?

• La variazione lineare è spesso unaspiegazione adeguata

• Variazioni non lineari diventano tali dopo unatrasformazione matematica di una dellevariabili

• La variazione lineare è un punto di partenza

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 84

Non-linearità

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 85

Non-linearità

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 86

Non-linearità

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 87

Trasformazioni normalizzanti e linearizzanti

• Radice quadrata

• Logaritmo

• Inversa (meglio se ulteriormente moltiplicataper -1)

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 88

Inversa negativa

Log

Radice

Dati originali

Dati

trasformati

Trasformazioni normalizzanti e linearizzanti

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 89

FREQUENCY

0

10

20

30

40

50

60

70

80

90

100

110

120

130

140

150

CORPUSCO MIDPOINT

0 250

500

750

1000

1250

1500

1750

2000

2250

2500

2750

3000

3250

3500

3750

4000

4250

4500

4750

5000

5250

5500

5750

6000

6250

6500

6750

7000

7250

7500

7750

8000

8250

8500

8750

9000

9250

9500

9750

10000

FREQUENCY

0

10

20

30

40

50

L_c MIDPOINT

0.00

0.25

0.50

0.75

1.00

1.25

1.50

1.75

2.00

2.25

2.50

2.75

3.00

3.25

3.50

3.75

4.00

4.25

4.50

4.75

5.00

5.25

5.50

5.75

6.00

6.25

6.50

6.75

7.00

7.25

7.50

7.75

8.00

8.25

8.50

8.75

9.00

9.25

9.50

9.75

10.00

10.25

10.50

10.75

11.00

11.25

11.50

11.75

12.00

12.25

12.50

12.75

13.00

13.25

13.50

13.75

14.00

Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 90

Esercizi regressione

• Pag.326 n 1• Pag.326 n 3• Pag.326 n 4• Pag.326 n 6• Pag.326 n 10