Università del Piemonte Orientale Corso di Laurea in Medicina e...
Transcript of Università del Piemonte Orientale Corso di Laurea in Medicina e...
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 1
Università del Piemonte OrientaleCorso di Laurea in Medicina e Chirurgia
Corso di Statistica Medica
Correlazione
Regressione Lineare
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 2
Campo di applicazione
• Analisi della relazione tra due variabilicontinue.
• Es: relazione tra altezza e peso
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 3
Campo di applicazione
• Le variabili sono associate? -> correlazione
• Come varia il valore di una variabile inconseguenza del variare di un’altra variabile? -> regressione
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 4
Correlazione
Dato un insieme di osservazioni definite da duevariabili continue,
valutiamo la forza dell’associazione tra le duevariabili
•disegnando il diagramma di dispersione e
•calcolando il coefficiente di correlazione.
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 5
Il diagramma di dispersione si disegnariportando i valori delle osservazioni su unsistema di assi cartesiani, in cui l’asse xrappresenta una delle due variabili el’asse y l’altra variabile.
Il diagramma consente di collocare ogniosservazione nello spazio definito daivalori possibili delle due variabili.
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 6
20,0
22,0
24,0
26,0
28,0
30,0
32,0
34,0
36,0
19 24 29 34 39 44 49
lunghezza
circ
onfe
renz
a cr
anic
a
Relazione alla nascita tra circonferenza cranica e lunghezza
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 7
La forma della nuvola di punti così ottenutaconsente una valutazione visiva del grado diassociazione tra le due variabili.
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 8
20,0
22,0
24,0
26,0
28,0
30,0
32,0
34,0
36,0
10 15 20 25 30 35 40 45
età materna
circ
onfe
renz
a cr
anic
a
Relazione tra circonferenza cranica alla nascita ed età materna
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 9
20,0
22,0
24,0
26,0
28,0
30,0
32,0
34,0
36,0
19 24 29 34 39 44 49
lunghezza
circ
onfe
renz
a cr
anic
a
Relazione alla nascita tra circonferenza cranica e lunghezza
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 10
Il coefficiente di correlazione di Pearson (r) consente lavalutazione formale del grado di associazione.
L’intervallo dei valori possibili di r è: -1 <= r <=1
Se r=1 o r=-1 tutti i punti giacciono su una retta
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 11
20,0
22,0
24,0
26,0
28,0
30,0
32,0
34,0
36,0
10 15 20 25 30 35 40 45
età materna
circ
onfe
renz
a cr
anic
a
r = 0,15
Relazione tra circonferenza cranica alla nascita ed età materna
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 12
20,0
22,0
24,0
26,0
28,0
30,0
32,0
34,0
36,0
19 24 29 34 39 44 49
lunghezza
circ
onfe
renz
a cr
anic
a
r = 0,72
Relazione alla nascita tra circonferenza cranica e lunghezza
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 13
( )( )
( ) ( )∑ ∑
∑
= =
=
−−
−−=
n
i
n
iii
n
iii
yyxx
yyxxr
1 1
22
1
La formula del coefficiente di correlazione di Pearson (r)
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 14
Colesterolo (x)
Trigliceridi (y)
1 3,45 6,242 3,5 6,183 2,95 5,24 3,77 6,115 3,67 6,366 5,31 5,677 5,1 5,488 7,85 5,679 8,79 9,4
10 12,3 8,4
medie: 5,669 6,471
Relazione tra concentrazione plasmatica i colesterolo e trigliceridi
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 15
Relazione tra concentrazione plasmatica di colesterolo e trigliceridi
0
1
2
3
4
5
6
7
8
9
10
0 2 4 6 8 10 12 14
colesterolo
trig
licer
idi
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 16
Colesterolo (x)
Trigliceridi (y)
( )xxi − ( )yyi −1 3,45 6,24 -2,459 -0,4932 3,5 6,18 -2,409 -0,5533 2,95 5,2 -2,959 -1,5334 3,77 6,11 -2,139 -0,6235 3,67 6,36 -2,239 -0,3736 5,31 5,67 -0,599 -1,0637 5,1 5,48 -0,809 -1,2538 7,85 5,67 1,941 -1,0639 8,79 9,4 2,881 2,667
10 12,3 8,4 6,391 1,667
medie: 5,669 6,471
Relazione tra concentrazione plasmatica i colesterolo e trigliceridi
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 17
Colesterolo (x)
Trigliceridi (y)
( )xxi − ( )yyi − ( ) ( )yx yx ii −− * ( )xxi−2 ( )yyi−
2
3,45 6,24 -2,459 -0,493 1,212287 6,046681 0,243049 3,5 6,18 -2,409 -0,553 1,332177 5,803281 0,305809
2,95 5,2 -2,959 -1,533 4,536147 8,755681 2,350089 3,77 6,11 -2,139 -0,623 1,332597 4,575321 0,388129 3,67 6,36 -2,239 -0,373 0,835147 5,013121 0,139129 5,31 5,67 -0,599 -1,063 0,636737 0,358801 1,129969 5,1 5,48 -0,809 -1,253 1,013677 0,654481 1,570009
7,85 5,67 1,941 -1,063 -2,063283 3,767481 1,129969 8,79 9,4 2,881 2,667 7,683627 8,300161 7,112889 12,3 8,4 6,391 1,667 10,653797 40,844881 2,778889
Sommatorie: 26,54411 83,54389 16,46149
r= 0,715774547
Relazione tra concentrazione plasmatica di colesterolo e trigliceridi
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 18
EserciziCorrelazione
• Pag. 304 n. 1
• Pag. 304 n. 5
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 19
Regressione
Stima della variazione mediadi una variabile in conseguenzadella variazione unitaria di un’altra variabile
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 20
• Variabile indipendente -> causa-> (sulle ascisse)
• Variabile dipendente -> effetto-> (sulle ordinate)
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 21
x
y
Var. indipendente
V.dipendente
causa
effetto
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 22
Obiettivo dell’analisi di regressione:
Individuare la retta che meglio predice il
valore di y (variabile dipendente), noto il
valore di x (variabile indipendente).
y=a+bx
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 23
y=a+bx
a -> intercetta
b -> pendenza
Come stimiamo i valori dei due coefficienti?
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 24
x
y
Media di x
Il valore atteso di x è la sua media
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 25
x
Med
ia d
i y
Il valore atteso di y è la sua media
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 26
x
y
Media di x e media di y
La retta che meglio predice y|x passa per la media di x e di y
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 27
x
y
Per un punto passano infinite rette!Quale retta scegliamo? Con quale criterio?
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 28
x
y
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 29
x
y
Residuo (o scarto) = valore y_osservato – valore y_predetto
La retta migliore minimizza la somma dei quadrati dei residui
valore y_osservato
valore y_predetto
Metodo detto ‘dei minimi quadrati’
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 30
( )( )( )∑ −
∑ −−=
xxyyxx
i
iib 2
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 31
xbya −=
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 32
Colesterolo (x)
Trigliceridi (y)
( )xxi − ( )yyi − ( ) ( )yx yx ii −− * ( )xxi−2
1 3,45 6,24 -2,219 -0,231 0,512589 4,923961
2 3,5 6,18 -2,169 -0,291 0,631179 4,704561
3 2,95 5,2 -2,719 -1,271 3,455849 7,392961
4 3,77 6,11 -1,899 -0,361 0,685539 3,606201
5 3,67 6,36 -1,999 -0,111 0,221889 3,996001
6 5,31 5,67 -0,359 -0,801 0,287559 0,128881
7 5,1 5,48 -0,569 -0,991 0,563879 0,323761
8 7,85 5,67 2,181 -0,801 -1,746981 4,756761
9 8,79 9,4 3,121 2,929 9,141409 9,740641
10 12,3 8,4 6,631 1,929 12,791199 43,970161
medie: 5,669 6,471 26,54411 83,54389
b= 0,31772653
a= 4,66980832
Relazione tra concentrazione plasmatica di colesterolo e trigliceridi
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 33
variazione del livello di trigliceridi con il livello di colesterolo
0
2
4
6
8
10
0 2 4 6 8 10 12 14
colesterolo (x)
trigl
icer
idi (
y)
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 34
variazione del livello di trigliceridi con il livello di colesterolo
0
2
4
6
8
10
0 2 4 6 8 10 12 14
colesterolo (x)
trigl
icer
idi (
y)
b = 0,32
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 35
variazione del livello di trigliceridi con il livello di colesterolo
0
2
4
6
8
10
0 2 4 6 8 10 12 14
colesterolo (x)
trigl
icer
idi (
y)
a=4,67
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 36
variazione del livello di trigliceridi con il livello di colesterolo
0
2
4
6
8
10
0 2 4 6 8 10 12 14
colesterolo (x)
trigl
icer
idi (
y)trigliceridi=4,67 + 0,32* colesterolo
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 37
Formule abbreviate
( )( ) ( )( )( ) ( )∑−
−=
∑∑∑∑∑xx
yxyxyin
iai
iiii22
2
( ) ( )( )( ) ( )∑−
−=
∑∑∑∑xxyxyx
inin
bi
iii22
Queste formule sono più convenienti per il calcolo a manoSi basano sulle formule abbreviate per il calcolo della varianza
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 38
Y è una variabile casuale
Omoscedasticità(omogeneità della varianza di y|x)
Distribuzione normale di y|x
Linearità della relazione tra x ed y
Requisiti dell’analisi di regressione
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 39
In questo esempio abbiamo dati campionati da una popolazione incui le tre assunzioni sono soddisfatte
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 40
Variabilità della retta di regressione.
• y è una variabile casuale
• x di solito non è una variabile casuale. Ilricercatore può scegliere soggetti con i valoridella x più adatti per lo studio.
• siamo interessati a valutare la variabilità di y,non quella di x.
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 41
Varianza intorno alla retta di regressione (stima campionaria)
( )2
2
2 ˆ−−
= ∑n
s yy ii
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 42
x
y
Residuo (o scarto) = valore y_osservato – valore y_predetto
Varianza = scarti ^ 2 / g.l.
valore y_osservato
valore y_predetto
scarto
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 43
( )2
2
2 ˆ−−
= ∑n
s yy ii ii bxay +=ˆ
( )2
2
2
−−−= ∑
nbxays ii
Sostituisco:
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 44
Colesterolo (x)
Trigliceridi (y)
att(y) y-att(y) (y-att(y))^2
1 3,45 6,24 5,765965 0,474035 0,224709
2 3,5 6,18 5,781851 0,398149 0,158522
3 2,95 5,2 5,607102 -0,4071 0,165732
4 3,77 6,11 5,867637 0,242363 0,05874
5 3,67 6,36 5,835865 0,524135 0,274718
6 5,31 5,67 6,356936 -0,68694 0,471881
7 5,1 5,48 6,290214 -0,81021 0,656446
8 7,85 5,67 7,163962 -1,49396 2,231921
9 8,79 9,4 7,462624 1,937376 3,753424
10 12,3 8,4 8,577845 -0,17784 0,031629
somma degli
scarti^2 8,027722
b= 0,31772653 s(b)^2= 1,003465
a= 4,66980832
Relazione tra concentrazione plasmatica di colesterolo e trigliceridi
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 45
Omoscedasticità: la varianza di y è costante per tutto l’intervallo x.E’ un requisito per la corretta applicazione della regressione lineare
(v.oltre)
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 46
Errore standard di b
( )2
2
)(∑ −
=xx
sbESi
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 47
Colesterolo (x)
Trigliceridi (y) ( )xxi−
2 att(y) y-att(y) (y-att(y))^2
1 3,45 6,24 4,923961 5,765965 0,474035 0,224709
2 3,5 6,18 4,704561 5,781851 0,398149 0,158522
3 2,95 5,2 7,392961 5,607102 -0,4071 0,165732
4 3,77 6,11 3,606201 5,867637 0,242363 0,05874
5 3,67 6,36 3,996001 5,835865 0,524135 0,274718
6 5,31 5,67 0,128881 6,356936 -0,68694 0,471881
7 5,1 5,48 0,323761 6,290214 -0,81021 0,656446
8 7,85 5,67 4,756761 7,163962 -1,49396 2,231921
9 8,79 9,4 9,740641 7,462624 1,937376 3,753424
10 12,3 8,4 43,970161 8,577845 -0,17784 0,031629
83,54389
somma degli
scarti^2 8,027722
b= 0,31772653 s(b)^2= 1,003465
a= 4,66980832 ES(b)= 0,109596
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 48
Errore standard di b
L’errore standard di b si riduce, a parità di s, quando lavariabilità di x è maggiore !
( )2
2
)(∑ −
=xx
sbESi
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 49
t = distanza tra il valore di b stimato (b) e quello previsto dall’ipotesi nulla (ß, di solito
H0: ß =0), in unità di errore standard di b (SE(b))
Intervallo di Confidenza e tests t per ilcoefficiente di regressione
)(bSEbt β−=
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 50
L’intervallo di confidenza si calcola nel modoconsueto (v. lezione precedente)
t ha (n-2) gradi di libertà ed il valore è scelto inmodo corrispondente all’errore di I tipo, contest a 2 code
)(bSEtbCI crit ×±=
Intervallo di Confidenza del coefficiente diregressione
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 51
Colesterolo (x)
Trigliceridi (y) ( )xxi−
2 att(y) y-att(y) (y-att(y))^2
1 3,45 6,24 4,923961 5,765965 0,474035 0,224709
2 3,5 6,18 4,704561 5,781851 0,398149 0,158522
3 2,95 5,2 7,392961 5,607102 -0,4071 0,165732
4 3,77 6,11 3,606201 5,867637 0,242363 0,05874
5 3,67 6,36 3,996001 5,835865 0,524135 0,274718
6 5,31 5,67 0,128881 6,356936 -0,68694 0,471881
7 5,1 5,48 0,323761 6,290214 -0,81021 0,656446
8 7,85 5,67 4,756761 7,163962 -1,49396 2,231921
9 8,79 9,4 9,740641 7,462624 1,937376 3,753424
10 12,3 8,4 43,970161 8,577845 -0,17784 0,031629
83,54389 somma degli scarti^2 8,027722
b= 0,31772653 s(b)^2= 1,003465
a= 4,66980832 ES(b)= 0,109596
IC(95%)_b= 0,064998 -0,570455
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 52
variazione del livello di trigliceridi con il livello di colesterolo
0
2
4
6
8
10
0 2 4 6 8 10 12 14
colesterolo (x)
trigl
icer
idi (
y)trigliceridi=4,67 + 0,32* colesteroloIC(95%)_b= 0,06 -0,57
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 53
18,0
20,0
22,0
24,0
26,0
28,0
30,0
32,0
34,0
36,0
19 22 25 28 31 34 37 40 43 46
lunghezza
circ
onfe
renz
a cr
anic
a
a=8,02b= 0,51ES(b)=0,05021(IC 95%_b: 0,41 - 0,61)y= 8,02 + 0,51x
Relazione alla nascita tra circonferenza cranica e lunghezza
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 54
Valore di y predetto dalla retta di regressione
data y=a+bx, dopo aver ricavato a e bpossiamo predire il valore atteso di y,
corrispondente ad un dato valore di x.
• Il calcolo si effettua sostituendo il valore di xnella formula, noti a e b e risolvendol’equazione.
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 55
Valore di y predetto dalla retta di regressione
• Es. il valore di circonferenza cranica predettoper un bambino di lunghezza 41 cm è
=8,02+0,513 * x
=8,02+0,513 * 41
=29,05
y
y
y
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 56
Intervallo di confidenza dei valori predetti
( )( )∑ −
−′++±= 2
2
2,
11ˆxxxx
nstyPI
i
i
gl α
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 57
=29,05
IC( )= 25,47 - 32,63
y
y
Relazione alla nascita tra circonferenza cranica e lunghezza
Es. il valore di circonferenza cranica predettoper un bambino di lunghezza 41 cm è
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 58
Intervallo di confidenza dei valori predetti
( )( )∑ −
−′++±= 2
2
2,
11ˆxxxx
nstyPI
i
i
gl α
La predizione ha unerrore maggioreallontanandosi dallamedia di x
La predizione ha un erroreminore con un’ampiavariabilità di x
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 59
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 60
0
2
4
6
8
10
12
14
0 2 4 6 8 10 12 14
atteso_y
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 61
Cautele nella predizione
• La predizione non è valida fuori dell’intervalloosservato di x
• La predizione è più incerta agli estremi delladistribuzione di x
• Per migliorare la precisione della predizionedebbo aumentare la somma dei quadratidegli scarti (devianza) di x
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 62
Outliers ed osservazioni ‘influenti’
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 63
18,0
20,0
22,0
24,0
26,0
28,0
30,0
32,0
34,0
36,0
19 22 25 28 31 34 37 40 43 46
lunghezza
circ
onfe
renz
a cr
anic
a
1
2
Relazione alla nascita tra circonferenza cranica e lunghezza
Ho due outliers, indicati come: 1 e 2
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 64
18,0
20,0
22,0
24,0
26,0
28,0
30,0
32,0
34,0
36,0
19 22 25 28 31 34 37 40 43 46
lunghezza
circ
onfe
renz
a cr
anic
a
1
Relazione alla nascita tra circonferenza cranica e lunghezza
Se escludo outlier 1
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 65
18,0
20,0
22,0
24,0
26,0
28,0
30,0
32,0
34,0
36,0
19 22 25 28 31 34 37 40 43 46
lunghezza
circ
onfe
renz
a cr
anic
a
1
2
Relazione alla nascita tra circonferenza cranica e lunghezza
Se escludo outliers 1 e 2
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 66
Tutti i dati:
a=8,02b= 0,51
Escluso outlier 1:a=4,91b=0,60
Esclusi outlier 1 e 2:a=4,46b=0,61
Relazione alla nascita tra circonferenza cranica e lunghezza
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 67
Valutazione del modello
• R2 : proporzione della varianza che èspiegata dal modello di regressione
• = (coefficiente di correlazione) ^2
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 68
variazione del livello di trigliceridi con il livello di colesterolo
0
2
4
6
8
10
0 2 4 6 8 10 12 14
colesterolo (x)
trigl
icer
idi (
y)trigliceridi=4,67 + 0,32* colesterolo
r =0,716R2 =0,51
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 69
Omoscedasticità (omogeneità della varianza)
Distribuzione normale degli errori
Linearità
Verifica dei modelli
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 70
Omoscedasticità (omogeneità della varianza)
Distribizione normale degli errori
Linearità
Verifica dei modelli
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 71
Omoscedasticità (omogeneità della varianza)
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 72
Verifica delle assunzioni del modello
La verifica delle assunzioni del modello vienecondotta esaminando la distribuzione deiresidui
Se la varianza è costante per tutta ladistribuzione della x,anche i residui sarannodistribuiti in modo uniforme.
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 73
x
y
Residuo (o scarto) = valore y_osservato – valore y_predetto
valore y_osservato
valore y_predetto
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 74
Verifica delle assunzioni del modello
Distribuzione uniforme dei residui
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 75
Distribuzione uniforme dei residui
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 76
Distribuzione non uniforme dei residui
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 77
Distribuzione non uniforme dei residui
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 78
Omoscedasticità (omogeneità della varianza)
Distribuzione normale degli errori
Linearità
Verifica dei modelli
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 79
Distribuzione normale dei residui (errori)
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 80
Distribuzione non normale dei residui (errori)
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 81
Distribuzione non normale dei residui (errori)
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 82
Omoscedasticità (omogeneità della varianza)
Distribizione normale degli errori
Linearità
Verifica dei modelli
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 83
Perchè parliamo di regressionelineare?
• La variazione lineare è spesso unaspiegazione adeguata
• Variazioni non lineari diventano tali dopo unatrasformazione matematica di una dellevariabili
• La variazione lineare è un punto di partenza
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 84
Non-linearità
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 85
Non-linearità
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 86
Non-linearità
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 87
Trasformazioni normalizzanti e linearizzanti
• Radice quadrata
• Logaritmo
• Inversa (meglio se ulteriormente moltiplicataper -1)
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 88
Inversa negativa
Log
Radice
Dati originali
Dati
trasformati
Trasformazioni normalizzanti e linearizzanti
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 89
FREQUENCY
0
10
20
30
40
50
60
70
80
90
100
110
120
130
140
150
CORPUSCO MIDPOINT
0 250
500
750
1000
1250
1500
1750
2000
2250
2500
2750
3000
3250
3500
3750
4000
4250
4500
4750
5000
5250
5500
5750
6000
6250
6500
6750
7000
7250
7500
7750
8000
8250
8500
8750
9000
9250
9500
9750
10000
FREQUENCY
0
10
20
30
40
50
L_c MIDPOINT
0.00
0.25
0.50
0.75
1.00
1.25
1.50
1.75
2.00
2.25
2.50
2.75
3.00
3.25
3.50
3.75
4.00
4.25
4.50
4.75
5.00
5.25
5.50
5.75
6.00
6.25
6.50
6.75
7.00
7.25
7.50
7.75
8.00
8.25
8.50
8.75
9.00
9.25
9.50
9.75
10.00
10.25
10.50
10.75
11.00
11.25
11.50
11.75
12.00
12.25
12.50
12.75
13.00
13.25
13.50
13.75
14.00
Corso di laurea in medicina e chirurgia - Statistica Medica – Correlazione e Regressione lineare semplice 90
Esercizi regressione
• Pag.326 n 1• Pag.326 n 3• Pag.326 n 4• Pag.326 n 6• Pag.326 n 10