Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6...

22
Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica CdL in Scienze e Tecnologie per l'Ambiente e la Natura I anno, II semestre G. Bacaro

Transcript of Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6...

Page 1: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

Confronto tra due popolazioniLezione 6

Last updated May 29, 2016

StatisticaCdL in Scienze e Tecnologie per l'Ambiente e la Natura I anno, II semestre

G. Bacaro

Page 2: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

2

Concetti visti nell’ultima lezione

Le media del campione è uguale e quella di una popolazione nota?

??

Page 3: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

3

Confronto FRA due campioni

Non conosco le popolazioni!

?

Page 4: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

4

Il test t su due campioni

Assunzioni generali:

1. Indipendenza delle osservazioni (posso correggere per questo)

2. Normalità delle popolazioni a confronto

3. Omogeneità della varianza (posso correggere per questo)

Ipotesi:

H0: le due medie sono uguali

Ha: le medie sono diverse (o > o <)

Page 5: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

5

1. Indipendenza delle osservazioni

Attenzione al campionamento!!!

Ogni osservazione corrisponde ad una vera replica?

Page 6: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

6

2. Normalità delle popolazioni a confronto

I due campioni devono provenire da popolazioni normali!

Page 7: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

7

2. Normalità delle popolazioni a confronto

Operazioni per verificare la normalità

1. Confrontare le caratteristiche dei dati con quelle teoriche della distribuzione normale (es. mediana ≈ media)

2. Analisi grafica (es. istogrammi)

3. Eseguire dei test (non considerati durante il corso)

Page 8: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

-4 -2 0 2 4

050

100

150

200

250

8

2. Normalità delle popolazioni a confronto

Analisi dell’istogramma

- Simmetria (media ≈mediana)

- c. 2/3 dei dati in un intervallo μ±σ

- c. 95% dei dati in un intervallo μ±2σ

Page 9: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

-5 0 5 10 15

050

100

150

200

250

-5 0 5 10 15

050

100

150

200

250

9

3. Omogeneità della varianza

Il livello di variabilità delle popolazioni a confronto deve essere simile!

μ=5 e σ=2 μ=5 e σ=1

Page 10: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

10

3. Omogeneità della varianza: Il test F

22

21

s

sF

Varianza maggiore

Varianza minore

Distribuzione di probabilità che dipende dalla numerosità dei due campioni (n1 e n2)

Page 11: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

11

3. Omogeneità della varianza: Il test F

22

21

s

sFcalcolato

Varianza maggiore

Varianza minore

Test di ipotesi:1. Calcolo la varianza dei due campioni2. Determino il valore di Fcalcolato

3. Decido il livello di significatività (alpha)4. Determino il valore di Fcritico (se la tavola dà P per alpha/2)5. Se Fcalcolato> F critico rifiuto H06. Conclusione: le varianze sono DIVERSE!

H0: le due varianze sono ugualiHa: le due varianze sono diverse

Page 12: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

12

3. Omogeneità della varianza: Il test F

calcolatoF

Numeratore: n1-1Denominatore: n2-1

La tavola dà un valore di F per una coda! Gli F qua sotto corrispondono a α=0.05 a due code!

Page 13: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

13

Il test t

Misura legata alla differenza fra le medie

Misura di variabilità dentro i gruppi

Differenza medie

Variabilità dei gruppi

tcalcolato=

Page 14: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

14

Il test t

Differenzafra le medie

Caso 1 Caso 2

Caso 3 Caso 4

A BA B

A B A B

Varia

bile

Varia

bile

Variabilità B

Variabilità A

Page 15: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

15

Il test t

Differenza fra le medie

Errore standard della differenza

Differenza fra medie

t

Variabilità dentro i gruppit

Più estremo sarà t calcolato maggiore sarà la probabilità di rifiutare H0

tcalcolato=

Page 16: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

16

Il test t

tcalcolato=

+ estremo sarà tcalcolato maggiore la probabilità di rifiutare H0

P

-Tcritico Tcritico

Differenza fra le medieErrore standard della differenza

Page 17: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

17

Come scegliere il test t giusto a partire dalle assunzioni

Indipendenza

NO SÌTest t appaiato Test t non appaiati

Test t perpop. omoschedastiche

21

22 ss

21

22 ss

Test t perpop. eteroschedastiche

Welch t-test(formula complessa

richiesto un PC)

21

2

21

11

)(

nnS

xxt

p

n

SD

tD

Page 18: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

18

Campioni independenti omoschedastici: Test t!

21

2

21

11

)(

nnS

xxt

p

calcolato

?

))1()1(

)1()1(

21

222

2112

nn

SnSnS p Varianza combinata (”pooled”)

I gradi di libertà sono n1 + n2-2 per Tcritico

Page 19: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

19

Campioni independenti omoschedastici: Test t!

I gradi di libertà sono n1+n2-2 per Tcritico

Test di ipotesi:1. Calcolo la varianza combinata dei due campioni2. Determino il valore di tcalcolato

3. Decido il livello di significatività (alpha, 1 o 2 code?)4. Determino il valore di tcritico

5. Se |tcalcolato|> |t critico| rifiuto H06. Conclusione: le medie sono DIVERSE!

H0: le due medie sono ugualiHa: le due medie sono diverse

Page 20: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

20

Campioni appaiati: 2 casi

Studente Prima DopoA 22 23B 23 24C 24 24D 25 25E 20 21F 18 18G 18 18H 19 20

1. Misure ripetute 2. Correlazione nello spazio

Industria tessile

Misuraa valle

Misuraa monte

Fiume A

Fiume B

Fiume C

[Ammoniaca] in acqua

Page 21: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

21

Campioni appaiati: Test t

n

SD

tD

n

DD i

1

)( 2

n

DDS i

D

Media delle differenze

Deviazione standard delle differenze

n Numero di coppie

Studente Prima Dopo Di

A 22 23 1B 23 24 1C 24 24 0D 25 25 0E 20 21 1F 18 18 0G 18 18 0H 19 20 1

I gradi di libertà sono n-1 per tcritico

Page 22: Confronto tra due popolazioni Lezione 6 - Moodle@Units · Confronto tra due popolazioni Lezione 6 Last updated May 29, 2016 Statistica ... Normalità delle popolazioni a confronto

22

I gradi di libertà sono n-1 per tcritico

Test di ipotesi:1. Determino il valore di tcalcolato

2. Decido il livello di significatività (alpha, 1 o 2 code?)3. Determino il valore di tcritico

4. Se |tcalcolato|> |tcritico| rifiuto H05. Conclusione: le medie sono DIVERSE!

H0: le due medie sono ugualiHa: le due medie sono diverse

Campioni appaiati: Test t

?