ANOVA 1 Via Esercizio –esempio 1 · PDF fileANOVA 1 Via Esercizio –esempio 1...
Transcript of ANOVA 1 Via Esercizio –esempio 1 · PDF fileANOVA 1 Via Esercizio –esempio 1...
ANOVA 1 Via Esercizio –esempio 1
Miller e Vanhoutte hanno condotto una ricerca sperimentale in cui
cani femmine adulte, a cui erano state precedentemente asportate
le ovaie (ovariectomizzate), sono stati trattati con estrogeni e
progesterone. Si vuole sapere se i trattamenti hanno o meno effetti
sulla concentrazione serica di progesterone.
Dati
TRATTAMENTO Non trattatiEstrogeno Progesterone Estrogeno +Progesterone 117 440 605 2664 124 264 626 2078 40 221 385 3584 88 136 475 1540 40 1840 n= 18 k= 4
Totale 409 1061 2091 11706
TOT generale=
T= 15267
Media 81.8 265.25 522.75 2341.2
Media generale =
X= 848.166
Variabile risposta = concentrazione sierica progesterone ng/dl Variabile trattamento = tipo di trattamento effettuato Unità sperimentale = singoli individui (cani) trattati Alfa = 0.05 Gradi di libertà totali =n-1= 18-1= 17 Gradi di libertà tra trattamenti = k-1 = 4-1=3 Gradi di libertà entro trattamenti = n-k = 18-4=14
F critico per 3 gdl al numeratore / 14 gdl al denominatore = 3.34 H0: µ1= µ2= µ3= µ4 i quattro trattamenti danno la stessa risposta HA : non tutte le µk sono uguali, almeno un trattamento da una risposta media diversa Assunzioni: “ INE” Randomizzazione dei trattamenti ai soggetti:effettuata
concentrazione sierica di progesterone ng/dl per tr attamento
0
500
1000
1500
2000
2500
3000
3500
4000
Non trattati Estrogeno Progesterone Estrogeno +Progesterone
prog
este
rone
ng/
dl
Nel grafico si osservano i valori della variabile risposta ng/dl di progesterone in funzione dei trattamenti effettuati, della variabile trattamento; si osservano la relativa posizione e dispersione dei valori per ogni trattamento ed in riferimento alla media generale della variabile risposta di tutte le unità sperimentali
Media generale
SOMMA QUADRATI SS
scarti dalla media al quadrato
Totale SST =
SST =∑ =
k
J 1 ∑ =
nj
i 1xij
2 – (T2../N)
(117*117)+(124*124)+…(124*124) - (15267*15267)/18
SST = 18570669
Tra trattamenti
∑ =
k
J 1 (T.j2/nj) – (T2../N)
SSA= (409*409)/5+(1061*1061)/4+….-(15267*15267)/18
SSA= 15865083
Entro trattamenti SSW= SST-SSA
SSW= 2705585
Tavola di analisi fonte varianza SS g.l MS R.V.
somma quadrati gradi di libertà media quadratica rapporto di varianze Tra trattamenti 15865083 3 5288361 27.36453 Entro trattamenti 2705585 14 193256.1
Totale 18570669 17
RV= MSA/ MSW = 5288361 / 193256.1 = 27.36453 F è maggiore di F critico = 3.34 per alfa = 0.05 , 3/14 gradi di libertà
quindi rifiutiamo H0
Almeno un trattamento ha una media diversa dagli altri
Risultati Excel analisi dati Analisi varianza: ad un fattore RIEPILOGO
Gruppi Conteggio Somma Media Varianza Colonna 1 5 409 81.8 1638.2 Colonna 2 4 1061 265.25 16400.91667 Colonna 3 4 2091 522.75 12893.58333 Colonna 4 5 11706 2341.2 652787.2 ANALISI VARIANZA
Origine della variazione SQ gdl MQ F Valore di
significatività F
critico Tra gruppi 15865083.4 3 5288361.133 27.364 0.000 3.34 In gruppi 2705585.1 14 193256.0786 Totale 18570668.5 17
Risoluzione esercizio con il software R (v2.15.1)
#Importazione dati data_estrogeni<-read.csv2(file.choose(), header= TRUE, sep= ";", dec=",", na.strings=" ") #importa dataset excel "anova1_1.csv"
#Visualizzo un estratto del dataset head(data_estrogeni)
> head(data_estrogeni) Un.sper risposta trattamento 1 117 A
2 124 A 3 40 A 4 88 A 5 40 A 6 440 B #Uso il comando ‘colnames’ che permette di visualiz zare il nome delle variabili colnames(data_estrogeni)
[1] "Un.sperimentale" "risposta" "trattamento" #Utilizzo il comando ‘attach’ per gestire le variab ili con il loro nome attach(data_estrogeni) #Calcolo le statistiche di sintesi della variabile risposta e della variabile trattamento
summary(risposta)
> summary(risposta) Min. 1st Qu. Median Mean 3rd Qu. Max. 40.0 127.0 412.5 848.2 1312.0 3584.0
#Comunico al software la natura nominale categorica della variabile trattamento trattamento<-as.factor(trattamento)
summary(trattamento)
> summary(trattamento) 1 2 3 4 5 4 4 5 #Applico l’analisi della varianza (ANOVA) a 1 via anova(lm(risposta~trattamento))
Analysis of Variance Table Response: risposta Df Sum Sq Mean Sq F value Pr(>F) trattamento 3 15865083 5288361 27.364 4.089e-06 *** Residuals 14 2705585 193256 ---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘. ’ 0.1 ‘ ’ 1
#Applico i confronti multipli di Tukey... TukeyHSD(aov(lm(risposta~trattamento))) trx vs try diff IC 95% (t) p agg lwr upr
2-1 183.45 -673.6928 1040.593 0.9232880 3-1 440.95 -416.1928 1298.093 0.4658803 4-1 2259.40 1451.2781 3067.522 0.0000061 3-2 257.50 -646.0078 1161.008 0.8401641 4-2 2075.95 1218.8072 2933.093 0.0000311 4-3 1818.45 961.3072 2675.593 0.0001282
#...che visualizzo anche graficamente rispetto alle seguenti ipotesi nulle H0: µx – µy = 0
plot(TukeyHSD(aov(lm(risposta~trattamento))))
Qualora le assunzioni dell’ANOVA fossero violate (es. assenza di normalità, varianze dei trattamenti non omogenee) si ricorre al metodo non parametrico di Kruskall-Wallis che sfrutta i ranghi: data.frame(rango=rank(risposta),risposta,trattamento) rango risposta trattamento 1 4.0 117 1 2 5.0 124 1 3 1.5 40 1 4 3.0 88 1 5 1.5 40 1 6 10.0 440 2 7 8.0 264 2 8 7.0 221 2 9 6.0 136 2 10 12.0 605 3 11 13.0 626 3 12 9.0 385 3 13 11.0 475 3 14 17.0 2664 4 15 16.0 2078 4 16 18.0 3584 4 17 14.0 1540 4 18 15.0 1840 4 kruskal.test(risposta~trattamento) > kruskal.test(risposta~trattamento) Kruskal-Wallis rank sum test data: risposta by trattamento Kruskal-Wallis chi-squared = 15.7004, df = 3, p-val ue = 0.001306
Test significativo , rifiuto H0 accetto Ha Almeno un trattamento ha una media diversa dagli altri
Esercizio esempio 2
Azoulay e Dupuis hanno studiato l’efficacia di cinque farmaci per debellare lo Streptococcus pneumonie nel polmone di topi femmina infettate dal batterio. I dati che seguono riassumono l’esperimento con dosaggi peri iniezione di antibiotico mg/Kg e numero di batteri delle vie aeree espresso in Log cfu/ml di polmone omogeneizzato). Si vuole sapere se i trattamenti hanno effetti diversi. DATI
TRATTAMENTO
Controlli Amoxicillina
50 Eritromicina
50 Temafloxacina
50 Ofloxacina
100 Ciprofloxacina
100
8.80 2.60 2.60 2.60 7.30 7.86 8.60 2.60 2.60 2.60 5.30 4.60 8.10 2.60 2.60 2.60 7.48 6.45 8.40 8.80 n= 20 k=6
Totale 42.70 7.80 7.80 7.80 20.08 18.91
Tot generale=
T=105.09
Media 8.54 2.60 2.60 2.60 6.69 6.30
Media
generale= X= 5.25
H0: µ1= µ2= µ3= µ4 i quattro trattamenti hanno stessa media, danno la stessa risposta HA : non tutte le µk sono uguali, almeno un trattamento da una risposta media diversa --------------------------------------------------------------------------------- Variabile risposta = numero di batteri (Log cfu/ml di polmone omogeneizzato) nelle vie aeree Variabile trattamento = tipo di antibiotico utilizzato Unità sperimentale = singoli individui (topi femmina)
Alfa = 0.05 Gradi di libertà totali =n-1= 20-1= 19 Gradi di libertà tra trattamenti = k-1 = 6-1=5 Gradi di libertà entro trattamenti = n-k = 20-6 =14 -------------------------------------------------------------------------------- F critico per 5 gdl al numeratore / 14 gdl al denominatore = 2.96 --------------------------------------------------------------------------------
Assunzioni: INE Randomizzazione dei trattamenti ai soggetti:effettuata
SOMMA QUADRATI
scarti dalla media al quadrato Totale SST = (2.6*2.6)+(2.6*2.)+…(6.45*6.45) - (105.09*105.09)/20
SST = 135.53
tra trattamenti SSA= (42.7*42.7)/5+(2.6*2.6)/3+….-(105.09*105.09)/20
SSA= 126.90
entro trattamenti SSW= SST-SSA
SSW= 8.63
Tavola di analisi fonte varianza SS g.l MS R.V.
somma quadrati gradi di libertà media quadratica rapporto di varianze
Tra trattamenti 126.90 5.00 25.380 41.19 Entro trattamenti 8.63 14.00 0.616
Totale 135.53 19.00
RV- F è maggiore di F critico 2.95 per alfa = 0.05 ,5/14 gradi di libertà quindi rifiutiamo H0 Rifiutiamo H0
Ovvero i quattro trattamenti non hanno stessa media, non
danno la stessa risposta; almeno un trattamento ha una media
diversa, almeno un farmaco antibiotico agisce diversamente sul
numero di batteri infettanti.
Risultati Excel analisi dati
Analisi varianza: ad un fattore
RIEPILOGO
Gruppi Conteggio Somma Media Varianza
Colonna 1 5 42.7 8.54 0.088 Colonna 2 3 7.8 2.6 0 Colonna 3 3 7.8 2.6 0 Colonna 4 3 7.8 2.6 0 Colonna 5 3 20.08 6.693 1.464
Colonna 6 3 18.91 6.303 2.673
ANALISI VARIANZA
Origine della variazione SQ gdl MQ F Valore di
significatività F crit
Tra gruppi 126.901 5 25.38015233 41.19040141 0.000 2.9582 In gruppi 8.62633 14 0.616166667
Totale 135.527 19
Risoluzione esercizio con il software R (v2.15.1)
> anova(lm(risposta~trattamento)) Analysis of Variance Table Response: risposta Df Sum Sq Mean Sq F value Pr(>F) trattamento 5 126.901 25.3802 41.19 6.916e-08 *** Residuals 14 8.626 0.6162 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘. ’ 0.1 ‘ ’ 1
Esercizio esempio 3 Rosen et al. hanno studiato la presenza di problemi nel sonno in soggetti sopravvissuti all’olocausto nazista, rispetto a soggetti depressi e sani. I problemi nel sonno sono valutati con l’indice PSQI (Pittsburg Sleep Qualità Index) che riassume diversi sintomi presenti nell’ultimo mese ed i risultati sono riportati nella tabella seguente. Si vuole sapere se le condizioni trauma dell’olocausto, depressione-non depressione dei soggetti determinano condizioni diverse di qualità del sonno.
TRATTAMENTO
k Sopravvissuti olocausto Pazienti depressi Pazienti sani 5 16 2 9 12 0 12 10 5 3 12 4 15 11 8 7 17 4 5 17 2 4 16 2 21 10 3 12 6 2 2 7 1 10 16 2 8 14 1 8 7 2 10 12 1 8 8 2 6 10 1 13 12 2 3 9 3 6 9 6 11 6 2 4 16 13 12
Totale 182 278 55 Media 8.27 11.58 2.62
Totale generale 515 n=67 Media generale 8 K=3
H0: µ1= µ2= µ3= µ4 i tre trattamenti hanno stessa media, danno la stessa risposta HA : non tutte le µk sono uguali, almeno un trattamento da una risposta media diversa Variabile risposta = punteggio indice PSQI qualità del sonno Variabile trattamento = tipo esperienza - condizione del paziente Unità sperimentale = singoli individui valutati Alfa = 0.05 -------------------------------------------------------------------------------- Gradi di libertà totali =n-1= 67-1= 66 Gradi di libertà tra trattamenti = k-1 = 3-1= 2 Gradi di libertà entro trattamenti = n-k = 67-3 = 64 -------------------------------------------------------------------------------- F critico per 2 gdl al numeratore / 64 gdl al denominatore = 3.14 -------------------------------------------------------------------------------- Assunzioni: INE Randomizzazione: effettuata ??
SOMMA QUADRATI
scarti dalla media al quadrato
Totale SST = (5*5)+(9*9)+…(2*2) - (515*515.)/67
SST = 1702.41791
Tra trattamenti SSA= (42.7*42.7)/5+(2.6*2.6)/3+….-(105.09*105.09)/20
SSA= 911.2685598
Entro trattamenti SSW= SST-SSA
SSW= 791.1493506
Tavola di analisi
fonte varianza SS g.l MS R.V.
somma quadrati gradi di libertàmedia quadraticarapporto di varianze
Tra trattamenti 911.2685598 2 455.6342799 36.86
Entro trattamenti 791.1493506 64 12.3617086
Totale 1702.41791 66.00
RV- F è maggiore di F critico 3.14
per alfa = 0.05 ,5/14 gradi di libertà quindi rifiutiamo H0
Ovvero i tre trattamenti non hanno stessa media, non danno la stessa risposta; almeno un trattamento ha una media diversa, almeno una delle tre condizioni agisce diversamente sulla qualità del sonno. Analisi varianza: ad un fattore Risultati Excel Analisi dati RIEPILOGO
Gruppi Conteggio Somma Media Varianza Colonna 1 22 182 8.272727 20.77922 Colonna 2 24 278 11.58333 12.34058 Colonna 3 21 55 2.619048 3.547619 67 ANALISI VARIANZA Origine della variazione SQ gdl MQ F Valore di significatività F crit Tra gruppi 911.2686 2 455.6343 36.85852 2.23951E-11 3.140443In gruppi 791.1494 64 12.36171 Totale 1702.418 66
Esercizio esempio 4 Singh et al. Hanno studiato le anomalie immunitarie in bambini autistici, sono riportati i dati relativi alla misurazione di concentrazione serica unità/ml di un antigene in tre campioni di bambini di età minore di 10 anni. Vi sono differenze tra i tre campioni di bambini artistici, normali e ritardati ?
TRATTAMENTO
Bambini autistici Bambini normali Bambini ritardati
755 165 380 385 390 510 380 290 315 215 435 565 400 235 715 343 345 380 415 320 390 360 330 245 345 205 155 450 375 335 410 345 295 435 305 200 460 220 105 360 270 105 225 355 245 900 360 365 335 440 305 820 325 400 245 170 285 300 370 325 345 345 230 370 285 315 195 270 305 375 220
Totale 9658 10065 4940
Media 419.91 305.00 329.33
Totale generale 24663 n=71
Media generale 347.3661972
H0: µ1= µ2= µ3= µ4 i tre trattamenti hanno stessa media, danno la stessa risposta HA : non tutte le µk sono uguali, almeno un trattamento da una risposta media diversa Variabile risposta = concentrazione serica antigene unità/ml Variabile trattamento = condizione mentale del bambino Unità sperimentale = singoli bambini valutati Alfa = 0.05 -------------------------------------------------------------------------------- Gradi di libertà totali =n-1= 71-1= 70 Gradi di libertà tra trattamenti = k-1 = 3-1= 2 Gradi di libertà entro trattamenti = n-k = 71-3 = 68 -------------------------------------------------------------------------------- F critico per 2 gdl al numeratore / 68 gdl al denominatore = 3.13 -------------------------------------------------------------------------------------
Assunzioni: INE Randomizzazione: ??
SOMMA QUADRATI scarti dalla media al quadrato Totale SST = (755*755)+(385*385)+…(245*245) - (24663*24663)/69
SST = 1421856.479
tra trattamenti SSA= (9658*9658)/23+(10065*10065)/33+….- (24663*24663)/71
SSA= 185159.3195
entro trattamenti SSW= SST-SSA
SSW= 1236697.159
Tavola di analisi fonte varianza SS g.l MS R.V.
somma quadrati gradi di libertà media quadratica rapporto di varianze
Tra trattamenti 185159.3195 2 92579.65973 5.09
Entro trattamenti 1236697.159 68 18186.72293 Totale 1421856.479 70.00
RV- F è maggiore di F critico =3.13
per alfa = 0.05 ,2/68 gradi di libertà quindi rifiutiamo H0 Rifiutiamo H0 Ovvero i tre trattamenti non hanno stessa media; almeno un trattamento ha una media diversa, almeno una delle tre condizioni dei bambini ha diversa concentrazione di antigene.
Analisi varianza: ad un fattore Analisi dati con excel
RIEPILOGO Gruppi Conteggio Somma Media Varianza
Colonna 1 23.00 9658.00 419.91 31693.36 Colonna 2 33.00 10065.00 305.00 4071.88 Colonna 3 15.00 4940.00 329.33 29224.52
ANALISI VARIANZA
Origine della variazione SQ gdl MQ F Valore di
significatività F crit Tra gruppi 185159.32 2.00 92579.66 5.09 0.01 3.13 In gruppi 1236697.16 68.00 18186.72
Totale 1421856.48 70.00
Esercizio esempio 5
Sono state sperimentate quattro tipi di diete alimentari in un gruppo di volontari per uno stesso periodo di tempo alfine di valutare l’efficacia o meno della dieta usata. I volontari inoltre non differivano in dispendio energetico nello stesso periodo di tempo. È stata misurata la % di variazione del peso dall’inizio alla fine della dieta per ogni volontario. I dati sono riportati sotto, vi sono differenze tra le diverse diete?
TRATTAMENTO controllo dieta 1 dieta 2 dieta 3 dieta 4 3 0 6 3 2 3 0 -3 7 -3 4 2 -1 2 -2 2 4 2 1 5 -3 6 2 -4 2 -4 6 3 2 2 -4 2 6 3 2 3 -4 2 2 0 2 6 0 1
Totale 20 19 17 14 Media 1.82 1.73 1.55 1.27 Totale generale 70 n=44 Media generale 1.59
H0: µ1= µ2= µ3= µ4 i tre trattamenti hanno stessa media, danno la stessa risposta HA : non tutte le µk sono uguali, almeno un trattamento da una risposta media diversa
Variabile risposta = variazione % di peso nel tempo standard Variabile trattamento = tipo di dieta Unità sperimentale = singoli volontari sottoposti alla dieta Alfa = 0.05 Gradi di libertà totali =n-1= 44-1= 43 Gradi di libertà tra trattamenti = k-1 = 4-1= 3 Gradi di libertà entro trattamenti = n-k = 44-4 = 40 -------------------------------------------------------------------------------- F critico per 3 gdl al numeratore / 40 gdl al denominatore = 2.84 -------------------------------------------------------------------------------- Assunzioni: “INE” Randomizzazione: effettuata
SOMMA QUADRATI scarti dalla media al quadrato Totale SST = (3*3)+(2*2)+…(1*1) - (70*70)/44
SST = 382.6364
tra trattamenti SSA= (20*20)/11+(19*19)/11+….- (70*70)/44
SSA= 1.909091
entro trattamenti SSW= SST-SSA
SSW= 380.7273
Tavola di analisi fonte varianza SS g.l MS R.V.
somma quadrati gradi di libertà media quadratica rapporto di varianze
Tra trattamenti 1.909091 3 0.636363636 0.07
Entro trattamenti 380.7273 40 9.518181818 Totale 382.6364 43.00
RV- F è minore di F critico 2.84
per alfa = 0.05 , 3/40 gradi di libertà quindi NON rifiutiamo H0 ---- Rifiutiamo HA
Ovvero i quattro trattamenti hanno stessa media; non vi sono differenze tra le diete e controllo. Analisi varianza: ad un fattore Analisi dati con excel RIEPILOGO
Gruppi Conteggio Somma Media Varianza Colonna 1 11 20 1.8182 11.56363636 Colonna 2 11 19 1.7273 9.818181818 Colonna 3 11 17 1.5455 9.472727273 Colonna 4 11 14 1.2727 7.218181818 ANALISI VARIANZA Origine della variazione SQ gdl MQ F Valore di significatività F crit Tra gruppi 1.909090909 3 0.6364 0.066857689 0.977177244 2.8387In gruppi 380.7272727 40 9.5182 Totale 382.6363636 43
Esercizio esempio 6
Per valutare la capacità di alcune specie vegetali di assorbimento-depurazione di metalli pesanti dal suolo è stata studiata la concentrazione di piombo in µg per grammo di fusto essiccato (materia secca) in quattro zone di coltivazione di girasole Helianthus annuus, compresa una ex discarica abusiva. Vi è differenza tra i diversi campioni di coltivazione?
TRATTAMENTO area 1 ex discarica area 2 area 3 area 4 10 3 2 1 9 2 2 0 13 5 2 2 11 3 1 3 14 1 4 2 6 0 3 3 2 3 2 3 10 2 1 2 11 3 3 3 9 1 4 11 2 2
K = 4 2 Totale 106 27 20 25 Media 9.64 2.25 2.22 2.27 Totale generale 178 n=43 Media generale 4.14
H0: µ1= µ2= µ3= µ4 i tre trattamenti hanno stessa media, danno la stessa risposta HA : non tutte le µk sono uguali, almeno un trattamento da una risposta media diversa
Variabile risposta = concentrazione di piombo microgrammi/g di materia secca Variabile trattamento = zona-terreno di coltivazione Unità sperimentali = singole piante di girasole Alfa = 0.05 Gradi di libertà totali =n-1= 43-1= 42 Gradi di libertà tra trattamenti = k-1 = 4-1= 3 Gradi di libertà entro trattamenti = n-k = 43-4 = 39 -------------------------------------------------------------------------------- F critico per 3 gdl al numeratore / 39 gdl al denominatore = 2.84 --------------------------------------------------------------------------------
Assunzioni: “INE” Randomizzazione: ??
SOMMA QUADRATI
scarti dalla media al quadrato Totale SST = 10*10)+(9*9)+…(2*2) - (178*178)/43
SST = 593.1628
tra trattamenti SSA= (106*106)/11+(27*27)/12+….- (178*178)/43
SSA= 446.63
entro trattamenti SSW= SST-SSA
SSW= 146.5328
Tavola di analisi fonte varianza SS g.l MS R.V.
somma quadrati gradi di libertà media quadratica rapporto di varianze
Tra trattamenti 446.63 3 148.8766541 39.62 Entro trattamenti 146.5328 39 3.757252007
Totale 593.1628 42.00
RV- F è maggiore di F critico 2.84 per alfa = 0.05 ,2/68 gradi di libertà quindi rifiutiamo H0
Ovvero i quattro trattamenti non hanno stessa media; almeno un trattamento ha una media diversa, almeno in una delle tre zone di coltivazione i girasoli hanno una diversa concentrazione di piombo. Analisi varianza: ad un fattore Analisi dati con Excel RIEPILOGO
Gruppi Conteggio Somma Media Varianza Colonna 1 11 1069.636410.85454545 Colonna 2 12 27 2.251.659090909 Colonna 3 9 202.22220.944444444 Colonna 4 11 252.27271.218181818 ANALISI VARIANZA Origine della variazione SQ gdl MQ F Valore di significatività F crit Tra gruppi 446.6299624 3148.8839.62381385 6.40246E-12 2.8451In gruppi 146.5328283 393.7573 Totale 593.1627907 42
Esercizio –esempio 7 Szàdòczky et al. hanno studiato un principio attivo della classe degli antidepressivi triciclici, la Imipramina, ed hanno valutato la densità di H3-imipramina nelle piastrine dei pazienti depressi stagionali (SAD), pazienti depressi non stagionali (non SAD) ed in paziento sani. I dati sono qui riportati. Sussiste differenza di concentrazione per le tre categorie di pazienti?
TRATTAMENTO
SAD non-SAD Controllo
634 771 1067 585 546 1176 520 552 1040 525 557 1218 693 976 942 660 204 845 520 807 573 526 731 788 736 1007 846 701 584 867 691
Totale 11661.00 4939.00 6288.00 Media 685.94 617.38 1048.00
Totale generale 22888.00 n=31 Media generale 738.32
H0: µ1= µ2= µ3 i tre trattamenti hanno stessa media, danno la stessa risposta HA : non tutte le µk sono uguali, almeno un trattamento da una risposta media diversa
Variabile risposta = densità di imipramina Variabile trattamento = tipologia di pazienti Unità sperimentali = singoli individui valutati Alfa = 0.05 -------------------------------------------------------------------------------- Gradi di libertà totali =n-1= 31-1= 30 Gradi di libertà tra trattamenti = k-1 = 3-1= 2 Gradi di libertà entro trattamenti = n-k = 31-3 = 28 -------------------------------------------------------------------------------- F critico per 2 gdl al numeratore / 28 gdl al denominatore = 3.34 Assunzioni: “INE” Randomizzazione: ??
SOMMA QUADRATI
scarti dalla media al quadrato Totale SST = (634*634)+(585*585)+…(845*845) - (22888*22888)/31
SST = 1512054.774
tra trattamenti SSA= (11661*11661)/17+(4939*493915)/8+….- (22888*2288)/31
SSA= 739071.958
entro trattamenti SSW= SST-SSA
SSW= 772982.8162
Tavola di analisi fonte varianza SS g.l MS R.V.
somma quadrati gradi di libertà media quadratica rapporto di varianze
Tra trattamenti 739071.958 2 369535.979 13.39 Entro trattamenti 772982.8162 28 27606.52915
Totale 1512054.774 30
RV- F è maggiore di F critico 3.34 per alfa = 0.05 ,2/28 gdi
Rifiutiamo H0 Ovvero i tre trattamenti non hanno stessa media; almeno un trattamento ha una media diversa, almeno un tipo di paziente SAD non-SAD ha una diversa densità di Imipramina. Analisi varianza: ad un fattore Analisi dati Con Excel RIEPILOGO
Gruppi Conteggio Somma Media Varianza Colonna 1 17 11661 685.9411765 18401.06 Colonna 2 8 4939 617.375 54344.55 Colonna 3 6 6288 1048 19630.8 ANALISI VARIANZA Origine della variazione SQ gdl MQ F Valore di significatività F crit Tra gruppi 739071.958 2 369535.979 13.38582 8.32592E-05 3.3404In gruppi 772982.8162 28 27606.52915 Totale 1512054.774 30
Esercizio-esempio 8
Per valutare l’efficacia di trattamenti sulla crescita dei capelli , effettuati mediante lozioni con infusi di erbe, è stato condotto un esperimento con tre tipi diversi di lozione e controllo (acqua distillata) su pazienti dello stesso sesso, età ed etnia per 10 giorni. La crescita è stata misurata in mm, I dati sono riportati qui di seguito. Esistono differenze tra i trattamenti?
TRATTAMENTO Infuso 1 infuso 2 infuso 3 controllo 10 7 12 8 6 8 10 6 8 11 6 11 13 9 4 9 5 5 9 9 8 9 7 8 6 7 5 12 3 6 6 5 12 5 4 4 5 8 4 4 7 8
Totale 88.00 67.00 71.00 83.00 Media 7.33 7.44 7.10 7.55 Totale generale 309 n=42 Media generale 7.36 K=4
H0: µ1= µ2= µ3= µ4 i quattro trattamenti hanno stessa media, danno la stessa risposta HA : non tutte le µk sono uguali, almeno un trattamento da una risposta media diversa
Variabile risposta = mm lunghezza crescita capelli Variabile trattamento = tipo di infuso-lozione Unità sperimentali = singoli individui trattati Alfa = 0.05 Gradi di libertà totali =n-1= 42-1= 41 Gradi di libertà tra trattamenti = k-1 = 4-1= 3 Gradi di libertà entro trattamenti = n-k = 42-4 = 38 -------------------------------------------------------------------------------- F critico per 3 gdl al numeratore / 38 gdl al denominatore = 2.85 Assunzioni:”INE” randomizzazione: ??
SOMMA QUADRATI
scarti dalla media al quadrato Totale SST = (10*10)+(6*6)+…(7*7) - (309*309)/42
SST = 273.6428571
tra trattamenti SSA= (88*88)/12+(67*67)/9+….- (309*309)/42
SSA= 1.126695527
entro trattamenti SSW= SST-SSA
SSW= 272.5161616
Tavola di analisi fonte varianza SS g.l MS R.V.
somma quadrati gradi di libertà media quadratica rapporto di varianze
Tra trattamenti 1.126695527 3 0.375565176 0.05 Entro trattamenti 272.5161616 38 7.171477937
Totale 273.6428571 41
RV- F è minore di F critico 2.85 per alfa = 0.05 ,3/38 gradi di libertà quindi non rifiutiamo H0 rifiutiamo HA Ovvero i trattamenti hanno stessa media; gli infusi-lozione e l’acqua distillata hanno tutti la stessa efficacia sulla cerescita dei capelli in mm. Analisi varianza: ad un fattore Analisi Dati Excel RIEPILOGO
Gruppi Conteggio Somma Media Varianza Colonna 1 12 88 7.333333333 9.696969697 Colonna 2 9 67 7.444444444 4.027777778 Colonna 3 10 71 7.1 6.988888889 Colonna 4 11 83 7.545454545 7.072727273 42 ANALISI VARIANZA Origine della variazione SQ gdl MQ F Valore di significatività F crit Tra gruppi 1.126696 3 0.375565176 0.052369286 0.983945612 2.8517In gruppi 272.5162 38 7.171477937 Totale 273.6429 41
Esercizio-esempio 9 Meg Gulanick ha studiato gli effetti di diversi tipi di addestramento per l’autosufficienza in pazienti che hanno subito un evento cardiaco (infarto o intervento al miocardio). L’autosufficienza viene misurata in punteggi ed i risultati sono riportati qui di seguito. Esistono differenze per l’autosufficienza raggiunta in funzione dei tipi diversi di addestramento?
TRATTAMENTO
gruppo 1 gruppo 2 gruppo 3
156 132 110 119 105 117 107 144 124 108 136 106 100 136 113 170 132 94 130 159 113 154 152 121 107 117 101 137 89 119 107 142 77 151 90 82 66
Totale 1395.00 1677.00 1351.00 Media 126.82 129.00 103.92
Totale generale 4423.00 n=37 Media generale 119.54 K=3
H0: µ1= µ2= µ3 i tre trattamenti hanno stessa media, danno la stessa risposta HA : non tutte le µk sono uguali, almeno un trattamento da una risposta media diversa
Variabile risposta = punteggio in test autosufficienza Variabile trattamento = tipo di addestramento Unità sperimentali = singoli individui addestrati Alfa = 0.05 -------------------------------------------------------------------------------- Gradi di libertà totali =n-1= 37-1= 36 Gradi di libertà tra trattamenti = k-1 = 3-1= 2 Gradi di libertà entro trattamenti = n-k = 37-3 = 34 F critico per 2gdl al numeratore / 14 gdl al denominatore = 3.27 --------------------------------------------------------------------------------
Assunzioni: “INE” Randomizzazione: ??
SOMMA QUADRATI
scarti dalla media al quadrato Totale SST = (156*156)+(119*119)+…(66*66) - (1395*1395)/37
SST = 21513.18919
tra trattamenti SSA= (88*88)/12+(67*67)/9+….- (1395*1395)/37
SSA= 4916.629749
entro trattamenti SSW= SST-SSA
SSW= 16596.55944
Tavola di analisi fonte varianza SS g.l MS R.V.
somma quadrati gradi di libertà media quadratica rapporto di varianze
Tra trattamenti 4916.629749 2 2458.314874 5.04 Entro trattamenti 16596.55944 34 488.1341012
Totale 21513.18919 41
RV- F è maggiore di F critico 3.27 per alfa = 0.05 ,2/34 gradi di libertà
quindi rifiutiamo H0
Ovvero i tre trattamenti non hanno stessa media; almeno un trattamento ha una media diversa, almeno un tipo di addestramento determina diverso punteggio di autosufficienza. Analisi varianza: ad un fattore RIEPILOGO
Gruppi Conteggio Somma Media Varianza Colonna 1 11 1395 126.8181818 588.1636364 Colonna 2 13 1677 129 579.3333333 Colonna 3 13 1351 103.9230769 313.5769231 37 ANALISI VARIANZA Origine della variazione SQ gdl MQ F Valore di significatività F crit Tra gruppi 4916.63 2 2458.314874 5.03614656 0.012142988 3.2759In gruppi 16596.56 34 488.1341012 Totale 21513.19 36
Esercizio-esempio 10
Cavalier Smith ha studiato il contenuto in DNA nucleare (genome size) in diversi organismi procarioti ed eucarioti, qui di seguito vengono riportati valori di genome size in pg di DNA (1pg= 10-12 g) per la specie Rattus norvegicus misurati in tre diverse aree geografiche lontane e separate. Vi sono differenze per gli animali delle tre aree geografiche?
TRATTAMENTO Area 1 Area 2 Area 3 2.98 3.33 2.95 3.15 2.86 3.05 3.5 3.12 3.42 2.89 3.02 2.9 3.05 2.98 2.87 3.15 3.12
Totale 19 15 18 Media 3.12 3.06 3.05 Totale generale 52.34 n=17 Media generale 3.08
H0: µ1= µ2= µ3= µ4 i tre trattamenti hanno stessa media, danno la stessa risposta HA : non tutte le µk sono uguali, almeno un trattamento da una risposta media diversa
Variabile risposta = contenuto nucleare di DNA in pg Variabile trattamento = area geografica diversa Unità sperimentali = singoli animali misurati Alfa = 0.05 -------------------------------------------------------------------------------- Gradi di libertà totali =n-1= 17-1= 16 Gradi di libertà tra trattamenti = k-1 = 3-1= 2 Gradi di libertà entro trattamenti = n-k = 17-3 = 14 -------------------------------------------------------------------------------- F critico per 2gdl al numeratore / 14 gdl al denominatore = 3.74 -------------------------------------------------------------------------------- Assunzioni: “INE” Randomizzazione: ??
SOMMA QUADRATI
scarti dalla media al quadrato Totale SST = (2.98*2.98)+(3.15*3.15)+…(3.12*3.12) - (52.34*52.34)/17
SST = 0.570776471
tra trattamenti SSA= (18.72*18.72)/6+(15.31*15.31)/5+….- (52.34*52.34)/17
SSA= 0.016013137
entro trattamenti SSW= SST-SSA
SSW= 0.554763333
Tavola di analisi
fonte varianza SS g.l MS R.V.
somma quadrati gradi di libertà media quadratica rapporto di varianze
Tra trattamenti 0.016013137 2 0.008006569 0.20 Entro trattamenti 0.554763333 14 0.039625952
Totale 0.570776471 16.00
RV- F è minore di F critico 3.73 per alfa = 0.05 ,2/14 gradi di libertà
quindi non rifiutiamo H0
rifiutiamo HA
quindi non sussistono differenze ei trattamenti, non ci sono differenze in DNA content negli animali delle tre aree diverse
Analisi varianza: ad un fattore Analisi Dati con Excel
RIEPILOGO
Gruppi Conteggio Somma Media Varianza
Colonna 1 6 18.72 3.12 0.04472
Colonna 2 5 15.31 3.062 0.03112
Colonna 3 6 18.31 3.051666667 0.041336667
ANALISI VARIANZA
Origine della variazione SQ gdl MQ F Valore di
significatività F crit
Tra gruppi 0.016013137 2 0.008006569 0.202053658 0.819392173 3.7389
In gruppi 0.554763333 14 0.039625952
Totale 0.570776471 16