Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in...

35
Metodologia della Ricerca Infermieristica C.L. in Infermieristica 3° A.A. Dott.ssa Marzia Lommi E-mail: [email protected] Cell. 339-3235608 La Ricerca Infermieristica Argomento: Analisi dei dati

Transcript of Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in...

Page 1: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

Metodologia della Ricerca Infermieristica

C.L. in Infermieristica 3° A.A.

Dott.ssa Marzia LommiE-mail: [email protected]

Cell. 339-3235608

La Ricerca Infermieristica

Argomento: Analisi dei dati

Page 2: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

Libro di riferimento

Fain, J. A. (2004). La ricerca infermieristica: leggerla, comprenderla e

applicarla. E. Vellone (Ed.). McGraw-Hill.

Materiale in aggiunta per la presente lezione

Non necessario.

Slide fornite dal docente.

Modalità lezione

Streaming

Note e specifiche della presente lezione

Durata lezione

45 minuti circa

Page 3: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

Your test is published and

available at:

testmoz.com/2882224

Passcode: metodologia

Page 4: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

Fase 4: Analisi dei dati

Sessione 1

• Analisi dei dati

• Interpretazione dei risultati

Page 5: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

• Una volta che i dati sono stati raccolti, è necessario analizzarli

da un punto di vista statistico perché solo in questo modo è

possibile dare una risposta alle domande di ricerca o testare le

ipotesi

• L’analisi statistica non è un'attività a sé stante nella ricerca,

ma è strettamente condizionata dal disegno di ricerca e dal

tipo di dati raccolti

• Esistono molte procedure statistiche ma in questa lezione

viene fornita una panoramica di quelle più comunemente

utilizzate per descrivere le variabili, esaminare le relazioni e

valutarne le differenze

• L'utilizzatore della ricerca infermieristica ha bisogno di saper

interpretare i dati statistici che trova nei rapporti di ricerca

Page 6: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

STATISTICA DESCRITTIVA

Le procedure statistiche sono classificate in due categorie:

• Descrittive che descrivono, organizzano e riassumono i dati

• Inferenziali che producono generalizzazioni sulla popolazione

sulla base dei dati raccolti dai campioni

La S. Descrittiva comprende:

- Misure di tendenza centrale che descrivono la posizione o il

centro approssimativo di una distribuzione di dati (media,

moda e mediana)

- Misure di dispersione che sono dati che mostrano la

variabilità in un insieme di dati numerici (range, varianza e

deviazione standard)

Page 7: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

STATISTICA DESCRITTIVA

MISURE DI TENDENZA CENTRALE

MEDIA

• La media è la misura di tendenza centrale più comune che viene

calcolata sommando tutti i valori di una distribuzione e dividendo il

totale per il numero dei valori stessi.

• Una delle caratteristiche principali della media è che il calcolo tiene

in considerazione ogni punteggio o valore presente nella

distribuzione.

• La media è la misura di tendenza centrale preferita quando i dati

sono raccolti su una scala intervallare o di rapporto.

• È una misura stabile e affidabile e, se da una popolazione sono

estratti campioni in modo random e di uguali dimensioni, il suo

valore è simile alla mediana e alla moda.

• La media è molto sensibile a valori estremi, detti anche valori

erratici, che sono molto diversi dagli altri presenti nel campione. In

una distribuzione di punteggi con la presenza di valori erratici, la

media è tirata verso questi valori.

Page 8: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

23, 22, 25, 26, 29, 27, 23 = 175/7 = 25

N (7), M età: 25

Supponiamo che il 29 diventi 50

23, 22, 25, 26, 50, 27, 23 = 196/7= 28

il valore 50 è un valore erratico e sposta la M a 28

STATISTICA DESCRITTIVA

Page 9: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

STATISTICA DESCRITTIVA

MISURE DI TENDENZA CENTRALE

MEDIANA

La mediana è il valore intermedio di una distribuzione. A volte è

chiamata «il 50° percentile», poiché il 50% della distribuzione si trova

al di sotto e al di sopra di questo valore.

La mediana è calcolata prima di tutto ponendo i valori in ordine

crescente o decrescente. Se il numero di valori è dispari, la mediana è

il valore che si trova a metà della distribuzione; se il numero di valori è

pari la mediana è la media dei due valori che si trovano a metà della

distribuzione. Quindi la mediana non è necessariamente uno dei valori

della distribuzione

Scala del dolore N 5 = 4, 5, 7, 8, 9 → Mdn 7

Scala del dolore N 6 = 4, 5, 5, 7, 7, 9 → Mdn (5+7/2) è 6

Una delle caratteristiche principali della mediana è che essa non tiene

in considerazione ogni punteggio della distribuzione quindi non è

sensibile ai valori estremi (outlier).

Scala coping N 5 = 12,15, 22, 31, 35 → Mdn 22, M 23

Scala coping N 5 = 12,15, 22, 31, 125 → Mdn 22, M 41

Page 10: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

STATISTICA DESCRITTIVA

MISURE DI TENDENZA CENTRALE

MEDIANA

• La mediana è una misura di tendenza centrale utilizzata

appropriatamente quando i dati hanno una distribuzione

asimmetrica (più orientati verso uno dei due estremi della

distribuzione); in questi casi la media, la mediana e la moda hanno

valori più o meno diversi. In una distribuzione simmetrica, invece,

poiché i valori estremi sono bilanciati, la media, la mediana e la

moda hanno valore simile.

• Una distribuzione asimmetrica ha il picco decentrato e una coda

(detta curva di Gauss) più lunga in una direzione. In questa

distribuzione la media, la mediana e la moda non coincidono. La

moda è la più vicina al picco della curva poiché in questa zona si

trovano i punteggi più frequenti; la media è la più vicina alla coda

dove i valori estremi l'hanno trascinata; la mediana si trova tra la

moda e la media.

• Nelle distribuzioni asimmetriche possiamo avere:

- la distribuzione asimmetrica positiva (asimmetria a destra) in cui la

media è spostata verso i valori più alti

- la distribuzione asimmetrica negativa (asimmetria a sinistra) in cui

la media è spostata verso i valori più bassi.

Page 11: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

STATISTICA DESCRITTIVA

Page 12: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

STATISTICA DESCRITTIVA

MISURE DI TENDENZA CENTRALE

MODA

• La moda è il punteggio o valore che si verifica più frequentemente

in una distribuzione; è una misura appropriata di tendenza centrale

per dati nominali.

CONFRONTO TRA M, Mdn E MODA

I ricercatori scelgono le misure di tendenza centrale a seconda del livello di

misurazione, della forma della distribuzione dei dati e degli obiettivi della

ricerca.

LIVELLO DI MISURAZIONE

• L’utilizzo della M è appropriato con dati intervallari o di rapporto e qualche

volta con dati ordinali. La media è una misura più precisa rispetto alla

mediana e alla moda, poiché prende in considerazione tutti i valori di una

distribuzione ed è anche la più stabile tra le tre misure. Se dalla popolazione

target vengono estratti in modo casuale più campioni, le loro medie

varieranno di poco rispetto alla mediana e alla moda.

• Non ha senso calcolare una mediana per dati nominali ( es. stato civile).

• Poiché la moda richiede solo il conteggio con le frequenza, può essere

applicata a qualsiasi insieme di dati nominali, ordinali, intervallari o di

rapporto.

Page 13: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

STATISTICA DESCRITTIVA

CONFRONTO TRA M, Mdn E MODA

FORMA DELLA DISTRIBUZIONE

• La forma della distribuzione è un altro fattore che influenza la scelta del

ricercatore sulla misura di tendenza centrale.

• Nelle distribuzioni asimmetriche la media, la mediana e la moda non

coincidono, nonostante la loro posizione relativa rimanga costante quando ci

si sposta dal punto più alto della curva verso la coda.

• L’ordine va sempre dalla moda, alla mediana, alla media. In una distribuzione

asimmetrica la mediana si trova sempre tra la media e la moda. È questa

caratteristica che fa della mediana la più appropriata misura di tendenza

centrale per la descrizione di una distribuzione asimmetrica.

OBIETTIVO DELLA RICERCA

• Il ricercatore utilizza la moda come indicatore preliminare di tendenza

centrale. Qualora venisse cercata una misura più precisa si utilizza la

mediana e la media.

• Per descrivere una distribuzione asimmetrica, il ricercatore sceglie la

mediana in modo da bilanciare i valori estremi (erratici). Inoltre la mediana è

talvolta utilizzata come punto della distribuzione in cui i valori possono

essere divisi in 2 categorie contenenti lo stesso numero di soggetti.

• La media è preferita rispetto alla mediana poiché è facilmente utilizzata in

molte analisi di statistica avanzata.

Page 14: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

STATISTICA DESCRITTIVAMISURE DI DISPERSIONE

RANGE

Il range detto anche campo di variazione, è la più semplice misura di

dispersione e viene calcolato sottraendo nella distribuzione il valore più

basso dal valore più alto.

Il ricercatore riporta i range potenziali e reali per ogni variabile

dipendente.

Il range è considerato una misura instabile perché si basa esclusivamente su

due valori nella distribuzione, è estremamente sensibile ai valori erratici e

non tiene in considerazione della variazioni di valori tra gli estremi.

VARIANZA O DEVIAZIONE STANDARD

Entrambe sono basate sugli scarti che sono la differenza tra un qualsiasi

valore grezzo e la media della distribuzione. I valori grezzi sotto la media

hanno una deviazione negativa mentre quelli sopra la media una deviazione

positiva. La somma degli scarti in una distribuzione è sempre uguale a «0»,

per cui se il ricercatore utilizza gli scarti per calcolare le misure di

variabilità deve prenderli nel loro valore assoluto (senza segno positivo o

negativo). Se uno scarto viene elevato al quadrato diventa positivo.

La somma degli scarti al quadrato divisa per il numero dei valori si chiama

varianza.

Page 15: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

MISURE DI DISPERSIONE

CONFRONTO TRA RANGE, VARIANZA E DEVIAZIONE STANDARD

• Nonostante il range sia veloce e semplice da ottenere, non è

molto affidabile poiché prende in considerazione solo due

valori della distribuzione.

• La varianza e la deviazione standard invece vengono calcolate

con tutti i valori.

• Nonostante la relativa stabilità, la varianza non è molto

utilizzata perché non può essere impiegata in molte analisi

statistiche.

• Contrariamente la SD riflette in modo più reale la variabilità

dei dati. Il calcolo della SD costituisce la fase iniziale per

ottenere altre misure statistiche specialmente quelle che

riguardano la scelta dei test per l’analisi dei risultati.

STATISTICA DESCRITTIVA

Page 16: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

STATISTICA

DESCRITTIVA INFERENZIALE

STIMA

PUNTUALE INTERVALLARE

CONVALIDA IPOTESI

PROCEDURE

PARAMETRICHE

PROCEDURE NON

PARAMETRICHE

Page 17: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

STATISTICA INFERENZIALE

È quella branca della statistica che si occupa di fare generalizzazioni

sulla popolazione sulla base dei dati provenienti da un campione. Questi

dati sono utilizzati per eseguire inferenze su un parametro che è una

caratteristica numerica della popolazione (es. media della popolazione,

deviazione standard della popolazione). I ricercatori poiché non possono

accedere ai dati di tutta la popolazione, possono solo stimarne i

parametri e questo viene fatto con i dati ottenuti dal campione.

Es. Io seleziono in modo random dalla popolazione un campione di 125

persone con diabete di tipo 1 e voglio misurare i cambiamenti del livello

di glicemia.

Io so che la glicemia media è 70 mg/dl come riferimento standard nella

popolazione e quindi questa è la media del mio campione.

Non ho la possibilità di studiare tutti gli individui con diabete di tipo 1 di

tutta la popolazione ma la S. inferenziale mi permette di fare inferenze

su una popolazione più ampia (tutti gli individui con diabete di tipo 1)

dallo studio del mio campione (i 125 soggetti con diabete di tipo 1

estratti a random dalla popolazione).

Page 18: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

Le procedure di S. inferenziale sono di due tipi:

1. Procedura che va a stimare il parametro della popolazione in

modo puntuale (ossia preciso) o in modo intervallare (ossia

entro i limiti di un range).

Es. Voglio calcolare l’età media di un campione di donne che

guidano e stimarlo puntualmente in base all’età media nella

popolazione (parametro) delle donne che guidano.

Oppure il parametro della popolazione (l’età media delle donne

che guidano) è stimato in un intervallo di valori con un’età

compresa tra 16 e 22 anni e voglio usarlo come stima nel mio

campione. Questa è una stima intervallare associata ad un

intervallo di confidenza (grado di confidenza).

L’intervallo di confidenza è un range di valori che ha alcune

probabilità specifiche (per esempio 0,95 o 0,99 ossia 95% o 99% di

probabilità) di includere un particolare parametro della

popolazione.

STATISTICA INFERENZIALE

Page 19: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

2. Procedura di convalida delle ipotesi che permette

di formulare un’ipotesi riguardo ad un parametro,

ricavare un campione della popolazione di interesse

e prendere delle decisioni obiettive sui risultati del

campione. Nel processo di convalida delle ipotesi è

centrale il concetto di probabilità. La probablità

aiuta a valutare l’accuratezza di un test statistico

(ossia quante probabilità si hanno che quanto

affermato dal test statistico abbia un riscontro

reale nella popolazione) e a validare un’ipotesi. I

risultati della ricerca sono spesso comunicati

utilizzando questo concetto. Le procedure di

convalida delle ipotesi sono sia quelle parametriche

sia quelle non parametriche.

STATISTICA INFERENZIALE

Page 20: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

STATISTICA INFERENZIALEPROBABILITÀ

• È un concetto essenziale per comprendere la statistica inferenziale. È

un mezzo di predizione (c’è una probabilità del 50% che piova per il

resto della settimana).

• La probabilità è un sistema di regole per analizzare un insieme di

risultati. È la possibilità che un evento si verifichi. La probabilità è

espressa con la lettera «p».

• Per stabilire se un risultato è statisticamente significativo il

ricercatore deve fissare un livello di confidenza. Si tratta di un livello

di probabilità con cui l’ipotesi nulla può essere rifiutata con fiducia e

può essere accettata con altrettanta fiducia l’ipotesi di ricerca.

• I ricercatori utilizzano il livello minimo di confidenza standard di

0,05. Questo livello significa che esiste una differenza significativa

tra variabili quado ci sono al massimo 5 possibilità su 100 che quello

che sostengono sia errato.

• Il valore della «p» non indica le dimensioni delle validità associate

con ogni ipotesi di ricerca. Una volta che è stato fissato il livello di

significatività questo rappresenta una regola di decisione. Le regole

di decisione sono dicotomiche: sì o no, significativo o non

significativo. Una volta che la decisione è stata presa, il valore della

«p» riflette solo la confidenza che può essere posta in quella

decisone.

Page 21: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

2,5% 2,5%

z = - 1,96 0 z = + 1,96

95%

Confidenza: 0,05

Il 95% delle differenze del campione cadono tra una SD -1,96

e +1,96

Page 22: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

2,5% 2,5%

z = - 2,58 0 z = + 2,58

99%

Confidenza: 0,01

1 possibilità su 100 che le differenze riscontrate nel campione siano

dovute al caso (1%)

Page 23: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

TEST PARAMETRICI E NON PARAMETRICI

Esistono diversi test statistici utilizzabili per l’analisi dei dati

raccolti su un campione e sono test parametrici o non

parametrici.

Le procedure parametriche richiedono il rispetto di alcune

condizioni affinché i risultati statistici possano essere validi:

- la variabile dipendente è misurata su una scala intervallare o

di rapporto

- distribuzione normale dei valori nella popolazione

- gruppi indipendenti (ad es campionamento randomizzato)

I test non parametrici non pongono condizioni sulla forma della

distribuzione dei valori e infatti sono anche chiamati test di

distribution-free. Sono di solito usati quando i dati sono stati

raccolti con scale ordinali o nominali e richiedono meno e più

semplici calcoli. La ragione principale per cui i non parametrici

sono meno utilizzati è perchè sono meno potenti rispetto ai test

parametrici.

Page 24: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI

CORRELAZIONI

La correlazione è una misura che definisce una relazione tra due

variabili (es. relazione fra fumo e capacità polmonare).

Per determinare la natura e la dimensione della relazione si usa un

coefficiente di relazione (r) che va da +1,0 a – 1,0. il segno + o – che

precede il coefficiente indica se la correlazione è positiva o negativa.

Nella correlazione positiva alti valori o punteggi di una variabile sono

associati ad alti valori o punteggi dell’altra variabile; oppure bassi valori

o punteggi in una sono associati a bassi valori o punteggi in un’altra.

Nella correlazione negativa bassi valori o punteggi in una variabile sono

correlati ad alti valori o punteggi dell’altra e viceversa.

Per valutare la forza o la dimensione di una correlazione si considera il

coefficiente senza segno (es. 0,63) e il valore di p (inferiore a 0,05).

Più il valore del coeffinciente è vicino a 1 più alta e forte è la

correlazione.

• 0,90-1,00 molto alta

• 0,89-0,70 alta

• 0,69-0,50 moderata

• 0,49-0.26 bassa

• 0,25-0,00 piccola o nessuna

Page 25: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI

CORRELAZIONE DI PEARSON

La correlazione di Pearson detta anche «r di Pearson» è una tecnica di

correlazione comune che si utilizza per esaminare le relazioni tra due

variabili. È una procedura parametrica che utilizza dati intervallari o di

rapporto.

Si possono presentare le correlazioni in tabella, chiamata matrice di

correlazione, o nel testo.

Correlazione tra fattori predisponenti e comportamenti di sesso sicuro

1 2 3 4 5 6

1 Autostima 1,00

2 LOC interno 0,21* 1,00

3 LOC in cambiamento -0,14* 0,21* 1,00

4 Suscettibilità percepita -0,17** -0,08 0,04 1,00

5 Atteggiamenti verso il condom 0,08 0,02 0,15** 0,05 1,00

6 Atteggiamenti di sesso sicuro -0,08 0,16** 0,01 -0,05 0,38* 1,00

*p < 0,01; **p < 0.05

Page 26: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

CORRELAZIONE DI PEARSON PRESENTATE SENZA TABELLA

UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI

Le correlazioni di Pearson sono state utilizzate per esaminare le

relazioni tra le variabili dello studio, gli anni di assistenza forniti dalla

famiglia a un genitore anziano e lo status socio-economico della

famiglia. Gli anni di assistenza erano negativamente e

significativamente correlati con il benessere della famiglia, r = -0,23,

p<0,05 ma con nessuna delle variabili indipendenti. Lo status socio-

economico era significativamente correlato con le risorse interne

della famiglia, r = 0,25, p<0,05 e il benessere della famiglia, r = 0,40,

p< 0,01.

LETTURA CRITICA

• Gli anni di assistenza con il benessere della famiglia = r 0,23 e p<0,05

Più era il tempo da quando veniva fornita assistenza a un genitore anziano

meno era il benessere della famiglia

• Lo status socio-economico con le risorse interne della famiglia = r

0,25, p<0,05 e con il benessere della famiglia = r 0,40, p< 0,01

Più alto era il livello socio economico più era forte il senso di forza

interna e di capacità a lavorare insieme nella risoluzione dei problemi e

più alto il benessere della famiglia.

Page 27: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI

T-TEST

È una procedura statistica inferenziale utilizzata per determinare se le

medie di due gruppi sono significativamente differenti.

GRUPPO 1

Impianto arteria mammaria interna

GRUPPO 2

Impianto della vena safena

4

3

5

6

8

-------

Score dolore 26

M 5,2

6

5

8

7

10

-------

Score dolore 36

M 7,2

Voglio conoscere se i pazienti sottoposti a bypass aorto-coronarico con

impianto dell’arteria mammaria interna, hanno più dolore toracico

postoperatorio rispetto ai pazienti in cui è stata impiantata la vena

safena. La variabile «dolore toracico» è misurata su una scala di rapporto

che utilizza una scala visiva analogica (VAS).

Page 28: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI

T-TEST

GRUPPO 1

Impianto arteria mammaria interna

GRUPPO 2

Impianto della vena safena

4

3

5

6

8

-------

Score dolore 26

M 5,2

6

5

8

7

10

-------

Score dolore 36

M 7,2

Osservando le medie si può constatare che il gruppo con l’impianto della

v. safena aveva un dolore più intenso nel post-operatorio rispetto

all’altro gruppo.

Il quesito statistico diventa…

La differenza fra le due medie dei campioni è abbastanza ampia da

permettere di concludere che anche le medie della popolazione

differiscono l’una dall’altra?

Page 29: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONIT-TEST

Il t-test può rispondere al quesito purché si rispettino le condizioni dei

test parametrici (v. dipendente su scala intervallare o di rapporto,

distribuzione normale dei valori, gruppi indipendenti) ed un ulteriore

condizione ossia che le variabili dipendenti in entrambi i gruppi devono

avere una varianza simile (omogeneità della varianza)

FORME DEL T-TEST

Esistono due tipi di T-Test:

• per gruppi indipendenti, quando i valori o punteggi in un gruppo non

hanno alcuna relazione logica con i valori o punteggi di un altro

gruppo. Se i gruppi hanno delle varianze significativamente differenti

(violata la condizione di omogeneità della varianza), si utilizza una

procedura più prudente, calcolando t-test separati.

• per gruppi dipendenti, detto anche per gruppi correlati o appaiati è

utilizzato per le situazioni in cui i punteggi in un primo gruppo hanno

una qualche associazione con i punteggi del secondo gruppo (es.

quando faccio un pre e post-test in cui misuro un singolo gruppo due

volte).

Il lettore critico non deve per forza sapere come calcolare le varie forme di T-Test o

come utilizzare le tabelle per determinare se esiste una differenza significativa.

Piuttosto deve andare a valutare i valori di p, se il livello di probabilità è inferiore a

0,05 esiste una differenza significativa tra le due medie.

Page 30: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI

ANALISI DELLA VARIANZA

• L’analisi della varianza (ANOVA) serve per determinare se esiste una

differenza significativa tra 3 o più medie. In sostanza sostituisce il T-

Test se sono presenti più di due gruppi in cui confrontare le M.

• Un’ANOVA semplice o a una via si riferisce a una variabile

indipendente con diversi livelli.

• L’ANOVA a più vie rappresenta due variabili indipendenti con diversi

livelli.

• La variabile dipendente deve essere misurata su scala nominale.

• Nell’ANOVA viene determinato se la varianza tra gruppi è maggiore

rispetto alla varianza all’interno dei gruppi. Se la varianza tra gruppi è

maggiore di quella all’interno dei gruppi, le medie dei gruppi sono

significativamente differenti. Se la varianza tra i gruppi è uguale o

inferiore a quella all’interno dei gruppi allora le medie dei gruppi non

sono significativamente differenti.

• La funzione F indica la dimensione delle differenze all’interno di ogni

gruppo. Più grande è la F (più grande la varianza tra gruppi) maggiore

è la probabilità di trovare una differenza statisticamente significativa

tra le medie dei gruppi.

Page 31: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI

ANALISI DELLA VARIANZA

Fonte di variazione SQ GL MQ F

Tra gruppi 55,6 2 27,8 23,16*

All’interno dei gruppi 14,4 12 1,2

Totale 70,0 14

Note: *p<0,05; SQ somma dei quadrati; GL gradi di libertà; MQ medie

quadratiche; F funzione F

Il valore che il lettore deve osservare è la F; se si trova una differenza

significativa tra le medie dei campioni, un asterisco vicino al valore F

indica la significatività. Nell’esempio esiste una reale differenza tra le

medie dei campioni studiati.

Page 32: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI

CHI QUADRO (NON PARAMETRICO)

• È il test che confronta le frequenze osservate (numero reale in ogni

categoria), con le frequenze teoriche (basate sulla teoria o

esperienze passate).

• Il chi quadro è un test statistico appropriato quando le variabili sono

misurate su una scala nominale in cui il ricercatore va a misurare il

numero di eventi verificatisi in ogni categoria.

• Le condizioni per usare il chi quadro sono: a) dati sintetizzati in

frequenze, b) le categorie devono escludersi a vicenda, c) deve

esistere una base teorica per categorizzare le variabili.

• Il chi quadro utilizza dati su scale nominale (categorici) e mette a

confronto frequenze e non medie.

• Viene utilizzato quando i dati raccolti nello studio non hanno una

distribuzione normale e violano le condizioni per l’utilizzo dei test

parametrici.

Page 33: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

UTILIZZO DELLA STATISTICA PER ESAMINARE RELAZIONI

CHI QUADRO (NON PARAMETRICO)

Esistono due tipi di test chi quadro:

1. per un campione si utilizza ad esempio se voglio confrontare il

numero di parte cesarei in un ospedale X (frequenze reali) con il

numero di parti cesarei riferiti a tutti gli ospedali (frequenze

teoriche).

2. per campioni indipendenti per determinare se due variabili

categoriche sono indipendenti l’una dall’altra (esempio glicemia a

digiuno in gruppo sperimentale che segue un programma di

educazione alimentare e gruppo di controllo che non segue il corso.

La glicemia viene misurata in genere su una scala intervallare o di

rapporto ma per applicare il chi quadro la portiamo su una scala

ordinale o nominale, creando 2 categorie con valori o superiori o

inferiori a 120mg/dl)

Page 34: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

CRITICA STATISTICA DESCRITTIVA E INFERENZIALE

• La statistica descrittiva utilizzata è stata appropriata?

La statistica descrittiva deve riportare misure di tendenza centrale e di

dispersione. Essa sintetizza dati numerici importanti e non fa inferenza

sui dati

• La statistica descrittiva riportata è appropriata per il livello di

misurazione di ogni variabile?

I dati nominali e ordinali possono essere descritti come frequenze, i dati

intervallari e di rapporto possono essere sommati o sottratti. I test di

inferenza statistica che richiedono calcoli matematici possono essere

applicati solo a variabili su scala intervallare e di rapporto. Quasi

sempre le scale psicologiche vengono considerate su scala intervallare.

• La statistica utilizzata è appropriata per rispondere alle domande

di ricerca o testare delle ipotesi?

La statistica nella ricerca serve a tre obiettivi principali: descrivere i

dati, esaminare relazioni tra variabili e verificare l’esistenza di

differenze tra gruppi. Non bisogna rimanere bloccati di fronte ai vari

test statistici riportati in uno studio di ricerca. Se una tecnica non è

familiare, è necessario andare a rivederla. Se vengono riportate delle

tabelle bisogna osservare i dati che vi sono elencati e identificare se

l’autore ha descritto i risultati nel testo.

Page 35: Argomento: Analisi dei dati - Formazione Infermiere...Le procedure statistiche sono classificate in due categorie: • Descrittive che descrivono, organizzano e riassumono i dati •

CRITICA STATISTICA DESCRITTIVA E INFERENZIALE

• La numerosità del campione è adeguata?

Per conoscere la dimensione del campione necessaria all’esecuzione di

un’accurata analisi statistica, può essere utile l’analisi della potenza.

Bisogna controllare se è stata eseguita questa procedura.

• Se sono utilizzate tabelle, i risultati sono chiari e completi?

Bisogna osservare le tabelle nel loro insieme prima di focalizzarsi su

informazioni specifiche. Tutte le tabelle devono essere adeguatamente

introdotte nel rapporto di ricerca, con le indicazioni dell’autore per

fare attenzione ai dati specifici. Il titolo della tabella ne descrive con

chiarezza il contenuto? I dati numerici della tabella sono stati sottoposti

a test di significatività? Qualora questo fosse avvenuto, i test sono

riportati in modo appropriato per poter meglio interpretare i risultati?