Statistic A

download Statistic A

of 19

Transcript of Statistic A

Statistica La statistica una disciplina che ha come fine lo studio quantitativo e qualitativo di un particolare fenomeno in condizioni di non determinismo o incertezza ovvero di non completa conoscenza di esso o parte di esso. Studia i modi (descritti attraverso formule matematiche) in cui una realt fenomenica - limitatamente ai fenomeni collettivi - pu essere sintetizzata e quindi compresa. La statistica studia come raccogliere i dati e come analizzarli per ottenere l'informazione che permetta di rispondere alle domande che ci poniamo. Si tratta di avanzare nella conoscenza partendo dall'osservazione e dall'analisi della realt in modo intelligente e obiettivo. lessenza del metodo scientifico.

La prevalenza una misura di frequenza, una formula ad uso epidemiologico mutuata dalla statistica. La prevalenza il rapporto fra il numero di eventi sanitari rilevati in una popolazione in un definito momento (od in un breve arco temporale) e il numero degli individui della popolazione osservati nello stesso periodo. Per migliorare la leggibilit del dato si moltiplica il risultato per una costante (pari a dieci od un suo multiplo), che normalizza il risultato e consente di confrontare campioni di popolazione quantitativamente differenti.

L'incidenza una misura di frequenza, una particolare relazione matematica utilizzata in studi di epidemiologia, che misura quanti nuovi casi di una data malattia compaiono in un determinato lasso di tempo (ad esempio pu essere rapportato ad un mese od un anno, il suo fine ultimo quello di stimare la probabilit di una persona di ammalarsi della malattia in oggetto di esame.

Nella statistica il campione rappresentato dalla popolazione.I test statistici servono a comprendere le caratteristiche di una popolazione target a partire dalle osservazioni.

La randomizzazione un processo di assegnazione casuale dei soggetti inclusi in uno studio a unodei gruppi di trattamento (studio parallelo) o a una certa successione di trattamenti (studio cross-over). La randomizzazione ha lo scopo di rendere tendenzialmente simili i gruppi per le loro caratteristiche, soprattutto per i fattori prognostici e di risposta alla terapia in esame, sia quelli noti e misurabili sia quelli ignoti.La randomizzazione permette lapplicabilit dei modelli probabilistici, sui quali si regge dal punto di vista metodologico lintero studio. In questo modo le differenze eventualmente osservate tra i gruppi di pazienti possono essere attribuite al trattamento.Esistono diverse tecniche di randomizzazione, fra cui larandomizzazione a blocchi, la randomizzazione a cluster e larandomizzazione stratificata.

Randomizzazione.semplice E il metodo pi semplice per lassegnazione casuale che pu essere effettuato tramite il lancio di una moneta o di un dado; metodi che, tuttavia, presentano problemi pratici, di validazione e riproducibilit. La randomizzazione semplice viene generalmente attuata utilizzando specifici software o le tabelle dei numeri random presenti nei libri di statistica. Randomizzazione.con.restrizioni Prevede tecniche specifiche per migliorare il bilanciamento tra i due gruppi rispetto al numero di pazienti

progressivamente arruolati (randomizzazione a blocchi) e/o a specifici fattori prognostici (randomizzazione stratificata). Randomizzazione a blocchi. Viene utilizzata per bilanciare lasimmetria quantitativa dei pazienti assegnati ai due gruppi, sia nel corso che al termine dellarruolamento. Il blocco una sequenza della lista di randomizzazione che contiene lo stesso numero di pazienti da assegnare ai trattati (A) ed ai controlli (B). Ad esempio, un blocco di 4 genera sei diverse sequenze, ciascuna delle quali assegna due pazienti al gruppo A e due al B: AABB, ABAB, BBAA, BABA, ABBA, BAAB. Grazie alla progressiva assegnazione bilanciata, la randomizzazione a blocchi garantisce nei due gruppi un numero analogo di pazienti arruolati, anche se il trial viene interrotto precocemente.Alcuni dettagli metodologici: a- il numero dei blocchi deve essere un multiplo dei bracci del trial; b- sono da evitare sia blocchi troppo piccoli, molto prevedibili, sia troppo grandi (nei trial a due bracci sono ottimali blocchi da 8-10). In ogni caso i software consentono di creare liste di randomizzazione a blocchi permutati (di dimensioni variabili), al fine di ridurre ulteriormente la prevedibilit della sequenza; c- la dimensione dei blocchi non deve mai essere resa nota ai professionisti che arruolano i pazienti. Randomizzazione stratificata. Per effetto del caso, specialmente nei trial di piccole dimensioni, i due gruppi possono essere sbilanciati per uno o pi fattori prognostici. La randomizzazione stratificata migliora il bilanciamento di specifici fattori prognostici: ad esempio, al fine di garantire che i fumatori siano equamente distribuiti tra i due gruppi vengono creati due strati (fumatori, non fumatori) e per ogni strato viene generata una lista separata.La randomizzazione stratificata trova poche applicazioni pratiche per varie ragioni: a- il numero elevato di fattori prognostici determina la paradossale necessit di creare troppe liste di randomizzazione (2 fattori prognostici= 4 strati, 3= 8 strati, 4= 16 strati); b- la probabilit di sbilanciamento dei fattori prognostici diminuisce allaumentare dei pazienti arruolati; c- eventuali sbilanciamenti dei fattori prognostici possono essere aggiustati in fase di analisi statistica. La randomizzazione stratificata indispensabile nei trial multicentrici, in particolare se sperimentano strategie interventistiche: ad esempio, in un trial di confronto tra endoarteriectomia e posizionamento di stent in pazienti con stenosi carotidea, ciascun centro (strato) deve arruolare un numero equivalente di pazienti da sottoporre a ciascun intervento.

Tabella di cntingenzaLe tabelle di contingenza sono un particolare tipo di tabelle a doppia entrata (cio tabelle con etichette di riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o pi variabili. In esse si riportano le frequenze congiunte delle variabili. Il caso pi semplice quello delle tabelle tetracoriche, in cui ciascuna delle due variabili assume solo due possibili valori, ad esempio: Colore degli occhi\Colore dei Capelli

Biondi NonBiondi Totale21 9 30 19 51 70 40 60 100

Chiari NonChiari Totale

Dove, tra le 100 persone esaminate, 30 presentano capelli biondi, 40 occhi chiari e soltanto 21 hanno capelli biondi e occhi chiari. Da questi dati possibile ricavare i dati restanti della tabella. Utilizzando le tabelle di contingenza e operando specifici calcoli su di esse, si pu arrivare a determinare la dipendenza o indipendenza tra le due variabili considerate, in base al valore assunto dallindice di contingenza quadratico X2 . Le due variabili considerate sono di tipo quantitativo discreto o qualitativo. Indicando tali variabili con X e Y e rispettivamente con xi (i = 1,2,,h) e yj (j=1,2,,k) le modalit rilevate per le due variabili, ad ogni coppia (xi,yj ) si fa corrispondere nella tabella la sua frequenza associata ni,j , cio il numero di elementi, tra gli n della popolazione, che possiedono contemporaneamente la modalit di xi di X e yj di Y. X\Y

x1

y1 n1,1

y2 n1,2

... yj ... n1,j

... ...

yk n1,k

Totale n1,.

x2 ... xi ... xh Totaledove

n2,1 ... ni,1 ... nh,1 n.,1

n2,2 ... ni,2 ... nh,2 n.,2

... n2,j ... ... ... ni,j ... ... ... nh,j ... n.,j

... ... ... ... ... ...

n2,k ... ni,k ... nh,k n.,k

n2,. ... ni,. ... nh,. n

(i = 1,2,,h) rappresenta le frequenze marginali assolute di X

(j = 1,2,,k) rappresenta le frequenze marginali assolute di Y

Ovviamente, sommando tutte le frequenze assolute presenti nella tabella, troveremo la numerosit n della popolazione:

Dalle frequenze assolute ni,j si ottengono le frequenze relative fi,j calcolando:

X\Y

x1 x2 ... xi ... xh Totale

y1 f1,1 f2,1 ... fi,1 ... fh,1 f.,1

y2 f1,2 f2,2 ... fi,2 ... fh,2 f.,2

... ... ... ... ... ... ... ...

yj f1,j f2,j ... fi,j ... fh,j f.,j

... ... ... ... ... ... ... ...

yk f1,k f2,k ... fi,k ... fh,k f.,k

Totale f1,. f2,. ... fi,. ... fh,. 1

In epidemiologia, l'odds ratio (OR) uno degli indici utilizzati per definire il rapporto di causa-effetto tra due fattori, per esempio tra un fattore di rischio e una malattia. Il calcolo dell'odds ratio prevede il confronto tra le frequenze di comparsa dell'evento (ad esempio, malattia) rispettivamente nei soggetti esposti e in quelli non esposti al fattore di rischio in studio. Esso utilizzato negli studi retrospettivi (caso-controllo), dove non necessaria la raccolta dei dati nel tempo, infatti esso non calcola un andamento ed , anzi, indipendente dal fattore durata. Negli studi prospettici si utilizza invece, allo stesso scopo, il calcolo del rischio relativo. L'odds ratio definito come l'odds della malattia tra soggetti esposti, diviso l'odds della malattia tra soggetti non

esposti.

.

Se il valore dell'OR uguale a 1, significa che l'odds di eposizione nei sani uguale all'odds di esposizione nei malati, cio il fattore di rischio ininfluente sulla comparsa della malattia. Se il valore dell'OR maggiore di 1, il fattore di rischio o pu essere implicato nella comparsa della malattia; se il valore dell'OR minore di 1 il fattore di rischio in realt una difesa contro la malattia.

Il rischio relativo (risk rate, RR) la probabilit che un soggetto, appartenente ad un gruppo esposto a determinati fattori, sviluppi la malattia, rispetto alla probabilit che un soggetto appartenente ad un gruppo non esposto sviluppi la stessa malattia. Questo indice utilizzato negli studi di coorte dove l'esposizione misurata nel tempo:

RR = I(esposti) / I(nonesposti)dove I = incidenza, che si definisce come I

= n.nuoviammalati / (n.personetot n.ammalati)

Se l'RR risulta uguale a 1 il fattore di rischio ininfluente sulla comparsa della malattia; se l'RR maggiore di 1 il fattore di rischio implicato nel manifestarsi della malattia; se l'RR minore di 1 il fattore di rischio difende dalla malattia (fattore di difesa). Esempi di applicazione di tale formula sono gli studi riguardanti la correlazione tra il fumo e lo sviluppo di cancro al polmone, nei quali sono stati riscontrati RR > 17.

Esempio

Stress correlato al rumore

variabile indipendente (esposizione) luogo rumoroso luogo non rumoroso

variabile dipendente (malattia) stress stress si no A 60 B 40

100 tot esposti tot non C 20 D 80 100 esposti tot malati e 80 120 200 non tot tot non tot malati e malati malati non

ODDS RATIO=odds di esposizione nei casi/odds di non esposizione nei casi ODDS RATIO=A/C / B/D=A/B X B/C=AXD/BXC ODDS di esposizione nei casi=60/20=3 ODDS di non esposizione nei casi=40/80=0,5 ODDS RATIO=3/0,5=6

RISCHIO RELATIVO=incidenza esposti/incidenza non esposti RR=A/ (A+B) / C/(C+D) Incidenza negli esposti=60/(60+40)=0,6 Incidenza nei non esposti=20/(20+80)=0,2 RR=0,6/0,2=3

Il valore OR e RR se sonop =1 c assenza di associazione tra malattia e fattore,se