STATISTICA a.a. 2003-2004

20
STATISTICA a.a. 2003-2004 – VARIABILITA’ BIOLOGICA E CASO – POPOLAZIONE E CAMPIONE – CAMPIONAMENTO CASUALE, SISTEMATICO , RANDOMIZZATO, PER STRATIFICAZIONE – TIPI DI DATI E SCALE DI MISURA

description

STATISTICA a.a. 2003-2004. VARIABILITA’ BIOLOGICA E CASO POPOLAZIONE E CAMPIONE CAMPIONAMENTO CASUALE, SISTEMATICO , RANDOMIZZATO, PER STRATIFICAZIONE TIPI DI DATI E SCALE DI MISURA. VARIABILITA’ BIOLOGICA E CASO. VARIABILITA’ BIOLOGICA : - PowerPoint PPT Presentation

Transcript of STATISTICA a.a. 2003-2004

Page 1: STATISTICA a.a. 2003-2004

STATISTICAa.a. 2003-2004

– VARIABILITA’ BIOLOGICA E CASO

– POPOLAZIONE E CAMPIONE

– CAMPIONAMENTO CASUALE, SISTEMATICO , RANDOMIZZATO, PER STRATIFICAZIONE

– TIPI DI DATI E SCALE DI MISURA

Page 2: STATISTICA a.a. 2003-2004

VARIABILITA’ BIOLOGICA E CASO

– VARIABILITA’ BIOLOGICA :– insieme di differenze fisiche e funzionali fra

individui dello stesso tipo– misure differenti in differenti individui o

nello stesso individuo in momenti diversi (es. l’altezza di un gruppo di bambini o di un bambino nel tempo)

Page 3: STATISTICA a.a. 2003-2004

VARIABILITA’ BIOLOGICA E CASO

- VARIABILITA’ SISTEMATICA :

insieme di differenze dovute a fattori che agiscono sulla grandezza in esame e dei quali è possibile accertare l’effetto

- Es. gruppo di bambini : i più grandicelli sono più alti – l’età ha effetto sull’altezza

Page 4: STATISTICA a.a. 2003-2004

VARIABILITA’ BIOLOGICA E CASO

– VARIABILITA’ CASUALE : insieme di differenze dovute a fattori incontrollabili che agiscono su un evento

– Es. ci sono bambini giovani più alti di bambini più vecchi – i fattori incontrollabili sono di origine familiare, alimentare, etnica, ecc.

– Quanti più fattori incontrollabili agiscono su un evento, tanto più omogenea sarà l’azione del caso sugli eventi.

Page 5: STATISTICA a.a. 2003-2004

POPOLAZIONE E CAMPIONE

– POPOLAZIONE:Insieme di enti che condividono una o più

caratteristiche comuni

-Una popolazione statistica può essere un insieme di persone o animali, o un insieme di misure o di osservazioni.

– Popolazioni ipotetiche: es. tutte le possibili estrazioni di due carte da un mazzo

Page 6: STATISTICA a.a. 2003-2004

POPOLAZIONE E CAMPIONE

– Popolazioni fisiche: bambini di V C di una certa scuola

– Popolazioni finite : l’insieme dei cartelli stradali

– Popolazioni infinite: tutti i multipli di 13

Page 7: STATISTICA a.a. 2003-2004

POPOLAZIONE E CAMPIONE

– Scopo della statistica è descrivere nel modo migliore possibile la popolazione.

– Se la popolazione è nota a priori : ricerca di grandezze significative che ne sintetizzino le caratteristiche (es. media, varianza, ecc.)

– Se la popolazione non è nota a priori occorre estrarne un campione.

Page 8: STATISTICA a.a. 2003-2004

POPOLAZIONE E CAMPIONE

– CAMPIONE: piccola frazione di una popolazione le cui caratteristiche si avvicinano a quelle della popolazione.

– L’avvicinamento massimo si ha quando il campione è CASUALE

cioè quando la probabilità che un elemento venga scelto per far parte del campione è uguale per tutti gli elementi della popolazione

– L’avvicinamento è tanto maggiore quanto maggiore è la dimensione del campione

Page 9: STATISTICA a.a. 2003-2004

POPOLAZIONE E CAMPIONE

– Es. la popolazione delle altezze degli alunni di V elementare di una città

– Basta considerarne 100 o 1000: sarà improbabile trovare in questo campione bambini molto più bassi o molto più alti della media della popolazione.

– Perché ?

Page 10: STATISTICA a.a. 2003-2004

POPOLAZIONE E CAMPIONE

– Ad es. immaginiamo un campione di 1000 bambini alti tutti meno di 140 cm.

– Se prendiamo a caso un bambino nella popolazione, la probabilità che sia sotto i 140 cm è circa 5/100.

– La probabilità di prendere casualmente 1000 bambini alti meno di 140 cm sarà ( 1/20 )1000, ossia 0.000(più di millevolte)0001.

– Se diminuiamo la grandezza del campione la probabilità che non sia corretto cresce.

Page 11: STATISTICA a.a. 2003-2004

CAMPIONAMENTO CASUALE

– Ogni elemento della popolazione ha la stessa probabilità di far parte del campione

– Errore casuale: scelta casuale di un campione di caratteristiche diverse dalla popolazione (v. es. precedente) . La probabilità di commettere un errore casuale è quantificabile.

– Errore sistematico: scelta del campione con metodo sbagliato (es. scegliere il campione da un’unica scuola). La probabilità di commettere un errore sistematico non è quantificabile.

Page 12: STATISTICA a.a. 2003-2004

CAMPIONAMENTO CASUALE

 Esistono metodiche per eseguire un corretto campionamento casuale.

SAMPLING FRAME: lista degli elementi di interesse facenti parte della popolazione che si vuole studiare.

– Va compilata prima di procedere al campionamento, perché eventuali correzioni dopo il campionamento lo invalidano.

– Lo sperimentatore è portato a manipolare i dati perché corrispondano alle sue aspettative: prefissare la sampling frame minimizza suoi interventi esterni.

– Avviene poi il campionamento vero e proprio.

Page 13: STATISTICA a.a. 2003-2004

CAMPIONAMENTO SISTEMATICO

Si prendono gli elementi del campione secondo una certa regola

Es. Su una popolazione di bambini prendo i primi cento in ordine alfabetico, o tutti quelli il cui nome comincia per A, o prendere le prime dieci cavie estratte da una gabbia.

Il campionamento sistematico è sconsigliabile perché elimina la casualità.

 

Page 14: STATISTICA a.a. 2003-2004

CAMPIONAMENTO SISTEMATICO

Es. le prima cavie estratte potrebbero essere le più malate o vecchie. Il risultato dell’esperimento potrebbe esserne influenzato.

Es. i bambini che iniziano per A possono contenere molti Abdul, Assan, Abraham, ecc.e molti fratelli, introducendo discriminazioni genetiche.

Page 15: STATISTICA a.a. 2003-2004

CAMPIONAMENTO RANDOMIZZATO

_ Consiste nell’accoppiare ad ogni elemento della popolazione un evento completamente casuale.

- Es. Numeriamo le cavie da uno a venti e lanciamo una moneta 20 volte, assegnando al campione le cavie per cui è venuta testa.

- Invece che lanciare una moneta si può usare una tabella di numeri casuali e scegliere i numeri pari.

 

Page 16: STATISTICA a.a. 2003-2004

CAMPIONAMENTO PER STRATIFICAZIONE

– Questo metodo è applicabile quando le classi in cui si può suddividere una popolazione sono disgiunte e quando la proporzione di individui in ciascuna classe è nota.

– Es. Vogliamo stimare l’altezza media dei bambini in due scuole differenti.

– La prima scuola ha 1000 allievi , la seconda 500.– Scegliamo 50 bambini a caso nella prima scuola e 25

nella seconda.– Le proporzioni vengono rispettate. In questo modo si

elimina una possibile fonte di errore casuale nel campione.

Page 17: STATISTICA a.a. 2003-2004

TIPI DI DATI E SCALE DI MISURA

I dati possono essere organizzati in modo diverso secondo la loro natura.

 

SCALE NOMINALI O CATEGORICHE DATI QUALITATIVI

– Es. il sesso, la razza, ecc.– Ad ogni raggruppamento viene conferito un

numero (1=bianchi, 2=neri, ecc.)– Il numero non ha valore quantitativo.

Page 18: STATISTICA a.a. 2003-2004

TIPI DI DATI E SCALE DI MISURA

SCALE ORDINALI DATI QUANTITATIVI

– Raggruppano dati quantitativi arrangiabili in ordine di grandezza.

– Non è però possibile quantificare la differenza fra due punti della scala

– Es. Un giudizio scolastico: “buono” è maggiore di “discreto”

– Ma non si può dire che la differenza fra “buono” e “ottimo” (contigui) sia uguale a quella fra “sufficiente” e “discreto” (contigui)

Page 19: STATISTICA a.a. 2003-2004

TIPI DI DATI E SCALE DI MISURA

SCALE INTERVALLARI DATI QUANTITATIVI

– Raggruppano dati quantitativi per i quali è possibile valutare le differenze ma non i rapporti.

– Es. Scale di temperatura. – E’ possibile dire che fra due punti c’è una certa differenza

(es. 5 gradi)– Non è possibile dire che 25° sopra lo zero è la metà di 50°. – Infatti basta cambiare la scala (da Celsius a Farenheit)

perché il rapporto cambi.– Lo zero della scala è arbitrario.

Page 20: STATISTICA a.a. 2003-2004

TIPI DI DATI E SCALE DI MISURA

SCALE RAZIONALI DATI QUANTITATIVI

– E’ possibile stabilire sia differenze che rapporti.– Lo zero non è arbitrario.

– Es. Misure di lunghezza– Un segmento lungo un metro è lungo il doppio di

uno di 50 cm anche se cambiamo scala (piedi o pollici).