STATISTICA a.a. 2003-2004
description
Transcript of STATISTICA a.a. 2003-2004
STATISTICAa.a. 2003-2004
– VARIABILITA’ BIOLOGICA E CASO
– POPOLAZIONE E CAMPIONE
– CAMPIONAMENTO CASUALE, SISTEMATICO , RANDOMIZZATO, PER STRATIFICAZIONE
– TIPI DI DATI E SCALE DI MISURA
VARIABILITA’ BIOLOGICA E CASO
– VARIABILITA’ BIOLOGICA :– insieme di differenze fisiche e funzionali fra
individui dello stesso tipo– misure differenti in differenti individui o
nello stesso individuo in momenti diversi (es. l’altezza di un gruppo di bambini o di un bambino nel tempo)
VARIABILITA’ BIOLOGICA E CASO
- VARIABILITA’ SISTEMATICA :
insieme di differenze dovute a fattori che agiscono sulla grandezza in esame e dei quali è possibile accertare l’effetto
- Es. gruppo di bambini : i più grandicelli sono più alti – l’età ha effetto sull’altezza
VARIABILITA’ BIOLOGICA E CASO
– VARIABILITA’ CASUALE : insieme di differenze dovute a fattori incontrollabili che agiscono su un evento
– Es. ci sono bambini giovani più alti di bambini più vecchi – i fattori incontrollabili sono di origine familiare, alimentare, etnica, ecc.
– Quanti più fattori incontrollabili agiscono su un evento, tanto più omogenea sarà l’azione del caso sugli eventi.
POPOLAZIONE E CAMPIONE
– POPOLAZIONE:Insieme di enti che condividono una o più
caratteristiche comuni
-Una popolazione statistica può essere un insieme di persone o animali, o un insieme di misure o di osservazioni.
– Popolazioni ipotetiche: es. tutte le possibili estrazioni di due carte da un mazzo
POPOLAZIONE E CAMPIONE
– Popolazioni fisiche: bambini di V C di una certa scuola
– Popolazioni finite : l’insieme dei cartelli stradali
– Popolazioni infinite: tutti i multipli di 13
POPOLAZIONE E CAMPIONE
– Scopo della statistica è descrivere nel modo migliore possibile la popolazione.
– Se la popolazione è nota a priori : ricerca di grandezze significative che ne sintetizzino le caratteristiche (es. media, varianza, ecc.)
– Se la popolazione non è nota a priori occorre estrarne un campione.
POPOLAZIONE E CAMPIONE
– CAMPIONE: piccola frazione di una popolazione le cui caratteristiche si avvicinano a quelle della popolazione.
– L’avvicinamento massimo si ha quando il campione è CASUALE
cioè quando la probabilità che un elemento venga scelto per far parte del campione è uguale per tutti gli elementi della popolazione
– L’avvicinamento è tanto maggiore quanto maggiore è la dimensione del campione
POPOLAZIONE E CAMPIONE
– Es. la popolazione delle altezze degli alunni di V elementare di una città
– Basta considerarne 100 o 1000: sarà improbabile trovare in questo campione bambini molto più bassi o molto più alti della media della popolazione.
– Perché ?
POPOLAZIONE E CAMPIONE
– Ad es. immaginiamo un campione di 1000 bambini alti tutti meno di 140 cm.
– Se prendiamo a caso un bambino nella popolazione, la probabilità che sia sotto i 140 cm è circa 5/100.
– La probabilità di prendere casualmente 1000 bambini alti meno di 140 cm sarà ( 1/20 )1000, ossia 0.000(più di millevolte)0001.
– Se diminuiamo la grandezza del campione la probabilità che non sia corretto cresce.
CAMPIONAMENTO CASUALE
– Ogni elemento della popolazione ha la stessa probabilità di far parte del campione
– Errore casuale: scelta casuale di un campione di caratteristiche diverse dalla popolazione (v. es. precedente) . La probabilità di commettere un errore casuale è quantificabile.
– Errore sistematico: scelta del campione con metodo sbagliato (es. scegliere il campione da un’unica scuola). La probabilità di commettere un errore sistematico non è quantificabile.
CAMPIONAMENTO CASUALE
Esistono metodiche per eseguire un corretto campionamento casuale.
SAMPLING FRAME: lista degli elementi di interesse facenti parte della popolazione che si vuole studiare.
– Va compilata prima di procedere al campionamento, perché eventuali correzioni dopo il campionamento lo invalidano.
– Lo sperimentatore è portato a manipolare i dati perché corrispondano alle sue aspettative: prefissare la sampling frame minimizza suoi interventi esterni.
– Avviene poi il campionamento vero e proprio.
CAMPIONAMENTO SISTEMATICO
Si prendono gli elementi del campione secondo una certa regola
Es. Su una popolazione di bambini prendo i primi cento in ordine alfabetico, o tutti quelli il cui nome comincia per A, o prendere le prime dieci cavie estratte da una gabbia.
Il campionamento sistematico è sconsigliabile perché elimina la casualità.
CAMPIONAMENTO SISTEMATICO
Es. le prima cavie estratte potrebbero essere le più malate o vecchie. Il risultato dell’esperimento potrebbe esserne influenzato.
Es. i bambini che iniziano per A possono contenere molti Abdul, Assan, Abraham, ecc.e molti fratelli, introducendo discriminazioni genetiche.
CAMPIONAMENTO RANDOMIZZATO
_ Consiste nell’accoppiare ad ogni elemento della popolazione un evento completamente casuale.
- Es. Numeriamo le cavie da uno a venti e lanciamo una moneta 20 volte, assegnando al campione le cavie per cui è venuta testa.
- Invece che lanciare una moneta si può usare una tabella di numeri casuali e scegliere i numeri pari.
CAMPIONAMENTO PER STRATIFICAZIONE
– Questo metodo è applicabile quando le classi in cui si può suddividere una popolazione sono disgiunte e quando la proporzione di individui in ciascuna classe è nota.
– Es. Vogliamo stimare l’altezza media dei bambini in due scuole differenti.
– La prima scuola ha 1000 allievi , la seconda 500.– Scegliamo 50 bambini a caso nella prima scuola e 25
nella seconda.– Le proporzioni vengono rispettate. In questo modo si
elimina una possibile fonte di errore casuale nel campione.
TIPI DI DATI E SCALE DI MISURA
I dati possono essere organizzati in modo diverso secondo la loro natura.
SCALE NOMINALI O CATEGORICHE DATI QUALITATIVI
– Es. il sesso, la razza, ecc.– Ad ogni raggruppamento viene conferito un
numero (1=bianchi, 2=neri, ecc.)– Il numero non ha valore quantitativo.
TIPI DI DATI E SCALE DI MISURA
SCALE ORDINALI DATI QUANTITATIVI
– Raggruppano dati quantitativi arrangiabili in ordine di grandezza.
– Non è però possibile quantificare la differenza fra due punti della scala
– Es. Un giudizio scolastico: “buono” è maggiore di “discreto”
– Ma non si può dire che la differenza fra “buono” e “ottimo” (contigui) sia uguale a quella fra “sufficiente” e “discreto” (contigui)
TIPI DI DATI E SCALE DI MISURA
SCALE INTERVALLARI DATI QUANTITATIVI
– Raggruppano dati quantitativi per i quali è possibile valutare le differenze ma non i rapporti.
– Es. Scale di temperatura. – E’ possibile dire che fra due punti c’è una certa differenza
(es. 5 gradi)– Non è possibile dire che 25° sopra lo zero è la metà di 50°. – Infatti basta cambiare la scala (da Celsius a Farenheit)
perché il rapporto cambi.– Lo zero della scala è arbitrario.
TIPI DI DATI E SCALE DI MISURA
SCALE RAZIONALI DATI QUANTITATIVI
– E’ possibile stabilire sia differenze che rapporti.– Lo zero non è arbitrario.
– Es. Misure di lunghezza– Un segmento lungo un metro è lungo il doppio di
uno di 50 cm anche se cambiamo scala (piedi o pollici).