INFERENZA STATISTICA
description
Transcript of INFERENZA STATISTICA
INFERENZA STATISTICA
STATISTICA DESCRITTIVA
Statistica inferenziale
PopolazioneCampione
Statistica inferenziale
Probabilità
Popolazione finita e suoi parametri
Una Popolazione finita è un insieme di unità su cui si può osservare un certo carattere. (es: tutti i pazienti di un reparto) I parametri della popolazione sono delle costanti che descrivono aspetti caratteristici della distribuzione del carattere nella popolazione stessa.
Esempio di parametro: media della popolazione
Varianza della popolazione
Ni ix
N 11
N
iiixN
22 1
Popolazione
Campione rappresentativo
Stima campionaria
Parametro della popolazione
Il campione statistico è quel sottoinsieme particolare della popolazione o universo, individuato in essa in modo da consentire,con un rischio definito di errore, la generalizzazione all’intera popolazione.
Il campione rappresentativo riproduce in miniatura la popolazione
Procedimento casuale
Campionerappresentativo
Il campione casuale è estratto con procedimento tale che tutte le unità della popolazione hanno la stessa probabilità di essere estratte
Con ricollocamento(estrazioni indipendenti)
Senza ricollocamento o in blocco(estrazioni indipendenti se n/N<0.05)
Campioni casuali
L’estrazione casuale dei campioni dalla popolazione può essere• con ripetizione: una volta estratta un’unità viene rimessa dentro la popolazione e quindi potrebbe essere nuovamente estratta;• senza ripetizione: una volta estratta un’unità questa viene messa da parte e quindi non può essere estratta più di una volta.
Due campioni non ordinati di uguale numerosità sono diversi tra loro se almeno un’unità del primo campione non è contenuta nel secondo campione. Nei campioni ordinati conta invece anche l’ordine con cui si presentano le diverse unità.
Schema senza ricollocamento o in blocco
Lo spazio campionario, ovvero l’insieme di tutti i possibili campioni è:
BACA CBDA DB DCEA EB EC ED Vi sono in tutto =10
campioni,
dati dalle combinazioni senza ripetizione di 5 elementi a 2 a 2.
Due campioni differiscono solo per la natura degli elementi
Schema con ricollocamento o ripetizione
Lo spazio campionario, ovvero l’insieme di tutti i possibili campioni è:
AA AB AC AD AEBA BB BC BD BECA CB CC CD CEDA DB DC DD DEEA EB EC ED EE Vi sono in tutto 52=25 campioni, dati
dalle disposizioni con ripetizione di 5 elementi a 2 a 2.
Due campioni differiscono sia per l’ordine sia per la natura degli elementi
Problema: Da una popolazione composta da 5 unità statistiche si voglia estrarre un campione casuale di numerosità 2.
2
5
Metodi di campionamento
Campioni probabilistici
Campione casuale semplice
Campione sistematico Campione stratificato A due o più stadi Campione a grappoli
Campioni non probabilistici
Per quote Campioni di unità già
disponibili Campioni di volontari
Si deve disporre di un elenco degli elementi della popolazione da campionare Per individuare le n unità del campione tra gli N della Popolazione si sceglie dall’elenco una unità ogni K (=N/n). Il seme iniziale è una qualunque unità scelta a caso fra le prime K.
Campionamento sistematico
Si voglia estrarre un campione di 10 unità da una popolazione di 1000. Si sceglie un passo di 1000/10=100. Supponiamo che il numero scelto a caso tra 1 e 100 sia 77. Le unità campionate sono le seguenti: 77; 177; 277;377;477;577;677;777;877;977
numerosità degli strati classi di età
Sesso tra 14 e 34 tra 35 e 64maggiore o uguale a 65
Maschi 1879 1046 789 3714Femmine 1756 976 1002 3734
3635 2022 1791 7448
Supponiamo di avere una popolazione di 7448 unità stratificate per sesso e classe di età
Campionamento stratificato
La popolazione è divisa in strati internamente omogenei e quindi si procede con campionamento casuale da ciascuno strato.
numerosità degli strati classi di età
Sesso tra 14 e 34 tra 35 e 64maggiore o uguale a 65
Maschi 1879 1046 789 3714Femmine 1756 976 1002 3734
3635 2022 1791 7448
pesi degli strati tra 14 e 34 tra 35 e 64
maggiore o uguale a 65
Maschi 0.25 0.14 0.11 0.50Femmine 0.24 0.13 0.13 0.50
0.49 0.27 0.24 1.00
pesi degli strati tra 14 e 34 tra 35 e 64
maggiore o uguale a 65
Maschi 0.25 0.14 0.11 0.50Femmine 0.24 0.13 0.13 0.50
0.49 0.27 0.24 1.00
composizione di un campione stratificato di 500 unità tra 14 e 34 tra 35 e 64
maggiore o uguale a 65
Maschi 126 70 53 249 Femmine 118 66 67 251
244 136 120 500
126=0.25*500 53=0.11*500
Nel campionamento casuale a grappoli la popolazione viene suddivisa in sottoinsiemi detti grappoli. Si selezionano, con un’estrazione casuale senza ripetizione, un certo numero di grappoli e si prendono come unità campionarie tutte le unità appartenenti ai grappoli estratti.
Nel campionamento casuale a due stadi la popolazione viene suddivisa in un certo numero di grappoli. Al primo stadio si estrae senza ripetizione un certo numero di grappoli. Da ciascuno di questi si estrae con ripetizione (secondo stadio) un certo numero di unità.
Campionamento casuale a grappoli e a stadi
primo stadio secondo stadio
Unità primarie Unità secondarie
Le indagini sulle famiglie dell’Istat seguono un piano di campionamento in cui i comuni (unità primarie) vengono stratificati e scelti a caso (I° stadio) e da ogni comune campionato viene scelto un campione di famiglie (2° stadio)
Piani di campionamento complessi