STATISTICA INFERENZIALE Studio del fenomeno considerando soltanto una parte dell’universo detta...

Post on 02-May-2015

214 views 0 download

Transcript of STATISTICA INFERENZIALE Studio del fenomeno considerando soltanto una parte dell’universo detta...

STATISTICA INFERENZIALE

Studio del fenomeno considerando soltanto una parte dell’universo detta Campione

CAMPIONEinsieme delle unità statiche considerate nello studio

N. B. i risultati ricavati sul campione verranno generalizzati (INFERITI) a tutto l’universo

PERCHÉ STUDIARE CAMPIONI

i test per la conoscenza del carattere possono essere distruttivi

(durata di una lavatrice) non tecnicamente possibile analizzare tutte le unità

statistiche ( studio sul numero di piastrine contenute nel sangue) ridurre i costi (indagine per sapere se un nuovo prodotto sarà apprezzato) indagine più accurata e più affidabile (più unità statistiche più possibilità di fare errori)

COME DEVE ESSERE UN BUON CAMPIONE

Rappresentativo dell’universocioè deve rappresentare l’universo nelle giuste

proporzioni:

- deve contenere u. s. che rappresentino

tutti i “tipi” di u. s. presenti nell’universo;

- dovrebbe contenere un n° di u. s. pari a circa il 10% dell’universo con un minimo di 100.

COME SI FA A TROVARE UN BUON CAMPIONE

Le principali modalità di campionamento sono: campionamento casuale semplice campionamento sistematico campionamento casuale a più stadi stratificazione del campione

CAMPIONAMENTO CASUALE SEMPLICE

Procedimento: equivale ad associare ad ogni u. s. dell’universo una biglia numerata e ad estrarre a caso da un’urna, una per volta e senza riporla (non ripetizione), tante biglie quante sono le u. s. del campione

L'estrazione può essere fatta anche con ripetizione, cioè reinserendo nell'urna la biglia estratta.

N. B.: l’estrazione a sorte si può simulare in ambiente excell con la funzione CASUALE

CAMPIONAMENTO SISTEMATICO

Procedimento: Si decide in modo casuale la prima unità statistica da inserire nel campione e le altre si scelgono a distanza regolare dalla prime

occorrente: lista ordinata dell’universo N. B.: E’ una variante del campionamento

casuale semplice

CAMPIONAMENTO CASUALE A PIU’ STADI

Si usa quando non si possiede una lista di tutte le unità statistiche dell’universo

Procedimento: è un campionamento attraverso varie fasi (livelli)

1° livello: l’universo viene diviso in gruppi

2° livello: ciascun gruppo viene suddiviso in sottogruppi e di quest’ultimi solo alcuni (scelti in modo casuale) concorreranno alla formazione del campione ( di solito il loro numero viene deciso in modo proporzionale al numero dei sottogruppi)

3° livello: ciascun sottogruppo scelto nel livello precedente, viene suddiviso a sua volta in altri sottogruppi e di quest’ultimi solo alcuni (scelti in modo casuale) concorreranno alla formazione del campione ( di solito il loro numero viene deciso in modo proporzionale al numero dei sottogruppi)

e così via………….fino ad arrivare a sottogruppi di u. s. dei quali conosciamo la lista.

Statistica inferenziale

Quando: Non possiamo o non vogliamo misurare tutta

la popolazione Vogliamo comunque descriverla Vogliamo avere una stima degli indici visti fino

ad ora, ma entra in gioco l’Incertezza e quindi la probabilità:

Probabilità = 0 ... 1 = 0% …100%

Stimatori degli “indici descrittivi”

Popolazione

media pop.

2 varianza pop.

Campione

media campionaria

s2 varianza campionaria

x

Inferenza

Indici campionari

Media campionaria Varianza campionaria Deviazione Standard campionaria

Distribuzione Normale

Media = Deviazione

Standard= indipendente da È frequente in “natura” In microbiologia…

Distribuzione Normale

Famiglia di distribuzioni al variare di e

Distribuzione Normalestandardizzata

Distribuzione Normale

2,5%

Simbologia (convenzioni) Lettere greche per parametri popolazione

con il cappelletto le relative stime Lettere latine MAIUSCOLE per variabili

casuali Lettere latine minuscole per campione (x,u) Media campionaria con trattino sopra

Es.

),(ˆ

),(21

2

nin Nxx

NXSe

μ σ 2

Media campionaria

In Excel: MEDIA(dati)

n

iixn

x1

1

Varianza campionaria

In Excel: VAR(dati)

n

i

xxins

1

22

1

1

Deviazione standard campionaria

In Excel: DEV.ST(dati) DEV.ST.POP(dati)

n

i

xxins

1

2

1

1

Lo statistico trova e dimostra che…

Stimatore della “vera” media è

Stimatore della “vera” varianza è

n

iixn

x1

n

i

xxin 1

22

1

Teorema del limite centrale

La media campionaria di un campione si distribuisce come una normale con

media pari alla media della popolazione varianza pari a varianza popolazione su

n=V(X)/n

),(ˆ

),(21

2

nin Nxxallora

DistribXse

Lo stimatore mi dà un solo valore!… è sufficiente?

Se un marziano ci chiedesse quanto sono alti mediamente gli esseri umani, e noi gli rispondessimo: - «mediamente 155cm»egli potrebbe immaginare esseri umani alti 5cm ed altri alti 3 metri!.

Ci vuole un “intervallo di confidenza”!

Tlc e Intervalli di confidenza

Posso sempre costruire intervalli di confidenza sfruttando il TLC

StandardErrorex

xn

2ˆ ˆ