Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema...

19
89 Parametri, stimatori e stime, aspetti esplicativi dell'Inferenza Statistica 1 Maria Felicia Andriani – Francesco Maria Dellisanti Oronzo Filippi Sunto: In questa esperienza vengono analizzati gli aspetti semantici e algebrici di un noto Teorema dell'Inferenza statistica, per una com- prensione più consapevole della disciplina. Abstract: In this experience we analyse the semantic and algebric as- pects of a well-known theorem about statistics, for a reading literacy of the subject. Parole chiave: Inferenza campionaria, media della distribuzione cam- pionaria media, varianza della distribuzione campionaria media. 1 Lavoro tratto da uno studio di Francesco Maria Dellisanti.

Transcript of Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema...

Page 1: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

89

Parametri, stimatori e stime, aspetti esplicativi dell'Inferenza Statistica1

Maria Felicia Andriani – Francesco Maria Dellisanti

Oronzo Filippi Sunto: In questa esperienza vengono analizzati gli aspetti semantici e algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract: In this experience we analyse the semantic and algebric as-pects of a well-known theorem about statistics, for a reading literacy of the subject. Parole chiave: Inferenza campionaria, media della distribuzione cam-pionaria media, varianza della distribuzione campionaria media.

1 Lavoro tratto da uno studio di Francesco Maria Dellisanti.

Page 2: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

90

1. INTRODUZIONE Il progresso scientifico, l’osservazione, lo studio e la descrizione

dei fenomeni naturali, intesi questi nell’accezione più ampia, necessi-tano della conoscenza anche della statistica e della probabilità, ambiti disciplinari già facenti parte del nucleo Dati e Previsioni2. Tali cono-scenze, affrontate in forma applicativa nei due bienni precedenti, pos-sono essere riprese, in questo particolare anno scolastico, con un o-biettivo diverso: la reading literacy, ossia con una lettura consapevole.

Si propone dunque un’attività di laboratorio, da effettuarsi anche con l'ausilio del foglio elettronico che, attraverso una metodologia di cooperative learning, permetta agli studenti la comprensione, sul pia-no metacognitivo, di terminologie specifiche e delle corrispondenti espressioni matematiche tipiche dell'inferenza statistica.

A titolo di esempio sarà esaminato il seguente Teorema: Il valore medio della media campionaria

!

X , in caso di cam-pionamento bernulliano, è uguale alla media µ della popola-zione, mentre la varianza della media campionaria

!

X è uguale alla varianza della popolazione divisa per la dimensione del campione, cioè:

!

Media(X ) = µX

= µ (1)

!

Var( X ) ="X

2=" 2

n (2)

Mentre in caso di campionamento senza ripetizione, risulterà:

!

Media(X ) = µX

= µ (1)

!

Var(X ) ="X

2=" 2

n*

N # n

N # 1 (3)

Sarà compito di questa proposta di lavoro contribuire a chiarire il significato di termini ed espressioni caratteristici di questa disciplina.

2 Protocollo MIUR-Mathesis, La Matematica per il cittadino [2].

Page 3: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

91

2. NOTE STORICHE SULL'INFERENZA STATISTICA3 Si definisce inferenza statistica il procedimento mediante il quale,

dall'analisi dei dati osservati sul campione, si traggono informazioni relative all'intera popolazione. Si possono distinguere due aspetti prin-cipali dell'inferenza statistica: la stima campionaria, quando dallo studio dei parametri del cam-

pione, quali la media, la varianza, etc si può stimare il corrispon-dente parametro della popolazione che non è noto;

la verifica delle ipotesi, quando dall'esame del campione si vuole decidere se un'ipotesi fatta su una data popolazione è accettabile o rifiutabile; la decisione è presa ad un dato livello di probabilità di commettere un errore nell'accettare l'ipotesi quando questa è falsa o nel rifiutarla quando questa è vera. I primi tentativi di estrapolare dati statistici riguardanti fenomeni

economici e sociali, risalgono in Francia e in Inghilterra ai secoli XVII e XVIII, con la nascita del calcolo delle probabilità. Si deve però giungere all'inizio del XX secolo, con le opere di R. A. Fisher (1890-1960), di R. Pearson (1857-1936), di E. S. Pearson (1895-1980) e di J. Neyman (1894-1961) per lo sviluppo della teoria della stima e della verifica delle ipotesi. Successivamente sotto l'influenza dello studioso di calcolo delle probabilità, Bruno de Finetti (1906-1985), si è svilup-pata una nuova impostazione: l'inferenza bayesiana, dove sono stati introdotti e affinati nuovi test statistici.

3. ATTIVITÀ DI LAVORO Si vuole chiarire attraverso degli esempi il significato dei termini:

parametro, stimatore e stima, rispettivamente costante, funzione di variabili campionarie e valore della funzione campionaria e delle e-spressioni: il valore medio della media campionaria e la varianza della media campionaria, mediante anche l'utilizzo di un applicativo realizzato in Excel4.

3 I contenuti esposti, con i dovuti riadattamenti, sono tratti dal cap 11 del volume CONOSCERE E

APPLICARE LA MATEMATICA, Ed. Tramontana, Aut. A. Gambotto Manzone - B. Consolini. [3]. 4 L'applicativo inferenza_esempio1.xls può essere richiesto direttamente agli autori.

Page 4: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

92

I voti riportati da 10 studenti della classe V B, negli esami di sta-to dello scorso anno scolastico, in una delle tre prove scritte, sono i seguenti: 10, 11, 9, 8, 12, 10, 11, 15, 13 e 14.

Quando calcoliamo la media e la varianza dei voti riportati dagli studenti negli Esami di stato stiamo misurando due parametri dei dati rilevati, ossia della popolazione dei dati; questi valori, che identificano la popolazione sono sempre costanti in quanto ottenuti dalle seguenti relazioni e con gli stessi valori:

!

µ =

xi

i=1

N

"

N=

xi

i=1

10

"

10=

10 + ...+ 14

10= 11,3

!

" 2 =

xi #µ( )i=1

N

$2

N=

10 # 11,3( )2

+ ...+ (14 # 11,3)2

10= 4,41

I valori dei due parametri sarebbero stati diversi se avessimo ope-rato su un'altra popolazione di dati, quali i risultati della stessa prova in un'altra classe o i risultati degli stessi studenti in altre prove.

Pertanto: i parametri di una popolazione di dati sono grandezze costanti, essi vengono sempre indicati con lettere minuscole greche e caratterizzano la popolazione stessa.

Ricordiamo brevemente alcuni termini che saranno richiamati in seguito. La popolazione (o universo statistico) è l'insieme di unità sta-tistiche che condividono una o più caratteristiche, ciascuna delle quali è la determinazione di una stessa variabile, ad esempio l'insieme dei voti conseguiti dagli studenti nella terza prova. Tale determinazione può essere numerica, in caso di variabile e può essere non numerica in caso di mutabile. La popolazione può essere finita o infinita, anche se quest'ultima è un'astrazione utilizzata per avere formule più semplici.

Per campione statistico s'intende un sottoinsieme proprio, di unità statistiche, facenti parte della popolazione ed estratte casualmente da essa. La dimensione n del campione rappresenta la sua ampiezza. Si definisce universo (o spazio) dei campioni, l'insieme di tutti i possibili campioni che si possono estrarre dalla popolazione. Un campione può essere composto mediante una estrazione bernulliana se ogni unità

Page 5: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

93

statistica, dopo l'estrazione, viene rimessa nella popolazione da cui è stata estratta, per essere nuovamente sorteggiata: in questo caso la probabilità di ogni unità di essere sorteggiata non varia ed è pari a: 1/N. Il numero dei campioni distinti, ciascuno di ampiezza n, che si possono estrarre da una popolazione di numerosità N è uguale al nu-mero di Disposizioni con ripetizione di N elementi di classe n, ossia: D'N,n=Nn.Un campione può essere composto mediante una estrazione in blocco se ogni unità statistica dopo l'estrazione non viene rimessa nella popolazione da cui è stata estratta, oppure le unità vengono e-stratte in blocco. Le unità statistiche, pertanto, non hanno tutte la stes-sa probabilità di essere sorteggiate; la prima, infatti, è pari a: 1/N la seconda: 1/(N-1) e l'ultima: 1/(N-n-1). Il numero dei campioni distinti, ciascuno di ampiezza n, che si possono estrarre da una popolazione di numerosità N, senza tener conto dell'ordine delle unità5, è uguale al numero di Combinazioni semplici di N elementi di classe n, ossia:

!

N

n

"

# $

%

& ' =

N!

n!(N ( n)!

Relativamente all'esempio proposto per calcolare l'universo dei cam-pioni, di dimensione n=2, nel caso di estrazione bernoulliana, dob-biamo far riferimento alla formula precedente e quindi: Nn=102=100. Nel caso di estrazioni in blocco o senza ripetizione, invece, il risultato sarà il seguente:

!

N

n

"

# $

%

& ' =

10!

2!(10 ( 2)!=

3628800

2* 40320= 45 .

3.1 VERIFICA PER CAMPIONI BERNULLIANI

Estraiamo con ripetizione dalla nostra popolazione tutti i possibili campioni di dimensione 2 e per ciascun campione ci calcoliamo la media. I risultati sono riportati nel prospetto seguente:

5 È possibile formare il campione anche tenendo conto dell'ordine, in questo caso il numero

dei campioni è pari alle Disposizioni semplici di N elementi di classe n, ossia: DN,n, ma que-sto caso non sarà trattato.

Page 6: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

94

Tabella n° 1 - Universo dei campioni, di dimensione n=2, estratti con ripetizione da una popolazione di 10 elementi. Campione Composizione

!

X 1° 10 10 10,0 2° 10 11 10,5 3° 10 9 9,5 4° 10 8 9,0 5° 10 12 11,0 6° 10 10 10,0 7° 10 11 10,5 8° 10 15 12,5 9° 10 13 11,5

10° 10 14 12,0 11° 11 10 10,5 12° 11 11 11,0 13° 11 9 10,0 14° 11 8 9,5 15° 11 12 11,5 16° 11 10 10,5 17° 11 11 11,0 18° 11 15 13,0 19° 11 13 12,0 20° 11 14 12,5 21° 9 10 9,5 22° 9 11 10,0 23° 9 9 9,0 24° 9 8 8,5 25° 9 12 10,5 26° 9 10 9,5 27° 9 11 10,0 28° 9 15 12,0 29° 9 13 11,0 30° 9 14 11,5 31° 8 10 9,0 32° 8 11 9,5 33° 8 9 8,5 34° 8 8 8,0 35° 8 12 10,0 36° 8 10 9,0 37° 8 11 9,5 38° 8 15 11,5 39° 8 13 10,5

Campione Composizione

!

X 40° 8 14 11,0 41° 12 10 11,0 42° 12 11 11,5 43° 12 9 10,5 44° 12 8 10,0 45° 12 12 12,0 46° 12 10 11,0 47° 12 11 11,5 48° 12 15 13,5 49° 12 13 12,5 50° 12 14 13,0 51° 10 10 10,0 52° 10 11 10,5 53° 10 9 9,5 54° 10 8 9,0 55° 10 12 11,0 56° 10 10 10,0 57° 10 11 10,5 58° 10 15 12,5 59° 10 13 11,5 60° 10 14 12,0 61° 11 10 10,5 62° 11 11 11,0 63° 11 9 10,0 64° 11 8 9,5 65° 11 12 11,5 66° 11 10 10,5 67° 11 11 11,0 68° 11 15 13,0 69° 11 13 12,0 70° 11 14 12,5 71° 15 10 12,5 72° 15 11 13,0 73° 15 9 12,0 74° 15 8 11,5 75° 15 12 13,5 76° 15 10 12,5 77° 15 11 13,0 78° 15 15 15,0

Page 7: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

95

Campione Composizione

!

X 79° 15 13 14,0 80° 15 14 14,5 81° 13 10 11,5 82° 13 11 12,0 83° 13 9 11,0 84° 13 8 10,5 85° 13 12 12,5 86° 13 10 11,5 87° 13 11 12,0 88° 13 15 14,0 89° 13 13 13,0

Campione Composizione

!

X 90° 13 14 13,5 91° 14 10 12,0 92° 14 11 12,5 93° 14 9 11,5 94° 14 8 11,0 95° 14 12 13,0 96° 14 10 12,0 97° 14 11 12,5 98° 14 15 14,5 99° 14 13 13,5

100° 14 14 14,0

Nella colonna relativa alla media aritmetica dei campioni, denota-ta

!

x osserviamo come questi valori variano; essi, infatti, sono legati alle unità che compongono il campione, quindi questa variabile cam-pionaria si presenta con una varietà specifica, la cui distribuzione di frequenza è la seguente.

Tabella n° 2 - Distribuzione di frequenza della variabile campio-naria: media aritmetica dei campioni

Modalità Freq. 8,00 1 8,50 2 9,00 5 9,50 8

10,00 10 10,50 12 11,00 12 11,50 12 12,00 11 12,50 10 13,00 7 13,50 4 14,00 3 14,50 2 15,00 1

100 Mentre la conseguente rappresentazione grafica è la seguente.

Page 8: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

96

0 1 2 3 4 5 6 7 8 9 10 11 12

8,00

9,00

10,00

11,00

12,00

13,00

14,00

15,00

Grafico n° 1 - Rappresentazione grafica della variabile campionaria: media aritmetica dei campioni.

Per comprendere appieno il significato algebrico delle espressioni (1), (2) e (3) del Teorema, oggetto della nostra attività, dobbiamo cal-colarci la media e la varianza, di questa variabile campionaria. Con riferimento alla Tabella n° 2 i valori

!

x 1, ..., x

15 rappresentano le mo-

dalità della variabile

!

X , ossia le determinazioni numeriche della va-riabile campionaria; i valori fr rappresentano le corrispondenti fre-quenze. Il valore medio ponderato di tutte le medie campionarie, pertanto, è

!

Media(X ) = µX

=

X r * fr

r=1

15

"

fr

r=1

15

"=

che corrisponderà a:

Page 9: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

97

!

=(8,00*1) + ...+ (15,00 *1)

1 + ...+ 1= 11,3

abbiamo così verificato come la media della distribuzione campionaria media è uguale al corrispondente parametro della popolazione, ossia:

!

Media(X ) = µX

= 11,3 = µ

Calcoliamo anche la varianza della variabile campionaria:

!

Varianza(X ) ="X

2 =

X r #µX ( )

r=1

15

$2

* fr

fr

r=1

15

$=

!

=8,00 " 11,3( )

2

* 1 + ...+ 15,00 " 11,3( )2

* 1

1 + ...+ 1= 2,205

Anche in questo caso risulta verificato come la varianza della distri-buzione campionaria, media campionaria, è uguale alla varianza del-la popolazione divisa per l'ampiezza dei campioni, ossia:

!

Varianza(X ) ="X

2= 2,205 =

" 2

n=

4,410

2= 2,205

3.2 VERIFICA PER CAMPIONI CON ESTRAZIONI IN BLOCCO

Estraiamo dalla nostra popolazione tutti i possibili campioni di dimensione 2, senza riutilizzare le unità statistiche già estratte e per ciascun campione ci calcoliamo la media. I risultati sono riportati nel prospetto seguente:

Tabella n° 3 - Universo dei campioni, di dimensione n=2, estratti sen-za ripetizione da una popolazione di 10 elementi.

Campione Composizione

!

X 1° 10 11 10,5 2° 10 9 9,5 3° 10 8 9,0 4° 10 12 11,0 5° 10 10 10,0

Campione Composizione

!

X 6° 10 11 10,5 7° 10 15 12,5 8° 10 13 11,5 9° 10 14 12,0 10° 11 9 10,0

Page 10: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

98

Campione Composizione

!

X 11° 11 8 9,5 12° 11 12 11,5 13° 11 10 10,5 14° 11 11 11,0 15° 11 15 13,0 16° 11 13 12,0 17° 11 14 12,5 18° 9 8 8,5 19° 9 12 10,5 20° 9 10 9,5 21° 9 11 10,0 22° 9 15 12,0 23° 9 13 11,0 24° 9 14 11,5 25° 8 12 10,0 26° 8 10 9,0 27° 8 11 9,5 28° 8 15 11,5

Campione Composizione

!

X 29° 8 13 10,5 30° 8 14 11,0 31° 12 10 11,0 32° 12 11 11,5 33° 12 15 13,5 34° 12 13 12,5 35° 12 14 13,0 36° 10 11 10,5 37° 10 15 12,5 38° 10 13 11,5 39° 10 14 12,0 40° 11 15 13,0 41° 11 13 12,0 42° 11 14 12,5 43° 15 13 14,0 44° 15 14 14,5 45° 13 14 13,5

Dalla tabella osserviamo come, anche in questo caso, la variabile

campionaria, media aritmetica dei campioni, si presenta con una varie-tà specifica, la cui distribuzione è la seguente:

Tabella n° 4 - Distribuzione di frequenza della variabile campio-naria: media aritmetica dei campioni.

Modalità Freq. 8,00 0 8,50 1 9,00 2 9,50 4

10,00 4 10,50 6 11,00 5 11,50 6 12,00 5 12,50 5 13,00 3 13,50 2 14,00 1 14,50 1 15,00 0

45

Page 11: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

99

0 1 2 3 4 5 6

8,00

9,00

10,00

11,00

12,00

13,00

14,00

15,00

Grafico n° 2 - Rappresentazione grafica della variabile campionaria: media aritmetica dei campioni.

Anche in questo caso, per comprendere il significato delle espres-sioni (1), (2) e (3) contenute nel Teorema, dobbiamo calcolare la me-dia e la varianza della variabile campionaria, pertanto il valore medio ponderato di tutte le medie campionarie corrisponderà a:

!

Media(X ) = µX

=

X r * fr

r=1

13

"

fr

r=1

13

"=

!

=(8,50* 1) + ...+ (14,50* 1)

1 + ...+ 1= 11,3

verificando, ancora una volta, come la media della distribuzione cam-pionaria media, anche in questo caso, è uguale alla media della popo-lazione, ossia:

!

Media(X ) = µX

= 11,3 = µ

Page 12: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

100

Anche il calcolo della varianza della variabile campionaria:

!

Varianza(X ) ="X

2 =

x r #µX ( )

r=1

13

$2

* fr

fr

r=1

13

$=

!

=8,50 " 11,3( )

2

* 1 + ...+ 14,50 " 11,3( )2

* 1

1 + ...+ 1= 1,96

verificherà quanto affermato nel Teorema, ossia la varianza della di-stribuzione campionaria è uguale alla varianza della popolazione, di-visa per l'ampiezza dei campioni e moltiplicata per il fattore corri-spondente, ossia:

!

Varianza(X ) ="X

2=" 2

n*

N # n

N # 1=

4,410

2*

10 - 2

10 - 1= 2,205*

8

9= 1,96

Utilizzando il software inferenza_esempio1.xls è possibile verifi-care come, limitatamente ad una popolazione di 10 elementi e ad un campione di ampiezza 2, il variare delle modalità del carattere produ-ce sempre le uguaglianze enunciate nel Teorema.

4. PARAMETRI, STIMATORI E STIME Abbiamo chiarito in precedenza il significato di parametro di una

popolazione e abbiamo visto come questa grandezza è costante, gene-ricamente essa è indicata con la lettera greca ϑ (leggasi theta).

Abbiamo visto come, al variare del campione, la distribuzione campionaria assume valori sempre diversi, perché legati alle unità sta-tistiche che formano il campione. Questa variabile è chiamata Stima-tore o statistica Test, ed è indicata con la lettera latina T; essa è una variabile casuale ed è funzione, nel nostro esempio, delle medie cam-pionarie, ossia:

!

T = f ( x 1,x 2,...,x

N n )

oppure

Page 13: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

101

!

T = f(x 1 ,...,x Nn

"

# $

%

& ' )

a seconda del tipo di campionamento interessato. Il valore che questo stimatore assume, quando si assegnano alle

variabili

!

X i i valori del campione estratto, si chiama Stima o Statisti-

ca Calcolata ed è un numero reale. Riteniamo pertanto di aver contribuito, con questo esempio, ad

una conoscenza più consapevole di questa parte dell'Inferenza statisti-ca. Siamo consapevoli, tuttavia, che la verifica di un teorema non può essere effettuata attraverso l'aspetto numerico, ma richiede un'argo-mentazione più ampia.

A titolo di esempio, quindi, presentiamo la dimostrazione di un pa-rametro che se il docente lo riterrà opportuno potrà discuterne in clas-se. 5. LE DIMOSTRAZIONI

Abbiamo compreso il significato delle affermazioni (1), (2) e (3) contenute nel Teorema enunciato in precedenza, ci accingiamo, ora, a verificare le uguaglianze sotto il profilo algebrico e assiomatico.

Sia P={x1, …, x10} l'insieme delle osservazioni, ossia i voti ripor-tati dai dieci studenti nella terza prova, relativamente al carattere os-servato, ossia:

!

X voto conseguito nella terza prova, e siano C1={x1, x1} , C2={x1, x2} ,…, C100={x10, x10}

i campioni di ampiezza 2, estratti bernullianamente dalla popolazione e sia U l'universo dei campioni, ossia: U={C1, …, C100} la media del-la popolazione corrisponde, com'è noto, a:

!

µ =x

1+ ...+ x

10

10

mentre la variabile campionaria, corrisponde a:

!

X = x 1,...,x

100{ }

dove ogni elemento, o determinazione numerica, rappresenta la media degli elementi facenti parte del campione, ossia:

Page 14: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

102

!

x 1

=x

1+ x

1

2, ... ,

!

x 50

=x

5+ x

10

2, ... ,

!

x 100

=x

10+ x

10

2

5.1 La media della variabile campionaria: media aritmetica dei cam-pioni, nel caso di campionamento con ripetizione, invece, corrispon-derà a:

!

Media( X ) =x

1+ ...+ x

50+ ...+ x

100

100

dove:

!

=

x1

+ x1

2+ ...+

x5

+ x10

2+ ...+

x10

+ x10

2

100

da cui semplificando:

!

=1

2*

x1

+ x1

+ ...+ x5

+ x10

+ ...+ x10

+ x10

100

e raggruppando, successivamente gli elementi simili, si ottiene:

!

=1

2*

20x1

+ ...+ 20x10

100

Va osservato che ogni unità statistica si presenta 20 volte poiché interviene 10 volte in prima posizione in un campione e 10 volte in seconda posizione nei successivi 90 raggruppamenti.

L'espressione precedente può essere scritta in forma equivalente:

!

=1

2*

2* 10(x1 + ...+ x10 )

100

la cui successiva semplificazione porta all'uguaglianza cercata:

!

=(x1 + ...+ x10 )

10= µ

In generale, per una popolazione di dimensione N e per un cam-pione di ampiezza n, le relazioni precedenti possono essere scritte come di seguito:

Page 15: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

103

!

µ =x

1+ ...+ x

N

N

mentre per la variabile campionaria, si ottiene:

!

X = x 1

,...,x N

n{ }

dove:

!

x 1

=x

1+ ...+ x

1

n,..., x

i=

xi+ ...+ x

k

n,...,x

Nn =

xN

n + ...+ xN

n

n

La media di questa variabile campionaria risulta:

!

Media(X ) =x 1 + ...+ x

Nn

Nn

ossia:

!

=

x1

+ ...+ x1

n+ ...+

xi+ ...+ x

k

n+ ...+

xN

n + ...+ xN

n

n

Nn

Possiamo sintetizzare le somme di ciascuna unità statistica con l'e-spressione:

!

nNn"1

xi in quanto ogni unità sarà presente

!

Nn"1 volte, in

prima posizione, in un raggruppamento e altre

!

Nn"1 volte, in varie po-

sizioni, in ciascuno degli

!

Nn"1 *(N-1) successivi raggruppamenti; poi-

ché l'ampiezza di ciascun raggruppamento è n, ogni valore risulta ap-punto

!

nNn"1 .

Dalla sostituzione, pertanto, si ottiene:

!

=1

n*

nNn -1

x1

+ ...+ nNn -1

xN

Nn

da cui, raccogliendo il fattore comune,

!

=1

n*

nNn -1

(x1 + ...+ xN )

Nn

e semplificando, si ottiene l'uguaglianza da verificare:

!

=x

1+ ...+ x

N

N= µ

Page 16: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

104

ossia:

!

µx

= µ c.v.d.

Rimane verificato, pertanto, come la media della distribuzione (o variabile) campionaria media dei campioni è uguale alla media della popolazione dei dati.

5.2 Verifichiamo ora il Teorema nel caso di campionamento senza ri-petizione. Sia P={x1, …, x10} l'insieme delle osservazioni, ossia i voti riportati dai dieci studenti nella terza prova; siano: C1={x1, x2} , C2={x1, x3} ,…, C45={x9, x10} i campioni di ampiezza 2, estratti in blocco dalla popolazione e sia U l'universo dei campioni, ossia: U={C1, …, C45} , la media della popolazione è:

!

µ =x

1+ ...+ x

10

10

mentre la media della distribuzione campionaria, risulta:

!

Media(X ) =x 1 + ...+ x 45

45

dove:

!

x 1

=x

1+ x

2

2

!

x 45

=x

9+ x

10

2

da cui sostituendo, si ottiene:

!

=

x1

+ x2

2+ ...+

x9

+ x10

2

45

e l'ulteriore semplificazione, porta alle seguenti espressioni:

!

=1

2*

9x1

+ ...+ 9x10

45

!

=1

2*

9(x1 + ...+ x10 )

45

Page 17: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

105

dove ogni unità statistica si presenta 9 volte, in varie posizioni e nei 45 raggruppamenti. Dopo l'ulteriore semplificazione, si ottiene la relazio-ne che si voleva dimostrare:

!

=(x1 + ...+ x10 )

10= µ

Anche in quest'esempio, le relazioni precedenti possono essere ge-neralizzate, come di seguito, nel caso di una popolazione di dimensio-ne N e per un campione di ampiezza n.

La media della popolazione corrisponde a:

!

µ =x

1+ ...+ x

N

N

mentre la variabile distribuzione campionaria risulta:

!

X = x 1,...,x

Nn

"

# $

%

& '

( ) *

+ , -

dove:

!

x N

n

"

# $

%

& ' =

xN -n +1

+ ...+ xN

n

!

x 1

=x

1+ ...+ x

n

n

la media della distribuzione campionaria corrisponde, invece, alla se-guente espressione:

!

Media(X ) =

x 1 + ...+ x Nn

"

# $

%

& '

N

n

"

# $

%

& '

e, quindi, dopo la sostituzione risulta:

!

=

x1

+ ...+ xn

n+ ...+

xN -n +1

+ ...+ xN

n

N

n

"

# $

%

& '

.

Sintetizzando le somme di ciascuna unità con l'espressione:

Page 18: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

106

!

n

N

N

n

"

# $

%

& ' xi

e raccogliendo il fattore comune, si ottiene:

!

1

n*

n

N

N

n

"

# $

%

& ' x1

+ ...+n

N

N

n

"

# $

%

& ' xN

(

) *

+

, -

N

n

"

# $

%

& '

la cui ulteriore elaborazione porta alla seguente espressione:

!

=

1

n*

n

N

N

n

"

# $

%

& ' (x1 + ...+ xN )

N

n

"

# $

%

& '

e la successiva semplificazione verifica l'uguaglianza:

!

=x

1+ ...+ x

N

N= µ

In generale, dunque, anche in questa situazione rimane verificata l'affermazione del Teorema, ossia:

!

µX

= µ c.v.d.

Page 19: Parametri, stimatori e stime, aspetti esplicativi dell ... · algebrici di un noto Teorema dell'Inferenza statistica, per una com-prensione più consapevole della disciplina. Abstract:

107

BIBLIOGRAFIA

[1] www.pianetascuola.it/resonline/Res_carta.

[2] MATEMATICA 2003, Attività didattiche e prove di verifica per un nuovo curricolo di matematica, Ciclo secondario, Liceo Scientifico Statale "A. Vallisneri", Lucca, 2004.

[3] GAMBOTTO MANZONE A., CONSOLINI B., Conoscere e appli-care la matematica, Ed. Tramontana.

[4] DELLISANTI FRANCESCO MARIA, Sintassi e semantica di un linguaggio: il sistema operativo MS-DOS (cap. 7 Analisi delle verifiche), d'Agostino Editore, Barletta, 1991.

[5] DELLISANTI FRANCESCO MARIA, “L'accelerazione gravitazio-nale e la verifica dei dati sperimentali” in Induzioni Demogra-fia, probabilità, statistica, Istituti Editoriali e Poligrafici In-ternazionali, Pisa, n° 28 (2004), 65-74.