Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP...

96
1 ZIP Statistica Matematica Lo ZIP ` e dedicato a San Giuseppe da Copertino (1603-1663) La morte di un uomo ` e una tragedia. Un milione di morti ` e una statistica. (Stalin, 1879-1953) Francesco Bertolino Appunti redatti da Elisabetta Lampis, Paolo Misso e Alessia Pusceddu dalle lezioni del corso di Statistica Matematica Universit` a di Cagliari - Anno accademico 2006/7 CUEC Libraria - Cagliari

Transcript of Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP...

Page 1: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1

ZIPStatistica Matematica

Lo ZIP e dedicato aSan Giuseppe da Copertino(1603-1663)

La morte di un uomo e una tragedia.Un milione di morti e una statistica.

(Stalin, 1879-1953)

Francesco Bertolino

Appunti redatti da Elisabetta Lampis, Paolo Misso e Alessia Pusceddu dalle lezioni

del corso di Statistica Matematica

Universita di Cagliari - Anno accademico 2006/7

CUEC Libraria - Cagliari

Page 2: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1

PremessaB Cos’e lo zip. Indichiamo con zip la compressione dei contenuti del corso di Statistica Matematica(d’ora in avanti “SM”). Esso e disponibile sul sito http://www.statistica12.it.

Data la natura dello zip, lo studio della SM puo risultare faticoso per chi non segue le lezioni(in cui avviene la dezippatura) e le attivita di studio assistito. Agli studenti non frequentanti sisuggerisce di affiancare allo zip un testo consigliato. Per lo meno sino a quando non sara disponibileuna dispensa del corso. L’utilita dello zip non verra meno anche in presenza di tale supporto.

Nello zip sono omesse le dimostrazioni. Alla fine di ogni capitolo sono presentati esempi conpochi commenti. In appendice sono fornite nozioni elementari di analisi, nonche le tavole delle leggidi Gauss, di Student e Chi2 corredate da brevi cenni esplicativi.

B Prerequisiti del corso. Sono in grado di seguire le lezioni del corso di SM gli studenti che hannosuperato (decorosamente) gli esami di Analisi Matematica I e di Geometria (Algebra).

B Scopo del corso. Scopo della SM e lo studio dei metodi matematici necessari per analizzarequantitativamente e per descrivere sinteticamente i fenomeni collettivi. In tal senso la SM non einteressata ne ad una particolare classe di fenomeni, ne a questa o a quella unita statistica appartenenteal collettivo (detto anche popolazione), bensı al collettivo nel suo complesso.

B Contenuti del corso di SM. Il corso di SM si articola in tre sezioni: statistica descrittiva, calcolo

delle probabilita, statistica inferente. Esse coincidono con le fasi stesse dell’analisi statistica.

Compiti della statistica descrittiva sono: definizione/delimitazione di un dato collettivo, acqui-sizione, riordino ed analisi della qualita dei dati, loro descrizione sintetica, mediante indici, grafici,vettori, matrici, etc. Fanno parte della statistica descrittiva le procedure e le tecniche che produconosintesi grafiche e descrittive, riguardanti aspetti salienti delle osservazioni.

Se i dati riguardano non l’intero collettivo bensı un suo sottoinsieme, detto campione, la statisticainferente risponde alla domanda: “alla luce dei dati campionari, cosa possiamo inferire sul collettivoda cui essi provengono?” Rientrano nella statistica inferente, le procedure e le tecniche necessarieper fare congetture (o inferenze) sulla popolazione. Tutte le conclusioni della statistica inferente,dipendendo da osservazioni limitate, hanno il carattere della provvisorieta.

Il calcolo delle probabilita non e che l’irriducibile tramite concettuale che collega il campione allapopolazione di provenienza. Il filo che unisce le tre sezioni, sara chiaro solo alla fine del corso.

B Testi di consultazione.

- P. Baldi (1992), Calcolo delle probabilita e statistica. McGraw-Hill Libri Italia.- G. Cicchitelli (1999), Probabilita e statistica. (II ediz.) Maggioli Editore.- D. M. Cifarelli (1998), Introduzione al calcolo delle probabilita. McGraw-Hill Libri Italia.- D. Piccolo (2004), Statistica per le decisioni. Il Mulino.- F. Ricci (1978), Statistica. Zanichelli Editore.

Il lettore trovera, nella tavola che segue, tre celebri problemi provenienti dalla letteratura latinae italiana, i cui contenuti statistici sono l’oggetto delle tre citate sezioni. Il primo problema e risolto

Page 3: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

2

in modo impreciso, il secondo e solo formulato, il terzo e risolto in modo incompleto.Allo studente e assegnato il compito di fornire le giuste risposte.

Sezione Esempi di problema della sezione

Statistica Descrittiva Sai ched’e la statistica? E na cosa

Che serve pe’ fa’ un conto in generale

De la gente che nasce, che sta male,

Che more, che va in carcere che sposa.

Ma pe’ me la statistica curiosa

E dove c’entra la percentuale,

Pe’ via che, lı, la media e sempre uguale

Puro co’ la persona bisognosa.

Me spiego: da li conti che se fanno

Seconno le statistiche d’adesso

Risurta che se te tocca un pollo all’anno:

E, se nun c’entra ne le spese tue,

T’entra ne la statistica lo stesso

Perche c’e un altro che ne magna due.

Trilussa, La Statistica, Uomini e Bestie

Calcolo delle probabilita Stillicidi casus cavat lapidem,

· · · · · ·Lucrezio, De rerum natura, I, 313

Statistica inferente Quando si parte il giuoco della zara,

Colui che perde si riman dolente,

Repetendo le volte, e tristo impara:

Con l’altro se ne va tutta la gente;

· · · · · ·Dante, Purgatorio, VI, 1-4

Page 4: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

INDICE

1. Caratteri semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.1 Unita statistiche, dati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .5

1.2 Elaborazioni elementari dei dati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8

1.3 Indici e momenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10

1.4 Asimmetria (*) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13

1.5 Concentrazione (*) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .14

1.6 Complementi ed esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17

2. Caratteri multipli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25

2.1 Indici per le variabili doppie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.2 L’interpolazione statistica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

2.3 Analisi degli scarti e leggi particolari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28

2.4 Mutabili doppie e tavole di contingenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.5 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

3. Probabilit a elementare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41

3.1 Eventi, nozioni di logica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

3.2 Assiomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43

3.3 Prime conseguenze degli assiomi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43

3

Page 5: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

4

3.4 Cenni sulla nozione di probabilita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.5 Fenomeni aleatori a valori numerici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45

3.6 Esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

3.7 Complementi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

4. Leggi di probabilit a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51

4.1 Leggi discrete di probabilita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .52

4.2 Funzione di ripartizione e momenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

4.3 Leggi continue di probabilita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.4 Alcune proprieta delle v.a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56

4.5 Trasformazioni di v.a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.6 Grafici ed esempi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .59

5. Operazioni sulle v.a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.1 Somme di v.a.i. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65

5.2 Esempi e grafici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68

5.3 Complementi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70

6. Statistica inferente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .73

6.1 Verosimiglianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74

6.2 Stima puntuale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77

6.3 Stima per intervalli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79

6.4 Esempi e procedure grafiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82

7. Appendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

7.1 Elementi di matematica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .87

7.2 Principali distribuzioni di probabilita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89

7.3 Uso delle tavole statistiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

Page 6: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1CARATTERI SEMPLICI

There are three kinds of lies: lies, damned lies and statistics.(Benjamin Disraeli; Mark Twain - Autobiography)

Nel 1935 lo statistico W. F. Willcox pubblico una lista costituita da ben 134 definizioni di statistica

apparse in letteratura a partire dal 1749. Da allora altre definizioni hanno allungato la lista.Lo zip non definira, dunque, cio che eminenti statistici non sono stati capaci di definire in due

secoli e mezzo, ne si attardera in ulteriori vani tentativi.Lo zip si limita a dire che la statistica si occupa dell’analisi e della sintesi di fenomeni collettivi.

Per tale suo scopo, la statistica elabora specifiche procedure matematiche.

1.1 Unit a statistiche, datiIndichiamo con Ω una popolazione, detta anche universo, un ben definito insieme o collettivo di unita

statistiche (d’ora in avanti “u.s.”) che denotiamo con ω1, ω2, . . . L’universo Ω, e le u.s. ωi possonoessere rappresentati in un diagramma di Venn.

Non e lecito parlare di universo ne di u.s. senza aver chiarito volta per volta lo scopo e l’ambito

dell’indagine statistica. Ad esempio, se l’ambito dell’analisi e la Sardegna, e lo scopo dell’analisiriguarda il diabete giovanile, l’universo e dato dai sardi con meno di 25 anni e l’u.s. e il giovanesardo. Se l’indagine riguarda i consumi domestici di elettricita, Ω e l’insieme delle famiglie domiciliatein Sardegna e l’u.s. e la famiglia (e non gli individui che ne fanno parte). Se lo scopo della ricercae la nuzialita, Ω e dato dalle coppie di sposi sardi e l’u.s. e la coppia di sposi. Segue dunque ladefinizione.

5

Page 7: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

6 Capitolo 1 Caratteri semplici

Definizione 1.1. L’oggetto dell’osservazione del fenomeno elementare (o irriducibile) costituente ilfenomeno collettivo prende il nome di unita statistica. L’u.s., definita volta per volta dall’indagine, ecostituita da un numero fisso o variabile di oggetti e/o individui.

Se gli scopi dell’analisi non sono ben precisati ed e arduo o impossibile definire univocamenteuniverso e u.s., e opportuno riformulare il problema o rinunciare all’analisi.

Il numero di u.s. in Ω puo essere noto oppure indefinito. L’insieme dei 630 deputati eletti alParlamento e un esempio di popolazione costituita da un numero noto di u.s.

Esempi di popolazioni costituite da un numero indefinito di u.s.: il numero di pazienti visitatigiornalmente da un certo medico, la carica bacterica presente in un certo tino. (Per quanto possaapparire strano, in questi due esempi e teoricamente opportuno considerare il numero delle u.s. comeun numero superiormente illimitato e “far coincidere” indefinito con infinito.)

In base agli scopi dell’indagine statistica, Ω puo essere suddiviso in strati che possono esserestudiati separatamente.

Una volta definito l’universo Ω e le u.s., l’analisi deve precisare cio che di esse interessa. Quasimai chi conduce l’indagine e interessato alle u.s. ωi “in quanto tali”, quanto piuttosto a loro aspetti ocaratteristiche. Se l’indagine riguarda la corporatura degli Italiani maschi all’eta della leva, i caratteridi interesse sono l’altezza, il peso, la circonferenza toracica, etc. di ciascuna recluta; se l’indagineriguarda la nuzialita in una certa comunita, i caratteri che interessano sono: la nazionalita, lareligione, l’eta, le condizioni sociali degli sposi al momento del matrimonio, etc. Se l’indagine ha peroggetto i consumi delle famiglie, i caratteri da considerare sono: il numero componenti la famiglia,il reddito familiare, il costo dell’energia e dell’istruzione, il livello dei prezzi alimentari, etc.

I caratteri si distinguono in variabili e mutabili. Variabile, o dato quantitativo, se il carattere, siesprime mediante una quantita ordinabile e dotata di dimensione fisica. Mutabile, o dato qualitativo,o categoria, se il carattere e un attributo non quantitativo.

B Variabili. Una variabile puo essere intera o “reale”. Variabile intera e il numero degli alunni inuna classe, il numero di componenti il nucleo familiare, il numero di incidenti in edilizia nella provinciadi Cagliari. Variabile “reale” e l’eta, il peso, il reddito, il consumo di elettricita, la proporzione di“si” in un referendum, la densita di popolazione, la temperatura e l’altezza di pioggia rilevata in unastazione meteorologica, etc.

Una variabile puo dunque essere un numero puro oppure una grandezza dimensionale espressa inuna conveniente unita di misura.

Si dice sommabile una variabile per la quale abbia senso la somma dei dati x1, x2, . . . , xn. Sonosommabili la statura, l’eta, il reddito, la massa corporea, etc. Non sommabile e il tasso di interesse,la proporzione di “si” in un referendum, il rendimento di un motore, etc.

Si dice trasferibile un carattere sommabile che sia (in tutto o in parte) cedibile da una u.s. adun’altra, almeno virtualmente. Trasferibile e il reddito, il consumo di energia, le azioni di una banca,la popolazione comunale, etc. Variabile sommabile non trasferibile e l’eta, il quoziente intellettuale,la statura, il voto conseguito nell’esame di SM, etc.

B Mutabili. Una mutabile puo essere ordinabile oppure non ordinabile (o sconnessa). E ordinabile iltitolo di studio, il giudizio in un esame, il grado gerarchico nell’Esercito. E non ordinabile il sesso, la

Page 8: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1.1 Unita statistiche, dati 7

nazionalita, la fede religiosa, il colore degli occhi, etc. In ciascuna delle u.s. considerate la mutabilesi presenta con una (ed una sola) modalita. Rinominare le modalita di una mutabile con numeriinteri, pratica che va sotto il nome di codifica, non altera la natura del carattere.

Una volta definiti i caratteri di interesse, ovvero la loro natura, e d’obbligo possedere un benpreciso protocollo di misura dei caratteri. Protocollo qui inteso come funzione, diciamo x = x(ω),che a ogni ω ∈ Ω fa corrispondere l’osservazione x ∈ X , dove X indica l’insieme dei valori o dellemodalita che x puo assumere.

L’indagine statistica puo riguardare tutte le u.s. di Ω o solo una parte di esse sorteggiate con unqualche criterio di casualita. Nel primo caso si parla di indagine esaustiva nel secondo di indaginecampionaria. Decidere se procedere esaustivamente oppure a campione e solo questione di conve-nienza. Il ricorso al campionamento e conveniente, quando non eludibile, se (i) la popolazione ecostituita da un numero immenso di u.s., ed e impensabile ed inutile condurre indagini esaustive ese (ii) pur in presenza di popolazioni limitate, le prove sono lunghe e/o costose e/o distruttive.

Grazie al protocollo di misura e ad un criterio di indagine si puo parlare di dati. Si da la definizione

Definizione 1.2. Si definisce campione la n−pla di valori x = (x1, x2, . . . , xn) rilevati sulle n u.s.(ω1, ω2, . . . , ωn) sorteggiate da Ω. Il numero n va sotto il nome di numerosita (o taglia) campionaria.L’ordine delle osservazioni e casuale.

Esulano dagli scopi del corso di SM le tecniche di campionamento. Lo zip tralascera dunque lefasi dell’ideazione, distribuzione, restituzione e spoglio dei questionari, etc. E sempre supporra chel’indagine sia condotta secondo le regole. In breve: sono gli scopi della ricerca, il tipo di universoe le risorse di chi conduce l’analisi a decidere il piano di campionamento (casuale semplice, a due opiu stadi, stratificato, etc.), e con esso il numero delle u.s. da campionare, cioe la taglia campionaria.Questa non e che il compromesso fra risorse disponibili ed esigenze di conoscenza di Ω.

Il concetto di universo o popolazione puo essere utilmente “esteso”. Nel caso di n ripetute mi-surazioni fisiche (x1, x2, . . . , xn) di uno stesso oggetto (e/o di un fenomeno opportunamente ripetuto),si puo immaginare l’esistenza di un universo virtuale Ω le cui u.s. sono costituite da tutte le possibilimisurazioni dell’oggetto stesso. Tale escamotage consente di trattare le misure ripetute alla streguadi ogni altro tipo di osservazioni.

Se la popolazione Ω e molto ridotta puo essere utile, in certi casi, assimilare l’insieme delle sueu.s. ad un campione proveniente da un’ampia popolazione virtuale detta superpopolazione. A taleconcetto si fa largo ricorso in statistica inferenziale. Ad esempio, nel caso di malattie genetiche rareche colpiscono poche decine di persone al mondo, la superpopolazione, e virtualmente costituita oltreche dai malati osservati anche dai malati presenti, passati e futuri, non osservati e/o di cui non si hanotizia.

L’ultima fase dell’indagine statistica, la piu complessa, ma anche la piu redditizia, e l’analisistatistica, a cui e affidato il compito di estrarre dai dati le informazioni in essi contenuti in modo(spesso) nascosto e confuso. A tale fase e dedicato il corso di SM.

Page 9: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

8 Capitolo 1 Caratteri semplici

1.2 Elaborazioni elementari dei datiUna volta raccolti, i dati devono essere ordinati e rappresentati. Se il carattere in studio e unavariabile, i dati x = (x1, x2, . . . , xn) sono ordinabili su una retta. Si danno le definizioni.

Definizione 1.3. Si definisce campione n−ordinato, e si scrive (x(1), x(2), . . . , x(n)), la successionedelle osservazioni x riordinate in senso crescente.

Definizione 1.4. Si definisce range (o campo di variazione) delle osservazioni x la quantita nonnegativa range = maxx1, x2, . . . , xn −minx1, x2, . . . , xn = x(n) − x(1).

Quale che sia la natura delle osservazioni, puo essere comodo, quanto piu n e grande, accorparlein sottogruppi o classi o coorti, in base a qualche criterio di buon senso. La scelta delle classi non ene univoca ne esente da soggettivita, specie nel caso di variabili reali.

Definizione 1.5. Si definisce partizione di X una qualsiasi collezione finita di classi Aj , j =1, 2, . . . , k, tale che: (i) ∪k

j=1Aj = X , (ii) Aj ∩ Ah = Ø, ∀j 6= h.

Se x e un carattere continuo, possiamo partizionare X in classi della forma Aj = [ξj−1, ξj),j = 1, 2, . . . , k. La scelta delle delimitazioni ξ0, ξ1, . . . , ξk non e univoca e risponde solo a criteridi comodita e buon senso. Se xi ∈ X = R+

0 e l’energia elettrica (in kWh) consumata dall’utenteωi ∈ Ω, e si assume la partizione: A1 = [0, 50), A2 = [50, 100), A3 = [100, 200), A4 = [200, 500),A5 = [500,+∞), e evidente che xi appartiene ad una ed una sola delle classi Aj .

Se x e una discreta la procedura varia di poco. Se l’u.s. e il nucleo familiare e il carattere x eil numero dei suoi componenti, e dunque xi ∈ X = 1, 2, . . . = N, si puo assumere una partizionedel tipo (A1, . . . ,Aj , . . . ,Ak), dove Aj = j, ∀j = 1, . . . k − 1, e Ak = k, k + 1, . . . . (L’ISTATassume k = 8.) Poche cautele in piu se x e una mutabile. Ad esempio, se x e lo stato civile, ogniosservazione xi assume una (ed una sola) delle 5 modalita: A1 = celibe/nubile, A2 = sposato/a,A3 = separato/a, A4 = vedovo/a, A5 = divorziato/a.

Le definizioni che seguono sono valide qualunque sia il carattere x.

Definizione 1.6. Data l’osservazione x e l’evento A, si definisce indicatore dell’evento A la funzioney = 1A(x), che assume il valore y = 1 se x ∈ A ed y = 0 se x 6∈ A.

Definizione 1.7. Il carattere x e detto dicotomico se esso si articola in due sole classi A, A. Perconvenzione, diciamo che x costituisce un successo [insuccesso] se x ∈ A [x ∈ A].

Esempi di tali caratteri: maschio/femmina, +/−, presente/assente, minorenne/maggiorenne, etc.I dati y = y1, y2, . . . , yn ottenuti da x mediante la funzione indicatrice y = 1A(x) sono dicotomici.La somma n1 =

∑ni=1 yi, che conta gli “1” (i successi) in y, coincide con la frequenza di A in x. La

differenza n0 = n− n1, il numero di “0” (gli insuccessi) in y, e la frequenza di A in x.Quale che sia la natura del carattere x (mutabile o variabile continua o discreta), una volta fissate

le k classi Aj i dati possono essere disposti nella forma accorpata

D =A1, . . . ,Aj , . . . ,Ak

n1, . . . , nj , . . . , nk

, (1.1)

Page 10: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1.2 Elaborazioni elementari dei dati 9

dove nj ≥ 0 e il numero di u.s. che presentano la modalita Aj , ossia la frequenza con cui la classe (ola modalita) Aj ricorre in x. Si ha facilmente nj =

∑ni=1 1Aj

(xi), con∑k

j=1 nj = n.

Se x e una variabile intera, se n e grande e se gli xi distinti sono k < n o k ¿ n, puo esserecomodo porre Aj = ξj e mettere i dati nella forma accorpata

D =

ξ1, . . . , ξj , . . . , ξk

n1, . . . , nj , . . . , nk

, (1.2)

dove le ξj , disposte in ordine di grandezza, sono i k valori distinti di frequenza nj > 0.

Definizione 1.8. Si definisce frequenza relativa, o proporzione, della classe Aj il rapporto pj =nj

n.

Se la variabile e discreta, i dati D possono essere rappresentati mediante un istogramma a barrecui e associata la funzione h(x) =

∑kj=1 nj1j(x).

Con le variabili continue accorpate si puo pensare di “spalmare” uniformemente in Aj le nj

osservazioni che vi cadono. Per costruzione ogni x ∈ Aj viene dotato di densita assoluta dj =nj

ξj − ξj−1e relativa δj =

dj

n, con

∑kj=1(ξj − ξj−1) dj = n e

∑kj=1(ξj − ξj−1) δj = 1. I dati D sono

rappresentabili in un istogramma a rettangoli di equazione h(x) =∑k

j=1 dj1Aj (x).

Si osservi che se ξ0 = −∞ e/o ξk = +∞, come nell’esempio, d1 e/o dk risultano nulle. Un modo“pratico” per superare tale inconveniente e di porre ξ0 = x(1) e/o ξk = x(n).

Definizione 1.9. Se il carattere e una variabile, si definisce funzione cumulata delle frequenze assolute,o semplicemente cumulata, e si indica con H(x), l’integrale generalizzato della h(x).

Se la variabile e discreta, la cumulata e la funzione a gradini H(x) =∑k

j=1 nj1[j,+∞)(x), see continua, la cumulata e la spezzata H(x) =

∫ x

−∞ h(t) dt. In entrambi i casi, essendo h(x) unafunzione non negativa, la cumulata H(x) e monotona non decrescente. Alla H(x), che indica comele osservazioni si distribuiscono sulla retta, si da il nome di funzione di distribuzione. (Qualche voltatale termine e attribuito ai dati D).

Per i dati esistono altre numerose sintesi grafiche non trattate nello zip, quali, gli istogrammi a

barre, gli istogrammi a rettangoli, i cartogrammi, gli aerogrammi, le torte, etc.

Nel caso delle mutabili e delle variabili intere, torna utile l’indice di posizione

Definizione 1.10. Si definisce moda la modalita piu frequente in x (o in D): m0 = arg supn1, . . . ,

nj , . . . , nk.

Non sempre la moda e unica. Meno semplice (e non univoca) e la definizione di moda perle variabili intere accorpate in classi che contengono piu di una modalita e, naturalmente per levariabili reali. Per queste ultime una formula e m0 = 1

2 (ξj0−1 + ξj0), dove l’indice j0 individua laclasse a maggiore densita.

La distribuzione D e gli istogrammi sono un’utile ma insufficiente sintesi delle osservazioni. Nelprossimo paragrafo si introdurranno gli indici e i momenti semplici.

Page 11: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

10 Capitolo 1 Caratteri semplici

1.3 Indici e momentiGli indici sono gli “oggetti numerici” di cui si serve la statistica per descrivere in sintesi i dati. Taleesigenza non ammette risposta (o soluzione) univoca e dipende dagli scopi dell’analisi.

Gli indici a cui si richiedono (essenzialmente) proprieta di buon senso, sono classificati secondola loro forma e il loro uso. Abbiamo cosı gli indici di posizione, di variabilita (o dispersione), diconcentrazione, di scala, di forma, etc. Lo zip non fara la disamina di tale elenco. Indici di posizione

sono le medie.

B Medie. Si da il nome generico di media ad ogni indice chiamato a rappresentare i dati. Buonsenso esige che la media m goda della proprieta dell’internalita, ovvero che condivida con i dati stessoordine di grandezza e stessa dimensione fisica. Dunque: x(1) ≤ m ≤ x(n), valendo il segno di ugualesolo simultaneamente.

Per la comprensione del concetto di valore medio torna utile la seguente definizione generale dimedia, di cui media aritmetica, armonica e geometrica non sono che casi particolari.

Definizione 1.11. (Oscar Chisini, 1929.) Si dice che m e la media di n osservazioni x in un problemain cui interessa una loro funzione ϕ(x1, x2, . . . , xn) se essa assume lo stesso valore quando al postodelle xi si pone m: ϕ(x1, x2, . . . , xn) = ϕ(m,m, . . . , m).

Si osservi che tale definizione stabilisce un nesso formale tra il concetto di media ed il problemache si deve risolvere. Tutti gli indici che seguono si riferiscono ad una n−pla di osservazioni x.

Definizione 1.12. Si definisce media aritmetica o semplicemente media delle osservazioni x, quandocio non da luogo a confusioni, l’indice

m = x =x1 + x2 + · · ·+ xn

n=

1n

n∑

i=1

xi .

Da notare che se i dati y = (y1, y2, . . . , yn) sono dicotomici, cioe yi = 0, 1, la media aritmeticay coincide con la proporzione di successo pn.

Definizione 1.13. Posto che xi > 0 ∀i, si definiscono media armonica e media geometrica gli indici

ma =n

1x1

+1x2

+ · · ·+ 1xn

=n

∑ni=1

1xi

, mg = n√

x1, ·x2 · · · · · xn = n∏

i=1

xi

1n

.

E facile verificare che1

ma=

1n

n∑

i=1

1xi

, e che log mg =1n

n∑

i=1

log xi. Vale il teorema

Teorema 1.1. Per ogni n−pla di osservazioni positive x si ha ma ≤ mg ≤ m. Il segno di ugualevale simultaneamente se e solo se x1 = x2 = · · · = xn.

Definizione 1.14. Si definisce scarto o scostamento di xi rispetto a un centro t, la quantita presa insegno εi(t) = xi − t, si definisce scarto baricentrico o scarto rispetto alla media (scarto e basta quandonon vi e confusione), la quantita presa in segno εi = xi − x.

Page 12: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1.3 Indici e momenti 11

La media gode dell’importante proprieta

Teorema 1.2. Per ogni n−pla di osservazioni x la funzione SG(t) =∑n

i=1(xi − t)2 di t ha puntodi minimo unico in x con minimo Dev = SG(x) =

∑ni=1(xi − x)2, noto col nome di devianza.

Definizione 1.15. Si definiscono varianza e varianza corretta gli indici

V ar = s2 =Dev

n=

1n

n∑

i=1

(xi − x)2 , V arc = s2c =

1n− 1

n∑

i=1

(xi − x)2 =n

n− 1V ar .

Definizione 1.16. Si definiscono scarto quadratico medio (s.q.m.), o standard deviation (s.d.) e s.q.m.corretto, o s.d. corretta gli indici

sqm =√

s2 = s =

√√√√ 1n

n∑

i=1

(xi − x)2 , sqmc =√

s2c = sc =

√√√√ 1n− 1

n∑

i=1

(xi − x)2 .

Devianza, varianza e s.q.m. sono indici di variabilita. La varianza e lo e s.q.m. sono anche unamisure di variabilita. E facile vedere che ∀n V ar < V arc, e che per n grande V ar ∼= V arc.

E facile mostrare che la varianza dei dati dicotomici y = (y1, y2, . . . , yn), aventi frequenza relativadi successo pn, e data da V ar = pn(1− pn).

Definizione 1.17. Si definiscono momento rispetto all’origine (o non centrato) di ordine k (o k−esimo)e momento k−esimo rispetto a t, con k ∈ N, gli indici

m′k =

xk1 + xk

2 + · · ·+ xkn

n=

1n

n∑

i=1

xki , mk(t) =

1n

n∑

i=1

εi(t)k =1n

n∑

i=1

(xi − t)k .

Definizione 1.18. Si definisce momento k−esimo rispetto alla media x (o centrato, o baricentrico)l’indice

mk =1n

n∑

i=1

εki =

1n

n∑

i=1

(xi − x)k .

La varianza s2, media dei quadrati degli scarti, coincide con il momento secondo centrato m2. Siosservi che mk(0) = m′

k, che mk(x) = mk e che il momento m′1 coincide con la media, etc.

Definizione 1.19. Si definiscono momento assoluto k−esimo non centrato e centrato gli indici

d′k =1n

n∑

i=1

|xi|k , dk =1n

n∑

i=1

|xi − x|k .

Ovviamente momenti e momenti assoluti coincidono quando le osservazioni sono non negative.

Definizione 1.20. Si definisce media k−esima (o di ordine k) l’indice

r′k = k

√√√√ 1n

n∑

i=1

xki .

Page 13: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

12 Capitolo 1 Caratteri semplici

Analoga e la definizione di media k−esima centrata (o baricentrica di ordine k). Vale il teorema.

Teorema 1.3. Per ogni n−pla di osservazioni x la relativa successione delle medie k−esime r′k, k ∈N, gode delle seguenti proprieta: (i) r′1 ≤ r′2 ≤ · · · ≤ r′k ≤ . . . , valendo simultaneamente il segnodi eguale se e solo se x1 = x2 = · · · = xn; (ii) limk→∞ r′k = x(n), limk→0 r′k = mg.

B Geometria delle masse. Tra geometria delle masse e statistica vi sono profonde analogie formali:proprieta valide in un contesto possono essere utilmente trasferite nell’altro. E facile vedere che (i)il baricentro di un sistema di n masse puntuali di massa 1

n concentrate nelle xi si trova in x; (ii) imomenti di inerzia calcolati rispetto all’origine e al baricentro coincidono con m′

2 e m2. CValgono le importanti proprieta.

Teorema 1.4. (Christiaan Huygens, 1655.) V ar = m′2 − x2.

Corollario 1.1. Per ogni n−pla di osservazioni x e nulla la somma degli scarti∑n

i=1(xi − x) = 0.

Corollario 1.2. m2(t0) =1n

n∑

i=1

(xi − t0)2 =1n

n∑

i=1

(xi − x)2 + (t0 − x)2 = V ar + (t0 − x)2.

Corollario 1.3. m3 = m′3 − 3 m′

2m + 2 m3 , m4 = m′4 − 4 m′

3m + 6 m′2m

2 − 3 m4 , etc.

In numerosi casi e utile conoscere il valore che, sull’asse delle x, segue la prima meta delleosservazioni e precede la seconda meta. O, equivalentemente, il valore prima del quale e dopo ilquale si colloca un egual numero di osservazioni. Formalmente

Definizione 1.21. Si dice mediana, o punto mediano, delle osservazioni x, il punto di minimo dellafunzione SL(t) =

∑ni=1 |xi − t|. Equivalentemente, si dice mediana il punto me soluzione del sistema

di disuguaglianze H(m−e ) ≤ 1

2n ≤ H(m+e ).

Con riferimento al campione n−ordinato (x(1), x(2), . . . , x(n)), si dimostra che se n e dispari lamediana e me = x( n+1

2 ). Viceversa, se n e pari la SL(t) e minima ∀t ∈ [x( n2 ), x( n

2 +1)]. In talesituazione solitamente si assume me = 1

2 (x( n2 ) + x( n

2 +1)).Allo stesso modo si definiscono gli indici di posizione quartili, i decili e i percentili (detti tutti

quantili). In certo senso, il primo [terzo] quartile e la mediana della prima [seconda] meta delleosservazioni. Formalmente

Definizione 1.22. Si definisce primo [terzo] quartile delle osservazioni x, il punto q1 [q3] soluzionedel sistema di disuguaglianze H(q−1 ) ≤ 1

4n ≤ H(q+1 ) [H(q−3 ) ≤ 3

4n ≤ H(q+3 )]. Il secondo quartile

coincide con la mediana. Si definiscono: interquartili le ampiezze δ1 = me − q1 e δ2 = q3 −me, range

interquartile l’ampiezza δ12 = δ1 + δ3 = q3 − q1.

Si osservi che il secondo quartile coincide con la mediana e che mentre i quartili sono indici diposizione, gli interquartili e il range interquartile sono indici di variabilita. Nel caso di osservazioninon negative torna utile l’indice di variabilita che segue.

Definizione 1.23. Data n−pla di osservazioni x, con xi ≥ 0, ∀i, con∑n

i=1 xi > 0, si definiscecoefficiente di variazione (di K. Pearson) il rapporto qV =

s

x.

Page 14: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1.4 Asimmetria (*) 13

Il coefficiente di variazione e un indice adimensionale che esprime la variabilita relativa del ca-rattere x in relazione all’intensita media del carattere nel collettivo. Essendo limitato (e faciledimostrare che 0 ≤ qV ≤ √

n− 1), qV e un indice di variabilita relativa.Tale indice, risulta prezioso quando si debbono mettere a confronto situazioni e/o popolazioni

differenti. Ad esempio, quando si deve paragonare la precisione (relativa) di strumenti di misuraeterogenei (la bilancia del farmacista con la bilancia dell’ortolano). O anche per stabilire confrontifra differenti specie di viventi (la variabilita relativa del peso dei pulcini e dei vitelli), etc.

Si supponga ora che i dati siano interi e che si trovino nella forma (1.2). Ricordando la proprietaassociativa della somma e del prodotto, si giunge alle espressioni delle medie aritmetica, armonica egeometrica ponderate

x =1n

k∑

j=1

ξjnj =k∑

j=1

ξjpj , ma =n

∑kj=1

nj

ξj

=1

∑kj=1

pj

ξj

, mg = k∏

j=1

ξnj

j

1n

=k∏

j=1

ξpj

j ,

le ultime due valide solo se il carattere e positivo. In modo simile si perviene agli altri indici ponderati.Nel caso considerato, usare i dati semplici o i dati accorpati e indifferente. Lo stesso non puo dirsise le osservazioni intere sono radunate in classi Aj costituite da piu valori.

Passando poi al caso continuo, se i dati x si presentano accorpati come nella (1.1), dove oraAj = [ξj−1, ξj), j = 1, 2, . . . , k, le medie aritmetica, armonica e geometrica ponderate risultano

x =1n

k∑

j=1

ζjnj =k∑

j=1

ζjpj , ma =n

∑kj=1

nj

ζj

=1

∑kj=1

pj

ζj

, mg = k∏

j=1

ζnj

j

1n

=k∏

j=1

ζpj

j ,

avendo indicato con ζj = 12 (ξj−1 + ξj) e il centro di classe. E cosı via per gli altri indici.

Gli indici calcolati usando osservazioni semplici differiscono dagli indici calcolati usando le (stesse)osservazioni accorpate. Le differenze tendono a ridursi quanto piu le classi sono ristrette.

1.4 Asimmetria (*)Gli indici di asimmetria sono indici di forma. I dati x sono simmetrici rispetto alla media se

ε(i) = −ε(n−i+1) ⇔ x(i) + x(n−i+1) = 2 x , ∀i = 1, 2, . . . , n ,

con ε(i) = x(i) − x. Dire che vi e asimmetria allorche tali condizioni non si verificano non e grancheutile. Ben piu utile risulta una “misura” del grado di asimmetria delle osservazioni. Un aiuto civiene dalla constatazione che, in caso di simmetria, tutti i momenti centrati di ordine dispari sononulli. Un indice adimensionale (standardizzato) di asimmetria, dovuto a R. A. Fisher, e

γ1 =m3

s3.

Page 15: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

14 Capitolo 1 Caratteri semplici

Poiche s3 > 0, il segno di γ1 e dato da m3. Si ha asimmetria negativa o positiva a seconda che gliscarti negativi prevalgono sui positivi o viceversa. Ovvero, a seconda che m3 < 0 o m3 > 0.

Dalla disuguaglianza facilmente verificabile

n∑

i=1

|ε(i) + ε(n−i+1)| ≤n∑

i=1

|ε(i)|+n∑

i=1

|ε(n−i+1)| = 2n∑

i=1

|ε(i)| ,

segue che per ogni n−pla di osservazioni l’indice adimensionale (dovuto a C. E. Bonferroni)

α =∑n

i=1 |ε(i) + ε(n−i+1)|2

∑ni=1 |ε(i)|

,

risulta compreso in [0, 1). Se le osservazioni sono simmetriche α = 0. Quanto piu le osservazionisono asimmetriche, tanto piu α si avvicina ad 1. Per il calcolo di α vedasi il paragrafo 1.6.B Nota. E facile dimostrare che, se i dati sono unimodali e simmetrici, media, moda e medianacoincidono ed inoltre δ1 = δ2. Per mostrare che non vale il viceversa, e sufficiente considerare leosservazioni asimmetriche (2, 8, 10, 10, 10, 15, 15), in cui x = me = m0 = 10.Gli indici di asimmetria, che sono indici di forma, non sono esenti da difetti. In caso di asimmetria“moderata” puo accadere che l’indice sia nullo. Esempio: con i dati (1, 5, 9, 10), (10, 10, 17, 18), incui e x = 10, si ha m3 = 0 e dunque γ1 = 0. C

1.5 Concentrazione (*)Siano x = x1, x2, . . . , xn osservazioni provenienti da n u.s. relative ad un certo carattere

trasferibile x. Siano x, V ar e T =∑n

i=1 xi = n x la media, la varianza e l’ammontare del carattere.

Con riferimento ai dati n−ordinati x(1), x(2), . . . , x(n), sia

Th =∑h

i=1 x(i), h = 1, 2, . . . , n

, lasuccessione degli ammontari parziali del carattere. Ovviamente Tn = T .

Il carattere e equi distribuito tra le n u.s. se ognuna di esse possiede 1n di T , cioe x(1) = x(2) = . . .

= x(n) = x. Si ha la massima concentrazione in x, se vi e una u.s. che possiede tutto l’ammontare T

con le altre n− 1 che non possiedono nulla. Cioe x(1) = · · · = x(n−1) = 0 e x(n) = T .Dire che vi e concentrazione solo perche in x vi sono osservazioni di differente valore, non e molto

utile. Piu utile e fornire una misura del grado di concentrazione dell’ammontare T .B Nota. Il ricorso ad indici quali il range, la varianza, lo s.q.m., etc. per misurare la variabilitadel carattere x non sempre e soddisfacente: tali indici, infatti, risentono dell’unita di misura e nonsono influenzati da traslazioni di scala. Sia xi, ad esempio, il reddito dell’i−esimo contribuente, siaνi =

xi

Tla proporzione di ammontare in suo possesso. Se ogni reddito e incrementato di una quota

c > 0, da xi si passa a x′i = xi + c e da T a T ′ = T + n c. Ma mentre la varianza ed il range non

si modificano, la proporzione νi diventa ν′i =x′iT ′

e il coefficiente di variazione si abbassa passando

da qV =s

xa q′V =

s

x + c. (Se poi c e grande ν′i ∼= 1

n e q′V ∼= 0.) Tali indici sono dunque capaci di

evidenziare la piu bilanciata (ed equa) ripartizione dell’ammontare tra le n u.s. CPer costruire un indice di variabilita che non si riferisca ad un centro, quale la media o la mediana

o altro, si puo pensare di farvi entrare solo le differenze assolute |xi − xj |, ∀i, j. Dopo aver notato

Page 16: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1.5 Concentrazione (*) 15

che le differenze non nulle distinte sono 12n(n − 1), essendo |xi − xj | = |xj − xi|, e posto

∑i>j =∑n

i=2

∑i−1j=1, si da la definizione.

Definizione 1.24. Data la n−pla di osservazioni trasferibili x, si definisce differenza semplice media

la quantita

∆ =1

n(n− 1)

n∑

i=1

n∑

j=1

|xi − xj | =2

n(n− 1)

i>j

|xi − xj | =2

n(n− 1)

i>j

(x(i) − x(j)

). (1.3)

La (1.3) puo essere data nella piu comoda forma

∆ =4

n(n− 1)

n∑

i=1

i(x(i) − x

)=

4n(n− 1)

n∑

i=1

i x(i) − 2n + 1n− 1

· x , (1.4)

la quale mostra che l’indipendenza di ∆ da un centro, nel nostro caso dalla media x, e piu formaleche sostanziale.

Definizione 1.25. Si definisce differenza quadratica media l’indice 2∆ =√

∆ .

Il fatto che, in caso di equidistribuzione del carattere, la differenza semplice media sia minima,con minimo ∆min = 0, e che sia massima con ∆max = 2 x, in caso di concentrazione massima,suggerisce l’idea di un indice normalizzato.

Definizione 1.26. Si definisce differenza media relativa di Gini il rapporto g =∆2 x

.

Nel caso di dati interi, accorpati come nella (1.2), al posto delle (1.3) e (1.4), si puo scrivere

∆ =2

n(n− 1)

i>j

(ξi − ξj)ninj =4

n(n− 1)

n∑

i=1

i (ξi − x)ni =4

n(n− 1)

n∑

i=1

i ξini − 2n + 1n− 1

· x .

Facili adattamenti della formula si rendono necessari nel caso di dati reali accorpati.

Misurare il grado di concentrazione di un dato carattere equivale, in certo modo, a “confrontare”la sua distribuzione tra le u.s. con la situazione (ideale) di equidistribuzione. Ovvero tra la frazione

di ammontare posseduto dalle h u.s. piu “povere”, dato da qh =Th

T, con la frazione di T che le

stesse h u.s. dovrebbero possedere in caso di equa ripartizione, cioe ph =h

n.

Tutto cio porta a considerare la successione dei punti (ph, qh), h = 0, 1, . . . , n, in cui pn = qn = 1e dove si pone, per convenzione, p0 = q0 = 0.

E facile mostrare che: (i) le successioni dei ph e dei qh sono crescenti con h; (ii) ∀h, qh ≤ ph,ovvero ph− qh ≥ 0, valendo il segno di uguaglianza solo in caso di equidistribuzione; (iii) la spezzatache unisce i punti (qh, ph), detta curva di concentrazione di Lorenz, e convessa. Grazie a tali proprieta,i punti (ph, qh) possono essere rappresentati nel quadrato unitario (1× 1).

Per la costruzione dell’indice di concentrazione si seguono due approcci; il primo, geometrico,dovuto a M. O. Lorenz (1905), il secondo, analitico, dovuto a C. Gini (1914).B Approccio geometrico.

Per costruzione, la curva di concentrazione di Lorenz si colloca al di sopra dell’asse delle ascisse eal di sotto della diagonale, curva (a) in figura 1.1. In caso di equiripartizione dell’ammontare T

Page 17: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

16 Capitolo 1 Caratteri semplici

0.2 0.4 0.6 0.8 1

0.2

0.4

0.6

0.8

1

HpiL

HqiL

HaLA

0.2 0.4 0.6 0.8 1

0.2

0.4

0.6

0.8

1

HpiL

HqiLHbL HcL

Amax

Figura 1.1. - Curve di Lorenz (a), (b), (c).

tra le n u.s. statistiche, curva (b), i punti (qh, ph) cadono sulla diagonale del quadrato. In caso diconcentrazione massima i punti stanno tutti, salvo l’ultimo, sull’asse delle ascisse, curva (c).

L’area A che misura la superficie compresa tra la curva di Lorenz e la diagonale e detta area di

concentrazione. Si ha A = 12− (somma dei trapezi) = 1

2 − 12 n

∑n−1h=0(qh + qh+1) = 1

2n−1

n − 1n

∑n−1h=1 qh.

In caso di equidistribuzione, si ha Amin = 0, in caso di concentrazione massima, Amax = 12

n−1n . Si

noti che Amax e l’area del triangolo di vertici (0, 0), (1, 1) e(

n−1n , 0

). Vedi ancora figura 1.1.

Definizione 1.27. Si definisce area di concentrazione normalizzata di Lorenz il rapporto

Anor =A

Amax= 1− 2

n− 1

n−1∑

h=1

qh . (1.5)

In caso di dati interi accorpati come nella (1.2), la curva di Lorenz risulta individuata dai punti(ph, qh), h = 0, 1, . . . , k, con ph = 1

n

∑hj=1 nj , qh = 1

T

∑hj=1 ξjnj e con p0 = q0 = 0, per conven-

zione. La (1.5) diviene percio Anor = 1− 2n−1

∑k−1h=1 qhnh. In caso di dati reali accorpati, tale formula

subisce facili adattamenti. (Varianti alla formula sono previste quando n e grande e Amax∼= 1

2 .)

B Approccio analitico.

Poiche le differenze ph − qh sono tanto piu grandi quanto piu il carattere x si concentra in “pochemani”, una intuitiva misura della concentrazione puo basarsi sulla somma G =

∑n−1h=1(ph − qh)

≥ 0. In caso di equidistribuzione si ha Gmin = 0. In caso di concentrazione massima, in cui eq1 = · · · = qn−1 = 0 e qn = 1, si ha Gmax =

∑n−1h=1 pj = 1

n

∑n−1h=1 j = 1

2 (n− 1). Gini propose dunquel’indice (o rapporto) di concentrazione

rC =G

Gmax=

∑n−1h=1(ph − qh)∑n−1

h=1 pj

= 1−∑n−1

h=1 qh∑n−1h=1 pj

.

L’indice rC puo essere dato nelle forme piu comode

rC = 1− 2n− 1

n−1∑

h=1

qh = 1− 2(n− 1)T

n−1∑

h=1

Th =∆

2 · x .

Page 18: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1.6 Complementi ed esempi 17

Dunque: la differenza media relativa di Gini, g, l’area di concentrazione normalizzata di Lorenz,Anor, l’indice di concentrazione di Gini, rC , coincidono. Le differenze tra l’approccio geometrico el’approccio analitico piu che sostanziali sono formali.

1.6 Complementi ed esempiB Calcolo semplificato di alcuni indici statistici.Un certo pezzo meccanico ha dimensione nominale (o di progetto) µ0 = Ø1000 [mm]. Sono statiprodotti quattro pezzi aventi misura in [mm] x1 = 1000.01, x2 = 1000.02, x3 = 999.99, x4 = 1000. Invista di un controllo di qualita della produzione, si calcoli media, varianza, sqm e varianza rispettoalla dimensione nominale. Media aritmetica e momento secondo non centrale sono

x =1000.01 + 1000.02 + 999.99 + 1000

4=

4000.02

4= 1000.005 ,

m′2 =

1000.012 + 1000.022 + 999.992 + 10002

4=

=1·000·020.000·1 + 1·000·040.000·4 + 999·980.000·1 + 1·000·000.

4=

4·000·040.000·64

= 1·000·010.000·15 ,

varianza campionaria, varianza rispetto a µ0, standard deviation e il coefficiente di variazione sono

V ar = m′2 − x2 = 1·000·010.000·15− 1·000·010.000·025 = 0.000·125 ,

V ar0 = V ar + (x− µ0)2 = 0.000·125 + 0.0052 = 0.00015 , s =

√V ar ∼= 0.0112 , qV =

s

x∼= 1.12 · 10−5.

Come e facile constatare, siamo in presenza di scarti molto piccoli rispetto alle osservazioni xi e,per conseguenza, di un coefficiente di variazione piccolo. Cio, oltre a dar luogo a numeri con moltecifre, puo “indurre” approssimazioni non sempre corrette. Un modo per alleggerire i calcoli consistenel traslare i dati. Il problema suggerisce di considerare gli scarti da µ0: yi = xi − µ0. Facilmente siha: y = x− µ0 e dunque x = µ0 + y. Inoltre, V ar = 1

n

∑ni=1(xi − x)2 = 1

n

∑ni=1(yi − y)2 = V ary, e,

analogamente V ar0 = V ar + (x− µ0)2 = V ary + y2 = 1n

∑ni=1 y2

i = V ar0y.Poiche y1 = 0.01, y2 = 0.02, y3 = −0.01, y4 = 0, si ha facilmente y = 0.005. Da cui x =

µ0 + y = 1000 + 0.005 = 1000.005. Inoltre, V ar0y = 14 (.012 + .022 + (−.01)2 + 0.2) = 0.000·15,

V ar = 1n

∑ni=1 y2

i − y2 = 0.000·15− 0.0052 = 0.000·125. C

B Associazione di indici.Si supponga che siano note le medie aritmetica, armonica e geometrica x1, a1, g1 e x2, a2, g2relative ai campioni andati perduti x1 e x2, di taglia n1 e n2. Grazie alle proprieta commutativa edassociativa della somma e del prodotto e ancora possibile calcolare le medie aritmetica, armonica egeometrica x, a, g del campione x = (x1,x2) unione dei due campioni. Facilmente si ha

x =n1x1 + n2x2

n, a =

nn1

a1+

n2

a2

, g =

g1n1 · g2

n2

1n

, con n = n1 + n2.

Page 19: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

18 Capitolo 1 Caratteri semplici

Siano y1 e y2 osservazioni dicotomiche di taglia n1 e n2, siano p1 e p2 le rispettive proporzionidi successo. Lo studente calcoli la proporzione p del campione y = (y1, y2), in caso di perdita deidati originari. Si ricorda che se i dati sono dicotomici, la proporzione coincide con la media.

Siano m(1)2 (c0) e m

(2)2 (c0) i momenti secondi di x1 e x2 calcolati rispetto a c0. Il momento secondo

rispetto a c0 di x = (x1, x2) e m2(c0) =1n

(n1m

(1)2 (c0) + n2m

(2)2 (c0)

). Notare che c0 non entra nei

calcoli!

Se (x1, s21) e (x2, s

22) sono le medie e le varianze di x1 e x2, per calcolare la varianza s2 di

x = (x1, x2), si deve invece ricorrere al teorema di Huygens nella forma:∑n

i=1 x2i = n (s2 + x2) . . .

Gli indici x, a, g, p, m2(c0) godono della proprieta della internalita. Non cosı l’indice s2. C

B Cambiamento di unita di misura.

Per lo piu, il passaggio da una unita di misura ad un’altra, e regolato da trasformazioni del tipoy = q x + k, dove q ∈ R+ e k ∈ R. (Dai gradi Celsius oC si passa ai gradi Fahrenheit oF , assumendoq = 1.8 [oF oC−1] e k = 32 [oF ].) Siano x = 36.1 [oC] e s2

x = 0.05 [oC2] la media e la varianza relativea temperature corporee, rilevate su certi individui sani a riposo. Si ha y = q · x+k = 1.8×36.1+32 =96.98 [oF ] e s2

y = q2 · s2x = 1.82 × 0.05 = 0.162 [oF 2]. C

B Considerazioni sui quantili.

Significato geometrico della definizione 1.21. Date le osservazioni (x1, x2, . . . , xn), sia SL(t) =∑ni=1 |xi − t| la somma degli scarti assoluti rispetto a t, sia me il punto di minimo di SL(t). Come

mostrano i grafici di figura 1.2, la SL(t) ha minimo in me = x( n+12 ) per n dispari, mentre, con n pari

-2 2 4 6

5

10

15

20

25

Hn=5Lme Ht,xL

SLHtL

-2 2 4 6

5

10

15

20

25

Hn=6Lme

SLHtL

Ht,xLFigura 1.2. - Calcolo grafico della mediana, n = 5 e n = 6 osservazioni.

SL(t) e minima ∀t ∈ [x( n2 ), x( n

2 +1)]. In tale caso si assume me = 12 (x( n

2 ) + x( n2 +1)). (La figura 1.2

considera i dati −1, 0, 2, 3, 6, n = 5, me = 2 e −1, 0, 1, 2, 3, 6, n = 6, me = 1.5.)

Altro esempio. I dati (5.1, 5.6, 6.4, 6.6), (7.2, 7.4, 7.4, 7.4), (7.8, 7.8, 8.2, 8.4), (8.8, 9.2, 10.5, 11.5),(14.4, 14.8, 15.5, 16.8), sono gli anni occorsi a 20 studenti, vecchio ordinamento, per laurearsi iningegneria. Il tempo medio per la laurea e stato x = 9.34 anni. Il 25% degli studenti piu bravi (opiu svelti) ha concluso gli studi prima di q1 = 7.3 anni e la meta si e laureata prima di me = 8 anni.Infine, per il 25% dei meno bravi (o piu calmi) ci sono voluti almeno q3 = 11 anni. C

B Costruzione geometrica dei percentili.

Page 20: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1.6 Complementi ed esempi 19

Date le distribuzioni discrete (a, b, c), se ne calcoli la mediana

Da =

(1, 2, 3, 4, 5, 6

1, 2, 6, 8, 2, 1

), Db =

(1, 2, 3, 4, 5, 6

1, 2, 7, 7, 2, 1

), Dc =

(1, 2, 3, 4

8, 6, 4, 1

).

Nel caso (a), in cui le u.s. sono n = 20, poiche la retta di equazione y = 12 n interseca la funzione

cumulata H(x), vedi figura 1.3 (a), in corrispondenza della “alzata” in 4, ne consegue che la medianae me = 4. Per giustificare tale procedimento, si consideri che n = 20, che il campione n-ordinato e(1, 2, 2, 3, 3), (3, 3, 3, 3, 4), (4, 4, 4, 4, 4), (4, 4, 5, 5, 6) e che x(10) = x(11) = 4, ritrovando cosı me = 4.

Nel caso (b) n = 20. Dunque la retta orizzontale y = 12 n interseca la funzione H(x) nello

“spigolo”, vedi figura 1.3 (b). Ne consegue che la mediana cade tra 3 e 4; dunque me = 3.5. Talerisultato si giustifica allo stesso modo. Tenuto conto che il campione n-ordinato e (1, 2, 2, 3, 3),(3, 3, 3, 3, 3), (4, 4, 4, 4, 4), (4, 4, 5, 5, 6), ne consegue che x(10) = 3 e x(11) = 4, e dunque me = 3.5.

Nel caso (c), in cui le u.s. sono n = 19, poiche le ordinate degli “spigoli” sono intere ed n edispari, dunque 1

2n non e intero, ne consegue che l’intersezione della retta orizzontale y = 12 n con la

funzione a gradini H(x) si puo trovare solo in corrispondenza di una “alzata”. In questo caso, vedifigura 1.3 (c), essendo 1

2n = 9.5, si ha me = 2. Per mostrare il risultato si procede al modo solito.Poiche nel campione n-ordinato (1, 1, 1, 1, 1), (1, 1, 1, 2, 2), (2, 2, 2, 2, 3), (3, 3, 3, 4), la 10a osservazionee x(10) = 2, si ritrova me = 2.

Verificare, nei casi (a, b, c), la condizione H(m−e ) ≤ 1

2 n ≤ H(m+e ) di cui alla definizione 1.20.

Per calcolare i quartili si procede allo stesso modo. Si tenga presente che per il primo [terzo]quartile, si deve considerare la retta y = 1

4 n [y = 34 n]. C

1 2 3 4 5 6 7

2468 HaLhHxL

HxL1 2 3 4 5 6 7

2468 HbLhHxL

HxL1 2 3 4 5

2468 HcLhHxL

HxL1 2 3 4 5 6 7

5101520 HaLHHxL

HxLme

1 2 3 4 5 6 7

5101520 HbLHHxL

HxLme

1 2 3 4 5

5101520 HcLHHxL

HxLme

Figura 1.3. - Istogramma e cumulata (casi a, b e c).

B Esempio A. Nel 1982 nella provincia di Cagliari, ogni settimana, sono stati rilevati gli incidenti digravita definita di primo livello. Le n = 52 osservazioni sono: (0, 1, 4, 5, 2), (0, 2, 1, 0, 4), (0, 2, 5, 2, 3),(3, 1, 0, 1, 4), (1, 0, 2, 4, 0), (1, 3, 4, 2, 2), (1, 7, 0, 1, 1), (5, 1, 0, 0, 4), (2, 0, 0, 2, 3), (2, 4, 1, 5, 3), (5, 0). Sifornisca una descrizione elementare dei dati.R. Nelle prime due colonne di Tav. 1.A sono riportati i dati accorpati. La tavola fornisce poi lefrequenze relative, nonche i calcoli parziali necessari per calcolare media e varianza e per tracciare

Page 21: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

20 Capitolo 1 Caratteri semplici

la cumulata. I principali indici statistici sono riportati in Tav. 2.A. In figura 1.4 (A) sono tracciatil’istogramma a barre, la cumulata ed il procedimento geometrico per il calcolo dei quartili.

ξj nj fj ξj nj ξ2j nj

∑jh nh

0 13 .2500 0 0 131 11 .2115 11 11 242 10 .1923 20 40 343 5 .0962 15 45 394 7 .1346 28 112 465 5 .0962 25 125 517 1 .0192 7 49 52

tot. 52 1.0000 106 382 −

Tav. 1.A - Tavola dei calcoli per l’esempio A.

indici di posizione indici di variabilita momenti

moda m0 = 0 varianza V ar(x) = 3.1908 m′2 = 7.3462

media x = 2.0385 s.q.m. sd = 1.7863mediana me = 2 var. corr. V arc(x) = 3.2534

1o quartile q1 = 0.5 s.q.m. corr. sdc = 1.80373o quartile q3 = 3.5 range interq. δ12 = 3

minimo x(1) = 0 campo di var. range = 7massimo x(2) = 7 coeff.di var. qV = 0.8763

Tav. 2.A - Tavola degli indici statistici per l’esempio A.

B Esempio B. Descrivere i dati (fittizi) riportati, in forma accorpata, nelle prime due colonne dellaTav. 1.B.

R. La Tav. 1.B riporta, vedi colonne 3 ÷ 8, i calcoli parziali necessari per calcolare i principaliindici statistici di cui alla Tav. 2.B. Si osservi che

∏ni=1 xi =

∏kj=i ξ

nj

j = 339738624. La figura 1.4(B) mostra l’istogramma a barre, la cumulata e il procedimento geometrico per calcolare i quartili.

ξi ni fj ξjnj ξ2j nj Σi

hnh nj/ξj ξnj

j

1 10 .3571 10 10 10 10. 12 8 .2857 16 32 18 4. 2563 4 .1429 12 36 22 1.333 814 4 .1429 16 64 26 1. 2568 2 .0714 16 128 28 0.250 64

tot. 28 1.0000 70 270 − 16.583∏

xi

Tav. 1.B - Calcoli per l’esempio B.

Page 22: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1.6 Complementi ed esempi 21

indici di posizione indici di variabilita momenti

moda m0 = 1 varianza V ar(x) = 3.3929 m′2 = 9.6429

media x = 2.5 s.q.m. sd = 1.8420mediana me = 2 var. corr. V arc(x) = 3.5185

media geom. mg = 2.0169 s.q.m. corr. sdc = 1.8758media arm. ma = 1.6884 range interq. δ12 = 21o quartile q1 = 1 campo di var. range = 73o quartile q3 = 3 coeff.di var. qV = 0.7368

minimo x(1) = 1massimo x(2) = 8

Tav. 2.B - Tavola degli indici statistici per l’esempio B.

2 4 6 8

2468

1012 HALhHxL

HxL2 4 6 8

2468

10 HBLhHxLHxL

2 4 6 8

1020304050 HALHHxL

HxLq1 me q3

2 4 6 8

510152025 HBLHHxL

HxLq1 me q3

Figura 1.4. - Istogramma e cumulata delle frequenze assolute, per gli esempi A e B.

B Esempio C. Si dispone di n = 54 osservazioni continue (fittizie) riportate, in forma accorpata,nella 2a e 3a colonna di Tav. 1.C. Se ne dia una descrizione elementare.R. Dalla Tav. 1.C si ricava m0 = 25, x = 26.85, m′

2 = 15445350 = 839.81, V ar = m′

2−x2 = 118.89,sd =

√V ar = 10.90, V arc = 54

53V ar = 121.13, sdc =√

V arc = 11.01, range = 50. La figura 1.5 (C)riporta l’istogrammi a rettangoli e la funzione cumulata delle frequenze assolute ed il procedimentogeometrico per il calcolo dei quartili. Essi sono me = 27.22, q1 = 19.5, q3 = 35.3125.Calcolo della mediana. Dalla Tav. 1.C e dalla figura 1.5 (C) si evince che la mediana si trova entrola classe [ξ2, ξ3). Infatti, H(me) = 1

2n = 27 e compreso fra H(ξ2) = 14 e H(ξ3) = 32. La mediana,vedi figura 1.5, e data dall’ascissa del punto M , intersezione della retta orizzontale y = 1

2n con lafunzione cumulata H(x). Si ha dunque me = ξ2 + PN . Dalla similitudine dei triangoli (PRQ) e(PNM) si ha PR : RQ = PN : NM , e dunque (30− 20) : (32− 14) = PN : (27− 14). Poiche

PN = 101318

= 7.22, si ottiene me = 27.22.

Page 23: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

22 Capitolo 1 Caratteri semplici

classe ξj−1 ` ξj nj ζj nj ζj nj ζ2j

∑jh nh

1 0 ` 10 4 5 20 100 42 10 ` 20 10 15 150 2250 143 20 ` 30 18 25 450 11250 324 30 ` 40 16 35 560 19600 485 40 ` 50 6 45 270 12150 54

tot. − 54 − 1450 45350 −

Tav. 1.C - Calcoli per l’esempio C.

10 20 30 40 50 60

5

10

15

20

q1 q3me

hHxLHxL

HCL10 20 30 40 50 60

10

20

30

40

50

60

HxLM

HCLq1 q3me

HHxL

20 30

27

14

32

P

Q

R

M

N

HxLme

Figura 1.5. - Esempio C, istogramma, cumulata e calcolo geometrico della mediana.

B Esempio D. (*) In 8 aziende vi sono (1, 1, 2, 2), (4, 6, 16, 48) occupati. Gli addetti di altre 8aziende sono (6, 6, 7, 7), (10, 11, 15, 18). Si calcolino gli indici di asimmetria γ1 di Fisher e α diBonferroni, il coefficiente di variazione qV , la differenza media relativa di Gini, g, (che coincide conl’area di concentrazione normalizzata di Lorenz, Anor, e l’indice di concentrazione di Gini, rC).R. Gli occupati totali ed il numero medio di occupati per azienda e lo stesso nei due gruppi diaziende T = 80 e x = 10. Le diversita risiedono essenzialmente nella struttura occupativa di ciascungruppo. Questa puo essere messa in luce solo grazie ad appropriati indici. Per motivi di spazio inTav. 1.D, in cui si trovano gli scarti ε(i) = x(i) − x, si e posto εI

(i) = ε(n−i+1) e u(i) = ε(i) + ε(n−i+1).

Si ha: V ar = 181·822 = 227.75, V ar

32 = 3·437.06, sd = 15.091, m3 = 1

857·850 = 7·231.25,∑ni=1 |ε(i) + ε(n−i+1)| = 116,

∑ni=1 |ε(i)| = 88. Si ricava subito qV = 15.091

10 = 1.5091, γ1 = 7·231.253·437.06 =

0.9805, α = 1162×88 = 0.6591. Gli indici γ1 e α indicano una notevole asimmetria delle osservazioni,

situazione questa, confermata dalla sensibile differenza tra media e mediana (me = 3).

Page 24: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

1.6 Complementi ed esempi 23

i x(i) ε(i) ε2(i) ε3(i) εI(i) ui |ε(i)| |ui| i · ε(i) Ti qi

1 1 −9 81 −729 38 29 9 29 −9 1 .01252 1 −9 81 −729 6 −3 9 3 −18 2 .02503 2 −8 64 −512 −4 −12 8 12 −24 4 .05004 2 −8 64 −512 −6 −14 8 14 −32 6 .07505 4 −6 36 −216 −8 −14 6 14 −30 10 .12506 6 −4 16 −64 −8 −12 4 12 −24 16 .20007 16 6 36 216 −9 −3 6 3 42 32 .40008 48 38 1444 54872 −9 29 38 29 304 80 1.0000

tot. 80 0 1822 52326 0 0 88 116 209 − 1.8875

Tav. 1.D - Calcoli per l’esempio D.

La differenza semplice media e ∆ = 48·7 209 = 14.9286. La differenza media relativa di Gini e

dunque g = 14.92862·10 = 0.7464. Poiche

∑n−1i=1 qi =

∑ni=1 qi − 1 = 0.8875, l’area di concentrazione

normalizzata di Lorenz e Anor = 1 − 27 0.8875 = 0.7464, la quale coincide con g e con l’indice di

concentrazione di Gini, rC .In figura 1.6 sono date le curve di Lorenz relative ai due gruppi di dati. Da esse si evince che i

dati del primo gruppo, in cui e g = 0.7464, risultano “quasi tre volte” piu concentrati di quelli delsecondo, in cui e g = 0.2527. Lo studente completi l’analisi statistica del secondo gruppo di dati.

0.2 0.4 0.6 0.8 1

0.2

0.4

0.6

0.8

1

HpiL

HqiL

H1LH2L

Figura 1.6. - Esempio D, curve di Lorenz per i due gruppi.

B Esempio E. (*) Dal XXVI Bollettino della Banca d’Italia, indagine campionaria su 3126 famigliesul “Risparmio e struttura delle famiglie italiane nel 1969”. Lo studio, vedi Tav. 1.E, considerak = 11 classi di reddito (in milioni di lire) e, in corrispondenza a ciascuna di esse, il numero difamiglie beneficiare. Si calcolino la differenza media relativa di Gini.R. Nella Tav. 1.E ni indica il numero di famiglie beneficiarie di un reddito che rientra nellai−esima classe il cui centro e ξi. (Poiche la k−esima classe e ad esaurimento, il centro di classe e

Page 25: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

24 Capitolo 1 Caratteri semplici

stato posto in 9.00.) Il reddito goduto dalla i−esima classe di reddito e niξi, l’ammontare dei redditie Ti =

∑ih=1 nhξh, l’ammontare dei nuclei familiari percettori e Ni =

∑ih=1 nh, infine le frazioni di

ammontare dei redditi e dei nuclei familiari sono qi =Ti

Te pi =

Ni

N, con T = Tk e N = Nk.

La curva di concentrazione di Lorenz che passa nei punti (pi, qi) e riportata in figura 1.7. Peravere l’area compresa fra la curva di Lorenz e l’asse delle ascisse si applica la formula dei trapezi12

∑ki=1 δi, dove δi = (pi − pi−1)(qi + qi−1), con p0 = q0 = 0. L’area di concentrazione di Gini e

dunque g = 12 (1− 0.60180) = 0.19909.

i classe reddito ni ξi niξi Ti qi Ni pi δi

1 [0− 0.5) 313 0.25 78.25 78.25 .01376 313 .10012 .00138

2 [0.5− 1.0) 594 0.75 445.50 523.75 .09190 907 .29014 .02078

3 [1.0− 1.5) 750 1.25 937.50 1461.25 .25651 1657 .53077 .08359

4 [1.5− 2.0) 563 1.75 985.25 2446.50 .42951 2220 .71017 .12355

5 [2.0− 2.5) 313 2.25 704.25 3150.75 .55315 2533 .81030 .09839

6 [2.5− 3.0) 187 2.75 514.25 3665.00 .64343 2720 .87012 .07158

7 [3.0− 3.5) 125 3.25 406.25 4071.25 .71475 2845 .91010 .05430

8 [3.5− 4.0) 94 3.75 352.50 4423.75 .77663 2939 .94017 .04485

9 [4.0− 4.5) 31 4.25 131.75 4555.50 .79977 2970 .95099 .01564

10 [4.5− 5.0) 62 4.75 294.50 4850.00 .85157 3032 .96992 .03275

11 [5.0 − ) 94 9.00 846.00 5696.00 1.00000 3126 1.00000 .05570

tot. - 3126 - 5·696.00 - - - - 0.60180

Tav. 1.E - Calcoli per l’esempio E.

0.2 0.4 0.6 0.8 1

0.2

0.4

0.6

0.8

1

HpiL

HqiL

Figura 1.7. - Esempio E, curva di Lorenz, redditi percepiti da 3126 famiglie.

Page 26: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

2CARATTERI MULTIPLI

People commonly use statistics like a drunk uses a lamp post. For supportrather than illumination. (Andrew Lang; Mark Twain)Quelli che si innamorano di pratica sanza scienzia, son come il nocchiereche entra in naviglio senza bussola, che mai ha certezza dove si vada.Studia prima la scienzia, e poi seguita la pratica nata da essa scienzia.(Leonardo da Vinci - Codex Urbinas)

Sulle u.s. ωi ∈ Ω si possono rilevare piu caratteri. Siano, ad esempio, x(·), y(·), z(·) tre funzioni chefanno corrispondere ad ogni ωi il vettore (xi, yi, zi) ∈ X × Y × Z, i = 1, 2, . . . , n. (Circa la naturadi (x, y, z) valgono le considerazioni gia viste.) I dati relativi alle n u.s. sono costituiti dai vettori(x,y, z)T = (x1, y1, z1), (x2, y2, z2), . . . , (xn, yn, zn), o anche, passando a k caratteri, dalla matrice

dei dati, o delle osservazioni, (n× k)

X =

x1,1 x1,2 . . . x1,k

x2,1 x2,2 . . . x2,k

. . . . . . . . . . . .

xn,1 xn,2 . . . xn,k

.

Se la suddivisione in classi e semplice, ossia e fatta rispetto ad un solo carattere, anche la frequenzae semplice. Se invece i caratteri rispetto ai quali e fatta la suddivisione in classi sono due, o piudi due, la distribuzione e detta doppia, tripla, etc. Il corso di SM trattera solo il caso di due solicaratteri x ed y, con (i) x ed y entrambi variabili, (ii) sia x che y mutabili. Come si vedra, all’analisistatistica dei caratteri multipli (che non e una mera estensione dell’analisi univariata) si richiede dimettere in luce il legame (statistico) che sussiste fra i caratteri. Lo zip non considera altri importanti

25

Page 27: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

26 Capitolo 2 Caratteri multipli

casi. Ad esempio: la x e una variabile e la y una mutabile. O anche: le x e y sono variabili e i datisono accorpati in classi e raccolti in una tavola di frequenze.

2.1 Indici per le variabili doppieSia X × Y ⊆ R2 l’insieme dei possibili valori che la variabile doppia (x, y) puo assumere. Siano(xi, yi), i = 1, 2, . . . , n i dati rappresentabili in un diagramma a dispersione.

Sui caratteri x ed y, presi separatamente, possiamo calcolare gli indici gia visti. In particolare,medie e varianze sono

x =1n

n∑

i=1

xi , y =1n

n∑

i=1

yi , s2x =

1n

Dev(x) =1n

n∑

i=1

(xi − x)2 , s2y =

1n

Dev(y) =1n

n∑

i=1

(yi − y)2 .

A tali momenti si aggiungono ora i momenti misti.

Definizione 2.1. Si definiscono momento misto, non centrale e centrale, di ordine (u, v) gli indici

m′u,v =

1n

n∑

i=1

xui yv

i , mu,v =1n

n∑

i=1

(xi − x)u(yi − y)v .

Ovviamente: x = m′1,0, y = m′

0,1, s2x = m2,0 e s2

y = m0,2. I momenti di ordine (1, 1) sono m′1,1 =

1n

n∑

i=1

xiyi e m1,1 =1n

n∑

i=1

(xi − x)(yi − y). Questo, noto come covarianza di x ed y, e piu spesso

indicato con i simboli Cov(x, y) o sxy. Il teorema 1.4 di Huygens puo essere esteso alla covarianza

Corollario 2.1. Cov(x, y) =1n

n∑

i=1

(xi − x)(yi − y) =1n

n∑

i=1

xiyi − x y = m′1,1 −m′

1,0 m′0,1.

Quando n e grande puo essere utile partizionare X ed Y in classi ed accorpare le osservazioni inuna tavola di frequenze. In tal modo, i dati potranno essere analizzati mediante le tecniche illustratenella sezione che tratta le tavole di contingenza.

2.2 L’interpolazione statisticaSul piano (x, y) si riportino i dati (xi, yi), i = 1, 2, . . . , n risultanti da un certo fenomeno, vedifigura 2.1. Si supponga che un esperto, in base alle sue conoscenze e all’aspetto dei dati, sia ingrado di proporre un modello (o una legge) capace di descrivere il fenomeno. Sia y = f(x; β) ilmodello proposto, dipendente dal vettore β = (β1, β2, . . . , βk)T ∈ Rk, i cui elementi βj sono dotatidi dimensione fisica. L’esistenza di ∞k versioni del modello, al variare dei βj , crea l’esigenza di unascelta basata su un qualche criterio di ottimalita a sua volta basato su una misura di accostamento delmodello y = f(x; β) rispetto ai dati e su un algoritmo di ricerca del vettore ottimale β.

Dei criteri di ottimalita presenti in letteratura, lo zip considera il piu usuale di essi: il metododei minimi quadrati, in sigla m.q. Vedi definizione 2.2. Per motivi di semplicita, lo zip tratta solo i

Page 28: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

2.2 L’interpolazione statistica 27

modelli che, rispetto a β, sono lineari o che sono linearizzabili mediante trasformazioni monotone.Tutte le leggi, cioe, che sono o che sono riconducibili alla forma

f(x; β) = β1ϕ1(x) + β2ϕ2(x) + · · ·+ βkϕk(x) =k∑

j=1

βjϕj(x) = βT ϕ(x) , (2.1)

dove le ϕj(x) sono funzioni continue e linearmente indipendenti. Rientrano nella classe dei modelli

lineari le utili funzioni y = c · 1x

e y = k · e−ωx, con ω noto, i polinomi y = Pk(x) =∑k

j=0 βjxj , con

ϕ0(x) = 1, ϕ1(x) = x, . . . , ϕk(x) = xk, e i polinomi trigonometrici, ad esempio, y = β0 + β1 sin x+β2 cosx, etc. Ma anche i modelli “meno usuali” del tipo y = β1 log x + β2

√x− β3|x− 5|, etc.

Modelli non lineari ma linearizzabili sono y = h · e−kx e xφyψ = c, piu avanti considerati. Non

linearizzablile e il modello logistico y =β1

1 + β2e−β3x.

Disponendo di una generica versione di f(x;β), vedi figura 2.1, e possibile calcolare le ordinateyi = f(xi; β) in corrispondenza delle ascisse xi e quindi gli scarti fra ordinate osservate e calcolate

εi = yi − yi = yi − f(xi; β) = yi −k∑

j=1

βj ϕj(xi) , i = 1, 2, . . . , n . (2.2)

1 2 3 4 5 6

1

2

3

4

5

HxL

HyLHxi,yiLHxi, yiL

yi

yi

Εi

f Hx;Β1,Β2,...,ΒkLFigura 2.1. - Osservazioni, curva interpolante, scarti.

Definizione 2.2. Si definisce misura globale degli scarti la somma dei quadrati degli scarti

SfG(β) =

n∑

i=1

ε2i =n∑

i=1

(yi − yi)2 =n∑

i=1

yi − f(xi; β)

2

=n∑

i=1

yi −

k∑

j=1

βj ϕj(xi)2

, (2.3)

si definisce stima dei minimi quadrati (in sigla m.q.) di β il vettore β che rende minima la (2.3).

Poiche il modello (2.1) e lineare in β, ne consegue che, se n > k + 1, la SfG(β) e una forma

quadratica (f.q.) positiva definita (p.d.) La f.q. SfG(β) ha dunque nello spazio Rk concavita rivolta

verso l’alto ed ha minimo unico in β. Per il calcolo di β e sufficiente l’esame delle condizioni del primo

ordine. Essendo∂

∂βhf(x; β) = ϕh(x), esse sono date dal sistema lineare

Page 29: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

28 Capitolo 2 Caratteri multipli

∂βhSf

G(β) = −2n∑

i=1

yi − f(xi;β)

· ϕh(xi) = 0 , ∀h = 1, 2, . . . , k , (2.4)

che puo essere posto nella comoda forma matriciale M · β = c, dove

M =

∑[ϕ1(xi)]2

∑ϕ1(xi)ϕ2(xi) . . .

∑ϕ1(xi)ϕk(xi)∑

ϕ1(xi) ϕ2(xi)∑

[ϕ2(xi)]2 . . .∑

ϕ2(xi)ϕk(xi). . . . . . . . . . . .∑

ϕ1(xi) ϕk(xi)∑

ϕ2(xi)ϕk(xi) . . .∑

[ϕk(xi)]2

, c =

∑yiϕ1(xi)∑yiϕ2(xi)

. . .∑yiϕn(xi)

in cui tutte le somme sono fatte rispetto a i che va da 1 ad n. Se SfG(β) e p.d. la M e invertibile, il

sistema (2.4) ha (di conseguenza) soluzione unica data da β = M−1 · c che e la soluzione dei m.q.Se n = k + 1 e se Sf

G(β) e p.d., il metodo dei m.q. e l’interpolazione matematica producono le stessesoluzioni. Se n ≤ k, Sf

G(β) e semi-p.d. e M−1 non esiste. Si ha in tal caso una situazione detta dicollinearita. Lo zip supporra sempre che n < k + 1.

2.3 Analisi degli scarti e leggi particolariNella pratica accade che il ricercatore si trovi a dover scegliere fra piu modelli. I principali criteri discelta sono: (i) i riscontri fisici, (ii) le analogie formali con fenomeni ben studiati, (iii) il confrontonumerico fra misure degli scarti, (iv) il rasoio di Occam che, coeteris paribus, privilegia il modellopiu semplice a scapito di altri modelli, i quali pur producendo scarti piu limitati sono complicati e didifficile interpretazione. I criteri di scelta (i), (ii) e (iv) sono i piu sicuri. Lo zip prendera in esamesolamente il criterio numerico (iii).

Siano f(·;β) e g(·; γ) i modelli a confronto, siano β e γ le stime dei m.q. dei parametri β e γ

ottenute con i dati (xi, yi), i = 1, 2, . . . , n. Siano SfG(β) e Sg

G(γ) le misure ottimali degli scarti.Il calcolo di tali misure usando la (2.3) puo essere oneroso. I modelli lineari della forma (2.1)

consentono economie di calcolo. Si consideri la scomposizione della misura ottimale degli scarti

SfG(β) =

n∑

i=1

(yi − yi)2 =n∑

i=1

(yi − yi)yi −n∑

i=1

(yi − yi)yi ,

in cui l’ultima somma e nulla per via delle condizioni del primo ordine (2.4)

n∑

i=1

(yi − yi)yi =n∑

i=1

(yi − yi)f(xi; β) =n∑

i=1

(yi − yi)k∑

j=1

βjϕj(xi) =k∑

j=1

βj

n∑

i=1

(yi − yi)ϕj(xi) = 0.

Il minimo della misura degli scarti diviene

SfG(β) =

n∑

i=1

(yi − yi)yi =n∑

i=1

y2i −

n∑

i=1

yi

k∑

j=1

βjϕj(xi) =n∑

i=1

y2i −

k∑

j=1

βj

n∑

i=1

yiϕj(xi) , (2.5)

Page 30: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

2.3 Analisi degli scarti e leggi particolari 29

o, in forma matriciale, SfG(β) = yTy− β

Tc. In modo analogo si calcola la misura ottimale Sg

G(γ).

Qui di seguito sono esaminati alcuni casi usualiB Retta y = β0 + β1x. le condizioni (2.4) danno luogo al sistema

[n

∑xi∑

xi

∑x2

i

(β0

β1

)=

( ∑yi∑

xiyi

), (2.6)

che produce le soluzioni β1 =n

∑xiyi −

∑xi

∑yi

n∑

x2i − (

∑xi)2

=Cov(x, y)V ar(x)

=sxy

s2x

, , β0 = y − β1 x.

Dalla (2.5) seguono le proprieta e le utili verifiche.

Teorema 2.1. (i) La retta dei m.q. y = β0 + β1x passa per (x, y), baricentro delle osservazioni,(ii) gli scarti hanno somma nulla,

∑(yi − yi) = 0, (iii) gli scarti sono ortogonali con le ascisse,∑

(yi − yi)xi = 0 (iv) gli scarti sono ortogonali con le ordinate stimate,∑

(yi − yi) yi = 0, (v) lamisura ottimale degli scarti e Sf

G(β) =∑

y2i − β0

∑yi − β1

∑xiyi.

Lo statistico inglese Karl Pearson (1857-1936) diede una misura del legame lineare fra variabili

Definizione 2.3. Si definisce coefficiente di correlazione lineare di Pearson (1898) l’indice

r =Cov(x, y)√

V ar(x)V ar(y)=

sxy

sx sy.

Si dimostra facilmente che

Teorema 2.2. (i) r ∈ [−1,+1] ed e adimensionale, (ii) r e invariante per trasformazioni di posizionee scala di x ed y.

Adottando la legge la retta y = β0 il metodo dei m.q. da β0 = y e SyG(β0) = Dev(y). Con

y = β1x si ha β1 =∑

xiyi∑x2

i

e SyG(β1) =

∑y2

i − β1

∑xiyi.

Quando tra la x e la y vi e un evidente legame di causa-effetto sia pure “con scarti” (esempio: x

e il reddito ed y e il consumo) si dice che tra le variabili sussiste una correlazione pura. Per contro, sele osservazioni (xi, yi) presentano regolarita non riconducibili in alcun modo ad un legame di causa-effetto (esempio: le altezze di pioggia mensile x ed y rilevate in due stazioni vicine), si dice che frale variabili vi e concomitanza e si parla di correlazione spuria. In questo caso, data la convenzionalitadei simboli, e saggio ripetere l’analisi a parti scambiate e considerare il modello x = α0 +α1y. Postoεi = xi − xi, dove xi = α0 + α1yi, la misura degli scarti e SG(α) =

∑(xi − xi)2. Si ottiene

α1 =n

∑xiyi −

∑xi

∑yi

n∑

y2i − (

∑yi)2

=Cov(x, y)V ar(y)

=sxy

s2y

, α0 = x− α1 y ,

SxG(α) =

∑x2

i − α0

∑xi − α1

∑xiyi.

Le rette y = β0 + β1x e x = α0 + α1y sono dette rette di regressione. Si osservi che Cov(x, y), α1,β1 ed r hanno lo stesso segno, che α1 β1 = r2 e che α1 e β−1

1 hanno stessa dimensione fisica.

B Polinomio y =∑k

j=i βjxj . In tal caso: ϕj(x) = xj , j = 0, 1, . . . , k. (Per k = 1 abbiamo la retta,

per k = 2, la parabola y = β0 + β1x + β2x2.) Sistema e misura degli scarti, vedi la (2.5), divengono

Page 31: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

30 Capitolo 2 Caratteri multipli

n∑

xi . . .∑

xki∑

xi

∑x2

i . . .∑

xk+1i

. . . . . . . . . . . .∑xk

i

∑xk+1

i . . .∑

x2ki

·

β0

β1

...βk

=

∑yi∑

xiyi

...∑xk

i yi

, (2.7)

SyG(β) =

n∑

i=1

y2i − β0

n∑

i=1

yi − β1

n∑

i=1

xiyi − · · · − βk

n∑

i=1

xki yi = yT y − β

Tc . (2.8)

B Modelli linearizzabili. Di notevole interesse applicativo sono le funzioni y = h · e−kx e xφyψ = c

che, pur non lineari nei parametri, lo divengono passando ai logaritmi. Si ha dunque v = log h− k x

e φ u + ψ v = log c, dove u = log x e v = log y. Ponendo β0 = log h e β1 = −k nel primo caso, e

β0 =log c

ψe β1 = −φ

ψnel secondo, si ricade in modelli gia visti. Si noti che la xφyψ = c ha tre

parametri solo in apparenza e che non si altera il problema se si pone ψ = 1.B Nota. Si osservi che con i modelli linearizzabili le stime dei m.q. sono ottimali rispetto allamisura globale degli scarti

∑ni=1(vi − vi)2 (nello spazio trasformato) e non rispetto alla misura∑n

i=1(yi − yi)2 (nello spazio originario). Dunque, per calcolare la misura globale∑n

i=1(yi − yi)2 chea noi interessa, non e possibile ricorrere alla formula semplificata (2.5). C

2.4 Mutabili doppie e tavole di contingenzaSono date le mutabili: x che assume una (ed una sola) delle h modalita A1,A2, . . . ,Ah ed y cheassume una (ed una sola) delle k modalita B1,B2, . . . ,Bk, con h ≥ 2 e k ≥ 2. Si chiama frequenza

congiunta nij il numero di u.s. che presentano, congiuntamente, la modalita Ai del carattere x

e la modalita Bj del carattere y. La Tav.1, detta tavola delle frequenze assolute che raccoglie lefrequenze congiunte nij , riporta le quantita Cj =

∑hi=1 nij , j = 1, 2, . . . , k, e Ri =

∑kj=1 nij , i =

1, 2, . . . , h, dette frequenze marginali dei caratteri y ed x rispettivamente. Ovviamente N =∑h

i=1 Ri =∑kj=1 Cj =

∑hi=1

∑kj=1 nij .

B1 . . . Bj . . . Bk tot.

A1 n11 . . . n1j . . . n1k R1

. . . . . . . . . . . . . . . . . . . . .

Ai ni1 . . . nij . . . nik Ri

. . . . . . . . . . . . . . . . . . . . .

Ah nh1 . . . nhj . . . nhk Rh

tot. C1 . . . Cj . . . Ck N

Tav.1 - Frequenze congiunte.

B1 . . . Bj . . . Bk tot.

A1 p11 . . . p1j . . . p1k r1

. . . . . . . . . . . . . . . . . . . . .

Ai pi1 . . . pij . . . pik ri

. . . . . . . . . . . . . . . . . . . . .

Ah ph1 . . . phj . . . phk rh

tot. c1 . . . cj . . . ck 1

Tav.2 - Proporzioni congiunte.

Partendo dalla Tav.1 possiamo calcolare la tavola delle frequenze relative (o proporzioni) congiunte

Page 32: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

2.4 Mutabili doppie e tavole di contingenza 31

date da pij =nij

N, ri =

Ri

Ne cj =

Cj

Ndove, per costruzione, cj =

∑hi=1 pij , j = 1, 2, . . . , k,

ri =∑k

j=1 pij , i = 1, 2, . . . , h e∑h

i=1 ri =∑k

j=1 cj =∑h

i=1

∑kj=1 pij = 1, vedi Tav.2.

Assai utile risulta lo studio della distribuzione del carattere y per ogni fissata modalita del carat-tere x. Allo scopo, si dividono le frequenze della i−esima riga per la frequenza marginale Ri ottenendo

bij =nij

Rie si dividono le frequenze marginali di y per N ottenendo cj =

Cj

N. Si perviene cosı alla

tavola delle frequenze relative delle modalita (B1, . . . ,Bj , . . . ,Bk) di y condizionate a ciascuna dellemodalita Ai di x o, piu semplicemente, alla tavola delle proporzioni di y condizionate ad x, vedi Tav.3.In modo del tutto analogo (invertendo il ruolo di x e di y) si calcola la tavola delle proporzioni aij

delle modalita di x condizionate ad y, vedi Tav.4. Si osservi che, per costruzione,∑h

i=1 aij = 1, ∀j,e che, analogamente,

∑kj=1 bij = 1, ∀i.

B1 . . . Bj . . . Bk tot.

A1 b11 . . . b1j . . . b1k 1

. . . . . . . . . . . . . . . . . . . . .

Ai bi1 . . . bij . . . bik 1. . . . . . . . . . . . . . . . . . . . .

Ah bh1 . . . bhj . . . bhk 1tot. c1 . . . cj . . . ck 1

Tav.3 - Prop. condiz. al carattere x.

B1 . . . Bj . . . Bk tot.

A1 a11 . . . a1j . . . a1k r1

. . . . . . . . . . . . . . . . . . . . .

Ai ai1 . . . aij . . . aik ri

. . . . . . . . . . . . . . . . . . . . .

Ah ah1 . . . ahj . . . ahk rh

tot. 1 . . . 1 . . . 1 1

Tav.4 - Prop. condiz. al carattere y.

B Indipendenza fra caratteri. Interessa sapere se tra i caratteri x ed y vi sia indipendenza o, piuttosto,qualche forma di dipendenza. Se le righe della Tav.3 sono uguali, allora diciamo che il carattere y eindipendente dal carattere x, ovvero che la distribuzione di y non varia al variare delle modalita Ai.Stesso discorso, a parti rovesciate, si puo fare con la Tav.4. E facile dimostrare che se le righe sonotutte uguali in Tav.3 lo sono anche le colonne in Tav.4. In caso di indipendenza sussistono le h× k

condizioni:

nij

Ri=

Cj

N⇔ nij

Cj=

Ri

N⇔ nij =

RiCj

N, ∀i = 1, 2, . . . , h , ∀j = 1, 2, . . . , k ,

come dire: nell’ipotesi di indipendenza fra i caratteri x ed y, la frequenza teorica congiunta, relativa

a (Ai,Bj), e nij =Ri Cj

N. Per costruzione risulta ∀i, ∑k

j=1 nij = Ri e ∀j, ∑hi=1 nij = Cj .

La Tav.5 che raccoglie le nij , prende il nome di tavola delle frequenze teoriche congiunte. Ladifferenza o scarto fra “dato osservato e dato teorico” sij = nij− nij , e nota col nome di contingenza.La tavola degli scarti e chiamata tavola di contingenza, vedi Tav.6. Si osservi che essendo i marginalidi tale tavola nulli per costruzione, le contingenze sono linearmente dipendenti. Tale osservazioneconsente di introdurre la nozione di gradi di liberta di una tavola di contingenza.B Gradi di liberta. Tra le contingenze, vedi Tav.6, sussistono relazioni di vincolo. Come tali essenon sono a “variazione libera”. La differenza tra il numero degli scarti ed il numero dei vincoli prendeil nome di gradi di liberta del sistema degli scarti ed ha simbolo gl (o ν o df).

Page 33: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

32 Capitolo 2 Caratteri multipli

B1 . . . Bj . . . Bk tot.

A1 n11 . . . n1j . . . n1k R1

. . . . . . . . . . . . . . . . . . . . .

Ai ni1 . . . nij . . . nik Ri

. . . . . . . . . . . . . . . . . . . . .

Ah nh1 . . . nhj . . . nhk Rh

tot. C1 . . . Cj . . . Ck N

Tav.5 - Freq. teoriche congiunte.

B1 . . . Bj . . . Bk tot.

A1 s11 . . . s1j . . . s1k 0

. . . . . . . . . . . . . . . . . . . . .

Ai si1 . . . sij . . . sik 0. . . . . . . . . . . . . . . . . . . . .

Ah sh1 . . . shj . . . shk 0tot. 0 . . . 0 . . . 0 0

Tav.6 - T. delle contingenze.

Si noti che nel nostro caso, sui h ·k scarti gravano h+k−1 vincoli: il vincolo∑h

i=1

∑kj=1 sij = 0,

i vincoli∑h

i=1 sij = 0, j = 1, 2, . . . , k−1, ed i vincoli∑k

j=1 sij = 0, i = 1, 2, . . . , h−1. Dunque, delleh · k contingenze sij solo gl = (h− 1)(k − 1) risultano linearmente indipendenti.

Per contro, se le frequenze teoriche nij sono valutate in base a considerazioni extra-sperimentali,i gradi di liberta devono essere valutati diversamente valendo, in ogni caso, la regola generale df =numero scarti − vincoli. Vedasi esempio G che propone un celebre esperimento dovuto a GregorMendel (1865).

Le considerazioni svolte si estendono a tutti gli indici basati sugli scarti. Anche per essi si parladi gradi di liberta.

Quanto piu gli sij sono prossimi a zero, tanto piu e debole il legame tra i caratteri x e y. Percontro, scarti grandi sono indice di accentuata connessione (o dipendenza) tra i caratteri.

Fra x e y vi e perfetta dipendenza bilaterale se: (i) h = k, (ii) ad ogni modalita Ai di x corrisponde(con frequenza non nulla) una sola modalita Bj di y e viceversa. Si ha perfetta dipendenza unilaterale

di x da y se: (i) h < k, (ii) ad ogni modalita Ai di x corrisponde una sola modalita Bj di y ma nonviceversa. In modo del tutto analogo si definisce la perfetta dipendenza unilaterale di y da x.

B Indici di Mortara, di Pearson, di Yule, di Tschuprow. Gli indici che danno una misura dellaconnessione fra caratteri sono classificati in indici basati sulle contingenze in valore assoluto oppureal quadrato. Il corso di SM trattera solo alcuni di essi. Vale innanzi tutto l’importante teorema

Teorema 2.3. Per ogni tavola di frequenze (h, k) vale la disuguaglianza

h∑

i=1

k∑

j=1

|sij | =h∑

i=1

k∑

j=1

|nij − nij | = N

h∑

i=1

k∑

j=1

|pij − ricj | ≤ 2 N .

Il segno di uguale puo valere solo per h = k.

Grazie al teorema si puo adottare come indice di connessione normalizzato (cioe contenuto in[0, 1]) l’indice dovuto allo statistico italiano Giorgio Mortara

CM =1

2 N

h∑

i=1

k∑

j=1

|nij − nij | .

Page 34: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

2.5 Esempi 33

L’indice χ2, o anche Chi-2, dovuto a K. Pearson (1900) e dato da

χ2 =h∑

i=1

k∑

j=1

(nij − nij)2

nij= N

h∑

i=1

k∑

j=1

n2ij

RiCj− 1 = N

h∑

i=1

k∑

j=1

p2ij

ricj− 1 = N Φ2.

Si osservi che l’indice χ2 e lineare rispetto a N e Φ2. Quest’ultimo dipende solo dalla “forma”

della tavola. Dall’indice χ2 si ricava l’indice di Yule Φ =

√χ2

N. Vale l’importante teorema

Teorema 2.4. Per ogni tavola di frequenze (h, k) sussistono le disuguaglianze

h∑

i=1

k∑

j=1

n2ij

RiCj≥ 1 , Φ2 ≤ minh− 1, k − 1 .

Il teorema 2.4 “suggerisce” gli indici normalizzati di Cramer e Tschuprow

ψ =Φ2

minh− 1, k − 1 =χ2

N minh− 1, k − 1 ,

T =Φ2

√(h− 1) (k − 1)

=χ2

N√

(h− 1) (k − 1),

E facile constatare che ψ ≥ T , valendo il segno di uguale sse h = k.

2.5 EsempiB Esempio A. Si chiede l’analisi delle osservazioni (fittizie) riportate nella Tav.7. Si ipotizza chetra x e y vi sia una correlazione spuria.

xi yi x2i xi yi y2

i

0.5 1.5 0.25 0.75 2.251.0 3.6 1.00 3.60 12.961.5 4.2 2.25 6.30 17.642.2 3.2 4.84 7.04 10.243.0 5.2 9.00 15.60 27.044.1 4.8 16.81 19.68 23.044.8 5.9 23.04 28.32 34.815.0 7.5 25.00 37.50 56.256.4 6.6 40.96 42.24 43.56

28.5 42.5 123.15 161.03 227.79

Tav.7 - Calcoli per l’esempio A.

Si ha n = 9, x = 1928.5 = 3.167, y = 1

942.5 = 4.722, V ar(x) = 19123.15 − (3.167)2 = 3.656,

Cov(x, y) = 19161.03 − 3.167 · 4.722 = 2.9385, V ar(y) = 1

9227.79 − (4.722)2 = 3.011, sx = 1.912,sy = 1.7351. I coefficienti di regressione e le intercette delle rette di regressione sono

Page 35: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

34 Capitolo 2 Caratteri multipli

1 2 3 4 5 6

1

2

3

4

5

6

7

HxL

HyL

y = Β`

0 + Β`

1x

x = Α0 + Α1 y

x

y

Figura 2.2. - Osservazioni e rette di regressione.

α1 =n

∑xiyi − (

∑xi)(

∑yi)

n∑

y2i − (

∑yi)2

=238.02243.86

= 0.9761 ,

β1 =n

∑xiyi − (

∑xi)(

∑yi)

n∑

x2i − (

∑xi)2

=238.02296.10

= 0.8039 ,

;

α0 = x− α1 · y = −1.4425 ,

β0 = y − β1 · x = 2.1767 .

Il coefficiente di correlazione, r = 0.8858, indica che tra x ed y vi e una buona correlazionepositiva. Le misure globali degli scarti valgono

SG(α0, α1) = Σx2

i − α0Σxi − α1Σxiyi = 123.15− (−1.4426)28.5− 0.9761 · 161.03 = 7.0827,

SG(β0, β1) = Σy2i − β0Σyi − β1Σxiyi = 227.79− 2.1767 · 42.5− 0.8039 · 161.03 = 5.8364.

B Esempio B. Si propone l’analisi statistica di n = 5 osservazioni doppie (x, y). L’esempio (fittizio)suppone che y dipenda da x e che sulla forma della legge vi sia incertezza. Nella Tav. 8 sono riportatele osservazioni (xi, yi) e le operazioni necessarie per stimare i parametri delle leggi che vengono divolta in volta proposte.

xi yi x2i xi yi y2

i x3i x4

i x5i x6

i x2i yi x3

i yi

1 8 1 8 64 1 1 1 1 8 82 12 4 24 144 8 16 32 64 48 963 22 9 66 484 27 81 243 729 198 5944 28 16 112 784 64 256 1024 4096 448 17925 30 25 150 900 125 625 3125 15625 750 3750

15 100 55 360 2376 225 979 4425 20515 1452 6240

Tav.8 - Calcoli per l’esempio B.

Ricavati gli indici x = 3, y = 20, V ar(x) = 2, Cov(x, y) = 12, V ar(y) = 75.2, sx = 1.4142,sy = 8.6718 e r = 0.9785, si considerano alcune leggi interpolanti.

Page 36: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

2.5 Esempi 35

• Retta y = β0. Si ha β0 = 1n

∑yi = 20, Sy

G(β0) =∑

y2i − β0

∑yi = Devy = 376.

• Retta y = β1x, (a). Si ha β1 =∑

xiyi∑x2

i

=36055

= 6.5455, S(a)G (β1) =

∑y2

i − β1

∑xiyi = 19.636.

• Retta y = β0 + β1x, (b). Si ha β1 =n

∑xiyi − (

∑xi)(

∑yi)

n∑

x2i − (

∑xi)2

=5 · 360− 15 · 100

5 · 55− 152= 6, β0 =

y − β1x = 2, S(b)G (β0, β1) =

∑y2

i − β0

∑yi − β1

∑xiyi = 16.

• Parabola y = β0 + β1x + β2x2, (c). Le stime dei m.q., β0 = −2, β1 = 9.429 e β2 = −0.5714,

sono ottenute risolvendo il sistema lineare (3× 3)

n∑

xi

∑x2

i∑xi

∑x2

i

∑x3

i∑x2

i

∑x3

i

∑x4

i

·

β0

β1

β2

=

∑yi∑

xiyi∑x2

i yi

.

La misura degli scarti e S(c)G (β0, β1, β2) =

∑y2

i − β0

∑yi − β1

∑xiyi −β2

∑x2

i yi = 11.429.• Parabola y = β0 + β2x

2, (d). Le stime dei m.q., β0 = 9.647 e β2 = 0.9412, sono state ricavatedal sistema (2× 2)

[n

∑x2

i∑x2

i

∑x4

i

(β0

β2

)=

( ∑yi∑

x2i yi

).

La misura degli scarti S(d)G (β0, β2) =

∑y2

i−β0

∑yi− β2

∑x2

i yi = 44.706, quasi tre volte superiorealla misura S

(b)G (β0, β1) = 16 ottenuta con la retta, mostra che la parabola, mancante del termine di

primo grado, non e soddisfacente.La figura 2.3 riporta le rette (a) e (b) e le parabole (c) e (d). Di tali leggi, solo la retta (b) passa

per il baricentro (x, y).

• Polinomio y = β0+β1x+β2x2+β3x

3. Si ha β0 = −12, β1 = −10.238, β2 = 6.9286, β3 = −0.8333e Sy

G(β0, β1, β2, β3) = 1.4286.

1 2 3 4 5

5

10

15

20

25

30

HxL

HyL

a

b

x-

y-

1 2 3 4 5

5

10

15

20

25

30

HxL

HyL c

d

Figura 2.3. - Osservazioni e leggi interpolanti a, b, c, d.

B Nota. Assumendo la classe dei polinomi dotati di tutti i coefficienti, si dimostra che, al cresceredel grado k, decresce la misura degli scarti indicata, per brevita, con S

(k)G . Si ha S

(0)G ≥ S

(1)G ≥ S

(2)G . . .

Page 37: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

36 Capitolo 2 Caratteri multipli

e dunque 1 = δ(0) ≥ δ(1) ≥ δ(2) . . . , essendo δ(k) =S

(k)G

S(0)G

. Piu utile di δ(k) e l’indice relativo di

miglioramento φ(k) =S

(k−1)G − S

(k)G

S(k−1)G

= 1 − S(k)G

S(k−1)G

, che fornisce il decremento relativo della misura

degli scarti quando dal polinomio di grado k − 1 si passa a quello di grado k.Nel caso dell’esempio B si ha φ(1) = 1 − 16

376 = 0.9575, φ(2) = 1 − 11.42916 = 0.2857 e φ(3) =

1 − 1.428611.429 = 0.8750. Dal confronto delle funzioni (a), (b), (c) e (d), vedi figura 2.3, e degli indici

φ(k), siamo propensi a scegliere la retta (b), che presenta semplicita analitica e limitata entita degliscarti. (L’artificiosita dell’esempio non consente ulteriori considerazioni.) CB Esempio C. Si supponga che sul tipo di dipendenza di y da x vi sia incertezza tra le leggiy = h · e−kx (1) e xφyψ = c (2). Si veda alla fine del paragrafo 2.3. Passando ai logaritmi, postou = log x, v = log y e ψ = 1, le leggi divengono v = β0 +β1 x e v = γ0 +γ1u, con β0 = log h, β1 = −k,γ0 = log c e γ1 = −φ.

La Tav.9 riporta (n = 5) osservazioni (xi, yi), le corrispondenti (ui, vi) e i calcoli necessari perstimare i coefficienti (trasformati) delle leggi (1) e (2). Facilmente si ha

β1 =n

∑xivi − (

∑xi)(

∑vi)

n∑

x2i − (

∑xi)2

=−80.9306

386.= −0.2097 ,

γ1 =n

∑uivi − (

∑ui)(

∑vi)

n∑

u2i − (

∑ui)2

=−18.44717.6163

= −1.0472 ,

;

β0 = v − β1 · x = 2.3614 ,

γ0 = v − γ1 · u = 2.6297 .

xi yi ui vi u2i uivi x2

i xi vi y(1)i ε2i (1) y

(2)i ε2i (2)

1 15 0. 2.7081 0. 0. 1 2.7081 8.6012 40.9449 13.8696 1.2778

2 6 0.6931 1.7918 0.4805 1.2420 4 3.5835 6.9741 0.9488 6.7116 0.5064

3 4 1.0986 1.3863 1.2069 1.5230 9 4.1589 5.6548 2.7383 4.3896 0.1518

5 3 1.6094 1.0986 2.5903 1.7481 25 5.4931 3.7177 0.5151 2.5710 0.1840

12 1 2.4849 0. 6.1748 0. 144 0. 0.8566 0.0206 1.0279 0.0008

23 29 5.8861 6.9847 10.4525 4.5331 183 15.9435 45.1676 2.1207

Tav.9 - Calcoli per l’esempio C.

2 4 6 8 10 12 141

2

5

10

20

HxL

log y

H1L1 2 5 10 20

1

2

5

10

20

log x

log y

H2L2 4 6 8 10 12 14

2468

10121416

H1LH2L HxL

HyL

Figura 2.4. - Punti e rette (1) e (2) in scala semi-logaritmica e logaritmica.

Le stime dei coefficienti (originari) sono h = eβ0 = 10.606, k = 0.2097, c = eγ0 = 13.8698,φ = 1.0472. Si possono cosı calcolare, ∀xi, le ordinate y

(k)i , k = 1, 2, nonche gli scarti εi(k) = yi−y

(k)i ,

Page 38: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

2.5 Esempi 37

vedi Tav.9. Poiche∑

ε2i (1) = 45.1676 e∑

ε2i (2) = 2.1207, scegliamo la legge (2). La scelta econfermata dal confronto fra i grafici di (1) e (2) sul piano (x, y); vedi figure 2.4.

B Esempio D. Delle leggi y =h

xe y =

1kx + q

, si stabilisca quale di esse si adatta meglio ai punti

(1,8), (2,3), (3,2) e (7,1). Delle leggi y = ax2 + b e y = c + k · |x| 12 , si stabilisca quale delle dueinterpola meglio i punti (-5,4), (-2,2), (0,0), (1,1) e (4,4).

B Esempio E. Date le leggi y = tan(ax + b), y = cos( 1

kx + q

), y = c + sin kx, y = lg(hx2 + q),

y = k · lg(hx2 + q), y = h + log ax, y =c

1 + q · e−hx, quali di esse sono linearizzabili?

B Esempio F. La Tav.10 fornisce gli occupati per settori di attivita economica e sesso, rilevati nel1985 in un gruppo di comuni della Campania. Le Tav.11, Tav.12 e Tav.13 riportano le proporzionicongiunte, condizionate di riga e di colonna, le Tav.14 e Tav.15 le frequenze teoriche e le contingenze.

Maschi Femmine totale

Agricoltura 1485 812 2297

Industria 5270 1626 6896

Altre att. 7232 4318 11550

totale 13987 6756 20743

Tav.10 - Frequenze congiunte.

Maschi Femmine totale

Agricoltura 7.16 3.91 11.07

Industria 25.41 7.84 33.25

Altre att. 34.86 20.82 55.68

totale 67.43 32.57 100.00

Tav.11 - Proporzioni congiunte. in (%).

Maschi Femmine totale

Agricoltura 64.65 35.35 100.

Industria 76.42 23.58 100.

Altre att. 62.61 37.39 100.

totale 67.43 32.57 100.

Tav.12 - Prop. cond. al sesso, in (%).

Maschi Femmine totale

Agricoltura 10.62 12.02 11.07

Industria 37.68 24.07 33.25

Altre att. 51.71 63.91 55.68

totale 100.00 100.00 100.00

Tav.13 - Prop. cond. al settore, in (%).

Maschi Femmine totale

Agricoltura 1548.87 748.13 2297.00

Industria 4649.97 2246.03 6896.00

Altre att. 7788.16 3761.84 11550.00

totale 13987.00 6756.00 20743.00

Tav.14 - Frequenze teoriche.

Maschi Femmine totale

Agricoltura −63.87 63.87 .00

Industria 620.03 −620.03 .00

Altre att. −556.16 556.16 .00

totale .00 .00 .00

Tav.15 - Contingenze.

Page 39: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

38 Capitolo 2 Caratteri multipli

I gradi di liberta sono gl = (3− 1)× (2− 1) = 2. Essendo∑3

i=1

∑2j=1 |sij | = 2(63.87 + 620.03 +

556.16) = 2480.12, l’indice di Mortara vale CM = 0.05978.L’indice di Pearson e

χ2 =

3Xi=1

2Xj=1

(nij − nij)2

nij=

(1485− 1548.87)2

1548.87+

(5270− 4649.97)2

4649.97+ · · ·+ (4318− 3761.84)2

3761.84= 383.864,

o anche

χ2 = 20743h 1

13987

14852

2297+

52702

6895+

72322

11550

+

1

6756

8122

2297+

16262

6896+

43182

11550

− 1i

= 20743 ·Φ2 = 383.864,

dove Φ2 = 0.018506, da cui facilmente si ricava l’indice di Yule Φ =

√χ2

N= 0.13604. Gli indici di

Cramer e di Tschuprow sono

ψ =Φ2

minh− 1, k − 1 = 0.018506 , T =Φ2

√(h− 1)(k − 1)

= 0.013086 .

B Esempio G. Yule e Kendall (1947) intervistarono 1000 soggetti provenienti da 5 gruppi nazionali:inglesi, francesi, tedeschi, italiani e spagnoli. A ciascun soggetto venne domandato quale fosse lamusica preferita (tra le suddette 5 nazionalita). La Tav.16 riporta la sintesi dell’intervista. Lanazionalita dell’intervistato e il carattere di riga, la musica preferita e il carattere di colonna.

Volendo studiare la dipendenza dei descritti caratteri si calcolino i gradi di liberta, gli indici diMortara, Pearson, Yule, Cramer e di Tschuprow.

ingl. franc. ted. ital. spagn. totale

ingl. 32 16 75 47 30 200

franc. 10 67 42 41 40 200

ted. 12 23 107 36 22 200

ital. 16 20 44 76 44 200

spagn. 8 53 30 43 66 200

totale 78 179 298 243 202 1000

Tav.16 - Frequenze.

B Esempio H. M.J. Kearsey (1964) considero 200 uova fertili di due ceppi (A e B) di moscerino

disch. non disch. totale

A 69 31 100

B 87 13 100

totale 156 44 200

Tav.17 - Frequenze.

disch. non disch. totale

A 78 22 100

B 78 22 100

totale 156 44 200

Tav.18 - Frequenze teoriche.

Page 40: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

2.5 Esempi 39

della frutta (Drosophila melanogaster) allo scopo di studiare la loro capacita di schiudersi e passareallo stato larvale, vedi Tav.17. Per valutare la diversita fra i due ceppi, fu calcolato (con l’aiuto

della Tav.18 delle frequenze teoriche) l’indice χ2, con df = 1. Avendo trovato χ2 =(69− 78)2

78+

(31− 22)2

22+

(87− 78)2

78+

(13− 22)2

22= 9.440, si concluse che fra i ceppi vi era notevole diversita.

B Nota. Per determinare i gradi di liberta dell’indice χ2 e necessario fare attenzione al “criterio”con cui si calcola la tavola delle frequenze congiunte teoriche, ovvero al modo con cui entrano, nelloro calcolo, le frequenze marginali (cioe i vincoli). Gli esempi classici che seguono, presi dal mondodella genetica, mostrano “che cosa si debba sostituire” alla regola solita df = (h− 1)× (k − 1). C

B Esempio I. K. Mather (1938), allo scopo di studiare un gene che interviene nella pigmentazionedella testa dei topi, fece incrociare due maschi A e B eterozigoti Gg con due differenti gruppi difemmine omozigoti gg. Vedi Tav.19. Ci si aspetta che le progenie discendenti dai due maschi sianocostituite, vedi Tav.20 delle frequenze teoriche, da un ugual numero di individui Gg e gg.

Gg gg totale

A 68 60 128

B 73 49 122

totale 141 109 250

Tav.19 - Frequenze.

Gg gg totale

A 64 64 128

B 61 61 122

totale 125 125 250

Tav.20 - Frequenze teoriche.

Per valutare la diversita fra le due progenie fu calcolato (con l’aiuto della Tav.20) l’indice di K.

Pearson χ2 = 2× (68− 64)2

64+ 2× (73− 61)2

61= 5.2213.

Il fatto che le frequenze teoriche siano state calcolate ripartendo le progenie A e B in conformitaalla legge 1

2 : 12 implica che gli scarti sono ora soggetti ai due vincoli (di riga)

∑2j=1 s1j =

∑2j=1 s2j = 0

la qual cosa fa concludere che df = 2× 2− 2 = 2.

B Esempio L. G. Mendel (1865), nel corso delle sue indagini sulla ereditarieta dei caratteri, osservoche su 556 piselli provenienti da 34 piante di Pisum sativum, 315 erano lisci e gialli, 108 lisci e verdi,101 rugosi e gialli, 32 rugosi e verdi. Vedi Tav.16.

lisci rugosi totale

gialli 315 101 416

verdi 108 32 140

totale 423 133 556

Tav.16 - Frequenze.

lisci rugosi totale

gialli 312.75 104.25 417.00

verdi 104.25 34.75 139.00

totale 417.00 139.00 556.00

Tav.17 - Frequenze teoriche.

Mendel avanzo due ipotesi. La prima, oggi nota come I legge di Mendel, e che dominante e recessivo(nell’esempio giallo e verde per il carattere colore e liscio e rugoso per il carattere superficie) stannonel rapporto 3 : 1. La seconda, oggi nota come II legge di Mendel, e che due differenti caratteri

Page 41: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

40 Capitolo 2 Caratteri multipli

(incontrandosi) non si influenzano reciprocamente, ovvero non alterano il suddetto rapporto 3 : 1.Come dire, insomma, che le frequenze fenotipiche stanno nella proporzione 9 : 3 : 3 : 1. Con taliipotesi, i 556 piselli si dovrebbero ripartire secondo le frequenze teoriche: n11 = 9

16556, n12 = 316556,

n21 = 316556, n22 = 1

16556, riportate in Tav.17. L’indice di Pearson risultando piccolo

χ2 =(315− 312.75)2

312.75+

(108− 104.25)2

104.25+

(101− 104.25)2

104.25+

(32− 34.75)2

34.75= 0.470 ,

mostra la validita delle ipotesi mendeliane. Il fatto che le frequenze teoriche siano state calcolateripartendo le 556 osservazioni in conformita alle leggi di Mendel, implica che gli scarti sono soggettial solo vincolo

∑2i=1

∑2j=1 sij = 0 la qual cosa fa concludere che df = 2× 2− 1 = 3.

Una nota storica. Sappiamo oggi che ciascuno dei caratteri presi in esame, e sotto il controllo diun singolo gene. Pertanto i fenotipi segregano in un modo facilmente riconoscibile. Non v’ha dubbioche, da questo punto di vista, l’esperimento di Mendel si rivelo particolarmente fortunato.

Page 42: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

3PROBABILIT A ELEMENTARE

The probability do not exist. (Bruno de Finetti - Theory of Probability)Dio non giuoca a dadi. (Albert Einstein - Carteggio con Niels Bohr)

Alea iacta est. (Caio Giulio Cesare, 49 a.C.)

Si indica col termine logica la disciplina che insegna a controllare la correttezza dei ragionamenti.Il calcolo delle probabilita e la logica che insegna a ragionare correttamente quando, per carenza diinformazioni, ci troviamo in situazioni di incertezza.

3.1 Eventi, nozioni di logicaLa logica si occupa di relazioni e di operazioni fra eventi che siano decidibili. Un evento e decidibile see possibile stabilirne univocamente il contenuto o di verita o di falsita. Dunque: un evento decidibile

(o la proposizione che lo traduce) e un ente logico capace di assumere due soli valori. Vero o falso.Se, in qualche modo, si deduce logicamente che l’evento da noi considerato e vero [falso] allora

diremo che l’evento e certo [impossibile] e lo chiamiamo Ω [Ø].La verifica del contenuto di verita di un evento e affidata alle informazioni effettivamente disponi-

bili. Se da esse non si puo stabilire con certezza se A e vero o falso, diremo che l’evento e possibile.Gli eventi di cui si occupa il calcolo delle probabilita sono solo gli eventi decidibili e possibili (e cometali aleatori o casuali).

Dati gli eventi E1 e E2 si dice che E1 implica E2, e si scrive E1 ⇒ E2, o anche E1 ⊂ E2, se dallaverita di E1 discende necessariamente la verita di E2. Se E1 ⇒ E2 e E2 ⇒ E1, allora E1 = E2.

41

Page 43: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

42 Capitolo 3 Probabilita elementare

Data la collezione di eventi E1, E2, . . . , En, . . . , con Ei ⊂ Ω, ∀i, si possono, a partire da essa,costruire nuovi eventi mediante opportune operazioni.

B Operazioni logiche sugli eventi.

Dato l’evento E ⊂ Ω, si definisce evento contrario (o negazione) di E, e si indica con E (o Ec) l’eventoche e vero sse E e falso e viceversa. Si ha E ⊂ Ω, ¯A = A, Ω = Ø.

Dati gli eventi E1 e E2 si definisce somma logica (o riunione), e si scrive E1 ∪ E2, l’evento che evero se e vero almeno uno degli eventi E1 e E2 e, per conseguenza, falso se entrambi sono falsi. Siha A ∪ A = Ω, A ∪A = A, Ω ∪Ø = Ω.

Si definisce prodotto logico (o intersezione), e si scrive E1 ∩ E2, l’evento che e vero se sono verientrambi gli eventi E1 e E2 e, per conseguenza, falso se anche uno di essi e falso. Si ha A ∩ A = Ø,Ω ∩Ø = Ø, A ∩A = A.

Si definisce differenza, e si scrive E1 \ E2, l’evento che e vero se E1 e vero ed e falso E2. Si haΩ \A = A, Ω \Ø = Ω.

Si dimostra che le operazioni somma e differenza sono deducibili dalle operazioni di negazioneed intersezione; per tale motivo esse sono dette necessarie. Si ha, infatti, rispettivamente E1 ∪ E2 =E1 ∩ E2 (noto come teorema di De Morgan), E1 \E2 = E1∩ E2. E facile dimostrare che per la sommalogica valgono le proprieta associativa e commutativa. Altrettanto dicasi per il prodotto logico.

Gli eventi A e B si dicono incompatibili se A ∩ B = Ø. Vale, in generale, la scomposizioneA = (A ∩B) ∪ (A ∩ B), con (A ∩B) ∩ (A ∩ B) = Ø.

Definizione 3.1. Si dice che gli eventi A1, A2, . . . , An costituiscono una partizione dell’evento certo

(o scomposizione di Ω) se (i) ∀j 6= k, Aj ∩Ak = Ø e se (ii)⋃n

j=1 Aj = Ω.

I concetti della logica degli eventi si possono far corrispondere a quelli della teoria degli insiemi.L’abitudine a trattare gli eventi come insiemi (e viceversa) ha condotto alla mescolanza dei linguaggie delle simbologie. (Si e gia visto che al posto della scrittura A ⇒ B oggi si preferisce A ⊂ B.) Siveda in proposito lo schema che segue

Eventi Insiemi Eventi Insiemicerto ambiente impossibile vuotocontrario complementare implicazione inclusioneprodotto logico intersezione somma logica unioneincompatibili disgiunti classe completa partizione

Corrispondenza fra eventi ed insiemi.

Puo essere utile rappresentare gli eventi mediante il diagramma di Venn, cioe con insiemi di puntiin un quadrato che rappresenta l’evento certo Ω.

Definizione 3.2. La collezione di eventi A = A, B,C, . . . contenuti in Ω costituisce un’algebra di

Boole, se essa e chiusa rispetto alle operazioni di negazione e di intersezione (e dunque di unione).

Dunque se: (i) A ∈ A, allora anche A ∈ A, (ii) A,B ∈ A allora si ha A ∩ B ∈ A e A ∪ B ∈ A.E facile mostrare che se la collezione di eventi A,B, C, . . . e un’algebra di Boole, allora essa devecomprendere anche gli eventi Ω e Ø.

Page 44: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

3.2 Assiomi 43

Definizione 3.3. L’algebra di Boole A e una σ−algebra o classe completamente addittiva, se essa echiusa anche rispetto all’unione infinita.

3.2 AssiomiIl piu accettato sistema assiomatico, completo e non contraddittorio, per la costruzione della teoriamatematica del calcolo delle probabilita risale al 1933 ed e dovuta ad Andrei Nikolaevic Kolmogorov(1903-1987). La sua semplicita fu motivo non ultimo del suo successo. Gli assiomi sono(i) Gli eventi A,B,C, . . . , sottoinsiemi di Ω, costituiscono una σ−algebra A;(ii) ∀A ∈ A, e associato un numero reale P(A) ≥ 0;(iii) P(Ω) = 1;(iv) ∀A,B ∈ A, con A ∩B = Ø, ⇒ P(A ∪B) = P(A) + P(B);(v) Se An, n = 1, 2, . . . e una successione decrescente di eventi appartenenti ad A con limn→∞An =Ø ⇒ limn→∞ P(An) = 0.

Agli assiomi (ii), (iii) e (iv), che costituiscono il nucleo essenziale del sistema e che erano notida tempo, Kolmogorov affianco gli assiomi (i) e (v) allo scopo di trattare il calcolo delle probabilitacon gli strumenti della teoria della misura: P(·) e la funzione che misura gli eventi della σ−algebra A.La terna Ω,A,P e detta spazio di probabilita.

Il sistema di Kolmogorov si completa con la definizione di probabilita condizionata.

Definizione 3.4. Dati gli eventi A,B ∈ A, con P(B) > 0, si definisce probabilita di A condizionata

all’accadere di B o, piu semplicemente, di A dato B il rapporto

P(A | B) =P(A ∩B)P(B)

.

Intuitivamente. Assegnati due eventi A e B, per probabilita di A dato B, P(A | B), si intende laprobabilita che si verifichi A nell’ipotesi che B si sia verificato. Ovvero, P(A | B) rappresenta unari-valutazione della probabilita di A disponendo dell’informazione che B si e verificato.

3.3 Prime conseguenze degli assiomiSi danno alcuni teoremi elementari del calcolo delle probabilita. Le dimostrazioni sono omesse.

Teorema 3.1. ∀A ∈ A, P(A) + P(A) = 1.

Teorema 3.2. P(Ø) = 0.

Teorema 3.3. ∀A ∈ A, P(A) ≤ 1.

Teorema 3.4. Se A ⊂ B ⇒ P(A) ≤ P(B).

Teorema 3.5. ∀A,B ∈ A si ha P(A ∪B) = P(A) + P(B)− P(A ∩B).

Page 45: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

44 Capitolo 3 Probabilita elementare

Teorema 3.6. Per ogni collezione A1, A2, . . . , An ∈ A si ha P(⋃n

j=1 Aj) ≤∑n

j=1 P(Aj).

Teorema 3.7. ∀A,B ∈ A si ha P(A ∪B) ≥ P(A) + P(B)− 1.

Teorema 3.8. Per ogni collezione di eventi mutuamente incompatibili A1, A2, . . . , An ∈ A si haP(

⋃nj=1 Aj) =

∑nj=1 P(Aj).

Teorema 3.9. Dati gli eventi A,B, C ∈ A si ha P(A∪B ∪C) = P(A) + P(B) + P(C)− P(A∩B)−−P(A ∩ C)− P(B ∩ C) + P(A ∩B ∩ C).

I teoremi 3.6 e 3.7 forniscono le disuguaglianze di Boole e di Bonferroni. I teoremi 3.8 e 3.9 portanoil nome di teorema delle probabilita totali: il primo per eventi incompatibili, il secondo per tre eventiqualsiasi. Per brevita non si da l’estensione del teorema 3.9 al caso di piu eventi.

Dalla definizione 3.4 di probabilita condizionata segue la formula P(A ∩ B) = P(B)P(A | B),o anche P(A ∩ B) = P(A)P(B | A), un tempo nota come teorema delle probabilita composte perdue eventi qualsiasi. A parole: dati due eventi A e B, la probabilita che accadano entrambi, edata dalla probabilita che accada B per la probabilita che accada A posto che sia accaduto B. O,equivalentemente: la probabilita che accadano A e B, e data dalla probabilita che accada A per laprobabilita che accada B posto che sia accaduto A. Valgono i teoremi

Definizione 3.5. Gli eventi A e B si dicono stocasticamente indipendenti se P(A ∩B) = P(A)P(B)o, equivalentemente, se P(A|B) = P(A).

Teorema 3.10. Se A e B sono indipendenti allora lo sono anche A e B, A e B, A e B.

Grazie ai teoremi delle probabilita composte e delle probabilita totali si ottiene la formula discomposizione P(E) = P(H)P(E | H) + P(H)P(E | H), ∀H,E ⊂ Ω che entra nella formula di Bayes.

Nel seguito il simbolo “∩” potra essere sostituito dalla virgola. Si da l’estensione del teoremadelle probabilita composte ad n eventi qualsiasi

Teorema 3.11. La probabilita del prodotto logico degli eventi A1, A2, . . . , An ⊂ Ω e

P( n⋂

j=1

Aj

)= P(A1, A2, . . . , An) = P(A1)P(A2|A1)P(A3|A1, A2) · · ·P(An|A1, A2, . . . , An−1) . (3.1)

Se gli eventi Ai sono mutuamente indipendenti la probabilita del loro prodotto logico e pari alprodotto delle probabilita dei singoli eventi e la (3.2) diviene P(

⋂nj=1 Aj) =

∏nj=1 P(Aj). Il viceversa

e vero solo per n = 2. Per n ≥ 3 non e detto, pur valendo tale fattorizzazione, che gli Aj sianoindipendenti. Nei paragrafi 3.6 e 3.7 si cerchera di chiarire il concetto di indipendenza. Si vedano inparticolare gli esempi (b), (c) e (d).

Si da l’enunciato del teorema di Thomas Bayes (1701-1761) noto anche come teorema delle cause

Teorema 3.12. (Bayes, 1763.) Data la partizione dell’evento certo Hj , j = 1, . . . , k e l’eventoE ⊂ Ω, compatibile con almeno uno degli Hj, con P(E) > 0 e P(Hj) > 0, ∀j, si ha

P(Hj | E) = P(Hj) · P(E | Hj)P(E)

=P(Hj)P(E | Hj)∑ki=1 P(Hi)P(E | Hi)

.

Page 46: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

3.4 Cenni sulla nozione di probabilita 45

B Nota. Si supponga che sugli eventi Hj , detti anche cause o ipotesi, un elicitatore fornisca levalutazioni di probabilita a priori P(Hj), j = 1, 2, . . . , k. Si supponga poi che si verifichi E, eventologicamente compatibile con almeno uno degli Hj . Il teorema di Bayes e lo strumento logico peraggiornare, alla luce di E, le valutazioni a priori P(Hj) con le probabilita a posteriori P(Hj |E).

Se il fattore k =P(E | Hj)P(E)

= 1, si dice che il verificarsi di E non modifica la valutazione a priori

di Hj . Per contro, se k > 1 [k < 1] si dice che l’evidenza E rafforza [indebolisce] l’ipotesi Hj . Leprobabilita P(E|Hj) sono dette verosimiglianze delle ipotesi Hj dato E.

3.4 Cenni sulla nozione di probabilit aPuo apparire paradossale che gli assiomi ed i teoremi del calcolo delle probabilita, cosı come sonoesposti, non siano preceduti da una definizione formale di probabilita e che la teoria matematicanon necessiti di una specifica nozione di probabilita.

Lo sviluppo del calcolo delle probabilita ha dato luogo, essenzialmente, a tre definizioni. Leriportiamo senza alcun commento.

B Definizione razionalista. La probabilita di un evento A e il rapporto del numero nA dei casi favorevolial manifestarsi di A ed il numero n dei casi possibili, giudicati ugualmente possibili: P(A) .=

nA

n.

B Definizione frequentista o empirista (detta anche legge empirica del caso). In una successione di nT

prove che si svolgono nelle stesse condizioni in cui A si verifica sA volte, si definisce probabilita diA il limite (improprio) a cui tende la proporzione empirica pA =

sA

nT, al divergere di nT . Ovvero

P(A) .= limnT→∞ pA.

B Definizione soggettivistica. La probabilita di un evento A e la misura del grado di fiducia che unindividuo coerente attribuisce, secondo le sue informazioni ed opinioni, all’avverarsi di A. Ovvero:la probabilita di un evento A, secondo l’opinione di un dato individuo, e il prezzo pA che egli valutaequo e coerente attribuire all’importo unitario esigibile al verificarsi di A. Circa il significato di equita

e coerenza, e sufficiente qui dire che, in ogni momento ed alle stesse condizioni, banco e giocatorepossono scambiarsi e che non sono consentite valutazioni di probabilita che permettono combinazionidi scommesse a perdita o guadagno certo.

Sul significato e sulla nozione di probabilita non vi e ne accordo ne prevalenza d’opinioni. Eopinione di chi scrive che le definizioni razionalista e l’empirista non sono che pseudo-definizioni.

Senza voler attenuare le profonde differenze fra le citate definizioni, diciamo che esse possonoessere riguardate, in ogni caso, come particolari procedure di valutazione delle probabilita.

3.5 Fenomeni aleatori a valori numericiDi norma l’aggettivo “aleatorio” e riferito all’esito di una prova (o di un esperimento) casuale. A taleesito, non predeterminabile con sicurezza prima della prova, puo essere associata una variabile chesi dira “aleatoria” che, come tale sara oggetto di valutazione di probabilita.

Page 47: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

46 Capitolo 3 Probabilita elementare

Ad esempio, nella verifica della qualita di una produzione, l’esperimento consiste nell’esaminaren pezzi e di accertare quanti di essi siano accettabili. Il numero aleatorio X di tali pezzi, la nostrav.a., prende valori nell’insieme X = 0, 1, . . . n. Se la prova consiste nel seminare una quantita notadi grano in un certo terreno, e naturale associare alla prova la quantita aleatoria X di grano cheverra raccolto. (In tal caso X ∈ X ⊂ R+.) Aleatorio e il numero di clienti che entrano in banca,il numero di telefonate giornaliere di un certo utente, aleatoria e l’entita della spesa settimanale diuna famiglia, etc. Tutto cio suggerisce la definizione.

Definizione 3.6. Si da il nome di variabile aleatoria (in sigla v.a.) al risultato numerico associato aduna prova o ad un esperimento aleatorio. Come tale, la v.a. e un numero compiutamente determinatoma non ancora conosciuto per mancanza di informazione.

Di norma con le maiuscole X, Y, Z, . . . sono indicate le v.a., con le rispettive minuscole x, y, z, . . .

le realizzazioni delle v.a. e con le maiuscole corsive X ,Y,Z, . . . gli insiemi dei valori che le v.a.possono assumere.

Le v.a., in tutto per tutto eventi aleatori, possono essere discrete o continue. Se la v.a. X ediscreta, X e costituito da un insieme (al piu) numerabile di punti. Se e continua, X e la retta realeo una sua porzione. Si osservi che in base all’assioma (iii) si ha P(X ∈ X ) = 1.

Come si vedra piu avanti, in molti casi le prove possono essere ricondotte a schemi di estrazioni

da urne. Con urna si intende non solamente un contenitore ideale di palline uguali fra loro, salvo chenel colore, le quali possono essere estratte in prove casuali, ma anche il tipo delle prove.

Se l’urna e costituita da palline di due (o piu) colori, possiamo chiamare (convenzionalmente)successo l’estrazione della pallina color A e con insuccesso la pallina di altro colore, cioe A. Sedopo ogni estrazione la pallina e [non e] reimbussolata o restituita, la prova e con essa l’urna e dettabernoulliana [esaustiva]. (Si osservi che la prova, aleatoria nell’esito, si svolge secondo un precisoprotocollo, che definisce il tipo di urna.)

Prima di iniziare con le prove, occorre dotarsi di una regola di stop. Lo zip ne considerera solo due.Con la prima si fissa il numero n di prove che si vogliono fare, ed e aleatorio il numero dei successirealizzati. Con la seconda, le prove hanno termine non appena si consegue un numero prefissato disuccessi; in tal caso e aleatorio il numero delle prove.

Altre urne, di cui lo zip non si occupera, sono quelle contenenti u.s. distinguibili o etichettate

e urne costituite da u.s. non identificate. Il primo caso riguarda in prevalenza popolazioni umanesulle quali, ad esempio, si compie un sondaggio di opinione. Il secondo caso e tipico di popolazionicostituite da bacteri che vivono in un certo tessuto.

3.6 EsempiDa qui in poi si fa uso di nozioni dell’analisi combinatoria, vedi appendice sezione 7.1.

Esempio A. Siano L ed U i giorni della settimana in cui sono nati Leo ed Ugo. Calcolare laprobabilita che i due amici: (i) siano nati entrambi di sabato, (ii) siano nati lo stesso giorno.R. Per comodita si rinominano i giorni della settimana con g1, g2, . . . , g7. (Sabato e g6.) Assumendol’equiprobabilita del giorno di nascita e l’indipendenza delle nascite di Leo ed Ugo, segue che, ∀j,

Page 48: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

3.6 Esempi 47

PL = gj = PU = gj = 17 . Dunque PL = U = g6 = PL = g6· PU = g6 = 1

49 . Percalcolare PL = U, quesito (ii), si osservi che l’evento L = U e l’unione di sette eventi equiprobabilie disgiunti: PL = U = PL = U = g1+ . . . +PL = U = g7 = 7 · 1

49 = 17 .

Esempio B. Due dadi regolari sono lanciati. Calcolare la probabilita che: (i) appaia un doppio 6,(ii) che appaiano facce uguali, (iii) che la somma S delle facce dia 5. Infine, e piu probabile cheS = 5 oppure S = 8?R. Ai primi due quesiti si risponde ripetendo il ragionamento esposto nell’esempio precedente. Peril quesito (iii) si osservi che con due dadi i risultati (ugualmente) possibili sono 62 = 36 e che lasomma 5 si consegue in quattro modi (1, 4), (2, 3), (3, 2) e (4, 1). Dunque PS = 5 = 4

36 .L’evento S = 5 e meno probabile di S = 8. La somma 8, infatti, si consegue nei cinque modi:

(2, 6), (3, 5), (4, 4), (5, 3) e (6, 2). Dunque PS = 8 = 536 .

Esempio C. (Un quesito posto a Galileo.) Nel giuoco della zara (lancio di tre dadi) e piu probabileche si realizzi la somma 9 oppure la somma 10?R. I casi (ugualmente) possibili sono 63 = 216. La somma 9 si consegue in 25 modi differenti: seimodi per ciascuna delle combinazioni (1, 2, 6), (1, 3, 5) e (2, 3, 4), tre modi per (2, 2, 5) e (1, 4, 4),un modo per (3, 3, 3). Dunque PS = 9 = 25

216∼= 0.1157. La somma 10 si consegue in 27 modi

differenti: sei modi per ciascuna delle combinazioni (1, 3, 6), (1, 4, 5) e (2, 3, 5), tre modi per (2, 2, 6),(2, 4, 4) e (3, 3, 4). Dunque PS = 10 = 27

216 = 0.125.

Esempio D. (Problema di Pepys, dal nome del giocatore che lo propose ad I. Newton.) E piuprobabile che si realizzi l’evento A =“in 6 lanci di un dado il 6 esce almeno 1 volta”, oppure l’eventoB =“in 12 lanci di un dado il 6 esce almeno 2 volte”?R. Tenuto conto che A e l’evento che si realizza quando in 6 lanci non esce alcun 6, si ha P(A) =1−P(A) = 1− ( 5

6 )6 = 1−0.3349 = 0.6651. Per contro B = B0∪ B1 e l’evento che si realizza quandoin 12 lanci il 6 non esce mai (B0), oppure esce una sola volta (B1). Poiche B1 si realizza in

(121

)modi,

tutti di probabilita ( 56 )11 · 1

6 , si ha P(B) = P(B0 ∪ B1) = P(B0) + P(B1) = ( 56 )12 +

(121

)( 56 )11 · 1

6 =0.3813 e dunque P(B) = 1− P(B) = 0.6187. Newton concluse che P(A) > P(B).

Esempio E. (Giuoco del lotto.) Come e noto, in ogni ruota si effettuano 5 estrazioni senza resti-tuzione da un’urna contenente 90 palline numerate da 1 a 90. Poiche nel giuoco del lotto l’ordined’estrazione non conta, il numero delle cinquine che si possono realizzare e dato dalle combinazioni(905

)= 43 949 268. Le giocate, di cui si calcolano le probabilita, si riferiscono tutte ad una sola ruota.

• Ambata. Tra tutte le possibili cinquine, quelle che contengono il numero desiderato sono lecombinazioni 4 a 4 degli 89 numeri restanti. Dunque p1 =

(894

):(905

)= 5

90 = 0.0555 . . .

• Ambo. Tra le possibili cinquine quelle che hanno due numeri fissati, sono le combinazioni 3 a 3degli 88 numeri restanti. Dunque p2 =

(883

):(905

)= 4·5

89·90 = 1400.5

∼= 0.0025.• Terno, quaterna, cinquina. Similmente, le probabilita d’indovinare 3, 4, 5 numeri assegnati sonop3 =

(872

):(905

)= 1

11748∼= 0.851 × 10−4, p4 =

(861

):(905

)= 1

511038∼= 0.196 × 10−5 e p5 = 1

43 949 268∼= 0.228× 10−7.

Esempio F. Siano date tre lettere da infilare in tre buste gia dotate di indirizzo. Un impiegatodistratto imbusta le lettere a caso. Calcolare: (i) che tutto fili liscio, (ii) che almeno un destinatarioriceva la lettera che gli compete, (iii) che nessuno dei destinatari riceva la propria lettera.

Page 49: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

48 Capitolo 3 Probabilita elementare

R. Siano A, B e C i tre destinatari. Se con A si indica l’evento: “il destinatario A riceve la sualettera”, e con B e C gli analoghi eventi, i quesiti si riducono a calcolare: (i) PA ∩ B ∩ C, (ii)PA ∪B ∪ C, (iii) PA ∩ B ∩ C.

Per il quesito (i) si deve ricordare il teorema delle probabilita composte: PA ∩B ∩ C = PAPB|A PC|A,B = 1

3 · 12 · 1 = 1

6 .Per rispondere a (ii) si deve ricordare il teorema delle probabilita totali per eventi qualsiasi. Si ha:

PA = PB = PC = 13 , PA,B = PA,C = PB,C = 1

6 . (Si tenga presente che PA,B =PA PB|A = 1

6 , o anche che PA,B = PA,B, C). Percio: PA ∪B ∪ C = 3( 13 )− 3 1

6 + 16 =

46∼= 0.6667.Al quesito (iii) si risponde ricordando che l’evento (A, B, C) e il complementare di (A∪B ∪C).

Esempio G. Si risponda al quesito (ii) dell’esempio precedente quando i destinatari sono N .R. Per il teorema delle probabilita totali per eventi qualsiasi si ha

P∪Ni=1Ai =

(N

1

)1N−

(N

2

)1N

1N − 1

+(

N

3

)1N

1N − 1

1N − 2

− · · · =

= 1− 12

+16− 1

24+ · · ·+ (−1)N+1 1

N !=

N∑

j=1

(−1)j+1 1j!

= 1−N∑

j=0

(−1)j 1j!

.

Per N →∞, si ha P∪∞i=1Ai = 1− e−1 ∼= 1− 0.3679 = 0.6321.

Esempio H. La macchina M1, costituita dagli apparecchi A,B, C disposti in serie, non e piu funzio-nante se uno almeno dei tre si guasta. La macchina M2, costituita dagli apparecchi A,B, C dispostiin parallelo, smette di funzionare se tutti e tre si guastano. Gli apparecchi sono uguali e la probabilitache uno di essi sopravviva per un anno e pari a 0.7. Calcolare la probabilita che, trascorso un anno,M1 ed M2 siano sempre funzionanti.R. Se con A si indica l’evento: “l’apparecchio A e funzionante dopo un anno”, e con B e C gli analoghieventi, la probabilita che M1 funzioni ancora equivale a calcolare PA, B,C. La probabilita che M2

sia ancora funzionante equivale a calcolare PA ∪B ∪C. La prima probabilita, vedi l’esempio E, e0.73 = 0.343, la seconda e 1− 0.33 = 0.973.

Esempio I. La malattia M presente in una certa popolazione scolastica colpisce un alunno su 10000.Si decide di sottoporre gli alunni a screening di massa il quale, essendo poco preciso, diagnostica“falsi positivi” e “falsi negativi” con probabilita pari a 0.04 e 0.02. Calcolare la probabilita che unalunno diagnosticato positivo sia, in realta, negativo.R. Si indichi con M [S] l’evento “ e positivo [negativo]” e con (+) [(−)] “l’alunno e dichiarato positivo[negativo]”. Le probabilita a priori sono PS = 0.9999, PM = 0.0001, le probabilita di “falsopositivo” e di “falso negativo” sono P(+)|S = 0.04 e P(−)|M = 0.02. Le verosimiglianze sonoriportate nella tavola

Stato di natura (−) (+)

Sano 0.96 0.04

Malato 0.02 0.98

Tav.3.1 - Verosimiglianze.

Page 50: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

3.7 Complementi 49

Per rispondere al quesito si ricorre al teorema di Bayes

PM |(+) =PMP(+)|M

PMP(+)|M+ PSP(+)|S =0.0001 · 0.98

0.0001 · 0.98 + 0.9999 · 0.04= 0.00244 ,

Dunque PS|(+) = 1 − 0.00244 = 0.99756. Si noti che la diagnosi (+) non implica che l’alunnosia malato. Il teorema di Bayes assicura che se a priori la probabilita di essere malati era 0.0001, laprobabilita a posteriori, pur cresciuta di k ∼= 25 volte e ancora molto bassa.

Esempio L. Le ditte di assistenza a domicilio A1, A2 e A3 occupano 9, 15 e 8 infermieri, 3, 6 e 6dei quali sono maschi. Si sa che le ditte si dividono il 50%, 40% e 10% degli assistiti. Calcolarela probabilita che un certo cliente sia assistito dalla ditta Aj , j = 1, 2, 3, quando nel suo domiciliotroviamo: (i) un infermiere maschio (d’ora in poi M1), (ii) due infermieri maschi (M2).R. Indicando le ipotesi con Aj =“la ditta di assistenza e la j−esima”, j = 1, 2, 3, si adottanocome probabilita a priori P(Aj) le quote di mercato. La verosimiglianza associata alla ditta A1 eP(M1|A1) = 3

9 = 0.3333, caso (i), e P(M2|A1) = 39 · 2

8 = 0.0833, caso (ii). Similmente si calcolano lealtre verosimiglianze.

Grazie alla P(Mk) =∑3

j=1 P(Aj)P(Mk|Aj), k = 1, 2, si calcolano i denominatori della formuladi Bayes: P(M1) = 0.4017, caso (i) e P(M2) = 0.1524, caso (ii). Le probabilita a posteriori deglieventi Aj avendo osservato M1, caso (i), e M2, caso (ii), sono riportate nella Tav.3.2. Si noti comel’ipotesi A1 [A3] si indebolisca [rafforzi] con l’accadere di M1, e piu ancora di M2.

ipotesi A1 A2 A3 totali

a priori P(Aj) 0.50 0.40 0.10 1.

verosimiglianze P(M1|Aj) 0.3333 0.4000 0.7500 -(i) P(Aj) · P(M1|Aj) 0.1667 0.1600 0.0750 0.4017

a posteriori P(Aj |M1) 0.4149 0.3983 0.1867 0.9999verosimiglianze P(M2|Aj) 0.0833 0.1429 0.5357 -

(ii) P(Aj) · P(M2|Aj) 0.0417 0.0572 0.0536 0.1524a posteriori P(Aj |M2) 0.2734 0.3750 0.3916 1.

Tav.3.2 - Tavola dei calcoli per la formula di Bayes, casi (i) e (ii).

3.7 ComplementiLa verifica della incompatibilita di due (o piu) eventi e solo una questione di logica, ovvero e unaproprieta intrinseca degli eventi.

Al contrario, l’indipendenza stocastica fra eventi dipende essenzialmente da valutazioni di pro-babilita. L’affermazione risulta ovvia a quanti accettano la concezione soggettivista e danno allaindipendenza (o alla dipendenza) un significato soggettivo. Un esempio.

B (a) Si considerino gli eventi R =“mi busco un raffreddore” e U =“per strada incontro Ugo”,dove Ugo passa per essere iettatore. Dire che P(R|U) = P(R), equivale ad affermare che tra R ed

Page 51: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

50 Capitolo 3 Probabilita elementare

U non vi sia alcun legame. Valutare che P(R|U) > P(R) equivale a stabilire una qualche forma di. . . dipendenza fra gli eventi R e U .

Un po’ meno evidenti sono i tre l’esempi che seguono.

B (b) E dato un mazzo di 40 carte, avente tre figure per ciascun seme ♥, ♦, ♣, ♠. Estratta acaso una carta, si considerino gli eventi f1 =“la carta e una figura” e ♥1 =“la carta e cuori”. Laprobabilita che accada f1 e P(f1) = 12

40 . La probabilita che accada f1 posto ♥1 e P(f1|♥1) = 310 .

Cioe P(f1|♥1) = P(f1). Se dal mazzo si estraggono a caso due carte, la probabilita che entrambesiano figure e P(f1, f2) = 12

40 · 1139 = 0.0846. La probabilita che siano figure, posto che entrambe siano

cuori, risulta P(f1, f2|♥1,♥1) = 310 · 2

9 = 0.0667. Cioe P(f1, f2|♥1,♥2) < P(f1, f2). Dunque: mentref1 e ♥1 sono eventi indipendenti, (f1, f2) e (♥1,♥2) non lo sono.

B (c) L’esempio, dovuto allo statistico russo S. Bernstein, mostra che l’indipendenza di tre o piueventi puo non sussistere anche quando gli eventi presi in coppia sono indipendenti.

Un tetraedo regolare che ha una faccia bianca, una rossa, una verde e l’ultima tricolore vienelanciato sul tavolo. Si definisce l’evento B =“la faccia a contatto del tavolo contiene il bianco”. Inmodo analogo si definiscono gli eventi R e V .

Poiche le quattro facce sono equiprobabili si ha P(B) = P(R) = P(V ) = 12 e poiche gli eventi

B ∩ R, B ∩ V e R ∩ V si verificano solo se la faccia che tocca il tavolo e tricolore, ne consegue cheP(B ∩ R) = P(B ∩ V ) = P(R ∩ V ) = 1

4 . D’altra parte la probabilita di avere la faccia tricolore eP(B ∩R ∩ V ) = 1

4 6= P(B)P(R)P(V ) = 18 . Tale circostanza mostra che gli eventi presi due alla volta

sono indipendenti. Presi in blocco (B, R, V ) non lo sono piu.

B (d) Questo esempio complementa, in certo modo, il precedente. Lanciati due dadi, si considerinogli eventi P1 =“il primo dado presenta faccia pari”, P2 =“il secondo dado presenta faccia pari”,D =“la somma dei punteggi e dispari”. E facile vedere che P(P1) = P(P2) = P(D) = 1

2 , cheP(P1, P2) = P(P1, D) = P(P2, D) = 1

4 e che P(P1, P2, D) = 0. Anche in questo caso gli eventiconsiderati sono indipendenti se presi due alla volta ma non lo sono piu se presi in blocco.

Per concludere due esempi provenienti dal gioco del poker. Come a tutti (non) e noto, il poker sigioca con un mazzo di 32 carte di valore 7, 8, 9, 10, J, Q, K, A nei quattro semi ♥, ♦, ♣, ♠. Ilbanco serve 5 carte ad ogni giocatore.

B (e) Calcolare la probabilita che ad un giocatore sia servito un full. Nota: si realizza un full sele 5 carte sono divisibili in due gruppi costituiti da un tris (tre carte dello stesso valore) e da unacoppia (due carte dello stesso valore). Ad esempio un tris di J e una coppia di 10.

Il numero totale di mani e dato da(325

)= 201·376. Per “costruire” un full occorre prima scegliere

due distinti valori, dove il numero delle scelte e dato dalle disposizioni D8,2 = 8 × 7 = 56. Perciascuna scelta, si possono formare

(43

)= 4 tris e

(42

)= 6 coppie. Il numero totale dei full e dunque

D8,2

(43

)(42

)= 56× 4× 6 = 1344. La probabilita cercata e Pfull = 1344

201·376∼= 6.674 · 10−3.

B (f) Per i piu “interessati”. Ripercorrendo il procedimento ora illustrato, si provi che la pro-babilita di ricevere una coppia e Pc = 107·520

201·376∼= 0.534, una doppia coppia e Pdc = 24·192

201·376∼= 0.120,

un tris e Ptris = 10·752201·376

∼= 0.0534, una scala e Ps = 5·100201·376

∼= 0.0253, un colore Pcol = 260201·376

∼=1.291 · 10−3, un poker Ppoker = 224

201·376∼= 1.112 · 10−3, una scala reale Psr = 20

201·376∼= 9.932 · 10−5.

Page 52: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

4LEGGI DI PROBABILIT A

How dare we speak of the laws of chance? Is not chance

the antithesis of all law? (Bertrand Russell)

Fissate le modalita dell’esperimento aleatorio che produce la v.a. X (e che definisce l’insieme deivalori X che X puo assumere) e necessario disporre di uno strumento che ci permetta di calcolare,per qualunque evento A ⊂ X , la probabilita P(X ∈ A). La funzione di evento (o di insieme) che∀A ⊂ X associa la sua probabilita prende il nome di distribuzione della v.a. X. La distribuzione vadunque intesa come strumento di conoscenza (ovviamente parziale) del risultato aleatorio X.

Come si vedra, una distribuzione puo essere data o sotto forma di legge di probabilita, che forniscela probabilita (o la densita di probabilita) dell’evento puntuale X = x, oppure sotto forma di funzione

di ripartizione. Pertanto, le proprieta di una v.a. X, ovvero tutte le affermazioni che su di essa sipossono fare, risiedono nella conoscenza della sua distribuzione data sotto forma di legge e/o difunzione di ripartizione.

Il presente capitolo presenta alcune usuali leggi di probabilita relative a v.a. discrete (o numerabili)e continue. La scrittura X ∼ f(x) indica “la v.a.X segue la legge f(x)”.

Poiche tutte le principali leggi discrete derivano da prove su urne, una certa cura sara dedicataalla descrizione dell’urna ed al tipo di esperimento. Resta confermato quanto detto in sezione 3.5. Eprivo di senso parlare di successioni di esperimenti, e di conseguenza di numero aleatorio (che puoessere di successi, di insuccessi, di prove) se prima non si fissa regola di stop e tipo di urna. Lo zip

considerera solo estrazioni con o senza restituzione (prove bernoulliane e prove esaustive). Le urnesono costituite da N palline di cui NA ≥ 1 color A, indicate come successi, ed NB ≥ 1 color B,

insuccessi. Con θ =NA

N, 0 < θ < 1, e indicata la proporzione di palline color A nell’urna. (Le palline

possono essere etichettate o identificate.)

51

Page 53: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

52 Capitolo 4 Leggi di probabilita

4.1 Leggi discrete di probabilit aSe la regola di stop fissa in n il numero delle prove, e aleatorio il numero di successi X ∈ X= 0, 1, . . . , n. Per contro, se la regola di stop prescrive che alla serie delle prove si ponga terminenon appena conseguito il ν−esimo successo, e aleatorio il numero delle prove X ∈ X = ν, ν +1, . . . Nel primo caso la stringa si chiude o con un successo o con un insuccesso, nel secondo, sempre conun successo. Esempi di stringhe (o sequenze) dei due tipi sono

(n, x)︷ ︸︸ ︷A,B, B, . . . , A, B e

(x−1, ν−1)︷ ︸︸ ︷B,A, B, . . . , A, B,

(1, 1)︷︸︸︷A︸ ︷︷ ︸

(x, ν)

.

B Binomiale. Dall’urna di proporzione θ sono estratte n palline con restituzione. Sia X ∈ 0, 1, . . . , nil numero aleatorio di successi. Il numero delle stringhe (distinte ed equiprobabili) lunghe n con x

successi ed n − x insuccessi e(

n

x

). Poiche ogni stringa ha probabilita P

(n, x)︷ ︸︸ ︷A, B,B, . . . , A, B =

[P(A)]x · [P(B)]n−x = θx(1− θ)n−x, la la legge della v.a. X, detta legge binomiale, e

X ∼ Bin(x | θ, n) =(

n

x

)θx(1− θ)n−x , X ∈ 0, 1, . . . , n , n ∈ N , θ ∈ (0, 1) .

B Geometrica. Da un’urna di composizione θ le palline sono estratte con restituzione. La seriedelle prove si arresta non appena si consegue un successo. Sia X ∈ N il numero aleatorie di prove almomento dello stop. Data l’indipendenza delle prove, la probabilita di conseguire una stringa lunga

x e P(x, ν=1)︷ ︸︸ ︷

B, B, . . . , B,B, A = P(A) · [P(B)]x−1 = θ(1− θ)x−1, da cui la legge geometrica

X ∼ G(x | θ) = θ(1− θ)x−1 , X ∈ N , θ ∈ (0, 1) .

B Legge di Pascal. La successione delle prove bernoulliane si arresta al ν-esimo successo (ν ≥ 1).Sia X ≥ ν il numero aleatorio di prove effettuate. Poiche l’ultima prova della stinga tipo e unsuccesso se ne deduce che nelle x − 1 prove che lo precedono vi sono ν − 1 successi. Il numero distringhe (distinte ed equiprobabili) aventi tale caratteristica, ognuna di probabilita θν(1 − θ)x−ν e(

x− 1ν − 1

). La legge di Pascal e dunque

X ∼ Pascal(x | θ, ν) =(

x− 1ν − 1

)θν(1− θ)x−ν , X ∈ ν, ν + 1, . . . , θ ∈ (0, 1) .

B Binomiale negativa. Stessa situazione della legge di Pascal. Sia Y il numero di insuccessi subitiprima di conseguire ν successi. Se nella legge di Pascal si fa la sostituzione x = ν + y, si ha la leggebinomiale negativa

Y ∼ Bneg(y | θ, ν) =(

ν + y − 1ν − 1

)θν(1− θ)y , Y ∈ N0 , θ ∈ (0, 1) .

B Ipergeometrica. Dall’urna esaustiva contenente N biglie di cui NA ≥ 1 color A e NB ≥ 1color B si estraggono n biglie (1 ≤ n ≤ N), x delle quali sono successi ed n − x insuccessi. Dalle

Page 54: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

4.2 Funzione di ripartizione e momenti 53

condizioni 0 ≤ x ≤ minn, NA e 0 ≤ n − x ≤ minn,NB, si ricava x ∈ xm, . . . , xM, dovexm = maxn−NB , 0 e xM = minn,NA. Il numero totale di gruppi costituiti da n biglie estratte

da un’urna che ne contiene N e(

N

n

). I possibili modi di estrarre x biglie da una massa di NA biglie

sono(

NA

x

), i possibili modi di estrarre n − x biglie da una massa di NB biglie sono

(NB

n− x

). Ne

consegue che il numero delle n-ple contenenti x successi ed n− x insuccessi e dato, vedi appendice,

dal prodotto(

NA

x

)(NB

n− x

). Si ha dunque la legge ipergeometrica

X ∼ Hyper(x | NA, NB , n) =

(NA

x

)(NB

n− x

)

(N

n

) , X ∈ xm, . . . , xM , NA, NB ∈ N , 1 ≤ n ≤ N ,

Avere x successi su n prove, una biglia alla volta senza restituzione, ed avere x successi estraendon biglie in blocco sono eventi equiprobabili.B Legge di Poisson. Grazie al teorema limite 4.6, vedi piu avanti, si deduce la legge di Poisson

X ∼ Po(x | λ) = e−λ λx

x!, X ∈ N0 , λ ∈ R+ .

B Uniforme discreta. Data un’urna che contiene n palline numerate da 1 a n, la probabilita diestrarre, in una prova, la pallina recante il numero x e descritta dalla legge uniforme discreta

X ∼ u(x | n) =1n· 11,2,...,n(x) , n > 1 .

Esempi di v.a. uniforme discreta sono: il punto ottenuto lanciando un dado regolare numeratoda 1 a 6, il numero random, da 0 a 1012 − 1, che si forma accostando 12 cifre, ciascuna delle quali siottiene lanciando a caso un dado regolare numerato da 0 a 9, etc.

4.2 Funzione di ripartizione e momentiSi da la definizione di funzione di ripartizione, in sigla f.r., per v.a. unidimensionali

Definizione 4.1. Si definisce funzione di ripartizione o funzione di distribuzione cumulata della v.a.X ∈ X la funzione F (x) = P(X < x), ∀x ∈ R.

La f.r. gode delle proprieta(i) limx→−∞ F (x) = 0, limx→+∞ F (x) = 1,(ii) ∀x1 < x2 ⇒ F (x1) ≤ F (x2),(iii) F (x) = F (x−).

Le (i) e (ii) discendono dagli assiomi di Kolmogorov, la (iii) discende dalla definizione di f.r.Alcuni autori anziche la definizione 4.1, detta europea adottano la definizione americana, F (x) =P(X ≤ x); in tal caso la proprieta (iii) va sostituita con la (iii’ ) F (x) = F (x+).

Page 55: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

54 Capitolo 4 Leggi di probabilita

E facile vedere che P(x ≤ X < x + h) = F (x + h) − F (x), ∀h > 0. Se la v.a. X e discreta e sipone f(u) = P(X = u), si ha F (x) =

∑u<x f(u) e

∑x∈X f(x) = 1.

Si osservi che la f.r. e all’un tempo funzione di punto e funzione di insieme (o di evento). Funzionedi punto in quanto ∀x ∈ R essa assume il valore F (x), di evento in quanto essa misura la probabilitadell’evento X ∈ (−∞, x). Tale proprieta fa della f.r. il principale strumento per l’identificazione diuna v.a.

Se la d.p. non concentra masse in alcun punto della retta e la v.a. X puo assumere tutti i valoridella retta (o di una sua porzione) e se infine ∀x esiste il limite

limh↓0

P(x ≤ X < x + h)h

= limh↓0

F (x + h)− F (x)h

= f(x) , x ∈ X ,

la v.a. X e detta assolutamente continua (in sigla a.c.) in x ed il limite f(x) prende il nome difunzione di densita di probabilita (in sigla f.d.p.) della v.a. X.

La f.r. F (x) e una funzione integrale, potendosi sempre rappresentare come integrale di unacerta funzione f(x) ≥ 0: F (x) =

∫ x

−∞ f(u) du. Ed ancora: dF (x) = f(x)dx ∼=∫ x+dx

xf(u)du =

P(x ≤ X < x + dx), P(X ∈ E) =∫

x∈Ef(x)dx, ∀E ⊂ X ,

∫x∈X f(x)dx = 1, etc.

B Nota. Di norma con le lettere maiuscole F (·), G(·), P (·) etc. sono indicate le f.r. Quandola v.a. e discreta, cioe assume valori solo in un insieme al piu numerabile di punti, le rispettiveminuscole f(·), g(·), p(·) etc. indicano le probabilita delle singole “masse puntuali”. Per contro,quando la v.a. e a.c., cioe assume valori in ogni punto di un insieme continuo, i simboli f(·), g(·),p(·) indicano le f.d.p. Sempre nel caso di v.a. a.c., ∀x ∈ X , si ha P(X = x) = 0 e dunque F (x−) =P(X < x) = P(X ≤ x) = F (x+). Da osservare infine che la probabilita (e dunque la f.r.) e unaquantita adimensionale e che la f.d.p. ha dimensione dim[x−1]. C

Seguono le definizioni di moda e di mediana valide per v.a. qualsiasi (discrete e a.c.)

Definizione 4.2. Si chiama moda della v.a., X ∼ f(x) il valore x0 = arg supx∈X f(x).

Definizione 4.3. Chiamasi mediana, o punto mediano, della v.a. X ∈ X , il punto me tale cheF (me) ≤ 1

2 ≤ F (m+e ).

La moda puo non essere unica. E facile vedere che il percentile p−esimo della v.a. X a.c.,∀p ∈ (0, 1) fissato, e dato da xp = F−1(p), soluzione dell’equazione F (xp) =

∫ xp

−∞ f(x)dx = p.L’indice esiste sempre ed e unico. Per p = 1

4 , 12 , 3

4 i percentili prendono il nome di primo quartile,mediana e terzo quartile. La mediana e percio me = F−1( 1

2 ).

Definizione 4.4. Si definisce speranza matematica della funzione aleatoria ϕ(X), la quantita certa

(se esiste) E[ϕ(X)] =∑

x∈X ϕ(x) f(x), nel caso discreto, e E[ϕ(X)] =∫X ϕ(x) f(x)dx, nel caso

continuo.

B Casi notevoli. Prende il nome di momento k−esimo della v.a. X la speranza matematica diϕ(X) = Xk, k ∈ N, µ′k = E(Xk) =

∑x∈X xkf(x), caso discreto, e µ′k = E(Xk) =

∫X xkf(x)dx, caso

continuo. Se k = 1, si ha µ′1 = µ = E(X), che prende il nome di media. Prende il nome di varianza

della v.a. X la speranza matematica di ϕ(X) = (X−µ)2, indicata con σ2 = V ar(X) = E[(X−µ)2].L’indice σ =

√σ2 prende il nome di s.q.m. o s.d. della v.a. X. C

Per quanto riguarda l’esistenza dei momenti vale il teorema

Page 56: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

4.3 Leggi continue di probabilita 55

Teorema 4.1. Se la v.a. X ha momento k-esimo, k ∈ N, allora essa possiede tutti i momenti diordine inferiore a k. Non e detto il viceversa.

Definizione 4.5. Si definisce coefficiente di variazione della la v.a. X > 0 il rapporto γV =s

µ.

I momenti godono di utili proprieta.

Teorema 4.2. (Christiaan Huygens, 1655.) V ar(X) = E(X2)− [E(X)]2 o anche σ2 = µ′2 − µ2.

Teorema 4.3. E(aX + b) = aE(X) + b.

Teorema 4.4. V ar(aX + b) = a2 V ar(X).

Corollario 4.1. E(c) = c, V ar(c) = 0, E[(X − a)2] = V ar(X) + (µ− a)2.

B Nota. E facile mostrare che la speranza matematica E(X) coincide col baricentro di un sistemaunitario di masse concentrate e/o diffuse e che i momenti di inerzia calcolati rispetto all’origine e albaricentro coincidono con i momenti E(X2) e V ar(X), posto che essi esistano. A parte i casi di nonesistenza dei momenti, l’analogia formale fra geometria delle masse e statistica, vista in sezione 1.3,si estende anche alla probabilita. C

4.3 Leggi continue di probabilit aSi danno, con pochi commenti, alcune importanti leggi continue.B Uniforme continua. Si dice che la v.a. X segue la legge uniforme continua se ha f.d.p.

X ∼ u(x | a, b) =1

b− a1(a,b)(x) , con a < b . C

Se a = 0 e b = 1 si ha la legge uniforme standard, X ∼ u(x | 0, 1) = 1(0,1)(x), che e alla base delletecniche di simulazione e dei metodo Monte Carlo. La corrispondente f.r. e

F (x) =

0 se x ≤ ax− a

b− ase a < x < b .

1 se b ≤ x

B Esponenziale. Si dice che la v.a. X segue la legge esponenziale se la sua f.d.p. e

X ∼ Exp(x | λ) = λe−λx , X ∈ R+ , λ ∈ R+ . C

La corrispondente f.r. e data da

F (x) =

0 se x ≤ 01− e−λx se 0 < x .

B Normale. La v.a. X segue la legge normale (o gaussiana) se ha f.d.p.

Page 57: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

56 Capitolo 4 Leggi di probabilita

X ∼ N(x | µ, σ2) =1√

2πσ2exp− 1

2

(x− µ)2

σ2 , X ∈ R , µ ∈ R , σ2 ∈ R+ . C

Per µ = 0 e σ = 1, si ha la legge normale standard, sovente indicata col simbolo φ(x) =1√2π

exp− 12 x2. La φ(x) non ha primitiva finita, motivo per cui la sua f.r. resta definita come

Φ(x) =∫ x

−∞ φ(t)dt. Poiche la φ(x) e funzione pari, ne consegue che (i) i momenti dispari sono nulli,(ii) la v.a X e simmetrica rispetto all’origine. Dunque Φ(−x) = 1 − Φ(x), P−x < X < x =2Φ(x)− 1, etc. Per il calcolo dei percentili si vedano le tavole nel paragrafo 7.3.B Gamma. Si dice che la v.a. X segue la legge gamma se ha f.d.p.

X ∼ Gamma(x | α, λ) =λα

Γ(α)xα−1 e−λx , X ∈ R+ , α, λ ∈ R+ . C

I parametri α e λ sono detti di forma e di scala. Se α = 1 la legge gamma coincide con lalegge esponenziale: Gamma(x | 1, λ) = Exp(x | λ). Se α = n ∈ N la legge gamma viene dettalegge di Erlang, dal nome dell’ingegnere elettronico danese Agner K. Erlang (1878-1929), e si scriveX ∼ Erlang(x | n, λ).

B Pareto.(*) Si dice che la v.a. X segue la legge di Pareto, dal nome dell’economista Vilfredo Pareto(1848-1923), se ha f.d.p.

X ∼ Pareto(x | α, β) = α βα 1xα+1

, X ≥ β, α, β ∈ R+ . C

Tutte le altre leggi considerate nello zip si ricavano a partire dalle leggi sopra illustrate. Nelparagrafo 7.2 se ne da un elenco comprendente anche i momenti primi e secondi.

4.4 Alcune propriet a delle v.a.Se X e Y , dotate di f.r. FX(x) e FY (y), sono ottenute da fenomeni (o esperimenti o prove) tra loroindipendenti allora si dira che esse sono stocasticamente indipendenti, in sigla v.a.i.,

P(X < x, Y < y) = P(X < x)P(Y < y) = FX(x) · FY (y).

Se X ed Y sono v.a.i. discrete si ha P(X = x, Y = y) = P(X = x) P(Y = y) = pX(x) · pY (y),mentre, se sono a.c. si ha P(x ≤ X < x + dx , y ≤ Y < y + dy) ∼= pX(x) pY (y) dx dy.

Se le v.a. X ed Y assumono valori nello stesso insieme Ω, e se ∀A ⊂ Ω si ha sempre P(X ∈ A) =P(Y ∈ A), allora si dira che esse sono identicamente distribuite (o somiglianti o identiche). Detto conparole diverse, se ∀ a, b ∈ Ω, con a < b, accade che

∑a≤x<b pX(x) =

∑a≤y<b pY (y), nel caso di v.a.

discrete, oppure∫ b

apX(x)dx =

∫ b

apY (y)dy, nel caso di v.a. a.c., allora pX(·) = pY (·) univocamente.

Se infine le prove sono realizzate nelle stesse condizioni sperimentali e sono indipendenti, allorale v.a. X ed Y sono indipendenti ed identicamente distribuite, in sigla v.a.iid. Prende il nome dicampione aleatorio, costituito da osservazioni iid, la collezione di v.a.iid X = (X1, X2, . . . , Xn).

Lo zip, che considera solo questo tipo di osservazioni, nel prossimo capitolo fornira utili proprietadi indici ottenuti dal campione X detti indici campionari.

Page 58: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

4.5 Trasformazioni di v.a. 57

Se la v.a. X e dotata di media µ = E(X) vale la disuguaglianza di Markov data da

P|X| < hE(|X|) ≥ 1− 1h⇔ P|X| < ε ≥ 1− E(|X|)

ε, ∀h > 0

con ε = hE(|X|). Se la v.a. X ha anche la varianza, σ2 = V ar(X) > 0, vale la disuguaglianza di

Cebicev

P| X − µ |< h σ ≥ 1− 1h2

⇔ P| X − µ |< ε ≥ 1− σ2

ε2, ∀h > 0

con ε = hσ. Le disuguaglianze, non banali solo per h > 1, si rivelano utili quando la legge di X ecomplicata e/o su di essa si hanno poche informazioni.

Indichiamo con X1, X2, . . . , Xn, . . . una sequenza indefinita di osservazioni iid, con Xi ∈ 0, 1,e con U1, U2, . . . , Un, . . . la sequenza dei successi cumulati, Un =

∑ni=1 Xi. Sia P1, P2, . . . , Pn, . . .

la corrispondente sequenza delle proporzioni di successo, Pn = 1nUn. Grazie alla disuguaglianza di

Cebicev e agevole dimostrare il teorema dovuto a Jakob Bernoulli (1654-1705).

Teorema 4.5. (Bernoulli, 1713.)

limn→∞

P(| Pn − θ |< ε) = 1 e limn→∞

P(| Un − nθ |< ε) = 0 , ∀ε > 0.

Il teorema di Bernoulli, noto anche come IIa legge dei grandi numeri, e un caso particolare diconvergenza in probabilita. Fondamentali nella teoria e nelle applicazioni del calcolo delle probabilitasono le definizioni di convergenza in legge o distribuzione e di convergenza dei momenti.

Definizione 4.6. Si dice che la successione delle v.a. Y1, Y2, . . . , Yn, . . . tutte a valori in Y ed aventif.r. F1(y), F2(y), . . . , Fn(y), . . . , converge in legge per n → ∞ alla v.a. Y , e si indica Yn

L→Y , selimn→∞ Fn(y) = F (y), ∀y ∈ Y in cui F (y) e continua.

Teorema 4.6. Nelle condizioni fissate dai limiti, valgono le convergenze in legge

limNA→∞NB→∞

NA/N=θ

Hyper(y | NA, NB , n) = Bin(y | θ, n) , limn→∞θ↓0

nθ=λ

Bin(y | θ, n) = Po(y | λ) .

B Nota. Si osservi che se una certa successione delle f.r. F1(y), F2(y), . . . , Fn(y), . . . converge aduna funzione F (y), non e detto che essa sia una f.r. C

Definizione 4.7. Si dice che la sequenza delle v.a. X1, X2, . . . , Xn, . . . , tutte a valori in X convergein media r-esima per n →∞ alla v.a. X, e si indica Xn

m.r.→ X, se limn→∞E(Xrn) = E(Xr).

B Nota. E facile vedere che, nelle condizioni fissate dal teorema 4.6, la legge ipergeometricaconverge alla binomiale e la binomiale alla legge di Poisson almeno in media quadratica. C

4.5 Trasformazioni di v.a.Sia y = y(x) ⇔ x = x(y) il legame deterministico che lega le quantita x ed y provenienti delle v.a.a.c. X ∼ f(x) e Y ∼ g(y). Il legame fra le p.d.f. delle v.a. X ed Y e stabilito dal teorema

Page 59: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

58 Capitolo 4 Leggi di probabilita

Teorema 4.7. Se la v.a. X a.c. ha f.d.p. f(x) e x ⇔ y e una trasformazione monotona, alloraY ∼ g(y) = f [x(y)] ·

∣∣∣ ddy

x(y)∣∣∣. Viceversa, se Y ∼ g(y) allora X ∼ f(x) = g[y(x)] ·

∣∣∣ ddx

y(x)∣∣∣. Se

la x ⇔ y e crescente G(y) = F (x(y)) ⇔ F (x) = G(y(x)), se e decrescente G(y) = 1 − F (x(y)) ⇔F (x) = 1−G(y(x)).

Il corollario che segue da delle proprieta parte delle quali sono affermate dai teoremi 4.3 e 4.4

Corollario 4.2. Se X ∼ N(x | µ, σ2), allora Y = aX + b ∼ N(y | aµ + b, a2σ2), a, b ∈ R, a 6= 0.

Se X ∼ N(x | µ, σ2) e si assume la trasformazione lineare Z =X − µ

σ, in base al corollario 4.2, si

ha Z ∼ N(z | 0, 1). Da cui Pa ≤ X < b = Φ(b− µ

σ

)−Φ

(a− µ

σ

). Tutto cio suggerisce l’operazione

di standardizzazione applicabile a v.a. qualsiasi (discrete o a.c.) purche dotate di varianza

Definizione 4.8. Sia X una v.a. qualsiasi avente media µ = E(X) e varianza σ2 = V ar(X) > 0.

Si definisce standardizzata di X la v.a. Z =X − E(X)V ar(X)1/2

=X − µ

σ. La v.a. standardizzata gode

delle proprieta: (i) E(Z) = 0, (ii) V ar(Z) = 1, (iii) Z e adimensionale.

Dalla legge normale e deducibile la legge lognormale, utile in tanti campi della ingegneria e dellaeconomia (distribuzione dei conti bancari, delle granulometrie di sabbie e polveri, del reddito, delconsumo, degli occupati per azienda, etc.).

Corollario 4.3. Sia data la v.a. X ∼ N(x | µ, σ2) e la trasformazione y = ex ⇔ x = log y. Si ha

Y ∼ LN(y | µ, σ2) =1√

2πσ2· 1

yexp

− 1

2

(log y − µ)2

σ2

, Y ∈ R+.

Corollario 4.4. Se X ∼ Gamma(x | α, λ), allora Y = b X ∼ Gamma(y | α,

λ

b

), con b ∈ R+.

B Nota. Poiche la p.d.f. gamma non ha primitiva finita, occorre far uso delle tavole statisticheche considerano la f.r. Iy(α) =

∫ y

0Gamma(t | α, 1)dt, con y > 0 e α ∈ R+. Si ha P(a ≤ X < b) =∫ b

aGamma(x|α, λ)dx =

∫ λb

λaGamma(y|α, 1)dy = Iλb(α)− Iλa(α). C

Il teorema 4.7, che considera solo trsformazioni monotone, puo trattare, fatte salve alcune cautele,trasformazioni simmetriche del tipo y = x2. Segue dunque il teorema

Teorema 4.8. Se X ∼ f(x), allora la v.a. Y = X2 segue la legge Y ∼ 12√

y

(f(√

y) + f(−√y)).

Dal teorema si ricava la legge Chi2, o anche chi-quadro, con un grado di liberta. Essa e il capostipitedella famiglia Chi2 con ν gradi di liberta, ν ∈ N, trattata nel prossimo capitolo.

Corollario 4.5. Se Z ∼ N(z | 0, 1), allora la v.a. Y = Z2 ∼ Chi2(y | 1) =1√2π

1√y

e−12 y, Y ∈ R+.

Nella teoria della affidabilita in cui e necessario descrivere il tempo di vita di certe macchine e/odi loro componenti, ha grande importanza la legge dovuta all’ingegnere e statistico svedese WallodiWeibull (1887-1979). Essa puo essere dedotta dalla legge esponenziale per trasformazione di v.a.

Corollario 4.6. Se X ∼ Exp(x | λ), allora Y = X1/α ∼ Weibull(y | α, λ) = λα yα−1e−λyα

.

Page 60: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

4.6 Esempi, grafici e complementi 59

Il parametro di forma α e adimensionale. Grazie al corollario 4.6 si ha facilmente Pa ≤ Y < b =Paα ≤ X < bα = exp−λaα − exp−λbα. Se α = 1 si ha Weibull(y | 1, λ) = Exp(x | λ).B Nota. Sia Y il tempo di vita di un certo pezzo. Se il pezzo funziona senza usure, cioe “noninvecchia”, si ha α = 1. (E questo il caso delle componenti elettroniche.) Se il funzionamento peril pezzo comporta usure (attriti, corrosioni, fatica, urti, sbalzi termici, etc.) si ha α > 1. Menofrequenti sono i casi in cui α ∈ (0, 1), che e quanto accade alle canape e alle fibre al carbonio. Sidice qui che il pezzo “piu lavora piu si rafforza”. Scomodo e di difficile significato e il parametro di

scala λ. Al suo posto si usa, spesso, il parametro θ = λ−1α che ha dimensione fisica di un tempo e si

ha Y ∼ Weibull(y|α, θ−α) =α

θ·(y

θ

)α−1

exp−

(y

θ

)αcon E(Y ) = θ · Γ(

1 + 1α

), vedi appendice.

Nella legge esponenziale, caso particolare della Weibull, θ = λ−1 assume il significato di un tempo

medio essendo E(Y ) = λ−1 = θ. C

4.6 Esempi, grafici e complementiEsempio A. Si rappresentino le leggi f2(x) e f3(x) delle v.a. somma X ottenute lanciando due etre dadi regolari (giuoco della zara).R. Si torni agli esempi B e C del capitolo 3. Due dadi: la v.a. X ∈ X = 2, 3, . . . , 12, con probabilita 1

36 , 236 , 3

36 , 436 , 5

36 , 636 , 5

36 , 436 , 3

36 , 236 , 1

36. Giuoco della zara: la v.a. X ∈ X = 3, 4, . . . , 18, conprobabilita 1

216 , 3216 , 6

216 , 10216 , 15

216 , 21216 , 25

216 , 27216 , 27

216 , 25216 , 21

216 , 15216 , 10

216 , 6216 , 3

216 , 1216. La figura 4.1

riporta i relativi istogrammi.

2 4 6 8 10 12

0.05

0.1

0.15

HxLf2HxL

3 6 9 12 15 18

0.05

0.1

0.15

HxLf3HxL

Figura 4.1. - Istogrammi del giuoco con due e tre dadi (zara).

Esempio B. Sono dati due dadi regolari a quattro facce. Il dado rosso ha le facce numerate da 1 a4, il dado verde da −4 a −1. Si rappresenti la legge della somma U ottenuta lanciando i due dadi.Si calcoli la probabilita che U > 0. (Risp. P(U > 0) = 3

8 ).

Esempio C. Si traccino gli istogrammi della legge geometrica per θ = 0.3 e θ = 0.7, della binomialeper n = 10 prove e per θ = 0.2 e θ = 0.5, della legge di Poisson per λ = 1.5 e λ = 4.8 e dellabinomiale negativa con ν = 3 successi e per θ = 0.4 e θ = 0.75.R. Per gli istogrammi delle leggi geometica e binomiale si debbono calcolare le probabilita p1 = θ,p2 = θ(1− θ), p3 = θ(1− θ)2, etc. e p0 = (1− θ)n, p1 = n θ(1− θ)n−1, p2 = 1

2n(n− 1)θ2(1− θ)n−2,p3 = 1

2·3n(n − 1)(n − 2)θ3(1 − θ)n−3, etc. Vedasi figura 4.2. Per le leggi di Poisson e binomialenegativa si ha p0 = e−λ, p1 = e−λ λ, p2 = e−λ λ2

2 , p3 = e−λ λ3

2·3 , etc. e p0 = θ3, p1 = 3 θ3 (1 − θ),p2 = 6 θ3 (1−θ)2, p3 = 10 θ3 (1−θ)3, etc. Vedasi figura 4.3. Per i calcoli delle probabilita geometrica,

Page 61: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

60 Capitolo 4 Leggi di probabilita

binomiale, poissoniana e binomiale negativa tornano utili le formule ricorsive

(a) pk+1 = pk · (1− θ) , k ∈ N , (b) pk+1 = pk · n− k

k + 1· θ

1− θ, k ∈ 0, 1, . . . , n− 1 ,

(c) pk+1 = pk · λ

k + 1, k ∈ N0 , (d) pk+1 = pk · ν + k

k + 1· (1− θ) , k ∈ N0 .

2 4 6 8

0.1

0.2

0.3

0.4

0.5

0.6

0.7

HxLΘ = 0.3

Θ = 0.7HgeometricaL

2 4 6 8 10

0.1

0.2

0.3

0.4

HxL

Θ = 0.2

Θ = 0.5

HbinomialeLHn=10L

Figura 4.2. - Istogrammi delle leggi geometrica e binomiale.

2 4 6 8 10 12 14

0.05

0.1

0.15

0.2

0.25

0.3

HxL

HPoissonLΛ= 1.5

Λ= 4.8

5 10 15 20

0.1

0.2

0.3

0.4 Hbinomiale negativaLHΝ =3LHxLΘ = 0.4

Θ = 0.75

Figura 4.3. - Istogrammi delle leggi di Poisson e binomiale negativa.

Esempio D. Mediante le formule ricorsive (b) e (c) dell’esempio C calcolare la moda delle leggibinomiale e di Poisson.R. Dalla (b) si deduce che ∀k < r0, con r0 = (n + 1)θ − 1, si ha pk < pk+1. Se r0 ∈ N la binomialee bimodale in r0 e r0 + 1. Se r0 6∈ N la binomiale e unimodale in cr0b. Ad esempio, per θ = 1

2 en = 10 si ha r0 = 4.5 e dunque moda = 5, vedi figura 4.2. Per θ = 1

3 e n = 11 si ha r0 = 3 e dunquemoda1 = 3, moda2 = 4. Per θ = 1

100 e n = 50 si ha r0 = −0.49 e dunque moda = 0.Dalla (c) si deduce che ∀k < r0, con r0 = λ− 1, si ha pk < pk+1. Se λ ∈ N la poissoniana e bimodalein r0 e r0 + 1. Se λ 6∈ N la poissoniana e unimodale in cr0b. Ad esempio, se λ = 0.5 si ha r0 = −0.5con moda = 0; se λ = 4.8 si ha r0 = 3.8 con moda = 4; se λ = 3 si ha moda1 = 3, moda2 = 4.

Page 62: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

4.6 Esempi, grafici e complementi 61

Esempio E. Ivo, Pio e Ugo hanno in tasca rispettivamente 18, 10 e 8 monete, 7, 3 e 4 delle qualisono estere. Ad uno dei tre un ladro ruba 5 monete 2 delle quali estere. Si calcoli la probabilita chela vittima sia Ivo.R. (Traccia.) Le informazioni in nostro possesso non ci autorizzano a pensare che per il ladro visia stata una speciale “preferenza” per uno dei tre. La descrizione . . . dell’esperimento induce ariguardare le tre tasche come . . . urne esaustive.

Esempio F. Si mostra, mediante esempi, la convergenza in legge e in media quadratica della iper-geometrica alla binomiale e della binomiale alla legge di Poisson, vedi teorema 4.6. Nel primo siincrementa il numero NA e NB delle biglie color A e B nell’urna, tenendo costante il rapportoNA/N , con N = NA + NB , e facendo sempre n = 5 prove esaustive. La binomiale di parametroθ = 0.3 e n = 5 ben approssima la ipergeometrica con NA = 300 e NB = 700. Vedasi Tav. 4.1.Nel secondo caso si manda a zero la proporzione θ delle biglie color A e si incrementa il numero n

delle prove (con restituzione), mantenendo costante il prodotto n θ. La legge di Poisson di parametroλ = n θ = 1.5 ben approssima la binomiale di parametro θ = 0.015 e n = 100. Vedasi Tav. 4.2.

px Hyp(x|6, 14, 5) Hyp(x|30, 70, 5) Hyp(x|60, 140, 5) Hyp(x|300, 700, 5) Bin(x|0.3, 5)

p0 0.12913 0.16076 0.16444 0.16735 0.16807

p1 0.38738 0.36536 0.36274 0.36067 0.36015

p2 0.35217 0.31628 0.31243 0.30944 0.30870

p3 0.11739 0.13023 0.13131 0.13211 0.13230

p4 0.01354 0.02548 0.02692 0.02807 0.02835

p5 0.00039 0.00189 0.00215 0.00237 0.00243

V arN (X) 0.82895 1.00758 1.02889 1.04580 1.05000

Tav.4.1 - Convergenza della ipergeometrica alla legge binomiale.

px Bin(x|0.3, 5) Bin(x|0.15, 10) Bin(x|0.03, 50) Bin(x|0.015, 100) Po(x|1.5)

p0 0.16807 0.19687 0.21807 0.22061 0.22313

p1 0.36015 0.34742 0.33721 0.33595 0.33470

p2 0.30870 0.27590 0.25551 0.25324 0.25102

p3 0.13230 0.12983 0.12644 0.12598 0.12551

p4 0.02835 0.04010 0.04595 0.04652 0.04707

p5 0.00243 0.00849 0.01307 0.01360 0.01412

p6 0.00125 0.00303 0.00328 0.00353

p7 0.00013 0.00059 0.00067 0.00076

p8 0.0 0.00010 0.00012 0.00014

p9 0.0 0.00001 0.00002 0.00002

p10 0.0 0.0 0.0 0.0

V arn(X) 1.0500 1.2750 1.4550 1.4775 1.5000

Tav.4.2 - Convergenza della binomiale alla legge di Poisson.

Esempio G. In figura 4.4 (A) e (B) sono tracciate le f.d.p. e le f.r. delle leggi normale con µ = 0 eσ2 = 1

4 , 1, 4, caso (A), normale con µ = −1, 0, 3 e σ2 = 1, caso (B). In figura 4.5 sono date le f.d.p.e le f.r. delle leggi esponenziale con λ = 1

2 , 1, 2 e di Weibull con α = 12 , 1, 2 e λ = 1.

Page 63: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

62 Capitolo 4 Leggi di probabilita

-4 -2 2 4

0.2

0.4

0.6

0.8HALHxL

-4 -2 2 4 6

0.1

0.2

0.3

0.4HBLHxL

-4 -2 2 4

0.2

0.4

0.6

0.8

1HALHxL

-4 -2 2 4 6

0.2

0.4

0.6

0.8

1HBLHxL

Figura 4.4. - F.d.p. e f.r. di alcune leggi normale.

0.5 1 1.5 2 2.5 3 3.5 4

0.5

1

1.5

2

HesponenzialeLHxL0.5 1 1.5 2 2.5 3

0.20.40.60.8

11.2 HWeibullL

HxL

0.5 1 1.5 2 2.5 3 3.5 4

0.2

0.4

0.6

0.8

1

HesponenzialeLHxL0.5 1 1.5 2 2.5 3

0.2

0.4

0.6

0.8

1

HWeibullL HxL

Figura 4.5. - F.d.p. e f.r. di alcune leggi esponenziali e di Weibull.

Esempio H. Sia T il tempo di vita di un cavo con T ∼ Weibull(t|α, λ), α = 2.2 e λ = 0.4. Unaditta vende n cavi con patto di risarcimento se T e inferiore a t0 = 2 anni. Calcolare la probabilitache essa debba risarcirne: (a) piu di 3, con n = 12, (b) piu di 6, n = 24, (c) piu di 30, n = 120.R. Sia Yi la v.a. che vale “1” [“0”] se l’i−esimo cavo [non] si rompe, sia X =

∑ni=1 Yi il numero

di cavi da risarcire. Sia θ = P(Y = 1) = P(T < t0) =∫ t00

Weibull(t|α, λ)dt =∫ tα

00

Exp(u|λ)du =e−λ·tα

0 ∼= 0.1591. Caso (a), qa = P(X > 3) = 1− P(X ≤ 2) = 1−∑2x=0 Bin(x|θ, n) = 0.1100. Caso

(b), qb = P(X > 6) = 0.0745. Caso (c), occorre ora applicare il teorema del limite centrale, vedasi piuavanti in sezione 5.1. Si ha qc = P(X > 30) =

∑x>30 Bin(x|θ, n) ∼= 1 − Φ(z0) = 0.0022, con z0 =

Page 64: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

4.6 Esempi, grafici e complementi 63

30+ 12−120·0.1591√

120·0.1591(1−0.1591)= 2.8454. (Come spiegare che 3

12 = 624 = 30

120 e che qa > qb > qc?)

Esempio I. Il tempo di vita T (in anni) di un certo pezzo segue la legge di Weibull di parametri α

e θ. (a) Posto α = 6 e θ = 5 [anni], si calcoli la probabilita che il pezzo: (i) non superi i 42 mesi divita; (ii) superi gli 80 mesi di esercizio. (b) Posto t0 = 3 e t1 = 10 [anni] si calcolino i parametri α eθ tali che P(T < t0) = P(T > t1) = 0.01.R. (a) Sia t0 = 42 mesi ≡ 3.5 anni e t1 = 80 mesi ≡ 6.667 anni. Poiche λ = θ−α = 6.4 · 10−4, siha (i) P(T < t0) = 1 − e−λtα

0 = 0.1110; (ii) P(T > t1) = e−λtα1 = 0.0036. (b) Dalle condizioni

P(T < t0) = 1− exp−

( t0θ

)α= P(T > t1) = exp

( t1θ

)α= 0.01, si ha

( t0t1

= log 0.99log 0.01 , da

cui α = 4.72. Sostituendo α in una delle due condizioni si ottiene θ = 7.96. Vedi figure 4.6.

2 4 6 8

0.1

0.2

0.3

0.4

0.1110

0.0036

t0 t1

Α = 6Θ = 5

HxL

WeibullHxÈΑ,Θ-ΑL

2 4 6 8

0.1

0.2

0.3

0.4

2 4 6 8 10 12 14

0.05

0.1

0.15

0.2

0.25

0.01 0.01

t0 t1

Α = 4.72Θ = 7.96

HxLWeibullHxÈΑ,Θ-ΑL

2 4 6 8 10 12 14

0.05

0.1

0.15

0.2

0.25

Figura 4.6. - F.d.p. della legge di Weibull; (a) α = 6 e θ = 5, (b) α = 4.72 e θ = 7.96.

Esempio L. (*) In figura 4.7 sono tracciate le f.d.p. e le f.r. delle leggi di Pareto con α = 0.5, 1, 2e β = 0.7 e lognormali con µ = 0.85, 1.3, 2 e σ2 = 1

4 .

0.5 1 1.5 2

0.51

1.52

2.53

HParetoLHxL

5 10 15 20

0.1

0.2

0.3

0.4

HlognormaleLHxL

0.5 1 1.5 2

0.2

0.4

0.6

0.8

1 HParetoLHxL

5 10 15 20

0.2

0.4

0.6

0.8

1

HlognormaleLHxL

Figura 4.7. - F.d.p. e f.r. di alcune leggi di Pareto e lognormali.

Page 65: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

64 Capitolo 4 Leggi di probabilita

Esempio M. Sono date le funzioni: (i) f1(x) = c1ζx, con x ∈ N0 e ζ ∈ (0, 1) noto, (ii) f2(x) =

c2(5−x)3, con x ∈ (0, 5), (iii) f3(x) = c3x3, con x ∈ ∓3,∓2,∓1, (iv) f4(x) = c4

1x

, con x ∈ N, (v)

f5(x) = c51

x (x + 1), con x ∈ N. (vi) f6(x) = c6

11 + x2

, con x ∈ R. Stabilire se, per qualche valore

delle costanti cj , le funzioni fj sono leggi di probabilita. In caso positivo si calcolino (se esistono)medie e varianze, nonche la probabilita che X superi 3.R. (Si consiglia di servirsi dei grafici delle funzioni.)(i) Per c1 > 0, f1(x) > 0, ∀x ∈ N0. Dalla condizione c1

∑∞x=0 ζx = 1, si ricava c1 = 1 − ζ. Si noti

che la nostra e una serie geometrica:∑∞

x=0 ζx =1

1− ζ, vedi sezione 7.1 in appendice. La f1(x) e

una legge binomiale negativa di parametri (1 − ζ, 1), con E(X) =ζ

1− ζe V ar(X) =

ζ

(1− ζ)2. Si

ha infine P(X > 3) = P(X ≥ 4) =∑∞

x=4(1 − ζ)ζx = (1 − ζ)ζ4∑∞

x=4 ζx−4 = (1 − ζ)ζ4∑∞

t=0 ζt =

(1− ζ)ζ4 11− ζ

= ζ4. (Si sarebbe potuto porre P(X > 3) = 1− P(X ≤ 3) = . . . )

(ii) Per c2 > 0, f2(x) > 0, ∀x ∈ (0, 5). Grazie alla condizione c2

∫ 5

0(5− x)3dx = 1 si ricava il valore

di c2. Poiche∫ 5

0(5 − x)3dx = − 1

4

[(5− x)4

]50

= 54

4 , si deduce c2 = 4625 . La f2(x) e dunque una

f.d.p. Media e momento secondo non centrale sono µ = 454

∫ 5

0x (5 − x)3dx = 4

54

∫ 5

0(5 − u) u3du =

454

[54u4 − 1

5u5]50

= 1 e µ′2 = 454

∫ 5

0x2 (5− x)3dx = 4

54

∫ 5

0(5− u)2 u3du = 4

54

[254 u4 − 10

5 u5 + 16u6

]50

=53 , da cui σ2 = µ′2 − µ2 = 2

3 . Si ha infine P(X > 3) = 1 − P(X ≤ 3) = 1 − ∫ 3

0(5 − x)3dx =

1− 454

14

[(5− x)4

]30

= 1− 0.9744 = 0.0256.(iii) La f3(x) non e una legge di probabilita. Infatti, se c3 > 0, la f3(x) < 0 per certi punti.Viceversa, se c3 < 0 f3(x) < 0 per i restanti punti. Si giunge alla stessa conclusione se si pensa che∀c3 6= 0, la f3(x) e una funzione dispari.(iv) La f4(x) non e una legge di probabilita. Se e vero che con c4 > 0, la f4(x) > 0, ∀x, e anche vero

che 6 ∃c4 > 0 finito tale che c4

∑∞x=1

1x

= 1. (Si osservi che la serie non e sommabile.)

(v) La f5(x) e una legge di probabilita. Se c5 > 0, la f5(x) > 0, ∀x. Poiche∑∞

x=1

1x (x + 1)

= 1, si

ha c5 = 1. Infine P(X > 3) = 1− P(X ≤ 3) = 1− (1 · 12 + 1

2 · 13 + 1

3 · 14 ) = 1

4 . La media non esiste.

(vi) La f6(x) e una legge di probabilita. Se c6 > 0, la f6(x) > 0, ∀x. Inoltre c6

∫∞−∞

11 + x2

dx =

c6 [arctanx]∞−∞ = c6π = 1. Da cui c6 =1π

. Poiche∫ x

1 + x2dx = 1

2 log(1 + x2) + cost, la X non ha

media. Infine P(X > 3) =1π

∫∞3

11 + x2

dx =1π

[arctan]∞3 ∼= 1π

2− 1.2491

)= 0.1024. (La f.d.p.

f6(x) prende il nome di legge di Cauchy.)

Page 66: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

5OPERAZIONI SULLE V.A.

Der Teufel steckt im Detail. (Il diavolo si annida nei dettagli.)(Johann Wolfgang Goethe - Doctor Faust)Provando e riprovando. (Motto dell’Accademia del Cimento, 1667)

Siano X = (X1, X2, . . . , Xn) e x = (x1, x2, . . . , xn) il campione aleatorio ed il corrispondente cam-

pione osservato. Con le maiuscole U =∑n

i=1 Xi, X =1n

U =1n

∑ni=1 Xi, S2 =

1n

∑ni=1(Xi − X)2,

S2c =

n

n− 1S2, S2

0 =1n

∑ni=1(Xi − µ)2, etc. sono indicati gli indici campionari aleatori. Con le cor-

rispondenti minuscole u, x, s2, s2c , s2

0, etc. gli indici campionari osservati. Se i dati sono dicotomici,

Xi ∈ 0, 1, medie X e x e proporzioni di successo P =1n

U e p =1n

u coincidono.Delle operazioni elementari sulle v.a.i. la somma e la piu importante. Teoria e tecniche della

somma di v.a.i. non sono trattate nello zip. Il capitolo fornisce, senza dimostrazioni, le leggi degliindici campionari aleatori, nota che sia la legge della v.a. X.

5.1 Somme di v.a.i.

Teorema 5.1. Date le v.a. X1, X2, . . . , Xn si ha E(∑

i aiXi + b) =∑

i aiE(Xi) + b.

Teorema 5.2. Se X1, X2, . . . , Xn sono v.a.i. allora V ar(∑

i aiXi + b) =∑

i a2i V ar(Xi).

Corollario 5.1. Se E(Xi) = µ e V ar(Xi) = σ2 > 0, allora E(U) = nµ, V ar(U) = nσ2 e E(X) = µ,V ar(X) = 1

nσ2.

65

Page 67: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

66 Capitolo 5 Operazioni sulle v.a.

E facile, verificare che le standardizzate di U e X coincidono

Z =U − E(U)V ar(U) 1

2=

U − nµ

σ√

n=

X − µ

σ

√n =

X − E(X)V ar(X) 1

2.

Teorema 5.3. Se X ∼ Bin(x | θ, m) e Y ∼ Bin(y | θ, n) sono v.a.i., allora la v.a. Z = X + Y ∼Bin(z | θ, N), con N = m + n.

Corollario 5.2. Se X1, X2, . . . , Xn sono v.a.iid dicotomiche, con PXi = 1 = θ, allora la v.a.U =

∑ni=1 Xi ∼ Bin(u | θ, n).

Teorema 5.4. Se X1, X2, . . . , Xn sono v.a.iid con Xi ∼ G(x | θ), allora la v.a. U =∑n

i=1 Xi

∼ Pascal(u | θ, n).

Teorema 5.5. Se X e Y sono v.a.i. con X ∼ Po(x | λ) e Y ∼ Po(y | µ), allora la v.a. Z = X + Y

∼ Po(z | λ + µ).

Corollario 5.3. Se X1, X2, . . . , Xn sono v.a.iid, con Xi ∼ Po(x | λ), allora la v.a. U =∑n

i=1 Xi

∼ Po(u | nλ).

Teorema 5.6. Se X e Y sono v.a.i. con X ∼ N(x | µ1, σ21) e Y ∼ N(y | µ2, σ

22), allora la v.a. Z =

aX ± bY + c ∼ N(z | µz, σ2z), con µz = aµ1 ± bµ2 + c e σ2

z = a2σ21 + b2σ2

2.

Dal teorema 5.6 e dai corollari 4.2 e 5.1 segue il corollario

Corollario 5.4. Se X1, X2, . . . , Xn sono v.a.iid, con Xi ∼ N(x | µ, σ2), allora le v.a. U =∑n

i=1 Xi

∼ N(u | nµ, nσ2) e X ∼ N(x | µ,σ2

n).

Corollario 5.5. Nelle condizioni del corollario 5.4 si ha Z =U − nµ

σ√

n=

X − µ

σ

√n ∼ N(z | 0, 1).

Teorema 5.7. Se X1, X2, . . . , Xn sono v.a.iid, con Xi ∼ Chi2(x | 1), allora la v.a. U =∑n

i=1 Xi

segue la legge Chi2 con n gradi di liberta

U ∼ Chi2(u | n) =( 12 )

12 n

Γ( 12n)

un2 − 1 e−

12u , U ∈ R+ .

Se α = 12ν, con ν ∈ N, e λ = 1

2 , si ha Gamma(x | 12ν, 1

2 ) = Chi2(x | ν). La f.d.p. Chi2, e dunqueuna particolare legge gamma. I percentili della Chi2 sono tabulati in sezione 7.3 dell’appendice.

Corollario 5.6. Se X ∼ Gamma(x | n, λ), con n ∈ N, allora la v.a. Y = 2λX ∼ Chi2(y | 2 · n).

Teorema 5.8. Se X ∼ Gamma(x | α1, λ) e Y ∼ Gamma(x | α2, λ), sono v.a.i., allora la v.a.Z = X + Y ∼ Gamma(x | α, λ), con α = α1 + α2.

Corollario 5.7. Se X1, X2, . . . , Xn sono v.a.iid, con Xi ∼ Exp(x | λ), allora U ∼ Erlang(u | n, λ).

Corollario 5.8. Se X ∼ Chi2(x | ν1) e Y ∼ Chi2(y | ν2) sono v.a.i., allora la v.a. Z = X + Y ∼Chi2(z | ν), con ν = ν1 + ν2.

Page 68: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

5.1 Somme di v.a.i. 67

Corollario 5.9. Se X1, X2, . . . , Xn sono v.a.iid, con Xi ∼ N(x | µ, σ2), allora la v.a. Q0 =∑n

i=1

(Xi − µ

σ

)2

=nS2

0

σ2∼ Chi2(q0 | n).

Per ogni n-pla di v.a.iid X1, X2, . . . , Xn, con media µ e varianza σ2 > 0, vale la scomposizione

Q0 = Q1 + Q2, con Q1 =(X − µ

σ/√

n

)2

e Q2 =nS2

σ2. Vale l’importante teorema

Teorema 5.9. (Friedrich Robert Helmert, 1876.) Nelle condizioni del precedente corollario, si ha:(i) X e S2 sono v.a.i., (ii) Q1 ∼ Chi2(q1 | 1), (iii) Q2 ∼ Chi2(q2 | n− 1).

Corollario 5.10. Nelle condizioni del teorema 5.9, si ha S2 ∼ Gamma(s2

∣∣ 12 (n − 1),

n

2σ2

)e S2

c ∼Gamma

(s2

∣∣ 12 (n− 1),

n− 12σ2

).

Teorema 5.10. (Student, 1908; pseudonimo di W. S. Gossett.) Se Z ∼ N(z | 0, 1) e Y ∼ Chi2(y | ν)

sono v.a.i., allora la v.a. T =Z√Y/ν

segue la legge di Student con n gradi di liberta

T ∼ Student(t | n) =Γ(n+1

2 )Γ(n

2 )√

π

1√n

(1 +

t2

n

)− 12 (n+1)

, T ∈ R .

La f.d.p. di Student, e pari e dunque simmetrica. La proprieta e utile nel calcolo dei percentili,vedi sezione 7.3 in appendice. Dai teoremi 5.9 e 5.10 segue il corollario

Corollario 5.11. Se X1, X2, . . . , Xn sono v.a.iid, con Xi ∼ N(x | µ, σ2), allora la v.a. Tn =X − µ

S

√n− 1 =

X − µ

Sc

√n ∼ Student(t | n− 1).

Vale l’utile proprieta limite.

Teorema 5.11. limν→∞ Student(x | ν) = N(x | 0, 1).

Di somma importanza teorica e pratica e il teorema del limite centrale caso particolare di conver-genza in distribuzione, vedi definizione 4.6, ed un tempo noto come IIIa legge dei grandi numeri

Teorema 5.12. Sia X1, X2, . . . , Xn, . . . una successione di v.a.iid con Xi avente media E(Xi) = µ

e varianza V ar(Xi) = σ2 > 0, sia Un =∑n

i=1,n Xi e Xn = 1nUn. Per n →∞ si ha

Zn =Un − E(Un)V ar(Un) 1

2=

Xn − E(Xn)V ar(Xn) 1

2

L→ Z ∼ N(x | 0, 1) .

Se Xi ∈ 0, 1, Xn e la proporzione Pn =1n

Un. Notare che il teorema 5.12 si riferisce a v.a.standardizzate e non fa differenza tra v.a. discrete o a.c. Ne richiede che sia nota la legge delle Xi

e/o di Un. Nella tavola che segue si danno esempi di v.a. standardizzate che convergono alla v.a.normale standard.

v.a. X v.a. standardizzata Zn v.a. X v.a. standardizzata Zn

Bin(x | θ, 1) Zn =Un − n θpnθ(1− θ)

=Pn − θpθ(1− θ)

√n u(x | 0, 1) Zn =

Un − 12nq

112

n= (Xn − 1

2)2√

3n

Po(x | λ) Zn =Un − nλ√

nλ=

Xn − λ√λ

√n Exp(x | λ) Zn =

Un − n/λ√n

λ = (λXn − 1)√

n

Chi2(x | 1) Zn =Un − n√

2n

Page 69: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

68 Capitolo 5 Operazioni sulle v.a.

B Nota. Nelle condizioni del teorema 5.12 e per “n grande” si ha Zn =Un − nµ

σ√

n≈ N(z|0, 1)

ovvero Un ≈ N(u|nµ, nσ2), etc. L’uso pratico del teorema, legato al concreto valore di “n grande”,si traduce nella (facile e banale) regola σ2

U = V ar(Un) = nV ar(X) = nσ2 > 8÷ 10. C

5.2 Esempi e graficiSi danno, vedi figura 5.1, i grafici delle leggi Chi2 con ν = 1, 2, . . . , 16 e di Student per ν = 1, 2, 3, 4,

6, 10, 20,∞. Si noti come all’aumentare dei gradi di liberta la legge Chi2 tenda a simmetrizzarsi ecome la legge di Student converga alla normale.

5 10 15 20 25 30

0.1

0.2

0.3

0.4

0.5

HΝ =1,2,...,16LChi2HxÈΝL

HxL-4 -2 0 2 4

0.1

0.2

0.3

0.4

Ν =1,2,3,4,

6,10,20,¥

StudentHxÈΝL

HxLFigura 5.1. - Leggi Chi2 e di Student.

Esempio A. Sia U ∼ Bin(u|θ, n). Si calcolino, in modo esatto ed approssimato la probabilita cheU ≤ u0, con u0 = 5 e u0 = 9, quando (i) θ = 1

2 e n = 20; (ii) θ = 14 e n = 40.

parametri u0 pu0 z0 pu0 zc0 pc

u0

θ = 12 , n = 20 5 0.02064 −2.236 0.01267 −2.012 0.02209

9 0.41190 −0.447 0.32736 −0.224 0.41153θ = 1

4 , n = 40 5 0.04327 −1.826 0.03394 −1.643 0.050179 0.43954 −0.365 0.35750 −0.183 0.42757

Tav. 5.1 - Probabilita esatte ed approssimate.

R. Nel caso (i) si ha pu0 = P(U ≤ u0) =∑u0

u=0 Bin(u|θ, n) = 0.02064 e cosı via per le altre

probabilita esatte, vedi Tav. 5.1. Grazie al teorema del limite centrale, si ha Zn =U − µU

σU≈

N(z|0, 1), con µU = n θ e σ2U = nθ(1 − θ), da cui U ≈ N(x|µU , σ2

U ). Posto z0 =u0 − µU

σUnel caso

(i) si ha: P(U ≤ u0) ∼= pu0 =∫ u0

−∞N(u|µU , σ2U )du = Φ(z0) = 0.01267, con z0 = −2.236, etc. Notare

che σ2U = 5, caso (i), e σ2

U = 7.5, caso (ii). Per migliorare le non soddisfacenti approssimazioni si

propone la correzione di continuita. Se e vero che, vedi figura 5.2, la f.r. Φ(u− µU

σU

)appare prossima

Page 70: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

5.2 Esempi e grafici 69

alla f.r. della binomiale, e pure vero che l’errore e massimo in corrispondenza delle “alzate”. Lacorrezione assume dunque uc

0 = u0 + 12 in luogo di u0. Nel caso (i) si ha: P(U ≤ u0) ∼= pc

u0=∫ uc

0−∞N(u|µU , σ2

U )du = Φ(zc0) = 0.02209, con zc

0 = −2.012, etc.

5 10 15 20

0.05

0.1

0.15

0.2

HxLΘ = 12n = 20

5 10 15 20

0.05

0.1

0.15

0.2

HxLΘ = 14n = 40

5 10 15 20

0.2

0.4

0.6

0.8

1

HxLFH x - ΜU

ΣUL

ΜU = 10

ΣU2= 5

5 10 15 20

0.2

0.4

0.6

0.8

1

HxLFH x - ΜU

ΣUL

ΜU = 10

ΣU2= 7.5

Figura 5.2. - Approssimazione della binomiale mediante la legge normale.

B Nota. Per il calcolo di P(U ≥ u0), la correzione e uc0 = u0 − 1

2 . Dunque P(U ≥ u0) ∼=1− Φ

(uc0 − µU

σU

). Ed ancora P(u0 ≤ U < u1) ∼= Φ

(u1 − 12 − µU

σU

)− Φ

(u0 − 12 − µU

σU

), etc. C

Esempio B. Il numero di bacteri contenuti in una goccia d’acqua (prelevata da una certa pozza)segue la legge di Poisson di media 2.3 [bacteri/goccia]. Calcolare la probabilita che su 1000 gocce,prese a caso dalla pozza, (i) piu di 900 siano infette; (ii) piu di 890 e meno di 910 siano infette.R. Si ponga λ = 2.3, n = 1000, u0 = 900, u1 = 890, u2 = 910. Sia Y la v.a. che prende il valore“1” [“0”] se la goccia [non] e infetta. Dunque: θ = P(Y = 1) = P(X ≥ 1) = 1−P(X = 0) = 1−e−λ ∼=0.8997. Sia Un =

∑ni=1 Yi il numero aleatorio di gocce infette, con µU = nθ = 899.7 e σ2

U = nθ(1−θ) =90.207. Tenuto conto della correzione di continuita, vedi esempio A, si ha: caso (i), P(Un > u0) =∑

u>u0Bin(u|θ, n) ∼=

∫∞uc0

N(u|µU , σ2U )du = Φ(zc

0) = 0.4682, con uc0 = u0 − 1

2 , zc0 = 0.080; caso (ii),

P(u1 < Un < u2) =∑

u1<u<u2Bin(u|θ, n) ∼=

∫ uc2

uc1

N(u|µU , σ2U )du = Φ(zc

2)−Φ(zc1) = 0.8479−0.1653 =

0.6826, con uc1 = u1 + 1

2 , uc2 = u2 − 1

2 e zc1 = −0.973, zc

2 = 1.027.

Esempio C. La v.a. Y segue la legge Chi2 con 1850 gradi di liberta. Calcolare la probabilita cheY non superi 2000 e non sia inferiore a 1900.R. Si ponga ν = 1850, y1 = 1900, y2 = 2000 e si consideri che E(Y ) = ν e V ar(X) = 2ν. Si ha:P(y1 < Y < y2) =

∫ y2

y1Chi2(y|ν)dy ∼= Φ(z2)− Φ(z1) = 0.9932− 0.7945 = 0.1987, dove z1 = 0.822 e

z2 = 2.466 sono ottenuti da y1 e y2 per standardizzazione.

Esempio D. Sia (X1, X2, . . . , Xn) una successione di v.a. iid, con n = 11·000, proveniente dalla v.a.X ∼ u(x|0, 10). Si calcoli la probabilita che la somma delle Xi sia compresa fra 54·000 e 55·500.

Page 71: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

70 Capitolo 5 Operazioni sulle v.a.

R. Sia Un =∑n

i=1 Xi, u1 = 54·000, u2 = 55·500. Poiche X ∼ u(x|0, 10), E(X) = 5 e V ar(X) = 253 ,

la v.a. standardizzata e Zn =Un − 5n

5√

13n

. Le standardizzate di u1 e u2 sono z1 = −3.303, z2 = 1.651.

Pertanto: P(u1 < Un < u2) ∼= Φ(z2)− Φ(z1) = 0.9507− 0.0005 = 0.9502.

Esempio E. La v.a. U segue la legge binomiale con θ = 13 e n = 450. Fissato α = 0.01, si calcolino

i valori u1 e u2 tali che P(u1 < U < u2) ≥ 1− α e che P(U ≤ u1) = P(U ≥ u2) < 12α.

R. Si ha E(U) = nθ = 150, V ar(U) = nθ(1−θ) = 100. Dalla Φ(z0) = 1− 12α si ricava che z0 = 2.576,

vedi Tav. 7.2 in appendice. Dalle condizioniu1,2 − E(U)[V ar(U)]1/2

= ∓z0 si ha u1,2 = nθ ∓ z0

√nθ(1− θ)

= 150∓ 2.576 · 10. E dunque u1 = b124.24c = 124 e u2 =c175.76b= 176.Esempio F. Sia U la somma di n v.a. iid esponenziali di media 2.2. Si calcoli la probabilita cheUn: (i) cada fra 24.4 e 32, con n = 20; (ii) superi 420, con n = 200.R. (i) P(24.4 < Un < 32) ∼= 0.091; (ii) grazie al teorema del limite centrale, P(420 < Un) ∼= 0.7398.

5.3 ComplementiPer mostrare la convergenza della legge Chi2 alla normale si danno, in figura 5.3, le f.d.p. delle

v.a. Zν =Xν − ν√

2 ν∼ f(z|ν), con Xν ∼ Chi2(x|ν), per ν = 8, 16, 50, 100,∞. Si osservi come f(z|ν)

si simmetrizzi al crescere di ν. Mediante esempi numerici si mostra la convergenza, al cresceredi ν, dei percentili standardizzati (di ordine 1 − α = 0.95) della Chi2 ai corrispondenti percentilidella normale standard. Siano xν, 1

2 α e xν,1− 12 α i percentili della legge Chi2 con ν gradi di liberta:

P(xν, 12 α ≤ Xν < xν,1− 1

2 α) = 1− α. La Tav. 5.2 riporta tali percentili ed i corrispondenti percentili

-4 -2 0 2 4

0.1

0.2

0.3

0.4

0.5

HΝ = 8,16,50,100,¥L

HzL

f Hz È ΝL

Figura 5.3. - F.d.p. di alcune v.a. Chi2 standardizzate. (La normale standard e in grassetto.)

standardizzati zν, 12 α e zν,1− 1

2 α, per ν = 8, 16, 50, 100, 200, 400,∞. Con la stessa procedura si puostudiare la convergenza del 10 e 30 quartile.

Page 72: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

5.3 Complementi 71

ν 8 16 50 100 200 400 ∞xν, 1

2 α 2.1797 26.2962 32.3574 74.2219 162.7280 346.4821 -

xν,1− 12 α 17.5345 28.8454 71.4202 129.5612 241.0579 457.3050 -

zν, 12 α −1.4551 −1.6073 −1.7643 −1.8228 −1.8636 −1.8922 −1.960

zν,1− 12 α 2.3836 2.2708 2.1420 2.0903 2.0529 2.0261 1.960

Tav. 5.2 - Percentili 1− α = 0.95.

B Il teorema di Bernoulli e la legge empirica del caso.

Il teorema di Bernoulli, vedi paragrafo 4.4, e la legge empirica del caso, vedi paragrafo 3.4, vengonospesso erroneamente confusi. Si esegua (ad esempio) un numero illimitato di lanci di un dado regolaree ad ogni colpo si formi il rapporto Pn = 1

nun tra il numero aleatorio di volte in cui e uscito il punto“5” ed il numero di lanci fatti fino allora. Il teorema di Bernoulli non afferma che Pn tende a θ = 1

6 ,per n → ∞, (ne si puo dire che questa affermazione sia corretta in senso matematico). Il teoremadice solo che, ∀ε > 0 arbitrario, la probabilita che il rapporto Pn cada nell’intervallo ( 1

6 − ε, 16 + ε)

tende alla certezza (cioe al limite 1) quando n →∞.Il teorema di Bernoulli, dunque, stabilisce un legame tra la probabilita nota θ e i risultati delle

prove. Come tale esso e uno strumento per calcolare probabilita di frequenze future. C

B Cosa si intende per legge dei grandi numeri.

Il termine legge dei grandi numeri indica genericamente un teorema che si riferisce al comportamentoasintotico, cioe per n →∞, cioe a lungo andare, di quantita aleatorie calcolate da successioni di v.a.i.(ad esempio la somma, la media, le proporzioni di successo, etc.)

Fanno parte delle leggi deboli dei grandi numeri, la convergenza in legge col teorema del limitecentrale e la convergenza in probabilita col teorema di Bernoulli. La convergenza dei momenti e laconvergenza quasi certa, in sigla q.c., rientrano nelle leggi forti dei grandi numeri. Lo zip accenneraalla differenza fra le convergenze in probabilita e q.c. facendo ricorso ad un facile esempio.

Si consideri una serie aleatoria di n lanci di una moneta regolare e con essa la proporzione disuccesso Pn e si calcoli, prima del giuoco, la probabilita che Pn cada fuori dell’intervallo ( 1

2−ε, 12 +ε),

con ε > 0 arbitrario. Il teorema di Bernoulli (legge debole) afferma che tale probabilita e inferioread un prefissato η > 0, pur di prendere n sufficientemente elevato. La legge forte assicura che,∀k ∈ N prefissato e per n convenientemente grande, si possa rendere inferiore ad η la probabilita chele proporzioni empiriche Pn, Pn+1, . . . , Pn+k cadano tutte fuori dall’intervallo (1

2 − ε, 12 + ε). C

B Il teorema di Poisson.Simeon D. Poisson (1781-1840) che per primo introdusse il termine legge dei grandi numeri, prese inesame una successione infinita di prove indipendenti, in ciascuna delle quali puo verificarsi un certoevento E, raro (ma non impossibile), avente probabilita pn > 0 variabile da una prova all’altra.Sotto tali ipotesi, puo accadere che E non si verifichi mai? Il teorema di Poisson, noto anche comeIa legge dei grandi numeri, assicura che “a lungo andare anche l’evento piu raro prima o poi finisceper accadere”. Indicando con En “l’evento E accade all’n-esima prova” si da il teorema

Teorema 5.13. (Poisson, 1837). Sia data una successione di prove indipendenti, in ciascuna dellequali puo verificarsi l’evento E, con P(En) = pn > 0. Vale il limite limn→∞ P

(⋃ni=1 En

)= 1.

Page 73: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

72 Capitolo 5 Operazioni sulle v.a.

Per dimostrare il teorema di Poisson si parte dalla formula di De Morgan, vedi paragrafo 3.1. Siha P

(⋃ni=1 En

)= P

(⋂ni=1 En

)= 1 − P( ⋂n

i=1 En

)= 1 −∏n

i=1(1 − pi). Poiche ∀i e 1 − pi < 1, ne

consegue che limn→∞∏n

i=1(1− pi) = 0 che dimostra il teorema. C

Page 74: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

6STATISTICA INFERENTE

Est modus in rebus, sunt certi denique fines,

Quos ultra citraque nequit consistere rectum. (Orazio, Satire, I,I, 106-107)

Non esistono dati, esistonono solo interpretazioni. (Friedrich W. Nietzsche)

Di norma, l’esigenza di conoscere o conoscere meglio la popolazione Ω da cui proviene il campionenon puo essere soddisfatta, se non in minima parte, con la semplice descrizione del campione.

Il processo mediante il quale si passa dal campione (noto) x = (x1, x2, . . . , xn) alla popolazione(ignota) Ω, dal noto all’ignoto, e l’oggetto della statistica inferente.

La relazione concettuale che lega il campione x alla popolazione Ω non e deterministica, bensıprobabilistica. Ogni (sensata) inferenza muove dall’idea che i dati “recano i segni” di Ω e dunquedel modello f(x | θ), x ∈ X , θ ∈ Θ ⊆ Rk, (k e la dimensione di Θ) che la descrive. Ma seθ non e noto, e questo accade il piu delle volte nella pratica, non resta che fornirne una stima

mediante una conveniente procedura. E questa non puo che riferirsi al meccanismo che ha generatox e dunque al calcolo delle probabilita. Le procedure della statistica inferente, rendono il terminemodello campionario, o semplicemente modello, piu adeguato del termine “legge” finora usato.

L’inferenza statistica classica si divide in due sezioni: la teoria della stima e la teoria dei test di

ipotesi. La prima si articola in stima puntuale, stima per intervalli, etc. la seconda valuta le ipotesi

(o congetture) sul modello formulate dal ricercatore. Teoria della stima e teoria dei test possonoriguardare sia i parametri del modello (statistica parametrica), sia la forma del modello (statisticanon parametrica). Lo zip si occupera solo di stima puntuale e per intervalli parametrica.

Se θ e il parametro di interesse, si puo pensare a una funzione che ai dati x fa corrisponderela quantita t ∈ Θ, detta stima puntuale di θ, oppure l’insieme [t1, t2] ⊂ Θ, che “ragionevolmente”contiene θ, detto stima per intervalli di θ.

73

Page 75: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

74 Capitolo 6 Statistica inferente

B Nota. Quando k ≥ 2, non sempre lo statistico e interessato a tutte le componenti di θ. Allecomponenti di θ, che sono la ragione dell’analisi, si da il nome di parametri di interesse (in sigla p.i.)Alle componenti di θ incognite, che non interessano, si da il nome di parametri di disturbo (in siglap.d.) Come si vedra, stime e procedure vengono a dipendere da tale distinzione. C

La teoria della stima puntuale si cura della ricerca e della valutazione inferenziale degli indicicampionari chiamati a stimare un certo parametro di interesse. Questo puo essere il parametro θ ouna sua funzione.B Nota. In statistica inferente vale la norma generale: l’idea che noi ci facciamo di Ω, venendo adipendere da un numero finito di dati, ha sempre (per forza di cose) il carattere della provvisorieta.Ripetere e/o proseguire l’esperimento, sia pure nelle stesse condizioni, equivale (lo si voglia o meno)a modificare le nostre conclusioni inferenziali. C

E dunque necessario introdurre il concetto (astratto) di esperimento statistico.

Definizione 6.1. Un esperimento statistico e una famiglia di spazi di probabilita E = Y,AY ,Pθ, Θ.

Quale che sia l’evento E ∈ AY che a noi interessa, il calcolo della probabilita di E e reso possibiledalla conoscenza della misura Pθ, cioe della legge f(y | θ) della v.a. Y , la quale dipende dal parametro(che si suppone noto) θ ∈ Θ. Ma se θ noto non e, si puo pensare a una famiglia continua di spazi diprobabilita, ciascuno di indice θ ∈ Θ, famiglia che consente, una volta realizzato l’esperimento yobs,di esaminare come varia, al variare di θ, la probabilita di ottenerlo.

6.1 VerosimiglianzaLa funzione di verosimiglianza, introdotta nel 1921 da Ronald A. Fisher (1890-1962), e il principalestrumento di analisi di un esperimento.

Definizione 6.2. Si definisce funzione di verosimiglianza, in sigla f.v., o funzione di supporto, overosimiglianza e basta, di θ ∈ Θ associata al risultato osservato yobs l’applicazione L : Y ×Θ 7→ R+

data da L(θ | yobs) = f(yobs | θ). A parole, la f.v. e la probabilita (o la f.d.p.) che si assegna a yobs

quando si assume vero θ. (Il simbolo “ L ” deriva dall’inglese likelihood.)

Se l’esperimento osservato e dato dalle osservazioni iid x = (x1, x2, . . . , xn), provenienti dalla v.a.X ∼ f(x | θ) con X ∈ X e θ ∈ Θ, si ha

L(θ | x) =n∏

i=1

f(xi | θ) . (6.1)

Alcune considerazioni sul significato di verosimiglianza.

B C.1. Probabilita e f.v. sono oggetti differenti, la prima e funzione d’insieme, la seconda di punto.B C.2. Per quanto possa sembrare paradossale, il valore della f.v. in un punto ha scarso significato.La f.v. deve essere intesa come sistema comparativo di pesi: la scrittura L(θ1 | yobs) = k ·L(θ2 | yobs),θ1 6= θ2 ∈ Θ, indica che θ1 riceve dall’esperimento yobs un supporto che e k volte quello che riceve

Page 76: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

6.1 Verosimiglianza 75

θ2. Per tale motivo, la f.v. puo essere data nella forma meno restrittiva L(θ | yobs) ∝ f(yobs | θ)data cioe a meno di una quantita positiva non dipendente da θ. In luogo della (6.1) si ha

L(θ | x) ∝n∏

i=1

f(xi | θ) . (6.2)

B C.3. Non si deve confondere verosimiglianza con verita. Un esempio. Da una produzione Ω sonocampionati n pezzi, s dei quali sono difettosi. La f.v. non dice quale e il “vero” tasso di difettosita θ

in Ω. La f.v. risponde ai quesiti: alla luce dell’esperimento (n, s), il tasso θ1 = 10% e piu verosimile(e di quanto) di θ2 = 30%? Tra tutti i valori che θ puo assumere qual’e il piu verosimile? etc.

Come tale la f.v. e uno strumento per la ricerca di una stima del parametro θ del modello. Aifini del calcolo di θ, e equivalente considerare L(θ | x) oppure `(θ | x) = log L(θ | x). Dunque

Definizione 6.3. Si definisce stima di massima verosimiglianza (in sigla MLE, maximum likelihoodestimate) del parametro θ, il valore θ = arg supθ∈Θ L(θ | x) = arg supθ∈Θ `(θ | x).

Sia L(θ | x) = supθ∈Θ L(θ | x) e `(θ | x) = supθ∈Θ `(θ | x). Il carattere comparativo della f.r.,vedi considerazioni C.2. e C.3., rende coerente rapportare i valori di L(θ | x) al suo valore superiore.

Definizione 6.4. Nelle condizioni di validita della (6.2) si definisce verosimiglianza massimizzata (orelativa) di θ, l’applicazione L : Xn ×Θ 7→ [0, 1]

L(θ | x) =L(θ | x)

L(θ | x). (6.3)

Quando e possibile, al posto delle notazioni L(θ | x), L(θ | x), `(θ | x), etc. si usano le notazionipiu leggere L(θ), L(θ), `(θ), etc. Il significato e l’uso della f.v. e chiarito mediante esempi.B Esempio 1.

Le osservazioni x iid, provengono dalla v.a. X ∼ θx(1 − θ)1−x, con X ∈ 0, 1 e θ ∈ Θ = (0, 1).Dalla (6.1) si ha L(θ | x) =

∏ni=1 θxi(1 − θ)1−xi = θu(1 − θ)n−u, con u =

∑xi, da cui `(θ) =

u log θ+(n−u) log(1−θ). Dalla condizione `′(θ) =u

θ− n− u

1− θ= 0 si ricava la stima MLE θ =

u

n= p,

che e la proporzione empirica di successo. La f.v. relativa e data da L(θ) =(θ

θ

)u (1− θ

1− θ

)n−u

.

Gli esperimenti (a) , (b) e (c) hanno dato i risultati (n, u) = (9, 3), (n, u) = (18, 6) e (n, u) =(36, 12). Le corrispondenti f.v. hanno stesso massimo in θ = 1

3 , si veda la figura 6.1. Il valoreθ = 0.5, vedi Tav. 6.1, riceve da (a) un buon supporto, La(θ) = 0.6007, e poco supporto da (c),Lc(θ) = 0.1302; θ = 0.9 e poco verosimile nel caso (a) ed ancor meno nel caso (c), La(θ) ∼= 0.2 · 10−3

e Lc(θ) < 10−4. I valori θ = 0 e θ = 1 sono impossibili. C

θ 0 0.1 0.2 0.3 13 0.4 0.5 0.6 0.7 0.8 0.9 1.0

La(θ) 0 .1634 .6450 .9769 1 .9183 .6007 .2721 .0769 .0101 .0002 0

Lb(θ) 0 .0267 .4160 .9544 1 .8433 .3608 .0740 .0059 .0001 .0 0Lc(θ) 0 .0007 .1734 .9109 1 .7112 .1302 .0055 .0 .0 .0 0

Tav.6.1 - F.v. massimizzate di θ dati gli esperimenti (a), (b) e (c).

Page 77: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

76 Capitolo 6 Statistica inferente

B Esempio 2.

Le osservazioni x iid provengono dalla v.a. X ∼ Po(x | λ), con X ∈ N0 e λ ∈ Λ = R+. Dalla(6.2) si ha L(λ | x) =

∏ni=1 Po(xi | λ) ∝ λu e−nλ, con u =

∑xi, da cui `(λ) = u log λ − nλ. Dalla

condizione `′(λ) =u

λ− n = 0 si ricava la stima MLE λ =

u

n= x, cioe la media del campione x. La

f.v. massimizzata e L(λ) =(λ

λ

)u

exp−n(λ− λ).Gli esperimenti (a), (b) e (c) hanno dato i risultati (n, u) = (6, 4), (n, u) = (12, 8) e (n, u) =

(24, 16). Le corrispondenti f.v. hanno stesso massimo in λ = 1.5, vedasi figura 6.1. Il valore λ = 3ha supporto La(λ) = 0.1586, Lb(λ) = 0.0252 e Lc(λ) = 0.0006. CB Esempio 3.

Le osservazioni iid x provengono dalla v.a. X ∼ N(x | µ, σ20), con X ∈ R, µ ∈ R e σ2

0 = 4. Dalla

(6.2) si ha L(µ | x) =∏n

i=1 N(xi | µ, σ20) = k · exp

− 12σ2

0

∑(xi − µ)2

∝ exp − n

2σ20

(x − µ)2,

dove x =u

n, con u =

∑xi e dove k indica una quantita che non dipende da µ. La stima MLE di µ

e µ = x. La f.v. relativa e L(µ) = exp− n

2σ20

(x− µ)2.

Si supponga che gli esperimenti (a), (b) e (c) abbiano dato i risultati (n, u) = (5, 9), (n, u) =(10, 18) e (n, u) = (20, 36). La stima MLE di µ e sempre µ = 1.8. Il valore µ = 1.2 riceve supportoLa(µ) = 0.3247, Lb(µ) = 0.0111 e Lc(µ) ∼= 1.15 ·10−7. Nel caso dell’esperimento (c) il valore µ = 1.2e praticamente inverosimile. Vedasi figura 6.1. C

0.5 1 1.5 2 2.5 3 3.5 4

0.2

0.4

0.6

0.8

1

q=0.50

abc

LHΜL Hp.i. Μ, Σ0

2=4LHNormaleLHΜL

2.5 5 7.5 10 12.5 15 17.5

0.2

0.4

0.6

0.8

1

q=0.50

abc

LHΣ2L Hp.i. Σ2, Μ0=4LHNormaleL

HΣ2L

0.2 0.4 0.6 0.8 1

0.2

0.4

0.6

0.8

1

abc

q=0.50

HBinomialeLLHΘL

HΘL1 2 3 4

0.2

0.4

0.6

0.8

1

abc

q=0.50

HPoissonLLHΛL

HΛL

Figura 6.1. F.v. massimizzate; vedi esempi 1÷ 4.

B Esempio 4.

Le osservazioni iid x provengono dalla v.a. X ∼ N(x | µ0, σ2), X ∈ R, σ2 ∈ R+ e µ0 = 4. Sia

s20 = 1

n

∑ni=1(xi − µ0)2 la varianza empirica calcolata rispetto a µ0. La (6.2) diviene L(σ2 | x) =

∏ni=1 N(xi | µ0, σ

2) = k · (σ2)−n2 exp

− n2

s20

σ2

, dove k e una costante non dipendente da σ2.

Page 78: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

6.2 Stima puntuale 77

Passando ai logaritmi si ha `(σ2) = −n2

(log σ2+

s20

σ2

)Derivando `′(σ2) = − n

2σ2

(1− s2

0

σ2

)= 0, da

cui si ricava σ2 = s20, stima MLE di σ2. Dunque L(σ2) =

( σ2

σ2

) 12 n

exp− 1

2n( σ2

σ2− 1

).

Si supponga che gli esperimenti (a) (b) e (c), di taglia n = 4, n = 8 e n = 16 abbiano dato lostesso risultato s2

0 = 1.5, e dunque la stessa stima MLE σ2. Dalla figura 6.1 si ricava che σ2 = 10 hasupporto La(σ2) = 0.1232, Lb(σ2) = 0.0152 e Lc(σ2) = 0.0002. C

La Tav. 6.2 riporta le stime MLE, per alcuni modelli considerati in sezione 7.2 dell’appendice.I parametri con “0” a pedice sono noti. Vi sono poi modelli per i quali il calcolo delle stime MLErichiede l’uso di algoritmi numerici, vedasi il caso delle leggi Gamma e di Weibull.

modello stima MLE modello stima MLE

Bin(x | θ, 1) θ = p N(x | µ, σ20) µ = x

Po(x | λ) λ = x N(x | µ0, σ2) σ2 = s2

0

G(x | θ) θ = 1/x N(x | µ, σ2) µ = x, σ2 = s2

Bneg(x | θ, ν0) θ =n ν0

n ν0 + uExp(x | λ) λ = 1/x

(+) u(x|0, θ) θ = x(n) (+) Pareto(x | α, β0) α =(

logmg

β0

)−1

Tav.6.2 - Stime MLE per alcuni modelli campionari.

Oltre al metodo dei minimi quadrati, visto nel capitolo 2, e della massima verosimiglianza vi e ancheil metodo dei momenti. Dovuto a K. Pearson e tutt’ora usato (sia pure con parsimonia), il metodoimpone di uguagliare i primi k momenti della popolazione (posto che esistano) con i corrispondentimomenti empirici, dove k e la dimensione dello spazio parametrico Θ. Spesso, le stime MLE e lestime dei momenti coincidono. In Tav. 6.2 con (+) sono indicati due casi in cui cosı non accade.

Col modello Gamma di parametri θ = (α, λ), la stima dei momenti e assai piu semplice dellastima MLE. Essendo k = 2, le condizioni sono E(X) =

α

λ

.= x e V ar(X) =α

λ2

.= s2, da cui si

ricavano le stime dei momenti α =x

s2e λ =

x2

s2.

B Nota. Le stime dei momenti non sempre esistono e non godono sempre di “buone proprieta”.Ad esempio, nel caso del modello di Pareto (che non ha media per α ≤ 1) il metodo dei momentie impercorribile. Non mancano poi casi di stime assurde. Sia X ∼ u(x | 0, θ), X ∈ [0, θ], θ ∈ R+,siano (x1, x2, . . . , xn) le osservazioni. La stima MLE di θ e θ = x(n), la stima dei momenti e θ = 2 x.Se (1, 2, 3, 22) e il campione osservato, dunque n = 4, x(n) = 22, x = 7, la stima MLE e θ = 22. Percontro, la stima θ = 14 e assurda essendo θ < x(n). C

6.2 Stima puntualeCome si e detto, la sezione della statistica che ha per oggetto la valutazione degli stimatori, prendeil nome di teoria della stima.

Sia X = (X1, X2, . . . , Xn) una n-pla di v.a. iid provenienti dalla v.a. X ∼ f(x | θ), θ ∈ Θ, siax = (x1, x2, . . . , xn) la sua realizzazione.

Page 79: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

78 Capitolo 6 Statistica inferente

Definizione 6.5. Qualsiasi funzione del campione aleatorio Tn = tn(X) chiamata a stimare θ prendeil nome di stimatore di θ. Si definisce stima di θ la realizzazione t = tn(x).

Nessuno puo garantire che tn sia una “buona stima” di θ. Tutto cio che si puo chiedere allastatistica inferente e che lo stimatore Tn (che si realizza in tn) goda di proprieta di “buon senso”. Insintesi si puo dire che le stime MLE hanno buone proprieta e che lo stesso non sempre accade conle stime dei momenti e dei m.q. Lo zip considera solo alcune proprieta valide per gli stimatori Tn

dotati di media e di varianza.

Definizione 6.6. Si definisce statistica qualunque trasformazione del campione aleatorio Tn = tn(X).Si definisce statistica osservata la corrispondente realizzazione t = tn(x).

Stimatori e statistiche sono v.a. Uno stimatore e una statistica ma non viceversa. Gli stimatoriX = 1

n

∑ni=1 Xi e S2 = 1

n

∑ni=1(Xi − X)2 sono statistiche. Le statistiche Un =

∑ni=1 Xi e Wn =∑n

i=1 X2i non sono stimatori. Tra stimatori e statistiche puo esservi corrispondenza, nell’esempio e

(X, S2) ⇔ (Un, Wn). La circostanza ritorna utile nella teoria.Di norma le leggi delle statistiche e degli stimatori dipendono dal parametro θ: Tn ∼ ϕn(t | θ),

Tn ∈ T .

Definizione 6.7. Lo stimatore Tn si dice corretto o non distorto (unbiased) se E(Tn | θ) = θ, ∀n.E detto distorto (biased) se E(Tn | θ) = θ + bn(θ), dove bn(θ) e la distorsione (bias).

Assai importante e stabilire la forma della funzione bias quando essa varia con θ ed n. (Non haalcun interesse in statistica il ben noto bias sistematico bn(θ) = cost.) Piu avanti, al posto di E(Tn|θ)e V ar(Tn|θ) si potranno adoperare le piu leggere notazioni E(Tn) e V ar(Tn).

B Esempio 5.

Sia X ∼ N(x|µ, σ2), siano X v.a.iid. Si mostrera che la media campionaria X e uno stimatorecorretto, mentre la varianza campionaria S2 non lo e. Infatti E(X) = E( 1

n

∑Xi) = 1

n

∑E(Xi) = µ.

Dal corollario 5.10, in cui si dice che S2 ∼ Gamma(s2| 12 (n−1),

n

2σ2

), e dall’espressione della speranza

matematica della legge gamma si deduce che E(S2) = 12 (n − 1) · 2σ2

n= σ2 − 1

nσ2. Dunque, S2 e

uno stimatore distorto con bias bn(σ2) = − 1nσ2. E facile mostrare poi che la varianza corretta

S2c = n

n−1S2 e stimatore corretto di σ2. Infatti: E(S2c ) = E( n

n−1S2) = nn−1E(S2) = σ2. C

Definizione 6.8. Se limn→∞E(Tn | θ) = θ ⇔ limn→∞ bn(θ) = 0, allora Tn e detto asintoticamente

corretto.

Definizione 6.9. Se limn→∞ P|Tn − θ| > ε = 0, ∀ε > 0, allora Tn e detto consistente o coerente.

Verificare la consistenza di uno stimatore mediante la definizione 6.9 non sempre e agevole. Tornapercio utile il teorema

Teorema 6.1. Condizione sufficiente affinche lo stimatore Tn sia consistente o coerente e che essosia asintoticamente corretto e che limn→∞ V ar(Tn | θ) = 0.

Page 80: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

6.3 Stima per intervalli 79

B Esempio 5. (seguito)

E facile vedere che Xn e S2n sono stimatori consistenti. Dal corollario 5.4 si ha V ar(Xn) =

σ2

n−→

n→∞ 0.

Essendo limn→∞ bn(σ2) = 0, S2n risulta asintoticamente corretto. Inoltre, si veda l’espressione della

varianza della legge gamma, V ar(S2n) = 1

2 (n− 1) ·(2σ2

n

)2

=2n

(n− 1)2σ4 −→

n→∞ 0. C

Passando dal campione X al riassunto Tn, inevitabilmente si perdono informazioni, sicche cio chesi chiede al riassunto e che la perdita sia “la minima possibile”. I riassunti che ai fini della conoscenzadi θ non danno luogo a perdite di informazione sono detti sufficienti o anche esaustivi.

Definizione 6.10. (Fisher, 1921.) La statistica Tn e detta sufficiente se la legge di X condizionataa Tn = tn non dipende da θ: X|tn ∼ fX|T (x|tn, θ) = fX|T (x|tn).

Definizione 6.11. (Neyman, 1931.) La statistica Tn e detta sufficiente, se la f.v. puo essere postanella forma L(θ | x) = ϕ(tn, θ) · h(x), dove ϕ(·) e h(·) sono funzioni positive.

Teorema 6.2. Se Tn e sufficiente nel senso di Fisher lo e anche nel senso di Neyman. E viceversa.

La definizione 6.11, piu pratica della 6.10 ai fini della verifica della sufficienza di una statistica,suggerisce un’utile variante alle rigide definizioni 6.2 e 6.4 di f.v. Si osservi infatti, che se Tn e unriassunto esaustivo e irrilevante considerare L(θ|x) oppure ϕ(tn, θ). Se Tn e sufficiente si ha

L(θ|x) ∝ L(θ|tn) ∝ ϕ(tn, θ) , L(θ|x) = L(θ|tn) =L(θ|tn)

L(θ|tn). (6.4)

B Esempio 6.

Sia X ∼ Exp(x|λ) = λ e−λx, con X > 0 e λ ∈ R+, siano x osservazioni iid. Si ha L(λ|x) =∏ni=1 Exp(xi|λ) =

∏ni=1 λ e−λxi = λn e−λun ∝ L(λ|un), con un =

∑xi = n · x. Dunque Un e X

sono statistiche sufficienti per λ. Il logaritmo della f.v. e `(λ) = n(log λ − λ x). Dalla condizione

`′(λ) = n( 1λ − x) = 0, si ricava λ =

1x

. Infine L(λ|x) = (xλ)nexp−n(xλ− 1). CB Nota. Osservare che negli esempi 1 ÷ 6, le f.v. massimizzate sono espresse in funzione dellestatistiche sufficienti.

6.3 Stima per intervalliLo zip tratta la stima per intervalli in ottica Fisher (1922) e in ottica Neyman (1937).

• L’approccio dovuto a Fisher consiste nell’associare al campione x l’intervallo di verosimiglianza

Iq = θ ∈ Θ : L(θ | x) ≥ q, con q ∈ (0, 1) fissato. Valgono le proprieta: (i) Iq ⊂ Θ, (ii) ∀q < q′

⇔ Iq′ ⊂ Iq. In figura 6.1 sono individuati gli intervalli di verosimiglianza per q = 0.50, q = 0.10 eq = 0.05. La Tav. 6.3 riporta gli estremi di tali intervalli.

Page 81: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

80 Capitolo 6 Statistica inferente

Modello e parametro n q = 0.50 q = 0.10 q = 0.05

9 0.1712, 0.5282 0.0815, 0.6826 0.0620, 0.7258

Binomiale (θ) 18 0.2132, 0.4702 0.1348, 0.5844 0.1147, 0.6188

36 0.2459, 0.4292 0.1834, 0.5107 0.1659, 0.5359

4 0.8896, 2.3409 0.5382, 3.2229 0.4530, 3.5347

Poisson (λ) 8 1.0462, 2.0629 0.7519, 2.6302 0.6736, 2.8229

16 1.1678, 1.8900 0.9335, 2.2563 0.8698, 2.3792

5 1.3290, 2.2710 0.9416, 2.6584 0.8209, 2.7791

Normale (µ, σ20 nota) 10 1.5645, 2.0355 1.3708, 2.2292 1.3105, 2.2896

20 1.6823, 1.9177 1.5845, 2.0146 1.5552, 2.0448

4 0.7219, 3.9409 0.4458, 11.290 0.3902, 16.665

Normale (σ2, µ0 nota) 8 0.8775, 2.8808 0.6032, 5.5275 0.5422, 6.9485

16 1.0163, 2.3461 0.7647, 3.5734 0.7039, 4.1200

Tav.6.3 - Insiemi di verosimiglianza per gli esempi 1÷ 4.

• L’approccio di Neyman, noto come metodo delle quantita pivotali, si basa sulla definizione

Definizione 6.12. Si definisce quantita pivotale la v.a. Yn che gode delle seguenti proprieta: (i)Yn = yn(X; θ), (ii) Yn ∼ ψn(y | θ) = ψn(y), ∀n finito. Si definisce quantita pivotale asintotica la v.a.

Yn che gode delle proprieta (i) e (ii ’) YnL→ Y ∼ ψ(y).

La quantita pivotale, dovendo contenere sia il campione X (o una sua statistica) che il parametroθ, non e una statistica. In Tav. 6.4 sono dati esempi di quantita pivotali, pivotali asintotiche,quest’ultime indicate col simbolo

L→. I simboli con “0” a pedice si suppongono noti.

modello p.i. p.d. quantita pivotale legge della q. pivotale vedere

N(x | µ0, σ2) σ2 − Q0 =

nS20

σ2Chi2(q0 | n) cor. 5.9

N(x | µ, σ20) µ − Zn =

X − µ

σ0

√n N(z|0, 1) cor. 5.4

N(x | µ, σ2) σ2 µ Q2 =nS2

σ2Chi2(q2 | n− 1) th. 5.9

N(x | µ, σ2) µ σ2 Tn =X − µ

S

√n− 1 Student(t | n− 1) cor. 5.11

Exp(x | λ) λ − Yn = 2λ∑

Xi Chi2(y | 2n) cor. 5.6 e 5.7

Bin(x | θ, n) θ − Zn =Pn − θ√θ(1− θ)

√n

L→ Z ∼ N(z | 0, 1) th. 5.12

Po(x | λ) λ − Zn =X − λ√

λ

√n

L→ Z ∼ N(z | 0, 1) th. 5.12

Tav. 6.4 Esempi di quantita pivotali e pivotali asintotiche.

L’approccio di Neyman consiste nel fissare una probabilita α ∈ (0, 1) e nell’associare al cam-pione X, o a una sua statistica Tn, l’intervallo aleatorio [In(X, α), Sn(X, α)] ⊂ Θ (detto intervallo di

confidenza) tale che PIn(X, α) ≤ θ ≤ Sn(X, α) = 1− α, dove la probabilita 1− α e detta livello di

sicurezza dell’intervallo aleatorio.

Page 82: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

6.3 Stima per intervalli 81

Passando dal campione aleatorio X al campione osservato x, gli estremi aleatori In(X, α) eSn(X, α), assumono i valori In(x, α) e Sn(x, α).

Se per il modello considerato esiste una quantita pivotale yn(X; θ), si puo stabilire l’eguaglianzaPy1 ≤ yn(X; θ) ≤ y2 =

∫ y2

y1ψn(y) dy = 1−α, dove y1 e y2 sono i percentili della quantita pivotale

Yn di ordine 12α e 1− 1

2α. Dall’evento y1 ≤ yn(X; θ) ≤ y2 si ottiene, dopo aver isolato θ, l’intervallodi confidenza [In(X, α), Sn(X, α)].

In mancanza di quantita pivotali, non resta che costruire (quando e possibile) una quantitapivotale asintotica, e ricorrere (disponendo di “grandi” taglie campionarie) al teorema limite centraleo a suoi corollari. Vale ora l’approssimazione Py1 ≤ yn(X; θ) ≤ y2 ∼= 1− α, dove i percentili y1 ey2, sempre stabiliti in funzione di α, si riferiscono alla legge limite ψ(y).

Si danno gli intervalli di confidenza per alcuni importanti modelli. Si veda la Tav. 6.4.

B [a] Modello normale. Sia X ∼ N(x | µ0, σ2), con σ2 p.i. e µ0 noto. La quantita pivotale, vedi

corollario 5.8, e Yn =nS2

0

σ2∼ Chi2(y | n), con nS2

0 =∑n

i=1(Xi − µ0)2. Da cui Py1 ≤ Yn ≤ y2 =

1 − α, dove y1 e y2 sono i percentili della Chi2 di ordine 12α e 1 − 1

2α con gl = n. Si ha dunque

Pn s2

0

y2≤ σ2 ≤ n s2

0

y1

= 1− α. C

B [b] Modello normale. Sia X ∼ N(x | µ, σ20), con µ p.i. e σ2

0 noto. La quantita pivotale, vedi

corollario 5.4, e Zn =X − µ

σ0

√n ∼ N(z | 0, 1), da cui P−z0 ≤ Zn ≤ z0 = 1 − α, dove z0 e il

percentile di ordine 1− 12α. Dunque P

x− z0

σ0√n≤ µ ≤ x + z0

σ0√n

= 1− α. C

B [c] Modello normale. Sia X ∼ N(x | µ, σ2), con σ2 p.i. e µ p.d. Per il teorema 5.9 di Helmert si

ha Yn =nS2

σ2∼ Chi2(y | n−1). Si ha percio Py1 ≤ Yn ≤ y2 = 1−α, dove y1 e y2 sono i percentili

della legge Chi2 di ordine 12α e 1− 1

2α con gl = n− 1. Da cui Pn s2

y2≤ σ2 ≤ n s2

y1

= 1− α. C

B [d ] Modello normale. Sia X ∼ N(x | µ, σ2), con µ p.i. e σ2 p.d. La quantita pivotale, vedi

corollario 5.10, Tn =X − µ

S

√n− 1 ∼ Student(t | n − 1), da cui Pr−t0 ≤ Tn ≤ t0 = 1 − α, dove

t0 e il percentile di ordine 1 − 12α con gl = n − 1. Da cui P

x − t0

s√n− 1

≤ µ ≤ x + t0s√

n− 1

= 1− α. C

B [e] Modello esponenziale. Sia X ∼ Exp(x | λ), con λ p.i. Per i corollari 5.6 e 5.7 la quantitapivotale e Yn = 2λUn ∼ Chi2(y | 2 n), con Un =

∑Xi, da cui Py1 ≤ Yn ≤ y2 = 1 − α, dove y1

e y2 sono i percentili della Chi2 di ordine 12α e 1 − 1

2α con gl = 2 n. Dunque P y1

un≤ λ ≤ y2

un

= 1− α. C

Poiche con i modelli binomiale e di Poisson non esistono quantita pivotali, e necessario ricorrereal teorema del limite centrale 5.12 e dunque alle quantita pivotali asintotiche.

B [f ] Modello binomiale. Sia X ∼ Bin(x | θ, 1), p.i. θ. Poiche Zn =Pn − θ√θ(1− θ)

√n

L→ Z ∼ N(z |

0, 1), si ha P−z0 ≤ Zn ≤ z0 ∼= 1− α. Notasi che −z0 ≤ Zn ≤ z0 equivale a∣∣∣ Pn − θ√

θ(1− θ)

√n

∣∣∣ ≤ z0.

Quadrando si ha la disuguaglianza Dα(pn, θ) = (1+ 1nz2

0)θ2− 2(Pn + 12nz2

0)θ+ P 2n ≤ 0, valida in tutti

Page 83: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

82 Capitolo 6 Statistica inferente

i punti dell’intervallo di confidenza di estremi

θ1,2 =1

1 +1n

z20

(pn +

12n

z20 ∓

√∆/4

), (6.5)

dove ∆/4 =(pn +

12n

z20

)2

− p2n

(1 +

1n

z20

)= z2

0

(pn(1− pn)n

+z20

4n2

). Se la taglia n e molto grande

e pn e distante da 0 e 1, si puo assumere

θ1,2 = pn ∓ z0

√pn(1− pn)

n. C (6.6)

B [g ] Modello di Poisson. Sia X ∼ Po(x | λ), p.i. λ. Si ha Zn =Xn − λ√

λ

√n

L→ Z ∼ N(z | 0, 1),

da cui P−z0 ≤ Zn ≤ z0 ∼= 1 − α. Dall’evento∣∣∣Xn − λ√

λ

√n

∣∣∣ ≤ z0, si ottiene la diseguaglianza

λ2 − 2(Xn + 12nz2

0)λ + X2n ≤ 0. Gli estremi dell’intervallo di confidenza sono

λ1,2 = xn +12n

z20 ∓

√∆/4 . C (6.7)

dove ∆/4 = (xn + 12nz2

0)2 − x2n = z2

0

( 1n

x +z20

4n2

). Se la taglia n e particolarmente grande, si puo

assumere l’approssimazione

λ1,2 = xn ∓ z0

√xn

n. C (6.8)

B Nota 1. Delle volte il p.i. non e il parametro del modello. Le procedure illustrate, che calcolanogli insiemi di verosimiglianza e gli intervalli di confidenza, subiscono lievi modifiche se tra i dueparametri vi e un legame biunivoco. Col modello esponenziale, caso [e], spesso il p.i. e la mediaθ = 1/λ. Col modello normale, casi [a] e [c], il p.i. puo essere la precisione φ = 1/σ2. CB Nota 2. Insiemi di verosimiglianza e intervalli di confidenza sono consistenti. Cio vuole significareche entrambi al crescere della taglia n, coeteris paribus, tendono a ridursi, con ordine di grandezzaO(n−1/2), fino a coincidere col “valore vero” del parametro. CB Nota 3. Il ricorso al metodo delle quantita pivotali asintotiche possibile solo in presenza di“grandi” taglie campionarie e legato, per forza di cose, al concreto valore di n. La regola d’uso,analoga alla regola data in nota alla fine della sezione 5.1, e σ2

U = n · σ2X > 9÷ 10. C

6.4 Esempi e procedure graficheEsempio A. Quattro pezzi di diametro nominale µ0 = Ø1000 [mm], prodotti da un tornio nondistorto, misurano x1 = 1000.01, x2 = 1000.02, x3 = 999.99, x4 = 1000 [mm], vedasi sezione 1.5.Fissato il livello 1− α, calcolare la stima per intervalli della precisione della macchina.R. Si ipotizza che la misura del pezzo segua la legge normale di media µ0 (il tornio non e distorto)

e varianza σ2. Poiche il p.i. e la precisione φ = 1/σ2, la quantita pivotale e Yn =nS2

0

σ2= nS2

0 φ, con

Page 84: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

6.4 Esempi e procedure grafiche 83

nS20 =

∑(Xi − µ0)2, la quale segue la legge Chi2 con gl = n = 4, vedi caso [b]. Se α = 0.05, si ha

y1 = 0.4844 e y2 = 11.1433. Poiche s20 = 0.00015 [mm2], l’intervallo di confidenza della precisione

ha estremi φ1,2 = y1,2/n s20 = 807.3, 18·572.2 [mm−2].

Esempio B. Si voglia misurare la distanza µ (non nota) fra due punti mediante uno strumento diprecisione φ nota. Fissato il livello di sicurezza 1− α, si stabilisca il numero minimo di misurazionitale che la stima intervallare di µ risulti non piu ampia di un fissato δµ.R. Sia z0 il percentile di ordine 1− 1

2α della normale standard. Se la precisione dello strumento dimisura e nota, l’intervallo di confidenza di µ ha estremi µ1,2 = x∓ z0σ/

√n = x∓ z0/

√nφ, vedi caso

[b]. Se si vuole che l’ampiezza µ2 − µ1 = 2z0/√

nφ dell’intervallo di confidenza risulti inferiore a δµ,si dovra porre 2z0/

√nφ ≤ δµ. Quadrando e riordinando si ottiene n ≥ 4 z2

0/δ2µφ, quantita quasi mai

intera. La taglia campionaria n0 da adottare e percio il minimo intero non inferiore a 4 z20/δ2

µ φ

n0 =⌋ 4 z2

0

δ2µ φ

⌊.

Se δ = 1[cm] e φ = 0.05[mm−2], il numero minimo cercato e n1 =c3.07b= 4 per α = 0.05 (z0 =1.96) e n2 =c5.31b= 6 per α = 0.01 (z0 = 2.576). Con uno strumento piu preciso, φ = 0.12[mm−2]e con lo stesso δ, si ha n1 =c1.28b= 2 per α = 0.05 e n2 =c2.21b= 3 per α = 0.01.Esempio C. Un computer invia un file di 2·500 [Gbyte] ed arrivano 80 [byte] danneggiati. E credibileche il tasso di diffettosita θ della trasmissione superi θ0 = 1.2 · 10−9? (Si fissi α = 0.01.)R. Dalle tavole della normale si ricava che il percentile di ordine 0.005 e z0 = 2.576. Sia p = 80

2·500 G

= 3.2 · 10−11 il tasso di difettosita osservato. Mediante la (6.5) si determina la stima per intervallidi θ: θ1 = 2.402 · 10−11 e θ2 = 4.264 · 10−11. Appare, del tutto irrealistico ritenere che θ > θ0.

Vi sono casi in cui gli intervalli di confidenza possono essere calcolati mediante procedure grafiche.Esse sono in grado di mostrare aspetti non evidenti nelle formule. Riprendiamo i casi [e], [f ] e [g ],descritti in sezione 6.3, riguardanti i modelli esponenziale, binomiale e di Poisson.

B [e] Modello esponenziale. Sia θ = 1/λ il p.i., sia 1−α il livello di sicurezza fissato. Come si e visto,l’intervallo di confidenza e 2un/y2 ≤ θ ≤ 2un/y1, dove un = n · x e (y1, y2) sono i percentili diordine ( 1

2α, 1− 12α) della Chi2 con gl = ν = 2 n. Si supponga ora che ν sia un numero che eccede le

possibilita della tavola del Chi2 a nostra disposizione. In tal caso si assumono i percentili asintoticiy1,2 = ν ∓ z0

√2 ν, si veda alla fine della sezione 7.3, ottenendo cosı gli estremi

θ1,2 =2un

ν ∓ z0

√2 ν

=x

1∓ z0n−1/2. (6.9)

Gli estremi 6.9 potevano essere calcolati col metodo delle quantita pivotali asintotiche. Poiche

E(X) = θ e V ar(X) = θ2 e Zn =X − θ

θ

√n

L→ Z ∼ N(z|0, 1), si ha P∣∣∣ xn − θ

θ

√n∣∣∣ ≤ z0

∼= 1− α.

Quadrando∣∣∣ xn − θ

θ

√n∣∣∣ ≤ z0, si ottiene (1 − 1

nz20)θ2 − 2xnθ + x2 ≤ 0 da cui si ricavano gli estremi

6.9. Dalla disuguaglianza∣∣∣ xn − θ

θ

√n∣∣∣ ≤ z0 si sarebbe anche potuto dedurre il sistema

y = |xn − θ| (1)

y =z0√n· θ (2)

Page 85: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

84 Capitolo 6 Statistica inferente

dove y e una variabile ausiliaria. Sul piano (θ, y) la (1) e una spezzata costituita da due semirette concuspide in (xn, 0), vedi figura 6.2. La (2) e una retta passante per l’origine inclinata positivamente.L’intervallo di confidenza e costituito da tutti i valori di θ in cui la retta supera la spezzata.

2.5 5 7.5 10 12.5 15 17.5 20

2

4

6

8

10

12

HΘL

HyL HΑ=0.05L20

40

80

160

2.5 5 7.5 10 12.5 15 17.5 20

2

4

6

8

10

12

HΘL

HyL HΑ=0.01L 20

40

80

160

Figura 6.2. - Modello esponenziale, intervallo di confidenza di θ per n = 20, 40, 80, 160.

Gli estremi dell’intervallo di confidenza [θ1, θ2], sono le intercette fra la (1), che dipende solo dallamedia x, e la (2), che dipende da n e da α. (Essendo x > 0, θ1 e θ2 sono sempre positive.)

La figura 6.2 considera x = 10, con taglie campionarie n = 20, 40, 80, 160. Si assume α = 0.05 eα = 0.01. Se ad esempio, α = 0.05 e n = 160 la procedura individua la retta meno ripida del graficodi sinistra. Le intercette di tale retta con la spezzata fornisce gli estremi dell’intervallo di confidenzaθ1 = 8.203 e θ2 = 12.806.

0.2 0.4 0.6 0.8 1

0.2

0.4

0.6

0.8

1

HpL

HΘLΑ=0.05

0.2 0.4 0.6 0.8 1

0.2

0.4

0.6

0.8

1

HpL

HΘLΑ=0.01

Figura 6.3. - Modello binomiale, intervallo di confidenza, per n = 20, 40, 80, 160, 1000,∞.

B [f ] Modello binomiale. Nei grafici di figura 6.3, assai utili nel controllo di qualita, sono consideratele quantita pn e θ. Per α (e dunque z0) ed n fissati, l’equazione Dα(pn, θ) ≤ 0, vedi sezione 6.3,rappresenta, nello spazio (pn, θ) ∈ (0, 1)2, la superficie di un’ellisse passante in (0, 0) e (1, 1). Per iltracciamento dei rami superiori ed inferiori delle ellissi, per differenti valori di n, si e fatto ricorsoalle equazioni (6.5). Per mostrare l’uso dei grafici si fissi, caso (a), (n, s) = (20, 12) ed α = 0.05(e dunque z0 = 1.96). Essendo α = 0.05 si deve considerare il grafico di sinistra. Poiche n = 20,l’ellisse cercata e quella che nel grafico appare piu aperta. Gli estremi dell’intervallo di confidenza,

Page 86: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

6.4 Esempi e procedure grafiche 85

θ1,2 = 0.3866, 0.7812, ottenuti dalle (6.5), possono ottenersi graficamente intersecando l’ellisse conla retta verticale di equazione pn = s/n = 0.6.

Con identica procedura e sempre con α = 0.05 si ottiene per (n, s) = (80, 48), caso (b), θ1,2 =0.4905, 0.7004 e per (n, s) = (320, 192), caso (c), θ1,2 = 0.5454, 0.6522. (Si noti che la proporzionepn e costante nei tre esempi.) Usando la 6.6 al posto della 6.5 si ha θ1,2 = 0.4926, 0.7074, caso (b),e θ1,2 = 0.5463, 0.6537, caso (c).

Dunque, da (a) a (b) la taglia campionaria si quadruplica e cosı pure passando da (b) a (c). Percontro l’ampiezza dell’intervallo θ2 − θ1 (all’incirca) si dimezza. C’e una spiegazione?

B [g ] Modello di Poisson. Gli estremi dell’intervallo di confidenza calcolabili mediante la (6.7) possono

essere dedotti graficamente. Dalla disuguaglianza∣∣∣ xn − λ√

λ/n

∣∣∣ ≤ z0, e dunque dalla (xn − λ)2 ≤ z20

n· λ,

si perviene al sistema

y = (xn − λ)2 (1)

y =z20

n· λ (2)

in cui la y e una variabile ausiliaria. Nel piano (λ, y) la (1) e una parabola avente vertice in (x, 0)e concavita positiva, vedi figura 6.4. La (2) e una retta passante per l’origine ed ha inclinazionepositiva. L’intervallo di confidenza e dato dai valori di λ in cui la retta supera la parabola. Leintersezioni λ1 e λ2 fra la (1), che dipende solo da xn, e la (2), che dipende da n e da α, sono gliestremi dell’intervallo di confidenza. Essendo xn > 0 (si esclude che xn = 0) λ1 e λ2 sono semprereali positive. Se n = 16, xn = 1.5, α = 0.05, la procedura individua gli estremi dell’intervallo diconfidenza λ1 = 1.0080 e λ2 = 2.2321.

0.5 1 1.5 2 2.5 3

0.1

0.2

0.3

0.4

0.5

HΛL

HyLΑ=0.05

16

32

64

128

0.5 1 1.5 2 2.5 3

0.1

0.2

0.3

0.4

0.5

HΛL

HyLΑ=0.01

16 32

64

128

Figura 6.4. - Modello di Poisson, intervallo di confidenza per n = 16, 32, 64, 128.

. Nota. Tralasciando le differenze teoriche e pratiche fra insiemi di verosimiglianza ed intervallidi confidenza, diciamo che, limitatamente all’ultimo esempio, l’intervallo di confidenza ora calcolatocorrisponde grosso modo all’insieme di verosimiglianza di estremi λ1 = 0.9335 e λ2 = 2.2563, ottenutocon gli stessi valori di n, x per q = 0.10. Vedi tavola 6.3.

Page 87: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

86 Capitolo 6 Statistica inferente

Page 88: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

7APPENDICE

Oportebat studuisse. (Anonimo)La matematica e l’arte di non fare i conti. (Oscar Chisini)

Si danno alcune notazioni e simboli di uso corrente in matematica, in probabilita, in statistica

simbolo o sigla significato

N, N0, Z insieme dei numeri naturali, degli interi non negativi, degli interiR, R+ insieme dei numeri reali e dei reali positivi[x1, x2], (x1, x2) insieme chiuso, aperto, costituito dai numeri reali da x1 a x2

x1, x2, . . . , xk insieme costituito dai numeri x1, x2, . . . , xk

y = 1A(x) funzione indicatrice dell’evento A: y = 1 se x ∈ A, y = 0 se x 6∈ A

bxc, cxb massimo [minimo] intero non superiore [inferiore] al numero x

u.s., v.a., v.a.a.c. unita statistica, variabile aleatoria, v.a. assolutamente continuav.a.i. v.a.iid v.a. indipendenti, v.a. indipendenti ed identicamente distribuitef.r., f.d.p. funzione di ripartizione, funzione di densita di probabilitaf.v. funzione di verosimiglianzap.i., p.d. parametro di interesse, parametro di disturbosse “se e solamente se”

7.1 Elementi di matematicaDati n oggetti distinti, il numero di gruppi che si possono formare scegliendone k, tenendo contodell’ordine della scelta, prende il nome di disposizioni semplici di n oggetti presi k alla volta ed e pari

87

Page 89: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

88 Capitolo 7 Appendice

a Dn,k = n(n − 1) · · · (n − k + 1), con 0 ≤ k ≤ n. Se k = 0 Dn,0 = 1. Se k = n le disposizioniprendono il nome di permutazioni e si indicano con n!

Dati n oggetti distinti, il numero di gruppi di k oggetti da essi scelti, a prescindere dall’ordinedella scelta, prende il nome di combinazioni semplici di n oggetti presi k alla volta ed e pari a

Cnk =

(n

k

)=

n!k!(n− k)!

=Dn,k

k!, 0 ≤ k ≤ n .

Sono dati n gruppi costituiti, ciascuno, da gi oggetti distinti. Nella i−esima cella di una stringaformata da n celle, si deve collocare un solo oggetto dell’i−esimo gruppo. Il numero di stringhedistinte che cosı si creano, detto possibilita, e N =

∏ni=1 gi. Se ∀i gi = g, al posto di possibilita si

preferisce parlare di disposizioni di g oggetti distinti con n ripetizioni e si ha N = gn.La potenza n−esima del binomio a + b e data da (a + b)n =

∑nj=0

(nj

)ajbn−j , da cui segue:∑n

j=0

(nj

)= 2n,

∑nj=0(−1)j

(nj

)= 0,

∑nj=0

(nj

)ζj(1− ζ)n−j = 1, ∀ζ ∈ (0, 1) e

∑nj=0 j · (n

j

)= n 2n−1.

Valgono le proprieta (1 )(nk

)=

(n

n−k

); (2 )

(n+1k+1

)=

(nk

)+

(n

k+1

); (3 )

(m+n

k

)=

∑jM

i=jm

(mj

) · ( nk−j

),

dove jm = maxk − n, 0 e jM = mink, m; (4 )∑n

k=0

(nk

)2 =(2 nn

).

Sia a1, a2, . . . , an, . . . una successione indefinita di numeri reali, siano s1 = a1, s2 = a1 + a2, . . . ,sn = a1 + a2 + · · ·+ an, . . . , le somme ridotte della successione. Se la serie s1, s2, . . . , sn, . . . convergead un numero s, e si scrive limn→∞ sn = s, allora si dira che la successione a1, a2, . . . , an, . . . econvergente. Il numero s =

∑∞n=1 an e detto valore della serie.

Sia 1, ρ, ρ2, . . . , ρk una sequenza (finita) di potenze, dove ρ ∈ R e detta ragione. Se ρ 6= 1, vale

la formula∑k

n=0 ρn =1− ρk+1

1− ρ, da cui

∑kn=1 ρn = ρ

1− ρk

1− ρ. Si definisce serie geometrica di ragione

ρ, la sequenza 1, ρ, ρ2, ρ3, . . . . Il suo valore, che esiste sse |ρ| < 0, e∑∞

n=0 ρn =1

1− ρ, e dunque

∑∞n=1 ρn =

ρ

1− ρ.

Si ha:∑∞

n=0

An

n!= eA, ∀A ∈ R che non dipende da n. Vale il limite limn→∞(1 +

A

n)n = eA.

Si danno alcune utili funzioni e loro principali proprieta.

Teorema 7.1. Se f(x), definita in (x1, x2), ha massimo in x0 ∈ (x1, x2) e ϕ(·) e una trasformazionecontinua e monotona crescente, allora anche la ϕ[f(x)] e definita in (x1, x2) ed ha massimo in x0.

Utili esempi di tali trasformazioni sono z = log f(x), purche ∀x ∈ (x1, x2) risulti f(x) > 0, ez = mf(x) + q, con (m, q) ∈ R+ × R.

Definizione 7.1. La funzione f(x), x ∈ X , si dice pari se ∀x f(−x) = f(x). Si dice dispari se ∀xf(−x) = −f(x).

Teorema 7.2. Se la funzione pari [dispari] f(x) e sommabile in (−x0, x0) ⊆ X , allora, ∀a ∈ (0, x0),∫ a

−af(x)dx = 2

∫ a

0f(x)dx [

∫ a

−af(x)dx = 0 ].

Corollario 7.1. Se f(x) e pari e se la x2k+1f(x), k ∈ N, e sommabile in (−x0, x0) ⊆ X , allora∫ a

−ax2k+1f(x)dx = 0, ∀a ∈ (0, x0).

Definizione 7.2. Si definisce funzione Gamma la funzione Γ(α) =∫∞0

xα−1e−x dx, α ∈ R+.

Page 90: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

7.2 Principali distribuzioni di probabilita 89

Per la funzione Gamma vale la proprieta

Teorema 7.3. Γ(α + 1) = αΓ(α).

Da cui consegue: (i) Γ(α + k) = (α + k − 1) · · ·αΓ(α); (ii) Γ(n) = (n − 1)! e Γ(1) = 0! = 1. Sidimostra che

∫ ∞

0

xα−1e−λx dx =Γ(α)λα

, Γ( 12 ) =

∫∞0

x−12 e−x dx =

∫∞−∞ e−x2

dx =√

π ,

da cui: Γ( 32 ) = 1

2

√π, Γ( 5

2 ) = 3·14

√π, Γ( 7

2 ) = 5·3·18

√π, etc.

7.2 Principali distribuzioni di probabilit aPer le leggi in elenco si da: evento certo X , spazio parametrico, media e varianza. Sono omesseproprieta e riferimenti al significato delle v.a. e dei parametri.

B Uniforme discreta

X ∼ u(x | n) =1n

11,2,...,n(x) , n > 1 , E(X) = 12 (n + 1) , V ar(X) = 1

12 (n2 − 1) .

B Binomiale

X ∼ Bin(x | θ, n) =(

n

x

)θx(1− θ)n−x , X ∈ 0, 1, . . . , n , n ∈ N , θ ∈ (0, 1) ,

E(X) = nθ , V ar(X) = nθ(1− θ) .

B Ipergeometrica

X ∼ Hyper(x | NA, NB , n) =

(NA

x

)(NB

n− x

)

(N

n

) , X ∈ xm, . . . , xM , NA, NB ∈ N ,

1 ≤ n ≤ N , con N = NA + NB e xm = maxn−NB , 0 , xM = minn,NA ,

E(X) = nNA

N, V ar(X) = n

NANB

N2

N − n

N − 1.

B Geometrica

X ∼ G(x | θ) = θ(1− θ)x−1 , X ∈ N , θ ∈ (0, 1) , E(X) =1θ

, V ar(X) =1− θ

θ2.

B Pascal

X ∼ Pascal(x | θ, ν) =(

x− 1ν − 1

)θν(1− θ)x−ν , X ∈ ν, ν + 1, . . . , θ ∈ (0, 1) ,

E(X) = ν1θ

, V ar(X) = ν1− θ

θ2.

Page 91: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

90 Capitolo 7 Appendice

B Binomiale negativa

X ∼ Bneg(x | θ, ν) =(

x + ν − 1ν − 1

)θν(1− θ)x , X ∈ N0 , θ ∈ (0, 1) ,

E(X) = ν1− θ

θ, V ar(X) = ν

1− θ

θ2.

B Poisson

X ∼ Po(x | λ) = e−λ λx

x!, X ∈ N0 , λ ∈ R+ , E(X) = V ar(X) = λ .

B Uniforme continua

X ∼ u(x | a, b) =1

b− a1(a,b)(x) , con a < b , E(X) = 1

2 (a + b) , V ar(X) = 112 (b− a)2 .

B Normale

X ∼ N(x | µ, σ2) =1√

2πσ2exp

− 1

2

(x− µ)2

σ2

, X ∈ R, µ ∈ R, σ2 ∈ R+, E(X) = µ, V ar(X) = σ2.

B Lognormale

X ∼ LN(x | µ, σ2) =1√

2πσ2· 1x

exp− 1

2

( log x− µ

σ

)2, X ∈ R+, µ ∈ R, σ2 ∈ R+,

E(X) = expµ + 12σ2, V ar(X) = exp2(µ2 + σ2) − exp2µ + σ2.

B Esponenziale

X ∼ Exp(x | λ) = λe−λx , X ∈ R+ , λ ∈ R+ , E(X) =1λ

, V ar(X) =1λ2

.

B Weibull

X ∼ Weibull(x | α, λ) = α λ xα−1e−λxα

, X ∈ R+ , α, λ ∈ R+ ,

E(X) =1

λ1/αΓ(1 + 1

α ) , V ar(X) =1

λ2/αΓ(1 + 2

α )− Γ2(1 + 1α ) .

B Gamma

X ∼ Gamma(x | α, λ) =λα

Γ(α)xα−1e−λx , X ∈ R+ , α, λ ∈ R+ , E(X) =

α

λ, V ar(X) =

α

λ2.

B Pareto

X ∼ Pareto(x | α, β) = α βα 1xα+1

, X ≥ β, α, β ∈ R+ ,

E(X) =α β

α− 1(purche α > 1) , V ar(X) =

α β2

(α− 1)2(α− 2)(purche α > 2) .

B Chi2

Page 92: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

7.3 Uso delle tavole statistiche 91

X ∼ Chi2(x | ν) =( 12 )

12 ν

Γ( 12ν)

x12ν − 1e−

12x , X ∈ R+ , ν ∈ N ,

E(X) = ν , V ar(X) = 2ν .

B Student

X ∼ Student(x | ν) =Γ( 1

2 (ν + 1) )Γ( 1

2ν)√

π

1√ν

1(1 + 1

ν x2) 1

2 (ν+1), X ∈ R , ν ∈ N ,

E(X) = 0 (se ν > 1) , V ar(X) =ν

ν − 2(se ν > 2).

7.3 Uso delle tavole statistichePoche note esplicative precedono le tavole delle leggi normale standard, Student e Chi2.B Normale In tavola I e tabulata la f.r. della normale standard Φ(z) =

∫ z

−∞N(t | 0, 1) dt per z

∈ [0, 0.2] con passo δ = 0.001 e per z ∈ [0.2, 3.5] con passo δ = 0.01. (Esempio: se z = 1.29 si haΦ(z) = 0.90147). Le tavole 7.1 e 7.2 forniscono i valori di PZ > z = 1 − Φ(z) per z ∈ [3, 5.9]con passo δ = 0.1 ed i quantili zα per usuali valori di α = P|Z| > z = 2[1 − Φ(z)]. (Esempio: seα = 0.01 si ha z = 2.576). Per z > 3 si puo usare la formula approssimata PZ > z = 1− Φ(z) ∼=φ(z)

1z

(1− 1

z2

). (Esempio: se z = 5.3 si ha 1− Φ(z) ∼= 5.771 · 10−8, anziche 5.790 · 10−8).

z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

3.0 .135− 2 .968− 3 .687− 3 .483− 3 .337− 3 .233− 3 .159− 3 .108− 3 .723− 4 .481− 4

4.0 .317− 4 .207− 4 .133− 4 .850− 5 .540− 5 .340− 5 .210− 5 .130− 5 .790− 6 .480− 6

5.0 .290− 6 .170− 6 .100− 6 .580− 7 .330− 7 .190− 7 .110− 7 .600− 8 .330− 8 .180− 8

Tavola 7.1 - Valori di PZ > z = 1− Φ(z) in funzione di z ∈ [3, 5.9] con passo δ = 0.1.

α 0.10 0.05 0.01 0.001 10−4 10−5 10−6 10−7 10−8 10−9

zα 1.645 1.960 2.576 3.2905 3.8906 4.4172 4.8916 5.3267 5.7307 6.1094

Tavola 7.2 - Valori di z in funzione di alcuni usuali valori di α = P|Z| > z = 2[1− Φ(z)].

B Student La tavola II riporta i quantili della legge t-Student soluzioni dell’equazione t = F−1(p),con F (t) =

∫ t

−∞ Student(u | ν) du, per p = 0.75, 0.80, 0.85, 0.90, 0.95, 0.975, 0.99, 0.995 e perν = 1, 2, . . . , 40, per ν = 40, 50, . . . , 100 e per ν = 200. (Esempio: se p = 0.99 e ν = 8 il percentile et = 2.8965). Per grandi valori di ν si ricorre, in forza del teorema 5.11, alla legge normale.B Chi2 La tavola III riporta i quantili della legge Chi2 soluzioni dell’equazione y = F−1(p), conF (y) =

∫ y

−∞ Chi2(u | ν) du, per p = 0.005, 0.01, 0.025, 0.05, 0.1 0.9, 0.95, 0.975, 0.99, 0.995 e perν = 1, 2, . . . , 40, per ν = 40, 50, . . . , 100 e per ν = 200. (Esempio: se p1 = 0.025, p2 = 0.975 e ν = 20i percentili sono y1 = 9.5908 e y2 = 34.1696).

Quando i gradi di liberta superano le capacita della tavola, vedi paragrafo 6.3 esempi [b], [c] ed

[e], si ricorre al teorema centrale del limite, teorema 5.12, che assicura la convergenza Zν =Y − ν√

2 ν

Page 93: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

92 Capitolo 7 Appendice

L→ Z ∼ N(z|0, 1) per ν → ∞. Se zp indica il percentile p−esimo della normale standard e yp il

corrispondente percentile della Chi2 con gl = ν, si hayp − ν√

2 ν∼= zp, da cui yp

∼= ν+zp

√2 ν. (Esempio:

se ν = 450 e p = 0.975, da cui zp = 1.96, il percentile p−esimo richiesto e yp∼= ν + zp

√2ν = 508.8).

Page 94: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

7.3 Uso delle tavole statistiche 93

TAVOLA I - Funzione di ripartizione della legge normale standard.

0

HzLz0

NHzÈ0,1LFHz0L

Figura 7.1. Φ(z0) = P(Z < z0) =∫ z0

−∞N(u|0, 1)du.

z → 0 1 2 3 4 5 6 7 8 9

↓ 0. 0. 0. 0. 0. 0. 0. 0. 0. 0.0.00 50000 50399 50798 51197 51595 51994 52392 52790 53188 535860.01 50399 50798 51197 51595 51994 52392 52790 53188 53586 539830.02 50798 51197 51595 51994 52392 52790 53188 53586 53983 543800.03 51197 51595 51994 52392 52790 53188 53586 53983 54380 547760.04 51595 51994 52392 52790 53188 53586 53983 54380 54776 551720.05 51994 52392 52790 53188 53586 53983 54380 54776 55172 555670.06 52392 52790 53188 53586 53983 54380 54776 55172 55567 559620.07 52790 53188 53586 53983 54380 54776 55172 55567 55962 563560.08 53188 53586 53983 54380 54776 55172 55567 55962 56356 567490.09 53586 53983 54380 54776 55172 55567 55962 56356 56749 571420.10 53983 54380 54776 55172 55567 55962 56356 56749 57142 575350.11 54380 54776 55172 55567 55962 56356 56749 57142 57535 579260.12 54776 55172 55567 55962 56356 56749 57142 57535 57926 583170.13 55172 55567 55962 56356 56749 57142 57535 57926 58317 587060.14 55567 55962 56356 56749 57142 57535 57926 58317 58706 590950.15 55962 56356 56749 57142 57535 57926 58317 58706 59095 594830.16 56356 56749 57142 57535 57926 58317 58706 59095 59483 598710.17 56749 57142 57535 57926 58317 58706 59095 59483 59871 602570.18 57142 57535 57926 58317 58706 59095 59483 59871 60257 606420.19 57535 57926 58317 58706 59095 59483 59871 60257 60642 610260.20 57926 58317 58706 59095 59483 59871 60257 60642 61026 614090.30 61791 62172 62552 62930 63307 63683 64058 64431 64803 651730.40 65542 65910 66276 66640 67003 67364 67724 68082 68439 687930.50 69146 69497 69847 70194 70540 70884 71226 71566 71904 722400.60 72575 72907 73237 73565 73891 74215 74537 74857 75175 754900.70 75804 76115 76424 76730 77035 77337 77637 77935 78230 785240.80 78814 79103 79389 79673 79955 80234 80511 80785 81057 813270.90 81594 81859 82121 82381 82639 82894 83147 83398 83646 838911.00 84134 84375 84614 84849 85083 85314 85543 85769 85993 862141.10 86433 86650 86864 87076 87286 87493 87698 87900 88100 882981.20 88493 88686 88877 89065 89251 89435 89617 89796 89973 901471.30 90320 90490 90658 90824 90988 91149 91309 91466 91621 917741.40 91924 92073 92220 92364 92507 92647 92785 92922 93056 931891.50 93319 93448 93574 93699 93822 93943 94062 94179 94295 944081.60 94520 94630 94738 94845 94950 95053 95154 95254 95352 954491.70 95543 95637 95728 95818 95907 95994 96080 96164 96246 963271.80 96407 96485 96562 96638 96712 96784 96856 96926 96995 970621.90 97128 97193 97257 97320 97381 97441 97500 97558 97615 976702.00 97725 97778 97831 97882 97932 97982 98030 98077 98124 981692.10 98214 98257 98300 98341 98382 98422 98461 98500 98537 985742.20 98610 98645 98679 98713 98745 98778 98809 98840 98870 988992.30 98928 98956 98983 99010 99036 99061 99086 99111 99134 991582.40 99180 99202 99224 99245 99266 99286 99305 99324 99343 993612.50 99379 99396 99413 99430 99446 99461 99477 99492 99506 995202.60 99534 99547 99560 99573 99585 99598 99609 99621 99632 996432.70 99653 99664 99674 99683 99693 99702 99711 99720 99728 997362.80 99744 99752 99760 99767 99774 99781 99788 99795 99801 998072.90 99813 99819 99825 99831 99836 99841 99846 99851 99856 998613.00 99865 99869 99874 99878 99882 99886 99889 99893 99896 99900

3.10 99903 99906 99910 99913 99916 99918 99921 99924 99926 999293.20 99931 99934 99936 99938 99940 99942 99944 99946 99948 99950

3.30 99952 99953 99955 99957 99958 99960 99961 99962 99964 999653.40 99966 99968 99969 99970 99971 99972 99973 99974 99975 99976

Page 95: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

94 Capitolo 7 Appendice

TAVOLA II - Quantili della legge t-Student.

HtL0 t0

StudentHtÈΝ LFHt0L

Figura 7.2. F (t0) = P(T < t0) =∫ t0−∞ Student(t|ν)dt.

F (t0) → 0.85 0.9 0.95 0.975 0.99 0.995 0.999 0.9995ν ↓

1 1.9626 3.0777 6.3138 12.7062 31.8205 63.6567 318.3088 636.61922 1.3862 1.8856 2.9200 4.3027 6.9646 9.9248 22.3271 31.59913 1.2498 1.6377 2.3534 3.1824 4.5407 5.8409 10.2145 12.92404 1.1896 1.5332 2.1318 2.7764 3.7469 4.6041 7.1732 8.61035 1.1558 1.4759 2.0150 2.5706 3.3649 4.0321 5.8934 6.86886 1.1342 1.4398 1.9432 2.4469 3.1427 3.7074 5.2076 5.95887 1.1192 1.4149 1.8946 2.3646 2.9980 3.4995 4.7853 5.40798 1.1081 1.3968 1.8595 2.3060 2.8965 3.3554 4.5008 5.04139 1.0997 1.3830 1.8331 2.2622 2.8214 3.2498 4.2968 4.7809

10 1.0931 1.3722 1.8125 2.2281 2.7638 3.1693 4.1437 4.586911 1.0877 1.3634 1.7959 2.2010 2.7181 3.1058 4.0247 4.437012 1.0832 1.3562 1.7823 2.1788 2.6810 3.0545 3.9296 4.317813 1.0795 1.3502 1.7709 2.1604 2.6503 3.0123 3.8520 4.220814 1.0763 1.3450 1.7613 2.1448 2.6245 2.9768 3.7874 4.140515 1.0735 1.3406 1.7531 2.1314 2.6025 2.9467 3.7328 4.072816 1.0711 1.3368 1.7459 2.1199 2.5835 2.9208 3.6862 4.015017 1.0690 1.3334 1.7396 2.1098 2.5669 2.8982 3.6458 3.965118 1.0672 1.3304 1.7341 2.1009 2.5524 2.8784 3.6105 3.921619 1.0655 1.3277 1.7291 2.0930 2.5395 2.8609 3.5794 3.883420 1.0640 1.3253 1.7247 2.0860 2.5280 2.8453 3.5518 3.849521 1.0627 1.3232 1.7207 2.0796 2.5176 2.8314 3.5272 3.819322 1.0614 1.3212 1.7171 2.0739 2.5083 2.8188 3.5050 3.792123 1.0603 1.3195 1.7139 2.0687 2.4999 2.8073 3.4850 3.767624 1.0593 1.3178 1.7109 2.0639 2.4922 2.7969 3.4668 3.745425 1.0584 1.3163 1.7081 2.0595 2.4851 2.7874 3.4502 3.725126 1.0575 1.3150 1.7056 2.0555 2.4786 2.7787 3.4350 3.706627 1.0567 1.3137 1.7033 2.0518 2.4727 2.7707 3.4210 3.689628 1.0560 1.3125 1.7011 2.0484 2.4671 2.7633 3.4082 3.673929 1.0553 1.3114 1.6991 2.0452 2.4620 2.7564 3.3962 3.659430 1.0547 1.3104 1.6973 2.0423 2.4573 2.7500 3.3852 3.646031 1.0541 1.3095 1.6955 2.0395 2.4528 2.7440 3.3749 3.633532 1.0535 1.3086 1.6939 2.0369 2.4487 2.7385 3.3653 3.621833 1.0530 1.3077 1.6924 2.0345 2.4448 2.7333 3.3563 3.610934 1.0525 1.3070 1.6909 2.0322 2.4411 2.7284 3.3479 3.600735 1.0520 1.3062 1.6896 2.0301 2.4377 2.7238 3.3400 3.591136 1.0516 1.3055 1.6883 2.0281 2.4345 2.7195 3.3326 3.582137 1.0512 1.3049 1.6871 2.0262 2.4314 2.7154 3.3256 3.573738 1.0508 1.3042 1.6860 2.0244 2.4286 2.7116 3.3190 3.565739 1.0504 1.3036 1.6849 2.0227 2.4258 2.7079 3.3128 3.558140 1.0500 1.3031 1.6839 2.0211 2.4233 2.7045 3.3069 3.551045 1.0485 1.3006 1.6794 2.0141 2.4121 2.6896 3.2815 3.520350 1.0473 1.2987 1.6759 2.0086 2.4033 2.6778 3.2614 3.496055 1.0463 1.2971 1.6730 2.0040 2.3961 2.6682 3.2451 3.476460 1.0455 1.2958 1.6706 2.0003 2.3901 2.6603 3.2317 3.460265 1.0448 1.2947 1.6686 1.9971 2.3851 2.6536 3.2204 3.446670 1.0442 1.2938 1.6669 1.9944 2.3808 2.6479 3.2108 3.435075 1.0436 1.2929 1.6654 1.9921 2.3771 2.6430 3.2025 3.425080 1.0432 1.2922 1.6641 1.9901 2.3739 2.6387 3.1953 3.416385 1.0428 1.2916 1.6630 1.9883 2.3710 2.6349 3.1889 3.408790 1.0424 1.2910 1.6620 1.9867 2.3685 2.6316 3.1833 3.401995 1.0421 1.2905 1.6611 1.9853 2.3662 2.6286 3.1782 3.3959

100 1.0418 1.2901 1.6602 1.9840 2.3642 2.6259 3.1737 3.3905150 1.0400 1.2872 1.6551 1.9759 2.3515 2.6090 3.1455 3.3566200 1.0391 1.2858 1.6525 1.9719 2.3451 2.6006 3.1315 3.3398

Page 96: Statistica Matematica - geoing.unica.itgeoing.unica.it/sitidocenti/Bertolino/zip.pdf · 1 ZIP Statistica Matematica Lo ZIP `e dedicato a San Giuseppe da Copertino (1603-1663) La morte

7.3 Uso delle tavole statistiche 95

TAVOLA III - Quantili della legge Chi-2.

Chi2HyÈΝ LFHy0L

HyLy00

Figura 7.3. F (y0) = P(Y < y0) =∫ y0

0Chi2(y|ν)dy.

F (y0) → 0.005 0.01 0.025 0.05 0.1 0.9 0.95 0.975 0.99 0.995ν ↓

1 0.0000 0.0002 0.0010 0.0039 0.0158 2.7055 3.8415 5.0239 6.6349 7.87942 0.0100 0.0201 0.0506 0.1026 0.2107 4.6052 5.9915 7.3778 9.2103 10.59663 0.0717 0.1148 0.2158 0.3518 0.5844 6.2514 7.8147 9.3484 11.3449 12.83824 0.2070 0.2971 0.4844 0.7107 1.0636 7.7794 9.4877 11.1433 13.2767 14.86035 0.4117 0.5543 0.8312 1.1455 1.6103 9.2364 11.0705 12.8325 15.0863 16.74966 0.6757 0.8721 1.2373 1.6354 2.2041 10.6446 12.5916 14.4494 16.8119 18.54767 0.9893 1.2390 1.6899 2.1673 2.8331 12.0170 14.0671 16.0128 18.4753 20.27778 1.3444 1.6465 2.1797 2.7326 3.4895 13.3616 15.5073 17.5345 20.0902 21.95509 1.7349 2.0879 2.7004 3.3251 4.1682 14.6837 16.9190 19.0228 21.6660 23.5894

10 2.1559 2.5582 3.2470 3.9403 4.8652 15.9872 18.3070 20.4832 23.2093 25.188211 2.6032 3.0535 3.8157 4.5748 5.5778 17.2750 19.6751 21.9200 24.7250 26.756812 3.0738 3.5706 4.4038 5.2260 6.3038 18.5493 21.0261 23.3367 26.2170 28.299513 3.5650 4.1069 5.0088 5.8919 7.0415 19.8119 22.3620 24.7356 27.6882 29.819514 4.0747 4.6604 5.6287 6.5706 7.7895 21.0641 23.6848 26.1189 29.1412 31.319315 4.6009 5.2293 6.2621 7.2609 8.5468 22.3071 24.9958 27.4884 30.5779 32.801316 5.1422 5.8122 6.9077 7.9616 9.3122 23.5418 26.2962 28.8454 31.9999 34.267217 5.6972 6.4078 7.5642 8.6718 10.0852 24.7690 27.5871 30.1910 33.4087 35.718518 6.2648 7.0149 8.2307 9.3905 10.8649 25.9894 28.8693 31.5264 34.8053 37.156519 6.8440 7.6327 8.9065 10.1170 11.6509 27.2036 30.1435 32.8523 36.1909 38.582320 7.4338 8.2604 9.5908 10.8508 12.4426 28.4120 31.4104 34.1696 37.5662 39.996821 8.0337 8.8972 10.2829 11.5913 13.2396 29.6151 32.6706 35.4789 38.9322 41.401122 8.6427 9.5425 10.9823 12.3380 14.0415 30.8133 33.9244 36.7807 40.2894 42.795723 9.2604 10.1957 11.6886 13.0905 14.8480 32.0069 35.1725 38.0756 41.6384 44.181324 9.8862 10.8564 12.4012 13.8484 15.6587 33.1962 36.4150 39.3641 42.9798 45.558525 10.5197 11.5240 13.1197 14.6114 16.4734 34.3816 37.6525 40.6465 44.3141 46.927926 11.1602 12.1981 13.8439 15.3792 17.2919 35.5632 38.8851 41.9232 45.6417 48.289927 11.8076 12.8785 14.5734 16.1514 18.1139 36.7412 40.1133 43.1945 46.9629 49.644928 12.4613 13.5647 15.3079 16.9279 18.9392 37.9159 41.3371 44.4608 48.2782 50.993429 13.1211 14.2565 16.0471 17.7084 19.7677 39.0875 42.5570 45.7223 49.5879 52.335630 13.7867 14.9535 16.7908 18.4927 20.5992 40.2560 43.7730 46.9792 50.8922 53.672031 14.4578 15.6555 17.5387 19.2806 21.4336 41.4217 44.9853 48.2319 52.1914 55.002732 15.1340 16.3622 18.2908 20.0719 22.2706 42.5847 46.1943 49.4804 53.4858 56.328133 15.8153 17.0735 19.0467 20.8665 23.1102 43.7452 47.3999 50.7251 54.7755 57.648434 16.5013 17.7891 19.8063 21.6643 23.9523 44.9032 48.6024 51.9660 56.0609 58.963935 17.1918 18.5089 20.5694 22.4650 24.7967 46.0588 49.8018 53.2033 57.3421 60.274836 17.8867 19.2327 21.3359 23.2686 25.6433 47.2122 50.9985 54.4373 58.6192 61.581237 18.5858 19.9602 22.1056 24.0749 26.4921 48.3634 52.1923 55.6680 59.8925 62.883338 19.2889 20.6914 22.8785 24.8839 27.3430 49.5126 53.3835 56.8955 61.1621 64.181439 19.9959 21.4262 23.6543 25.6954 28.1958 50.6598 54.5722 58.1201 62.4281 65.475640 20.7065 22.1643 24.4330 26.5093 29.0505 51.8051 55.7585 59.3417 63.6907 66.766045 24.3110 25.9013 28.3662 30.6123 33.3504 57.5053 61.6562 65.4102 69.9568 73.166150 27.9907 29.7067 32.3574 34.7643 37.6886 63.1671 67.5048 71.4202 76.1539 79.490055 31.7348 33.5705 36.3981 38.9580 42.0596 68.7962 73.3115 77.3805 82.2921 85.749060 35.5345 37.4849 40.4817 43.1880 46.4589 74.3970 79.0819 83.2977 88.3794 91.951765 39.3831 41.4436 44.6030 47.4496 50.8829 79.9730 84.8206 89.1771 94.4221 98.105170 43.2752 45.4417 48.7576 51.7393 55.3289 85.5270 90.5312 95.0232 100.4252 104.214975 47.2060 49.4750 52.9419 56.0541 59.7946 91.0615 96.2167 100.8393 106.3929 110.285680 51.1719 53.5401 57.1532 60.3915 64.2778 96.5782 101.8795 106.6286 112.3288 116.321185 55.1696 57.6339 61.3888 64.7494 68.7772 102.0789 107.5217 112.3934 118.2357 122.324690 59.1963 61.7541 65.6466 69.1260 73.2911 107.5650 113.1453 118.1359 124.1163 128.2989

100 67.3276 70.0649 74.2219 77.9295 82.3581 118.4980 124.3421 129.5612 135.8067 140.1695200 152.2410 156.4320 162.7280 168.2786 174.8353 226.0210 233.9943 241.0579 249.4451 255.2642