A Pietro e a Valentino - Luiss Guido...

496
A Pietro e a Valentino

Transcript of A Pietro e a Valentino - Luiss Guido...

Page 1: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

A Pietro e a Valentino

Page 2: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 3: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indice Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza 7 2.3 Rappresentazione in classi per caratteri quantitativi 10 2.4 Frequenza relativa 12 2.5 Istogramma 2.5.1 Costruzione dell’istogramma 13 2.5.2 Distribuzioni simmetriche ed asimmetriche 15 2.6 Diagramma stelo e foglia 17 2.7 Distribuzione congiunta di due caratteri 19 2.8 Esercizi 23 3 Indici di posizione 3.1 Introduzione 27 3.2 La media 3.2.1 Definizione di media 27 3.2.2 Proprietà della media 31 3.3 La mediana 3.3.1 Definizione di mediana 33 3.3.2 Proprietà della mediana 34 3.4 La moda 36 3.5 Esercizi 37

Page 4: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

VIII

4 Indici di variabilità 4.1 Introduzione 41 4.2 La varianza 4.2.1 Definizione di varianza 42 4.2.2 Proprietà della varianza 47 4.3 La mediana degli scarti assoluti dalla mediana 50 4.4 La differenza interquartile ed il campo di variazione 51 4.5 Esercizi 53 5 Box-plot e altre rappresentazioni grafiche 5.1 Introduzione 57 5.2 Il box-plot 57 5.3 La classificazione delle osservazioni 61 5.4 Altre rappresentazioni grafiche 65 5.5 Esercizi 75 6 Calcolo delle probabilità 6.1 Introduzione 83 6.2 Esperimento casuale ed eventi 84 6.3 La probabilità 90 6.4 Impostazione assiomatica 94 6.5 Misura della probabilità come rapporto fra casi

favorevoli e casi possibili 97 6.6 Probabilità condizionata 99 6.7 Eventi indipendenti 103 6.8 Teorema di Bayes 105 6.9 Elementi di calcolo combinatorio 110 6.10 Probabilità congiunte 114 6.11 Esercizi 119 7 Variabili casuali 7.1 Introduzione 125 7.2 Definizione di variabile casuale 125

Page 5: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indice

IX

7.3 Variabili casuali discrete e funzione di probabilità 128 7.4 Variabili casuali continue e funzione di densità 129 7.5 Funzione di ripartizione 130 7.6 Valore atteso 134 7.7 Varianza 138 7.8 Variabili casuali standardizzate 141 7.9 Esercizi 142

8 Variabili casuali doppie 8.1 Introduzione 145 8.2 Definizione di variabile casuale doppia 146 8.3 Variabili casuali doppie discrete 8.3.1 Funzione di probabilità congiunta e funzioni di probabilità marginali 147 8.3.2 Funzione di probabilità condizionata 154 8.3.3 Indipendenza delle componenti di una variabile casuale doppia 157 8.4 Variabili casuali doppie continue 159 8.5 Covarianza e correlazione 8.5.1 Valore atteso di una funzione di una variabile casuale doppia 160 8.5.2 Covarianza 160 8.5.3 Proprietà della covarianza 162 8.5.4 Coefficiente di correlazione 164 8.5.5 Proprietà del coefficiente di correlazione 165 8.6 Combinazioni lineari di variabili casuali 8.6.1 Combinazioni lineari di due variabili casuali 169 8.6.2 Combinazioni lineari di n variabili casuali 172 8.7 Esercizi 174

9 Modelli per variabili casuali discrete 9.1 Introduzione 181 9.2 Variabile casuale di Bernoulli 182 9.3 Variabile casuale binomiale 183 9.4 Variabile casuale ipergeometrica 187 9.5 Variabile casuale di Poisson 190

Page 6: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

X

9.6 Variabile casuale geometrica 196 9.7 Esercizi 200 10 Modelli per variabili casuali continue 10.1 Variabile casuale normale 10.1.1 Il modello normale 205 10.1.2 Proprietà riproduttiva della variabile casuale normale 213 10.2 Variabile casuale uniforme 215 10.3 Variabile casuale esponenziale negativa 216 10.4 Variabile casuale chi-quadrato 220 10.5 Variabile casuale t di student 222 10.6 Esercizi 223 11 Teorema del limite centrale 11.1 Introduzione 229 11.2 Teorema del limite centrale 11.2.1 Media di variabili casuali 229 11.2.2 Somma di variabili casuali 233 11.3 Approssimazione della distribuzione binomiale

mediante la normale 234 11.4 Esercizi 236 12 Campionamento 12.1 Introduzione all’inferenza 237 12.2 Motivi del campionamento 239 12.3 La popolazione 240 12.4 Il campione 241 12.5 Le statistiche campionarie 245 13 Stima puntuale 13.1 Introduzione 249 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255

Page 7: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indice

XI

13.4 La proporzione campionaria 256 13.5 La varianza campionaria 258 13.6 Metodi di costruzione degli stimatori 261 13.7 Determinazione della numerosità campionaria per la media 264 13.8 Determinazione della numerosità campionaria per la

proporzione 269 13.9 Cenni al campionamento senza rimessa 272 13.10 Esercizi 277 14 Intervalli di confidenza 14.1 Introduzione 281 14.2 Definizione di intervallo di confidenza 281 14.3 Intervallo di confidenza per la media di una

popolazione normale con varianza nota 283 14.4 Intervallo di confidenza per la media di una

popolazione normale con varianza incognita 288 14.5 Intervallo di confidenza per la media quando la

popolazione non è normale 291 14.6 Intervallo di confidenza per la probabilità di successo

di una variabile casuale di Bernoulli 293 14.7 Esercizi 295 15 Test delle ipotesi 15.1 Introduzione 297 15.2 Le ipotesi statistiche 298 15.3 La regola di decisione 300 15.4 Errori nel test delle ipotesi 302 15.5 Test unidirezionale sulla media di una popolazione

normale con varianza nota 308 15.6 Test unidirezionale sulla media di una popolazione

normale con varianza incognita 316 15.7 Test bidirezionale sulla media di una popolazione normale 322 15.8 Test sulla media di una popolazione in assenza di normalità 325 15.9 Test sulla probabilità di successo di una variabile

casuale di Bernoulli 329

Page 8: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

XII

15.10 Il p-valore 337 15.11 La potenza del test 341 15.12 Intervalli di confidenza e test delle ipotesi bidirezionali 348 15.13 Esercizi 350 16 Test chi-quadrato 16.1 Introduzione 357 16.2 Test chi-quadrato sull’adattamento 358 16.3 Test chi-quadrato sull’indipendenza 362 16.4 Test sull’indipendenza nelle tabelle di contingenza 2×2 370 16.5 Esercizi 372 16.6 Appendice 376 17 Correlazione 17.1 Introduzione 379 17.2 Analisi grafica 380 17.3 Stima del coefficiente di correlazione 383 17.4 Stima del coefficiente di correlazione da tabelle di

contingenza 390 17.5 Test sul coefficiente di correlazione per popolazioni

normali 393 17.6 Esercizi 397 18 Il modello di regressione 18.1 Introduzione 401 18.2 Il modello di regressione lineare semplice 402 18.3 Il metodo dei minimi quadrati 410 18.4 Le proprietà dei minimi quadrati 417 18.5 Stima della varianza degli errori nel modello di regressione 419 18.6 Indice di determinazione 424 18.7 Il test nel modello di regressione 429 18.8 La previsione 438 18.9 Esercizi 443 18.10 Appendice 451

Page 9: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indice

XIII

Tavole statistiche Note per l’utilizzo delle tavole 457 Tavole 460 Soluzioni 463 Indice analitico 477

Page 10: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 11: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Prefazione Questo testo è il frutto della mia esperienza nell’insegnamento

rivolto sia a studenti dei corsi di laurea in Statistica sia a studenti che avevano scelto come professione futura quella dell’economista e dell’aziendalista. L’interazione con gli studenti è stata preziosa e ho cercato di farne tesoro. Le loro domande, i loro commenti e il loro modo di esporre hanno modificato nel tempo il mio approccio alla didattica rendendola, spero, più accessibile.

Il testo è concepito come supporto ad un corso universitario di primo anno; pertanto ho cercato di esporre gli argomenti in modo semplice e immediato. La metodologia e i modelli sono presentati richiamando i possibili contesti applicativi e soffermandosi sull’interpretazione dei risultati in modo da evidenziarne l’utilità. Gli esercizi alla fine di ogni capitolo e le soluzioni alla fine del testo consentono al lettore di verificare il proprio grado di apprendimento. Per agevolare la comprensione sono stati introdotti numerosi esempi anche su dati reali. Il fine è sia descrivere l’applicazione dei diversi metodi sia illustrare situazioni nelle quali la statistica fornisce strumenti di interpretazione. In un mondo nel quale l’informazione quantitativa è sempre più ampia e disponibile nei più svariati contesti, l’auspicio è quello di motivare il lettore al ricorso alla statistica quale metodologia indispensabile per l’analisi e la comprensione dei fenomeni reali.

Per la lettura del testo non è necessario che lo studente abbia seguito un corso di analisi matematica; per questo motivo, senza rinunciare al rigore, ho limitato le dimostrazioni a ciò che ritenevo essenziale. Nella scelta degli argomenti ho tenuto conto di ciò che può risultare più rilevante sotto il profilo applicativo. In diversi capitoli gli ultimi paragrafi sono di approfondimento; essi possono essere tralasciati, se vi sono vincoli di tempo, senza pregiudicare la comprensione delle parti successive.

Page 12: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica XVI

L’impostazione del libro riflette il mio percorso formativo e l‘insegnamento di quanti vi hanno contribuito, fra i quali ricordo, in ordine di “apparizione”, Franco Polverini, Domenico Piccolo, Elvezio Ronchetti e Tom DiCiccio. A tutti va il mio affettuoso ringraziamento. Desidero inoltre ringraziare Rosa Capobianco per essermi stata vicina in questo impegno e aver discusso con me ogni dettaglio del libro. Fondamentali sono stati anche i suggerimenti e gli scambi di idee con Stefano Pagnotta ed Emma Sarno. Prezioso lavoro hanno svolto Ester Masiello e Simona Pacillo nella lettura delle bozze, sottolineando numerosi errori commessi nella prima stesura. Fabrizio Farina e Antonio De Pietro, con i loro commenti, hanno contribuito a rendere più scorrevole il testo.

Ovviamente la responsabilità di eventuali errori e imprecisioni è esclusivamente dell’autrice. Sarò grata a quanti vorranno inviare commenti o segnalare errori e imprecisioni all’indirizzo email [email protected].

A Pietro Perlingieri va il merito di avermi incoraggiato a scrivere questo libro.

Un abbraccio particolare va a Pietro e a Valentino. Senza il loro

affetto e la loro comprensione verso una mamma, spesso troppo impegnata nel lavoro, queste pagine non sarebbero mai state scritte. E’ a loro che il libro è dedicato.

Maratea, Agosto 2003

Anna Clara Monti

Page 13: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Prefazione alla seconda edizione

Dopo alcuni anni di verifica didattica del testo, questa seconda

edizione, pur mantenendo pressoché inalterata la struttura del manuale, presenta alcune integrazioni e modifiche che hanno la finalità di rendere il contenuto più chiaro ed esaustivo.

Sono stati preziosi i suggerimenti di Franco Polverini e soprattutto di Salvatore Bologna per la parte sulla probabilità. A loro vanno i miei più sinceri ringraziamenti. Impagabile è stato anche il lavoro di Maria Anna Di Lucca che, con grande pazienza e dedizione, ha collaborato alla correzione delle bozze, e quello di Daniela Maffei che, con estrema cura, ha contribuito a migliorare la grafica. Ringrazio inoltre i miei studenti che, con le loro domande e i loro commenti, hanno consentito di migliorare il testo.

Infine, ma non per ultimi, ringrazio i miei genitori che, con immenso amore, mi sono stati sempre vicini anche nella vita professionale e quindi nella stesura di questo libro. A loro, a Pietro e a Valentino tutto il mio affetto.

Napoli, gennaio 2008

Anna Clara Monti

Page 14: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 15: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione 1.1 Obiettivi della Statistica

La statistica fornisce la metodologia per descrivere, analizzare e

prevedere i fenomeni del mondo reale: essa è quindi una scienza empirica. La sua finalità è l’analisi dei dati, in quanto questi ultimi sono concepiti come manifestazione di una realtà da rappresentare e interpretare.

La statistica si occupa in particolare di quei fenomeni il cui studio richiede l’osservazione di una pluralità di manifestazioni individuali. Quando il dato riguarda un singolo individuo esso è facilmente compreso dalla mente umana; laddove invece esiste un insieme di persone, famiglie, imprese o aree geografiche, interessate da un medesimo fenomeno, interviene la statistica fornendo strumenti di sintesi, analisi e previsione.

Mediante i metodi statistici si elaborano sia informazioni di tipo quantitativo, come redditi, consumi, prezzi, rendimenti e fatturato, sia informazioni di tipo qualitativo, come il livello di istruzione, la condizione occupazionale e il grado di soddisfazione. In ogni caso l’obiettivo è una conoscenza di tipo quantitativo che si esplica nella costruzione di un modello più o meno complesso in relazione alla realtà esaminata e alle esigenze dello studioso.

I risultati che si possono raggiungere sono molteplici. La statistica consente di sintetizzare grandi quantità di informazioni fornendo indicazioni sul livello di un fenomeno, sulla sua variabilità e sulla sua distribuzione. Le analisi statistiche ad esempio forniscono informazioni

Page 16: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 2

sul livello dei consumi, sulla variabilità dei rendimenti, sulla concentrazione del reddito e così via.

E’ possibile inoltre valutare il grado di incertezza legato a particolari fenomeni di interesse mediante la costruzione di modelli probabilistici. Sulla base di un modello è possibile prevedere quando, con maggiore probabilità, un impianto necessiterà di un intervento di manutenzione. Utilizzando un processo di conta è possibile prevedere quanti utenti richiederanno un servizio in un intervallo di tempo. Conoscendo la distribuzione è infine possibile valutare la probabilità che nell’ambito di una produzione si verifichino pezzi non conformi agli standard.

Un altro obiettivo molto importante della statistica è lo studio delle caratteristiche di una popolazione mediante l’analisi di un campione. Spesso il tempo limitato, i costi elevati e la mancanza di un elenco non consentono di estendere l’indagine all’intera popolazione di interesse. In queste circostanze è possibile studiare un fenomeno mediante rilevazioni effettuate soltanto su alcune unità e utilizzare la metodologia statistica per fare inferenza sulla popolazione sottostante.

Fra le finalità della statistica vi è anche l’individuazione e la valutazione quantitativa delle relazioni fra più variabili. Si può verificare se esiste una relazione fra il voto conseguito alla laurea e il tempo impiegato per trovare lavoro, oppure si può misurare qual è l’effetto di una variazione del prezzo di un bene sulla quantità domandata o, ancora, si può valutare in quale misura le caratteristiche tecniche di un prodotto incidono sul prezzo.

La statistica infine può essere utilizzata per fare previsioni su fenomeni di interesse sulla base di un modello che rappresenti le relazioni fra il fenomeno oggetto di studio e altre variabili che hanno la capacità di influenzarlo.

1.2 Struttura del testo Il testo è diviso in quattro parti. La prima, dal capitolo 2 al

capitolo 5, riguarda le analisi descrittive ed esplorative e fornisce gli strumenti per sintetizzare e rappresentare le informazioni statistiche.

Page 17: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione

3

Nella seconda, dal capitolo 6 al capitolo 11, si introducono gli elementi di calcolo delle probabilità necessari per affrontare le parti successive. Dopo aver fornito le nozioni di base, si considerano le variabili casuali univariate e bivariate e alcuni modelli per variabili casuali particolarmente rilevanti nello studio dei fenomeni reali.

L’inferenza, ossia la metodologia statistica per lo studio della popolazione attraverso l’analisi di un campione, è trattata nella terza parte dal capitolo 12 al capitolo 15. In questo ambito si considera il problema della stima puntuale, quella per intervallo e il test delle ipotesi. La trattazione è limitata agli aspetti essenziali e particolarmente rilevanti nel contesto applicativo.

I capitoli 16, 17 e 18 infine sono dedicati allo studio delle relazioni fra fenomeni. Nei primi due si introduce un test per verificare l’indipendenza fra due fenomeni e si approfondisce lo studio della correlazione al fine di valutare l’intensità del legame fra due variabili. Nell’ultimo capitolo invece si introduce il modello di regressione quale strumento di analisi del legame fra due variabili, utile anche per la previsione.

Page 18: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 19: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati

L’informazione statistica è costituita dal carattere statistico − quale fenomeno oggetto di studio – e dall’unità statistica sulla quale il fenomeno è osservabile. In uno studio sul fatturato delle aziende, che operano in un certo settore, il fatturato costituisce il carattere statistico e le aziende sono le unità statistiche; mentre, in uno studio sui consumi, le famiglie costituiscono le unità statistiche e il loro livello di consumo il carattere statistico.

Affinché un fenomeno abbia rilevanza come carattere statistico è essenziale che esso si manifesti con diverse modalità rispetto alle unità statistiche e sia quindi suscettibile di variabilità.

I caratteri statistici possono essere quantitativi o qualitativi. Nel primo caso, le modalità sono numeri reali o valori; nel secondo, le modalità non sono esprimibili numericamente. Sono caratteri quantitativi il reddito di un individuo, il numero di dipendenti di un’azienda, il prezzo di un bene e il rendimento dei titoli; mentre sono caratteri qualitativi il sesso, il titolo di studio, la condizione occupazionale e il colore di un’automobile. I caratteri quantitativi sono anche definiti variabili statistiche mentre quelli qualitativi sono definiti mutabili.

Le variabili si distinguono in discrete e continue. Sono discrete quelle che assumono valori in un insieme discreto, come il voto conseguito a un esame, il numero di utenti che ogni giorno si recano

Page 20: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

6

presso uno sportello bancario, il numero di errori in un testo e il numero di spettatori di un programma televisivo. Sono invece continue quelle variabili che assumono valori in un intervallo (limitato o illimitato): il peso di un individuo, la spesa in generi alimentari di una famiglia, la percentuale di pezzi difettosi di una produzione, il tempo di accelerazione affinché un’automobile arrivi a una velocità di 100 chilometri orari e la durata di una batteria.

L’insieme di tutte le informazioni relative a un fenomeno di interesse costituisce la popolazione. A seconda che l’oggetto di studio sia costituito da una variabile oppure da una mutabile, la popolazione è data dai valori o dalle modalità corrispondenti a tutte le unità statistiche interessate dal fenomeno.

L’obiettivo della statistica è lo studio della popolazione. Tuttavia, la raccolta dei dati statistici non è sempre eseguita su tutte le unità. La rilevazione può infatti avvenire in due modi diversi: mediante censimento o campionamento. Nel primo caso la rilevazione dei dati è esaustiva, cioè riguarda tutte le unità statistiche. La sintesi dei dati può essere realizzata con le metodologie descritte in questa prima parte del libro e i risultati ottenuti, con l’elaborazione statistica, forniscono esattamente le informazioni richieste sulla popolazione.

Nel campionamento invece la rilevazione dei dati avviene soltanto su alcune unità statistiche. Il sottoinsieme dei valori o delle modalità corrispondenti alle unità statistiche, sulle quali è eseguita la rilevazione, costituisce il campione. Quando la rilevazione è parziale, le informazioni ottenute devono essere elaborate con una metodologia adeguata e la generalizzazione dei risultati ottenuti dall’analisi del campione all’intera popolazione richiede particolare cautela.

Si supponga di voler effettuare un’indagine per conoscere la proporzione di consumatori di birra che acquistano quella di produzione estera. Non essendo disponibile una lista dei consumatori di birra, ossia un elenco di tutte le unità statistiche, si può decidere di svolgere un’indagine scegliendo a caso alcuni clienti nei supermercati. Se il campione è sufficientemente numeroso, si può auspicare che la

Page 21: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Distribuzioni di frequenza

7

proporzione degli intervistati che acquistano birra di produzione estera sia vicina alla proporzione della popolazione dei consumatori di birra che acquistano quella di produzione estera. E’ opportuno comunque tenere presente che la rilevazione è svolta soltanto su una parte della popolazione e pertanto il dato calcolato sul campione costituisce soltanto un’approssimazione del dato vero.

In questa parte del testo si introdurranno alcune tecniche per sintetizzare e rappresentare le informazioni, sia che esse provengano dall’intera popolazione sia da un campione. Nel secondo caso, però, è opportuno tener presente che generalizzazioni sull’intera popolazione possono essere derivate soltanto utilizzando le metodologie proprie dell’inferenza statistica. Queste ultime consentono di ottenere, sulla base delle informazioni campionarie, la migliore conoscenza possibile della popolazione e di valutare probabilisticamente il grado di incertezza di ogni risultato. Per lo studio di queste metodologie si rinvia ai capitoli 12-18.

2.2 Distribuzioni di frequenza

All’aumentare del numero di unità statistiche sulle quali è osservato un carattere, diventa via via più difficile interpretare quantità crescenti di dati. Quando le informazioni aumentano si rende necessaria una rappresentazione sintetica dei dati che renda più evidenti le caratteristiche del fenomeno oggetto di studio. La prima elaborazione dei dati consiste nel calcolo della distribuzione di frequenza.

Si consideri un insieme di n unità statistiche sul quale è stato osservato un carattere che assume k modalità m1, m2, …, mk. Si definisce frequenza (assoluta) di mi il numero di volte che la modalità mi è stata osservata sulle n unità statistiche e si indica con ni. Evidentemente la somma delle frequenze è pari a n

1 21

k

i ki

n n n n n=

= + + ⋅⋅⋅ + =∑ .

Page 22: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

8

Dopo aver calcolato le frequenze è possibile darne una rappresentazione mediante una tabella come la 2.1. L’insieme delle modalità assunte dal carattere con le corrispondenti frequenze costituisce la distribuzione di frequenza.

Tabella 2.1 – Distribuzione di frequenza.

modalità im

frequenza in

1m 1n 2m 2n km kn

Totale n Esempio 2.1. La tabella 2.2 riporta alcune rilevazioni su 20

telefoni cellulari che, nel marzo 2002, avevano un prezzo compreso fra 76 euro e 103 euro. I dati (rilevati sul sito web www.cellulari.it) riguardano la durata della batteria in ore di conversazione, il numero di memorie disponibili nel telefono, il tipo di rete e la disponibilità del protocollo WAP. La durata delle batterie e il numero di memorie disponibili sono caratteri quantitativi. Il tipo di rete e la disponibilità del protocollo Wap, invece, sono caratteri qualitativi. Il primo assume le modalità Dual Band GSM (DB) o Etacs (E); mentre il secondo assume le modalità presente (Si) e assente (No).

Le distribuzioni di frequenza dei quattro caratteri sono riportate nelle tabelle 2.3.a, 2.3.b, 2.3.c e 2.3.d. Per la maggior parte dei telefoni considerati, le batterie hanno una durata, in conversazione, di 3 o 4 ore. Su circa la metà dei telefoni non vi sono memorie disponibili mentre 7 telefoni hanno 99 o 100 memorie. Infine la maggior parte dei telefoni utilizzano la rete Dual Band GSM e non hanno il protocollo WAP.

Page 23: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Distribuzioni di frequenza

9

Tabella 2.2 – Durata della batteria in ore di conversazione, numero di memorie disponibili nel telefono, rete (Dual Band GSM o Etacs) e disponibilità del protocollo Wap di 20 telefoni cellulari. Cellulare

Durata batteria

Memorie disponibili

Rete

Wap

Alcatel – OneTouchEasyDB 5 0 DB No Ericsson – A 2618 4 100 DB No Ericsson – A 2628 4 99 DB Si Ericsson – R 320 s 4 99 DB Si Ericsson – T 10 s 3 0 DB No Motorola – M 3588 4 0 DB No Motorola – StarTAC Etacs 1 100 E No Motorola – Talkabout T2288 3 0 DB Si Motorola Talkabout T180 3 0 DB No Nec – DB4100 2 0 DB No Nokia – Ringo 2 60 E No Panasonic – GD30 3 50 DB No Philips – Savvy Vogue 4 0 DB No Sagem – MW 930 3 100 DB Si Sagem – MW 936 3 100 DB Si Siemens – C30 4 0 DB No Telit – GM810e 5 0 DB No Telit – GM822 4 0 DB Si Telit – GM830 4 0 DB No Trium – Galaxy 3 100 DB No

Tabella 2.3.a – Durata delle batterie

im in 1 1 2 2 3 7 4 8 5 2

Totale 20

Tabella 2.3.b – Memorie disponibili

im in 0 11 50 1 60 1 99 2

100 5 Totale 20

Tabella 2.3.c – Rete

im in Dual Band GSM 18

Etacs 2 Totale 20

Tabella 2.3.d – WAP

im in Si 6 No 14

Totale 20

Page 24: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

10

2.3 Rappresentazione in classi per caratteri quantitativi Quando un carattere quantitativo è continuo oppure è discreto, ma

assume numerosi valori, la costruzione della distribuzione di frequenza richiede che le osservazioni siano preliminarmente raggruppate in classi. Queste si costruiscono dividendo l’insieme dei valori che la variabile assume in intervalli.

Nella costruzione delle classi è opportuno seguire alcuni criteri. Le classi devono essere disgiunte, in modo da evitare ambiguità nell’attribuzione delle osservazioni alle classi. Nel caso di caratteri continui questa esigenza è soddisfatta lasciando aperta la classe in uno dei due estremi. Ad esempio, nel costruire le classi per il reddito, in migliaia di euro, si possono considerare le classi (0 |− 5), (5 |− 10), (10 |− 15), etc., sicché nella prima classe rientrano i redditi inferiori a 5 mila euro, nella seconda i redditi maggiori o uguali a 5 mila euro e inferiori a 10 mila euro, e così via. Un reddito esattamente pari a 5 mila euro è incluso nella seconda classe senza che vi siano ambiguità.

Le classi devono essere esaustive, ossia tutte le osservazioni devono poter essere collocate in una delle classi. Il problema si pone per alcuni caratteri come il reddito o l’età per i quali non esiste un limite superiore. La soluzione consiste nell’utilizzare come ultima classe una classe aperta. Nel caso del reddito, ad esempio, l’ultima classe può contenere i redditi superiori a 100 mila euro.

La scelta del numero delle classi è piuttosto complessa e deve essere tale da garantire un compromesso fra sintesi e dettaglio. La strategia da seguire può essere quella di iniziare con un numero elevato di classi e procedere successivamente a un’aggregazione delle stesse.

Altro elemento importante è la scelta dell’ampiezza delle classi. Laddove possibile, conviene che le classi siano tutte di eguale ampiezza. Tuttavia se nella distribuzione dei dati vi sono intervalli con una scarsa densità di osservazioni, può essere opportuno costruire classi di maggiore ampiezza per evitare classi vuote. Se invece vi sono delle

Page 25: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Distribuzioni di frequenza

11

aree con un’elevata concentrazione di dati può essere utile costruire classi di minore ampiezza per non disperdere informazioni.

Nella costruzione delle classi infine è opportuno fare attenzione affinché il valore centrale, costituito dalla semi-somma degli estremi, sia rappresentativo della classe perché nelle successive elaborazioni sarà utilizzato in sostituzione dei valori effettivi.

Esempio 2.2. La tabella 2.4 riporta i rendimenti a sei mesi di 80

fondi bilanciati moderati italiani calcolati al 26 marzo 2002 (dati rilevati sul sito web www.morningstar.it). Osservando i dati (figura 2.1) si nota un maggiore addensamento dei rendimenti fra l’1% e il 4% e una scarsa frequenza di rendimenti negativi o molto elevati. Ciò suggerisce di considerare classi di diversa ampiezza.

Tabella 2.4 – Rendimenti a sei mesi di 80 fondi bilanciati moderati italiani.

-1.0 -0.6 -0.3 0.0 0.0 0.7 0.7 0.8 0.9 1.2 1.2 1.2 1.3 1.3 1.4 1.4 1.4 1.5 1.5 1.5 1.6 1.7 1.7 1.7 1.7 1.7 1.8 1.8 1.8 1.8 1.9 1.9 2.0 2.0 2.1 2.2 2.2 2.2 2.3 2.3 2.4 2.4 2.4 2.5 2.5 2.5 2.6 2.6 2.6 2.7 2.7 2.7 2.9 2.9 2.9 2.9 3.1 3.1 3.3 3.4 3.6 3.6 3.8 3.8 4.0 4.1 4.7 4.8 5.0 5.2 5.3 5.6 5.8 6.1 6.7 7.6 8.4 8.6 9.4 11.0

Figura 2.1 – Rappresentazione grafica dei dati in tabella 2.4

La distribuzione di frequenza dei dati raggruppati in classi è riportata nella tabella 2.5.

0 2 4 6 8 10

Page 26: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

12

Tabella 2.5 – Distribuzione in classi dei rendimenti dei fondi. Rendimento in -1.0 |– 1.0 9 1.0 |– 2.0 23 2.0 |– 3.0 24 3.0 |– 4.0 8 4.0 |– 6.0 9 6.0 |– 8.0 3

8.0 |– 10.0 3 10.0 |– 12.0 1

Totale 80 2.4 Frequenza relativa

La distribuzione di frequenza, sebbene costituisca un’importante sintesi iniziale dei dati, non consente di confrontare le distribuzioni di fenomeni osservati su insiemi di unità statistiche di numerosità diversa. Per poter confrontare tali insiemi è necessario rendere le distribuzioni di frequenza indipendenti dalla numerosità. A tale fine si utilizza la frequenza relativa.

Si considerino n unità statistiche sulle quali è stato osservato un carattere che assume k modalità m1, m2, …, mk. Si definisce frequenza relativa fi di mi il rapporto fra il numero di volte in nelle quali la modalità mi è stata osservata e la numerosità n. Quindi /i if n n= e inoltre la somma delle frequenze relative è pari a 1

1 2

1

1k

ki

i

nn nfn n n=

= + + ⋅⋅⋅ + =∑ .

La frequenza relativa if moltiplicata per 100 indica la percentuale di volte nelle quali è stata osservata la modalità mi sulle n unità statistiche.

Esempio 2.3. La tabella 2.6 riporta la distribuzione dei voti di 188

laureati in Economia presso l’Università degli Studi del Sannio da

Page 27: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Distribuzioni di frequenza

13

maggio 1995 a marzo 1999. I dati sono stati suddivisi rispetto al sesso del laureato. Il numero di laureati di sesso femminile è 116 ed è maggiore del numero di laureati di sesso maschile pari a 72; pertanto le frequenze ni non sono confrontabili. La tabella 2.7 riporta le distribuzioni delle frequenze relative, dalle quali si evince che le laureate conseguono voti alti con maggiore frequenza di quanto avvenga per i loro colleghi di sesso maschile; il 25% delle laureate consegue il titolo con il massimo dei voti, mentre soltanto il 9.7% dei laureati raggiunge il 110.

Tabella 2.6 – Distribuzione di

frequenza dei voti di laurea Tabella 2.7 – Distribuzione di frequenza relativa dei voti di laurea.

Voto

Femmine

in Maschi

in

Voto Femmine

if Maschi

if 70–79 0 1 70–79 0.000 0.014 80–89 2 6 80–89 0.017 0.083 90–94 7 9 90–94 0.060 0.125 95–99 16 19 95–99 0.138 0.264

100–104 25 10 100–104 0.216 0.139 105–109 37 20 105–109 0.319 0.278 110–110 29 7 110–110 0.250 0.097 Totale 116 72 Totale 1.000 1.000

2.5 Istogramma 2.5.1 Costruzione dell’istogramma

L’istogramma è un grafico mediante il quale rappresentare la distribuzione di frequenza di un carattere quantitativo. Esso si costruisce disegnando tanti rettangoli adiacenti quante sono le classi e osservando i seguenti criteri:

1) le basi dei rettangoli sono costituite dalle classi;

2) l’area dei rettangoli è proporzionale alla frequenza delle classi.

Page 28: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

14

Nel seguito è descritta la costruzione dell’istogramma tale che l’area dei rettangoli coincida con la frequenza relativa. Si consideri una distribuzione definita su k classi (x0 – x1), (x1 – x2), …, (xk-1 – xk), con frequenze relative f1, f2, …, fk. Per ciascuna classe, si calcola l’ampiezza

1i i iA x x −= − (cioè la differenza fra gli estremi) e quindi l’altezza del rettangolo o densità data da /i i ih f A= . Il grafico dei rettangoli adiacenti aventi come basi le classi e come altezze le densità hi è l’istogramma. I calcoli per la costruzione dell’istogramma sono schematizzati nella tabella 2.8.

Tabella 2.8 – Calcoli per la costruzione dell’istogramma. Classi if iA ih

0x |– 1x 1f 1 1 0A x x= − 1 1 1/h f A=

1x |– 2x 2f 2 2 1A x x= − 2 2 2/h f A=

1kx − |– kx kf 1k k kA x x −= − /k k kh f A=

Esempio 2.4. A un insieme di 100 famiglie è stato chiesto quanto

spendono, in euro, per la benzina ogni mese. La distribuzione di frequenza e i calcoli per la costruzione dell’istogramma sono riportati nella tabella 2.9.

Tabella 2.9 – Spesa per la benzina. Classi if iA ih

0 |– 20 0.15 20 0.0075 20 |– 50 0.35 30 0.0117

50 |– 100 0.30 50 0.0060 100 |– 200 0.20 100 0.0020

L’istogramma corrispondente è disegnato nella figura 2.2. La

classe con densità più elevata è la seconda. La densità decresce più lentamente a destra che a sinistra e pertanto la distribuzione è definita asimmetrica.

Page 29: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Distribuzioni di frequenza

15

Figura 2.2 Istogramma per l’esempio 2.4

0 50 100 150 2000.0

0.002

0.004

0.006

0.008

0.010

0.012

2.5.2 Distribuzioni simmetriche e asimmetriche

Un aspetto che caratterizza le distribuzioni di frequenza è la presenza o l’assenza di simmetria. Generalmente nelle distribuzioni di frequenza è possibile individuare un valore cui corrisponde la massima frequenza o una classe cui corrisponde la massima densità di frequenza. Tale valore o classe si definisce modale. Quando le frequenze (o densità di frequenza) decrescono in modo simmetrico, a destra e a sinistra del valore (o della classe modale), la distribuzione si dice simmetrica. In tal caso osservazioni molto piccole o molto elevate sono ugualmente frequenti. La figura 2.3 illustra l’istogramma di una distribuzione simmetrica.

Spesa mensile per la benzina

Page 30: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

16

Qualora invece le frequenze (o densità di frequenza) decrescano

più rapidamente, a destra o a sinistra del valore (o della classe modale), la distribuzione è definita asimmetrica. La figura 2.4 illustra l’istogramma di una distribuzione con asimmetria positiva, caratterizzata da una coda a destra, mentre la figura 2.5 illustra l’istogramma di una distribuzione con asimmetria negativa, caratterizzata da una coda a sinistra.

Figura 2.3 Distribuzione simmetrica

Figura 2.4 Distribuzione asimmetrica positiva

Page 31: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Distribuzioni di frequenza

17

2.6 Diagramma stelo e foglia

Una rappresentazione alternativa dei dati in classi è costituita dal diagramma stelo e foglia. Nella versione più semplice i dati vengono raggruppati nella stessa classe se hanno le cifre iniziali in comune e l’immissione avviene in “cifre iniziali” e “cifre finali”. Le cifre iniziali identificano la classe e sono riportate a sinistra, all’inizio della riga, mentre le cifre finali vengono riportate a destra, separatamente per ogni dato. Ogni riga costituisce uno stelo, mentre le informazioni relative a ciascun dato sono le foglie.

Si considerino i dati seguenti

22, 23, 25, 27, 31, 33, 34, 43, 48. I valori 22, 23, 25 e 27 hanno la stessa cifra iniziale “2” e cifre finali “2”, “3”, “5” e “7” rispettivamente. Nel diagramma stelo e foglia sono riportati sullo stesso stelo, individuato dalla cifra iniziale “2”. L’insieme dei dati è rappresentato nel diagramma stelo e foglia nel modo seguente.

Figura 2.5 Distribuzione asimmetrica negativa

Page 32: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

18

2 2 3 5 73 1 3 4 4 3 8

La costruzione del diagramma stelo e foglia facilita l’ordinamento dei dati e presenta il vantaggio, rispetto all’istogramma, di conservare i valori all’interno della classe.

Esempio 2.5. La tabella 2.10 riporta i dati relativi ai consumi

alimentari pro-capite in alcuni paesi europei negli anni 1992-93 (fonte: Eurostat - Statistiche generali della Comunità Europea, anno 1995).

Tabella 2.10 – Consumi alimentari pro-capite (consumo annuo in chilogrammi)

1992-93. Cereali Patate Carne Latte e

latticini Burro Vino

Belgio ... 101 152 85 7 21 Danimarca 68 57 329 145 3 23 Germania 71 74 86 93 7 23 Grecia 103 81 66 62 1 26 Spagna ... 105 97 114 1 42 Francia 72 ... 107 97 9 65 Irlanda ... ... 299 189 3 4 Italia 121 41 75 64 2 63 Lussemburgo ... ... ... ... ... 58 Paesi Bassi 58 87 231 137 3 13 Portogallo 87 155 88 100 1 55 Regno Unito 78 ... 85 131 3 12 Finlandia 70 62 62 206 6 10 Austria 71 60 91 104 4 33 Svezia 64 84 61 152 2 13 Norvegia 76 74 55 195 2 6 Svizzera 74 45 68 121 6 42

Il diagramma stelo e foglia relativo ai consumi pro-capite di

cereali è riportato nella figura 2.6. Si evince un’asimmetria positiva della distribuzione con la presenza di due osservazioni, corrispondenti a Grecia e Italia, particolarmente distanti dalle altre.

Page 33: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Distribuzioni di frequenza

19

5 8 6 4 8 7 0 1 1 2 4 6 88 7 9

10 3 11 12 1

2.7 Distribuzione congiunta di due caratteri

In alcune circostanze si può avere interesse a studiare congiuntamente due fenomeni come il livello di istruzione e la posizione professionale, la dimensione aziendale e il settore di attività o l’esposizione a fattori di rischio e l’insorgenza di particolari patologie cliniche. In questi casi informazioni sul legame esistente fra i due caratteri si possono ottenere attraverso la distribuzione delle frequenze congiunte.

Si supponga che il primo carattere, indicato con A, assuma k modalità 1 2 ka ,a , ,a… e il secondo, indicato con B, assuma h modalità

1 2 hb ,b , ,b… . Si assuma inoltre che entrambi i caratteri siano stati rilevati su n unità statistiche. Il numero delle volte che si osserva contemporaneamente la modalità ia del carattere A e la modalità jb del carattere B sulle n unità è la frequenza congiunta ijn della coppia ( )i ja ,b . La distribuzione delle frequenze congiunte può essere utilmente rappresentata mediante una tabella di contingenza come illustrato nella tabella 2.11.

Figura 2.6 Diagramma stelo e foglia dei consumi di cereali

Page 34: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

20

Tabella 2.11 – Tabella di contingenza. B

A 1b 2b jb hb Totale

1a 11n 12n 1 jn 1hn 1n .

2a 21n 22n 2 jn 2hn 2n .

ia 1in 2in ijn ihn in .

ka 1kn 2kn kjn khn kn .

Totale 1n. 2n. jn. hn. n

Le celle all’interno della tabella di contingenza riportano le

frequenze congiunte ijn con le quali sono state osservate tutte le possibili coppie di modalità ( )i ja ,b . La somma di tutte le frequenze congiunte è pari a n

1 1

k h

iji j

n n= =

=∑∑ .

Per distinguerle dalle frequenze congiunte, le frequenze delle modalità del carattere A o del carattere B, considerati singolarmente, sono definite marginali. Le frequenze marginali in . delle modalità ia del primo carattere, per i=1,2,…,k, sono riportate sull’ultima colonna. Per ciascuna modalità ia , la frequenza marginale si ottiene sommando le frequenze congiunte che si trovano sulla riga corrispondente, cioè

1 21

h

i i i ih ijj

n . n n n n=

= + + + =∑ .

Analogamente le frequenze marginali jn. delle modalità bj del carattere B, per j=1,2,…,h, sono riportate nell’ultima riga e si ottengono sommando le frequenze congiunte che si trovano sulla colonna corrispondente

Page 35: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Distribuzioni di frequenza

21

1 21

k

j j j kj iji

n. n n n n=

= + + + =∑ .

Ovviamente anche per le frequenze marginali si ha che

1 1

n n

i ji i

n . n. n= =

= =∑ ∑ .

Esempio 2.6. La tabella 2.12 riporta i risultati di una ricerca

sull’interazione fra disturbi cardiaci e russare notturno condotta su 2484 pazienti da Norton e Dunn (British Medical Journal, 1985). Il primo carattere assume due modalità: “si” se il paziente è affetto da disturbi cardiaci e “no” altrimenti. Il secondo carattere considera la frequenza con la quale il paziente russa durante il sonno e assume le modalità “non russa”, “russa occasionalmente”, “russa quasi ogni notte” e “russa tutte le notti”. Dalla tabella si osserva che, in proporzione, i pazienti affetti da disturbi cardiaci russano più frequentemente dei pazienti sani.

Tabella 2.12 – Disturbi cardiaci e russare notturno. Russare notturno Disturbi

cardiaci Non russa Russa occasionalmente

Russa quasi ogni notte

Russa tutte le notti Totale

Si 24 35 21 30 110 No 1⋅355 603 192 224 2⋅374 Totale 1⋅379 638 213 254 2⋅484

Esempio 2.7. Nell’ambito della valutazione della didattica da

parte degli studenti frequentanti, in un corso di statistica, sono stati posti agli studenti i seguenti due quesiti: “sei interessato alla disciplina?” e “sei soddisfatto del corso?”. Per entrambi i quesiti le modalità di risposta previste erano “decisamente no”, “più no che sì”, “più sì che no” e “decisamente sì”. La distribuzione di frequenza è riportata nella tabella 2.13. Per ciascuna modalità di entrambi i

Page 36: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

22

caratteri, le frequenze più elevate tendono a disporsi lungo la diagonale principale a evidenza del fatto che la valutazione complessiva dell’attività didattica (soddisfazione per l’insegnamento) dipende dall’interesse per la disciplina.

Tabella 2.13 – Interesse per la disciplina e soddisfazione per l’insegnamento.

Soddisfazione per l’insegnamento Interesse per la disciplina Decisamente

no Più no che

sì Più sì che

no Decisamente

sì Totale

Decisamente no 3 1 6 1 11 Più no che sì 2 2 5 1 10 Più sì che no 0 4 39 17 60 Decisamente si 0 2 9 50 61 Totale 5 9 59 69 142

Esempio 2.8. La tabella 2.10 riporta il consumo pro-capite di

carne e di latte e latticini in 16 paesi europei nel periodo 1992-93. Per il consumo pro-capite di carne si considerano le modalità “minore di 80 chilogrammi”, “compreso fra 80 e 100 chilogrammi” e “maggiore di 100 chilogrammi”. Per il consumo pro-capite di latte e latticini si considerano le modalità “minore di 100 chilogrammi”, “compreso fra 100 e 150 chilogrammi” e “maggiore di 150 chilogrammi”. La distribuzione congiunta dei due caratteri è riportata nella tabella 2.14.

Tabella 2.14 – Consumi pro-capite di carne e latte o latticini.

Consumi di latte e latticini Consumi di carne Minore di 100

kg Fra 100 e 150 kg. Maggiore di 150 kg. Totale

Minore di 80 kg 2 1 3 6 Fra 80 e 100 kg 1 4 0 5 Maggiore 100 kg 2 2 1 5 Totale 5 7 4 16

Page 37: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Distribuzioni di frequenza

23

2.8 Esercizi

Esercizio 2.1. La tabella 2.10 riporta i consumi pro-capite di burro in alcuni paesi europei negli anni 1992-93. Costruire la distribuzione di frequenza e quella delle frequenze relative.

Esercizio 2.2. La tabella 2.15 riporta le gradazioni alcoliche di alcuni vini rossi DOC prodotti nella Provincia di Benevento (fonte: sito web www.politicheagricole.it). Costruire la distribuzione di frequenza e quella delle frequenze relative.

Tabella 2.15 – Gradazioni alcoliche di alcuni vini rossi DOC prodotti nella provincia di Benevento.

Vino Gradazione alcolica Aglianico del Taburno Rosso 11.5 Aglianico del Taburno Rosso Riserva 12.0 Guardiolo Aglianico 11.5 Guardiolo Aglianico Riserva 12.5 Guardiolo Rosso 11.5 Guardiolo Rosso Riserva 12.5 Sannio Aglianico 11.5 Sannio Barbera 11.5 Sannio Piedirosso 11.0 Sannio Rosso 11.0 Sannio Sciascinoso 11.0 Sant’Agata dei Goti Aglianico 11.5 Sant’Agata dei Goti Aglianico Riserva 11.5 Sant’Agata dei Goti Piedirosso 11.5 Sant’Agata dei Goti Piedirosso Riserva 12.0 Sant’Agata dei Goti Rosso 11.5 Solopaca Aglianico 11.5 Solopaca Rosso 11.5 Solopaca Rosso Superiore 12.5 Taburno Piedirosso 11.0 Taburno Rosso 11.0 Esercizio 2.3. La tabella 2.16 riporta la distribuzione degli investimenti annuali, in migliaia di euro, in titoli azionari on-line di 49 dirigenti di azienda. Calcolare le frequenze relative, quindi costruire l’istogramma e commentare i risultati.

Page 38: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

24

Tabella 2.16 – Investimenti in titoli azionari on-line. Investimenti Numero di dirigenti d’azienda

0 |– 5 4 5 |– 10 32 10 |– 15 10 15 |– 25 3

Esercizio 2.4. La tabella 2.17 riporta la distribuzione dei depositi in conto corrente, in migliaia di euro, di 100 famiglie. Calcolare le frequenze relative, quindi costruire l’istogramma e commentare i risultati.

Tabella 2.17 – Depositi in conto corrente (in migliaia di euro) di un campione di 100 famiglie.

Riserva liquida Numero di famiglie 0 |– 2 15 2 |– 5 35

5 |– 10 30 10 |– 20 20

Esercizio 2.5. La tabella 2.18 riporta la distribuzione della durata,

in centinaia di ore, di 120 lampadine da 100 Watt. Calcolare le frequenze relative, quindi costruire l’istogramma e commentare i risultati.

Tabella 2.18 – Durata (in centinaia di ore) di 120 lampadine da 100 Watt.

Durata in ore Numero di lampadine 6 |– 7 10 7 |– 8 25 8 |– 9 45

9 |– 10 25 10 |– 12 15

Esercizio 2.6. La tabella 2.5 riporta la distribuzione dei

rendimenti a sei mesi di 80 fondi bilanciati moderati italiani. Calcolare le frequenze relative, quindi costruire l’istogramma e commentare i risultati.

Page 39: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Distribuzioni di frequenza

25

Esercizio 2.7. Il Sole 24 ore del 5 aprile 2002 ha pubblicato il numero di ascoltatori radiofonici, cioè coloro che si sintonizzano su un’emittente per almeno 15 minuti in un giorno, delle principali radio diffuse sul territorio nazionale. I dati sono riportati nella tabella 2.19. Raggruppare i dati in classi e calcolare la distribuzione di frequenza. Successivamente, rappresentare i dati mediante istogramma e commentare i risultati.

Tabella 2.19 – Ascoltatori radiofonici in un giorno delle principali emittenti.

Emittenti Numero di ascoltatori (in migliaia) Rai Radiouno 7969 Rai Radiodue 5276 Rai Radiotre 2011 Isoradio 1441 Radio 101 1108 Radio Montecarlo 2245 Radio Capital 1390 Radio Deejay 5558 Rin – Radio Italia Network 2012 Radio Kiss Kiss Network 961 Radio Maria 1667 Radio Radicale 501 Radio 105 Network 3333 Radio Dimensione Suono 4051 Radio Italia Solo Musica Italiana 4004 Rti 102.5 4398 Radio 24 – Il Sole 24 Ore 1209 Radio Lattemiele 2019

Esercizio 2.8. La tabella 2.20 riporta il numero di accessi

giornalieri ad un sito internet in cinque mesi. Raggruppare i dati in classi e calcolare la distribuzione di frequenza. Successivamente, rappresentare i dati mediante istogramma e commentare i risultati.

Esercizio 2.9. La tabella 2.10 riporta i dati relativi ai consumi pro-

capite di patate in alcuni paesi europei negli anni 1992-93. Costruire il diagramma stelo e foglia e commentare i risultati.

Page 40: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica

26

Tabella 2.20 – Accessi giornalieri ad un sito internet. 88 91 93 95 95 97 99 100 103 103 105 108 108 109 112

112 114 116 116 118 119 119 120 120 120 122 122 122 122 122 123 125 125 126 126 126 127 128 128 129 130 131 132 132 132 132 135 135 135 136 136 138 139 140 140 140 141 141 142 142 143 143 143 143 145 146 146 147 147 147 148 148 148 149 149 151 152 153 154 156 156 157 158 159 159 159 160 160 162 162 162 163 163 165 166 166 167 168 168 169 169 169 170 170 170 170 173 176 176 179 179 182 183 183 183 184 184 185 190 190 190 190 190 191 193 196 196 200 203 204 208 211 213 214 215 215 217 218 222 222 227 230 237 238 240 244 250 258 261 319

Esercizio 2.10. La tabella 2.10 riporta i dati relativi ai consumi

pro-capite di carne in alcuni paesi europei negli anni 1992-93. Costruire il diagramma stelo e foglia e commentare i risultati.

Esercizio 2.11. La tabella 2.10 riporta i dati relativi ai consumi

pro-capite di latte e latticini in alcuni paesi europei negli anni 1992-93. Costruire il diagramma stelo e foglia e commentare i risultati.

Esercizio 2.12. La tabella 2.10 riporta i dati relativi ai consumi

pro-capite di vino in alcuni paesi europei negli anni 1992-93. Costruire il diagramma stelo e foglia e commentare i risultati.

Esercizio 2.13. La tabella 2.10 riporta il consumo pro-capite di

cereali e di patate in alcuni paesi europei nel periodo 1992-93. Considerando soltanto gli 11 paesi per i quali sono disponibili entrambi i dati, si individuino per ciascun alimento delle opportune classi di consumo pro-capite e si costruisca la distribuzione di frequenza congiunta per i due caratteri.

Page 41: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di posizione 3.1 Introduzione

Il presente capitolo e il successivo riguardano elaborazioni di dati relativi a caratteri quantitativi rappresentati mediante variabili statistiche. L’obiettivo è mettere in evidenza le principali caratteristiche della loro distribuzione.

Le rappresentazioni delle distribuzioni di frequenza, mediante tabella o istogramma, forniscono un’informazione molto dettagliata sui dati. Tuttavia vi sono circostanze nelle quali è necessario sintetizzare gli aspetti essenziali della distribuzione mediante pochi valori. Ivi, assumono particolare rilevanza gli indici di posizione e di variabilità.

In particolare gli indici di posizione costituiscono dei valori rappresentativi intorno ai quali si distribuiscono le osservazioni. Essi indicano qual è l’ordine di grandezza dei dati e forniscono informazioni sul centro della distribuzione. 3.2 La media 3.2.1 Definizione di media

Sia X una variabile statistica che assume n valori, 1 2 nx , x , , x… , la media (aritmetica) è data da

Page 42: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 28

(3.1) ( )1 21

1 1 n

n ii

x x x x xn n =

= + + ⋅⋅⋅+ = ∑ .

Esempio 3.1. Uno studente di liceo, nel corso dell’anno ha svolto

sei compiti di matematica nei quali ha ottenuto i seguenti voti (6, 7½, 5½, 7, 7½, 6½). In questo caso 6n = e applicando la (3.1) si ottiene la media dei voti in matematica

( )1 406.0 7.5 5.5 7.0 7.5 6.5 6.676 6

x = + + + + + = = .

Se il docente arrotonda la media, lo studente avrà 7 in pagella.

Qualora sia disponibile la distribuzione di frequenza dei dati, il calcolo della media può essere abbreviato. Se X assume i valori

1 2 kx , x , , x… con frequenze 1 2 kn , n , , n… , la media è data da

(3.2) 1

1 k

i ii

x x nn =

= ∑ .

Nella (3.2), ciascuna osservazione è ponderata per la frequenza corrispondente.

Esempio 3.2. Si considerino gli anni impiegati per laurearsi da 187 studenti che hanno conseguito il titolo presso la Facoltà di Economia dell’Università degli Studi del Sannio, a partire dal 1995 fino al mese di marzo 1999. La distribuzione di frequenza è riportata nella tabella 3.1.

Tabella 3.1 – Anni impiegati per laurearsi. xi ni xi ni 4 2 8 46 5 21 9 7 6 51 11 1 7 58 15 1

Page 43: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di posizione 29

La media è data da

( )1 4 2 5 21 6 51 7 58 8 46 9 7 11 1 15 1 6.86.187

x = × + × + × + × + × + × + × + × =

Per laurearsi gli studenti hanno impiegato in media circa 6 anni, 10 mesi e 10 giorni.

Ricordando che la frequenza relativa è data da /i if n n= , la media può anche essere calcolata nel modo seguente

(3.3) 1

k

i ii

x x f=

=∑ .

Esempio 3.2 (continuazione). Riprendendo i dati dell’esempio 3.2 e calcolando le frequenze relative si ottiene la distribuzione riportata nella tabella 3.2.

Tabella 3.2 – Anni impiegati per laurearsi.

xi fi xi fi 4 0.0107 8 0.2460 5 0.1123 9 0.0374 6 0.2727 11 0.00535 7 0.3102 15 0.00535

Applicando la (3.3) per il calcolo della media, si ha

4 0.0107 5 0.1123 6 0.2727 7 0.3102 8 0.24609 0.0374 11 0.00535 15 0.00535 6.86.

x = × + × + × + × + ×+ × + × + × =

Se i dati sono forniti già raggruppati in classi non è possibile calcolare il valore esatto della media, perché manca l’informazione sulla loro distribuzione all’interno della classe. E’ possibile però calcolare un valore approssimato della media. Per ogni classe si calcola il valore centrale, che costituisce un valore rappresentativo della classe. Un’approssimazione della media si ottiene come media dei valori

Page 44: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 30

centrali delle classi ponderati per le frequenze corrispondenti. La qualità del risultato dipende dalle modalità con le quali i dati sono stati suddivisi in classi e, in particolare, dalla rappresentatività dei valori centrali delle classi.

Si supponga che la variabile statistica X assuma valori nella classe ( )0 1x x− con frequenza 1n , nella classe ( )1 2x x− con frequenza 2n , e così via fino all’ultima classe ( )1k kx x− − alla quale corrisponde la frequenza kn . I valori centrali delle classi ix si ottengono come semi-somma degli estremi

0 1 11 21 2, , ,

2 2 2k k

kx x x xx xx x x −+ ++

= = ⋅⋅⋅ = .

L’approssimazione della media per dati raggruppati in classi è calcolata nel modo seguente

(3.4) 1 1

1 k k

i i i ii i

x x n x fn = =

=∑ ∑ .

Esempio 3.3. La tabella 2.5 riporta la distribuzione in classi dei

rendimenti di 80 fondi bilanciati moderati italiani. I calcoli per la media sono riportati nella tabella 3.3. Si ha 226.5i ix n =∑ , sicché applicando la (3.4) si ottiene

226.5 2.83180

x = .

Tabella 3.3 – Calcolo della media per i rendimenti dei fondi. Classi ix in i ix n

-1.0 |– 1.0 0.0 9 0.0 1.0 |– 2.0 1.5 23 34.5 2.0 |– 3.0 2.5 24 60.0 3.0 |– 4.0 3.5 8 28.0 4.0 |– 6.0 5.0 9 45.0 6.0 |– 8.0 7.0 3 21.0 8.0 |– 10.0 9.0 3 27.0 10.0 |– 12.0 11.0 1 11.0

Totale 80 226.5

Page 45: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di posizione 31

Questo valore costituisce una buona approssimazione della media effettiva, calcolata sui dati non raggruppati in classi, che risulta 2.834. 3.2.2 Proprietà della media

La media gode delle quattro proprietà enunciate nel seguito. Proprietà 1. Si consideri una trasformazione lineare Y aX b= +

di X; a ogni valore ix di X corrisponde il valore i iy ax b= + di Y. La media y di Y è data dalla trasformazione lineare della media di X

y ax b= + . Infatti

1 1 1 1

1 1 1 1( )k k k k

i i i i i i ii i i i

nx

y y n ax b n a x n b n ax bn n n n= = = =

==

= = + = + = +∑ ∑ ∑ ∑ .

Questa proprietà è particolarmente utile quando si operano dei cambiamenti nell’unità di misura. Ad esempio, dati inizialmente misurati in centimetri sono successivamente trasformati in metri, o temperature inizialmente espresse in gradi centigradi sono successivamente convertite in gradi Fahrenheit.

Proprietà 2. La media è quel valore che sostituito a ogni osservazione lascia invariata la loro somma, ossia

1

k

i ii

nx x n=

= ∑ .

Questa proprietà è un’immediata conseguenza della (3.2).

Proprietà 3. La somma degli scarti ix x− dalla media è nulla. Infatti

Page 46: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 32

( )1 1 1

0k k k

i i i i ii i i

nnx

x x n x n x n nx nx= = =

==

− = − = − =∑ ∑ ∑ .

Proprietà 4. La media è quel valore che minimizza la somma dei

quadrati degli scarti, ossia

( ) ( )2 2

1 1

k k

i i i ii i

x x n min x nα

α= =

− = −∑ ∑ .

Questa proprietà si dimostra nel modo seguente

( ) ( ) ( )

( ) ( ) ( )( )

( ) ( ) ( )( )

( ) ( ) ( ) ( )

( ) ( )

22

1 1

2 2

1

2 2

1 1 1

2 2

1 1 1

0

2 2

1

2

2

2

.

k k

i i i ii i

k

i i iik k k

i i i i ii i ik k k

i i i i ii i i

n

k

i ii

x n x x x n

x x x x x x n

x x n x n x x x n

x x n x n x x x n

x x n n x

α α

α α

α α

α α

α

= =

=

= = =

= = =

= =

=

− = − + −⎡ ⎤⎣ ⎦

⎡ ⎤= − + − + − −⎣ ⎦

= − + − + − −

= − + − + − −

= − + −

∑ ∑

∑ ∑ ∑

∑ ∑ ∑

Poiché il secondo addendo ( )2n x α− è non-negativo, la somma dei quadrati degli scarti da una qualsiasi costante α , diversa da x , è maggiore della somma dei quadrati degli scarti dalla media.

Si ricorda che un indice di posizione costituisce un valore rappresentativo che dà informazioni sul centro della distribuzione. E’ auspicabile quindi che i dati siano il più possibile vicini a esso. Pertanto, definita una misura di distanza ( , )d x α dei dati da un indice di posizione α , l’obiettivo è determinare α in modo da minimizzare la somma delle distanze. Se la distanza è data dagli scarti al quadrato

Page 47: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di posizione 33

2( , ) ( )d x xα α= − , la media è l’indice di posizione che minimizza la somma delle distanze. 3.3 La mediana

3.3.1 Definizione di mediana

La mediana è il valore centrale di una distribuzione, ossia quel valore che divide i dati ordinati in due parti di eguale numerosità.

Per calcolare la mediana è necessario, in via preliminare, ordinare i dati. Per distinguerle dai dati originari, le osservazioni ordinate si indicano con ( )ix , dove

(1) (2) ( )nx x x≤ ≤⋅⋅⋅≤ .

Quindi si calcola la profondità della mediana, cioè la sua posizione, data da

1( )2

nprof med += .

Se n è dispari, la profondità della mediana è un numero intero e la mediana coincide con l’osservazione che occupa la posizione ( )1 / 2n + nei dati ordinati

12

nmed x +⎛ ⎞⎜ ⎟⎝ ⎠

= .

Ad esempio, avendo i 5 dati seguenti (4, 7, 12, 23, 61), la profondità della mediana è ( )5 1 2 3/+ = sicché la mediana è la terza osservazione, cioè 12.

Se n è pari, la profondità della mediana non è un numero intero e la mediana si ottiene come media delle osservazioni che occupano la posizione / 2n e la posizione / 2 1n + ,

( ) ( )/ 2 / 2 1

2n nx x

med ++= .

Page 48: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 34

Ad esempio, avendo le 6 osservazioni seguenti (5, 7, 12, 22, 36, 61), la profondità della mediana è ( )6 1 2 3 5/ .+ = e la mediana è data dalla media della terza e della quarta osservazione, cioè

( )12 22 / 2 17med = + = .

Esempio 3.4. Si considerino i consumi pro-capite di cereali dei paesi europei negli anni 1992-93, riportati nella tabella 2.10. I dati ordinati sono (58, 64, 68, 70, 71, 71, 72, 74, 76, 78, 87, 103, 121). In questo caso 13n = , sicché la profondità della mediana è ( )13 1 2 7/+ = e la mediana è 72. La media di questi dati è 77.92 ed è più grande della mediana perché risente maggiormente delle osservazioni estreme relative a Italia e Grecia.

Esempio 3.5. Si considerino i consumi pro-capite di carne dei

paesi europei negli anni 1992-93, riportati nella tabella 2.10. I dati ordinati sono (55, 61, 62, 66, 68, 75, 85, 86, 88, 91, 97, 107, 152, 231, 299, 329). Poiché 16n = è pari, la profondità della mediana, data da ( )16 1 2 8 5/ .+ = , non è un numero intero. La mediana si ottiene quindi come media dell’ottava e della nona osservazione,

( )86 88 / 2 87med = + = . La media degli stessi dati è 122 e risulta molto più elevata della mediana a causa dei dati relativi alla Danimarca, all’Irlanda e ai Paesi Bassi, paesi con un consumo di carne notevolmente maggiore rispetto agli altri.

3.3.2 Proprietà della mediana

La mediana gode delle tre proprietà seguenti.

Proprietà 1. Sia Y una trasformazione lineare di X, Y aX b= + . La mediana di Y è la trasformazione lineare della mediana di X

( ) ( )med Y a med X b= + .

Page 49: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di posizione 35

Proprietà 2. Siano 1 2, , , nx med x med x med− − −… gli scarti dalla mediana. Il numero di scarti positivi è uguale al numero di scarti negativi.

Proprietà 3. La mediana è quel valore che minimizza la somma degli scarti in valore assoluto, ossia

1 1

n n

i ii i

x med min xα

α= =

− = −∑ ∑ .

In precedenza è stato osservato che la media è l’indice di posizione che minimizza la somma degli scarti al quadrato. La terza proprietà della mediana è analoga alla quarta proprietà della media e può essere interpretata nel modo seguente. Se si pone come obiettivo la scelta di un indice di posizione che minimizzi la somma delle distanze e le distanze sono date dagli scarti in valore assoluto, ( , ) | |d x xα α= − , l’indice di posizione ottimale è la mediana.

Esiste anche un’altra importante differenza fra la media e la mediana, come si evince dagli esempi 4 e 5. A differenza della media, la mediana non è sensibile alla presenza di osservazioni anomale. Tali osservazioni sono costituite da valori distanti dalla maggioranza degli altri dati. La loro origine può essere dovuta a errori grossolani, avvenuti nel momento della rilevazione o trascrizione dei dati, o a fenomeni peculiari che interessano poche unità. Comunque, qualsiasi sia la loro origine, è importante che il loro effetto non sia tale da rendere poco significativo l’indice di posizione. La diversa sensibilità della media e della mediana rispetto ai valori anomali può essere resa chiara mediante un esempio. Si considerino i 5 dati seguenti (1, 2, 3, 4, 5). La media e la mediana coincidono e sono uguali a 3. Si supponga che, per un errore di digitazione, al posto di 5 venga immesso 50. La mediana rimane invariata mentre la media diventa 12, un valore molto distante dalla maggioranza dei dati e difficilmente interpretabile come valore tipico. La media ha perso di rappresentatività. La mediana invece sarebbe

Page 50: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 36

rimasta la stessa anche se fosse stato digitato 500 oppure 5000. Essa non è sensibile rispetto a ciò che accade nelle estremità della distribuzione e quindi è resistente rispetto alla presenza di valori anomali. 3.4 La moda La moda di una variabile statistica X, che assume valori 1x , 2x , …, kx , con frequenze 1n , 2n , …, kn , è il valore di X al quale corrisponde la massima frequenza.

Esempio 3.6. Si considerino i dati sugli anni impiegati per laurearsi dell’esempio 3.2, riportati nella tabella 3.1. La frequenza massima ( 58in = ) corrisponde al valore 7 che pertanto risulta essere la moda della distribuzione.

La moda può essere calcolata anche per distribuzioni di frequenza

di dati qualitativi. Se un carattere qualitativo assume le modalità 1 2, , ..., km m m , con frequenze 1n , 2n , …, kn , la moda è la modalità cui

corrisponde la massima frequenza. Esempio 3.7. La tabella 3.4 riporta la frequenza dei telespettatori

delle emittenti diffuse sul territorio nazionale nel giorno 3 marzo 2003, nella fascia oraria 20:30-23:00 (dati disponibili sul sito web www.bilink.it).

Le modalità sono costituite dalle emittenti, a ciascuna di esse è associata la frequenza dei telespettatori. La moda è la modalità “RAI 1”, cui corrisponde la massima frequenza, pari a 7⋅873 migliaia di telespettatori.

Page 51: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di posizione 37

Tabella 3.4 – Telespettatori (in migliaia) delle emittenti televisive. Emittente Telespettatori

RAI 1 7⋅873 RAI 2 2⋅377 RAI 3 2⋅664 Canale 5 7⋅665 Rete 4 2⋅007 Italia 1 3⋅162 La Sette 910 Altre emittenti terrestri 1⋅857 Altre emittenti satellite 687

3.5 Esercizi

Esercizio 3.1. La tabella 2.3.a riporta la distribuzione di frequenza della durata delle batterie, in ore di conversazione, di 20 telefoni cellulari. Calcolare la media, la mediana e la moda.

Esercizio 3.2. La tabella 2.15 riporta le gradazioni alcoliche di

alcuni vini rossi DOC prodotti nella provincia di Benevento. Calcolare la media, la mediana e la moda.

Esercizio 3.3. La tabella 3.5 riporta le gradazioni alcoliche di alcune birre prodotte in Italia (fonte: sito web www.gamberorosso.it). Costruire la distribuzione di frequenza e quindi calcolare la media, la mediana e la moda.

Esercizio 3.4. La tabella 2.9 riporta la distribuzione della spesa

mensile per la benzina, in euro, di 100 famiglie. Calcolare la media. Esercizio 3.5. La tabella 2.16 riporta la distribuzione degli

investimenti in titoli azionari on-line, in migliaia di euro, di 49 dirigenti di azienda. Calcolare la media.

Page 52: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 38

Tabella 3.5 – Gradazioni alcoliche di alcune birre prodotte in Italia.

Birra Gradazione alcolica Birra Gradazione

alcolica Baffo D’oro 4.8 La Rossa Moretti 7.2 Bock 1877 6.5 Menabrea 150 Anni 5.0 Bock Rossa 6.5 Menabrea Lager 4.8 Castello 5.0 Moretti Pills 4.6 Crystall 5.6 Nastro Azzurro 5.2 Dreher 4.7 Peroni 4.7 Forst Kronen 5.2 Raffo 4.7 Forst Pills 5.0 Sans Souci 5.6 Forst Premium 4.8 Splugen 4.5 Forst Sixtus 6.5 Von Wunster 4.5 Itala Pilsen 4.7 Wührer 4.7

Esercizio 3.6. La tabella 2.17 riporta la distribuzione dei depositi in conto corrente, in migliaia di euro, di 100 famiglie. Calcolare la media.

Esercizio 3.7. La tabella 2.18 riporta la distribuzione della durata,

in centinaia di ore, di 120 lampadine da 100 Watt. Calcolare la media. Esercizio 3.8. La tabella 3.6 riporta la distribuzione del numero di

dipendenti di 200 aziende di piccola e media dimensione. Costruire l’istogramma e calcolare il numero medio di dipendenti.

Tabella 3.6 – Numero di dipendenti di un campione di 200 aziende di piccola e

media dimensione.

Numero di dipendenti Numero di aziende 0 |–10 80 10 |– 20 50 20 |– 30 40 30 |– 50 30

Esercizio 3.9. La tabella 3.7 riporta la distribuzione delle quantità esatte di liquido, in millilitri, contenute in 100 bottiglie da due litri. Costruire l’istogramma e calcolare il contenuto medio.

Page 53: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di posizione 39

Tabella 3.7 – Contenuto di liquido in un campione di 100 bottiglie da due litri. Millilitri Numero di bottiglie

1⋅850 |– 1⋅950 12 1⋅950 |– 2⋅000 36 2⋅000 |– 2⋅050 38 2⋅050 |– 2⋅150 14

Esercizio 3.10. La tabella 2.7 riporta le distribuzioni di frequenza

dei voti di laurea degli studenti, di sesso femminile e maschile, laureati in Economia presso l’Università degli Studi del Sannio. Calcolare le medie delle due distribuzioni e confrontarle.

Esercizio 3.11. Calcolare la media e la mediana dei consumi pro-capite di patate nei paesi europei negli anni 1992-93, riportati nella tabella 2.10.

Esercizio 3.12. Calcolare la media e la mediana dei consumi pro-

capite di latte e latticini nei paesi europei negli anni 1992-93, riportati nella tabella 2.10.

Esercizio 3.13. Calcolare la media e la mediana dei consumi pro-

capite di vino nei paesi europei negli anni 1992-93, riportati nella tabella 2.10.

Page 54: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 55: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di variabilità

4.1 Introduzione

Gli indici di posizione forniscono informazioni sul centro della distribuzione e operano una sintesi fondamentale dei dati. Tuttavia la loro rappresentatività quali valori tipici dipende, in modo rilevante, dalla minore o maggiore dispersione dei dati intorno a essi. Un indice di posizione è tanto più rappresentativo quanto più le osservazioni sono concentrate intorno al suo valore. Pertanto la sintesi dei dati è completa soltanto se la costruzione di un indice di posizione è accompagnata da una misura della dispersione della distribuzione intorno a esso.

Si considerino due investimenti alternativi che negli ultimi periodi hanno realizzato lo stesso rendimento medio del 10%, ma i rendimenti del primo hanno subito notevoli oscillazioni variando fra il 2% e il 17%, mentre quelli del secondo sono variati fra il 7.5% e il 12%. Per il secondo investimento il rendimento medio ha una maggiore rappresentatività, perché i rendimenti effettivi non si discostano di molto. Malgrado lo stesso rendimento medio, è indubbio che il primo investimento risulta più rischioso a causa di una maggiore volatilità. Limitando l’analisi dei rendimenti al valore medio non è possibile evidenziare la diversa rischiosità. Questa informazione è necessariamente dedotta da un indice di variabilità.

Lo studio della variabilità è importante anche prescindendo dal riferimento a un indice di posizione. La variabilità è infatti l’attitudine delle osservazioni a essere diverse l’una dall’altra. Si considerino due

Page 56: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 42

insiemi di dati, il primo costituito da (5, 7, 12, 22, 29, 31) e il secondo costituito da (1, 8, 25, 39, 48, 65). Nel secondo insieme vi è maggiore diversità fra le osservazioni, cioè più variabilità. E’ evidente la necessità di definire degli indici per differenziare queste due situazioni.

I voti conseguiti dagli studenti di un corso post-laurea nell’esame di Algebra e nell’esame di Calcolo delle Probabilità sono riportati nella tabella 4.1. Nelle valutazioni dei due docenti vi è una diversità sostanziale: il secondo docente ha utilizzato i voti dal 20 al 30, mentre il primo ha utilizzato soltanto tre voti operando una minore differenziazione. La variabilità, in questo caso, indica una maggiore attenzione nella valutazione degli studenti. Ciò può essere messo in evidenza mediante un indice di variabilità.

Tabella 4.1 – Voti in alcuni insegnamenti di un corso post-laurea. Studente Matematica Algebra Probabilità Inferenza

A 25 24 28 24 B 23 24 24 25 C 25 24 30 27 D 25 24 27 23 E 28 27 26 28 F 28 24 26 24 G 26 24 26 28 H 25 24 25 26 I 26 27 27 25 L 22 21 25 21 M 26 27 23 26 N 22 21 20 20 O 20 24 25 24 P 27 24 30 25

4.2 La varianza

4.2.1 Definizione di varianza

La varianza è il più importante indice di variabilità e, al tempo stesso, di dispersione intorno alla media. Sia X una variabile statistica che assume i valori 1 2 nx ,x , ,x… e ha media x , la varianza è data da

Page 57: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di variabilità 43

(4.1) ( )22

1

1 n

ii

s x xn =

= −∑ .

La varianza indica qual è la concentrazione dei dati intorno alla media, fornendo informazioni sull’ordine di grandezza degli scarti

ix x− delle osservazioni dalla media. Poiché la somma degli scarti è nulla − scarti positivi e scarti negativi si compensano (proprietà 3 della media, paragrafo 3.2.2) − la loro media non dà informazioni sulla dispersione dei dati intorno a x . Per avere un indice che esprima l’ordine di grandezza degli scarti è necessario neutralizzare il segno. Pertanto la varianza è calcolata come media degli scarti al quadrato.

Si ricordi che la media è l’indice di posizione che minimizza la somma delle distanze quando le distanze sono costituite dagli scarti al quadrato. La varianza misura la distanza media delle osservazioni da x .

Definita con

( )2

21

1 n

ii

x xn =

= ∑

la media dei quadrati delle osservazioni, la varianza può anche essere calcolata nel modo seguente

(4.2) ( )2 2

2s x x= − ,

cioè come differenza fra la media dei quadrati delle ix e il quadrato della media. Infatti

( ) ( )

( )

( ) ( )

22

22 2 2

1 1

2 2

1 1 1

2 2 22 2

1 1 2

1 1 12

2 .

n n

i i ii i

n n n

i ii i i

x x nx

s x x x x x xn n

x x x xn n n

x x x x x

= =

= = =

= = =

= − = − +

= − +

= − + = −

∑ ∑

∑ ∑ ∑

Page 58: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 44

La varianza può risultare difficilmente interpretabile perché, essendo la media dei quadrati degli scarti, è espressa in un’unità di misura diversa da quella del fenomeno oggetto di studio. Al fine di ottenere un indice di variabilità espresso nella stessa unità di misura si considera lo scarto quadratico medio s , ossia la radice della varianza presa con segno positivo, 2s s= .

Esempio 4.1. Si considerino le seguenti osservazioni (1, 2, 5, 6, 7, 9) con media 5. La varianza può essere calcolata applicando la (4.1) nel modo seguente

2 2 2 2 2 2 21 (1 5) (2 5) (5 5) (6 5) (7 5) (9 5) 7.676

s = − + − + − + − + − + − = .

In alternativa, si può applicare la (4.2). Inizialmente si calcola la media dei quadrati delle osservazioni,

( ) ( )2 2 2 2 2 22

1 1 2 5 6 7 9 32.676

x = + + + + + = ,

quindi applicando la (4.2) si ottiene 2 232.67 5 7.67s = − = . Lo scarto quadratico medio è dato da 7.67 2.77s = = .

Qualora sia disponibile la distribuzione di frequenza, il calcolo della varianza può essere abbreviato. Se X assume i valori 1 2 kx ,x , ,x… con frequenze 1 2 kn ,n , ,n… , si ha

(4.3) ( )22

1

1 k

i ii

s x x nn =

= −∑ .

Sviluppi analoghi a quelli visti in precedenza per la (4.2) dimostrano che la varianza può anche essere calcolata con la formula

(4.4) ( )2 2

2s x x= − ,

dove la media dei quadrati per distribuzioni di frequenze è data da

Page 59: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di variabilità 45

( )2

21

1 k

i ii

x x nn =

= ∑ .

Esempio 4.2. Si considerino i dati, riportati nella tabella 4.1, relativi ai voti in Algebra e Calcolo delle Probabilità. Si indichi con X la variabile che descrive i voti in Algebra; essa ha media 24.21x = . I calcoli per la varianza mediante la (4.3) sono riportati nella tabella 4.2. Si ha ( )2 44.3574i ix x n− =∑ , pertanto la varianza è 2 44.3574 /14Xs =

3.17= e lo scarto quadratico medio risulta 1.78Xs = . Tabella 4.2 – Calcolo della varianza dei voti in Algebra.

ix in ix x− ( )2

ix x− ( )2

i ix x n− 21 2 -3.21 10.3041 20.6082 24 9 -0.21 0.0441 0.3969 27 3 2.79 7.7841 23.3523

Totale 14 44.3574 Sia Y la variabile che descrive i voti in Calcolo delle Probabilità;

la media è 25.86y = . La tabella 4.3 riporta i calcoli per la media dei quadrati.

Tabella 4.3 – Calcolo della media dei quadrati dei voti in Calcolo delle

Probabilità.

iy in 2

iy 2

i iy n 20 1 400 400 23 1 529 529 24 1 576 576 25 3 625 1⋅875 26 3 676 2⋅028 27 2 729 1⋅458 28 1 784 784 30 2 900 1⋅800

Totale 14 9⋅450 La somma dei quadrati delle osservazioni iy risulta

2 9 450i iy n ⋅=∑ , pertanto si ha ( )2 9 450 /14 675y ⋅= = . Applicando la

Page 60: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 46

(4.4) si ottiene 2 2675 25.86 6.26Ys = − = e 2.50Ys = . Lo scarto quadratico medio dei voti in Calcolo delle Probabilità è maggiore di quello dei voti in Algebra.

Se è disponibile la distribuzione di frequenze relative il calcolo

della varianza può essere ulteriormente abbreviato. Infatti sostituendo /i if n n= nelle (4.3) e (4.4) si ottiene

(4.5) ( ) ( )22 2

21

k

i ii

x xs x f x=

= − = −∑ ,

dove ( )2

21

k

i ii

x x f=

= ∑ .

Quando i dati sono raggruppati in classi, analogamente a quanto avviene per la media, non è possibile calcolare il valore esatto della varianza. Tuttavia è possibile ottenere un’approssimazione utilizzando, come per la media, il valore centrale quale valore rappresentativo della classe.

Se la variabile statistica X è distribuita in k classi, con valori centrali 1 2, , ... , kx x x e frequenze 1 2 kn ,n , ,n… , un’approssimazione della varianza è data da

(4.6) ( )22

1

1 k

i ii

xs x nn =

−∑

(4.7) 2 2

1

1 k

i ii

xx nn =

= −∑ .

Esempio 4.3. Si considerino i rendimenti dei fondi bilanciati

moderati italiani dell’esempio 3.3. L’approssimazione della media ottenuta dai dati raggruppati in classi è 2.83. I calcoli per la varianza mediante la (4.6) sono sintetizzati nella tabella 4.4. Essa è data da

2 395.56 / 80 4.94s = , sicché lo scarto quadratico medio risulta 2.22.

Page 61: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di variabilità 47

Tabella 4.4 – Calcolo della varianza per i rendimenti dei fondi mediante la (4.6).

Classi ix in ix x− ( )2

ix x− ( )2

i ix x n− -1.0 |– 1.0 0.0 9 -2.83 8.01 72.09 1.0 |– 2.0 1.5 23 -1.33 1.77 40.71 2.0 |– 3.0 2.5 24 -0.33 0.11 2.64 3.0 |– 4.0 3.5 8 0.67 0.45 3.60 4.0 |– 6.0 5.0 9 2.17 4.71 42.39 6.0 |– 8.0 7.0 3 4.17 17.39 52.17 8.0 |– 10.0 9.0 3 6.17 38.07 114.21 10.0 |– 12.0 11.0 1 8.17 67.75 67.75

Totale 80 395.56

In alternativa, i calcoli per la media dei quadrati sono riportati nella tabella 4.5; essa è data da ( )

22 1035.75 / 80 12.95i ix x n n ⋅= =∑ .

Applicando la (4.7) si ottiene 2 212.95 2.83 4.94s − = . Tabella 4.5 – Calcolo della media dei quadrati dei rendimenti dei fondi.

Classi ix in 2

ix 2

i ix n -1.0 |– 1.0 0.0 9 0.00 0.00 1.0 |– 2.0 1.5 23 2.25 51.75 2.0 |– 3.0 2.5 24 6.25 150.00 3.0 |– 4.0 3.5 8 12.25 98.00 4.0 |– 6.0 5.0 9 25.00 225.00 6.0 |– 8.0 7.0 3 49.00 147.00 8.0 |– 10.0 9.0 3 81.00 243.00 10.0 |– 12.0 11.0 1 121.00 121.00

Totale 80 1⋅035.75 4.2.2 Proprietà della varianza

La disuguaglianza di Chebyshev motiva ulteriormente il ricorso alla varianza come indice di dispersione intorno alla media. Sia X una variabile statistica con media x e varianza 2s ; è possibile dimostrare che

Page 62: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 48

( )2

21xsfr X εε

− < ≥ − ,

dove ( )xfr X ε− < è la frequenza relativa con la quale X assume valori nell’intervallo ( ),x xε ε− + . La disuguaglianza di Chebyshev afferma che una qualsiasi variabile X assume valori in un intorno della media, di semi-ampiezza ε , con frequenza relativa almeno pari a

2 21 /s ε− . La disuguaglianza di Chebyshev fornisce un limite inferiore per la

frequenza. Quando la varianza diminuisce questo limite aumenta; ma se aumenta la frequenza con la quale X assume valori intorno a x , ciò significa che la distribuzione è più concentrata intorno alla sua media. Viceversa, quando la varianza aumenta si riduce il limite della frequenza con la quale X assume valori intorno a x e la distribuzione presenta una maggiore dispersione.

Esempio 4.4. La tabella 4.6 riporta i tempi, in minuti, impiegati dagli operatori di un call center per assistere i clienti. La media è 3.5 e la varianza è 1.02. La disuguaglianza di Chebyshev consente di calcolare un limite inferiore per la frequenza relativa con la quale il tempo delle telefonate è compreso fra 1.5 minuti e 5.5 minuti.

Tabella 4.6 – Tempo impiegato dagli operatori di un call center per assistere i clienti. 1.32 1.65 1.67 1.73 1.78 2.08 2.16 2.19 2.21 2.34 2.42 2.63 2.64 2.74 2.82 2.95 2.97 2.98 3.06 3.09 3.11 3.16 3.25 3.28 3.32 3.34 3.36 3.39 3.42 3.42 3.45 3.47 3.49 3.62 3.63 3.76 3.77 3.90 3.96 4.06 4.11 4.19 4.20 4.21 4.28 4.32 4.46 4.54 4.56 4.56 4.61 4.63 4.70 4.74 4.77 4.77 4.92 5.12 5.24 5.51

Si indichi con X la variabile che descrive i tempi impiegati per

assistere i clienti; si ha 3.5x = e 2 1.02s = . L’intervallo di tempo considerato corrisponde a un intorno della media di semi-ampiezza

2ε = . Applicando la disuguaglianza di Chebyshev, si ottiene

Page 63: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di variabilità 49

( ) ( ) 1.021.5 5.5 2 1 0.7454

fr X fr X x< < = − < ≥ − = .

Almeno il 74.5% dei clienti è assistito in un tempo compreso fra 1.5 minuti e 5.5 minuti.

Un’altra proprietà della varianza è la seguente. Sia 2

Xs la varianza di una variabile X, la varianza di una trasformazione lineare Y aX b= + è data da

(4.8) 2 2 2 2Y aX b Xs s a s+= = .

La varianza è indipendente dalla posizione: se si effettua una traslazione dei dati, aggiungendo a ciascuna osservazione una stessa quantità b, la varianza rimane invariata. Infatti aggiungendo una costante si sposta la distribuzione e la media passa da x a x b+ . Gli scarti dalla media non risultano modificati e pertanto la varianza, che è funzione degli scarti, rimane la stessa. La varianza è invece sensibile a cambiamenti della scala. Infatti se si altera l’unità di misura dei dati, moltiplicandoli per una costante non nulla a, la varianza risulta modificata di conseguenza.

Per dimostrare la (4.8) si consideri

( )22

1

1 k

Y i ii

s y y nn =

= −∑

dove y ax b= + è la media di Y. Sostituendo i iy ax b= + e y si ha

( ) ( )

( )2

2 22

1 1

22 2 2

1

1 1

1 .

X

k k

Y i i i ii i

k

i i Xi

s

s ax b ax b n ax ax nn n

a x x n a sn

= =

=

=

= + − + = −

= − =

∑ ∑

Poiché la varianza e lo scarto quadratico medio dipendono dall’unità di misura e dall’ordine di grandezza dei dati, quando la

Page 64: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 50

variabile assume soltanto valori positivi, può essere conveniente utilizzare il coefficiente di variazione

sCVx

= .

Questo indice non dipende dall’unità di misura e consente di confrontare fenomeni con un diverso ordine di grandezza. Infatti se si opera un cambiamento nella scala, moltiplicando i dati per una costante a positiva, la media risulta ax e lo scarto quadratico medio risulta as , sicché il coefficiente di variazione rimane inalterato.

Esempio 4.4 (continuazione). La media dei tempi impiegati dagli operatori di un call center per assistere i clienti, riportati nella tabella 4.6, è 3.5x = e lo scarto quadratico medio è 1.02 1.01s = = . Pertanto il coefficiente di variazione risulta 1.01/ 3.5 0.29CV = = . 4.3 La mediana degli scarti assoluti dalla mediana

La varianza, fra gli indici di variabilità, è quello che risente maggiormente della presenza di valori anomali. Infatti, essendo calcolata come media dei quadrati degli scarti, ha la stessa sensibilità della media rispetto ai valori anomali.

Un indice di variabilità che non risulta influenzato dai valori anomali è la mediana degli scarti assoluti dalla mediana

(4.9) { }1.483 iMAD mediana x med= − .

L’assenza di sensibilità del MAD (Median Absolute Deviation) ai valori anomali è dovuta al duplice ricorso alla mediana sia come indice di posizione sia come operatore per valutare l’ordine di grandezza degli scarti. La costante 1.483 che compare nella (4.9) rende questo indice confrontabile con lo scarto quadratico medio: se la distribuzione dei

Page 65: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di variabilità 51

dati è simmetrica e non presenta valori anomali, i due indici assumono valori simili1.

Esempio 4.5. Si considerino i dati sui consumi pro-capite di

cereali in alcuni paesi europei negli anni 1992-93, riportati nella tabella 2.10. Le osservazioni ordinate sono (58, 64, 68, 70, 71, 71, 72, 74, 76, 78, 87, 103, 121) e la mediana è 72. I corrispondenti scarti in valore assoluto dalla mediana sono (14, 8, 4, 2, 1, 1, 0, 2, 4, 6, 15, 31, 49). La loro mediana è 4 e di conseguenza si ha 1.483 4 5.932MAD = × = . Lo scarto quadratico medio per gli stessi dati è 16.335s = e risulta di gran lunga maggiore a causa delle osservazioni corrispondenti a Italia e Grecia che sono piuttosto distanti da tutte le altre, come si è avuto modo di osservare negli esempi 2.5 e 3.4.

4.4 La differenza interquartile e il campo di variazione

La differenza interquartile misura la variabilità del 50% dei dati

che si trovano al centro della distribuzione. Per definire questo indice è necessario introdurre i quartili. Essi dividono i dati in quattro parti uguali: il primo quartile Q1 si lascia a sinistra il 25% dei dati, il secondo quartile si lascia a sinistra il 50% dei dati e coincide con la mediana e il terzo quartile si lascia a sinistra il 75% delle osservazioni. Il primo e il terzo quartile possono essere calcolati come mediane della prima e della seconda metà dei dati. Siano ( ) ( ) ( )1 2 nx , x , , x … le osservazioni ordinate. La profondità del primo quartile è data da

( ) [ ]1

( ) 12

prof medprof Q

+= ,

dove [⋅] indica la parte intera. Se la profondità del primo quartile è un numero intero, Q1 è dato dall’osservazione che occupa la posizione 1 La costante 1.483 è scelta in modo tale che se i dati hanno una distribuzione normale (paragrafo 10.1) il MAD e lo scarto quadratico medio coincidono.

Page 66: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 52

corrispondente nella sequenza ordinata; altrimenti il primo quartile è dato da

[ ]( ) [ ]( )1 1( ) ( ) 11 2

prof Q prof Qx xQ ++

= .

Il terzo quartile viene calcolato in maniera speculare a partire dall’ultima osservazione.

La differenza interquartile è data da

3 1DQ Q Q= −

e fornisce indicazioni sulla variabilità della metà centrale dei dati. Poiché nel calcolo della differenza interquartile si trascurano le osservazioni che si trovano nelle estremità della distribuzione, questo indice non risente della presenza di valori anomali.

Esempio 4.6. La tabella 2.10 riporta i dati sui consumi pro-capite di carne in alcuni paesi europei negli anni 1992-93. Le osservazioni ordinate sono (55, 61, 62, 66, 68, 75, 85, 86, 88, 91, 97, 107, 152, 231, 299, 329). Poiché 16n = , la profondità della mediana è 8.5 e la mediana risulta 87. La profondità del primo quartile è

( ) [ ]1

8.5 1 8 1 4.52 2

prof Q+ +

= = = ,

sicché il primo quartile è dato dal valore centrale fra la quarta e la quinta osservazione, ( )1 66 68 / 2 67Q = + = . In maniera speculare il terzo quartile è dato dal valore centrale fra la quarta e la quinta osservazione nella sequenza dei dati ordinati in modo decrescente, cioè

( )3 107 152 / 2 129.5Q = + = . Di conseguenza la distanza interquartile risulta 129.5 67.0 62.5DQ = − = . Lo scarto quadratico medio per gli stessi dati è 83.91 ed è molto maggiore perché risente del consumo particolarmente elevato di carne nei Paesi Bassi, in Irlanda e in Danimarca.

Page 67: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di variabilità 53

Un altro indice di variabilità che talvolta si utilizza è il campo di variazione. Esso è costituito dalla differenza fra la massima e la minima osservazione

( ) (1)nx x− .

Sebbene in alcune circostanze l’informazione relativa al campo di variazione possa suscitare interesse, questo indice risente in maniera eccessiva della presenza di valori anomali in quanto essi sono collocati all’inizio e alla fine dei dati ordinati.

Esempio 4.6 (continuazione). Il minimo valore dei consumi pro-

capite di carne nei paesi europei negli anni 1992-93 (tabella 2.10), corrisponde alla Norvegia ed è (1) 55x = , mentre il massimo valore corrisponde alla Danimarca ed è (16) 329x = . Di conseguenza il campo di variazione risulta 329 55 274− = .

4.5 Esercizi

Esercizio 4.1. La tabella 2.3.a riporta la distribuzione di frequenza della durata delle batterie, in ore di conversazione, di 20 telefoni cellulari. Calcolare la varianza e lo scarto quadratico medio.

Esercizio 4.2. La tabella 2.15 riporta le gradazioni alcoliche di

alcuni vini rossi DOC prodotti nella provincia di Benevento. Calcolare la varianza e lo scarto quadratico medio.

Esercizio 4.3. La tabella 4.1 riporta i voti in Matematica e in

Inferenza di 14 studenti. Calcolare la varianza, lo scarto quadratico medio e il coefficiente di variazione e confrontare i risultati.

Esercizio 4.4. La tabella 2.9 riporta la distribuzione della spesa

mensile per la benzina, in euro, di 100 famiglie. Calcolare lo scarto quadratico medio.

Page 68: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 54

Esercizio 4.5. La tabella 2.16 riporta la distribuzione degli investimenti in titoli azionari on-line, in migliaia di euro, di 49 dirigenti di azienda. Calcolare lo scarto quadratico medio.

Esercizio 4.6. La tabella 2.17 riporta la distribuzione dei depositi

in conto corrente, in migliaia di euro, di 100 famiglie. Calcolare lo scarto quadratico medio.

Esercizio 4.7. La tabella 3.6 riporta la distribuzione del numero di

dipendenti di 200 aziende di piccola e media dimensione. Calcolare lo scarto quadratico medio.

Esercizio 4.8. La tabella 3.7 riporta la distribuzione delle quantità

esatte di liquido contenute in 100 bottiglie da due litri. Calcolare lo scarto quadratico medio e il coefficiente di variazione.

Esercizio 4.9. La tabella 4.7 riporta la distribuzione degli importi

delle fatture, in migliaia di euro, emesse da una tipografia in un mese. Costruire l’istogramma e calcolare media e scarto quadratico medio.

Tabella 4.7 – Distribuzione degli importi delle fatture.

Importo delle fatture Numero di fatture 0 |– 5 22

5 |– 10 45 10 |– 20 37 20 |– 50 18

Esercizio 4.10. La tabella 4.8 riporta la distribuzione del peso

esatto, in grammi, di 100 pacchi di biscotti da 350 grammi. Costruire l’istogramma e calcolare la media, lo scarto quadratico medio e il coefficiente di variazione.

Tabella 4.8 – Distribuzione del peso dei pacchi di biscotti.

Grammi Numero di pacchi 335 |– 345 10 345 |– 350 40 350 |– 355 35 355 |– 365 15

Page 69: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indici di variabilità 55

Esercizio 4.11. La tabella 2.18 riporta la distribuzione della durata, in centinaia di ore, di 120 lampadine da 100 Watt. Calcolare lo scarto quadratico medio e il coefficiente di variazione.

Esercizio 4.12. La tabella 2.7 riporta le distribuzioni di frequenza

relative ai voti di laurea degli studenti, di sesso femminile e maschile, laureati in Economia presso l’Università degli Studi del Sannio. Calcolare gli scarti quadratici medi e i coefficienti di variazione delle due distribuzioni e confrontarli.

Esercizio 4.13. La tabella 3.5 riporta le gradazioni alcoliche di

alcune birre prodotte in Italia. Calcolare lo scarto quadratico medio, la mediana degli scarti assoluti dalla mediana, la differenza interquartile e il campo di variazione.

Esercizio 4.14. La tabella 2.10 riporta i consumi pro-capite di patate nei paesi europei negli anni 1992-93. Calcolare lo scarto quadratico medio, la mediana degli scarti assoluti dalla mediana, la differenza interquartile, il campo di variazione e commentare i risultati.

Esercizio 4.15. La tabella 2.10 riporta i consumi pro-capite di latte e latticini nei paesi europei negli anni 1992-93. Calcolare lo scarto quadratico medio, la mediana degli scarti assoluti dalla mediana, la differenza interquartile, il campo di variazione e commentare i risultati.

Esercizio 4.16. La tabella 2.10 riporta i consumi pro-capite di

vino nei paesi europei negli anni 1992-93. Calcolare lo scarto quadratico medio, la mediana degli scarti assoluti dalla mediana, la differenza interquartile, il campo di variazione e commentare i risultati.

Page 70: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 71: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 5.1 Introduzione

Nel secondo capitolo è stato utilizzato l’istogramma come grafico

utile per visualizzare una distribuzione di frequenza. In questo capitolo si introducono altre forme di rappresentazione grafica dei dati. In particolare si considera il box-plot come strumento per visualizzare le principali caratteristiche di un insieme di dati e confrontare più distribuzioni. Si illustrano, inoltre, altre rappresentazioni grafiche finalizzate alla comunicazione di informazioni rilevanti contenute nei dati.

5.2 Il box-plot

Il box-plot è un grafico che fornisce simultaneamente

informazioni sulla posizione, sulla variabilità e sulla forma della distribuzione di un insieme di dati. Esso è costituito da tre elementi:

1) una linea in corrispondenza della mediana che rappresenta il centro della distribuzione;

Page 72: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 58

2) un rettangolo o scatola (box) che va dal primo al terzo quartile, la cui altezza (costituita dalla differenza interquartile) indica qual è la variabilità della metà centrale dei dati;

3) due segmenti, detti baffi (whiskers), disegnati a partire dal rettangolo, le lunghezze dei quali sono determinate, in assenza di osservazioni anomale, dagli estremi della distribuzione.

Esempio 5.1. Si considerino i voti in matematica riportati nella tabella 4.1. Le osservazioni ordinate sono (20, 22, 22, 23, 25, 25, 25, 25, 26, 26, 26, 27, 28, 28). La mediana è 25, i quartili sono 1 23Q = e

3 26Q = e gli estremi sono ( )1 20x = e ( )14 28x = . Il box-plot corrispondente è illustrato nella figura 5.1.

20

22

24

26

28

Allineando diversi box-plot è possibile confrontare più distribuzioni e rilevare similarità e differenze. La figura 5.2.a illustra i box-plot di distribuzioni con diversi indici di posizione, mentre la figura 5.2.b illustra i box-plot di distribuzioni con diversa variabilità. La figura 5.2.c infine confronta il box-plot di una distribuzione simmetrica (il primo da sinistra) con quelli di distribuzioni asimmetriche. In particolare, il secondo box-plot della figura 5.2.c rappresenta una distribuzione con asimmetria positiva, il terzo una

Figura 5.1 Box-plot

Page 73: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 59

distribuzione con asimmetria negativa e il quarto una distribuzione con asimmetria al centro ma con code simmetriche.

Figura 5.2.a – Box-plot di distribuzioni con diversa posizione.

Figura 5.2.b – Box-plot di distribuzioni con diversa variabilità.

Page 74: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 60

Figura 5.2.c – Box-plot di distribuzioni con diversa asimmetria.

Esempio 5.2. La figura 5.3 riporta i box-plot dei consumi medi giornalieri di energia nel Queensland (Australia). I dati (ottenuti mediante elaborazioni di quelli disponibili sul sito web www.tg.nsw.gov.au) riguardano il consumo complessivo per usi domestici, industriali e commerciali, si riferiscono all’anno 2000 e sono espressi in megawatt. Ciascun box-plot riguarda un giorno della settimana.

Il consumo è molto più elevato nei giorni feriali rispetto ai giorni festivi: nei primi infatti vi è un’elevata componente di consumo per uso industriale e commerciale. Inoltre la variabilità dei consumi nei giorni feriali è pressoché costante e maggiore di quella dei giorni festivi. Per il sabato e la domenica, la mediana dei consumi è molto vicina al primo quartile sicché dal grafico risulta indistinguibile.

Page 75: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 61

Figura 5.3 − Box-plot dei consumi di energia nel Queensland (Australia) nei diversi giorni della settimana, anno 2000.

4000

4500

5000

5500

Lunedì Martedì Mercoledì Giovedì Venerdì Sabato Domenica

5.3 La classificazione delle osservazioni

Il box-plot consente di mettere in evidenza l’eventuale presenza di osservazioni anomale. Si ricorda che un’osservazione anomala è un’osservazione distante dalla maggioranza degli altri dati. Al fine di identificare tali osservazioni è utile definire un intervallo di valori che si ritengono “nella norma”, in modo tale da individuare i dati che non vi rientrano e sono quindi considerati valori anomali.

L’intervallo di valori ritenuti nella norma viene definito recinto interno. Una regola empirica, largamente diffusa, consiste nel considerare come estremo inferiore r1 e come estremo superiore r2 i valori

Page 76: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 62

1 1 2 31.5 , 1.5r Q DQ r Q DQ= − × = + × .

La distanza massima delle osservazioni più piccole dal primo quartile e la distanza massima delle osservazione più grandi dal terzo quartile non devono superare una volta e mezzo la distanza interquartile. Tutte le osservazioni che si trovano nel recinto interno sono considerate nella norma, mentre le osservazioni che si trovano all’esterno dell’intervallo (r1, r2) sono definite osservazioni distanti (outside).

La classificazione delle osservazioni anomale può essere resa più accurata graduando il livello di anomalia. Si definisce perciò un recinto esterno con estremi

1 1 3R Q DQ= − × e 2 3 3R Q DQ= + × .

Tutte le osservazioni che si trovano fuori il recinto esterno sono definite osservazioni molto distanti (far out).

In presenza di osservazioni anomale, i baffi del box-plot partono dai quartili e si fermano in corrispondenza dei valori adiacenti. Questi ultimi coincidono con il massimo e il minimo valore compresi nel recinto interno. Le osservazioni anomale, distanti e molto distanti, sono rappresentate all’esterno del box-plot con simboli diversi.

Esempio 5.3. Si considerino le 10 osservazioni seguenti (–3, 10,

11, 13, 15, 17, 18, 19, 25, 48). La mediana è 16 e i quartili sono 1 11Q = e 3 19Q = . La distanza interquartile è 8DQ = , pertanto l’estremo inferiore del recinto interno è 1 11 1 5 8 1r .= − × = − e l’estremo superiore è 2 19 1 5 8 31r .= + × = . Di conseguenza tutte le osservazioni che si trovano nell’intervallo (–1, 31) sono ritenute nella norma. Il più piccolo valore nel recinto interno è 10 e il massimo valore è 25, pertanto 10 e 25 sono i valori adiacenti. Nel disegnare il box-plot, il baffo inferiore si estende fino a 10 e il baffo superiore fino a 25.

Le osservazioni –3 e 48 sono anomale. Per classificarle si calcola il recinto esterno: l’estremo inferiore è 1 11 3 8R = − × = –13 e l’estremo superiore è 2 19 3 8 43R = + × = . La prima osservazione, –3, si trova all’esterno del recinto interno ma è compresa nel recinto esterno

Page 77: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 63

( )13 43,− ed è quindi classificata come distante. L’ultima osservazione invece si trova fuori il recinto esterno ed è classificata come molto distante. Il box-plot è illustrato nella figura 5.4.

-10

0

10

20

30

40

50 osservazionemolto distante

osservazionedistante

Esempio 5.4. La tabella 2.10 riporta i consumi pro-capite di carne

in alcuni paesi europei, negli anni 1992-93. Le osservazioni ordinate sono (55, 61, 62, 66, 68, 75, 85, 86, 88, 91, 97, 107, 152, 231, 299, 329). La mediana è 87, i quartili risultano 1 67Q = e 3 129 5Q .= e la distanza interquartile è data da 62 5DQ .= . Di conseguenza il recinto interno è ( 26 75 223 25. , .− ). Nella coda sinistra della distribuzione non vi sono valori anomali, pertanto il baffo inferiore del box-plot si estende fino al minimo dato, cioè 55. Le ultime tre osservazioni invece sono anomale. Il valore adiacente superiore è il massimo dato contenuto nel recinto interno, cioè 152, e corrisponde all’estremità del baffo superiore. Per classificare le ultime tre osservazioni si costruisce

Figura 5.4 Box-plot con osservazioni anomale.

Recinto esterno

Recinto interno

Page 78: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 64

il recinto esterno ottenendo ( 120 5 317 0. , .− ). I dati relativi ai Paesi Bassi, 231, e all’Irlanda, 299, sono osservazioni distanti poiché si trovano fuori il recinto interno ma sono comprese nel recinto esterno. Invece l’osservazione corrispondente alla Danimarca, 329, si trova fuori il recinto esterno ed è quindi molto distante. Il box-plot è illustrato nella figura 5.5.

50

100

150

200

250

300

DanimarcaIrlanda

Paesi Bassi

Esempio 5.5. La figura 5.6 illustra i box-plot dei voti del corso post-laurea riportati nella tabella 4.1. Dal grafico si rileva una diversa posizione dei quattro insiemi di dati e soprattutto un’assenza di variabilità nella metà centrale dei voti in Algebra (quartili e mediana coincidono). E’ evidente inoltre che lo studente identificato con la lettera N, in tre corsi, ha conseguito un voto particolarmente basso e ha quindi un comportamento che non è conforme a quello degli altri studenti.

Figura 5.5 Box-plot per i consumi di carne.

Page 79: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 65

Figura 5.6 – Box-plot dei voti.

5.4 Altre rappresentazioni grafiche

La rappresentazione grafica è uno strumento estremamente utile

per l’interpretazione delle informazioni. E’ quindi importante che la scelta del grafico sia appropriata sia alle caratteristiche dei dati sia al messaggio che si intende trasmettere. Fra i diagrammi utilizzati nella statistica, particolare rilievo hanno i grafici a barre, i grafici a torta e i grafici a dispersione.

I grafici a barre consentono di visualizzare in modo efficace l’intensità con la quale un fenomeno quantitativo si manifesta rispetto a diverse unità statistiche.

Esempio 5.6. La rivista Panorama del 4 aprile 2002 ha pubblicato

i dati della tabella 5.1 sui picchi dell’audience, relativi agli spettatori televisivi di sesso femminile, che si sono verificati per i programmi di

E,I,M

N N,L

N 20

22

24

26

28

30

Matematica Algebra Probabilità Inferenza

Page 80: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 66

diverse emittenti nei giorni 18-24 marzo 2002. Il grafico a barre è illustrato nella figura 5.7.

Tabella 5.1 – Picchi dell’audience (in migliaia) per emittente televisiva relativi

agli spettatori di sesso femminile, dal 18 al 24 marzo 2002. Emittente Programma Numero di spettatrici (in migliaia) Rai Uno Commesse 2 4⋅572 Rai Due Tg2 giorno 2⋅613 Rai Tre Mi manda Raitre 2⋅207 Canale 5 Striscia la notizia 5⋅401 Italia Uno Saranno famosi 2⋅842 Rete 4 Al Bano storie d’amore… 1⋅569 La Sette Il processo di Biscardi 318

Figura 5.7 – Grafico a barre − Picchi dell’audience.

5401

4572

2842 26132207

1569

318

Canale 5 Rai Uno Italia 1 Rai Due Rai Tre Rete 4 La Sette

I grafici a torta consentono di visualizzare come la totalità di un

fenomeno si ripartisce, in percentuale, fra le sue componenti. Un grafico a torta è un cerchio suddiviso in settori con archi di lunghezza (o area o angolo) proporzionale a quella della componente che rappresenta. Tutti i settori insieme costituiscono il cerchio. L’obiettivo di questi grafici è illustrare qual è la dimensione delle diverse parti in cui si suddivide il totale.

Page 81: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 67

Esempio 5.7. La figura 5.8 illustra la composizione del fatturato nel settore delle telecomunicazioni (in Italia) in base al tipo di servizio. I dati di riferiscono all’anno 1999 (fonte: Istat).

Figura 5.8 Grafico a torta Fatturato nel settore delle telecomunicazioni nel 1999.

In alternativa al grafico a torta, per visualizzare come un

fenomeno si ripartisce fra le sue componenti si potrebbe considerare una barra rettangolare suddivisa in parti con altezza (o area) proporzionale alla dimensione delle componenti. Questo approccio si rivela particolarmente utile se si vuole visualizzare la ripartizione dello stesso fenomeno in tempi diversi o in aree geografiche diverse, perché le diverse barre possono essere affiancate in un unico grafico.

Si ottiene così un grafico a barre suddivise. Esso consente di mettere in evidenza i mutamenti che un fenomeno subisce nel tempo o in diverse aree geografiche, ridistribuendosi rispetto alle proprie modalità. Esso è costituito da barre rettangolari, ciascuna riferita a un periodo o a un’area geografica identificato dall’etichetta. Tutte le barre hanno la stessa altezza pari a 100, e sono suddivise in modo da evidenziare, in riferimento a ciascuna etichetta, come il fenomeno si ripartisce fra le sue componenti.

Esempio 5.8. La tabella 5.2 riporta la percentuale dei disoccupati

disponibili a lavorare “a qualsiasi condizione” o “a condizioni adeguate”. I dati si riferiscono all’anno 1996 e sono suddivisi per ripartizione geografica (elaborazioni su dati Istat disponibili sul sito

58%

37%

5%

Telefonia fis sa Telefonia mobile Altro

Page 82: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 68

web www.bdp.it). Ogni riga della tabella riporta la distribuzione (in percentuale) del modo nel quale si suddividono i disoccupati nella relativa ripartizione geografica.

Tabella 5.2 – Percentuali dei disoccupati disponibili a lavorare “a qualsiasi

condizione” o “a condizioni adeguate” per diverse aree geografiche. Ripartizione geografica A qualsiasi condizione A condizioni adeguate Totale Nord-Ovest 37.3 62.7 100 Nord-Est 23.8 76.2 100 Centro 38.6 61.4 100 Mezzogiorno 51.1 48.9 100

Il grafico a barre suddivise è illustrato nella figura 5.9. In prevalenza i disoccupati del Nord-Est sono disponibili a lavorare soltanto a condizioni adeguate. Quelli del Nord-Ovest e del Centro hanno un comportamento molto simile. Infine oltre la metà dei disoccupati del Sud e delle Isole sono disposti a lavorare a qualsiasi condizione.

Figura 5.9 – Grafico a barre suddivise – Disponibilità lavorative dei

disoccupati.

62,7% 76,2% 61,4% 48,9%

51,1% 38,6% 23,8%

37,3%

Nord-Ovest Nord-Est Centro Sud e Isole

A qualsiasi condizione A condizioni adeguate

Page 83: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 69

In alternativa al grafico a barre suddivise si sarebbero potuti utilizzare quattro grafici a torta, uno per ogni ripartizione geografica, tuttavia il grafico a barre suddivise fornisce una rappresentazione delle stesse informazioni molto più sintetica.

Esempio 5.9. La figura 5.10 illustra come è cambiata la distribuzione degli occupati nei tre settori dell’economia in Italia dal 1971 al 1991 (fonte: Istat).

Figura 5.10 – Grafico a barre suddivise – Occupati per settore produttivo in

Italia negli anni 1971, 1981 e 1991.

20.1% 13.3% 8.4%

39.5%37.5%

32.0%

40.4% 49.5% 59.6%

1971 1981 1991

Agricoltura Industria Servizi

Il grafico a barre multiple consente di visualizzare come due o

più fenomeni si sono evoluti nel tempo o come mutano rispetto a diverse aree geografiche. Esso è simile al grafico a barre ma, per ogni etichetta, due o più barre forniscono informazioni su due o più fenomeni.

Esempio 5.10. La tabella 5.3 riporta i rendimenti annuali, dal

1999 al 2002, di un fondo obbligazionario italiano che investe nell’area dell’euro in titoli con vita residua sino a cinque anni e i rendimenti medi annuali dei titoli appartenenti alla categoria Morningstar di riferimento, ossia quella dei titoli obbligazionari a breve termine dell’area dell’euro (fonte: sito web www.morningstar.it).

Page 84: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 70

Tabella 5.3 – Rendimenti annuali di un fondo italiano e rendimenti medi dei titoli appartenenti alla categoria Morningstar di riferimento.

Anno Fondo Categoria Morningstar 1999 0.4 1.1 2000 3.5 3.6 2001 4.5 3.0 2002 4.5 3.3

Il grafico a barre multiple è riportato nella figura 5.11. Nei primi

due anni il rendimento del fondo è stato inferiore al rendimento medio della categoria Morningstar di riferimento. Negli anni successivi si è verificata un’inversione di tendenza e il fondo ha prodotto rendimenti superiori alla media della categoria.

Figura 5.11 – Grafico a barre multiple – Rendimenti annuali di un fondo

italiano e rendimenti medi annuali dei titoli appartenenti alla categoria Morningstar di riferimento nel periodo 1999-2002.

0,4

3,5

4,5 4,5

1,1

3,63,0 3,3

1999 2000 2001 2002

Fondo Morningstar

Esempio 5.11. La tabella 5.4 riporta i laureati in Economia presso l’Università degli Studi del Sannio dal 1995 al 1998 suddivisi per sesso.

Tabella 5.4 – Laureati in Economia presso l’Università degli Studi del Sannio. Anno Femmine Maschi Totale 1995 10 4 14 1996 10 6 16 1997 30 22 52 1998 49 28 77

Page 85: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 71

La figura 5.12 riporta i dati in un grafico a barre suddivise con diverse altezze nel quale si evidenzia sia l’incremento del numero di laureati, che si è verificato dal 1995 al 1998, sia il modo nel quale i laureati sono ripartiti rispetto al sesso. Figura 5.12 – Grafico a barre suddivise – Laureati in Economia presso l’Università degli Studi del Sannio dal 1995 al 1998.

Eventuali relazioni fra due variabili possono essere rappresentate

con un grafico a dispersione. Esso è un grafico che usa le coordinate cartesiane per rappresentare i valori di due variabili. I dati sono rappresentati da punti, a ciascuno dei quali corrisponde una coordinata sull’asse orizzontale data dal valore di una variabile e una coordinata sull’asse verticale data dal valore dell’altra variabile. Un grafico a dispersione è uno strumento sintetico per rappresentare dati bivariati, nel quale ciascun punto rappresenta i valori di due variabili rilevati sulla stessa unità statistica.

Il modo con il quale si dispongono i punti può fornire indicazioni su un’eventuale associazione fra le due variabili. In particolare se i punti si dispongono in modo crescente a partire dall’angolo a sinistra in basso del grafico verso l’angolo a destra in alto, ciò suggerisce un’associazione positiva. Se i dati si dispongono in modo decrescente dall’angolo a sinistra in alto del grafico a quello in basso a destra, ciò suggerisce un’associazione negativa. Se i punti si dispongono in

6

22

28

4930

1010 4

1995 1996 1997 1998

MaschiFemmine

Page 86: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 72

maniera casuale ciò indica l’assenza di un’associazione fra le due variabili. L’uso di questi grafici risulterà particolarmente utile per lo studio della correlazione fra variabili (capitolo 17) e per l’analisi esplorativa che precede la costruzione di un modello di regressione (capitolo 18).

Figura 5.13 – Esempi di grafici a dispersione Associazione positiva lineare Associazione negativa lineare

Associazione non-lineare Assenza di associazione

Esempio 5.12. La figura 5.14 illustra il grafico a dispersione del

rendimento in eccesso delle azioni IBM (sulle ordinate) rispetto al rendimento in eccesso di mercato (sulle ascisse), nel periodo gennaio 1978 - dicembre 1987 (fonte: Berndt, 1990, The practice of econometrics, Addison Wesley). I rendimenti in eccesso delle azioni

Page 87: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 73

IBM sono costituiti dalle differenze fra i rendimenti mensili delle azioni IBM e i tassi di rendimento libero da rischio, cioè quelli dei buoni del tesoro statunitensi a 30 giorni. I rendimenti in eccesso del mercato sono dati dalle differenze fra i rendimenti medi mensili delle azioni scambiate nella borsa di New York e i tassi di rendimento libero da rischio.

In questo esempio le variabili sono costituite dai due rendimenti e le unità statistiche sono i mesi nei quali sono effettuate le rilevazioni. E’ evidente una relazione diretta fra i due rendimenti: a valori elevati del rendimento di mercato tendenzialmente corrispondono rendimenti elevati delle azioni IBM.

Figura 5.14 – Grafico a dispersione – Rendimento in eccesso delle azioni IBM

rispetto al rendimento in eccesso della borsa di New York nel periodo gennaio 1978 - dicembre 1987.

Borsa di New York

Azi

oni I

BM

-0.2 -0.1 0.0 0.1-0.2

-0.1

0.0

0.1

Una serie storica è costituita da una serie di osservazioni su un fenomeno di interesse rilevante a intervalli regolari di tempo. Essa può

Page 88: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 74

essere rappresentata su un sistema di assi cartesiani, dove sull’asse delle ascisse è indicato il tempo e sull’asse delle ordinate vi sono i valori osservati.

Esempio 5.13. La figura 5.15 illustra la serie storica delle

quotazioni dell’indice Mibtel nel periodo 12 marzo 2001 - 11 maggio 2001.

Figura 5.15 – Serie storica dell’indice Mibtel nel periodo 12 marzo 2001 - 11

maggio 2001.

26000

27000

28000

03/12/01 03/26/01 04/09/01 04/23/01 05/07/01

Esempio 5.14. La figura 5.16 illustra la serie storica del consumo medio giornaliero di energia nel Queensland (Australia) nei primi due mesi del 2001 (dati disponibili sul sito web www.tg.nsw.gov.au). Dall’analisi del grafico si nota una ciclicità dovuta al susseguirsi delle settimane: il consumo di energia infatti è più elevato nei giorni feriali rispetto a quelli festivi.

Page 89: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 75

Figura 5.16 – Consumo medio giornaliero di energia nel Queensland (Australia) nei mesi di Gennaio e Febbraio 2001.

4500

5000

5500

01/01/01 01/15/01 01/29/01 02/12/01 02/26/01

5.5 Esercizi

Esercizio 5.1. I seguenti dati sono i tempi, in secondi, che 16 operai in una catena di montaggio hanno impiegato per compiere alcune operazioni

59, 72, 89, 70, 87, 63, 72, 51, 130, 85, 89, 93, 63, 69, 98, 67.

Rappresentare i dati mediante box-plot e commentare i risultati.

Esercizio 5.2. La tabella 2.10 riporta i dati relativi ai consumi pro-capite di cereali in alcuni paesi europei negli anni 1992-93. Rappresentare i dati mediante box-plot e commentare i risultati.

Page 90: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 76

Esercizio 5.3. La tabella 2.10 riporta i dati relativi ai consumi pro-capite di patate in alcuni paesi europei negli anni 1992-93. Rappresentare i dati mediante box-plot e commentare i risultati.

Esercizio 5.4. La tabella 2.10 riporta i dati relativi ai consumi pro-

capite di latte e latticini in alcuni paesi europei negli anni 1992-93. Rappresentare i dati mediante box-plot e commentare i risultati.

Esercizio 5.5. La tabella 2.10 riporta i dati relativi ai consumi pro-

capite di vino in alcuni paesi europei negli anni 1992-93. Rappresentare i dati mediante box-plot e commentare i risultati.

Esercizio 5.6. La tabella 2.4 riporta i rendimenti a sei mesi di 80 fondi bilanciati moderati italiani. Rappresentare i dati mediante box-plot e commentare i risultati.

Esercizio 5.7. La tabella 5.5 riporta le ore di lavoro (in migliaia)

perdute per licenziamenti e sospensioni di operai nel 1999 e nel 2000 (fonte: Istat). Confrontare i box-plot e commentare i risultati.

Tabella 5.5 – Ore di lavoro (in migliaia) perdute per licenziamenti e

sospensioni di operai nel 1999 e nel 2000. Gen. Feb. Mar. Apr. Mag. Giu. Lug. Ago. Set. Ott. Nov. Dic.

1999 10 40 7 6 1 6 5 5 20 11 41 35 2000 27 165 143 2 11 25 17 21 28 37 12 15

Esercizio 5.8. La tabella 5.6 riporta i dati pubblicati dalla rivista Panorama, nel numero del 4 aprile 2002, sul prezzo minimo in euro di un chilogrammo di pane in alcune città europee. Rappresentare i dati nel modo più opportuno.

Tabella 5.6 – Prezzo minimo in euro di un chilogrammo di pane nel 2002.

Paese Milano Francoforte Parigi Vienna Dublino Atene Prezzo 2.44 2.20 2.06 1.88 1.14 1.00

Esercizio 5.9. Il quotidiano la Repubblica del 30 marzo 2002 ha

pubblicato i dati, riportati nella tabella 5.7, sulla diffusione dei cellulari in alcuni paesi. Rappresentare i dati nel modo più opportuno.

Page 91: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 77

Tabella 5.7 – Diffusione dei cellulari in alcuni paesi.

Paese Numero di cellulari per ogni 100 abitanti

Lussemburgo 96.7 Taiwan-Cina 96.6 Hong Kong 84.4 Italia 83.9 Islanda 82.0 Israele 80.8 Austria 80.7 Regno Unito 78.3 Finlandia 77.8 Portogallo 77.4

Esercizio 5.10. La tabella 5.8 riporta la composizione delle attività di un fondo del Sanpaolo Imi nel febbraio 2002. Rappresentare i dati nel modo più opportuno e commentare i risultati.

Tabella 5.8 – Composizione delle attività di un fondo del Sanpaolo Imi al febbraio 2002. Attività Percentuale Azioni Europa 47.6 Azioni Usa 35.3 Liquidità 8.9 Azioni Giappone 5.3 Azioni Altri Paesi 2.9

Esercizio 5.11. La tabella 5.9 riporta le ore di lavoro (in migliaia)

perdute per conflitti di lavoro, distinte per causa, nell’anno 2001 (fonte: Istat). Rappresentare i dati mediante diagramma a torta e commentare i risultati.

Tabella 5.9 – Ore di lavoro (in migliaia) perdute per conflitti di lavoro nel 2001. Causa Ore Rinnovo contratto di lavoro 4⋅204 Rivendicazioni salariali 146 Rivendicazioni economico normative 1⋅592 Licenziamenti e sospensione operai 351 Solidarietà 22 Altre cause 723 Estranee al rapporto di lavoro 144

Page 92: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 78

Esercizio 5.12. La tabella 5.10 riporta il costo, in centesimi di euro al minuto, di una chiamata da un telefono fisso con contratto privato Telecom verso un telefono cellulare nell’aprile 2003 (dati disponibili sul sito internet www.cellularitalia.com). Rappresentare graficamente i dati nel modo più opportuno.

Tabella 5.10 – Costo, in centesimi di euro al minuto, di una chiamata da un

telefono fisso con contratto privato Telecom verso un telefono cellulare.

Tariffa Tim Vodafon Omnitel Wind Blu

Giorni feriali 30.91 29.71 35.29 34.67 Giorni festivi e ore serali 15.49 17.64 16.73 17.35

Esercizio 5.13. La tabella 5.11 riporta le quantità, in grammi, di

proteine, lipidi e glucidi contenuti in 100 grammi di latte di vacca intero, parzialmente scremato e scremato. Rappresentare graficamente i dati nel modo più opportuno.

Tabella 5.11 – Quantità, in grammi, di proteine, lipidi e glucidi contenuti in

100 grammi di latte di vacca intero, parzialmente scremato e scremato. Latte di vacca Proteine Lipidi Glucidi Intero 3.1 3.4 4.8 Parzialmente scremato 3.5 1.8 5.0 Scremato 3.6 0.2 5.3

Esercizio 5.14. La tabella 5.12 riporta il numero di occupati e

disoccupati (in migliaia) negli anni 1985, 1990 e 1995 (fonte: Istat). Rappresentare graficamente i dati nel modo più opportuno.

Tabella 5.12 – Numero di occupati e disoccupati (in migliaia) negli anni 1985,

1990 e 1995. Condizione occupazionale 1985 1990 1995 Occupati 13⋅982 13⋅592 12⋅933 Disoccupati 269 255 597

Esercizio 5.15. La tabella 5.13 riporta le presenze (in milioni) dei clienti delle strutture ricettive italiane nel primo semestre del 2000, per ripartizione geografica e residenza (fonte: Istat). Rappresentare graficamente i dati nel modo più opportuno.

Page 93: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 79

Tabella 5.13 – Presenze (in milioni) dei clienti delle strutture ricettive italiane nel primo semestre del 2000, per ripartizione geografica e residenza. Ripartizione geografica Italiani Stranieri Totale Nord-Ovest 13.805 8.284 22.089 Nord-Est 23.904 24.594 48.498 Centro 15.171 14.566 29.737 Sud e Isole 13.277 7.520 20.797 Italia 66.157 54.964 121.121

Esercizio 5.16. La produzione, in migliaia di tonnellate, di diversi tipi di carne, dal 1996 al 2000, è riportata nella tabella 5.14 (fonte: Istat). Rappresentare graficamente i dati nel modo più opportuno.

Tabella 5.14 – Produzione di carne (in migliaia di tonnellate) in Italia dal 1996

al 2000. Prodotti 1996 1997 1998 1999 2000 Carne bovina 979 946 875 920 901 Carne suina 1⋅342 1⋅348 1⋅321 1⋅381 1⋅391 Carne ovi-caprina 53 53 51 50 47 Carne avicunicola 1⋅357 1⋅378 1⋅392 1⋅378 1⋅332

Esercizio 5.17. La rivista Donna Moderna di Aprile 2002 ha

pubblicato i risultati di un’indagine compiuta su 200 persone alle quali è stato chiesto “Perché tante donne si fanno bionde?”. I risultati sono riportati nella tabella 5.15. Rappresentare graficamente i dati nel modo più opportuno.

Tabella 5.15 – Risposte alla domanda “Perché tante donne si fanno bionde?”

Risposta Uomini Donne Per ringiovanire 17% 26% Per essere più appariscenti 58% 41% Perché agli uomini piacciono di più 25% 33%

Esercizio 5.18. L’espresso del 3 aprile 2003 ha pubblicato i tempi

complessivi nei quali sono apparse sulle emittenti RAI, Mediaset e La Sette cinque donne del mondo politico: L. Turco, L. Moratti, A. Mussolini, R. Bindi e A. Finocchiaro. I dati sono riportati nella tabella 5.16; rappresentarli graficamente nel modo più opportuno.

Page 94: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 80

Tabella 5.16 – Tempo dedicato ad alcune donne del mondo politico da diverse emittenti televisive. Emittente L. Turco L. Moratti A. Mussolini R. Bindi A. Finocchiaro

RAI 1ora

7 minuti 51 secondi

55 minuti. 19 secondi

45 minuti 58 secondi

29 minuti 51 secondi

30 minuti 41 secondi

Mediaset 9 minuti 38 secondi

6 minuti 10 secondi

7 minuti 17 secondi

13 minuti 45 secondi

La Sette 11 minuti 23 secondi

15 minuti 38 secondi

6 minuti 26 secondi

15 minuti 18 secondi

9 minuti 50 secondi

Esercizio 5.19. La tabella 5.17 riporta il numero di pagine stampate al minuto, in bianco e nero e a colori, e i prezzi in euro di alcune stampanti a getto d’inchiostro (dati disponibili sul sito web www.hightechland.com nel febbraio 2002). Costruire il diagramma a dispersione dei prezzi sia rispetto al numero di pagine stampate in bianco e nero sia rispetto al numero di pagine stampate a colori e commentare i risultati.

Tabella 5.17 – Numero di pagine stampate al minuto, in bianco e nero e a

colori, e prezzo di alcune stampanti a getto d’inchiostro. Stampante Bianco e nero Colori Prezzo Canon S200 5.0 3.0 73.20 Canon S300 11.5 7.5 126.00 Canon S450 10.0 7.0 158.40 Canon S500 12.0 8.0 163.20 Canon S630 17.0 12.0 249.60 Epson Stylus C20UX 6.5 3.5 64.80 Epson Stylus C40UX 4.8 3.9 74.40 Epson Stylus C60 12.0 12.0 120.00 Epson Stylus C70 16.0 11.5 192.00 Epson Stylus C80 20.0 10.5 240.00 HP DeskJet 656C 6.0 3.0 72.00 HP DeskJet 845C 8.0 5.0 102.00 HP DeskJet 920C 9.0 7.5 130.80 HP DeskJet 940C 12.0 10.0 160.80 Lexmark Z22 6.0 3.5 62.40 Lexmark Z25 9.0 6.0 58.80 Lexmark Z33 9.0 5.0 66.00

Page 95: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Box-plot e altre rappresentazioni grafiche 81

Tabella 5.17 – Numero di pagine stampate al minuto, in bianco e nero e a colori, e prezzo di alcune stampanti a getto d’inchiostro. Stampante Bianco e nero Colori Prezzo Lexmark Z35 11.0 6.0 79.20 Lexmark Z43 12.0 6.0 97.20 Lexmark Z45 15.0 9.0 98.40 Lexmark Z52 15.0 7.0 138.00 Lexmark Z53 16.0 8.0 146.40 Lexmark Z55 17.0 13.0 147.60 Lexmark Z65 21.0 15.0 246.00

Esercizio 5.20. La tabella 5.18 riporta il prodotto interno lordo e

la spesa delle famiglie italiane per abbigliamento in miliardi di euro (a prezzi 1995) dal 1970 al 2001 (fonte: Istat). Costruire un grafico a dispersione e commentare i risultati.

Tabella 5.18 – Prodotto interno lordo e spesa delle famiglie italiane per

abbigliamento in miliardi di euro, a prezzi 1995.

Anno Prodotto interno lordo

Spesa per abbigliamento Anno Prodotto

interno lordoSpesa per

abbigliamento 1970 486 160 1986 772 340 1971 495 170 1987 795 360 1972 511 180 1988 826 380 1973 544 210 1989 850 400 1974 573 230 1990 867 390 1975 561 230 1991 879 410 1976 598 250 1992 885 410 1977 612 270 1993 877 390 1978 634 270 1994 897 410 1979 669 310 1995 923 410 1980 693 340 1996 933 410 1981 698 330 1997 952 430 1982 703 330 1998 969 450 1983 711 320 1999 985 450 1984 731 320 2000 1013 460 1985 753 330 2001 1031 470

Esercizio 5.21. Il Sole 24 Ore del 30 marzo 2002 ha pubblicato il

risultato netto, in migliaia di euro, del gruppo Alitalia dal 1992 al 2001. I dati sono riportati nella tabella 5.19; rappresentarli graficamente nel modo più opportuno.

Page 96: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 82

Tabella 5.19 – Risultato netto, in migliaia di euro, del gruppo Alitalia dal 1992 al 2001.

Anno Risultato netto Anno Risultato netto 1992 -9.1 1997 225.0 1993 -177.4 1998 210.0 1994 -162.3 1999 7.9 1995 -46.9 2000 -256.5 1996 -625.1 2001 -907.0

Esercizio 5.22. Quattroruote di aprile 2002 ha pubblicato il

numero di concessionari di automobili in Italia dal 1990 al 2000. I dati sono riportati nella tabella 5.20; rappresentarli graficamente nel modo più opportuno. Tabella 5.20 – Numero di concessionari di automobili in Italia dal 1990 al 2000.

Anno Numero di concessionari Anno Numero di

concessionari 1990 5⋅039 1996 4⋅555 1991 5⋅091 1997 4⋅087 1992 5⋅050 1998 4⋅521 1993 4⋅799 1999 4⋅489 1994 4⋅635 2000 4⋅383 1995 4⋅575

Page 97: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità 6.1 Introduzione

Molte decisioni sono prese in condizioni di incertezza. La scelta della facoltà da parte di uno studente che ha appena conseguito la maturità, la scelta della strategia di marketing da parte di un’impresa, la scelta di uno strumento finanziario da parte di un investitore sono tutte decisioni maturate in condizioni di incertezza poiché gli operatori che le compiono non sanno quale sarà l’esito della loro scelta. In queste circostanze il calcolo delle probabilità fornisce gli strumenti per misurare l’incertezza.

Il calcolo delle probabilità si può definire come la “logica del possibile o dell’incerto” poiché tratta di “proposizioni” (o enunciati) alle quali non è possibile associare con certezza l’attributo “vero” o l’attributo “falso” ma soltanto l’attributo “possibile”. Ad esempio, prima di effettuare il lancio di un dado, la proposizione “si presenta la faccia con due puntini” non è né vera né falsa ma soltanto possibile. Anche le affermazioni “domani piove” o “avrò un lavoro entro un anno dalla laurea”, oggi sono soltanto proposizioni possibili.

Per le proposizioni, che si collocano in un contesto di incertezza, il calcolo delle probabilità considera il problema di “misurare il grado di possibilità della proposizione”, ovvero di assegnare alla proposizione una probabilità. Ad esempio, se si considera il lancio di un dado, le

Page 98: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 84

proposizioni “si presenta la faccia con due puntini” e “si presenta una faccia con un numero di puntini pari” sono entrambe possibili – esprimono possibili esiti del lancio di un dado – ma è chiaro che il “grado di possibilità” delle due proposizioni è diverso. E’ a questo grado di possibilità cui si fa riferimento quando si parla di probabilità.

Il calcolo delle probabilità risulta inoltre particolarmente importante nello studio della popolazione mediante rilevazioni parziali. L’analisi del campione consente di ottenere informazioni sulla popolazione sottostante, ma non conduce a una conoscenza esatta. Nei risultati di un’indagine campionaria vi è sempre un margine di incertezza. Lo studio della probabilità consente di valutare il grado di incertezza relativo alla conoscenza della popolazione.

6.2 Esperimento casuale ed eventi

Le proposizione di interesse per il calcolo della probabilità prendono il nome di eventi casuali (o aleatori). Per definirli è necessario introdurre il concetto di esperimento casuale.

Si definisce esperimento casuale o prova qualsiasi fenomeno del mondo reale per il quale vi è più di un risultato possibile e pertanto l’esito è incerto.

In altri termini, un esperimento casuale è un fenomeno alla cui manifestazione è associato uno stato di incertezza: il risultato non è noto a priori e, se l’esperimento è ripetuto, ogni prova può dar luogo a un risultato diverso. Un sondaggio di opinione, un esame universitario, una partita di calcio, un controllo di qualità effettuato su un prodotto, un’analisi del sangue, il lancio di un dado costituiscono tutti esperimenti casuali poiché non è possibile conoscere il risultato prima che siano conclusi.

Si indichino con 1 2, , , nω ω ω… i possibili risultati di un esperimento casuale. L’insieme S di tutti i possibili risultati

Page 99: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

85

( )1 2, , , nS ω ω ω= …

è definito spazio campionario. In un sondaggio di opinione che prevede le risposte “molto

favorevole”, “favorevole”, “contrario” e “molto contrario”, ciascuna risposta costituisce un possibile risultato dell’esperimento. Pertanto si ha 1ω =“la risposta è molto favorevole”, 2ω = “la risposta è favorevole”,

3ω = “la risposta è contrario” e 4ω = “la risposta è molto contrario”. L’insieme delle quattro possibili risposte è lo spazio campionario

{ }1 2 3 4, , ,S ω ω ω ω= . Si può ora definire un evento casuale: esso è una proposizione

non ambigua formulabile intorno a un esperimento casuale. Gli eventi (casuali) possono essere rappresentati come

sottoinsiemi dello spazio campionario S.

Esempio 6.1. Si consideri il lancio di un dado; lo spazio campionario è { }1 2 6, , ,S ω ω ω= … dove iω indica che lanciando il dado si presenta la faccia con i puntini. L’evento A = “si presenta una faccia con un numero di puntini pari” è dato da { }2 4 6, ,A ω ω ω= . Esso è un sottoinsieme di S e si verifica quando il risultato dell’esperimento è 2ω oppure 4ω oppure 6ω .

La rappresentazione degli eventi mediante insiemi presenta il notevole vantaggio di consentire di operare sugli eventi con le usuali operazioni dell’insiemistica.

In particolare, i sottoinsiemi di S costituiti da singoli elementi prendono il nome di eventi elementari.

Esempio 6.1 (continuazione). Nell’esperimento costituito dal

lancio di un dado, gli eventi elementari sono { }1 1E ω= , { }2 2E ω= , …, { }6 6E ω= 1. 1 Si noti la differenza fra 1 2 6, , ,ω ω ω… (elementi di S) e { } { } { }1 2 6, , ,ω ω ω… (eventi elementari).

Page 100: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 86

Se si considera come sottoinsieme (improprio) di S lo stesso spazio campionario, esso rappresenta l’evento che si verifica se uno qualsiasi dei possibili risultati dell’esperimento si verifica. Poiché uno di tali risultati deve necessariamente verificarsi, allora S prende il nome di evento certo.

Si consideri il sottoinsieme di S che non contiene alcun elemento, cioè l’insieme vuoto ∅ ; poiché uno dei possibili risultati dell’esperimento necessariamente si verifica, ∅ rappresenta un evento che non può mai verificarsi. Pertanto esso prende il nome di evento impossibile.

Ogni altro sottoinsieme di S rappresenta un evento possibile o semplicemente un evento.

Uno strumento molto utile per visualizzare gli eventi è il diagramma di Venn illustrato nella figura 6.1. Il rettangolo rappresenta lo spazio campionario, mentre le figure all’interno (sottoinsiemi di S) rappresentano gli eventi.

Vi sono tre operazioni che si possono fare con gli eventi: l’intersezione, l’unione e la negazione. Dato un esperimento casuale, che ammette un insieme S di possibili risultati, e considerati due eventi A e B (sottoinsiemi di S), l’intersezione A B∩ è costituita dagli elementi di S (risultati dell’esperimento) comuni sia ad A sia a B. Pertanto l’intersezione è l’evento che si verifica quando si verificano contemporaneamente A e B.

S

A

Figura 6.1 Diagramma di Venn

Page 101: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

87

Esempio 6.1 (continuazione). Nel lancio di un dado, si

considerino gli eventi A = “esce una faccia con un numero di puntini pari” e B = “esce una faccia con un numero di puntini maggiore di tre”. Si ha { }2 4 6, ,A ω ω ω= e { }4 5 6, ,B ω ω ω= . L’evento definito dall’intersezione di A e di B è { }4 6,A B ω ω∩ = . Esso si verifica quando si verificano contemporaneamente sia A sia B, cioè quando il risultato del lancio di un dado è una faccia con un numero di puntini pari maggiore di tre.

Dato un esperimento casuale, che ammette un insieme S di

possibili risultati, e considerati due eventi A e B, l’unione A B∪ è costituita dagli elementi di S che appartengono soltanto ad A oppure soltanto a B oppure a entrambi. Pertanto l’unione di A e B è l’evento che si verifica quando si verifica soltanto A oppure si verifica soltanto B oppure si verificano contemporaneamente A e B.

Figura 6.3 Unione di due eventi

S

A B

A∪B

S

A A∩B B

Figura 6.2 Intersezione di due eventi

Page 102: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 88

Esempio 6.1 (continuazione). Nel lancio del dado, l’unione di A e B, definiti in precedenza, è data da { }2 4 5 6, , ,A B ω ω ω ω∪ = e si verifica quando l’esito del lancio è uno dei risultati che la costituiscono.

Dato un evento A contenuto in S, si indica con A l’insieme

complementare di A rispetto a S, costituito dagli elementi di S che non appartengono ad A. Esso rappresenta quindi l’evento che si verifica quando A non si verifica e pertanto viene chiamato negazione di A.

Figura 6.4 Negazione di un evento

Esempio 6.2. In una partita di calcio, fra le squadre X e Z, lo

spazio campionario è dato da { }1 2 3, ,S ω ω ω= dove 1ω indica la vittoria della squadra X, 2ω il pareggio e 3ω la sconfitta di X. Sia { }1A ω= l’evento “vittoria di X”, la negazione di A si verifica quando X non vince – consegue un pareggio o una sconfitta – e quindi si ha

{ }2 3,A ω ω= .

Due eventi A e B, contenuti in S, si dicono incompatibili se non possono verificarsi contemporaneamente. In tal caso A e B non hanno elementi in comune e la loro intersezione è l’evento impossibile, A B∩ =∅ . In una rappresentazione mediante diagramma di Venn, due eventi incompatibili appaiono come insiemi disgiunti (figure non sovrapposte).

A

A

Page 103: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

89

Figura 6.5 Eventi incompatibili

Considerati n eventi 1 2, , , nA A A… di S, essi si dicono

incompatibili se sono incompatibili a due a due, ovvero quando si ha

i jA A∩ =∅ per qualunque i j≠ .

Dati n eventi 1 2, , , nA A A… di S, essi si dicono necessari se la loro unione dà l’evento certo, ossia se

1 2 nA A A S∪ ∪ ∪ = .

Un insieme di n eventi necessari e incompatibili costituisce una partizione dello spazio campionario. La figura 6.6 ne è un esempio.

Gli eventi elementari sono chiaramente necessari – uno di essi deve necessariamente verificarsi – e al tempo stesso incompatibili – due diversi risultati dell’esperimento non possono verificarsi

Figura 6.6 Partizione dello spazio degli eventi

A12

A1 A2 A3 A4

A5

A7 A8

A9

A10 A11

S

A B

A6

Page 104: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 90

contemporaneamente. Essi costituiscono quindi una partizione dello spazio degli eventi.

Un evento A e la sua negazione A costituiscono il caso più semplice di partizione di S.

Un risultato che tornerà utile in seguito è il seguente. Considerata una partizione di S costituita dagli eventi B e B e un generico evento A, quest’ultimo si può esprimere come unione della sua intersezione con B e della sua intersezione con B

(6.1) ( ) ( )A A B A B= ∩ ∪ ∩ .

Poiché B e B sono incompatibili, lo sono anche A B∩ e A B∩ . La (6.1) quindi esprime A come l’unione di due eventi incompatibili, definiti dalle intersezioni di A con B e di A con B . Analogamente per B si ha

( ) ( )B A B A B= ∩ ∪ ∩ .

6.3 La probabilità

Definire la probabilità è utile per misurare quanto è verosimile che un evento si verifichi. Il termine “probabilità” in realtà appartiene al linguaggio comune e le valutazioni di probabilità sono

S

A∩B A B∩

BA Figura 6.7 Rappresentazione di un evento come unione di eventi incompatibili

Page 105: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

91

particolarmente ricorrenti. Si pensi ai pronostici sull’esito di una competizione agonistica; frequentemente si sente dire che una squadra ha maggiore probabilità di vincere. Quando si esce di casa si porta l’ombrello se si ritiene probabile che piova. In previsione di un ballottaggio elettorale sono ricorrenti le valutazioni su quale candidato ha maggiore probabilità di vincere.

Sebbene il concetto sia intuitivamente chiaro è necessario avere una definizione formale di probabilità che consenta di quantificarla. Gli studiosi hanno suggerito diverse definizioni. Comune, nei diversi approcci, è la misura della probabilità su una scala da zero a 1. Essa è tanto più vicina a 1 quanto più verosimile è il verificarsi dell’evento e, viceversa, essa è prossima a zero se si ritiene che l’evento difficilmente si possa verificare. Nei casi estremi, la probabilità dell’evento certo è uno e la probabilità dell’evento impossibile è zero. Rimane però il problema di misurare la probabilità di un evento diverso da ∅ oppure S. A tal fine, risultano utili la definizione frequentista e quella soggettivista.

La definizione frequentista si applica ai cosiddetti eventi ripetibili,

cioè eventi che si possono verificare in ciascuna replicazione (o prova) di un esperimento casuale. Questo ultimo, a sua volta, deve potersi replicare indefinitamente senza che il risultato di una replicazione sia influenzato dai risultati delle prove precedenti.

Un esempio di evento ripetibile è il risultato di un lancio di una moneta. L’esperimento del lancio di una moneta può essere replicato un numero infinito di volte. Lo spazio campionario è { }1 2,S ω ω= dove 1ω è il risultato “nel lancio si presenta Testa” e 2ω è il risultato “nel lancio si presenta Croce”. L’evento { }1A ω= – nel lancio della moneta si presenta Testa – si può verificare in ogni replicazione dell’esperimento ed è quindi ripetibile.

Sia A un evento (ripetibile), che può risultare da un esperimento casuale, del quale si vuole conoscere la probabilità. A livello teorico è possibile immaginare di ripetere innumerevoli volte l’esperimento casuale. A ogni replicazione è possibile rilevare il numero di volte k

Page 106: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 92

nelle quali A si è verificato fino a quel momento e il numero n di replicazioni realizzate, ottenendo la frequenza relativa k n dell’evento nelle n prove. La frequenza relativa (in funzione di n) può essere rappresentata su un piano cartesiano. Secondo la definizione frequentista la probabilità dell’evento A è il valore cui converge la frequenza relativa di A al divergere del numero di replicazioni dell’esperimento. Il fondamento di questa definizione è la constatazione, basata sull’esperienza empirica, che quando il numero delle prove aumenta la frequenza relativa di un evento tende a stabilizzarsi intorno a un valore. Quel valore è la probabilità dell’evento.

La figura 6.8 illustra la frequenza relativa dell’evento “Testa” quando l’esperimento del lancio di una moneta (equilibrata) viene replicato. All’aumentare del numero dei lanci la frequenza relativa tende a stabilizzarsi intorno a 0.5.

0 20 40 60 800.0

0.2

0.4

0.6

0.8

1.0

numero di replicazioni Operativamente, se si assume che la probabilità dell’evento di

interesse A si mantenga costante in ogni prova e che l’esito di una prova non sia influenzato dai risultati delle prove precedenti, considerato un numero n sufficientemente grande di prove, la frequenza relativa con la quale si è verificato A viene assunta come probabilità di A.

Figura 6.8 Frequenza relativa dell’evento “Testa” nel lancio di una moneta

Page 107: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

93

In tal modo la definizione frequentista di probabilità soddisfa l’esigenza operativa di misurare la probabilità di eventi almeno virtualmente ripetibili. Tuttavia vi sono esperimenti, come una partita di calcio, un esame universitario o un’operazione chirurgica, che non sono ripetibili tante volte e sempre nelle medesime condizioni, per i quali questa definizione risulta inapplicabile.

Secondo la definizione soggettivista la probabilità è il grado di

fiducia che un individuo (coerente) ha nel verificarsi di un evento. Per tradurre il grado di fiducia in una valutazione numerica di probabilità si fa riferimento a uno schema di scommesse. La probabilità di un evento è la somma che un individuo coerente è disposto a scommettere per ricevere una somma unitaria se l’evento si verifica e zero altrimenti.

Ad esempio se, con riferimento a una partita di calcio fra le squadre X e Z, un individuo afferma che la probabilità dell’evento “la squadra X vince” è 0.8, ciò significa che è disposto a scommettere una somma pari a 0.8 per ricevere una somma pari a 1 se la squadra X vince e zero altrimenti2.

Secondo la definizione soggettivista la valutazione della probabilità di un evento è compiuta da un individuo sulla base delle informazioni a lui disponibili, ovvero mediante un’elaborazione soggettiva di queste informazioni. Pertanto è possibile assegnare una probabilità a qualsiasi evento casuale, anche se non è ripetibile, sicché la definizione soggettivista è applicabile nell’ambito di qualsiasi esperimento casuale. Tuttavia il grado di fiducia che un individuo ha nel verificarsi di un evento è inevitabilmente soggettivo: persone diverse, con informazioni diverse ma anche con le stesse informazioni, possono pervenire a valutazioni diverse della probabilità di un medesimo evento3.

2 Per coerenza, lo stesso individuo è disposto a scommettere una somma pari a 0.2 per ricevere una somma unitaria se la squadra X non vince. 3 Nella definizione soggettivista la probabilità non è una proprietà intrinseca dell’evento.

Page 108: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 94

6.4 Impostazione assiomatica

Il dibattito sulla definizione della probabilità trova una sua composizione con l’impostazione assiomatica. Ivi la probabilità è definita mediante alcuni postulati dai quali si ricavano tutte le sue proprietà4.

Sia S lo spazio dei possibili risultati di un esperimento casuale. Si definisce probabilità una funzione ( )P A che associa a ogni evento A di S un numero reale e che soddisfa i seguenti postulati.

Postulato 1. Per qualunque evento A la probabilità è non negativa

( ) 0P A ≥ .

Postulato 2. La probabilità dell’evento certo è 1

( ) 1P S = .

Postulato 3. Siano A e B due eventi incompatibili, la probabilità

della loro unione è data dalla somma delle probabilità

A B∩ =∅ ⇒ ( ) ( ) ( )P A B P A P B∪ = + .

Per induzione il terzo postulato può essere esteso all’unione di n eventi incompatibili. Se 1 2, , , nA A A… sono eventi incompatibili – cioè tali che i jA A∩ =∅ , per qualunque i j≠ – si ha

( ) ( ) ( ) ( )1 2 1 2n nP A A A P A P A P A∪ ∪ ∪ = + + + .

La (6.1) ha messo in evidenza che dati due eventi A e B, l’evento

A può essere rappresentato come unione di due eventi incompatibili: la

4 Tali postulati sono validi sia nella definizione frequentista sia nella definizione soggettivista di probabilità.

Page 109: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

95

sua intersezione con B e la sua intersezione con B . Di conseguenza, per il terzo postulato la probabilità di A si può ottenere come

(6.2) ( ) ( ) ( )P A P A B P A B= ∩ + ∩ .

Esempio 6.3. Un ristoratore sa che la probabilità che un cliente si

presenti per pranzo e beva vino è 0.13, mentre la probabilità che un cliente si presenti per cena e beva vino è 0.26. Si vuole determinare la probabilità che un cliente beva vino5.

Si indichi con A l’evento “il cliente beve vino” e con B l’evento “il cliente si presenta a pranzo”, sicché B è l’evento “il cliente si presenta a cena”. Si ha ( ) 0.13P A B∩ = e ( ) 0.26P A B∩ = . Di conseguenza applicando la (6.2) si ha ( ) 0.13 0.26 0.39P A = + = .

Sulla base dei postulati è possibile dimostrare alcuni teoremi utili

per il calcolo delle probabilità. Teorema 1. Dato un evento A, la probabilità della sua negazione è

( ) ( )1P A P A= − .

Per dimostrare questo risultato si procede osservando che A e A sono necessari − A A=S∪ − il che implica ( ) ( ) 1P A A P S∪ = = . Inoltre A e A sono anche incompatibili, di conseguenza per il terzo postulato si ha ( ) ( ) ( ) 1P A A P A P A∪ = + = , il che dimostra il teorema.

Teorema 2. La probabilità dell’evento impossibile è nulla,

( ) 0P ∅ = .

L’evento impossibile è la negazione dell’evento certo e pertanto si ha ( ) ( )1 0P P S∅ = − = .

5 Nell’esempio si assume che il cliente ha due sole possibilità: presentarsi a pranzo o presentarsi a cena.

Page 110: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 96

Teorema 3. Per un qualunque evento A si ha

( ) 1P A ≤ .

Per il teorema 1 si ha ( ) ( )1P A P A= − . Poiché per il primo postulato ( )P A è non negativa, la probabilità di A non può essere maggiore di 1.

Si osservi che, sulla base del primo postulato e del teorema 3, la probabilità è un numero appartenente all’intervallo [ ]0,1 .

Teorema 4. Dati due eventi A e B, la probabilità dell’unione è data

da

( ) ( ) ( ) ( )P A B P A P B P A B∪ = + − ∩ .

L’evento “unione di A e B” può essere ottenuto anche come unione di eventi incompatibili ( )A B A A B∪ = ∪ ∩ ; di conseguenza per il terzo postulato si ha ( ) ( ) ( )P A B P A P A B∪ = + ∩ . Per la (6.2) si ha ( ) ( ) ( )P B P A B P A B= ∩ + ∩ , pertanto sostituendo ( )P A B∩ ( ) ( )P B P A B= − ∩ in ( )P A B∪ si dimostra il teorema.

Esempio 6.4. Un fornitore sa che la probabilità che un cliente chieda un pagamento rateizzato è 0.37, la probabilità che un cliente chieda uno sconto è 0.50 e la probabilità che un cliente chieda sia un pagamento rateizzato sia uno sconto è 0.20. Si vuole determinare la probabilità che un cliente chieda un pagamento rateizzato oppure uno sconto.

Si indichi con A l’evento “il cliente chiede un pagamento rateizzato” e con B l’evento “il cliente chiede uno sconto”; si ha ( ) 0.37P A = , ( ) 0.50P B = e ( ) 0.20P A B∩ = . La probabilità che un

cliente chieda un pagamento rateizzato oppure uno sconto è data da ( )P A B∪ . Applicando il teorema 4 si ha

( ) 0.37 0.50 0.20 0.67.P A B∪ = + − =

Page 111: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

97

Il cliente paga subito e non chiede sconti quando non si verifica né A né B . Di conseguenza la probabilità che il cliente paghi subito senza chiedere sconti è la probabilità della negazione di A B∪ e, sulla base del teorema 1, è data da

( ) ( )1 1 0.67 0.33P A B P A B∪ = − ∪ = − = .

6.5 Misura della probabilità come rapporto fra casi favorevoli e casi possibili

Quando gli eventi elementari sono equiprobabili (cioè hanno tutti la stessa probabilità di verificarsi) e in numero finito, la probabilità di un evento A si ottiene come rapporto fra casi favorevoli − il numero di eventi elementari in A − e casi possibili − il numero di eventi elementari in S.

Siano 1 2, , , nE E E… gli n eventi elementari dello spazio campionario S generato da un esperimento. Se essi sono equiprobabili, ossia

( ) ( ) ( )1 2 nP E P E P E= = = ,

ciascuno ha probabilità 1/ n , cioè

(6.3) ( ) 1iP E

n= , i=1,2, …, n.

Per dimostrare la (6.3) si ricordi che gli eventi elementari sono necessari e pertanto si ha ( ) ( )1 2 1nP E E E P S∪ ∪ ∪ = = . Essendo anche incompatibili, per il terzo postulato si ha

( ) ( ) ( ) ( )1 2 1 2 1n nP E E E P E P E P E∪ ∪ ∪ = + + = .

Infine l’equiprobabilità implica che

( ) ( )1 2 1n iP E E E nP E∪ ∪ ∪ = = ,

sicché la (6.3) è dimostrata.

Page 112: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 98

Sia A un evento costituito dall’unione di k degli n eventi elementari equiprobabili, si ha

(6.4) ( ) kP An

= .

Per dimostrare la (6.4), senza perdere in generalità, si consideri 1 2 kA E E E= ∪ ∪ ∪ . Per l’incompatibilità degli eventi elementari si

ha ( ) ( ) ( ) ( )1 2 kP A P E P E P E= + + + . Inoltre per l’equiprobabilità si ha ( ) 1/iP E n= per 1, 2,i n= … , il che implica che ( ) ( ) /iP A kP E k n= = .

Di conseguenza, quando gli eventi elementari sono equiprobabili e in numero finito, la probabilità di A si può esprimere come il rapporto fra il numero k di casi favorevoli al verificarsi di A e il numero n di casi possibili.

Esempio 6.1 (continuazione). Se il dado non è truccato gli eventi

elementari, 1 2 6, , ,E E E… , sono equiprobabili e quindi ciascuno ha probabilità 1/6. L’evento A = “si presenta una faccia con un numero di puntini pari”, dato da 2 4 6A E E E= ∪ ∪ , ha probabilità ( ) 3 6 0 5P A / .= = .

Esempio 6.5. Il dirigente di un’azienda ha otto collaboratori, dei

quali sei sono laureati in Economia e due in Statistica. Fra i laureati in Economia due sono donne, mentre fra i laureati in Statistica vi è una sola donna. Il dirigente deve scegliere un collaboratore per affidargli un progetto. Se la scelta è casuale ciascun collaboratore ha eguale probabilità di essere scelto. Definiti gli eventi A = “il collaboratore scelto è laureato in Economia” e B = “il collaboratore scelto è una donna”, si vogliono determinare le probabilità di A e di B, la probabilità di A e la probabilità dell’unione di A e B.

Poiché ogni collaboratore ha probabilità 1/8 di essere estratto, la probabilità di A, ottenuta come rapporto fra casi favorevoli e casi possibili, è ( ) 6 / 8P A = . Analogamente la probabilità di B è ( ) 3/ 8P B = .

Page 113: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

99

La probabilità dell’evento A= “il collaboratore scelto è laureato in Statistica” si ottiene applicando il teorema 1: ( ) ( )1P A P A= −

1 6 / 8 2 / 8= − = . Essendo A e B eventi compatibili, la probabilità dell’unione può

essere calcolata applicando il teorema 4. Preliminarmente si deve determinare ( )P A B∩ . L’intersezione A B∩ è l’evento che si verifica quando viene scelta una delle due donne laureate in Economia, di conseguenza si ha ( ) 2 / 8P A B∩ = . La probabilità dell’unione è quindi data da ( ) 6 / 8 3/ 8 2 / 8 7 / 8P A B∪ = + − = . 6.6 Probabilità condizionata

Vi sono circostanze nelle quali l’informazione sul verificarsi di un evento modifica la valutazione della probabilità di un altro evento. Un medico può ritenere che la probabilità che insorga una particolare patologia sia, in genere, piuttosto piccola. Tuttavia l’informazione che un paziente è stato esposto a un fattore di rischio può modificare la sua valutazione della probabilità, inducendolo a ritenere la patologia più probabile per questo particolare soggetto. Un investitore può avere una sua valutazione sulla probabilità che, in un prossimo futuro, vi sia un incremento dei rendimenti del mercato azionario. Tuttavia informazioni su futuri andamenti del tasso di interesse o interventi di politica economica possono renderlo più o meno ottimista.

In questi esempi la probabilità di un evento si modifica in seguito all’informazione relativa al verificarsi di un altro evento e si parla perciò di probabilità condizionata. Spesso, sottintesa al concetto di probabilità condizionata, vi è l’individuazione di una relazione di causa ed effetto fra due eventi.

Siano A e B due eventi contenuti in S e si supponga di disporre dell’informazione che B si è verificato. La probabilità condizionata di A, dato che si è verificato l’evento B, è data da

Page 114: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 100

(6.5) ( )( | )( )

P A BP A BP B∩

= ,

posto ( ) 0P B > .

Quando si calcola la probabilità di A dato B, l’evento B deve essere vero; esso assume quindi il ruolo di evento certo e rappresenta il nuovo insieme dei possibili risultati dell’esperimento. Inoltre A può verificarsi solo se il risultato dell’esperimento è un elemento di A che appartiene anche a B. Pertanto l’evento possibile non è più A ma A B∩ . Di conseguenza la probabilità di A dato B può essere calcolata come rapporto fra la probabilità di A B∩ e la probabilità del nuovo insieme dei possibili risultati B.

Esempio 6.1 (continuazione). Nell’esperimento del lancio del

dado, si consideri l’evento A=“si presenta una faccia con al massimo due puntini” e l’evento B= “si presenta una faccia con un numero di puntini pari”. Si vuole calcolare la probabilità di A condizionata a B.

Si ha 1 2A E E= ∪ , 2 4 6B E E E= ∪ ∪ e ( ) 1/ 2P B = . Se B è vero vi è un solo caso favorevole al verificarsi di A: “si presenta la faccia con due puntini”, cioè A B∩ , che ha probabilità ( ) 1/ 6P A B∩ = . Inoltre l’insieme dei possibili risultati è dato da B. La probabilità di A dato B, può essere ottenuta come rapporto fra ( )P A B∩ e ( )P B

( ) 1/ 6| 1/ 31/ 2

P A B = = .

Esempio 6.4 (continuazione). Nell’esempio 6.4 la probabilità che

un cliente chieda uno sconto è ( ) 0.50P B = e la probabilità che chieda sia uno sconto sia un pagamento rateizzato è ( ) 0.20P A B∩ = . La probabilità condizionata che il cliente chieda un pagamento rateizzato, dato che ha chiesto uno sconto, è ( )| 0.20 / 0.50 0.40P A B = = . La probabilità condizionata è maggiore di ( ) 0.37P A = : l’informazione

Page 115: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

101

che il cliente ha chiesto uno sconto induce a ritenere più probabile che chieda un pagamento rateizzato.

Dalla (6.5) si ottiene anche la probabilità dell’intersezione di due

eventi A e B che risulta

(6.6) ( ) ( ) ( )|P A B P A P B A∩ = ,

o alternativamente

( ) ( ) ( )|P A B P B P A B∩ = .

Molti esperimenti sono schematizzabili come estrazioni di unità da un insieme. Quando l’estrazione riguarda più unità è rilevante la modalità con la quale essa avviene. In particolare si distingue fra estrazione in blocco (o senza rimessa) ed estrazione con rimessa. Nel primo caso l’unità estratta viene eliminata dall’insieme, sicché il risultato di ogni estrazione modifica la composizione dell’insieme dal quale avviene l’estrazione successiva generando dipendenza fra i risultati delle diverse prove. Se invece l’estrazione avviene con rimessa, ogni unità estratta, dopo la rilevazione, è reinserita nell’insieme, sicché le successive estrazioni avvengono sempre da un insieme con la stessa composizione. Quando l’estrazione avviene in blocco vi è dipendenza fra le prove e il calcolo della probabilità di eventi definiti in funzione del risultato di due o più estrazioni richiede il ricorso alla probabilità condizionata.

Esempio 6.6. In un’urna vi sono tre palline blu e cinque palline

rosse. Si estraggono due palline in blocco. Si vuole determinare la probabilità che siano entrambe rosse.

Si indichi con E1 l’evento “risulta una pallina rossa alla prima estrazione” e con E2 l’evento “risulta una pallina rossa alla seconda estrazione”. L’esperimento produce due palline rosse quando si verifica l’evento 1 2E E∩ , con probabilità ( ) ( ) ( )1 2 1 2 1|P E E P E P E E∩ = . La probabilità di avere una pallina rossa alla prima estrazione è

Page 116: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 102

( )1 5 / 8P E = . Per calcolare ( )2 1|P E E bisogna tenere conto che il risultato “pallina rossa” della prima estrazione ha modificato la composizione dell’urna, pertanto ora essa contiene quattro palline rosse e tre palline blu. Di conseguenza la probabilità condizionata di avere una pallina rossa alla seconda estrazione, dato che nella prima estrazione è risultata una pallina rossa, è ( )2 1| 4 / 7P E E = . Applicando la (6.6) si ha

( )1 25 4 58 7 14

P E E∩ = × = .

La probabilità condizionata può essere utilizzata per calcolare la

probabilità di un evento A qualora siano note: la probabilità di un altro evento B e le probabilità condizionate ( )|P A B e ( )|P A B . Infatti dalla (6.2) si ha ( ) ( ) ( )P A P A B P A B= ∩ + ∩ e applicando la (6.6) si ottiene

(6.7) ( ) ( ) ( ) ( ) ( )| |P A P B P A B P B P A B= + .

Esempio 6.7. Un editore sa che il 65% dei lettori di una rivista sui

computer lavorano nel settore dell’informatica. Al momento dell’acquisto della rivista, il lettore può scegliere se acquistare anche un CD allegato alla rivista pagando un supplemento di prezzo. L’editore sa che fra coloro che lavorano nel settore dell’informatica l’80% acquista anche il CD, mentre fra coloro che lavorano in altri settori soltanto il 50% acquista il CD. Si vuole determinare la probabilità che un lettore acquisti il CD.

Sia A l’evento “il lettore acquista il CD” e B l’evento “il lettore lavora nel settore dell’informatica”. L’evento A si verifica se il lettore lavora nel settore dell’informatica e acquista il CD, cioè se si verifica l’evento A B∩ , oppure se il lettore non lavora nel settore dell’informatica (evento B ) e acquista il CD, cioè se si verifica l’evento A B∩ . Quindi l’evento A si può esprimere come

Page 117: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

103

( ) ( )A A B A B= ∩ ∪ ∩ . Poiché A B∩ e A B∩ sono incompatibili si ha ( ) ( ) ( ) ( ) ( )| |P A P B P A B P B P A B= + .

Dato che il 65% dei lettori lavora nel settore dell’informatica si ha ( ) 0.65P B = . La probabilità che un lettore non lavori in tale settore è ( ) ( )1P B P B= − 1 0.65 0.35= − = . Fra coloro che lavorano nel settore

dell’informatica l’80% acquista il CD, perciò ( )| 0.80P A B = . Analogamente la probabilità che un lettore acquisti il CD, dato che lavora in altri settori, è ( )| 0.50P A B = . Applicando la (6.7) si ottiene la probabilità di A

( ) 0.65 0.80 0.35 0.50 0.695P A = × + × = .

6.7 Eventi indipendenti

Si considerino due eventi A e B contenuti in S e tali che ( ) 0P A > e ( ) 0P B > . L’evento B è indipendente da A se

(6.8.a) ( ) ( )|P B A P B= .

La probabilità condizionata di B dato A coincide con la probabilità non condizionata di B; pertanto l’informazione relativa al verificarsi di A non modifica la valutazione della probabilità di B.

Se B è indipendente da A, applicando la (6.6) si ha

(6.9) ( ) ( ) ( )P A B P A P B∩ = .

Se B è indipendente da A anche A è indipendente da B. Infatti applicando la (6.5) si ottiene

( ) ( )( | )( )

P A P BP A BP B

= ,

ovvero

(6.8.b) ( ) ( )|P A B P A= .

Page 118: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 104

L’indipendenza fra due eventi può essere verificata indifferentemente mediante la (6.9) oppure la (6.8.a) oppure la (6.8.b).

Nel paragrafo 6.6 è stato osservato che l’estrazione in blocco induce dipendenza fra i risultati delle prove, sicché per il calcolo della probabilità di un evento definito in funzione del risultato di due o più estrazioni è necessario ricorrere alla probabilità condizionata. Se invece l’estrazione avviene con rimessa l’insieme dal quale sono effettuate le successive estrazioni è lo stesso; pertanto il risultato di un’estrazione non altera la probabilità degli eventi che possono risultare nelle prove successive. L’estrazione con rimessa dà luogo a prove indipendenti e gli eventi generati da tali prove sono, a loro volta, indipendenti.

Esempio 6.8. Si consideri l’urna dell’esempio 6.6 con tre palline blu e cinque palline rosse. Se l’estrazione avviene con rimessa l’esperimento è costituito da due prove indipendenti. Di conseguenza anche gli eventi che risultano dalle due estrazioni sono indipendenti, sicché la probabilità di estrarre una pallina rossa è sempre 5/8. Il risultato della prima estrazione non altera la probabilità degli eventi che possono risultare nella seconda estrazione. Applicando la (6.9), la probabilità di estrarre due palline rosse risulta

( ) ( ) ( ) ( ) ( )1 2 1 2 5 / 8 5 / 8 25 / 64P E E P E P E∩ = = × = .

E’ possibile dimostrare che, se A e B sono indipendenti, lo sono

anche A e B , A e B, A e B . Per dimostrare che A e B sono indipendenti si consideri la (6.2); se A e B sono indipendenti si ha ( ) ( ) ( )P A B P A P B∩ = e pertanto la (6.2) diventa

( ) ( ) ( ) ( )P A P A P B P A B= + ∩ .

Di conseguenza si ha

( ) ( ) ( )1P A P B P A B− = ∩

Page 119: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

105

(6.10) ( ) ( ) ( )P A P B P A B= ∩ .

La (6.10) prova che A e B sono indipendenti. In modo analogo si dimostra che A e B e anche A e B sono indipendenti.

Esempio 6.9. Nel lancio di due dadi si vuole calcolare la

probabilità che la somma dei puntini sia un numero pari. Si indichi con 1E l’evento “esce una faccia con un numero di puntini pari nel lancio

del primo dado” e con 2E l’evento “esce una faccia con un numero di puntini pari nel lancio del secondo dado”; si ha ( ) ( )1 2 0.5P E P E= = . Si indichi con A l’evento “la somma è pari”; A si verifica quando si verificano due numeri pari oppure due numeri dispari, quindi

( ) ( )1 2 1 2A E E E E= ∩ ∪ ∩ . Poiché gli eventi ( )1 2E E∩ e ( )1 2E E∩ sono incompatibili si ha ( ) ( ) ( )1 2 1 2P A P E E P E E= ∩ + ∩ . Inoltre 1E ed 2E sono indipendenti e pertanto ( ) ( ) ( )1 2 1 2P E E P E P E∩ = . L’indipendenza di 1E ed 2E implica l’indipendenza di 1E e 2E e quindi ( ) ( ) ( )1 2 1 2P E E P E P E∩ = . Sostituendo si ha

( ) 0.5 0.5 0.5 0.5 0.5P A = × + × = .

E’ naturale chiedersi che relazione vi sia fra incompatibilità e

indipendenza. Due eventi A e B incompatibili e tali che ( ) 0P A > e ( ) 0P B > non possono essere indipendenti. Infatti per l’incompatibilità

non possono verificarsi contemporaneamente e quindi ( )|P A B ( )| 0P B A= =

6.8 Teorema di Bayes

Il teorema di Bayes fornisce una regola per aggiornare la

probabilità di un evento qualora si rendano disponibili informazioni aggiuntive relative al verificarsi di un evento a esso collegato. Sulla base della propria esperienza un direttore di una banca ritiene che la

Page 120: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 106

probabilità che un cliente acquisti titoli azionari è, ad esempio, 0.2. Successivamente, un’indagine sulle abitudini dei risparmiatori rivela che coloro che investono nel mercato azionario leggono riviste economiche più frequentemente di coloro che preferiscono titoli a reddito fisso. Sapere che un suo cliente è un lettore abituale di riviste economiche può indurre il direttore a rivalutare la probabilità che il cliente acquisti delle azioni, ritenendola, alla luce delle nuove informazioni, maggiore di 0.2.

Nel teorema di Bayes, si distingue fra probabilità a priori, ossia la probabilità attribuita a un evento di interesse prima che un’informazione aggiuntiva sia disponibile, e probabilità a posteriori, ossia la probabilità aggiornata in funzione della nuova informazione. Tale informazione tipicamente riguarda l’esito di un esperimento casuale.

Sia A l’evento di interesse, a esso è associata, in base allo stato di conoscenze iniziali, una probabilità a priori ( )P A . Si supponga ora di venire a conoscenza che si è verificato un evento B dipendente da A. Si assuma inoltre che siano note le probabilità condizionate di B dato A e dato A . Tali probabilità, date da ( )|P B A e ( )|P B A , sono definite probabilità probative o verosimiglianze. Il teorema di Bayes consente di rivalutare la probabilità di A: avendo osservato B è ora opportuno considerare la probabilità a posteriori ( )|P A B .

Essa è data da

( ) ( )|( )

P A BP A BP B∩

= .

Poiché ( ) ( )( ) |P A B P A P B A∩ = si ha

(6.11) ( ) ( )( ) ||

( )P A P B A

P A BP B

= .

La (6.11) è la versione più semplice della formula di Bayes che consente di ottenere la probabilità condizionata di A dato B coinvolgendo la probabilità iniziale ( )P A .

Page 121: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

107

Sulla base della (6.7) si ha ( ) ( ) ( )|P B P A P B A= ( ) ( )|P A P B A+ . Sostituendo questa espressione al denominatore della

(6.11) si ricava la formula di Bayes

( ) ( ) ( )( ) ( ) ( ) ( )

||

| |P A P B A

P A BP A P B A P A P B A

=+

.

Questa formula consente di calcolare le probabilità a posteriori a partire dalle probabilità a priori e dalle verosimiglianze.

In modo analogo è possibile calcolare la probabilità a posteriori di A , ottenendo

( ) ( ) ( )( ) ( ) ( ) ( )

||

| |

P A P B AP A B

P A P B A P A P B A=

+.

Si noti che la somma delle probabilità a posteriori è 1.

( ) ( )| | 1P A B P A B+ = .

Spesso nelle applicazioni del teorema di Bayes gli eventi A e A sono interpretati come ipotesi, cause o stati di natura alternativi che possono aver determinato l’evento B. In questo contesto l’obiettivo è quello di individuare quale ipotesi, causa o stato di natura può aver determinato B con maggiore probabilità

Esempio 6.10. Il 70% dei messaggi in arrivo in una casella email è costituito da messaggi illegittimi, usualmente indicati con il termine “spam”. Il software antispam riconosce correttamente i messaggi illegittimi con probabilità 0.97. Si possono però verificare dei falsi positivi, per i quali un messaggio legittimo è classificato erroneamente come spam. La probabilità che un messaggio sia classificato come spam, dato che è legittimo è 0.05. Si vuole calcolare la probabilità che un messaggio sia legittimo dato che è stato classificato come spam. Sulla base di questa probabilità si potrà decidere se cancellare un messaggio prima ancora di aprirlo.

Page 122: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 108

Si indichi con A l’evento “il messaggio è legittimo” sicchè A è l’evento “il messaggio è illegittimo”. Gli eventi A e A sono le ipotesi formulate sulla natura del messaggio. Le loro probabilità a priori sono ( ) 0.3P A = e ( ) 0.7P A = . Sia B l’evento “il messaggio è classificato

come spam”; le probabilità probative sono ( )| 0.05P B A = e ( )| 0.97P B A = . Applicando la formula di Bayes (6.11) si ottiene la

probabilità a posteriori che il messaggio sia legittimo dato che è stato classificato come spam

0.3 0.05( | ) 0.0220.3 0.05 0.7 0.97

P A B ×= =

× + ×.

La probabilità a posteriori che il messaggio sia illegittimo dato che è stato classificato come spam è

( ) ( )| 1 | 1 0.022 0.978P A B P A B= − = − = .

Il confronto fra le probabilità delle due ipotesi, A “il messaggio è legittimo” e A “il messaggio è illegittimo”, dato B, induce ragionevolmente il destinatario a cancellare il messaggio senza aprirlo.

Il teorema di Bayes può essere applicato anche a più eventi di

interesse 1 2, , , nA A A… , necessari e incompatibili, la cui probabilità può essere aggiornata disponendo dell’informazione che si è verificato un evento B . Si generalizza così il confronto (limitato a due sole ipotesi nel caso precedente) a n ipotesi in presenza delle quali può essersi verificato l’evento B. Si indichi con ( )iP A la probabilità a priori dell’evento iA , per 1, 2, ,i n= … , e con ( )| iP B A la probabilità probativa o verosimiglianza di B dato iA . La probabilità a posteriori dell’evento iA è data da

(6.12) ( ) ( ) ( )

( ) ( )1

||

|

i ii n

j jj

P A P B AP A B

P A P B A=

=

∑.

Chiaramente la somma delle probabilità a posteriori è pari a 1

Page 123: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

109

( )1

| 1n

ii

P A B=

=∑ .

Esempio 6.11. Il direttore di un supermercato è interessato alla frequenza con la quale i clienti visitano il negozio. Egli ritiene che la probabilità che un cliente non sia fidelizzato è 0.30, la probabilità che sia parzialmente fidelizzato è 0.25 e la probabilità che sia fidelizzato è 0.45. Inoltre il direttore ha osservato che i clienti non fidelizzati acquistano prodotti dal banco frigo con probabilità 0.15, quelli parzialmente fidelizzati acquistano prodotti dal banco frigo con probabilità 0.38, mentre quelli fidelizzati acquistano prodotti dal banco frigo con probabilità 0.80. Avendo osservato quali clienti acquistano prodotti dal banco frigo, il direttore è interessato a conoscere le probabilità dei diversi gradi di fidelizzazione.

Si indichi con 1A l’evento “il cliente non è fidelizzato”, con 2A l’evento “il cliente è parzialmente fidelizzato” e con 3A l’evento “il cliente è fidelizzato”; le probabilità a priori sono ( )1 0.30P A = , ( )2 0.25P A = e ( )3 0.45P A = . Sia B l’evento “il cliente acquista

prodotti dal banco frigo”; le probabilità probative sono ( )1| 0.15P B A = , ( )2| 0.38P B A = e ( )3| 0.80P B A = . Applicando la

(6.12) si ottiene

( )10.30 0.15| 0.09

0.30 0.15 0.25 0.38 0.45 0.80P A B ×

= =× + × + ×

e

( )20.25 0.38| 0.19

0.30 0.15 0.25 0.38 0.45 0.80P A B ×

= =× + × + ×

.

Inoltre, poiché la somma delle probabilità a posteriori è 1, si ha

( ) ( ) ( )3 1 2| 1 | | 1 0.09 0.19 0.72P A B P A B P A B= − − = − − = .

Page 124: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 110

6.9 Elementi di calcolo combinatorio

Nell’ambito del calcolo delle probabilità può sorgere l’esigenza di contare quanti sono i possibili risultati di un esperimento. In questo contesto risultano utili alcuni elementi di calcolo combinatorio.

Si supponga di avere n elementi e n posti. Le diverse sequenze che si possono ottenere disponendo gli n elementi negli n posti sono definite permutazioni. Si vuole determinare quale sia il numero nP di tutte le possibili permutazioni. Quando si sceglie l’elemento da collocare al primo posto, si può scegliere fra n elementi. Una volta che è stato collocato un elemento nel primo posto, per il secondo posto la scelta è limitata fra 1n − elementi rimanenti. Di conseguenza vi sono ( )1n n − modi di riempire i primi due posti. Per il terzo posto, la scelta

è limitata fra 2n − elementi, sicché per i primi tre posti vi sono ( )( )1 2n n n− − modi di coprirli, e così via. Proseguendo fino all’ultimo

posto, si ottiene il numero di permutazioni di n elementi

( )( ) ( )( )1 2 2 1 !nP n n n n= − − = .

Figura 6.9. – Permutazioni di n elementi

Ad esempio il numero di permutazione di 3 elementi è 3! 3 2 1 6= × × = . Per convezione, 0! 1= .

Se i posti disponibili per allocare gli n elementi sono m, dove

m n< , il numero delle diverse sequenze ordinate, definite disposizioni, che si possono ottenere è n mD . Procedendo come in precedenza, si osserva che per il primo posto si può scegliere fra n elementi, per il secondo posto fra 1n − elementi, e così via fino all’ultimo posto disponibile, che è il posto m. A questo punto 1m − elementi sono già

n n−1 n−2 2 1⋅⋅⋅

Page 125: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

111

stati utilizzati, sicché la scelta è limitata a 1n m− + elementi. Il numero di disposizioni di m elementi scelti fra n è

( )( ) ( ) ( )!1 2 1

!n mnD n n n n m

n m= − − − + =

−.

Figura 6.10. – Disposizioni di m elementi scelti fra n.

Ad esempio il numero di disposizioni di 3 elementi scelti fra 5 è

( )5 35! 5! 5 4 3 2 1 5 4 3 60

5 3 ! 2! 2 1D × × × ×

= = = = × × =− ×

.

Infine si supponga di essere interessati ai modi nei quali si possono scegliere m elementi da un insieme che ne contiene n, ma di non essere interessati all’ordine con il quale si dispongono gli elementi. Sequenze che contengono gli stessi elementi ordinati in modo diverso non vengono distinte. Tali sequenze sono definite combinazioni. Per ottenere il numero delle combinazioni n mC si osserva che vi sono m! sequenze ordinate che contengono gli stessi elementi. Pertanto si ha

( )!

! ! !n m

n m

nD nCmm m n - m

= = =

.

Ad esempio il numero di combinazioni di 3 elementi scelti fra 5 è

( ) ( ) ( )5 3

5 5! 5! 5 4 3 2 1 5 4 103 3! 5 3 ! 3!2! 3 2 1 2 1 2

C × × × × ×= = = = = = − × × × ×

.

Questo numero è più piccolo del numero delle disposizioni perché insiemi con gli stessi elementi, sebbene ordinati differentemente, sono considerati equivalenti.

n−m+2 n−m+1 ⋅⋅⋅n−2n−1 n

n−m elementi sono esclusi

Page 126: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 112

E’ immediato verificare che

(6.13) 10n n

n

= =

e 1 1n n

nn

= = −

.

Esempio 6.6 (continuazione). Nell’esempio 6.6 si considera

un’urna con tre palline blu e cinque palline rosse e si vuole determinare la probabilità che, estraendo due palline in blocco, esse siano entrambe rosse. Questo risultato può essere ottenuto sia utilizzando la probabilità condizionata sia mediante il rapporto fra casi favorevoli e casi possibili.

Se si estraggono due palline da un’urna che ne contiene otto e si prescinde dall’ordine, il numero di eventi elementari che possono risultare dall’esperimento è dato dal numero di combinazioni di due elementi scelti fra otto

( )8 8! 8! 8 7 282 2! 8 2 ! 2!6! 2

casi possibili ×

= = = = = − .

I casi favorevoli sono dati dal numero di combinazioni con le quali si possono scegliere due palline rosse fra le cinque disponibili

( )5 5! 5! 5 4 102 2! 5 2 ! 2!3! 2

casi favorevoli ×

= = = = = − .

Di conseguenza la probabilità desiderata, calcolata come rapporto fra casi favorevoli su casi possibili, è

52 10 5(" ")8 28 142

P due palline rosse

= = =

,

che è il risultato ottenuto in precedenza. In maniera analoga è possibile calcolare la probabilità di avere

due palline blu. Essa è data da

Page 127: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

113

( ) ( )

( )

3 3!2! 3 2 !2 3 3" " 8! 8 78 282! 8 2 ! 22

P due palline blu

− = = = =

× −

.

Per calcolare la probabilità di avere una pallina rossa e una pallina blu è opportuno osservare che i casi favorevoli sono dati dal prodotto del numero di combinazioni con le quali si può scegliere una pallina rossa fra cinque per il numero di combinazioni con le quali si può scegliere una pallina blu fra tre. Di conseguenza la probabilità di estrarre due palline di diverso colore è

( )

5 31 1 5 3 15" "

8 28 282

P una pallina rossa e una blu

× = = =

.

Nel calcolo della probabilità di estrarre due palline rosse (o due palline blu) non è stato esplicitato il prodotto del numero delle combinazioni con le quali si possono scegliere due palline rosse fra cinque (o due palline blu fra tre) con il numero delle combinazioni con le quali si possono scegliere zero palline blu fra tre (o zero palline rosse fra cinque) perché il secondo termine del prodotto, per la (6.13), vale 1. Tuttavia le formule complete sono

( ) ( )

5 3 5 32 0 0 2

" " , " "8 82 2

P due palline rosse P due palline blu

= =

.

Il risultato dell’esempio può essere generalizzato. Si consideri un

insieme di N unità delle quali F possiedono una specifica caratteristica mentre le restanti ne sono prive. Si supponga di estrarre in blocco n unità. La probabilità che, fra le n unità estratte, x possiedano la

Page 128: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 114

caratteristica di interesse può essere calcolata come rapporto fra il numero di casi favorevoli e quello dei casi possibili. Il numero di casi possibili è dato dal numero delle combinazioni con le quale n elementi possono essere scelti fra N. Il numero dei casi favorevoli è dato dal prodotto del numero di combinazioni con le quali x unità possono essere scelte fra le F che possiedono la caratteristica per il numero delle combinazioni con le quali n x− unità possono essere scelte fra le N F− unità che sono prive della caratteristica. Si ha

( )" "

F N Fx n x

P x unità favorevoli in n estrazioniNx

− − =

.

L’argomento sarà ulteriormente sviluppato nel nono capitolo quando si introdurrà la variabile casuale ipergeometrica. 6.10 Probabilità congiunte

I concetti introdotti fino a questo punto sono utili per schematizzare situazioni nelle quali si è interessati a due caratteri statistici che possono essere osservati congiuntamente come risultato di un’unica rilevazione. Nella valutazione della didattica si può chiedere a ciascuno studente “se è interessato alla disciplina” e “se è soddisfatto della capacità didattica del docente”. In un’indagine sul consumo di droga da parte dei giovani si può rilevare la frequenza con la quale si assume la droga e il tipo di educazione ricevuta dai genitori. Infine il controllo di qualità su un prodotto può essere eseguito da due ispettori rilevando il giudizio di entrambi.

Siano M e L due diversi caratteri statistici, relativi a un medesimo fenomeno oggetto di studio, che assumono rispettivamente le modalità

1 2, , , km m m… e 1 2, , , h… . Si consideri un esperimento casuale i cui

Page 129: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

115

possibili risultati sono costituiti dalle coppie di modalità ( ),i jm , 1, 2, ,i k= … e 1, 2, ,j h= … , dei caratteri M e L. Lo spazio campionario

di questo esperimento è

( ) ( ) ( ){ }1 1 1 2, , , , , ,k hS m m m= … ,

mentre ( ){ }11 1 1,E m= , ( ){ }12 1 2,E m= , …, ( ){ },kh k hE m= sono gli eventi elementari associati ai possibili risultati dell’esperimento.

Esempio 6.12. Una compagnia telefonica ha pubblicizzato un

nuovo piano tariffario in televisione, sulla stampa e con manifesti murali. In un’analisi di mercato la compagnia ha intervistato i suoi utenti chiedendo “se avevano aderito al nuovo piano tariffario” e “quale mezzo di comunicazione aveva veicolato la pubblicità che era rimasta più impressa”. Le modalità di risposta al primo quesito sono 1m = “ha aderito” e 2m = “non ha aderito”, mentre le possibili risposte al secondo quesito sono 1 = “televisione”, 2 = “stampa” e 3 = “manifesti”.

Lo spazio campionario di questo esperimento è

( ) ( ) ( ) ( ) ( ) ( ){ }1 1 1 2 1 3 2 1 2 2 2 3, , , , , , , , , , ,S m m m m m m= ,

e gli eventi elementari sono 11E =“l’utente intervistato ha aderito al nuovo piano tariffario e la pubblicità televisiva è quella che gli è rimasta più impressa” , 12E =“l’utente intervistato ha aderito al nuovo piano tariffario e la pubblicità su stampa è quella che gli è rimasta più impressa”, e così via.

A ciascuna coppia di modalità ( ),i jm è associata una

probabilità congiunta ijp . L’insieme delle probabilità congiunte ijp , per 1, 2, ,i k= … e 1, 2, ,j h= … costituisce la distribuzione di probabilità congiunta dei due caratteri M e L. Il suo studio è essenziale per l’analisi della dipendenza esistente fra i due caratteri.

Per il primo postulato le probabilità congiunte sono non negative,

0ijp ≥ per qualunque i e j .

Page 130: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 116

Inoltre, poiché gli eventi elementari ijE costituiscono una partizione dello spazio campionario, la somma delle loro probabilità deve essere pari a 1

1 11

k h

iji j

p= =

=∑∑ .

La distribuzione di probabilità congiunta può essere rappresentata mediante una tabella come la 6.1, all’interno della quale vi sono le probabilità congiunte.

Tabella 6.1 – Distribuzione di probabilità congiunta.

1 2 h

1m 11p 12p ihp

2m 21p 22p 2hp km 1kp 2kp khp

Si indichi con A1 l’evento “il carattere M ha assunto la modalità 1m ” e si supponga di voler conoscere la sua probabilità. L’evento A1 si

verifica quando si verifica 11E oppure 12E … oppure 1kE . Pertanto l’evento A1 è rappresentato nel modo seguente

1 11 12 1hA E E E= ∪ ∪ ∪ .

La sua probabilità, indicata con 1.p , è

( ) ( ) ( ) ( )1 11 12 1 11 12 1

11 12 1

. h h

h

p P E E E P E P E P Ep p p

= ∪ ∪ ∪ = + + +

= + + +

La probabilità di A1 è definita probabilità marginale perché l’interesse si è spostato dalla coppia di caratteri M e L al solo carattere M.

In generale, sia Ai l’evento “il carattere M assume la modalità im ”, la probabilità marginale .ip si ottiene sommando le probabilità

congiunte che si trovano sulla i − esima riga della tabella 6.1.

Page 131: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

117

(6.14.a) 1 2.i i i ihp p p p= + + +

per 1, 2, ,i k= … . Analogamente, sia Bj l’evento “il carattere L assume la modalità

j ”, la probabilità marginale . jp di Bj si ottiene sommando le probabilità congiunte che si trovano sulla j − esima colonna della tabella 6.1

(6.14.b) 1 2. j j j kjp p p p= + + +

per 1, 2, ,j h= … .

Chiaramente le probabilità marginali sono non negative e la loro somma è pari a 1

1 1. . 1

k h

i ji j

p p= =

= =∑ ∑ .

Le probabilità marginali e le probabilità congiunte sono riportate insieme nella tabella 6.2. In particolare le probabilità marginali del carattere M sono riportate nell’ultima colonna della tabella 6.2 e le probabilità marginali del carattere L sono riportate nell’ultima riga.

Tabella 6.2 – Distribuzione di probabilità congiunta e distribuzioni di

probabilità marginali. 1B 2B hB

1A 11p 12p ihp 1.p

2A 21p 22p 2hp 2 .p

kA 1kp 2kp khp .kp 1.p 2.p .hp 1

Esempio 6.12 (continuazione). La distribuzione di probabilità congiunta dei quesiti dell’esempio 6.12, risultata alla fine dell’indagine, è rappresentata nella tabella 6.3.

Page 132: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 118

Tabella 6.3 – Distribuzione di probabilità congiunta dell’esempio 6.12. 1B

“Televisione” 2B

“Stampa” 3B

“Manifesti”

1A “ha aderito”

0.20 0.15 0.05 0.40

2A “non ha aderito”

0.30 0.15 0.15 0.60

0.50 0.30 0.20 1

Nell’ultima colonna sono riportate le probabilità marginali delle

risposte al primo quesito. In particolare 0.40 e 0.60 sono le probabilità rispettivamente che un utente abbia aderito al nuovo piano tariffario e che non abbia aderito al nuovo piano tariffario, prescindendo dal mezzo di comunicazione che ha veicolato la pubblicità che gli è rimasta più impressa.

Analogamente le probabilità marginali relative al mezzo di comunicazione che ha veicolato la pubblicità che gli è rimasta più impressa sono riportate nell’ultima colonna e prescindono dalla decisione di aderire o no al nuovo piano tariffario.

I due caratteri M e L sono indipendenti se le probabilità congiunte

possono essere ottenute come prodotto delle probabilità marginali

(6.15) . .ij i jp p p=

per qualunque i e j. E’ sufficiente che per una sola cella della tabella 6.2 della distribuzione di probabilità congiunta non valga la (6.15) per concludere che fra i due caratteri vi è dipendenza.

Esempio 6.12 (continuazione). E’ immediato verificare che fra le

diverse forme pubblicitarie e l’adesione al piano tariffario vi è dipendenza. Infatti

12 1 20.15 . . 0.40 0.30 0.12p p p= ≠ = × = .

Page 133: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

119

6.11 Esercizi

Esercizio 6.1. Il 60% dei lettori di una rivista è di sesso femminile e il 35% dei lettori è abbonato. In particolare il 20% dei lettori sono abbonati e di sesso femminile. i) Qual è la probabilità che un lettore sia di sesso maschile? ii) Qual è la probabilità che il lettore non sia abbonato? iii) Qual è la probabilità che un lettore sia abbonato o sia di sesso

femminile? iv) Qual è la probabilità che un lettore non sia abbonato e sia di sesso

maschile?

Esercizio 6.2. E’ noto che l’abitudine al fumo e un elevato tasso di colesterolo nel sangue sono fattori di rischio per le patologie cardiache. Un cardiologo sa che la probabilità che un suo paziente fumi è 0.38, la probabilità che abbia un elevato tasso di colesterolo nel sangue è 0.65 e infine la probabilità che fumi e abbia un elevato tasso di colesterolo nel sangue è 0.22. i) Qual è la probabilità che un paziente sia esposto ad almeno uno

dei due fattori di rischio? ii) Qual è la probabilità che un paziente non sia esposto ad alcun

fattore di rischio?

Esercizio 6.3. L’80% dei visitatori di un portale raggiunge il sito web tramite un motore di ricerca, mentre i restanti visitatori conoscono l’indirizzo del sito. Il 15% dei visitatori chiede un preventivo, inoltre il 5% dei visitatori conoscono l’indirizzo del sito web e chiedono un preventivo. i) Qual è la probabilità che un visitatore conosca l’indirizzo del sito

web? ii) Qual è la probabilità che un visitatore conosca l’indirizzo del sito

web o chieda un preventivo? iii) Qual è la probabilità che un visitatore raggiunga il sito web

tramite un motore di ricerca e non chieda un preventivo?

Page 134: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 120

Esercizio 6.4. Un risparmiatore ha acquistato un titolo obbligazionario. Il rendimento di questo titolo è ancorato a un indice di rendimento del mercato italiano e a un indice di rendimento del mercato internazionale. Se almeno uno dei due indici non scende al di sotto di una soglia minima, stabilita nel contratto, il titolo obbligazionario assicura un rendimento annuale del 7%, altrimenti il rendimento si limiterà a coprire il tasso di inflazione. Il risparmiatore ritiene che la probabilità che l’indice italiano scenda al di sotto della soglia è pari al 0.10, mentre la probabilità che l’indice internazionale scenda al di sotto della soglia è 0.22. Infine la probabilità che entrambi si mantengano sopra la soglia è 0.86. Qual è la probabilità che il titolo dia un rendimento del 7%?

Esercizio 6.5. In un mazzo di carte francese vi sono 52 carte, delle quali tredici sono di fiori e quattro sono assi. Si estrae una carta a caso dal mazzo. i) Qual è la probabilità che sia di fiori? ii) Qual è la probabilità che sia un asso?

Esercizio 6.6. Alla realizzazione di un progetto sull’ambiente

collaborano cinque ricercatori universitari e otto dipendenti di un ente pubblico. Fra i ricercatori universitari due sono esperti in economia mentre gli altri sono competenti nelle scienze ambientali. Fra i dipendenti dell’ente pubblico quattro sono esperti in economia. Al termine del progetto si organizza un seminario per divulgare i risultati ed è quindi necessario scegliere il relatore. La scelta fra i partecipanti al progetto avviene a caso. i) Qual è la probabilità che sia un ricercatore universitario? ii) Qual è la probabilità che sia un dipendente dell’ente pubblico? iii) Qual è la probabilità che sia un esperto in economia? iv) Qual è la probabilità che sia un ricercatore universitario esperto in

economia? v) Qual è la probabilità che sia un ricercatore universitario oppure un

esperto in economia?

Page 135: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

121

Esercizio 6.7. Il 30% delle persone che entrano in un grande magazzino compiono un acquisto. Il 12% compie un acquisto e lascia la macchina in un parcheggio convenzionato. Qual è la probabilità che un cliente abbia lasciato la macchina nel parcheggio convenzionato dato che ha compiuto un acquisto?

Esercizio 6.8. Un corso di diritto commerciale è seguito da 200

studenti, dei quali il 60% è iscritto al corso di laurea in Economia e gli altri sono iscritti al corso di laurea in Giurisprudenza. La probabilità che uno studente sia iscritto al corso di laurea in Economia e superi l’esame è 0.45. Qual è la probabilità condizionata che uno studente superi l’esame dato che è iscritto al corso di laurea in Economia?

Esercizio 6.9. Presso un call center vi sono 120 telefoniste, fra le quali 50 hanno un’età compresa tra i 18 e 24 anni e le restanti hanno un’età compresa tra i 25 e 30 anni. Alcune telefoniste hanno un contratto a tempo indefinito mentre altre hanno un contratto a tempo determinato. La probabilità che una telefonista abbia un contratto a tempo determinato, dato che appartiene al gruppo delle più giovani, è 0.5; mentre la probabilità che una telefonista abbia un contratto a tempo determinato, dato che appartiene al gruppo delle meno giovani, è 0.3. Le telefoniste decidono di scegliere a caso una di loro per incontrare il datore di lavoro e discutere dei loro problemi. Qual è la probabilità che la telefonista scelta abbia un contratto a tempo determinato?

Esercizio 6.10. Sono stati intervistati 100 giovani che partecipavano all’inaugurazione di una discoteca all’aperto. E’ stato chiesto loro come erano venuti a conoscenza del nuovo locale: 60 avevano ascoltato la pubblicità alla radio, mentre i rimanenti avevano appreso la notizia da amici. La probabilità che un giovane sia entrato senza pagare il biglietto, dato che ha appreso la notizia alla radio, è 0.10, mentre la probabilità che un giovane sia entrato gratuitamente, dato che ha appreso la notizia da amici, è 0.50. Qual è la probabilità che un giovane sia entrato senza pagare?

Page 136: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 122

Esercizio 6.11. Per essere assunto presso l’ufficio statistico di un ente pubblico un laureato deve sostenere sia una prova in statistica sia una prova in diritto amministrativo. La probabilità che superi la prima prova è 0.85, mentre la probabilità che superi la seconda prova è 0.38. Se gli esiti delle prove sono indipendenti, qual è la probabilità che il laureato sia assunto?

Esercizio 6.12. Un fornitore ha imballato 200 batterie in due scatole, delle quali la prima ne contiene 120 e la seconda 80. Fra le batterie ve ne sono 10 difettose e il fornitore ne mette cinque per scatola. Il cliente proverà due batterie dalla prima scatola e una dalla seconda e se non sono difettose procederà al pagamento. Qual è la probabilità che l’affare si concluda?

Esercizio 6.13. Un dado è truccato in modo tale che la probabilità

sia proporzionale al numero di puntini su ciascuna faccia. i) Qual è la probabilità che lanciando tale dado si verifichi una

faccia con un numero di puntini pari? ii) Qual è la probabilità che lanciando tale dado si verifichi una

faccia con un numero di puntini dispari? iii) Qual è la probabilità che lanciando due dadi di questo tipo la

somma dei puntini sia pari? iv) Qual è la probabilità che lanciando due dadi di questo tipo la

somma dei puntini sia dispari?

Esercizio 6.14. Il 70% dei libri di testo utilizzati presso un corso di Scienze Statistiche sono stampati in una tipografia convenzionata con l’università, mentre la parte restante è stampata presso case editrici nazionali. La probabilità che in una pagina di un libro vi sia un errore di stampa, dato che il libro è stato prodotto dalla tipografia, è 0.08; mentre la probabilità che vi sia un errore in una pagina di un libro, dato che è stato prodotto da una casa editrice, è 0.05. i) Qual è la probabilità che in una pagina di un libro di testo vi sia

un errore? ii) Qual è la probabilità che un libro sia stato stampato nella

tipografia dato che è stato osservato un errore in una pagina?

Page 137: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Calcolo delle probabilità

123

iii) Qual è la probabilità che un libro sia stato stampato da una casa editrice dato che è stato osservato un errore in una pagina?

Esercizio 6.15. Un’azienda vinicola produce sia vino da tavola sia

vino DOC. La sua produzione è distribuita attraverso due canali: il 65% è destinata ai supermercati e la parte restante alle enoteche. La probabilità che sia richiesto vino DOC, dato che l’ordine proviene da un supermercato, è 0.25; mentre la probabilità che sia richiesto vino DOC, dato che è un’enoteca a emettere l’ordine, è 0.80. i) Qual è la probabilità che sia richiesto vino DOC? ii) Qual è la probabilità che l’ordine provenga da un’enoteca dato

che è stata richiesta la qualità DOC? iii) Qual è la probabilità che l’ordine provenga da un supermercato

dato che è stata richiesta la qualità DOC?

Esercizio 6.16. Un’azienda produce ceramica. Due ispettori del controllo di qualità classificano i pezzi prodotti in pezzi di buona qualità da distribuire sul mercato mediante una catena di negozi di lusso e pezzi di scarto da vendere a prezzo ridotto. Ciascun ispettore controlla metà della produzione. Può capitare che dei difetti sfuggano agli ispettori. In particolare la probabilità che il primo ispettore non si accorga di un difetto è 0.05, mentre la probabilità che il secondo ispettore non se ne accorga è 0.03. i) Qual è la probabilità che un difetto sfugga all’ispezione sul

controllo di qualità? ii) Qual è la probabilità che un pezzo difettoso erroneamente

classificato come di buona qualità sia stato esaminato dal primo ispettore?

iii) Qual è la probabilità che un pezzo difettoso erroneamente classificato come di buona qualità sia stato esaminato dal secondo ispettore?

Esercizio 6.17. Un’azienda effettua vendite per corrispondenza

con tre diverse modalità di pagamento: contrassegno, con conto corrente postale e con bonifico bancario. La probabilità che un cliente paghi contrassegno è 0.42 e la probabilità che paghi con bonifico

Page 138: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 124

bancario è 0.28. Il contabile dell’azienda ha osservato che la probabilità che l’importo della vendita superi cento euro, dato che il cliente paga contrassegno, è 0.22; la probabilità che l’importo superi cento euro, dato che il cliente paga con bonifico bancario, è 0.67; infine la probabilità di superare cento euro, dato che il pagamento avviene con conto corrente postale, è 0.35. i) Qual è la probabilità che l’importo della vendita superi cento

euro? ii) Qual è la probabilità che il pagamento avvenga contrassegno dato

che l’importo della vendita ha superato cento euro? iii) Qual è la probabilità che il pagamento avvenga con bonifico

bancario dato che l’importo della vendita ha superato cento euro? iv) Qual è la probabilità che il pagamento avvenga con conto corrente

postale dato che l’importo della vendita ha superato cento euro?

Esercizio 6.18. In un mazzo di carte francesi vi sono 52 carte, fra le quali dodici sono figure. Si estraggono, in blocco, due carte dal mazzo. i) Qual è la probabilità che escano due figure? ii) Qual è la probabilità che non esca alcuna figura? iii) Qual è la probabilità che esca una sola figura?

Esercizio 6.19. Lo spettacolo di un prestigiatore è seguito da 50 spettatori di cui 30 di sesso maschile. Il prestigiatore chiede che due persone vadano sul palco, contemporaneamente, per collaborare a un gioco. La scelta avviene a caso. i) Qual è la probabilità che sul palco vadano due donne? ii) Qual è la probabilità che sul palco vadano due uomini? iii) Qual è la probabilità che sul palco vadano un uomo e una donna?

Page 139: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali

7.1 Introduzione

In molte situazioni gli eventi ai quali si è interessati hanno una naturale interpretazione in termini numerici. I consumi di una famiglia, gli utili di un’impresa, il tempo di accelerazione di un’automobile, la durata di una telefonata, il volume di scambi di un titolo sono tutti eventi rappresentabili mediante un valore. In queste circostanze è utile introdurre una variabile casuale, stabilendo una corrispondenza tra i risultati dell’esperimento e i numeri reali. Ciò consente un’agevole rappresentazione dei risultati e semplifica il calcolo della probabilità di eventi di interesse. Utilizzando una variabile casuale è inoltre possibile sintetizzare le caratteristiche essenziali di un esperimento casuale mediante funzioni di probabilità e opportuni indici. 7.2 Definizione di variabile casuale

Si consideri l’esperimento consistente nel rilevare la spesa di un

cliente scelto a caso in un supermercato. Il risultato che viene osservato – la somma spesa – ha un’ovvia rappresentazione numerica, pertanto è naturale associare a esso il valore di una variabile che indica la spesa. Questa variabile è definita casuale poiché il suo valore dipende dall’esito dell’esperimento casuale.

Page 140: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 126

Anche quando il risultato di un esperimento non ha un’immediata rappresentazione numerica, l’associazione di un valore a ogni risultato può rivelarsi un’operazione utile. Si consideri il controllo di qualità sui pezzi di una produzione; i risultati che si possono osservare in questo esperimento sono “pezzo difettoso” e “pezzo non difettoso”. Al fine di studiare le caratteristiche del processo produttivo, può essere utile definire una variabile casuale che assume valore 1 quando il risultato è “pezzo difettoso” e valore zero quando il risultato è “pezzo non difettoso”.

Dato un esperimento casuale, una variabile casuale è una funzione1 che associa a ogni possibile risultato dell’esperimento un numero reale.

Essa è quindi una variabile che assume valori numerici dipendenti dal risultato di un esperimento casuale.

Figura 7.1 − Rappresentazione di una variabile casuale.

Per convenzione le variabili casuali si indicano con lettera

maiuscola, mentre i valori che esse assumono si indicano con lettera minuscola.

Esempio 7.1. Si consideri il lancio di un dado; lo spazio

campionario è { }1 2 6, , ,S ω ω ω= … , dove iω indica che lanciando il

1 Formalmente una variabile casuale è una funzione definita sullo spazio campionario S che assume valori nell’insieme dei numeri reali R: ( ) :X S Rω → .

ω1

ω2

ω3

ω4 x1 x2

x3

S

Page 141: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali 127

dado si presenta la faccia con i puntini, e gli eventi elementari sono { }1 1E ω= , { }2 2E ω= , …, { }6 6E ω= . In relazione a questo esperimento si può definire sullo spazio

campionario la variabile casuale X che esprime il numero di puntini risultati nel lancio del dado. Essa assume valore 1 1x = quando si verifica 1E , assume valore 2 2x = quando si verifica 2E , e così via fino al valore 6 6x = che si ha quando si verifica 6E .

La corrispondenza tra i risultati di un esperimento e i valori di

una variabile casuale non è necessariamente biunivoca. Nell’esempio 7.1 a ogni risultato dell’esperimento è associato un valore della variabile casuale e viceversa. Tuttavia, in generale, a ogni elemento di S deve corrispondere un solo valore, ma, inversamente, a un valore della variabile casuale possono corrispondere più risultati dell’esperimento. Ad esempio nell’esperimento del lancio del dado si può definire una variabile casuale che assume valore 1 se il risultato è un numero di puntini dispari, cioè quando si verifica E1 oppure E3 oppure E5, e assume invece valore zero se risulta un numero di puntini pari, ossia se si verifica uno degli eventi E2, E4 o E6.

Questa corrispondenza consente di assegnare ai valori assunti dalla variabile casuale la stessa probabilità (globale) che compete agli eventi che concorrono all’individuazione di tali valori. Ad esempio, per la variabile casuale che assume valore 1 quando il risultato del lancio di dado è una faccia con un numero di puntini dispari e zero altrimenti, si ha ( ) ( )2 4 60 1/ 2P X P E E E= = ∪ ∪ = e ( )1P X = = ( )1 3 5P E E E∪ ∪

1/ 2= .

Le variabili casuali si distinguono in discrete e continue. Una variabile casuale è discreta se assume un numero finito o al

più un’infinità numerabile di valori. Il numero di clienti che compiono acquisti in un grande magazzino, il numero di mesi trascorsi in condizione di disoccupazione, il numero di pezzi difettosi di una produzione, il numero di errori in un testo, il numero di reclami ricevuti

Page 142: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 128

da una ditta in un anno, il voto a un esame universitario sono esempi di variabili casuali discrete.

Una variabile casuale invece è continua se può assumere tutti i valori di un intervallo (limitato o illimitato). Il peso di una confezione di biscotti, la percentuale di pezzi difettosi di una produzione, il consumo di carburante di un’automobile, il tempo che intercorre fra una chiamata a un centralino e la successiva, la durata di una batteria sono variabili casuali continue.

7.3 Variabili casuali discrete e funzione di probabilità

Sia X una variabile casuale discreta; essa può assumere un

numero finito di valori { }1 2, , , nx x x… oppure un numero illimitato di valori { }1 2, , , ,ix x x… … . La probabilità che X assuma un particolare valore ix si indica con ( )i ip P X x= = . Una variabile casuale discreta è definita quando è nota la sua funzione di probabilità, ossia l’insieme dei valori che essa può assumere con le rispettive probabilità

( ) ( ) ( )1 1 2 2, , ,i ix p x p x p .

Le probabilità ip hanno le seguenti proprietà:

1) 0ip ≥ , per qualunque i;

2) 1ii

p =∑ .

La prima proprietà afferma che le probabilità ip degli eventi iX x= , per 1, 2, ,i = … sono non negative. E’ una condizione necessaria

affinché sia soddisfatto il primo postulato della probabilità. Per comprendere il significato della seconda proprietà si osservi che gli eventi 1X x= , 2X x= , …, iX x= , … sono necessari e incompatibili – costituiscono una partizione dello spazio campionario – pertanto la somma delle corrispondenti probabilità deve essere uguale a 1.

Page 143: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali 129

Esempio 7.1 (continuazione). Nel lancio di un dado la variabile casuale X, definita come il numero i di puntini osservati, assume i valori 1, 2, , 6ix = … . In particolare l’evento X i= si verifica solo se si verifica l’evento Ei = “si è presentata la faccia con i puntini” che ha probabilità ( ) 1/ 6iP E = ; di conseguenza si ha ( ) 1/ 6ip P X i= = = , per i=1,2,…,6. Al variare di i questa probabilità fornisce la funzione di probabilità illustrata nella figura 7.2.

Figura 7.2 − Funzione di probabilità della variabile casuale generata con il lancio di un dado.

7.4 Variabili casuali continue e funzione di densità

Sia X una variabile casuale continua, che assume tutti i valori in

un intervallo limitato o illimitato. A X è associata una funzione di densità (di probabilità) ( )f x tale che la probabilità ( )P a X b≤ ≤ , che X assuma valori in un intervallo ( ),a b , è data dalla misura dell’area2 sottesa a ( )f x sull’intervallo ( ),a b .

La funzione di densità ha le seguenti proprietà:

1) ( ) 0f x ≥ , per qualunque x;

2) la misura dell’area sotto la funzione di densità è uguale a 1.

2 Utilizzando il calcolo integrale si ha ( ) ( )

b

aP a X b f x dx=≤ ≤ ∫ .

x

1

6

P(X=x)

1 2 3 4 5 6

Page 144: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 130

La prima proprietà è necessaria affinché le probabilità siano non negative. La seconda proprietà3 è equivalente ad affermare che la probabilità dell’evento certo − ovvero X assume un qualsiasi valore reale − è 1.

Una caratteristica delle variabili casuali continue è che la probabilità che assumano un singolo valore è nulla, ossia ( ) 0P X x= = . Infatti la probabilità che assumano un particolare valore

x è data dall’area sotto ( )f x su un intervallo di lunghezza nulla e di conseguenza vale zero. Ciò implica che per le variabili casuali continue, si ha

( ) ( ) ( ) ( )P a X b P a X b P a X b P a X b< < = ≤ < = < ≤ = ≤ ≤ .

7.5 Funzione di ripartizione Sia X una variabile casuale, la funzione di ripartizione ( )F x

esprime la probabilità che X assuma un valore al massimo pari a x

( ) ( )F x P X x= ≤ .

3 Utilizzando il calcolo integrale la seconda proprietà è ( ) 1f x dx

+∞

−∞=∫ .

Figura 7.3 Probabilità che una variabile casuale continua assuma valori in un intervallo (a,b)

f(x)

a b

( )P a X b≤ ≤

Page 145: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali 131

Essa è definita per qualunque valore reale di x4.

Essendo una probabilità, la funzione di ripartizione assume valori nell’intervallo [ ]0,1 . Essa inoltre è una funzione non decrescente e pertanto se 0 1x x< si ha ( ) ( )0 1F x F x≤ .

Nel caso di variabili casuali discrete, il valore della funzione di ripartizione nel punto x è dato dalla somma di tutte le probabilità pi dei valori ix non superiori a x

( )i

ix x

F x p≤

= ∑ .

La funzione di ripartizione delle variabili casuali discrete si presenta graficamente come una funzione a gradini. Essa presenta dei salti in corrispondenza dei valori 1 2, , , ,ix x x… … , di ampiezza uguale alle probabilità ip . La funzione di ripartizione è invece costante per valori di x compresi fra 1ix − e ix . Infine, se X assume un numero n finito di valori, si ha ( ) 1F x = per nx x≥ .

4 La funzione di ripartizione rappresenta la probabilità che compete alla semiretta ( , ]x−∞ . E’ intuitivo che questa funzione dipende dall’estremo superiore di tale insieme e può quindi essere letta come “funzione di x”.

x1 x2 … xi … xn

p1 p2

1 F(x)

pi

pnFigura 7.4 Funzione di ripartizione per variabili casuali discrete

Page 146: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 132

La funzione di ripartizione fornisce le stesse informazioni della funzione di probabilità: i punti di discontinuità corrispondono ai valori assunti dalla variabile casuale e le altezze dei salti sono le probabilità corrispondenti.

Esempio 7.2. Un negoziante di abbigliamento ha acquistato un

capo in pelle per 200 euro. Egli può rivenderlo a 400 euro prima dei saldi oppure in saldi a 250 euro, infine il capo può rimanere invenduto in magazzino. La probabilità che lo rivenda prima dei saldi è 0.50 e la probabilità che lo rivenda in saldi è 0.30.

Sia X la variabile casuale che descrive il profitto del negoziante su questo particolare capo. Se la vendita avviene prima dei saldi si ha

200X = , se la vendita avviene nel periodo dei saldi si ha 50X = , infine se il capo rimane invenduto si ha 200X = − . La funzione di probabilità di X è riportata nella tabella 7.1.

Tabella 7.1 – Funzione di probabilità della variabile casuale X che descrive il

profitto nell’esempio 7.2. Profitto -200 50 200 Probabilità 0.20 0.30 0.50

La funzione di ripartizione è nulla per 200x < − ,

( ) ( )200 0.20F x P X= = − = per 200 50x− ≤ < , ( ) ( )200F x P X= = − ( )50 0.20 0.30 0.50P X+ = = + = per 50 200x≤ < e ( ) 1F x = per 200x ≥ . In sintesi

( ) 0, per 200;( ) 0.2, per 200 50;( ) 0.5, per 50 200;( ) 1, per 200.

F x xF x xF x xF x x

= < −= − ≤ <= ≤ <= ≥

Si osservi che la funzione di ripartizione è definita per qualsiasi valore reale sebbene X assuma soltanto tre valori e non possa risultare né minore di 200− né maggiore di 200. Il grafico della funzione di ripartizione è illustrato nella figura 7.5.

Page 147: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali 133

Figura 7.5 Funzione di ripartizione nell’esempio 7.2 Nel caso di variabili casuali continue il valore della funzione di

ripartizione in x è dato dalla misura dell’area5 sottesa alla funzione di densità fino al punto x.

Se la variabile casuale è continua, la funzione di ripartizione è

continua e varia fra zero e 1 come illustrato nella figura 7.7.

5 Utilizzando il calcolo integrale la funzione di ripartizione risulta

( ) ( )x

F x f u du−∞

= ∫ . La funzione di ripartizione è la primitiva della funzione di

densità (fissato il vincolo che la costante sia nulla) e pertanto si ha ( ) ( )dF xf x

dx= .

1

0.2

0.5

F(x)

f(x)

F(x)

x

Figura 7.6 Valore della funzione di ripartizione per variabili casuali continue

Page 148: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 134

1

La probabilità che una variabile casuale X, discreta o continua,

assuma valori in un intervallo ( , ]a b può essere calcolata come differenza fra il valore che la funzione di ripartizione assume nell’estremo superiore dell’intervallo e quello che assume nell’estremo inferiore, cioè

( ) ( ) ( )aFbFbXaP −=≤< .

7.6 Valore atteso

Nell’ambito della statistica descrittiva è stato osservato che, sebbene la distribuzione di frequenza fornisca tutte le informazioni su un insieme di dati, vi sono circostanze nelle quali è utile costruire degli indici che caratterizzino gli aspetti essenziali della distribuzione. Analogamente, nell’ambito del calcolo delle probabilità, la funzione di probabilità nel caso discreto e la funzione di densità nel caso continuo o, ancora, la funzione di ripartizione contengono tutte le informazioni su una variabile casuale. Tuttavia è utile avere a disposizione anche degli indici che sintetizzino le principali caratteristiche della variabile casuale e, in particolare, la posizione e la variabilità.

x

Figura 7.7 Funzione di ripartizione di una variabile casuale continua

F(x)

Page 149: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali 135

Un indice che fornisce informazioni sulla posizione di una variabile casuale X è il valore atteso. Esso si indica con [ ]E X oppure con µ .

Nel caso di variabili casuali discrete il valore atteso è dato da6

[ ]ii

iE X x pµ = =∑ .

E’ immediato verificare che il valore atteso di una variabile casuale è la quantità corrispondente, nel contesto probabilistico, alla media di una distribuzione nel contesto descrittivo. Il valore atteso infatti è anche definito media della variabile casuale.

Per interpretare il valore atteso si supponga che il risultato di un esperimento casuale sia descritto da una variabile casuale X, discreta o continua, e si considerino N replicazioni indipendenti dell’esperimento. Il valore atteso [ ]E X può essere interpretato come il valore cui converge la media dei valori osservati di X quando N diventa infinitamente grande.

Esempio 7.3. Una fabbrica produce ganci per appendere quadri e

li vende in confezioni da 20. Il proprietario della fabbrica ha stimato che la probabilità che in una scatola non vi siano ganci difettosi è 0.85, la probabilità che vi sia un gancio difettoso è 0.12 e la probabilità che vi siano due ganci difettosi è 0.03.

Sia X la variabile casuale che descrive il numero di ganci difettosi; la distribuzione di X è riportata nella tabella 7.2.

Tabella 7.2 – Funzione di probabilità della variabile casuale X che descrive il numero di ganci difettosi nell’esempio 7.3. Ganci difettosi 0 1 2 Probabilità 0.85 0.12 0.03

6 Il valore atteso di una variabile casuale continua X è dato da [ ] ( )E X x f x dx

+∞

−∞= ∫ .

Page 150: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 136

Il valore atteso di X è dato da

[ ]2

0( ) 0 0.85 + 1 0.12 + 2 0.03 = 0.18

xE X xP X xµ

=

= = = = × × ×∑

Questo risultato può essere interpretato nel modo seguente: se si considera un elevato numero di scatole il numero medio di ganci difettosi per scatola è 0.18.

Data una variabile casuale X, è possibile considerare una sua funzione ( )Y g X= . Una funzione di variabile casuale è a sua volta una variabile casuale. E’ pertanto possibile calcolare il suo valore atteso [ ]E Y . Nel caso di variabili casuali discrete esso è dato da7

[ ] [ ]( ) ( )ii

iE Y E g X g x p= =∑ .

Il valore atteso ( )E g X può essere interpretato come il valore cui converge la media dei valori osservati di ( )g X quando l’esperimento viene replicato un numero infinitamente grande di volte.

L’espressione di ( )E g X mostra che il valore atteso di una variabile casuale Y, definita come una funzione ( )g X della variabile casuale X, può essere calcolato conoscendo soltanto la distribuzione di X (e non necessariamente quella di Y).

Particolarmente interessante è il caso nel quale ( )g X aX b= + ; si definisce così la trasformazione lineare Y aX b= + della variabile casuale X. Anche Y è una variabile casuale perchè funzione di variabile casuale. Il valore atteso di Y è dato dalla trasformazione lineare del valore atteso di X

(7.1) [ ] [ ] [ ]E Y E aX b aE X b= + = + .

7 Se X è una variabile casuale continua si ha [ ( )] ( ) ( )E g X g x f x dx

+∞

−∞= ∫ .

Page 151: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali 137

E’ immediato verificare questo risultato nel caso di variabili casuali discrete. Ai valori ix della variabile casuale X corrispondono i valori i iy ax b= + della variabile casuale Y con le stesse probabilità ip . Pertanto si ha

[ ] ( )i i i i i i ii i i i

E Y y p ax b p a x p b p= = + = +∑ ∑ ∑ ∑ ,

osservando che [ ]i ix p E X=∑ e 1ip =∑ si ottiene la (7.1).

Esempio 7.4. Il reddito di un promotore finanziario è in parte fisso e in parte variabile. Egli percepisce una quota fissa giornaliera di 50 euro più una somma pari a 10 euro per ogni contratto concluso. Sia X la variabile casuale che descrive il numero di contratti conclusi quotidianamente. La funzione di probabilità è riportata nella tabella 7.3.

Tabella 7.3 – Funzione di probabilità della variabile casuale X che descrive il

numero di contratti nell’esempio 7.4. Contratti 0 1 2 3 4 Probabilità 0.15 0.25 0.35 0.20 0.05

Si vuole calcolare il reddito atteso del promotore finanziario. A

tal fine si osservi che il reddito Y è dato da 10 50Y X= + , pertanto per la (7.1) il valore atteso di Y risulta [ ] [ ]10 50E Y E X= × + . La media dei contratti conclusi quotidianamente è

[ ] 0 0.15 1 0.25 2 0.35 3 0.20 4 0.05 1.75E X = × + × + × + × + × = ;

di conseguenza il reddito atteso è [ ] 10 1.75 50 67.50E Y = × + = euro.

Un caso di particolare interesse si ha quando, nel considerare la trasformazione lineare Y aX b= + , la costante a è nulla. Applicando la (7.1) si ha

[ ]E b b= ,

ossia il valore atteso di una costante coincide con la costante stessa.

Page 152: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 138

7.7 Varianza

Nella statistica descrittiva la dispersione di un insieme di dati rispetto alla media è misurata dalla varianza, ossia dalla media dei quadrati degli scarti. Lo stesso approccio è utilizzato nel calcolo delle probabilità per misurare la dispersione di una variabile casuale rispetto al suo valore atteso.

Sia X una variabile casuale con media µ , la varianza si indica con ( )Var X oppure 2σ ed è data dal valore atteso del quadrato degli scarti di X dalla sua media8

2 2( ) ( )Var X E Xσ µ = = − .

Essa è un indice di dispersione di X intorno alla media.

Per le variabili casuali discrete la varianza9 è data da

( )22i i

ix pσ µ= −∑ .

Esempio 7.3 (continuazione). La variabile casuale X che descrive

il numero di ganci difettosi per scatola, nell’esempio 7.3, ha valore atteso 0.18. La varianza è invece data da

22 2

02 2 2

( ) ( )

(0 0.18) 0.85 (1 0.18) 0.12 (2 0.18) 0.03 0.21.x

x P X xσ µ=

= − =

= − × + − × + − × =

La varianza può anche essere calcolata come differenza fra il

valore atteso del quadrato di X e il quadrato della media

8 La varianza è il valore atteso della funzione ( ) ( )2g X X µ= − di X . 9 Nel caso di variabili casuali continue la varianza è data da

2 2( ) ( )x f x dxσ µ+∞

−∞= −∫ .

Page 153: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali 139

(7.2) 2 2 2( )Var X E Xσ µ = = − .

E’ immediato verificare questo risultato nel caso discreto, infatti

( ) ( )22 2 2

2 2

2

2 .

i i i i ii i

i i i i ii i i

x p x x p

x p x p p

σ µ µ µ

µ µ

= − = − +

= − +

∑ ∑

∑ ∑ ∑

Poiché 2 2i ix p E X = ∑ , [ ]i ix p E X=∑ e 1ip =∑ , si ha

2 2 2 2 2 22 .E X E Xσ µ µ µ = − + = − La determinazione positiva della radice quadrata della varianza,

2σ σ= , è lo scarto quadratico medio di X. Solitamente σ risulta un indice di variabilità più conveniente da utilizzare perché è espresso nella stessa unità di X.

Esempio 7.3 (continuazione). Si consideri la variabile casuale X

che descrive il numero di ganci difettosi per scatola dell’esempio 7.3. Per calcolare la varianza con la (7.2) è necessario calcolare il valore atteso del quadrato della X, cioè 2E X . Esso è dato da

( )2

2 2 2 2 2

0

0 0.85 1 0.12 2 0.03 0.24x

E X x P X x=

= = = × + × + × = ∑ .

Di conseguenza, la varianza è 2 20.24 0.18 0.21σ = − = e lo scarto quadratico risulta 0.21 0.46σ = = .

La disuguaglianza di Chebyshev, già incontrata nell’ambito della

statistica descrittiva (paragrafo 4.2.2), rende ancor più evidente il ruolo della varianza come indice di dispersione intorno alla media. Per una qualsiasi variabile casuale X, la disuguaglianza di Chebyshev afferma che

Page 154: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 140

( )2

21P X σµ εε

− < ≥ − ,

per qualunque 0ε > . La probabilità che X assuma valori in un intorno della media, di semi-ampiezza ε, è almeno pari a 2 21 σ ε− . Di conseguenza quando la varianza aumenta X assume con maggiore probabilità valori distanti da µ e viceversa quando la varianza decresce X assume con minore probabilità valori distanti da µ .

Sia X una variabile casuale con media Xµ e varianza 2Xσ e

Y aX b= + una sua trasformazione lineare. La (7.1) ha dimostrato che il valore atteso di Y è dato dalla trasformazione lineare del valore atteso di X, [ ]Y XE Y a bµ µ= = + . La varianza di Y invece è data da

(7.3) 2 2 2( ) ( )Y XVar Y Var aX b aσ σ= = + = .

Per definizione si ha

( )2( ) .i y i

iVar Y y pµ= −∑

Si osservi che per la (7.1) gli scarti risultano

( )i y i x i x i xy ax b a b ax a a xµ µ µ µ− = + − − = − = − ;

pertanto l’aggiunta della costante additiva b non ha influenza sugli scarti. Continuando si ha

( ) ( )2 22 2 2( ) i X i i X i Xi i

Var Y a x p a x p aµ µ σ= − = − = ∑ ∑ ,

il che prova la (7.3).

La varianza non è influenzata da traslazioni della distribuzione provocate dal termine b, perché gli scarti non né risentono, ma risente dei cambiamenti nella scala che si producono moltiplicando X per la costante a. Di conseguenza lo scarto quadratico medio di Y è dato da

Y Xaσ σ= .

Page 155: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali 141

Esempio 7.4 (continuazione). Si vuole calcolare la varianza del reddito del promotore finanziario dell’esempio 7.4. Il reddito è descritto dalla trasformazione lineare 10 50Y X= + della variabile casuale X che descrive il numero di contratti conclusi quotidianamente. La media di X è 1 75X .µ = e la sua varianza è 2 2 2 24.25 1.75X XE Xσ µ = − = −

1.19= . Di conseguenza la varianza di Y risulta 2 210 1.19 119Yσ = × = e lo scarto quadratico medio è 10 91Y .σ = .

Se si considera una trasformazione lineare Y aX b= + dove la

costante a è nulla, si ottiene Y b= . La variabile casuale Y si riduce alla costante b, cioè a una cosiddetta variabile casuale degenere. Applicando la (7.3) con 0a = si ha

( ) 0Var b = ,

ossia una costante ha varianza nulla. 7.8 Variabili casuali standardizzate

In alcune circostanze può risultare utile standardizzare una variabile casuale. Data una variabile casuale X, con media µ e varianza

2σ , la variabile casuale standardizzata è definita da

XZ µσ−

= .

La variabile casuale Z si può ottenere come una particolare trasformazione lineare di X, ponendo 1a / σ= e b /µ σ= − ,

1Z X µσ σ

= − .

Una variabile casuale standardizzata ha sempre media nulla e varianza unitaria. Infatti applicando la (7.1) si ha

[ ] [ ]1 0E Z E X µσ σ

= − = ,

Page 156: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 142

mentre applicando la (7.3) si ottiene

( ) ( )2

1 1Var Z Var Xσ

= = .

La standardizzazione risulta quindi particolarmente utile quando si vuole rendere la distribuzione indipendente dalla posizione e dalla scala. 7.9 Esercizi

Esercizio 7.1. La tabella 7.4 riporta la funzione di probabilità del numero di errori di stampa nelle pagine dei libri prodotti da una tipografia. Si indichi con X la variabile casuale che descrive il numero di errori per pagina. i) Calcolare e rappresentare graficamente la funzione di ripartizione

di X. ii) Calcolare il valore atteso e la varianza di X.

Tabella 7.4 – Funzione di probabilità del numero di errori di stampa nelle

pagine dei libri stampati da una tipografia. Numero di Errori 0 1 2 Probabilità 0.952 0.031 0.017

Esercizio 7.2. La tabella 7.5 riporta la funzione di probabilità del

numero di carte di credito possedute dai clienti di un grande magazzino. Si indichi con X la variabile casuale che descrive il numero di carte di credito. i) Calcolare e rappresentare graficamente la funzione di ripartizione

di X. ii) Calcolare il valore atteso e la varianza di X.

Tabella 7.5 – Funzione di probabilità del numero di carte di credito possedute

dai clienti di un grande magazzino. Carte di credito 0 1 2 3 Probabilità 0.27 0.46 0.18 0.09

Page 157: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali 143

Esercizio 7.3. La tabella 7.6 riporta la distribuzione del tasso di rendimento di un titolo. Sia X la variabile casuale che descrive il rendimento. i) Calcolare e rappresentare graficamente la funzione di ripartizione

di X. ii) Calcolare il valore atteso e la varianza di X.

Tabella 7.6 – Funzione di probabilità del tasso di rendimento di un titolo.

Rendimento -1.2 -0.5 1.3 2.5 4.0 Probabilità 0.05 0.14 0.37 0.25 0.19

Esercizio 7.4. Una variabile casuale X assume valori { }2 3,1 ,2

con probabilità ( ) ( )1 3P X x x= = . i) Calcolare la funzione di probabilità. ii) Calcolare e rappresentare graficamente la funzione di ripartizione

di X. iii) Calcolare il valore atteso e la varianza di X.

Esercizio 7.5. Calcolare il valore atteso e lo scarto quadratico medio della variabile casuale che descrive il profitto del negoziante nell’esempio 7.2.

Esercizio 7.6. Un libero professionista è incerto circa i suoi redditi

lordi mensili. Egli può guadagnare 4500 euro con probabilità 0.30, oppure 3700 euro con probabilità 0.40 o, infine, può guadagnare 3000 euro. L’imposta sul reddito è proporzionale con un’aliquota media del 35%. Sia X la variabile casuale che descrive il reddito al netto dell’imposta. Calcolare il valore atteso e lo scarto quadratico medio di X.

Esercizio 7.7. Per acquistare un appartamento uno speculatore del

settore immobiliare deve sostenere un costo di 500 mila euro. Egli può rivendere l’appartamento a 700 mila euro, a 550 mila euro o a 450 mila euro. La probabilità che lo rivenda a 700 mila euro è 0.24, mentre la probabilità che lo rivenda a 550 euro è 0.56. Sia X la variabile casuale

Page 158: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 144

che descrive il profitto dello speculatore, si calcoli il valore atteso e lo scarto quadratico medio.

Page 159: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 8.1 Introduzione

Nel precedente capitolo sono state definite le variabili casuali univariate associando a ogni risultato di un esperimento casuale un numero reale. In molte situazioni può esservi più di un fenomeno di interesse, sicché risulta utile descrivere il risultato dell’esperimento mediante una coppia di variabili casuali.

In un’indagine sul reddito per ogni famiglia può essere rilevato contemporaneamente il reddito di entrambi i coniugi. Nel controllo di qualità su una produzione di bulloni, può essere opportuno verificare sia il diametro sia l’altezza dei bulloni. In un’indagine sulla soddisfazione dei clienti di una catena di fast food, può essere chiesto loro di esprimere una valutazione sia sulla qualità del cibo sia su quella del servizio. Quando l’interesse riguarda due caratteristiche, che si manifestano congiuntamente sulla stessa unità statistica, un’adeguata rappresentazione dell’esperimento può essere ottenuta mediante una variabile casuale doppia o variabile casuale bivariata.

In altre circostanze infine l’interesse può riguardare un insieme di n caratteristiche che si manifestano sulla stessa unità statistica, dove

2n > . In tal caso la descrizione del fenomeno avviene mediante una variabile casuale multivariata. Nel presente capitolo l’attenzione è rivolta principalmente alle variabili casuali doppie, tuttavia alcuni risultati di particolare interesse sono generalizzati al caso di variabili casuali multivariate.

Page 160: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 146

8.2 Definizione di variabile casuale doppia

Dato un esperimento casuale, una variabile casuale doppia ( ),X Y è definita associando a ogni risultato una coppia di valori reali ( ),x y . In uno studio sugli sbocchi occupazionali dei laureati è interessante analizzare simultaneamente il voto con il quale è stata conseguita la laurea e il tempo impiegato per trovare un’occupazione. Questi due fenomeni possono essere descritti congiuntamente mediante una coppia di variabili casuali, delle quali la prima, X, indica il voto e la seconda, Y, rappresenta i mesi intercorsi fra la laurea e il primo impiego.

Figura 8.1 – Rappresentazione di una variabile casuale doppia.

Le variabili X e Y che costituiscono la variabile casuale doppia

( ),X Y sono definite marginali. Se entrambe le variabili sono discrete la variabile casuale doppia è discreta, mentre se entrambe le variabili sono continue si ha una variabile casuale doppia continua. Sebbene possibile, raramente si incontrano variabili casuali doppie delle quali una componente è discreta e l’altra è continua.

Quando si studia una variabile casuale doppia ( ),X Y l’interesse riguarda in via prioritaria la distribuzione congiunta; essa esprime la probabilità con la quale contemporaneamente entrambe le variabili assumono specifici valori. Lo studio della distribuzione congiunta è

ω1 ω2

ω3

x1 x2 x3 X

S y1

y2

y3

Y

(x3 , y3)

(x1 , y1)

(x2 , y2)

Page 161: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 147

essenziale per l’analisi dei legami e, in particolare, delle forme di dipendenza esistenti fra le componenti della variabile casuale doppia.

Tuttavia in alcune circostanze può essere utile considerare anche le distribuzioni marginali, ossia le distribuzioni della X e della Y considerate singolarmente. Quando le componenti della variabile casuale doppia sono analizzate separatamente, lo studio riguarda la distribuzione di variabili casuali univariate e può essere realizzato utilizzando le metodologie del precedente capitolo.

Infine può risultare interessante studiare le distribuzioni condizionate, analizzando la distribuzione di una delle due variabili dato che l’altra ha assunto un particolare valore. Così, nello studio degli sbocchi occupazionali dei laureati, si può considerare la distribuzione della variabile casuale Y − che rappresenta il tempo necessario per trovare lavoro − condizionata alla circostanza che la variabile casuale X − il voto − ha assunto un determinato valore. Lo studio delle distribuzioni condizionate consente di mettere in evidenza se e in quale modo il valore assunto da una delle due variabili influenza la distribuzione dell’altra variabile. 8.3 Variabili casuali doppie discrete 8.3.1 Funzioni di probabilità congiunta e funzioni di probabilità marginali

Sia ( ),X Y una variabile casuale doppia discreta e, per semplicità, si supponga che sia X sia Y assumano un numero finito di valori; sicché X assume i valori 1 2, , , kx x x… e Y assume i valori 1 2, , , hy y y… . La variabile casuale doppia ( ),X Y assume valore ( ),i jx y quando si verificano contemporaneamente gli eventi iX x= e jY y= . A ogni coppia di valori ( ),i jx y , per i=1,2,…,k e j=1,2,…,h, è associata una probabilità congiunta

( ) ( )ij i jp P X x Y y = = ∩ = .

Page 162: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 148

L’insieme di tutte le possibili coppie di valori ( ),i jx y con le corrispondenti probabilità ijp costituisce la funzione di probabilità congiunta della variabile casuale doppia ( ),X Y .

Le probabilità congiunte soddisfano due condizioni:

1) 0ijp ≥ , per i=1,2,…,k e j=1,2,…,h;

2) 1 1

1k h

iji j

p= =

=∑∑ .

Come per le variabili casuali univariate, la prima proprietà assicura che le probabilità siano non negative in coerenza con il primo postulato della probabilità. La seconda proprietà si spiega osservando che le coppie di valori ( ),i jx y sono eventi necessari – che la variabile casuale ( ),X Y assuma una qualsiasi coppia di questi valori è l’evento certo – e incompatibili – soltanto una coppia di valori ( ),i jx y può verificarsi – pertanto la somma delle loro probabilità deve essere 1.

A partire dalla funzione di probabilità congiunta è possibile

ottenere le funzioni di probabilità marginali. Per determinarle si segue l’approccio del paragrafo 6.10, dove le probabilità marginali degli eventi iA , per 1, 2, ,i k= … , e jB , per 1, 2, ,j h= … , sono state derivate dalle probabilità congiunte ijp . L’evento iX x= si verifica quando si verifica la coppia di valori ( )1,ix y oppure la coppia ( )2,ix y , ..., oppure la coppia ( ),i hx y . Trattandosi di eventi incompatibili, la probabilità marginale ( )iP X x= è data da

[ ] [ ]1( ) ( ) ( ) ( ) ( )i i i hP X x P X x Y y P X x Y y= = = ∩ = + ⋅⋅⋅+ = ∩ = .

Utilizzando la notazione ( ).i ip P X x= = , per i=1,2,…,k, si ha

(8.1.a) 1

.h

i ijj

p p=

= ∑ .

Analogamente, indicando con ( ). j jp P Y y= = la probabilità marginale della Y corrispondente al valore jy , per j=1,2,…,h, si ha

Page 163: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 149

(8.1.b) 1

.k

j iji

p p=

= ∑ .

I risultati (8.1.a) e (8.1.b) riproducono nel contesto delle variabili casuali doppie discrete le formule (6.14.a) e (6.14.b).

Le funzioni di probabilità marginali, .ip per 1, 2,...,i k= e . jp per 1, 2,...,j h= , sono le funzioni di probabilità (univariate) della X e della Y. Pertanto, le probabilità marginali sono non negative,

. 0 per 1,2, , , . 0 per 1, 2, , ,i jp i k p j h≥ = ≥ =… …

e la loro somma è pari a 1

. .1 1

1k h

i ji j

p p= =

= =∑ ∑ .

La funzione di probabilità congiunta di una variabile casuale doppia discreta ( ),X Y e le funzioni di probabilità marginali possono essere rappresentate simultaneamente in una tabella a doppia entrata (tabella 8.1). Al centro vi sono le probabilità congiunte, mentre nell’ultima riga e nell’ultima colonna vi sono le probabilità marginali. In particolare le probabilità marginali della X sono date dai totali di riga, mentre le probabilità marginali della Y sono date dai totali di colonna.

Tabella 8.1 − Distribuzione di una variabile casuale doppia discreta.

Y X 1y 2y … hy

1x 11p 12p … 1hp 1.p

2x 21p 22p … 2 hp 2 .p

kx 1kp 2kp … khp .kp

1.p 2.p … .hp 1

Sulla base delle distribuzioni marginali è possibile calcolare i

valori attesi marginali Xµ e Yµ e le varianze marginali 2Xσ e 2

Yσ delle variabili casuali X e Y

Page 164: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 150

1

.k

X i ii

x pµ=

= ∑ , 1

.h

Y j jj

y pµ=

= ∑ ,

e

( )22

1

.k

X i X ii

x pσ µ=

= −∑ , ( )22

1.

h

Y j Y jj

y pσ µ=

= −∑ .

Esempio 8.1. Il direttore di un grande magazzino intende

verificare se i clienti dotati della carta fedeltà hanno un comportamento diverso da coloro che ne sono sprovvisti. A tal fine ha rilevato il numero di acquisti compiuti dai clienti congiuntamente al possesso della carta fedeltà. Sia X una variabile casuale che assume valore 1 se il cliente ha la carta fedeltà e zero altrimenti e sia Y una variabile casuale che descrive il numero di acquisti. Il dirigente ha stimato la funzione di probabilità congiunta per X e Y riportata nella tabella 8.2.

Tabella 8.2 − Distribuzione congiunta per il possesso della carta fedeltà (X) e il

numero di acquisti (Y) nell’esempio 8.1. Y

X 1 2 3 0 0.20 0.15 0.05 0.40 1 0.20 0.25 0.15 0.60 0.40 0.40 0.20 1

La funzione di probabilità marginale della X fornisce la

probabilità che un cliente possegga o non possegga la carta fedeltà. Essa è stata ottenuta sommando le probabilità congiunte su ciascuna riga nel modo seguente

( ) ( ) ( ) ( )( ) ( )

( 0) 0 1 0 2

0 3

0.20 0.15 0.05 0.40,

P X P X Y P X Y

P X Y

= = = ∩ = + = ∩ = + = ∩ =

= + + =

Page 165: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 151

( ) ( ) ( ) ( )( ) ( )

( 1) 1 1 1 2

1 3

0.20 0.25 0.15 0.60.

P X P X Y P X Y

P X Y

= = = ∩ = + = ∩ = + = ∩ =

= + + =

Analogamente la funzione di probabilità marginale del numero di acquisti, ossia della variabile casuale Y, è stata ottenuta sommando le probabilità congiunte su ciascuna colonna come segue

( )( )( )

1 0.20 0.20 0.40,

2 0.15 0.25 0.40,

3 0.05 0.15 0.20.

P Y

P Y

P Y

= = + =

= = + =

= = + =

Il numero medio degli acquisti compiuti dai clienti è dato dal valore atteso marginale della variabile casuale Y,

[ ] 1 0.40 2 0.40 3 0.20 1.8E Y = × + × + × = ,

mentre la varianza del numero di acquisti è data da

( ) ( ) ( ) ( )2 2 21 1.8 0.40 2 1.8 0.40 3 1.8 0.20 0.56Var Y = − × + − × + − × = .

Esempio 8.2. A una prova scritta di un esame universitario un

docente ha somministrato un questionario con trenta domande a scelta multipla. Per ogni quesito lo studente può scegliere fra tre possibili risposte, delle quali una sola è corretta. Se lo studente risponde correttamente a una domanda acquisisce un punto, se non risponde ha zero punti, se infine dà una risposta errata consegue una valutazione negativa pari a –1/2. L’esame è sostenuto sia da studenti che hanno seguito il corso che da studenti che non l’hanno seguito. Dopo un elevato numero di esami il docente ha stimato alcune probabilità. In particolare la probabilità che uno studente abbia seguito il corso risulta 0.65. Per ciascun quesito la probabilità che uno studente risponda correttamente è 0.50 e la probabilità che non risponda è 0.20. La probabilità che uno studente abbia seguito il corso e risponda

Page 166: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 152

correttamente è 0.40, mentre la probabilità che uno studente non abbia seguito il corso e dia una risposta errata è 0.15.

Sia X una variabile casuale che assume valore 1 se lo studente ha seguito il corso e zero altrimenti e sia Y una variabile casuale che rappresenta il punteggio conseguito al singolo quesito. Si vuole determinare la funzione di probabilità congiunta della variabile casuale doppia ( ),X Y .

Le probabilità note fin qui sono riportate in corsivo nella tabella 8.3. Inizialmente si determinano le distribuzioni di probabilità marginali. La probabilità che X assuma valore 1 è ( )1 0.65P X = = ; di conseguenza, affinché la somma delle probabilità marginali sia 1, la probabilità che la X assuma valore zero risulta

( )0P X = ( )1 1 1 0.65 0.35P X= − = = − = .

La variabile casuale Y assume tre valori –1/2, 0 e 1. Sono note le probabilità con le quali la Y assume i valori 0 – quando uno studente non risponde – e 1 – quando uno studente risponde correttamente. Esse sono ( )0 0.20P Y = = e ( )1 0.50P Y = = . Dato che la somma delle probabilità marginali deve essere pari a 1 si ha

( ) ( ) ( )1/ 2 1 0 1 1 0.20 0.50 0.30P Y P Y P Y= − = − = − = = − − = .

Successivamente si determinano le probabilità congiunte. E’ nota la probabilità che contemporaneamente 1X = e 1Y = . La coppia (1,1) si verifica quando lo studente ha seguito il corso e risponde correttamente e ha probabilità ( ) ( )1 1 0.40P X Y= ∩ = = . Ciò consente di calcolare la probabilità della coppia (0,1). Infatti la somma di queste due probabilità deve essere uguale alla probabilità marginale con la quale la variabile casuale Y assume valore 1. Di conseguenza si ha

( ) ( ) ( ) ( ) ( )0 1 1 1 1

0.50 0.40 0.10.

P X Y P Y P X Y= ∩ = = = − = ∩ = = − =

Page 167: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 153

E’ nota inoltre la probabilità della coppia ( )0, 1/ 2− che si verifica quando uno studente non ha seguito il corso e dà una risposta errata; essa è ( ) ( )0 1/ 2 0.15P X Y= ∩ = − = . Ciò consente di determinare la probabilità della coppia ( )0, 1/ 2− , in modo analogo a quanto fatto precedentemente, come differenza fra la probabilità marginale con la quale la Y assume valore –1/2 e la probabilità della coppia (0,–1/2). Si ha

( ) ( ) ( ) ( ) ( )1 1/ 2 1/ 2 0 1/ 2

0.30 0.15 0.15.

P X Y P Y P X Y= ∩ = − = = − − = ∩ = − = − =

Infine per determinare le probabilità delle coppie (0,0) e (0,1) si tiene conto che i totali delle probabilità congiunte per riga devono coincidere con le probabilità marginali della X. Pertanto si ha

( ) ( )( ) ( ) ( ) ( ) ( )

0 0

0 0 1/ 2 0 1

0.35 0.15 0.10 0.10,

P X Y

P X P X Y P X Y

= ∩ = = = − = ∩ = − − = ∩ = = − − =

( ) ( )( ) ( ) ( ) ( ) ( )

1 0

1 1 1/ 2 1 1

0.65 0.15 0.40 0.10.

P X Y

P X P X Y P X Y

= ∩ = = = − = ∩ = − − = ∩ = = − − =

La distribuzione di probabilità congiunta di X e Y è riportata nella tabella 8.3.

Tabella 8.3 − Distribuzione di probabilità congiunta per la frequenza al corso

(X) e il punteggio (Y) nell’esempio 8.2. Y Totale

X -1/2 0 1 0 0.15 0.10 0.10 0.35 1 0.15 0.10 0.40 0.65

Totale 0.30 0.20 0.50 1

Page 168: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 154

8.3.2 Funzione di probabilità condizionata Le funzioni di probabilità condizionate sono utili per valutare

l’influenza che il valore assunto da una delle due variabili ha sulla probabilità con la quale l’altra variabile assume i diversi valori. Esse possono essere ottenute applicando la definizione di probabilità condizionata (6.5) introdotta nel paragrafo 6.6. La funzione di probabilità condizionata della variabile casuale Y, dato che la variabile casuale X ha assunto il valore ix , è data da

( ) ( )( | )

( ) .i j ij

j ii i

P X x Y y pP Y y X x

P X x p = ∩ = = = = =

=,

per j=1,2,…,h. La funzione di probabilità condizionata della Y, dato che la X ha assunto il valore ix , si ottiene dividendo le probabilità sulla i-esima riga della tabella 8.1 per il loro totale. Analogamente la funzione di probabilità condizionata della X, dato che la Y ha assunto il valore

jy , è data da

( ) ( )( | )

( ) .i j ij

i jj j

P X x Y y pP X x Y y

P Y y p = ∩ = = = = =

=,

per 1, 2,...,i k= e può essere agevolmente calcolata dividendo le probabilità sulla j-esima colonna della tabella 8.1 per il loro totale1.

Le probabilità condizionate sono non negative. Inoltre, per un dato jy si ha

( )1 1 1

1 1| . 1. . .

k k kij

i j ij ji i ij j j

pP X x Y y p p

p p p= = =

= = = = = =∑ ∑ ∑

e, analogamente, per ix fissato si ha

1 Se X assume k valori, vi sono k funzioni di probabilità condizionate di Y dato il valore della X e analogamente se Y assume h valori, vi sono h funzioni di probabilità condizionate di X dato il valore di Y.

Page 169: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 155

( )1

| 1h

j ij

P Y y X x=

= = =∑ .

Anche per le distribuzioni condizionate è possibile calcolare il valore atteso e la varianza. Il valore atteso condizionato della variabile casuale Y, dato che X ha assunto il valore ix , è

[ ] ( )1 1

| |.

h hij

i j j i jj j i

pE Y X x y P Y y X x y

p= =

= = = = =∑ ∑

e la varianza condizionata è

( ) [ ]( ) ( )

[ ]( )

2

1

2

1

| | |

| ..

h

i j i j ij

hij

j ij i

Var Y X x y E Y X x P Y y X x

py E Y X x

p

=

=

= = − = = =

= − =

Analogamente per X si ha

1

|.

kij

j ii j

pE X Y y x

p=

= = ∑

e

( ) ( )2

1| |

.

kij

j i ji j

pVar X Y y x E X Y y

p=

= = − = ∑ .

Esempio 8.1 (continuazione). Per verificare se la distribuzione del

numero di acquisti dipende dal possesso della carta fedeltà è utile considerare le funzioni di probabilità condizionate della Y, per 0X = e

1X = , e confrontarle. Per i clienti che non hanno la carta fedeltà la funzione di probabilità condizionata della Y, per 0X = , è data da

( ) ( )( )

0 1 0.201| 0 0.500,0 0.40

P X YP Y X

P X= ∩ =

= = = = ==

Page 170: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 156

( ) ( )( )

0 2 0.152 | 0 0.375,0 0.40

P X YP Y X

P X= ∩ =

= = = = ==

( ) ( )( )

0 3 0.053 | 0 0.125.0 0.40

P X YP Y X

P X= ∩ =

= = = = ==

La funzione di probabilità condizionata della Y dato 1X = invece risulta2

( ) ( )( )

( ) ( )( )

( ) ( )( )

1 1 0.201| 1 0.333,1 0.60

1 2 0.252 | 1 0.417,1 0.60

1 3 0.153 | 1 0.250.1 0.60

P X YP Y X

P X

P X YP Y X

P X

P X YP Y X

P X

= ∩ == = = = =

=

= ∩ == = = = =

=

= ∩ == = = = =

=

Le funzioni di probabilità condizionata mettono in evidenza che i clienti dotati della carta fedeltà, tendenzialmente, compiono un maggior numero di acquisti.

Più sinteticamente questo risultato può essere evidenziato mediante i valori attesi delle distribuzioni condizionate. Il numero medio di acquisti per i clienti sprovvisti della carta fedeltà è dato dal valore atteso della Y condizionato ad 0X =

[ ] ( ) ( )( )

| 0 1 1| 0 2 2 | 0

3 3 | 01 0.500 2 0.375 3 0.125 1.625.

E Y X P Y X P Y X

P Y X

= = × = = + × = =

+ × = =

= × + × + × =

2 In alternativa, poiché la somma delle probabilità condizionate è pari a uno, la probabilità condizionata di 3Y = si può calcolare anche nel modo seguente

( ) ( ) ( )3 | 1 1| 2 |P Y X x P Y X x P Y X x= = = − = = − = = per 0,1.x =

Page 171: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 157

Il valore atteso del numero di acquisti per i clienti possessori della carta fedeltà invece è dato da

[ ] ( ) ( )( )

| 1 1 1| 1 2 2 | 1

3 3 | 11 0.333 2 0.417 3 0.250 1.917.

E Y X P Y X P Y X

P Y X

= = × = = + × = =

+ × = =

= × + × + × =

In media, i clienti dotati di carta fedeltà compiono un numero di acquisti maggiore.

E’ agevole verificare che il valore atteso marginale [ ]E Y è la media dei due valori attesi condizionati, [ ]| 0E Y X = e [ ]| 1E Y X = , ponderata utilizzando le probabilità marginali della variabile casuale X,

( 0)P X = e ( 1)P X = . Infatti

[ ] [ ] [ ]| 0 ( 0) | 1 ( 1)1.625 0.40 1.917 0.60 1.8.

E Y E Y X P X E Y X P X= = × = + = × =

= × + × =

8.3.3 Indipendenza delle componenti di una variabile casuale doppia

Le variabili casuali X e Y, componenti di una variabile casuale doppia ( ),X Y , sono indipendenti quando gli eventi iX x= e jY y= sono indipendenti per qualunque i e j. Sulla base della (6.8) ciò implica che

( | ) ( ), ( | ) ( )i j j j i jP X x Y Y P X x P Y y X X P Y y= = = = = = = =

per qualunque i e j. Le funzioni di probabilità condizionata coincidono con la funzione di probabilità marginale. Come per gli eventi, una definizione equivalente di indipendenza basata sulla (6.9) è la seguente: X e Y sono indipendenti quando

( ) ( ) ( ) ( )i j i jP X x Y y P X x P Y y = ∩ = = = = ,

ovvero

Page 172: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 158

(8.2) . .ij i jp p p=

per qualunque i e j. Il risultato (8.2) ripropone, nell’ambito delle variabili casuali doppie discrete, la formula (6.14) per la probabilità congiunta di due fenomeni indipendenti.

Esempio 8.3. In uno studio sull’effetto della pubblicità è stato chiesto a un campione di consumatori se avevano visto la pubblicità di una particolare marca di cereali, nella quale si esaltavano le capacità nutritive, e se avevano acquistato il prodotto. Sia X una variabile casuale che assume valore 1 se il consumatore ha visto la pubblicità e zero altrimenti e Y una variabile casuale che assume valore 1 se il consumatore ha acquistato i cereali e zero altrimenti. E’ stata stimata la distribuzione di probabilità congiunta riportata nella tabella 8.4.

Tabella 8.4 – Distribuzione di probabilità congiunta per la pubblicità (X) e

l’acquisto dei cereali (Y) dell’esempio 8.3. Y

X 0 1 0 0.45 0.20 0.65 1 0.25 0.10 0.35 0.70 0.30 1

Per verificare se le scelte dei consumatori sono influenzate dalla

pubblicità si calcola la distribuzione di probabilità congiunta in caso di indipendenza sulla base della (8.2). I risultati sono riportati nella tabella 8.5.

Tabella 8.5 – Distribuzione doppia dell’esempio 8.3 in caso di indipendenza. Y Totale

X 0 1 0 0.65×0.70=0.455 0.65×0.30=0.195 0.65 1 0.35×0.70=0.245 0.35×0.30=0.105 0.35

Totale 0.70 0.30 1 La distribuzione congiunta che si avrebbe in caso di indipendenza

è diversa da quella della tabella 8.4 e pertanto le due variabili X e Y sono dipendenti. Affinché si abbia dipendenza è sufficiente verificare

Page 173: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 159

che per una sola cella la probabilità congiunta non coincida con il prodotto delle probabilità marginali. Si conclude quindi che la pubblicità e gli acquisti dei consumatori non sono indipendenti.

La definizione di indipendenza può essere estesa alle componenti di una variabile casuale multivariata discreta. Una n-pla di variabili casuali discrete ( )1 2, , , nX X X… costituisce una variabile casuale n-variata. Le componenti 1 2, , , nX X X… sono indipendenti quando la probabilità congiunta [ ]1 1 2 2( ) ( ) ( )n nP X x X x X x= ∩ = ∩⋅⋅⋅∩ = può essere ottenuta come prodotto delle probabilità marginali

[ ]1 1 2 2

1 1 2 2

( ) ( ) ( )( ) ( ) ( ),

n n

n n

P X x X x X xP X x P X x P X x

= ∩ = ∩⋅⋅⋅∩ =

= = = ⋅⋅⋅ =

per qualsiasi n-pla di valori 1 2, , , nx x x… . 8.4 Variabili casuali doppie continue

Sia ( ),X Y una coppia di variabili casuali continue, a essa è associata la funzione di densità ( ),f x y mediante la quale è possibile calcolare la probabilità che contemporaneamente X e Y assumano valori in una determinata regione del piano.

Il livello del testo non consente una trattazione estesa delle variabili casuali doppie continue, di conseguenza nel seguito l’attenzione è limitata alle condizioni per verificare l’indipendenza.

Data una variabile casuale doppia continua ( ),X Y , si indichi con ( )Xf x la funzione di densità marginale della X e con ( )Yf y la

funzione di densità marginale della Y. Le componenti X e Y sono indipendenti quando la funzione di densità congiunta può essere ottenuta come il prodotto delle funzioni di densità marginali

( ) ( ) ( ), X Yf x y f x f y=

per qualunque coppia di valori ( ),x y .

Page 174: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 160

La definizione di indipendenza può, anche nel caso continuo, essere estesa alle componenti di una variabile casuale multivariata ( )1 2, , , nX X X… . Le variabili casuali marginali 1 2, , , nX X X… sono indipendenti quando la funzione di densità congiunta 1 2( , ,..., )nf x x x , per qualunque n-pla di valori 1 2, ,..., nx x x , può essere ottenuta come prodotto delle funzioni di densità marginali, ossia

1 21 2 1 2( , ,..., ) ( ) ( ) ( )nn X X X nf x x x f x f x f x= ⋅⋅⋅

dove ( )iX if x è la funzione di densità marginale di iX , per 1, 2,...,i n= .

8.5 Covarianza e correlazione 8.5.1 Valore atteso di una funzione di una variabile casuale doppia

Sia ( ),X Y una variabile casuale doppia; una sua funzione ( ),g X Y è una variabile casuale univariata per la quale si può calcolare

il valore atteso [ ]( , )E g X Y . Per interpretare questa quantità si consideri un esperimento casuale il cui risultato è descritto dalla coppia di variabili casuali ( ),X Y . Il valore atteso [ ]( , )E g X Y può essere interpretato come il valore cui converge la media dei valori osservati di

( ),g X Y quando l’esperimento viene replicato infinite volte. Nel caso di variabili casuali discrete [ ]( , )E g X Y è dato da

[ ]1 1

( , ) ( , )k h

i j iji j

E g X Y g x y p= =

= ∑∑ .

8.5.2 Covarianza

Un valore atteso particolarmente importante nello studio delle variabili casuali doppie è la covarianza, indicata con XYσ oppure

Page 175: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 161

( ),Cov X Y . Si indichi con Xµ il valore atteso di X e con Yµ quello di Y. La covarianza è data da3

[ ]( , ) ( )( )XY X YCov X Y E X Yσ µ µ= = − − .

Nel caso di variabili casuali discrete la formula per il calcolo della covarianza è

( )( )1 1

k h

XY i X j Y iji j

x y pσ µ µ= =

= − −∑∑ .

La covarianza riguarda l’associazione fra X e Y. Essa è il valore atteso del prodotto degli scarti XX µ− per gli scarti YY µ− . Se scarti positivi della X si verificano con maggiore probabilità in corrispondenza di scarti positivi della Y e, viceversa, scarti negativi della X sono tendenzialmente associati a scarti negativi della Y, il prodotto ( )( )X YX Yµ µ− − è positivo con maggiore probabilità e la covarianza è positiva. Se invece scarti positivi della X si verificano con maggiore probabilità in corrispondenza di scarti negativi della Y e viceversa, il prodotto ( )( )X YX Yµ µ− − è negativo con probabilità più elevata e la covarianza è negativa. Quindi, se vi è con maggiore probabilità una concordanza nel segno degli scarti la covarianza è positiva, altrimenti se vi è discordanza la covarianza è negativa. In particolare è possibile dimostrare che se esiste dipendenza lineare fra le variabili – ossia X e Y assumono con probabilità elevata valori intorno a una retta – la covarianza ne individua il segno. Essa è positiva se all’aumentare della X aumenta anche la Y ed è invece negativa se all’aumentare della X la Y decresce.

Una formula alternativa per il calcolo della covarianza è la seguente

(8.3) XY XY X Yσ µ µ µ= −

dove [ ]XY E XYµ = è il valore atteso del prodotto XY 3 La funzione della quale si calcola il valore atteso è il prodotto degli scarti

( ) ( )( ), x yg X Y X Yµ µ= − − .

Page 176: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 162

1 1

k h

XY i j iji j

x y pµ= =

= ∑∑ .

E’ immediato verificare questo risultato nel caso discreto, infatti

( )( )

( )1 1

1 1

1 1 1 1 1 1 1 1

1 1 1 1 1 1 1

k h

XY i X j Y iji j

k h

i j X j i Y X Y iji j

k h k h k h k h

i j ij X j ij Y i ij X Y iji j i j i j i j

k h h k k h h

i j ij X j ij Y i ij X Y iji j j i i j i j

x y p

x y y x p

x y p y p x p p

x y p y p x p p

σ µ µ

µ µ µ µ

µ µ µ µ

µ µ µ µ

= =

= =

= = = = = = = =

= = = = = = =

= − −

= − − +

= − − +

= − − +

∑∑

∑∑

∑∑ ∑∑ ∑∑ ∑∑

∑∑ ∑ ∑ ∑ ∑ ∑1

.k

=∑

Poiché 1

.k

ij ji

p p=

=∑ , 1

.h

ij ij

p p=

=∑ e 1 1

1k h

iji j

p= =

=∑∑ si ha

1 1 1 1

. .k h h k

XY i j ij X j j Y i i X Yi j j i

x y p y p x pσ µ µ µ µ= = = =

= − − +∑∑ ∑ ∑

e, considerato che 1 1

k h

i j ij XYi j

x y p µ= =

=∑∑ , 1

.h

j j Yj

y p µ=

=∑ e 1

.k

i i Xi

x p µ=

=∑ ,

si ottiene

XY XY X Y Y X X Y XY X Yσ µ µ µ µ µ µ µ µ µ µ= − − + = − .

8.5.3 Proprietà della covarianza

La covarianza ha alcune proprietà cui è opportuno riferirsi per interpretare correttamente il valore che essa assume. Esse sono enunciate nel seguito.

Page 177: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 163

Proprietà 1. Se X e Y sono indipendenti la covarianza è nulla

X e Y indipendenti ⇒ 0XYσ = .

In tal caso infatti il valore atteso del prodotto XY è uguale al prodotto dei valori attesi marginali, XY X Yµ µ µ= . Per dimostrarlo nel caso discreto si ricordi che, per la (8.2), se X e Y sono indipendenti la funzione di probabilità congiunta è data dal prodotto delle funzioni di probabilità marginali . .ij i jp p p= . Di conseguenza si ha

1 1 1 1 1 1. . . .

k h k h k h

XY i j ij i j i j i i j j X Yi j i j i j

x y p x y p p x p y pµ µ µ= = = = = =

= = = =∑∑ ∑∑ ∑ ∑ ,

sicché applicando la (8.3) si ottiene 0XYσ = .

L’indipendenza implica che 0XYσ = , tuttavia una covarianza nulla non implica che le variabili siano indipendenti. Quando 0XYσ = le variabili casuali X e Y si dicono incorrelate – ovvero non hanno un legame lineare – tuttavia in presenza di una covarianza nulla possono esservi forme di dipendenza non lineare (vedi esempio 8.5). Proprietà 2. Date due variabili casuali X e Y, la covarianza fra le trasformazioni lineari aX b+ e cY d+ è data da

(8.4) ( )( , ) ,Cov aX b cY d acCov X Y+ + = .

Il segno della covarianza rivela se fra le variabili esiste concordanza oppure discordanza, tuttavia il valore della covarianza è di difficile interpretazione perché dipende dall’unità di misura nella quale sono espresse le variabili X e Y.

La dimostrazione della (8.4) è immediata. Infatti ricordando che, per la (7.1), [ ] XE aX b a bµ+ = + e [ ] YE cY d c dµ+ = + si ha

( )( )1 1

( , ) [ ] [ ]k h

i j iji j

Cov aX b cY d ax b E aX b cy d E cY d p= =

+ + = + − + + − +∑∑

Page 178: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 164

( )( )

( )( )

( )( )

1 1

1 1

1 1

.

k h

i X j Y iji j

k h

i X j Y iji j

k h

i X j Y ij XYi j

ax b a b cy d c d p

ax a cy c p

ac x y p ac

µ µ

µ µ

µ µ σ

= =

= =

= =

= + − − + − −

= − −

= − − =

∑∑

∑∑

∑∑

Proprietà 3. Disuguaglianza di Cauchy-Schwarz: la covarianza

fra due variabili casuali X e Y, in valore assoluto, è al massimo uguale al prodotto degli scarti quadratici medi

X Y XY X Yσ σ σ σ σ− ≤ ≤ .

Questo risultato individua il campo di variazione della covarianza. In particolare si dimostra che se fra le due variabili X e Y esiste un

perfetto legame lineare, cioè Y aX b= + , il valore assoluto della covarianza è uguale al prodotto degli scarti quadratici medi

Y aX b= + ⇔ | |XY X Yσ σ σ= .

Quando fra due variabili vi è una perfetta dipendenza lineare vi è massima prevedibilità: noto il valore della X è possibile predire esattamente il valore della Y, che si troverà su una retta con equazione Y aX b= + , e in maniera analoga dato il valore della Y è possibile predire con esattezza il valore della X. 8.5.4 Coefficiente di correlazione

Un indice dell’intensità del legame lineare fra due variabili X e Y è il coefficiente di correlazione, indicato con XYρ oppure con

Page 179: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 165

( ),Corr X Y . Esso è dato dal valore atteso del prodotto delle variabili standardizzate4

( , ) X YXY

X Y

X YCorr X Y E µ µρσ σ

− −= =

e può anche essere calcolato come rapporto fra la covarianza e il prodotto degli scarti quadratici medi,

( )( )1 XYXY X Y

X Y X Y

E X Y σρ µ µσ σ σ σ

= − − = .

8.5.5 Proprietà del coefficiente di correlazione

Il coefficiente di correlazione gode di alcune importanti proprietà da tenere presenti per interpretare correttamente il suo valore. Esse sono riportate nel seguito.

Proprietà 1. Il coefficiente di correlazione assume valore nell’intervallo [ ]1,1−

1 1XYρ− ≤ ≤ .

Questa proprietà è un’immediata conseguenza della disuguaglianza di Cauchy-Schwarz. Proprietà 2. Il valore assoluto del coefficiente di correlazione è uguale a 1, | | 1XYρ = , quando fra la X e la Y esiste un perfetto legame lineare

Y aX b= + ⇔ | | 1XYρ = .

4 In questo caso, ( ),g X Y è il prodotto delle variabili casuali standardizzate

( ),YX yxg X Y

x y

µµσ σ

− − =

.

Page 180: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 166

Queste due proprietà sono fondamentali per interpretare il valore del coefficiente di correlazione. Quanto più XYρ è in valore assoluto vicino all’unità, tanto più forte è l’intensità del legame lineare fra le variabili. In altri termini, quanto più il valore di XYρ è prossimo a 1 o a

1− , tanto più la distribuzione doppia si concentra intorno a una retta. L’inclinazione della retta, positiva o negativa, è indicata dal segno di

XYρ . Viceversa, quanto più XYρ si avvicina allo zero, tanto più debole è l’intensità del legame lineare. Quando 0XYρ = non vi è legame lineare.

Proprietà 3. Se le variabili X e Y sono indipendenti il coefficiente di correlazione è nullo

X e Y indipendenti ⇒ 0XYρ = .

Questa proprietà è un’immediata conseguenza della proprietà 1 della covarianza, in base alla quale risulta che se X e Y sono indipendenti si ha 0XYσ = .

E’ opportuno osservare che l’indipendenza fra le variabili implica l’incorrelazione – ossia 0XYρ = . Non è però possibile affermare il contrario, può accadere infatti che XYρ sia nullo e X e Y abbiano un legame di tipo non lineare (vedi esempio 8.5).

Proprietà 4. Il coefficiente di correlazione è invariante, a meno

del segno, rispetto alle trasformazioni lineari, cioè

( , ) XYCorr aX b cY d ρ+ + = ± .

Infatti

( , )( , )| | | |

XYXY

aX b cY d X Y

Cov aX b cY d acCorr aX b cY da c

σ ρσ σ σ σ+ +

+ ++ + = = = ± .

Il coefficiente di correlazione è il valore atteso del prodotto delle variabili casuali standardizzate, le quali hanno sempre media nulla e varianza unitaria. Pertanto, a differenza di quanto avviene per la

Page 181: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 167

covarianza, alterazioni nell’unità di misura non modificano il valore (assoluto) del coefficiente di correlazione.

La figura 8.2 riporta le regioni del piano dove una variabile casuale doppia assume valori con probabilità 0.5, 0.8, e 0.95, al variare del coefficiente di correlazione. Quando il valore assoluto di XYρ si avvicina a 1, la variabile casuale doppia assume con maggiore probabilità valori intorno a una retta5.

Figura 8.2 – Aree nelle quali si concentra la probabilità al variare del coefficiente di correlazione.

0.950.8

0.5

0.950.8

0.5

0.950.8

0.5

0.950.8

0.5

5 La figura fa riferimento a valori positivi del coefficiente di correlazione. Anche quando XYρ si avvicina a –1 la variabile casuale doppia assume con maggiore probabilità valori intorno a una retta, ma l’inclinazione della retta è negativa.

0XYρ = 0.5XYρ =

0.8XYρ = 0.95XYρ =

Page 182: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 168

Esempio 8.4. Un ateneo somministra abitualmente agli studenti frequentanti un questionario per rilevare le loro opinioni sui corsi. Nel questionario gli studenti devono esprimere una valutazione sulla chiarezza espositiva del docente e sulla sua capacità di suscitare interesse per la materia. In entrambi i casi il giudizio può essere 1 (insufficiente), 2 (sufficiente) e 3 (buono). Sia X la variabile casuale che rappresenta la valutazione sulla chiarezza espositiva del docente e Y la variabile casuale che rappresenta il giudizio sulla capacità del docente di suscitare interesse verso la materia. E’ stata stimata la funzione di probabilità congiunta riportata nella tabella 8.6. Si vuole calcolare il coefficiente di correlazione.

Tabella 8.6 – Distribuzione di probabilità della valutazione degli studenti sulla

chiarezza espositiva del docente (X) e sulla sua capacità di suscitare interesse (Y) nell’esempio 8.4.

Y X 1 2 3 1 0.09 0.04 0.00 0.13 2 0.07 0.17 0.10 0.34 3 0.01 0.12 0.40 0.53 0.17 0.33 0.50 1

Dalle distribuzioni marginali si ottengono i valori attesi 2.40Xµ = e 2.33.Yµ = Per la covarianza è necessario calcolare XYµ

sulla base della distribuzione di probabilità congiunta. Si ha

1 1 0.09 1 2 0.04 1 3 0.002 1 0.07 2 2 0.17 2 3 0.103 1 0.01 3 2 0.12 3 3 0.40 5.94.

XYµ = × × + × × + × ×+ × × + × × + × ×+ × × + × × + × × =

Applicando la (8.3) si ottiene la covarianza

5.94 2.40 2.33 0.348XYσ = − × = .

Per calcolare il coefficiente di correlazione sono necessari gli scarti quadratici medi di X e Y. Considerando le distribuzione marginali si ottiene 0.707Xσ = e 0.749Yσ = . Pertanto il coefficiente di correlazione risulta

Page 183: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 169

0.348 0.6570.707 0.749XYρ = =

×.

Fra la valutazione degli studenti sulla chiarezza espositiva del docente e quella sulla sua capacità di suscitare interesse per la materia vi è una correlazione positiva.

Esempio 8.5. Una variabile casuale doppia ( ),X Y ha la distribuzione di probabilità riportata nella tabella 8.7. I valori attesi marginali delle due variabili casuali sono 1/ 2Xµ = e 0Yµ = mentre il valore atteso del prodotto XY è 0XYµ = , pertanto applicando la (8.3) risulta 0XYσ = . Essendo nulla la covarianza le variabili X e Y sono incorrelate ma, ciò nonostante, sono dipendenti. A ogni valore di Y è associato con probabilità non nulla un solo valore di X, sicché conoscendo il valore della prima variabile è possibile predire con esattezza il valore della seconda. In questo caso esiste una dipendenza perfetta di tipo non lineare.

Tabella 8.7 – Distribuzione di probabilità congiunta. Y

X –1 0 1 0 1/4 0 1/4 1/2 1 0 1/2 0 1/2 1/4 1/2 1/4 1

8.6 Combinazioni lineari di variabili casuali 8.6.1 Combinazioni lineari di due variabili casuali

Data una coppia di variabili casuali ( ),X Y , una combinazione lineare è una particolare funzione di X e Y data da aX bY+ . Ad esempio se 1a b= = la combinazione lineare è la somma X Y+ , mentre se 1a = e 1b = − si ottiene la differenza X Y− . Nel presente

Page 184: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 170

paragrafo si considerano il valore atteso e la varianza di combinazioni lineari di variabili casuali.

Il valore atteso di una combinazione lineare è dato dalla combinazione lineare del valore atteso

(8.5) [ ] X YE aX bY a bµ µ+ = + .

La (8.5) è facilmente verificata nel caso discreto, infatti

[ ] ( )1 1

1 1 1 1

1 1 1 1

1 1. . .

k h

i j iji j

k h k h

i ij j iji j i j

k h h k

i ij j iji j j i

k h

i i j j X Yi j

E aX bY ax by p

ax p by p

a x p b y p

a x p b y p a bµ µ

= =

= = = =

= = = =

= =

+ = +

= +

= +

= + = +

∑∑

∑∑ ∑∑

∑ ∑ ∑ ∑

∑ ∑

La varianza di una combinazione lineare è invece data da

(8.6) 2 2 2 2( ) 2X Y XYVar aX bY a b abσ σ σ+ = + + .

In particolare se le variabili casuali sono incorrelate (hanno covarianza nulla), si ha

2 2 2 2( ) X YVar aX bY a bσ σ+ = + .

La dimostrazione della (8.6) nel caso discreto è la seguente

( )

( )

( ) ( )

2

1 1

2

1 1

2

1 1

( ) [ ]k h

i j iji j

k h

i j X Y iji j

k h

i X j Y iji j

Var aX bY ax by E aX bY p

ax by a b p

a x b y p

µ µ

µ µ

= =

= =

= =

+ = + − +

= + − −

= − + −

∑∑

∑∑

∑∑

Page 185: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 171

( ) ( )

( )( )

( ) ( )

( )( )

( ) ( )

( ) ( )

222 2

1 1

222 2

1 1 1 1

1 1

222 2

1 1 1 1

222 2

1

2

2

2

.

k h

i X j Yi j

i X j Y ij

k h k h

i X ij j Y iji j i j

k h

i X j Y iji j

k h h k

i X ij j Y ij XYi j j i

k

i X i j Yi j

a x b y

ab x y p

a x p b y p

ab x y p

a x p b y p ab

a x p b y

µ µ

µ µ

µ µ

µ µ

µ µ σ

µ µ

= =

= = = =

= =

= = = =

= =

= − + −

+ − −

= − + −

+ − −

= − + − +

= − + −

∑∑

∑∑ ∑∑

∑∑

∑ ∑ ∑ ∑

∑1

2 2 2 2

. 2

2 .

h

j XY

X Y XY

p ab

a b ab

σ

σ σ σ

+

= + +

Esempio 8.6. Un investitore ha impiegato metà delle risorse a sua disposizione in un fondo azionario e l’altra metà in un fondo obbligazionario. I rendimenti del fondo azionario hanno media 6 e scarto quadratico medio 3, mentre i rendimenti del fondo obbligazionario hanno media 4 e scarto quadratico medio 1. La covarianza fra i rendimenti dei due fondi è 2. Si vuole calcolare il valore atteso e lo scarto quadratico medio del rendimento medio degli investimenti.

Sia X una variabile casuale che rappresenta il rendimento degli investimenti azionari e Y una variabile casuale che rappresenta il rendimento degli investimenti obbligazionari. Il rendimento medio degli investimenti è

1 12 2

X Y+ .

Il rendimento medio atteso è

[ ]0.5 0.5 0.5 0.5 0.5 6 0.5 4 5X YE X Y µ µ+ = + = × + × = .

Page 186: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 172

La varianza del rendimento medio è 2 2 2 2

2 2 2 2

(0.5 0.5 ) 0.5 0.5 2 0.5 0.5

0.5 3 0.5 1 2 0.5 0.5 2 3.5.X Y XYVar X Y σ σ σ+ = × + × + × × ×

= × + × + × × × =

Di conseguenza lo scarto quadratico medio è 1.87.

Nel caso di somme e differenze di variabili casuali le formule per il valore atteso e la varianza si semplificano. Infatti si ha

[ ] ,[ ] ,

X Y

X Y

E X YE X Y

µ µµ µ

+ = +− = −

e 2 2

2 2

( ) 2

( ) 2 .X Y XY

X Y XY

Var X YVar X Y

σ σ σ

σ σ σ

+ = + +

− = + −

In particolare quando X e Y sono incorrelate si ha 2 2( ) X YVar X Y σ σ± = + .

8.6.2 Combinazioni lineari di n variabili casuali Le formule per il valore atteso e la varianza di combinazioni lineari possono essere generalizzate al caso di n variabili casuali

1 2, , , nX X X… . Considerata la combinazione lineare

1 1 2 21

n

i i n ni

a X a X a X a X=

= + + +∑ ,

il valore atteso è dato da

(8.7) [ ]1 1

n n

i i i ii i

E a X a E X= =

= ∑ ∑

e la varianza è data da

Page 187: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 173

(8.8) ( ) ( )2

1 1 1

,n n n

i i i i i j i ji i i j i

Var a X a Var X a a Cov X X= = = ≠

= +

∑ ∑ ∑∑ .

E’ immediato verificare che nel caso 2n = la (8.7) e la (8.8) coincidono rispettivamente con la (8.5) e la (8.6). Si noti che la (8.7) vale sia quando le variabili casuali sono indipendenti sia nel caso in cui esiste una dipendenza. Invece, nel caso della varianza di combinazioni lineari si deve verificare se le variabili casuali sono incorrelate. Infatti, se 1 2, , , nX X X… sono incorrelate, sicché ( ), 0i jCov X X = per qualunque i j≠ , la (8.8) diventa

(8.9) ( )2

1 1

n n

i i i ii i

Var a X a Var X= =

=

∑ ∑ .

Per gli sviluppi successivi, di particolare interesse è il caso nel quale le variabili casuali sono indipendenti con la stessa media e la stessa varianza,

[ ]iE X µ= , 2( )iVar X σ= ,

per i=1,2,…,n, e come combinazione lineare si considera la media. La variabile casuale media si ottiene ponendo 1/ia n= per qualunque i . Essa è data da

1 21

1 1 1 1n

i ni

X X X X Xn n n n=

= = + + ⋅⋅⋅+∑ .

Il valore atteso di X coincide con µ, infatti applicando la (8.7) si ha

(8.10) [ ] [ ] [ ]1 21 1 1 1 .nE X E X E X E X nn n n n

µ µ = + + ⋅⋅⋅ + = =

La varianza di X è invece data da

(8.11) ( )2

Var Xn

σ= .

Infatti, poiché le variabili sono indipendenti e quindi hanno covarianza nulla, applicando la (8.9) si ottiene

Page 188: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 174

( ) ( ) ( ) ( )2

21 22 2 2 2

1 1 1 1nVar X Var X Var X Var X n

n n n n nσσ= + + ⋅⋅⋅+ = = .

Il valore atteso di X è sempre µ per qualunque n , invece la varianza si riduce all’aumentare del numero di variabili casuali.

E’ possibile dimostrare, applicando la (8.7) e la (8.8), che se le variabili casuali 1 2, , , nX X X… hanno tutte la stessa media e la stessa varianza ma sono correlate con covarianza ( , )i jCov X X τ= , costante per qualunque i e j, il valore atteso di X è sempre µ mentre la varianza è data da

( )2 1nVar X

n nσ τ−

= + .

In alcune circostanze è utile calcolare il valore atteso e la varianza della somma di n variabili casuali indipendenti con la stessa media e la stessa varianza. Siano 1 2, , , nX X X… variabili casuali indipendenti tali che [ ]iE X µ= e 2( )iVar X σ= per qualunque i. La variabile casuale somma

1 21

n

i ni

Y X X X X=

= = + + ⋅⋅⋅ +∑

è una particolare combinazione lineare che si ottiene ponendo 1ia = per qualunque i . Applicando la (8.7) e la (8.9), si ha

(8.12) [ ] [ ]1

n

ii

E Y E X nµ=

= =∑ ,

(8.13) ( ) ( ) 2

1

n

ii

Var Y Var X nσ=

= =∑ .

8.7 Esercizi

Esercizio 8.1. Una compagnia di assicurazioni ha due agenti, Rossi e Bianchi. Sia X una variabile casuale che assume valore 1 se un

Page 189: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 175

potenziale cliente è stato contattato dall'agente Rossi e zero se è stato contattato dall'agente Bianchi. Sia Y una variabile casuale che assume valore 1 se la persona contattata sottoscrive una polizza e zero in caso contrario. La funzione di probabilità congiunta di X e Y è riportata nella tabella 8.8. i) Calcolare le funzioni di probabilità marginali. ii) Calcolare le funzioni di probabilità condizionate di Y, per 0X =

e 1X = , e confrontarle. iii) Calcolare la funzione di probabilità congiunta che si avrebbe in

caso di indipendenza. E’ possibile affermare che le due variabili casuali sono indipendenti? Tabella 8.8 – Distribuzione di probabilità congiunta di X e Y nell’esercizio 8.1.

Y X 0 1 0 0.23 0.13 1 0.34 0.30

Esercizio 8.2. In una facoltà vi sono due corsi di laurea:

Economia e Statistica. L’80% dei laureati conseguono il titolo in Economia. La probabilità che un laureato di questa facoltà trovi lavoro nell’arco di un anno dalla laurea è 0.60, mentre la probabilità che un laureato consegua il titolo in Statistica e trovi lavoro nell’arco di un anno è 0.15. Sia X una variabile casuale che assume valore 1 se un laureato consegue il titolo in Statistica e zero se consegue il titolo in Economia. Sia Y una variabile casuale che assume valore 1 se un laureato trova lavoro nell’arco di un anno e zero altrimenti. i) Determinare la funzione di probabilità congiunta di X e Y. ii) Verificare se le variabili casuali X e Y sono indipendenti. iii) Calcolare le funzioni condizionate di Y, per 0X = e 1X = , e

confrontarle.

Esercizio 8.3. Un funzionario di un’azienda addetto al reclutamento del personale sottopone i candidati ad un test attitudinale e, se questo è superato, ad un colloquio finalizzato ad accertare la preparazione professionale. Egli ha osservato che gli esiti sono tendenzialmente diversi per i candidati che hanno una precedente esperienza di lavoro rispetto a coloro che sono alla ricerca del primo

Page 190: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 176

impiego. Sia X una variabile casuale che assume valore 1 se il candidato ha già lavorato in precedenza e zero altrimenti e sia Y una variabile casuale che assume valore zero se il candidato non supera il test attitudinale, 1 se supera il test attitudinale ma non il colloquio e 2 se supera anche il colloquio. Il dirigente ha stimato alcune probabilità.

In particolare, la probabilità che un candidato abbia una precedente esperienza di lavoro è 0.40. La probabilità che un candidato superi il test attitudinale ma non superi il colloquio è 0.37 e la probabilità che li superi entrambi è 0.15. La probabilità che un candidato non abbia precedenti esperienze di lavoro e non superi il test attitudinale è 0.33, mentre la probabilità che un candidato abbia precedenti esperienze di lavoro e superi il test attitudinale ma non il colloquio è 0.15. i) Determinare la funzione di probabilità congiunta di X e Y. ii) Verificare se le variabili casuali X e Y sono indipendenti. iii) Calcolare le funzioni condizionate di Y, per 0X = e 1X = , e

confrontarle.

Esercizio 8.4. E’ stata svolta un’indagine per studiare la relazione

fra il peso dei neonati e l’abitudine al fumo in gravidanza da parte della madre. Per il peso dei neonati sono state individuate quattro classi: la prima ha valore centrale 2.000 chilogrammi, la seconda ha valore centrale 2.750 chilogrammi, la terza ha valore centrale 3.250 chilogrammi e la quarta ha valore centrale 4.000 chilogrammi. Sia X una variabile casuale che assume valore 1 se la madre ha fumato durante la gravidanza e zero in caso contrario e sia Y una variabile casuale che assume valori 2.000, 2.750, 3.250 e 4.000 a seconda della classe di appartenenza del peso del neonato. E’ stata stimata la funzione di probabilità congiunta riportata nella tabella 8.9.

Tabella 8.9 – Distribuzione di probabilità congiunta del fumo in gravidanza (X)

e del peso del neonato (Y). Y

X 2.000 2.750 3.250 4.000 0 0.12 0.15 0.15 0.19 1 0.16 0.09 0.08 0.06

Page 191: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 177

i) Calcolare le funzioni di probabilità marginali. ii) Calcolare i valori attesi condizionati della Y, per 0X = e 1X = ,

e confrontarli con il valore atteso marginale, commentando i risultati.

iii) E’ possibile affermare che le due variabili casuali sono indipendenti? Esercizio 8.5. La tabella 8.3 riporta la funzione di probabilità

congiunta delle variabili X e Y dell’esempio 8.2. La X assume valore 1 se uno studente ha seguito il corso e 0 altrimenti e la Y rappresenta il punteggio ottenuto al singolo quesito. Calcolare i valori attesi condizionati della Y, per 0X = e 1X = , e confrontarli con il valore atteso marginale.

Esercizio 8.6. Un’azienda vende i propri prodotti per

corrispondenza. Fra gli articoli trattati vi sono sia detersivi sia prodotti per l’igiene personale. Sia X una variabile casuale che descrive il numero di detersivi richiesti in ciascun ordine e Y una variabile casuale che descrive il numero di prodotti per l’igiene personale richiesti in ciascun ordine. La funzione di probabilità congiunta è riportata nella tabella 8.10. Calcolare il coefficiente di correlazione e commentare il risultato.

Tabella 8.10 – Distribuzione di probabilità congiunta del numero di detersivi

(X) e del numero di prodotti per l’igiene personale (Y) in ciascun ordine. Y

X 0 1 2 0 0.00 0.05 0.01 1 0.30 0.08 0.02 2 0.35 0.15 0.04

Esercizio 8.7. Il responsabile del servizio medico di un ente

pubblico è interessato a studiare le abitudini dei dipendenti rispetto al fumo e all’alcool. A tal fine egli somministra a 500 dipendenti un questionario chiedendo loro se il numero medio di sigarette che fumano ogni giorno è 0 (=non fumatori), circa 10 (=fumatori moderati) oppure circa 20 (=fumatori) e se la quantità di alcool che consumano per pasto

Page 192: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 178

è 0 (=astemi), circa 0.125 litri (=bevitori moderati) o circa 0.250 litri (bevitori). Fra i dipendenti 300 dichiarano di non fumare e 125 di fumare circa 10 sigarette al giorno. Fra coloro che non fumano 180 risultano astemi e 70 sono bevitori moderati. Fra i fumatori moderati 50 sono bevitori moderati e 50 sono bevitori. Infine il numero complessivo di dipendenti astemi risulta 220 e il numero di bevitori moderati è 140.

Sia X la variabile che descrive il numero medio di sigarette e Y la variabile casuale che descrive la quantità di alcool consumata a pasto. i) Utilizzando la frequenza relativa per approssimare la probabilità,

determinare la funzione di probabilità congiunta. ii) Calcolare il coefficiente di correlazione.

Esercizio 8.8. In un’azienda vi sono 30 dipendenti, dei quali 20

sono disponibili a fare il turno di notte ottenendo il pagamento dello straordinario, mentre i restanti sono contrari. Si estraggono a caso, in blocco, due dipendenti affinché discutano l’organizzazione dei turni di lavoro con il direttore del personale. Sia X una variabile casuale che assume valore 1 se il primo dipendente scelto è disponibile per il turno di notte e zero altrimenti e sia Y una variabile casuale che assume valore 1 se il secondo dipendente è favorevole e zero altrimenti. Si costruisca la funzione di probabilità congiunta per X e Y.

Esercizio 8.9. In uno studio sull’alimentazione delle persone che

lavorano è risultato che la quantità di calorie che assumono durante il pranzo può essere descritta da una variabile casuale X con media 800 e scarto quadratico medio 150, mentre la quantità di calorie che assumono durante la cena può essere descritta da una variabile casuale Y con media 1300 e scarto quadratico medio 230. Sapendo che la covarianza fra X e Y è 1250, calcolare la media e lo scarto quadratico medio della quantità complessiva di calorie assunta nei due pasti.

Esercizio 8.10. Un esame è composto da due prove delle quali la

prima è scritta e la seconda è orale. I voti conseguiti dagli studenti nella prova scritta possono essere rappresentati da una variabile casuale X che ha media 24 e varianza 9, mentre i voti conseguiti nella prova orale possono essere descritti da una variabile casuale Y che ha media 22 e varianza 16. Il docente attribuisce maggior peso alla prova scritta

Page 193: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Variabili casuali doppie 179

sicché il voto finale è una combinazione lineare dei voti riportati nelle due prove: ( ) ( )2 / 3 1/ 3X Y+ . Sapendo che la covarianza fra X e Y è 10, calcolare la media e lo scarto quadratico medio del voto finale.

Page 194: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 195: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 9.1 Introduzione Molti fenomeni del mondo reale possono essere rappresentati da variabili casuali che hanno una struttura analoga. I pesi, le altezze, le lunghezze, gli errori di misura generalmente hanno una distribuzione di forma campanulare centrata sulla media. Altri fenomeni sono schematizzabili mediante esperimenti con esito di tipo dicotomico: un consumatore può scegliere se acquistare o no un prodotto di una particolare marca, un elettore può scegliere se votare o no a favore di un partito, un investitore può scegliere fra titoli a reddito fisso e titoli azionari, e così via. In queste situazioni risultano particolarmente utili i modelli per variabili casuali mediante i quali descrivere, in modo semplice ed efficace, fenomeni ed esperimenti di interesse. I modelli di variabili casuali esistono in quanto per ciascuno di essi esiste almeno un fenomeno reale la cui schematizzazione si estrinseca mediante il modello. I modelli proposti dalla letteratura sono numerosi, tuttavia nel testo l’attenzione è limitata soltanto ad alcuni di essi particolarmente importanti e ricorrenti nelle applicazioni statistiche. In particolare il presente capitolo considera i modelli per variabili casuali discrete, mentre il capitolo successivo considera quelli per variabili casuali continue.

Page 196: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 182

9.2 Variabile casuale di Bernoulli Molti esperimenti hanno due soli esiti possibili interpretabili

come “successo” oppure “insuccesso”. Un promotore finanziario che incontra per la prima volta un cliente può riuscire o non riuscire a concludere un contratto. Un esame può concludersi con una promozione oppure con una bocciatura. Un prodotto può essere venduto oppure rimanere in magazzino. Questi esperimenti possono essere descritti mediante una variabile casuale di Bernoulli.

Si consideri un esperimento con risultato dicotomico del tipo “successo” o “insuccesso” e sia π la probabilità del successo, dove 0 1π≤ ≤ . La variabile casuale di Bernoulli X assume valore 1 quando si verifica un successo e zero quando si verifica un insuccesso. La sua distribuzione di probabilità dipende dal parametro π , infatti

(9.1) ( ) ( )0 1 , 1P X P Xπ π= = − = = .

Per indicare che X ha una distribuzione di Bernoulli si utilizza la notazione

( )X Ber π∼ 1.

In base alla (9.1) la funzione di probabilità risulta

( ) ( )11 xxP X x π π −= = −

per 0,1x = . In forma tabellare si ha

X ( )P X x= 0 1 π− 1 π

Il valore atteso della variabile casuale di Bernoulli coincide con la probabilità di successo π , infatti

1 Il simbolo ∼ si legge “si distribuisce come”.

Page 197: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 183

( )[ ] 0 1 1E X π π π= × − + × = .

La varianza invece è data da

( ) ( ) ( ) ( ) ( )2 20 1 1 1Var X π π π π π π= − × − + − × = − .

9.3 Variabile casuale binomiale

Si consideri un esperimento con risultato dicotomico e si supponga di eseguire n prove indipendenti, in modo tale che la probabilità di successo sia costante e pari a π . La variabile casuale X che descrive il numero di successi nelle n prove ha una distribuzione binomiale, che si indica con

( ),X B n π∼ .

La variabile casuale binomiale è una variabile casuale discreta che assume valori interi fra zero e n. La sua funzione di probabilità è data da

(9.2) ( ) ( ) ( )!( ) 1 1! !

n x n xx xn nP X xx x n xπ π π π− −

= = − = − −

per 0,1, ,x n= … e 0 1π≤ ≤ . Per dimostrare la (9.2) si consideri inizialmente la probabilità di

una particolare sequenza nella quale si sono verificati x successi e n x− insuccessi. Senza perdere in generalità, si supponga che i successi (S) si siano verificati nelle prime x prove e gli insuccessi (I) nelle ultime n x− prove. Di conseguenza la sequenza è

, ,..., , ,...,x n x

S S S I I I−

.

Poiché le prove sono indipendenti, la probabilità di questa sequenza è data dal prodotto delle probabilità dei risultati delle singole prove. La probabilità di successo è costante nelle n prove ed è uguale a π , mentre

Page 198: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 184

la probabilità di un insuccesso è costante e uguale a 1 π− . Di conseguenza la probabilità di questa particolare sequenza è

( ) ( ) ( ) ( )1 1 1 1 .n xx

x n x

π π π π π π π π −

× ×⋅⋅⋅× × − × − ×⋅⋅⋅× − = −

E’ immediato verificare che qualsiasi altra sequenza con x successi e n x− insuccessi ha la stessa probabilità. Ai fini del calcolo di ( )P X x= non interessa l’ordine con il quale si presentano i successi e

gli insuccessi ma soltanto il numero complessivo di successi nelle n prove. Vi sono diverse sequenze in cui possono disporsi gli x successi nelle n prove, per ciascuna di esse la variabile casuale assume sempre valore x. Inoltre le diverse sequenze sono incompatibili. Di conseguenza la probabilità dell’evento X x= è data dal prodotto della probabilità di una particolare sequenza, (1 )x n xπ π −− , per il numero di sequenze nel quale si possono presentare gli x successi nelle n prove. Quest’ultimo è dato dal numero delle combinazioni di x elementi scelti fra n (vedi paragrafo 6.9). In tal modo si ottiene la (9.2).

La figura 9.1 illustra la funzione di probabilità della variabile casuale binomiale per 10n = e .5.0,3.0,1.0=π Si noti che la distribuzione è simmetrica quando 5.0=π mentre diventa via via più asimmetrica quando π si avvicina a zero (oppure a 1).

Esempio 9.1. Un venditore di elettrodomestici a domicilio sa che, in ogni visita, la probabilità che riesca a convincere il cliente ad acquistare un elettrodomestico è 0.35. L’esito di ogni visita è indipendente da quello delle altre. Il venditore ha programmato cinque visite, si vuole calcolare la distribuzione di probabilità del numero di elettrodomestici che riesce a vendere.

Sia X la variabile casuale che descrive il numero di elettrodomestici venduti. Le visite sono prove indipendenti con probabilità di successo costante pari a 0.35, sicchè X ha una distribuzione binomiale con 5n = e 0.35π = , cioè ( )5,0.35X B∼ . La funzione di probabilità è

Page 199: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 185

Figura 9.1 Distribuzione della variabile casuale Binomiale

10n =

0 2 4 6 8 10

0.0

0.1

0.2

0.3

0.4

0 2 4 6 8 100.0

0.05

0.10

0.15

0.20

0.25

0 2 4 6 8 100.0

0.05

0.10

0.15

0.20

0.25

0 5

1 4

2 3

5!( 0) 0.35 (1 0.35) 0.116,0!5!5!( 1) 0.35 (1 0.35) 0.312,

1!4!5!( 2) 0.35 (1 0.35) 0.337,

2!3!

P X

P X

P X

= = − =

= = − =

= = − =

3 25!( 3) 0.35 (1 0.35) 0.181,3!2!

P X = = − =

4 1

5 0

5!( 4) 0.35 (1 0.35) 0.049,4!1!5!( 5) 0.35 (1 0.35) 0.005.

5!0!

P X

P X

= = − =

= = − =

0.5π = 0.3π =

0.1π =

Page 200: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 186

Una variabile casuale binomiale, con parametri n e π , può essere rappresentata come la somma di n variabili casuali bernoulliane indipendenti e identicamente distribuite con parametro π . Si associ a ciascuna prova una variabile casuale iY , dove Yi assume valore 1 se nella prova i-esima si verifica un successo e zero altrimenti e pertanto

( )iY Ber π∼ . Le variabili Yi sono indipendenti poiché le prove sono indipendenti. Il numero di successi nelle n prove è dato dal numero di Yi che assumono valore 1 e quindi

1 2 nX Y Y Y= + + ⋅⋅⋅ + .

Utilizzando questa rappresentazione è possibile dimostrare che il valore atteso e la varianza di ( ),X B n π∼ sono dati da

[ ]E X nπ= , ( ) ( )1Var X nπ π= − .

Infatti le variabili casuali iY sono indipendenti e hanno tutte valore atteso π e varianza ( )1π π− . Di conseguenza applicando la (8.12) si ha

[ ] [ ]1 2 nE X E Y Y Y nπ= + + ⋅⋅⋅+ =

e applicando la (8.13) si ottiene

( ) ( ) ( )1 2 1 .nVar X Var Y Y Y nπ π= + + ⋅⋅⋅+ = −

Esempio 9.2. La probabilità che una ceramica prodotta da

un’azienda presenti un difetto è 0.05. Un cliente ha ordinato 40 pezzi; si vuole conoscere il valore atteso e la varianza del numero di ceramiche difettose acquistate dal cliente. Si vuole determinare inoltre la probabilità che vi sia almeno una ceramica difettosa.

Il cliente ha ordinato 40 ceramiche sicché 40n = . Inoltre la probabilità che una ceramica presenti un difetto è 0.05π = . Di conseguenza la variabile casuale che descrive il numero di ceramiche difettose acquistate dal cliente è ( )40,0.05X B∼ . Si ha

[ ] 40 0.05 2.0E X = × =

Page 201: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 187

e ( ) ( )40 0.05 1 0.05 1.9Var X = × × − = .

Per calcolare la probabilità dell’evento 1X ≥ si osservi che 0X = è la sua negazione. Il modo più rapido per calcolare la

probabilità desiderata è

( ) ( )1 1 0P X P X≥ = − = .

Applicando la (9.2) si ha

( ) 0 40 0 40400 (0.05) (1 0.05) 0.95 0.1285

0P X −

= = × − = =

.

Di conseguenza ( )1 1 0.1285 0.8715P X ≥ = − = . 9.4 Variabile casuale ipergeometrica

Si supponga di avere un insieme di N unità delle quali F sono classificate come “favorevoli” e N F− come “contrarie”, in modo tale che scegliendone una a caso il risultato dell’esperimento possa configurarsi come un “successo” − quando si estrae un’unità favorevole − oppure come un “insuccesso” − se si estrae un’unità contraria. Dall’insieme delle N unità ne vengono estratte n. Se l’estrazione avviene con rimessa la variabile che descrive il numero di successi ha una distribuzione binomiale con probabilità di successo /F Nπ = . Quando invece l’estrazione avviene in blocco (senza rimessa) la variabile casuale che descrive il numero di unità favorevoli nelle n estrazioni è ipergeometrica.

La sua distribuzione dipende da tre parametri: il numero complessivo di unità N, il numero di unità favorevoli F e il numero di estrazioni n. Di conseguenza per indicare che X è una variabile casuale ipergeometrica si utilizza la notazione

( ), ,X IP N F n∼ .

Page 202: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 188

La variabile casuale ipergeometrica assume valori interi da zero al minimo fra n e F. La probabilità che X assuma valore x si calcola come rapporto fra casi favorevoli e casi possibili. I casi possibili sono dati dal numero delle combinazioni di n elementi scelti fra N

!!( )!

N Nn n N n

= −

.

Il numero di modi nei quali è possibile scegliere x elementi fra le F unità favorevoli è

!!( )!

F Fx x F x

= −

.

Se fra le n unità estratte ve ne sono x favorevoli, necessariamente le restanti n x− sono contrarie. Il numero di modi nei quali è possibile scegliere n x− elementi fra le N F− unità contrarie è

( )!( )!( )!

N F N Fn x n x N F n x− −

= − − − − + .

I casi favorevoli, ossia il numero di sequenze nelle quali si possono presentare esattamente x unità favorevoli e n x− unità contrarie, risultano

! ( )!!( )! ( )!( )!

F N F F N Fx n x x F x n x N F n x

− −= − − − − − +

.

Di conseguenza si ha

! ( )!!( )! ( )!( )!( ) !

!( )!

F N F F N Fx n x x F x n x N F n xP X x NN

n N nn

− − − − − − − + = = =

,

per { }0,1, ,x min n,F= … .

Page 203: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 189

Esempio 9.3. Un’azienda riceve da un fornitore un pacco con 20 pezzi. L’azienda decide di provarne cinque, estraendoli in blocco dal pacco; se nessun pezzo è difettoso la fornitura è accettata altrimenti il pacco è respinto. Si vuole calcolare la probabilità di accettare una fornitura con 6 pezzi difettosi.

La variabile casuale X che descrive il numero di pezzi difettosi ha una distribuzione ipergeometrica. Nella fornitura vi sono 20N = pezzi dei quali 6F = difettosi; se si provano 5n = pezzi si ha

( )20,6,5X IP∼ . Si vuole la probabilità di 0X = ; essa risulta

6! (20 6)!0!6! (5 0)!(20 6 5 0)!( 0) 0.12920!

5!(20 5)!

P X

−− − − += = =

,

La probabilità che l’azienda accetti un pacco con 6 pezzi difettosi è 0.129.

E’ possibile dimostrare che il valore atteso della variabile casuale ipergeometrica è dato da

[ ] FE X nN

= ,

mentre la varianza è

( ) 11

F F N nVar X nN N N

− = − − .

Se si indica con /F Nπ = la probabilità di estrarre un’unità favorevole in una singola prova, si osserva che il valore atteso della variabile casuale ipergeometrica coincide con quello della variabile casuale binomiale. La circostanza che l’estrazione avvenga senza rimessa non modifica il valore atteso del numero di successi. Infatti l’estrazione in blocco induce dipendenza fra le prove, ma ciò è irrilevante ai fini del calcolo del valore atteso. La varianza invece risulta più piccola poiché la quantità ( )1nπ π− , corrispondente alla

Page 204: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 190

varianza di una variabile casuale binomiale, risulta moltiplicata per un fattore ( ) ( )1N n N− − minore di uno. Intuitivamente la minore variabilità della variabile casuale ipergeometrica può essere attribuita a una maggiore efficienza dell’estrazione in blocco. Se l’estrazione avviene con rimessa la stessa unità può essere estratta più volte. Questa replicazione è invece impossibile quando l’estrazione è in blocco. Nell’esperimento descritto dalla variabile casuale ipergeometrica sono escluse tutte le sequenze nelle quali compare più volte la stessa unità e di conseguenza questa variabile casuale presenta una minore variabilità rispetto alla variabile casuale binomiale.

Tuttavia quando N aumenta, mantenendo costante il rapporto /F Nπ = , il rapporto ( ) ( )1N n N− − tende a 1 e pertanto la varianza

della variabile casuale ipergeometrica converge a ( )1nπ π− . Al crescere di N la probabilità di estrarre più volte la stessa unità, nell’estrazione con rimessa, diventa trascurabile. Di conseguenza, per N sufficientemente grande, la distribuzione di probabilità della variabile casuale ipergeometrica può essere approssimata dalla distribuzione di probabilità della variabile casuale binomiale. La figura 9.2 illustra l’approssimazione della distribuzione di una variabile casuale ipergeometrica con = 50, 100, 200N , = /5F N e = 10n mediante la distribuzione di probabilità di una variabile casuale binomiale con parametri 10n = e / 0.20F Nπ = = .

9.5 Variabile casuale di Poisson

Il numero di chiamate in arrivo a un call center in dieci minuti, il numero di automobili in arrivo a un casello autostradale in un’ora, il numero di interventi di manutenzione necessari per far funzionare un impianto in un anno, il numero di clienti che entrano in un grande magazzino in un’ora, il numero di arrivi a un pronto soccorso in un giorno sono fenomeni rappresentati da variabili casuali che contano il numero di eventi che si verificano in un intervallo di tempo.

Page 205: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 191

Figura 9.2 Approssimazione della distribuzione ipergeometrica (cerchi) mediante la distribuzione binomiale (triangoli)

10n = , 0.2FN

π = =

0 2 4 6 8 100.0

0.1

0.2

0.3

0 2 4 6 8 100.0

0.05

0.10

0.15

0.20

0.25

0.30

0 2 4 6 8 100.0

0.05

0.10

0.15

0.20

0.25

0.30

Un modello idoneo a rappresentare tali fenomeni è la distribuzione di Poisson. In generale la variabile casuale di Poisson consente di studiare la distribuzione di probabilità del numero di utenti che richiedono un servizio in un intervallo di tempo − un’informazione essenziale per dimensionare correttamente il servizio.

Si consideri un esperimento il cui risultato è costituito dal numero di eventi che si verificano in un intervallo di tempo. Si supponga inoltre che le modalità con le quali si verificano gli eventi sono tali da poter assumere le seguenti condizioni:

1) il numero di eventi che si verificano in intervalli disgiunti sono descritti da variabili casuali indipendenti;

2) la probabilità che si verifichi un evento in un piccolo intervallo è approssimativamente proporzionale alla lunghezza dell’intervallo;

N = 50 F = 10

N = 100 F = 20

N = 200 F = 40

Page 206: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 192

3) la probabilità che si verifichi più di un evento in un piccolo intervallo è trascurabile.

Sotto queste condizioni la variabile casuale X che descrive il numero di eventi che si verificano in un intervallo ha una distribuzione di Poisson.

Questa variabile casuale assume valori nell’insieme dei numeri naturali, ossia { }0,1, 2,… . Di conseguenza, a differenza delle variabili casuali binomiale e ipergeometrica, quella di Poisson può assumere un numero illimitato di valori. La sua distribuzione dipende da un parametro 0λ > che rappresenta il numero medio di eventi nell’intervallo; pertanto per indicare che X è una variabile casuale di Poisson si utilizza la notazione

( )X P λ∼ .

Essa ha funzione di probabilità

( )!

xeP X xx

λλ−

= = ,

per 0,1, 2,x = … . Una particolarità di questa variabile casuale è che valore atteso e varianza coincidono entrambi con il parametro λ

[ ] ( ),E X Var Xλ λ= = .

Esempio 9.4. Alle casse di un supermercato si presentano in

media tre clienti al minuto. Il numero di clienti che arrivano alle casse è rappresentato da una variabile casuale di Poisson, si vuole determinare la distribuzione di probabilità.

Sia X la variabile casuale che descrive il numero di clienti in arrivo alle casse in un minuto, il suo valore atteso è 3λ = e perciò

( )3X P∼ . La funzione di probabilità è 3 03( 0) 0.0498,0!

eP X−

= = =

Page 207: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 193

Figura 9.3 – Distribuzione di probabilità della variabile casuale di Poisson

0 2 4 6 8 100.00.10.20.30.40.50.6

0 2 4 6 8 100.0

0.1

0.2

0.3

0 2 4 6 8 100.0

0.05

0.10

0.15

0.20

0.25

0 2 4 6 8 100.0

0.05

0.10

0.15

0.20

3 13( 1) 0.1494,1!

eP X−

= = = 3 2

3 3

3 4

3( 2) 0.2240,2!3( 3) 0.2240,

3!3( 4) 0.1680,

4!

eP X

eP X

eP X

= = =

= = =

= = =

e così via. Si supponga ora di voler calcolare la probabilità che in un minuto

arrivino più di quattro clienti. Poiché l’evento 4X > è la negazione dell’evento 4X ≤ , il modo più rapido per calcolare questa probabilità è il seguente

0.5λ =

4λ =

1λ =

2λ =

Page 208: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 194

( 4) 1 ( 4)P X P X> = − ≤ .

La probabilità dell’evento 4X ≤ è data da ( 4) ( 0) ( 1) ( 2) ( 3) ( 4)

0.0498 0.1494 0.2240 0.2240 0.1680 0.8152.P X P X P X P X P X P X≤ = = + = + = + = + =

= + + + + =

Di conseguenza si ha ( )4 1 0.8152 0.1848P X > = − = .

Per calcolare le probabilità di valori consecutivi che può assumere la variabile casuale di Poisson è utile la seguente formula recursiva

(9.3) ( ) ( )11

P X x P X xxλ

= + = =+

per 1,2,...x =

dove ( ) λ−== eXP 0 .

Esempio 9.4 (continuazione). La variabile casuale che descrive il numero di clienti che si presentano alle casse di un grande magazzino in un minuto è ( )3X P∼ , sicché ( 0) 0.0498P X = = . Applicando la (9.3) si ha

( ) 31 0.0498 0.1494,1

P X = = × =

( ) 32 0.1494 0.2240,2

P X = = × =

( )

( )

33 0.2240 0.2240,334 0.2240 0.1680,4

P X

P X

= = × =

= = × =

e così via.

Facendo variare la lunghezza dell’intervallo si ottiene una successione di variabili casuali di Poisson, 1 2, , , ,tX X X… … , delle quali 1X rappresenta il numero di eventi che si verificano in un intervallo di lunghezza 1, 2X rappresenta il numero di eventi che si

Page 209: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 195

verificano in un intervallo di lunghezza 2, e così via. In generale la variabile casuale tX rappresenta il numero di eventi che si verificano in un intervallo di lunghezza t. Questa successione di variabili casuali

1 2, , , ,tX X X… …è chiamata processo di Poisson2. Alla successione di variabili casuali 1 2, , , ,tX X X… …

corrispondono i parametri 1 2, , , ,tλ λ λ… … , dove il generico tλ è il numero medio di eventi che si verificano nell’intervallo di ampiezza t. E’ immediato verificare che, se in un intervallo di lunghezza unitaria si verificano in media 1λ eventi, in un intervallo di lunghezza t si verificano in media 1tλ eventi e quindi 1t tλ λ= . Di conseguenza si ha

( )1tX P tλ∼ .

Esempio 9.5. In un ufficio postale si presentano in media cinque utenti al minuto. Il numero di utenti in arrivo in un intervallo di tempo ha una distribuzione di Poisson. Si vuole calcolare la probabilità che in due minuti arrivino 12 utenti.

Si indichi con tX la variabile casuale che descrive il numero di utenti che arrivano in t minuti. Il numero medio di utenti che arrivano in un minuto è [ ]1 1 5E Xλ = = . Di conseguenza la variabile che descrive il numero di arrivi in due minuti è ( )2 2X P λ∼ dove

2 12 10λ λ= = . La probabilità è data da 10 12

210( 12) 0.0948.

12!eP X−

= = =

Esempio 9.6. A uno sportello bancario si presentano in media

venti clienti ogni ora. Il numero di clienti in arrivo in un intervallo di tempo ha una distribuzione di Poisson. Si vuole calcolare la probabilità che in cinque minuti non arrivi alcun cliente.

Se in un’ora arrivano in media 20 clienti, il numero medio di clienti che arrivano in un minuto è 1 20 / 60 1/ 3λ = = . Di conseguenza il

2 In generale, il parametro t che rappresenta la lunghezza dell’intervallo nel processo di Poisson può assumere valori reali positivi.

Page 210: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 196

numero di clienti che arrivano in cinque minuti è descritto dalla variabile casuale ( )5 5 / 3X P∼ . La probabilità è

5/3 05/ 3

5(5 / 3)( 0) 0.18890!

eP X e−

−= = = = .

9.6 Variabile casuale geometrica Vi sono circostanze nelle quali un esperimento, con esito dicotomico, viene ripetuto finché non si verifica un “successo”. Un responsabile del reclutamento aziendale effettua tanti colloqui finché non individua un candidato adatto a svolgere le mansioni previste dall’azienda. Un giocatore di roulette può puntare sul rosso finché non vince. Se un paziente ha bisogno di una trasfusione, una struttura sanitaria può effettuare tanti prelievi finché non trova un donatore con un gruppo sanguigno compatibile. Quando si effettuano tante prove indipendenti finché non si verifica un successo e la probabilità di successo è costante e pari a π , la variabile casuale che descrive il numero di prove necessarie per avere un successo ha una distribuzione geometrica. Essa assume valori interi positivi e quindi, come la variabile casuale di Poisson, assume un numero illimitato di valori. La sua funzione di probabilità dipende dal parametro π , dove 0 1π≤ ≤ ; pertanto per indicare che X è una variabile casuale geometrica si utilizza la notazione

( )X G π∼ .

La variabile casuale X assume valore x quando si verifica un insuccesso (I) in ciascuna delle prime x−1 prove, mentre nell’ultima prova − la prova x − si verifica un successo (S), ottenendo quindi la sequenza seguente

1

, ,...,x

I I I S−

.

Page 211: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 197

Poiché le prove sono indipendenti, la probabilità di questa sequenza è data dal prodotto delle probabilità dei risultati delle singole prove. La probabilità di un insuccesso è 1 π− ed è costante in ciascuna prova, pertanto la probabilità della sequenza è

( ) ( ) ( ) ( ) 1

1

1 1 1 1 x

x

π π π π π π−

− × − ×⋅⋅⋅× − × = − .

Di conseguenza la funzione di probabilità di X è

( ) 1(1 )xP X x π π−= = − ,

per 1, 2,x = …. La figura 9.4 illustra la funzione di probabilità della variabile casuale geometrica per diversi valori di π ; all’aumentare di π la funzione di probabilità decresce più rapidamente.

Figura 9.4 – Distribuzione di probabilità della variabile casuale geometrica

2 4 6 8 10 12 140.02

0.04

0.06

0.08

0.10

2 4 6 8 10 12 140.0

0.05

0.10

0.15

0.20

0.25

0.30

2 4 6 8 10 12 140.0

0.1

0.2

0.3

0.4

0.5

2 4 6 8 10 12 140.0

0.2

0.4

0.6

0.1π =

0.7π =

0.3π =

0.5π =

Page 212: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 198

Come per la variabile casuale di Poisson, anche per la variabile casuale geometrica le probabilità, per 1x > , possono essere calcolate mediante una formula recursiva

( ) ( ) ( )1 1P X x P X xπ= + = − = .

E’ possibile dimostrare che il valore atteso e la varianza di una variabile casuale geometrica, con parametro π , sono

[ ] 1E Xπ

= , ( ) 2

1Var X ππ−

= .

Il valore atteso è inversamente legato a π ; infatti quanto più piccola è la probabilità di successo, tanto più elevato è il numero di prove necessarie affinché si verifichi un successo.

La funzione di ripartizione della variabile casuale geometrica è

(9.4) ( ) ( ) .11 xxF π−−=

Esempio 9.7. Una casa editrice ha appena pubblicato un libro di

esercizi di Statistica. Per pubblicizzare il libro l’editore decide di contattare dei professori di Statistica e inviare loro una copia omaggio. Da esperienze precedenti l’editore sa che la probabilità che un docente, che ha ricevuto una copia omaggio, adotti il libro come testo per il proprio corso è 0.11. Si vuole determinare la distribuzione del numero di professori da contattare affinché l’ultimo adotti il libro. Si vuole inoltre sapere in media quanti docenti devono essere contattati.

La variabile casuale X, che descrive il numero di professori da contattare affinché l’ultimo adotti il libro come testo di riferimento, è una variabile casuale geometrica con probabilità di successo 0.11π = :

( )0.11X G∼ . La funzione di probabilità è la seguente

( ) ( )01 1 0.11 0.11 0.110P X = = − × = ,

( ) ( )12 1 0.11 0.11 0.098P X = = − × = ,

( ) ( )23 1 0.11 0.11 0.087P X = = − × = ,

Page 213: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 199

( ) ( )34 1 0.11 0.11 0.078P X = = − × = ,

( ) ( )45 1 0.11 0.11 0.069P X = = − × = , e così via.

Il valore atteso di X è

[ ] 1 9.090.11

E X = = ,

pertanto in media è necessario contattare circa nove docenti affinché l’ultimo adotti il libro.

La variabile casuale geometrica è utilizzata per descrivere i tempi

di attesa necessari perché si verifichi un evento quando il tempo è misurato in modo discreto, ad esempio in mesi, giorni, ore o minuti. Se ogni intervallo di tempo è considerato come una prova indipendente che può dar luogo a un “successo” oppure a un “insuccesso” e la probabilità del successo è costante, il numero di mesi, giorni, ore o minuti necessari affinché si verifichi un successo ha una distribuzione geometrica.

Esempio 9.8. La probabilità che in un minuto vi sia un arrivo in

un pronto soccorso è 0.05. Sapendo che gli arrivi sono fra loro indipendenti, si vuole determinare il numero medio di minuti affinché si verifichi un arrivo. Si vuole inoltre conoscere la probabilità che un arrivo si verifichi al massimo in dieci minuti.

La variabile casuale X che descrive il numero di minuti affinché si verifichi un arrivo al pronto soccorso, ha una distribuzione geometrica con parametro 0.05π = : ( )0.05X G∼ . Di conseguenza il numero medio di minuti affinché si verifichi un arrivo è [ ] 1/ 0.05 20E X = = .

La probabilità che un arrivo si verifichi al massimo in dieci minuti si ottiene mediante la (9.4)

( ) ( ) ( ) 4013.005.0111010 10 =−−==≤ FXP .

Page 214: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 200

9.7 Esercizi

Esercizio 9.1. La probabilità che una fattura emessa da un’azienda sia errata è 0.02. In un mese sono state emesse 35 fatture. Determinare la probabilità che: i) nessuna fattura sia errata; ii) una fattura sia errata; iii) almeno due fatture siano errate.

Esercizio 9.2. Sulla base della passata esperienza un agente di

viaggio ritiene che soltanto l’80% dei clienti, che effettuano una prenotazione aerea, acquistano successivamente il biglietto. Se i clienti si sono recati indipendentemente presso l’agenzia di viaggio per una prenotazione, determinare la probabilità che: i) cinque acquistino il biglietto; ii) tutti acquistino il biglietto; iii) almeno quattro acquistino il biglietto.

Esercizio 9.3. Il dirigente di una banca ha stimato che la probabilità che un cliente, cui è stato concesso un finanziamento, sia insolvente è 0.05. L’esito di ciascun finanziamento è indipendente dagli altri. Recentemente sono stati concessi 10 finanziamenti. Determinare la probabilità che: i) un cliente sia insolvente; ii) i clienti siano tutti solventi; iii) al massimo un cliente sia insolvente. Esercizio 9.4. Una società di esplorazione di gas naturale scopre in media quattro giacimenti di gas per ogni cento trivellazioni eseguite. L’esito di ciascuna trivellazione è indipendente dagli altri. Si eseguono venti trivellazioni. i) Qual è la probabilità che si scopra un giacimento? ii) Qual è la probabilità che si scopra al massimo un giacimento? iii) Qual è la probabilità che si scoprano almeno due giacimenti? iv) Qual è il numero medio di giacimenti scoperti in venti

trivellazioni?

Page 215: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 201

Esercizio 9.5. Dall’inventario di 48 automobili spedite ai concessionari risulta che su 12 di esse sono state montate radio difettose. Un concessionario ha ricevuto 8 automobili. i) Qual è la probabilità che nessuna automobile abbia una radio

difettosa? ii) Qual è la probabilità che almeno un’automobile abbia una radio

difettosa? iii) Quante automobili con radio difettose deve aspettarsi il

concessionario? Esercizio 9.6. In una busta ci sono venti semi di una pianta che

produce fiori rossi o bianchi. Se il 40% dei semi sono di piante con i fiori bianchi, qual è la probabilità che piantando sei semi si abbiano quattro piante con fiori bianchi e due piante con fiori rossi?

Esercizio 9.7. Un mazzo di carte francesi è composto da 52 carte,

fra le quali vi sono tredici carte di fiori e quattro assi. Un giocatore sceglie a caso, senza rimessa, 5 carte dal mazzo. i) Qual è la probabilità che siano tutte carte di fiori? ii) Qual è la probabilità che quattro delle cinque carte siano assi?

Esercizio 9.8. A un casello autostradale arrivano in media cinque automobili al minuto. Il numero di automobili ha una distribuzione di Poisson. i) Qual è la probabilità che in un minuto non arrivi alcuna

automobile? ii) Qual è la probabilità che in un minuto arrivi almeno

un’automobile? iii) Qual è il numero medio di automobili che arrivano al casello

autostradale in 10 minuti? iv) Qual è la probabilità che in 3 minuti arrivino 18 automobili?

Esercizio 9.9. Il numero di riparazioni necessarie per far funzionare un determinato sistema ha una distribuzione di Poisson. In media, in un mese, sono effettuate due riparazioni.

Page 216: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 202

i) Qual è la probabilità che in un mese si debba fare una riparazione?

ii) Qual è la probabilità che in un mese si debbano fare due riparazioni?

iii) Qual è la probabilità che in un mese si debbano fare tre riparazioni?

iv) Qual è la probabilità che in tre mesi si debbano fare sette riparazioni?

Esercizio 9.10. Il numero di studenti che si presentano presso la

segreteria di un grande ateneo ha una distribuzione di Poisson. In media si presentano tre studenti al minuto. i) Qual è la probabilità che in un minuto arrivi almeno uno

studente? ii) Qual è la probabilità che in due minuti non arrivi alcuno

studente? iii) Qual è la probabilità che in tre minuti arrivino 15 studenti? iv) Qual è il numero medio di studenti che si presentano in un’ora?

Esercizio 9.11. Il gestore di una stazione di servizio regala un grattino a ogni cliente. Egli garantisce che ogni grattino ha probabilità 0.05 di contenere un messaggio che dà diritto a venti euro di benzina gratuiti. Un automobilista decide di far rifornimento sempre nella stessa stazione finché non ottiene un grattino con il messaggio vincente. i) Qual è la probabilità che un grattino con il messaggio vincente si

verifichi al quinto acquisto di benzina? ii) Qual è il numero medio di acquisti di benzina che l’automobilista

deve effettuare affinché si verifichi il grattino con il messaggio vincente? Esercizio 9.12. Un giardiniere sa che una pianta si riproduce con

estrema difficoltà. In particolare la probabilità che una talea metta le radici è 0.15. i) Qual è la probabilità che la pianta si riproduca quando il

giardiniere pianta la seconda talea?

Page 217: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali discrete 203

ii) Qual è la probabilità che la pianta si riproduca dopo la seconda talea?

iii) Qual è il numero medio di talee che il giardiniere deve piantare perché la pianta si riproduca?

Esercizio 9.13. Un’azienda produttrice di automobili offre ai suoi

clienti un servizio di soccorso stradale. La probabilità che in un’ora vi sia una richiesta di aiuto è 0.33. Le richieste di soccorso sono fra loro indipendenti. i) Qual è la probabilità che la prima richiesta di soccorso si verifichi

nella seconda ora? ii) Qual è la probabilità che la prima richiesta di soccorso si verifichi

dopo la prima ora? iii) Qual è il numero medio di ore necessarie affinché vi sia la prima

richiesta di soccorso?

Page 218: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 219: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue

10.1 Variabile casuale normale 10.1.1 Il modello normale

In molte circostanze è ragionevole ipotizzare che la variabile casuale, che descrive un fenomeno di interesse, assuma con probabilità elevata valori intorno alla media e inoltre assuma valori in intervalli di ampiezza fissata con probabilità che decresce quando l’intervallo si allontana dalla media. La statura media dei bambini maschi, a dieci anni, è circa 137 centimetri ed è naturale aspettarsi che con probabilità elevata un bambino di dieci anni abbia un’altezza compresa intorno a tale valore. Risulta invece meno probabile che la statura sia compresa fra 130 e 134 centimetri − o fra 140 e 144 centimetri − e risulta ancora meno probabile che la statura sia compresa fra 125 e 129 centimetri − o fra 145 e 149 centimetri. Un modello idoneo a rappresentare questo o altri fenomeni simili deve avere una funzione di densità che ha il massimo in corrispondenza della media e che decresce in maniera simmetrica nelle code (vedi figura 10.1). Il modello normale ha tali caratteristiche. Lo stesso nome suggerisce che si tratta di una distribuzione particolarmente ricorrente e molti fenomeni, come pesi, altezze, lunghezze ed errori di misura, sono adeguatamente rappresentati da una variabile casuale normale, sicché questo modello ha un ruolo centrale sia nella teoria che nelle applicazioni della statistica.

Page 220: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 206

Una variabile casuale continua X, che assume valori nell’insieme dei numeri reali, è normale se la sua funzione di densità è

( )22

12

2

1( )2

x

f x eµ

σ

πσ

−−

= ,

per x−∞ < < +∞ , dove µ e 2σ sono due parametri tali che µ−∞ < < +∞ e 2σ >0. E’ possibile dimostrare che µ e 2σ sono

rispettivamente la media e la varianza di X

[ ]E Xµ = , ( )2 Var Xσ = .

Per indicare che una variabile casuale X è distribuita in modo normale, con media µ e varianza 2σ , si utilizza la notazione

( )2,X N µ σ∼ .

La funzione di densità di una variabile casuale normale ha forma campanulare ed è centrata sulla media.

Quando varia µ la funzione di densità si sposta lungo l’asse delle ascisse. La figura 10.2 illustra le funzioni di densità di due variabili casuali normali X e Y, con la stessa varianza, ma tali che Xµ , la media di X, è minore della media Yµ di Y. Al crescere di 2σ invece aumenta la dispersione intorno alla media. La figura 10.3 illustra le funzioni di densità di due variabili casuali normali X e Y, con la stessa media, ma

Figura 10.1 Funzione di densità

di una variabile casuale normale

f(x)

x µ

Page 221: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue 207

tali che la varianza 2Xσ di X è minore della varianza 2

Yσ di Y. In breve al variare dei parametri µ e 2σ si genera una famiglia di variabili casuali normali, esse hanno una funzione di densità con la stessa forma ma sono caratterizzate da diversa posizione e diversa variabilità.

Il grafico della funzione di ripartizione di una variabile casuale

normale è illustrato nella figura 10.4. La funzione di ripartizione delle variabili casuali normali non ha

un’espressione analitica e deve essere calcolata numericamente. Tuttavia, nelle applicazioni, la probabilità che una variabile casuale normale assuma valori in un intervallo può essere ottenuta utilizzando la funzione di ripartizione della variabile casuale normale standardizzata, per la quale è disponibile la tavola (riportata in appendice).

f(x) f(y)

µX µY

Figura 10.2 Funzione di densità di variabili casuali normali con

Figura 10.3 Funzione di densità di variabili casuali normali con diverse varianze

f(x)

f(y)

µ

Page 222: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 208

Una variabile casuale normale standardizzata Z ha media nulla e

varianza unitaria, ( )0,1Z N∼ . La sua funzione di densità è 21

21( )2

zz eφ

π

−= .

La funzione di ripartizione di Z si indica con

( ) ( )z P Z zΦ = ≤

ed è tabulata per valori di z non negativi.

Ad esempio consultando le tavole si ha ( ) ( )1.28 1.28P Z ≤ = Φ

0.8997= e ( ) ( )1.96 1.96 0.9750P Z ≤ = Φ = .

F(x)

x

Figura 10.4 Funzione di ripartizione di una variabile casuale normale

Figura 10.5 ( ) ( )z P Z zΦ = ≤

z

( )zφ

0

Φ(z)

Page 223: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue 209

Utilizzando la tavola di ( )zΦ è possibile calcolare le probabilità che Z assuma valore in una qualsiasi regione dell’asse reale. Infatti la probabilità ( )P Z z≥ , per z positivo, è l’area sotto ( )zφ a destra di z. Poiché l’area sotto la funzione di densità vale 1, ( )P Z z≥ è data dal complemento a 1 della funzione di ripartizione

( ) ( )1P Z z z≥ = −Φ .

Così la probabilità che Z sia maggiore di 1.96 è data da

( 1.96) 1 (1.96) 1 0.9750 0.0250P Z ≥ = −Φ = − = .

Per la simmetria della funzione di densità, la probabilità che Z sia maggiore di z− , con 0z > , è data dal valore della funzione di ripartizione calcolata in z

( ) ( )P Z z z≥ − = Φ .

Ad esempio la probabilità che Z sia maggiore di –1.28 è data da

( ) ( )1.28 1.28 0.8997P Z ≥ − = Φ = .

Figura 10.6 ( ) ( )1P Z z z≥ = −Φ c

on 0z >

1-Φ(z)

( )zφ

0 z

Page 224: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 210

Sempre per la simmetria della funzione di densità, la probabilità

che Z sia minore di z− , con 0z > , (costituita dall’area a sinistra di z− ) è uguale all’area nella coda a destra di z, cioè

( ) ( ) ( )1P Z z z z≤ − = Φ − = −Φ .

Così la probabilità che Z sia minore di –1.28 è data da

( ) ( ) ( )1.28 1.28 1 1.28 1 0.8997 0.1003P Z ≤ − = Φ − = −Φ = − = .

Infine la probabilità che Z assuma valori nell’intervallo ( )1 2,z z è data dalla differenza della funzione di ripartizione calcolata nei due estremi

1 2 2 1( ) ( ) ( )P z Z z z z≤ ≤ = Φ −Φ .

Figura 10.7 ( ) (P Z z z≥ − = Φ

con 0z >

Figura 10.8 ( ) ( )1P Z z z≤ − = −Φ

con 0z >

( )zφ

Φ(z)

-z 0

-z

( )zφ

1-Φ(z) 0

Page 225: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue 211

Ad esempio la probabilità che Z assuma valori nell’intervallo ( 1.28,1.96)− è data da ( ) ( ) ( )1.28 1.96 1.96 1.28 0.9750 0.1003 0.8747.P Z− ≤ ≤ = Φ −Φ − = − =

( )zφ

Per calcolare la probabilità che una variabile casuale normale X

(non standardizzata) assuma valori in un intervallo è utile la seguente proprietà della distribuzione normale.

Sia ( )2,X XX N µ σ∼ , la trasformazione lineare Y aX b= + è ancora normale con media Xa bµ + e varianza 2 2

Xa σ

( )2 2,X XY aX b N a b aµ σ= + +∼ .

Di conseguenza, se ( )2,X N µ σ∼ , standardizzando X si opera una trasformazione lineare (paragrafo 7.8) e pertanto si ha

(10.1) ( )0,1X Nµσ− ∼ .

La probabilità che X assuma valori in un intervallo ( ),a b è data da

( ) ( ) a X bP a X b P a X b P µ µ µµ µ µσ σ σ− − − ≤ ≤ = − ≤ − ≤ − = ≤ ≤

e per la (10.1) si ha

( ) a b b aP a X b P Zµ µ µ µσ σ σ σ− − − − ≤ ≤ = ≤ ≤ = Φ −Φ

.

z1 z2

Φ(z2)-Φ(z1)

Figura 10.9 ( )( ) ( )1 2

2 1

P z Z z

z z

≤ ≤

= Φ −Φ

( )zφ

( )zφ

Page 226: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 212

Esempio 10.1. Il percorso in chilometri che un’utilitaria compie con un litro di carburante ha una distribuzione normale con media 25 e scarto quadratico medio 3. Si vuole calcolare la probabilità che i chilometri percorsi con un litro di carburante siano al massimo 30.

Sia X la variabile casuale che descrive i chilometri percorsi per litro di carburante, si ha ( )225,3X N∼ 1. La probabilità dell’evento

30X ≤ è data da

30 25( 30) ( 1.67) (1.67) 0.95253

P X P Z P Z− ≤ = ≤ = ≤ = Φ =

.

Esempio 10.2. Il peso delle confezioni di biscotti prodotti da

un’azienda ha una distribuzione normale con media 350 grammi e scarto quadratico medio 5 grammi. Si vuole calcolare la probabilità che un pacco di biscotti pesi più di 360 grammi.

Sia X la variabile casuale che descrive il peso delle confezioni di biscotti, si ha ( )2350,5X N∼ . La probabilità dell’evento 360X ≥ è data da

( )360 350( 360) 25

P X P Z P Z− ≥ = ≥ = ≥

1 (2) 1 0.9772 0.0228.= −Φ = − =

Esempio 10.3. Sulla base dell’esperienza maturata negli anni

passati è stato osservato che i rendimenti di un titolo azionario in percentuale hanno una distribuzione normale con media 6.5 e scarto quadratico medio 3.5. Si vuole calcolare la probabilità che si abbia una perdita.

Sia X la variabile casuale che descrive i rendimenti, si ha ( )26.5,3.5X N∼ . La probabilità che vi sia una perdita è

1 Si noti che i parametri della variabile casuale normale sono la media e la varianza; quindi, quando il testo dell’esempio riporta lo scarto quadratico medio, nel definire la distribuzione di X si deve riportare 2σ .

Page 227: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue 213

0 6.5( 0) ( 1.86)3.5

1 (1.86) 1 0.9686 0.0314.

P X P Z P Z− ≤ = ≤ = ≤ −

= −Φ = − =

Esempio 10.4. La durata in ore delle lampadine prodotte da

un’azienda ha una distribuzione normale con media 1500 e scarto quadratico medio 300. Si vuole calcolare la probabilità che una lampadina duri almeno 1000 ore.

Sia X la variabile casuale che descrive la durata delle lampadine, si ha ( )21500,300X N∼ . Di conseguenza

( )1000 1500( 1000) 1.67 (1.67) 0.9525.300

P X P Z P Z− ≥ = ≥ = ≥ − = Φ =

Esempio 10.5. Il diametro in millimetri dei bulloni prodotti da

un’azienda ha una distribuzione normale con media 12 e scarto quadratico medio 0.15. Si vuole calcolare la probabilità che il diametro sia compreso fra 11.8 e 12.1 millimetri.

Sia X la variabile casuale che descrive il diametro dei bulloni, ( )212,0.15X N∼ . La probabilità che X assuma valori nell’intervallo

( )11.8,12.1 è data da

( )[ ] ( )

11.8 12.0 12.1 12.0(11.8 12.1)0.15 0.15

1.33 0.67 (0.67) ( 1.33)

(0.67) 1 (1.33) 0.7486 1 0.9082 0.6568.

P X P Z

P Z

− − ≤ ≤ = ≤ ≤

= − ≤ ≤ = Φ −Φ −

= Φ − −Φ = − − =

10.1.2 Proprietà riproduttiva della variabile casuale normale

La variabile casuale normale gode della proprietà riproduttiva: combinazioni lineari di variabili casuali normali indipendenti generano variabili casuali la cui distribuzione è ancora normale.

Page 228: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 214

Siano 1 2, , , nX X X… variabili casuali normali, ( )2,i i iX N µ σ∼ , e indipendenti; la combinazione lineare i iY a X=∑ ha una distribuzione normale. In particolare applicando le formule (8.7) e (8.9) si ha

(10.2) 2 2

1 1 1,

n n n

i i i i i ii i i

Y a X N a aµ σ= = =

=

∑ ∑ ∑∼ .

Esempio 10.6. Una catena di grandi magazzini ha due filiali nella

stessa città. Il fatturato mensile della prima filiale ha una distribuzione normale con media 5 milioni di euro e scarto quadratico medio 0.30. Il fatturato della seconda filiale invece si distribuisce indipendentemente in modo normale con media 6.5 milioni di euro e scarto quadratico medio 0.45. Si vuole calcolare la probabilità che il fatturato complessivo sia superiore a 12 milioni di euro.

Sia 1X la variabile casuale che descrive il fatturato della prima filiale, ( )2

1 5.0,0.30X N∼ , e sia 2X la variabile casuale che descrive il fatturato della seconda filiale, ( )2

2 6.5,0.45X N∼ . Il fatturato complessivo è dato da 1 2Y X X= + ed è una particolare combinazione lineare nella quale 1 2 1a a= = . Poiché 1X e 2X sono indipendenti la loro somma ha una distribuzione normale, con media data dalla somma delle medie [ ] [ ] [ ]1 2 5.0 6.5 11.5E Y E X E X= + = + = e varianza data dalla somma delle varianze ( ) ( ) ( )1 2Var Y Var X Var X= +

2 20.30 0.45 0.2925= + = ; pertanto ( )11.5,0.2925Y N∼ . La probabilità che il fatturato complessivo superi 12 milioni di euro è

( ) ( )

( )

12.0 11.512 0.930.2925

1 0.93 1 0.8238 0.1762.

P Y P Z P Z− > = > = >

= −Φ = − =

Nell’ambito delle combinazioni lineari di variabili casuali

normali, particolare rilievo ha la media di n variabili indipendenti con la stessa media e la stessa varianza.

Siano 1 2, , , nX X X… variabili casuali normali indipendenti e identicamente distribuite, cioè tali che ( )2,iX N µ σ∼ per i=1,2,…,n.

Page 229: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue 215

Per la (8.10) e la (8.11) la loro media X ha valore atteso µ e varianza 2σ /n. Per la proprietà riproduttiva si ha

(10.3) 2

1

1 ,n

ii

X X Nn n

σµ=

=

∑ ∼ .

10.2 Variabile casuale uniforme

La variabile casuale uniforme assume valori in un intervallo ( )1 2,ϑ ϑ ed è caratterizzata dal fatto che la funzione di densità è costante nell’intervallo. L’estremo inferiore dell’intervallo 1ϑ e l’estremo superiore 2ϑ sono i parametri che caratterizzano la distribuzione. Per indicare che una variabile casuale X ha una distribuzione uniforme sull’intervallo ( )1 2,ϑ ϑ si utilizza la notazione

( )1 2,X U ϑ ϑ∼ .

La funzione di densità è data da

( )2 1

1f xϑ ϑ

=−

,

per 1 2xϑ ϑ≤ ≤ ed è nulla altrove. La forma della funzione di densità è tale che la probabilità che X assuma valori in due diversi segmenti di eguale ampiezza è la stessa.

E’ possibile dimostrare che il valore atteso e la varianza di X sono dati da

[ ] 1 2

2E X ϑ ϑ+

= , ( ) ( )22 1

12Var X

ϑ ϑ−= .

La media coincide con il valore centrale dell’intervallo ( )1 2,ϑ ϑ . Infine la funzione di ripartizione è

( ) 1

2 1

xF x ϑϑ ϑ−

=−

.

Page 230: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 216

Esempio 10.7. Nel gioco della ruota della fortuna un ago viene

fatto ruotare in modo tale da non privilegiare alcun punto della circonferenza quando si arresta. Sia X la variabile casuale che descrive l’angolo ottenuto quando l’ago si arresta; si ha ( )0, 2X U π∼ sicché la funzione di densità è ( ) ( )1/ 2f x π= .

La ruota della fortuna è divisa in spicchi. Vi è uno spicchio di ampiezza / 6π tale che, quando l’ago si ferma sull’arco corrispondente, il giocatore passa il turno. Si vuole determinare la probabilità che il giocatore perda il turno. Poiché la funzione di densità è costante, la probabilità è data dalla misura dell’area sotto la funzione di densità di un qualsiasi intervallo di ampiezza / 6π . Questa è l’area di un rettangolo con base / 6π e altezza ( ) ( )1/ 2f x π= e pertanto la probabilità è ( ) ( )/ 6 1/ 2 1/12π π× = . 10.3 Variabile casuale esponenziale negativa

La variabile casuale esponenziale negativa è utilizzata per descrivere i tempi di attesa affinché si verifichi un evento: un utente richieda un servizio, un impianto necessiti un intervento di

f(x)

Figura 10.10 Funzione di densità di una variabile casuale Uniforme

2ϑ1ϑ

Page 231: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue 217

manutenzione, una persona trovi un impiego, una terapia abbia effetto, e così via. Inoltre, quando il numero di eventi che si verificano in un intervallo di tempo ha una distribuzione di Poisson, i tempi che intercorrono fra un evento e il successivo hanno una distribuzione esponenziale negativa.

La variabile casuale esponenziale negativa X è una variabile continua che assume valori non negativi. La sua funzione di densità è

( ) xf x e λλ −=

per 0x ≥ e nulla altrove e dipende da un parametro 0λ > . Di conseguenza per indicare che X ha una distribuzione esponenziale negativa si usa la notazione

( )X Exp λ∼ .

La figura 10.11 illustra la funzione di densità della variabile casuale esponenziale negativa per diversi valori di λ ; all’aumentare del valore del parametro la funzione di densità tende più rapidamente verso zero.

La funzione di ripartizione della variabile casuale esponenziale negativa è

( ) 1 xF x e λ−= − ,

mentre il valore atteso e la varianza sono

[ ] 1E Xλ

= , 2

1( )Var Xλ

= .

Esempio 10.8. Il tempo impiegato da un commesso di un negozio per assistere i clienti si distribuisce come una variabile casuale esponenziale negativa. In media il commesso impiega 10 minuti per ogni cliente. Si vuole calcolare la probabilità che, per assistere un cliente, il commesso impieghi un tempo compreso fra 5 e 15 minuti.

Page 232: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 218

Figura 10.11 – Funzione di densità di una variabile casuale esponenziale negativa

0 1 2 3 40.0

0.1

0.2

0.3

0.4

0.5

0 1 2 3 4

0.0

0.2

0.4

0.6

0.8

1.0

0 1 2 3 40.0

0.5

1.0

1.5

2.0

0 1 2 3 4

0

1

2

3

4

Sia X la variabile casuale che descrive il tempo impiegato per assistere un cliente. Il parametro λ è dato dal reciproco della media; pertanto si ha 1/10λ = e ( )1/10X Exp∼ . La probabilità è

( )1 115 5

10 10

1 32 2

5 15 (15) (5) 1 1

0.3834.

P X F F e e

e e

− × − ×

− −

≤ ≤ = − = − − −

= − =

La variabile casuale esponenziale negativa è utilizzata in

concomitanza con la variabile casuale di Poisson per studiare le modalità con le quali gli utenti richiedono un servizio. Lo studio di tale

f(x)

f(x) f(x)

f(x)

λ=0.5

λ=2 λ=4

λ=1

x

x x

x

Page 233: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue 219

fenomeno può riguardare sia il numero di eventi che si verificano in un intervallo di tempo di lunghezza prefissata sia il tempo che intercorre fra eventi successivi. Quando il numero di eventi è descritto da una variabile casuale di Poisson, il tempo di interarrivo − che intercorre fra un evento e il successivo − ha una distribuzione esponenziale negativa.

Sia ( )1tX P tλ∼ la variabile casuale che descrive il numero di eventi che si verificano in un intervallo di lunghezza t, dove λ1 è il numero medio di eventi in un intervallo di lunghezza unitaria. Il tempo T, affinché si verifichi un evento, è maggiore di t se in un intervallo di lunghezza t non si verifica alcun evento. Di conseguenza la probabilità dell’evento T t> è data da

( ) ( )1

1

01( )0

0!

tt

te tP T t P X e

λλλ−

−> = = = = .

La funzione di ripartizione di T è 1( ) ( ) 1 ( ) 1 t

TF t P T t P T t e λ−= ≤ = − > = − ,

sicché T ha una distribuzione esponenziale negativa con parametro λ1, ( )1T Exp λ∼ . Si noti che il tempo medio è il reciproco del numero

medio di eventi che si verificano in un intervallo di lunghezza unitaria.

Esempio 10.9. Nell’esempio 9.6 il numero di clienti che si presentano a uno sportello bancario in t minuti ha una distribuzione di Poisson con parametro 1t tλ λ= , dove 1 1/ 3λ = è il numero medio di clienti che si presentano in un minuto. Di conseguenza il tempo T affinché si verifichi un arrivo ha una distribuzione esponenziale negativa con parametro 1λ , ( )1/ 3T Exp∼ . La probabilità che in cinque minuti non arrivi alcun cliente può essere calcolata come la probabilità che il tempo necessario affinché arrivi un cliente sia maggiore di 5, ottenendo

( ) ( )1 535 1 5 0.1889P T F e

− ×> = − = = .

Page 234: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 220

Esempio 10.10. A un centralino arrivano in media due chiamate al minuto. Assumendo che il numero di chiamate abbia una distribuzione di Poisson, si vuole calcolare la probabilità che il tempo che intercorre fra due chiamate sia al massimo 20 secondi.

Sia X1 la variabile casuale che descrive il numero di chiamate al minuto, si ha ( )1 2X P∼ . La variabile casuale T, che descrive il tempo che intercorre fra due chiamate, ha una distribuzione esponenziale negativa con parametro 2λ = , ( )2T Exp∼ . Se il minuto rappresenta l’intervallo di tempo di lunghezza unitaria, 20 secondi corrispondono a un intervallo di lunghezza 1/ 3t = . La probabilità che T non superi 20 secondi è

1231 1 1 0.4866

3 3P T F e

− × ≤ = = − =

.

10.4 Variabile casuale chi-quadrato

Siano 1 2, , , nZ Z Z… n variabili casuali normali standardizzate, ( )0,1iZ N∼ , e indipendenti. La variabile casuale

2

1

n

ii

X Z=

= ∑

ha una distribuzione χ2 (chi-quadrato) con n gradi di libertà, 2nX χ∼ .

I gradi di libertà n costituiscono il parametro che caratterizza questa distribuzione; esso è dato dal numero di variabili casuali Zi indipendenti comprese nella somma. La variabile casuale 2χ assume valori non negativi, 0X ≥ , e ha una funzione di densità unimodale e asimmetrica verso destra. La figura 10.12 illustra la funzione di densità per diversi valori di n.

Page 235: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue 221

Figura 10.12 – Funzione di densità della variabile casuale χ2

Il valore atteso e la varianza dipendono dai gradi di libertà e sono

dati da [ ]E X n= , ( ) 2Var X n= .

La tavola (riportata in appendice) fornisce, al variare di n, i percentili 2

,n αχ tali che una variabile casuale 2nχ assuma valori

maggiori di 2,n αχ con probabilità α,

( )2 2,n nP αχ χ α≥ = .

Ad esempio per una variabile casuale 2χ con 10 gradi di libertà, il percentile tale che nella coda di destra vi sia un’area pari ad 0.10α =

f(x)

α

x

Figura 10.13 Aree nelle tavole della variabile casuale χ2

n=4

n=6

n=8

n=1

n=2

f(x) f(x)

x x

2αχ

Page 236: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 222

è 210,0.10χ =15.99. Di conseguenza il valore della funzione di ripartizione

di una variabile casuale 210χ nel punto 15.99 è ( )2

10 15.99P χ ≤ 1 0.10 0.90= − =

10.5 Variabile casuale t di Student

Sia Z una variabile casuale normale standardizzata e Y una variabile casuale 2

nχ , fra loro indipendenti. La variabile casuale

/ZX

Y n=

ha una distribuzione t di Student con n gradi di libertà,

nX t∼ .

Il parametro n che caratterizza la distribuzione di questa variabile casuale è lo stesso della variabile casuale 2χ che si trova al denominatore.

La variabile casuale t di Student assume valori reali e ha una distribuzione simmetrica intorno allo zero. La funzione di densità è simile a quella della variabile casuale normale standardizzata, ma presenta una maggiore dispersione e tende a zero più lentamente. La variabile casuale t di Student assume valori distanti dallo zero con maggiore probabilità rispetto alla variabile casuale normale standardizzata.

f(x)

x 0

Figura 10.14 Funzione di densità della variabile casuale t di Student

Page 237: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue 223

La tavola (in appendice) fornisce, al variare dei gradi di libertà n e in corrispondenza di diversi valori di α , i percentili ,nt α tali che la probabilità che una variabile casuale tn assuma valori maggiori di ,nt α sia uguale ad α,

( ),n nP t t α α≥ = .

Ad esempio il percentile di una t di Student con 7 gradi di libertà, tale che l’area nella coda di destra sia pari ad 0.05α = , è 7,0.05 1.895t = ; pertanto il valore della funzione di ripartizione di una variabile casuale

7t in 1.895 è 1 0.95α− = .

Un’importante proprietà della variabile casuale t di Student è la

seguente: all’aumentare dei gradi di libertà n la distribuzione di tn converge alla distribuzione di una variabile casuale normale standardizzata. Come conseguenza pratica di questa proprietà, quando n è sufficientemente grande (approssimativamente maggiore di 30), la distribuzione della variabile casuale t di Student può essere approssimata dalla distribuzione normale standardizzata.

10.6 Esercizi

Esercizio 10.1. Sia ( )0,1Z N∼ , determinare le seguenti probabilità

x

Figura 10.15 Aree nelle tavole della variabile casuale t di Student

f(x)

α

,nt α

Page 238: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 224

i) ( )1.34P Z ≤ ; iv) ( )1.17P Z ≤ − ;

ii) ( )1.17P Z ≥ ; v) ( )1.17 1.34P Z− ≤ ≤ ;

iii) ( )1.17 1.34P Z≤ ≤ ; vi) ( )1.17 0.50P Z− ≤ ≤ − . Esercizio 10.2. Il contenuto di liquido in una bottiglia da due litri

ha una distribuzione normale con media 2000 millilitri e scarto quadratico medio 25 millilitri. Determinare la probabilità che i) il contenuto sia minore di 2020 millilitri; ii) il contenuto sia maggiore di 2020 millilitri; iii) il contenuto sia minore di 1975 millilitri; iv) il contenuto sia maggiore di 1970 millilitri; v) il contenuto sia compreso fra 1970 e 2030 millilitri.

Esercizio 10.3. Nell’esempio 10.1 il percorso in chilometri che un’utilitaria compie con un litro di carburante ha una distribuzione normale con media 25 e scarto quadratico medio 3. Determinare la probabilità che i) percorra più di 27 chilometri; ii) percorra meno di 21 chilometri; iii) il percorso sia compreso fra 21 e 27 chilometri.

Esercizio 10.4. Nell’esempio 10.2 il peso delle confezioni di

biscotti prodotti da un’azienda ha una distribuzione normale con media 350 grammi e scarto quadratico medio 5. Determinare la probabilità che i) il peso sia minore di 365 grammi; ii) il peso sia maggiore di 335 grammi; iii) il peso sia compreso fra 340 e 350 grammi.

Esercizio 10.5. Nell’esempio 10.3 il rendimento di un titolo azionario in percentuale ha una distribuzione normale con media 6.5 e scarto quadratico medio 3.5. Determinare la probabilità che i) il rendimento sia minore di 12; ii) il rendimento sia superiore a 4; iii) il rendimento sia compreso fra 4 e 10.

Page 239: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue 225

Esercizio 10.6. Nell’esempio 10.4 la durata in ore delle lampadine prodotte da un’azienda ha una distribuzione normale con media 1500 e scarto quadratico medio 300. Determinare la probabilità che i) la durata sia inferiore a 1250 ore; ii) la durata sia superiore a 1750 ore; iii) la durata sia compresa fra 1500 e 1670 ore.

Esercizio 10.7. Il tempo intercorrente tra la fatturazione e il

pagamento dei conti aperti di un’azienda ha una distribuzione approssimativamente normale con media 30 giorni e scarto quadratico medio 4.9. Determinare il tempo tale che una fattura sia pagata con probabilità 0.90.

Esercizio 10.8. La distribuzione del numero di clienti che consumano un pasto in un autogrill in un giorno può essere approssimata da una distribuzione normale con media 100 e varianza 82. Determinare la probabilità che i) il numero di clienti sia maggiore di 120; ii) il numero di clienti sia minore di 90; iii) il numero di clienti sia compreso fra 90 e 120. Ogni giorno nell’autogrill si prepara lo stesso numero di pasti sostenendo un costo fisso pari a 1000 euro e ciascun pasto viene venduto a un prezzo fisso di 12 euro. Determinare iv) il profitto atteso; v) lo scarto quadratico medio del profitto; vi) la probabilità che vi sia una perdita.

Esercizio 10.9. La distribuzione dei voti conseguiti dagli studenti a un esame di statistica ha una distribuzione approssimativamente normale con media 24 e scarto quadratico medio 3.3. Invece la distribuzione dei voti conseguiti a un esame di economia ha una distribuzione approssimativamente normale con media 25 e scarto quadratico medio 1.5. Se i docenti utilizzano una graduatoria, in base alla quale sono classificati con A il 10% dei più bravi, è preferibile ottenere 28 all’esame di statistica o 27 all’esame di economia?

Page 240: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 226

Esercizio 10.10. In un’indagine sul reddito familiare mensile è stato osservato che il reddito dei mariti ha una distribuzione normale con media 1500 euro e scarto quadratico medio 250, mentre il reddito delle mogli si distribuisce indipendentemente in modo normale con media 1200 euro e scarto quadratico medio 300. Si vuole calcolare la probabilità che il reddito familiare superi i 3000 euro.

Esercizio 10.11. Un’azienda acquisisce il 30% delle sue materie prime da un fornitore e la parte restante da un altro fornitore. La percentuale di impurità nel materiale del primo fornitore ha una distribuzione normale con media 5 e scarto quadratico medio 1.2. La percentuale di impurità nel materiale del secondo fornitore si distribuisce indipendentemente in modo normale con media 3.5 e scarto quadratico medio 1.7. Qual è la probabilità che nell’insieme delle materie prime la percentuale di impurità sia superiore al 4%?

Esercizio 10.12. Nell’esempio 10.5 il diametro in millimetri dei bulloni prodotti da un’azienda ha una distribuzione normale con media 12 e scarto quadratico medio 0.15. Si sceglie un campione di dieci bulloni. Qual è la probabilità che la media dei diametri dei dieci bulloni sia compresa fra 11.9 e 12.1 millimetri?

Esercizio 10.13. Un professore incontra regolarmente gli studenti

durante l’orario di ricevimento. Il tempo trascorso con ciascuno studente si distribuisce come una variabile casuale esponenziale negativa con media 15 minuti. Determinare la probabilità che i) uno studente trascorra con il professore meno di 20 minuti; ii) uno studente trascorra con il professore più di 5 minuti; iii) uno studente trascorra con il professore un tempo compreso fra

10 e 15 minuti.

Esercizio 10.14. Il tempo in minuti che intercorre fra l’arrivo di due automobili presso una stazione di servizio ha una distribuzione esponenziale negativa con media 2. Determinare la probabilità che il tempo che intercorre fra due arrivi

Page 241: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Modelli per variabili casuali continue 227

i) sia minore di un minuto; ii) sia maggiore di cinque minuti; iii) sia compreso fra tre e cinque minuti.

Esercizio 10.15. Il numero di prelievi presso uno sportello bancomat ha una distribuzione di Poisson. In media ogni ora vi sono sei prelievi. i) Qual è la probabilità che in 10 minuti non vi siano prelievi? ii) Qual è il tempo medio che intercorre fra un prelievo e il

successivo? Esercizio 10.16. Il numero di incidenti automobilistici che si verificano su un raccordo extraurbano ha una distribuzione di Poisson. Il numero medio di incidenti al mese è 1.8. i) Qual è la probabilità che passino 2 mesi prima che si verifichi un

incidente? ii) Qual è il tempo medio che intercorre fra due incidenti? iii) Qual è la probabilità che in 10 minuti non vi siano prelievi? iv) Qual è il tempo medio che intercorre fra un prelievo e il

successivo?

Page 242: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 243: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Teorema del limite centrale 11.1 Introduzione

Il teorema del limite centrale motiva ulteriormente il ruolo

fondamentale che la distribuzione normale ha nella statistica. Molti fenomeni possono essere interpretati come la media o la somma di un elevato numero di variabili casuali indipendenti. Il teorema del limite centrale dimostra che la distribuzione della media o della somma di n variabili casuali indipendenti tende alla distribuzione di una variabile casuale normale quando n diventa infinitamente grande.

Sebbene esistano diverse versioni del teorema del limite centrale, l’esposizione è qui limitata al caso in cui le variabili casuali sono indipendenti e hanno la stessa media e la stessa varianza.

11.2 Teorema del limite centrale 11.2.1 Media di variabili casuali

Si consideri una successione di variabili casuali 1 2, , , ,nX X X… … indipendenti e tali che [ ]iE X µ= e ( ) 2

iVar X σ= per qualunque i. Si indichi1 con nX la media delle prime n variabili casuali

1 Limitatamente a questo capitolo, si utilizzano le notazioni nX e nY per la media e la somma di n variabili casuali (al posto di X e Y utilizzati altrove), perché l’interesse verte sul comportamento di queste variabili casuali al variare di n.

Page 244: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 230

1

1 n

n ii

X Xn =

= ∑ .

Per la (8.10) e la (8.11) la variabile casuale nX ha media µ e varianza 2 / nσ . Al crescere di n la varianza di nX tende a zero e quindi la

distribuzione di nX converge a quella di una costante che assume valore µ.. Tuttavia se si considera la media standardizzata

/n

nXZ

σ−

=

si ottiene una variabile casuale che ha media nulla e varianza unitaria per qualsiasi valore di n.

Il teorema del limite centrale afferma che, quando n tende a infinito, la distribuzione di nZ converge a quella di una variabile casuale normale standardizzata.

Questo è un risultato di ampia rilevanza in quanto non si assume alcuna ipotesi sulla distribuzione delle variabili casuali di partenza, le quali possono essere sia discrete sia continue e avere una distribuzione molto diversa da quella normale.

La figura 11.1.a illustra la funzione di densità di una variabile casuale uniforme X (paragrafo 10.2). Essa è costante su tutto l’intervallo nel quale X assume valori e pertanto ha una forma molto diversa da quella della funzione di densità della variabile casuale normale. La figura 11.1.b illustra la funzione di densità della media di due variabili casuali uniformi che ha una forma triangolare. Infine la figura 11.1.c illustra la funzione di densità della media di dieci variabili casuali uniformi. Essa ha una forma campanulare molto simile a quella normale.

La figura 11.2 illustra la distribuzione della media quando le variabili casuali Xi hanno una distribuzione esponenziale negativa (paragrafo 10.3). La distribuzione delle Xi è asimmetrica; tuttavia la funzione di densità della media di n variabili casuali esponenziali negative diventa via via più simmetrica al crescere di n. Si osservi

Page 245: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Teorema del limite centrale 231

infatti che per n=5 vi è ancora una notevole asimmetria, mentre per n=25 l’asimmetria della funzione di densità della media si è notevolmente ridotta.

Figura 11.1.a Funzione di densità di una variabile casuale uniforme

Figura 11.1.b Funzione di densità della media di 2 variabili casuali uniformi

Figura 11.1.c Funzione di densità della media di 10 variabili casuali uniformi

f(x)

x

n = 1

nz

n = 2 ( )nf z

nz

n = 10 ( )nf z

Page 246: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 232

Figura 11.2.a Funzione di densità di una variabile casuale esponenziale negativa

Figura 11.2.b Funzione di densità della media di 5 variabili casuali esponenziali negative

Figura 11.2.c Funzione di densità della media di 25 variabili casuali esponenziali negative

Il teorema del limite centrale ha importanti conseguenze applicative. Ogni volta che una variabile può essere espressa come media di n variabili casuali indipendenti, con lo stesso valore atteso e la

f(x)

x

n = 1

nz

n = 2 ( )nf z

nz

n = 10 ( )nf z

Page 247: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Teorema del limite centrale 233

stessa varianza, è possibile, per n sufficientemente grande, approssimare la probabilità che essa assuma valori in un intervallo ( ),a b utilizzando la funzione di ripartizione di una variabile casuale normale standardizzata. Infatti si ha

( )/ / /

/ /

/ /

nn

n

Xa bP a X b Pn n n

a bP Zn n

a bP Zn n

µµ µσ σ σ

µ µσ σ

µ µσ σ

⎛ ⎞−− −≤ ≤ = ≤ ≤⎜ ⎟

⎝ ⎠− −⎛ ⎞= ≤ ≤⎜ ⎟

⎝ ⎠− −⎛ ⎞≤ ≤⎜ ⎟

⎝ ⎠

dove Z è una variabile casuale normale standardizzata. Purtroppo non esiste una regola generalmente valida che consenta

di definire quale valore di n può ritenersi sufficientemente grande. Esso dipende dalla distribuzione delle Xi: la convergenza della distribuzione di nZ a quella di una variabile casuale normale standardizzata è tanto più veloce quanto minore è il grado di asimmetria nella distribuzione delle Xi.

11.2.2 Somma di variabili casuali Il teorema del limite centrale può essere applicato anche a somme

di variabili casuali indipendenti. Sia 1 2, , , ,nX X X… … una successione di variabili casuali indipendenti, con la stessa media [ ]iE X µ= e la stessa varianza ( ) 2

iVar X σ= . Si indichi con nY la somma delle prime n variabili casuali

1

n

n ii

Y X=

=∑ .

Per la (8.12) e la (8.13) il valore atteso e la varianza di nY sono dati da

[ ]nE Y nµ= , ( ) 2nVar Y nσ= .

Page 248: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 234

E’ immediato verificare che la variabile somma standardizzata coincide con nZ . Infatti n nY nX= e pertanto si ha

[ ]( ) 2 2 /

n n n nn

n

Y E Y nX n X ZVar Y n n

µ µσ σ

− − −= = = .

Di conseguenza, per n sufficientemente grande, la distribuzione di [ ]( ) ( )n n nY E Y Var Y− può essere approssimata da quella di una

variabile casuale normale standardizzata. In particolare per la probabilità che nY assuma valori in un intervallo ( ),a b si ha

(11.1)

( ) [ ]( )2 2

2 2

2 2,

n nn

n

n

Y E Ya n b nP a Y b PVar Yn n

a n b nP Zn n

a n b nP Zn n

µ µσ σ

µ µσ σ

µ µσ σ

⎛ ⎞−− −⎜ ⎟≤ ≤ = ≤ ≤⎜ ⎟⎝ ⎠⎛ ⎞− −

= ≤ ≤⎜ ⎟⎝ ⎠⎛ ⎞− −

≤ ≤⎜ ⎟⎝ ⎠

dove Z è una variabile casuale normale standardizzata. 11.3 Approssimazione della distribuzione binomiale mediante la normale

Il teorema del limite centrale può essere utilizzato per ottenere un’approssimazione delle probabilità della variabile casuale binomiale quando il parametro n è elevato. In tal caso infatti utilizzare la (9.2) risulta particolarmente oneroso in termini di calcoli.

Sia ( ),X B n π∼ , essa può essere espressa coma la somma di n variabili casuali bernoulliane indipendenti e identicamente distribuite con parametro π (paragrafo 9.3). Tali variabili casuali hanno valore atteso π e varianza ( )1π π− . Di conseguenza applicando la (11.1) la

Page 249: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Teorema del limite centrale 235

probabilità che X assuma valori in un intervallo ( ),a b può essere approssimata nel modo seguente

(11.2)

( ) [ ]( )(1 ) (1 )

,(1 ) (1 )

X E Xa n b nP a X b Pn nVar X

a n b nP Zn n

π ππ π π π

π ππ π π π

⎛ ⎞−− −⎜ ⎟≤ ≤ = ≤ ≤⎜ ⎟− −⎝ ⎠⎛ ⎞− −

≤ ≤⎜ ⎟⎜ ⎟− −⎝ ⎠

dove Z è una variabile casuale normale standardizzata.

L’approssimazione delle probabilità della binomiale mediante la (11.2) è tanto migliore quanto più π è prossimo a 0.5, ossia quanto più la forma della distribuzione di X è vicina alla simmetria.

Una regola empirica indica che l’approssimazione della distribuzione normale a quella binomiale è sufficientemente accurata quando ( )1 10nπ π− > .

Figura 11.3 – Approssimazione della distribuzione binomiale mediante la

distribuzione normale

-3 -2 -1 0 1 2 30.0

0.05

0.10

0.15

-3 -2 -1 0 1 2 30.0

0.02

0.04

0.06

0.08

0.10

0.12

-3 -2 -1 0 1 2 30.0

0.02

0.04

0.06

0.08

0.10

-3 -2 -1 0 1 2 30.0

0.02

0.04

0.06

0.08

( )

500 11 4 5

n.

n .ππ π

==

− =

( )

500 51 12 5

n.

n .ππ π

==

− =

( )

500 31 10 5

n.

n .ππ π

==

− =

( )

1000 31 21

n.

nππ π

==

− =

Page 250: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 236

Esempio 11.1. Un produttore di sementi assicura che l’80% dei semi germoglia. I semi sono venduti in confezioni da 200. Si vuole calcolare la probabilità che in una confezione germoglino al massimo 170 semi.

Sia X la variabile casuale che descrive il numero di semi che germogliano, (200,0.8)X B∼ . La probabilità dell’evento 170X ≤ è data da

( )170 200 0.8( 170) 1.77 0.9616200 0.8 (1 0.8)

P X P Z P Z⎛ ⎞− ×

≤ ≤ = ≤ =⎜ ⎟⎜ ⎟× × −⎝ ⎠.

Questo risultato fornisce un’approssimazione della probabilità esatta che risulta pari a 0.9717.

11.4 Esercizi

Esercizio 11.1. Una compagnia di assicurazione ha stipulato 100

polizze contro il furto. La probabilità che un assicurato debba essere risarcito entro un anno è 0.08. Determinare la probabilità che i) al massimo cinque assicurati debbano essere risarciti; ii) al massimo dieci assicurati debbano essere risarciti; iii) il numero di assicurati da risarcire sia compreso fra cinque e

dieci.

Esercizio 11.2. La probabilità che in una pagina di un libro vi sia un errore di stampa è 0.05. Determinare la probabilità che in un libro di 360 pagine i) vi siano al massimo 10 errori; ii) vi siano più di 25 errori; iii) vi sia un numero di errori compresi fra 10 e 25.

Page 251: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Campionamento

12.1 Introduzione all’inferenza

La raccolta delle informazioni statistiche, come accennato nel

secondo capitolo, può avvenire secondo due modalità: il censimento e il campionamento. Nel primo caso la rilevazione è esaustiva e le informazioni raccolte possono essere elaborate giungendo a una conoscenza esatta della popolazione. Quando invece si procede mediante campionamento si raccoglie soltanto un sottoinsieme dei dati riguardanti la popolazione. Si pone quindi il problema di individuare i metodi più opportuni per ottenere informazioni sull’intera popolazione avendo a disposizione soltanto i risultati di una rilevazione parziale.

L’inferenza consiste appunto in un insieme di metodi finalizzati a ottenere la migliore conoscenza possibile della popolazione sulla base delle informazioni campionarie.

Esiste una differenza fondamentale fra il calcolo delle probabilità e l’inferenza. Nel calcolo delle probabilità la struttura dell’esperimento è nota ma non sono noti i risultati. L’obiettivo è quindi quello di “predire” il risultato nel senso che a ciascun evento è attribuita una probabilità. Se le modalità della prova sono note, la probabilità di ciascun evento è determinata con esattezza.

Nell’ambito dell’inferenza invece vi è una popolazione, costituita dall’insieme delle informazioni riguardanti un fenomeno di interesse, che non è nota. Il campionamento è un esperimento consistente nell’estrarre alcuni dati dalla popolazione. Poiché non si conosce

Page 252: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 238

l’insieme dal quale avviene l’estrazione l’esperimento non è interamente noto. Tuttavia, dopo aver estratto il campione, è noto il risultato dell’esperimento, costituito dalle informazioni campionarie. Sulla base di queste ultime si vuole ottenere una conoscenza della popolazione (e quindi dell’esperimento) che le ha generate. Il procedimento è inverso rispetto a quello del calcolo delle probabilità.

I metodi utilizzati nell’inferenza sono induttivi poiché, basandosi sull’analisi di un sottoinsieme della popolazione, si persegue l’obiettivo di ottenere informazioni sull’intera popolazione. Nel procedimento induttivo vi è possibilità di errore.

Quando si utilizza un procedimento deduttivo si passa da affermazioni di carattere generale ad affermazioni di carattere particolare e le conclusioni cui si perviene sono esatte. Se si individua un insieme A, tale che tutti gli elementi appartenenti a esso godono di una proprietà, una volta che un elemento è identificato come appartenente ad A sicuramente esso gode della stessa proprietà. Si consideri l’insieme A costituito da tutti gli studenti iscritti all’università per i quali vale la proprietà che “studiano”. Se Antonio è iscritto all’università, e quindi appartiene ad A, è possibile affermare con certezza che Antonio “studia”; per Antonio vale la proprietà posseduta da tutti gli elementi di A.

Nel procedimento induttivo si segue il passaggio inverso dal particolare al generale: si effettua un esperimento su alcuni elementi appartenenti a un insieme e successivamente si generalizzano i risultati a tutti gli elementi appartenenti all’insieme. Un esempio di procedimento induttivo è costituito dall’esame universitario. Tipicamente il colloquio finalizzato ad accertare la preparazione di uno studente si risolve in alcune domande; l’interrogazione non riguarda tutto il programma. Il docente quindi sperimenta la preparazione soltanto su alcuni argomenti e, con un procedimento induttivo, esprime una valutazione che dovrebbe rappresentare la conoscenza complessiva che lo studente ha della materia.

Page 253: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Campionamento 239

Se la rilevazione è parziale e riguarda soltanto alcuni dei dati che costituiscono la popolazione, la generalizzazione dei risultati può comportare degli errori. I metodi inferenziali hanno l’obiettivo di ridurre il più possibile l’ordine di grandezza dell’errore oppure di tenere sotto controllo la probabilità di commettere errori.

12.2 Motivi del campionamento

E’ naturale chiedersi perché si eseguano indagini campionarie se vi è la possibilità di commettere errori. I motivi per i quali si effettua un campionamento sono diversi. Vi possono essere motivi economici, in quanto ogni rilevazione comporta un costo e un censimento può risultare proibitivo in termini di spesa. Si supponga di voler svolgere un’indagine su aziende dislocate su tutto il territorio nazionale. Se per rilevare le informazioni relative a ciascuna azienda l’intervistatore deve recarsi sul posto, i costi di trasporto necessari per un censimento possono risultare incompatibili con la somma disponibile per eseguire l’indagine.

Vi è poi l’esigenza di disporre dei risultati dell’indagine in tempi brevi. Quando la popolazione è particolarmente numerosa, i tempi di raccolta ed elaborazione delle informazioni di un censimento possono risultare eccessivamente lunghi. I risultati di indagini sul tasso di disoccupazione o sul livello di inflazione devono essere rapidamente disponibili per poter intervenire tempestivamente con strumenti di politica economica.

In alcune situazioni la rilevazione è distruttiva e ciò impedisce di effettuare un censimento. Nell’ambito del controllo di qualità, la verifica della durata di una batteria, della resistenza di un cavo o delle caratteristiche di un prodotto alimentare comporta la distruzione del prodotto.

Talvolta può non esistere un elenco delle unità statistiche interessate dal fenomeno oggetto di studio, come nel caso dei

Page 254: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 240

consumatori di alcolici, degli spettatori abituali di un programma televisivo o degli stranieri entrati clandestinamente in Italia.

Vi sono circostanze infine nelle quali è possibile mediante campionamento ottenere informazioni sufficientemente precise per gli scopi dell’indagine. Ad esempio nella previsione dell’esito di un ballottaggio elettorale è sufficiente sapere se la proporzione di elettori a favore di un candidato supera il 50%, ma non interessa sapere se questa proporzione è esattamente del 60% o differisce per alcune cifre decimali.

12.3 La popolazione L’oggetto dell’inferenza è la distribuzione dell’insieme di tutti i

valori che costituiscono la popolazione o alcune sue caratteristiche. Questa distribuzione è rappresentata da un modello di variabile casuale. Sebbene esistano procedure inferenziali finalizzate a verificare quale sia il modello più idoneo a rappresentare un certo fenomeno, nel testo l’attenzione è limitata al caso in cui vi è un’ipotesi precisa sulla variabile casuale più adatta a descrivere la popolazione in esame. Se la popolazione è costituita dai pesi dei pacchi di biscotti prodotti da un’azienda alimentare, si può assumere come modello quello della variabile casuale normale. Quando l’interesse riguarda la percentuale di consumatori che acquistano un prodotto di una particolare marca, il modello che descrive la popolazione è quello della variabile casuale di Bernoulli. Se invece oggetto di studio è il numero di utenti che richiedono un servizio in un dato intervallo di tempo, la popolazione può essere rappresentata da una variabile casuale di Poisson. Se infine si studia la distribuzione del tempo che intercorre fra due riparazioni successive di un impianto, la popolazione può essere descritta da una variabile casuale esponenziale negativa.

I parametri che caratterizzano la distribuzione della variabile casuale, che descrive la popolazione, sono delle costanti non note.

Page 255: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Campionamento 241

Finalità dell’inferenza è ottenere informazioni sul valore di questi parametri. Così nel caso di una popolazione descritta da una variabile casuale normale l’inferenza riguarda la media e la varianza, mentre nel caso di una variabile casuale di Bernoulli l’inferenza riguarda la probabilità di successo, infine nel caso di una variabile casuale di Poisson l’inferenza riguarda la media.

In sintesi la popolazione è descritta da una variabile casuale X con una distribuzione che dipende da un parametro incognito ϑ . Nel seguito si utilizzerà la notazione

( , )X f x ϑ∼

dove, a seconda dei casi, ( , )f x ϑ indica la funzione di probabilità o la funzione di densità di un modello noto.

Nell’ambito della teoria della stima l’obiettivo è individuare un’approssimazione per ϑ − ossia stimare ϑ − mentre la finalità del test delle ipotesi è verificare se le informazioni campionarie contengono evidenza sufficiente per sostenere un’ipotesi formulata su alcune caratteristiche della popolazione. 12.4 Il campione

Data una popolazione ( , )X f x ϑ∼ , l’inferenza su ϑ è svolta mediante l’estrazione di un campione, ossia di un sottoinsieme di n valori dalla popolazione.

Affinché si possano ottenere informazioni sulla popolazione il campione deve essere rappresentativo. Si consideri un sociologo che voglia svolgere un’indagine sulle modalità di impiego del tempo libero fra gli adulti di una data città. Se si limita a intervistare una cerchia di amici, includerà nel campione informazioni relative a un gruppo di persone che hanno delle affinità e condividono parte del tempo libero con il rischio che i risultati dell’indagine non rappresentino le caratteristiche dell’intera popolazione. Affinché il campione sia

Page 256: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 242

rappresentativo la scelta delle unità sulle quali effettuare la rilevazione deve essere casuale.

Tralasciando forme di campionamento più complesse, qui si assume che il campione è casuale se tutte le unità interessate dal fenomeno oggetto di studio hanno uguale probabilità di essere estratte. Di conseguenza, se nella popolazione vi sono N unità, ciascuna deve avere probabilità 1/N di essere estratta.

Il campione è costituito da una n-pla di variabili casuali: prima che la rilevazione sia effettuata non è possibile dire quali valori effettivamente risulteranno, sicché il risultato di ciascuna estrazione può essere rappresentato da una variabile casuale. Sia 1X la variabile casuale associata alla prima estrazione, 2X la variabile casuale associata alla seconda estrazione, … e nX quella associata alla n-esima estrazione; il campione è dato da

( )1 2, ,..., nX X X .

Dopo l’estrazione è possibile osservare i valori assunti dalle variabili campionarie; l’insieme di questi valori, indicato con

( )1 2, ,..., nx x x ,

costituisce il campione osservato. Invece l’insieme di tutte le n-ple di valori che può assumere il campione costituisce lo spazio campionario.

Si osservi che ciascuna delle variabili 1 2, ,..., nX X X , appartenenti al campione, ha la stessa distribuzione della variabile casuale X che descrive la popolazione. Infatti, prima dell’estrazione, la probabilità che

1X assuma valori in un intervallo ( ),a b è la stessa probabilità con la quale si verificano valori compresi in ( ),a b nella popolazione. Analogamente la probabilità che 2X assuma valori nell’intervallo ( ),a b coincide con ( )P a X b≤ ≤ e così via. Le variabili campionarie sono quindi identicamente distribuite alla variabile casuale che descrive la popolazione

( , )iX f x ϑ∼ per 1 2i , , ,n= … .

Page 257: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Campionamento 243

Esempio 12.1. La tabella 12.1 riporta la popolazione dei voti conseguiti dai 290 studenti che hanno superato l’esame relativo a un insegnamento di statistica presso la Facoltà di Economia dell’Università degli Studi del Sannio nell’anno accademico 1999-2000.

In questa popolazione 23 studenti hanno conseguito il voto 18 sicché la probabilità che la variabile casuale X (che descrive la popolazione) assuma valore 18 − costituita dalla probabilità che scegliendo a caso uno studente egli abbia avuto 18 − è ( )18 23/ 290P X = = . Analogamente 6 studenti hanno conseguito il

voto 19 e pertanto ( )19 6 / 290P X = = e così via fino all’ultimo voto per il quale si ha ( )30 42 / 290P X = = .

Tabella 12.1 − Voti conseguiti all’esame di statistica da 290 studenti.

18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 19 19 19 19 19 19 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 21 21 21 21 21 21 21 21 21 22 22 22 22 22 22 22 22 22 22 22 22 23 23 23 23 23 23 23 23 23 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 24 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 25 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 26 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 27 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 28 29 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30

Si supponga di estrarre un campione casuale di 10 unità da questa

popolazione, esso è costituito da dieci variabili casuali 1 2 10, , ,X X X… .

Page 258: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 244

La probabilità che la generica variabile campionaria iX assuma un qualsiasi valore − fra il 18 e il 30 − è la probabilità che scegliendo a caso uno studente, fra i 290 studenti che hanno conseguito l’esame di statistica, egli abbia ottenuto quel particolare voto. Questa è la stessa probabilità con la quale la variabile casuale X che descrive la popolazione assume quel valore. Di conseguenza si ha

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

1 1 1

2 2 2

10 10 10

23 6 4218 , 19 , , 30 ;290 290 29023 6 4218 , 19 , , 30 ;

290 290 290

23 6 4218 , 19 , , 30 .290 290 290

P X P X P X

P X P X P X

P X P X P X

= = = = = =

= = = = = =

= = = = = =

Le variabili casuali campionarie 1 2 10, , ,X X X… sono identicamente distribuite rispetto a X.

L’estrazione del campione può avvenire con rimessa o in blocco.

Se il campionamento avviene con rimessa, dopo aver estratto un’unità e aver eseguito la rilevazione, l’unità è rimessa nell’insieme di partenza prima di procedere all’estrazione successiva. In questo caso l’estrazione del campione avviene mediante n prove indipendenti e le variabili campionarie 1 2, ,..., nX X X sono indipendenti.

Se invece l’estrazione avviene in blocco le variabili campionarie sono dipendenti. Questa forma di campionamento è più efficiente perché evita che la stessa unità possa essere estratta più volte. D’altra parte il trattamento analitico delle informazioni ottenute da n variabili casuali dipendenti è molto più complesso di quello relativo a n variabili indipendenti, sicché gran parte della teoria dell’inferenza è stata sviluppata per il campionamento con rimessa.

Page 259: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Campionamento 245

12.5 Le statistiche campionarie Per fare inferenza su un parametro ϑ di una popolazione ( , )X f x ϑ∼ è necessario definire un modo per sintetizzare le

informazioni campionarie affinché, dopo aver osservato il campione, gli n valori 1 2, ,..., nx x x possano essere riassunti in un unico valore utile per l’inferenza su ϑ .

L’operazione di sintesi è realizzata mediante una funzione del campione chiamata statistica campionaria

( )1 2, ,...,n nS S X X X= .

Le statistiche campionarie sono funzioni delle variabili casuali 1 2, ,..., nX X X e pertanto sono anch’esse variabili casuali con una

propria funzione di probabilità o di densità. Esse hanno la proprietà che il loro valore

( )1 2, ,...,n ns S x x x=

è noto dopo l’estrazione del campione.

Ad esempio, se l’obiettivo è stimare la media della popolazione µ , si può utilizzare la media del campione al fine di ottenere un’approssimazione per µ . Questa statistica è chiamata media campionaria ed è data da

1

1 n

ii

X Xn =

= ∑ .

Dopo aver estratto il campione X assume valore

1

1 n

ii

x xn =

= ∑ .

Esempio 12.1 (continuazione). La media della popolazione dei voti riportati nella tabella 12.1 è 25.238µ = . Si supponga di estrarre un

Page 260: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 246

campione di numerosità 10n = , costituito da ( )1 2 10, , ,X X X… , e si consideri la statistica

1 2 10

10X X XX + + +

= .

Se il campione osservato è (26, 27, 24, 18, 30, 22, 27, 22, 18, 27) la statistica X assume valore 24.1, se invece il risultato dell’estrazione è (26, 28, 24, 30, 24, 27, 25, 18, 28, 30) X assume valore 26.0. A ogni possibile campione osservato corrisponde un valore di X . La tabella 12.2 riporta alcuni campioni estratti dalla popolazione della tabella 12.1 con i corrispondenti valori della statistica X .

Tabella 12.2 − Alcuni campioni di 10 osservazioni estratti dalla popolazione

della tabella 12.1 e i corrispondenti valori della statistica X . Campione 1x 2x 3x 4x 5x 6x 7x 8x 9x 10x x

1 26 27 24 18 30 22 27 22 18 27 24.1 2 26 28 24 30 24 27 25 18 28 30 26.0 3 30 27 28 20 28 30 18 29 27 21 25.8 4 30 28 28 24 30 28 30 24 28 22 27.2 5 25 28 28 25 18 27 27 26 26 27 25.7 6 20 24 28 27 30 20 30 28 18 25 25.0 7 28 30 21 28 26 25 26 27 22 20 25.3 8 19 24 28 24 28 22 28 24 27 30 25.4 9 30 27 25 30 25 26 26 25 27 28 26.9 10 28 28 28 24 25 24 28 30 26 26 26.7 11 23 30 26 26 28 30 18 25 24 26 25.6 12 26 26 18 28 19 18 24 22 30 28 23.9 13 22 28 27 28 20 30 28 18 28 25 25.4 14 18 28 30 30 28 18 28 26 26 18 25.0 15 20 24 22 24 22 30 27 30 30 25 25.4

La figura 12.1 illustra l’istogramma dei valori assunti da X in

100·000 campioni di numerosità 10 estratti dalla stessa popolazione.

Page 261: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Campionamento 247

18 20 22 24 26 28 300.0

0.1

0.2

0.3

µ

Figura 12.1 Istogramma dei valori assunti dalla statistica X in 100 000 campioni, con

10n = , estratti dalla popolazione della tabella 12.1

Page 262: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 263: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 13.1 Introduzione

Obiettivo della stima è ottenere informazioni sul valore dei parametri incogniti, che caratterizzano la distribuzione di una popolazione, sulla base delle osservazioni campionarie. Quando si stima un parametro le informazioni contenute nel campione sono elaborate al fine di ottenere un’approssimazione del suo valore. In particolare la stima puntuale fornisce un singolo valore per ciascun parametro.

Per sintetizzare le informazioni campionarie si utilizza uno stimatore, ossia una statistica campionaria la cui funzione è fornire un’approssimazione del valore del parametro. L’affidabilità del risultato dipende quindi dalle caratteristiche dello stimatore.

Poiché un’indagine campionaria comporta dei costi è auspicabile che il risultato sia il più accurato possibile. Pertanto s’introducono alcune importanti proprietà che consentono di valutare gli stimatori e si accenna brevemente ai metodi di costruzione degli stimatori. Particolare attenzione è data ad alcuni stimatori frequentemente utilizzati nelle applicazioni statistiche: la media campionaria, la varianza campionaria e la proporzione campionaria, che stimano rispettivamente la media e la varianza di una popolazione e la probabilità di successo di una variabile casuale di Bernoulli. Per tali stimatori si affronta anche il problema della scelta della numerosità

Page 264: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 250

campionaria necessaria per raggiungere prefissati obiettivi di precisione. 13.2 Proprietà degli stimatori

Sia ( , )X f x ϑ∼ la variabile casuale che descrive la popolazione e ϑ il parametro oggetto dell’inferenza. Dato un campione di dimensione n, 1 2( , ,..., )nX X X , uno stimatore è dato da

1 2( , ,..., )n nT T X X X=

e ha la funzione di sintetizzare le informazioni campionarie al fine di fornire un’approssimazione per ϑ . Essendo una statistica campionaria, lo stimatore è una variabile casuale. Il valore che esso assume, in corrispondenza del campione osservato, è la stima

1 2( , ,..., )n nt T x x x= .

Essa fornisce un’approssimazione del valore del parametro ottenuta sulla base di un particolare campione osservato. La stima costituisce soltanto uno dei possibili valori che può assumere lo stimatore, di conseguenza l’affidabilità del risultato di un procedimento di stima dipende dalla distribuzione dello stimatore. E’ opportuno assicurarsi che i suoi valori costituiscano approssimazioni ragionevolmente accurate del valore di ϑ . In particolare, se lo stimatore è una variabile casuale continua la probabilità che la stima coincida con il parametro è nulla, quasi certamente nt è diverso da ϑ . E’ importante allora assicurarsi che l’errore commesso nella stima non presenti sistematicità e sia piccolo in ordine di grandezza.

Nella stima di un parametro è auspicabile che i valori assunti dallo stimatore non siano né tendenzialmente più piccoli né tendenzialmente più grandi del parametro. La non distorsione è la proprietà della quale godono gli stimatori che non presentano sistematicità nell’errore di stima. Uno stimatore nT è non distorto se il suo valore atteso coincide con il parametro

Page 265: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 251

[ ]nE T ϑ= .

Alcune volte nt potrà risultare maggiore di ϑ , altre minore, ma in media errori positivi e negativi si compensano.

A livello teorico è possibile immaginare di ripetere l’esperimento del campionamento. Se si estraggono diversi campioni, a ciascuno di essi corrisponde una stima. Si può calcolare la media delle stime ottenute in un numero infinitamente grande di campioni. Nel caso di uno stimatore non distorto, questa media coincide con il parametro.

Quando il valore atteso di nT è diverso da ϑ , la distorsione si misura mediante

( ) [ ]n nd T E T ϑ= − .

Per un medesimo parametro vi possono essere più stimatori tali che il loro valore atteso coincida con ϑ , sicché il criterio della non distorsione non sempre consente di effettuare una scelta fra stimatori alternativi. Inoltre vi sono situazioni nelle quali è preferibile uno stimatore distorto piuttosto che uno stimatore non distorto, se il primo assume valori vicini al parametro con maggiore probabilità. La figura 13.1 confronta le funzioni di densità di due stimatori, dei quali 1,nT è non distorto ma presenta maggiore variabilità intorno a ϑ e 2,nT è distorto ma presenta una distribuzione più concentrata intorno a ϑ . Il secondo stimatore è preferibile perché con maggiore probabilità assume valori vicini al parametro.

Figura 13.1 Confronto fra le distribuzioni di due stimatori

( )1, 1nTf t

ϑ

( )2, 2nTf t

Page 266: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 252

L’efficienza è la proprietà degli stimatori che riguarda la concentrazione della loro distribuzione intorno al parametro. L’efficienza di uno stimatore nT di ϑ è misurata attraverso l’errore quadratico medio

( ) ( )2n nEQM T E T ϑ = − ,

che corrisponde al valore atteso del quadrato dell’errore di stima nT ϑ− . L’errore quadratico medio è un indice della dispersione della

distribuzione dello stimatore intorno al parametro e fornisce indicazioni sull’ordine di grandezza di nT ϑ− .

Esso si scompone nella somma della varianza di nT e della distorsione al quadrato

(13.1) ( ) ( ) ( ){ }2n n nEQM T Var T d T= + .

Per dimostrare la (13.1) si aggiunge e sottrae il valore atteso di nT nell’espressione dell’errore quadratico medio ottenendo

( ) [ ]( ) [ ]( ){ }[ ]( ) ( ){ }[ ]( ) ( ){ } ( ) [ ]( )

2

2

2 22 .

n n n n

n n n

n n n n n n

EQM T E T E T E T

E T E T d T

E T E T d T d T T E T

ϑ = − + − = − + = − + + −

Dato che il valore atteso di una combinazione lineare è uguale alla combinazione lineare dei valori attesi (paragrafo 8.6) e la distorsione è costante, si ottiene

( ) [ ]( ) ( ){ } ( ) [ ]( )( ) ( ){ } ( ) [ ]

2 2

2

2

2 .

n n n n n n n

n n n n n

EQM T E T E T E d T E d T T E T

Var T d T d T E T E T

= − + + −

= + + − L’ultimo termine si annulla perché [ ] [ ] [ ] 0n n n nE T E T E T E T − = − = , sicché la (13.1) è dimostrata.

Page 267: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 253

Se nT è uno stimatore non distorto si ha, ( ) 0nd T = e pertanto l’errore quadratico medio coincide con la varianza

( ) ( )n nEQM T Var T= .

Nel confronto fra due stimatori 1,nT e 2,nT , per il medesimo parametro ϑ , 1,nT è definito più efficiente di 2,nT se ha errore quadratico medio minore, cioè

( ) ( )1, 2,n nEQM T EQM T< .

L’efficienza relativa fra due stimatori 1,nT e 2,nT è misurata dal rapporto di efficienza

( )( )

2,

1,

n

n

EQM Te

EQM T= .

E’ possibile dimostrare che il rapporto di efficienza indica quale è il rapporto fra le numerosità campionarie da utilizzarsi rispettivamente con 1,nT e 2,nT per aver eguale efficienza. Quando 1,nT e 2,nT sono entrambi non distorti il rapporto di efficienza è dato dal rapporto delle varianze

( )( )

2,

1,

n

n

Var Te

Var T= .

Esempio 13.1. Si consideri una popolazione normale, ( )2,X N µ σ∼ , della quale si vuole stimare la media µ sulla base di

un campione 1 2( , ,..., )nX X X di dimensione n. E’ possibile dimostrare che sia la media campionaria X sia la mediana campionaria

1 2( , ,..., )nM mediana X X X= sono stimatori non distorti per µ . La varianza della media campionaria è ( ) 2 /Var X nσ= mentre per la mediana campionaria si ha ( ) 2 /(2 )Var M nπσ , pertanto il rapporto di efficienza è dato da

Page 268: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 254

( )( )

2

2

/(2 ) 1.57/ 2

Var M nenVar X

πσ πσ

= = .

La media campionaria è più efficiente della mediana campionaria: per avere eguale efficienza utilizzando la mediana campionaria è necessario un campione con numerosità del 57% maggiore rispetto a quella necessaria con la media campionaria.

Talvolta può non essere possibile verificare le proprietà degli stimatori in corrispondenza di una numerosità campionaria n finita; può però essere possibile determinare cosa accade quando n diventa infinitamente grande, verificando così il comportamento asintotico dello stimatore.

In tale contesto una proprietà irrinunciabile per uno stimatore è la consistenza in probabilità. Essa implica che all’aumentare di n la distribuzione di nT si concentra sempre di più intorno al parametro. Si considera perciò un intorno di ϑ di semi-ampiezza ε, ( ),ϑ ε ϑ ε− + , dove ε è arbitrariamente piccolo. Se la probabilità che nT assuma valori nell’intervallo ( ),ϑ ε ϑ ε− + tende a 11,

( ) 1nP T ϑ ε− < → ,

quando n diventa infinitamente grande, nT è definito consistente in probabilità per ϑ . Intuitivamente quando n aumenta cresce la quantità di informazioni disponibili e ciò rende lo stimatore via via più preciso, sicché la sua distribuzione si concentra sempre più intorno a ϑ (figura 13.2).

1 Formalmente, nT è consistente in probabilità per ϑ quando

( ) 1nnlim P T ϑ ε→∞

− < =

Page 269: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 255

13.3 La media campionaria Sia X la variabile casuale che descrive la popolazione con valore atteso [ ]E Xµ = e varianza 2 ( )Var Xσ = . Se il parametro da stimare è il valore atteso è naturale utilizzare come stimatore per µ la media campionaria

1

1 n

ii

X Xn =

= ∑ .

Se il campione è estratto con rimessa le variabili 1 2, ,..., nX X X sono indipendenti e identicamente distribuite, con valore atteso [ ]iE X µ= e varianza ( ) 2

iVar X σ= . Di conseguenza per la (8.10) e la (8.11) il valore atteso e la varianza della media campionaria sono dati da

E X µ = , ( )2

Var Xnσ

= .

La media campionaria è uno stimatore non distorto poiché il suo valore atteso coincide con il parametro µ . Pertanto l’errore quadratico medio coincide con la varianza

( ) ( )2

EQM X Var Xnσ

= = .

ϑ ε− ϑ ε+

n=20

n=50

n=100

n=200

ϑ

Figura 13.2 Consistenza in probabilità

Page 270: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 256

Un risultato noto come la legge debole dei grandi numeri dimostra inoltre che la media campionaria è consistente in probabilità per µ .

Il teorema del limite centrale (paragrafo 11.2.1) fornisce ulteriori informazioni sul comportamento asintotico di X . La media campionaria standardizzata ha infatti una distribuzione asintotica normale. Ciò implica che, per n sufficientemente grande, la distribuzione di

/X

σ−

può essere approssimata da quella di una variabile casuale normale standardizzata.

Le proprietà delle quali gode la media campionaria (non distorsione, errore quadratico medio dato da 2 / nσ , consistenza in probabilità e normalità asintotica) non dipendono dalla distribuzione sottostante e sono quindi verificate qualsiasi sia il modello che descrive la popolazione.

Tuttavia, per la rilevanza che ha il modello normale, è opportuno considerare le proprietà della media campionaria quando la popolazione è descritta dalla variabile casuale ( )2,X N µ σ∼ . In questo caso particolare la distribuzione della media campionaria è nota per qualsiasi valore di n. Infatti per la proprietà riproduttiva della variabile casuale normale (paragrafo 10.1.2) anche X ha una distribuzione normale

2

,X Nnσµ

∼ .

13.4 La proporzione campionaria

Quando la popolazione è costituita da unità che possono essere classificate come favorevoli o contrarie, sicché all’estrazione delle prime è associato un “successo” e all’estrazione delle altre è associato

Page 271: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 257

un “insuccesso”, il modello idoneo a rappresentarla è quello di Bernoulli. In questo caso la popolazione è descritta dalla variabile casuale ( )X Ber π∼ e il parametro di interesse è la probabilità di successo π , ossia la proporzione di unità favorevoli nella popolazione.

In realtà π è anche il valore atteso di X, [ ]E Xπ = , di conseguenza la stima della proporzione di unità favorevoli nella popolazione non è altro che un caso particolare di stima della media.

Per stimare π si utilizza la proporzione di successi nel campione. Il campione ( )1 2, ,..., nX X X in questo caso è costituito da n variabili casuali Bernoulliane; ciascuna iX assume valore 1 se nella i-esima estrazione si verifica un successo e zero altrimenti. Di conseguenza la somma 1 2 ... nX X X+ + + esprime il numero di successi nel campione. Lo stimatore di π è la proporzione campionaria

1

1ˆn

ii

p Xn =

= ∑ ,

ossia la frequenza relativa dei successi nel campione.

Lo stimatore p è la media campionaria di una popolazione bernoulliana e gode perciò di tutte le proprietà di X . La proporzione campionaria è infatti uno stimatore non distorto,

[ ]ˆE p π= .

Ricordando che la varianza di una variabile casuale bernoulliana è ( ) ( )1Var X π π= − si ottiene la varianza della proporzione

campionaria

( ) ( ) ( )1ˆ

Var XVar p

n nπ π−

= = .

Inoltre, analogamente a quanto avviene per la media campionaria, anche la proporzione campionaria è consistente in probabilità per π .

Infine per il teorema del limite centrale la proporzione campionaria standardizzata ha una distribuzione asintotica normale. Di conseguenza, per n sufficientemente grande e 0 1a b≤ < ≤ , si ha

Page 272: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 258

( )( ) ( ) ( )

( ) ( )

ˆˆ1 / 1 / 1 /

,1 / 1 /

a p bP a p b Pn n n

a bP Zn n

π π ππ π π π π π

π ππ π π π

− − − ≤ ≤ = ≤ ≤ − − − − − ≤ ≤ − −

dove Z è una variabile casuale normale standardizzata.

Esempio 13.2. Un dirigente dell’Agenzia delle Entrate è interessato a stimare la percentuale di dichiarazioni dei redditi errate. Supponendo che la proporzione effettiva sia 0.05π = , si vuole calcolare la probabilità che, in un campione di 100 dichiarazioni dei redditi, la proporzione di dichiarazioni errate superi il 10%.

Il parametro π è stimato mediante la proporzione campionaria p . Assumendo 0.05π = si ottiene la probabilità

( ) 0.10 0.05ˆ 0.100.05 (1 0.05) /100

( 2.29) 1 (2.29) 1 0.9890 0.0110.

P p P Z

P Z

−> ≥ × −

= ≥ = −Φ = − =

13.5 La varianza campionaria

Sia X la variabile casuale che descrive una popolazione con valore atteso µ e varianza 2σ . Per stimare 2σ , sulla base di un campione ( )1 2, ,..., nX X X , potrebbe risultare naturale utilizzare lo stimatore

( )22 2 2

1 1

1 1n n

i ii i

S X X X Xn n= =

= − = −∑ ∑ ,

tuttavia è facile verificare che 2S è distorto. Il suo valore atteso infatti è dato da

Page 273: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 259

2 2 2 2 2

1 1

1 1n n

i ii i

E S E X X E X E Xn n= =

= − = − ∑ ∑ .

Poiché le variabili campionarie sono identicamente distribuite alla variabile casuale che descrive la popolazione si ha 2 2

iE X E X = , per i=1,2,…,n, e quindi applicando la (8.7) si ottiene

2 2 2 2

1 1

1 1 1n n

i ii i

E X E X nE X E Xn n n= =

= = = ∑ ∑ .

Per calcolare il valore atteso di 2X si ricordi che ( ) ( )22Var X E X E X = − e, poiché X è uno stimatore non

distorto, si ha

( )2

2 2Var X E Xnσµ = − = .

Di conseguenza 2 2 2 /E X nµ σ = + e il valore atteso di 2S risulta 2 2

2 2 2 2 21nE S E Xn n nσ σµ σ σ− = − − = − = .

Lo stimatore 2S è distorto negativamente, cioè sottostima sistematicamente 2σ .

Uno stimatore non distorto per 2σ è dato dalla varianza campionaria

( )22

1

1ˆ1

n

ii

X Xn

σ=

= −− ∑ .

Il valore atteso di 2σ è infatti dato da

2 2 2 21ˆ1 1

n n nE E Sn n n

σ σ σ− = = = − − .

Una spiegazione intuitiva della non distorsione di 2σ è la seguente. Fra gli n scarti iX X− soltanto 1n − sono linearmente indipendenti. Infatti per la terza proprietà della media (paragrafo 3.2.2) la somma degli scarti è nulla,

Page 274: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 260

( )1

0n

ii

X X=

− =∑ .

Di conseguenza, determinati i primi 1n − scarti iX X− per 1,2, , 1i n= −… , l’ultimo scarto nX X− dovrà essere tale che la somma

sia uguale a zero, ossia

( )1

1

n

n ii

X X X X−

=

− = − −∑ .

Nella stima della varianza si divide la somma degli scarti per 1n − , anziché per n , perché si fa riferimento al numero di scarti iX X− linearmente indipendenti.

Si dimostra inoltre che la varianza campionaria è consistente in probabilità per 2σ .

Nel seguito, se non è altrimenti specificato, per stimatore della varianza si intende 2σ e per scarto quadratico medio campionario la sua radice presa con segno positivo.

Altre proprietà della varianza campionaria sono note quando la popolazione è normale. Se ( )2,X N µ σ∼ la varianza di 2σ è data da

( )4

2 2ˆ1

Varnσσ =−

.

Inoltre la variabile casuale

( )222

12 2

1

ˆ( 1)

n

i ni i

i

X XX Xn σ

σ σ σ=

=

− −−

= =

∑∑ ,

si distribuisce come una variabile casuale 2χ con 1n − gradi di libertà (paragrafo 10.4). Se la media fosse nota la variabile

2

1

ni

i

X µσ=

Page 275: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 261

avrebbe una distribuzione 2χ con n gradi di libertà, poiché è la somma di n variabili casuali normali standardizzate e indipendenti al quadrato. La circostanza che il parametro µ non sia noto rende necessario sostituire µ , nella formula della varianza campionaria, con il suo stimatore X . Ciò comporta la perdita di un grado di libertà a causa del vincolo sulla somma degli scarti. E’ infine possibile dimostrare che, se ( )2,X N µ σ∼ , gli stimatori X e 2σ sono variabili casuali indipendenti. 13.6 Metodi di costruzione degli stimatori La media campionaria, la varianza campionaria e la proporzione campionaria sono stati proposti come ovvi stimatori della media e della varianza di una popolazione e della probabilità di successo di una variabile casuale bernoulliana. In situazioni più complesse la scelta dello stimatore, più opportuno per un parametro, può risultare meno intuitiva. In tali circostanze si utilizzano dei metodi di costruzione degli stimatori. Fra questi particolarmente importante è il metodo della massima verosimiglianza. Sia ( );X f x ϑ∼ la variabile casuale che descrive la popolazione. Il metodo della massima verosimiglianza considera come stima di ϑ quel valore tn per il quale è massima la probabilità del campione osservato.

Le variabili campionarie 1 2, , , nX X X… sono indipendenti e identicamente distribuite con la stessa funzione di densità ( );f x ϑ della variabile casuale X che descrive la popolazione. Di conseguenza la funzione di densità del campione, in corrispondenza della n-pla di valori 1 2, , , nx x x… , è data dal prodotto delle funzioni di densità delle

iX (paragrafo 8.4), per 1,2, ,i n= … ,

(13.2) ( ) ( ) ( )1 2; ; ;nf x f x f xϑ ϑ ϑ .

Page 276: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 262

Dopo che il campione è stato osservato, i valori 1 2, , , nx x x… sono noti e possono essere considerati come costanti, mentre non è noto il parametro ϑ . Per indicare che l’argomento della (13.2) è costituito da ϑ si utilizza la notazione

( ) ( ) ( ) ( )1 2; ; ;nL f x f x f xϑ ϑ ϑ ϑ= .

La funzione ( )L ϑ è definita funzione di verosimiglianza perché esprime quanto è verosimile che il valore del parametro sia ϑ dato che è stato osservato il campione 1 2, , , nx x x… . La stima di massima verosimiglianza è quel valore del parametro per il quale ( )L ϑ è massima.

Sebbene in pratica il campionamento sia effettuato una sola volta, a livello teorico è possibile immaginare di ripetere infinite volte questa operazione. Ripetendo infinite volte il campionamento si avrebbero altrettante stime di massima verosimiglianza; esse costituiscono i valori assunti dallo stimatore di massima verosimiglianza. Tale stimatore ha ottime proprietà sia per n finito che asintotiche.

Il livello del testo non consente una trattazione approfondita dei metodi di costruzione degli stimatori. Tuttavia è opportuno osservare che la media campionaria è lo stimatore di massima verosimiglianza per la media di variabili casuali normali o variabili casuali di Poisson, mentre la proporzione campionaria è lo stimatore di massima verosimiglianza della probabilità di successo di una variabile casuale di Bernoulli. Infine lo stimatore di massima verosimiglianza del parametro λ di una variabile casuale esponenziale negativa è dato da 1/ X . La tabella 13.1 riporta gli stimatori di massima verosimiglianza per i parametri che caratterizzano la distribuzione di alcune variabili casuali.

Esempio 13.3. Si consideri un’urna contenente dieci palline di colore rosso e blu, della quale non si conosce la proporzione di palline rosse. La variabile casuale che descrive la popolazione è una

Page 277: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 263

Tabella 13.1 – Stimatori di massima verosimiglianza per alcuni modelli di variabili casuali ottenuti da un campione casuale 1 2, , , nX X X… (gli stimatori sono indicati con lo stesso simbolo dei parametri soprassegnato da “^”).

Modello Stimatori

( )X Ber π∼ 1

1ˆn

ii

Xn

π=

= ∑

( )X P λ∼ 1

1ˆn

ii

Xn

λ=

= ∑

( )X G π∼ 1

ˆn

ii

n

=

=

( )2,X N µ σ∼ 1

1ˆn

ii

Xn

µ=

= ∑ ( )22

1

1ˆn

ii

X Xn

σ=

= −∑

( )X Exp λ∼ 1

ˆn

ii

n

=

=

bernoulliana: ( )X Ber π∼ ; si verifica un successo se si estrae una pallina rossa. Poiché nell’urna vi sono dieci palline, la proporzione di palline rosse π può assumere valori nell’insieme ( )0,1/10,2 /10, ,10 /10… .

Si supponga di aver estratto tre palline con rimessa e aver ottenuto una pallina rossa e due blu, sicché nel campione osservato ( )1 2 3, ,x x x una variabile ha assunto valore 1 e le altre hanno assunto il valore zero. La funzione di verosimiglianza per π è illustrata nella figura 13.3. Essa è massima in corrispondenza del valore 0.3, che risulta la stima di massima verosimiglianza2. Il campione osservato ha massima probabilità di verificarsi se nell’urna vi sono tre palline rosse su dieci, sicché 0.3 risulta il valore più verosimile per il parametro π .

2 Il valore 0.3 è il valore osservato della proporzione campionaria, che è lo stimatore di massima verosimiglianza per la probabilità di successo di una variabile casuale di Bernoulli.

Page 278: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 264

0.0 0.2 0.4 0.6 0.8 1.00.00

0.05

0.10

0.15

13.7 Determinazione della numerosità campionaria per la media

Sin qui la numerosità campionaria è stata assunta come data; tuttavia, nelle applicazioni pratiche, occorre determinare n.

Talvolta n è determinato da vincoli di bilancio. Se per un’indagine è stata prevista una spesa S, ciò impone un limite massimo al numero di osservazioni possibili. Nell’ambito di un’indagine statistica vi sono due tipi di costi: fissi e variabili. I costi fissi sono quelli connessi alla progettazione dell’indagine, alla preparazione del questionario, all’elaborazione dei dati e così via. Quelli variabili riguardano la raccolta dei dati e, in particolare, il compenso per l’intervistatore, i costi di spedizione (se la rilevazione avviene per posta), del telefono (se l’intervista è realizzata telefonicamente), di trasporto (se l’intervistatore deve recarsi sul posto per svolgere l’intervista), di immissione dei dati nel computer e così via. Se CF è l’ammontare dei costi fissi e CI è il costo di ciascuna intervista, evidentemente dovrà essere soddisfatto il vincolo

F IS C nC= +

e quindi la numerosità campionaria risulta

Figura 13.3 Funzione di verosimiglianza nell’esempio 13.3

( )L π

π

Page 279: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 265

F

I

S CnC−

= .

In circostanze più fortunate la numerosità può essere determinata in modo tale da ottenere un livello di precisione desiderato nella stima. Sia X la variabile casuale che descrive la popolazione della quale si vuole stimare la media µ mediante la media campionaria X . Si può richiedere che lo stimatore X non disti dal parametro µ di un ammontare superiore a 0ε > . La quantità ε è un errore ritenuto tollerabile per gli scopi dell’indagine e varia in funzione del contesto applicativo. Ad esempio in un’indagine sul reddito mensile individuale uno scarto di 50 euro fra X e µ può essere ritenuto tollerabile, mentre nella stima del numero medio di chilometri percorsi da un’automobile con un litro di benzina si può fissare 0.2ε = . Scelto il valore di ε, l’obiettivo che si vuole raggiungere è

X µ ε− < .

Poiché la media campionaria è consistente in probabilità, la certezza che X µ− sia minore di ε , per qualsiasi 0ε > , si ha per un valore di n infinitamente grande. Per ottenere un valore di n finito si fissa una probabilità 1 α− , ritenuta sufficientemente elevata per il contesto specifico, con la quale si vuole che X si trovi nell’intorno di µ di semi-ampiezza ε. Di conseguenza α è la probabilità di commettere un errore di stima maggiore di ε. L’obiettivo, compiutamente definito, consiste nel determinare n tale che

( ) 1P X µ ε α− < = − .

Dividendo entrambi i membri per lo scarto quadratico medio di X si ha

( )( ) ( )

XP X P

Var X Var X

µ εµ ε − − < = <

Page 280: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 266

( ) ( ) ( )1 .XP

Var X Var X Var X

ε µ ε α − = − < < = −

Assumendo che n sia sufficientemente grande, per il teorema del limite centrale è possibile approssimare la distribuzione della media campionaria standardizzata con quella di una variabile casuale normale standardizzata Z ottenendo

( )( ) ( )

1P X P ZVar X Var X

ε εµ ε α − < − < < = −

.

Ciò implica che la quantità ( )Var Xε dovrà essere uguale a quel valore / 2zα tale che una variabile casuale normale standardizzata sia compresa nell’intervallo ( )/ 2 / 2,z zα α− con probabilità 1 α− ,

( )/ 2 / 2 1P z Z zα α α− ≤ ≤ = − .

Si utilizza la notazione / 2zα perché la probabilità che Z assuma valore in ognuna delle due code, a destra e a sinistra dell’intervallo, è / 2α

( ) ( )/ 2 / 2 / 2P Z z P Z zα α α≤ − = ≥ = .

Sommando la probabilità / 2α che Z assuma valori a sinistra di / 2zα− con la probabilità 1 α− che Z assuma valori nell’intervallo ( )/ 2 / 2,z zα α− , si ottiene la funzione di ripartizione in / 2zα che vale 1 / 2α− , ossia ( )/ 2 1 / 2zα αΦ = − .

Il valore di n è quindi tale che

(13.3) ( ) / 2z

Var Xα

ε= .

Poiché ( ) 2Var X nσ= la (13.3) diventa

/ 2zn α

εσ

=

Page 281: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 267

e risolvendo rispetto a n si ottiene

(13.4) 2 2

/ 22

zn α σε

= .

Si osservi che la (13.3) impone un vincolo sulla varianza della media campionaria del tipo

( )2

2/ 2

Var Xzα

ε= .

Poiché X è uno stimatore non distorto l’efficienza è misurata dalla sua varianza; pertanto l’obiettivo di precisione, individuato per la determinazione di n , si traduce in un vincolo sull’efficienza della media campionaria.

Per determinare n mediante la (13.4) è necessario conoscere la varianza della popolazione, che costituisce un’informazione tipicamente non disponibile. Tuttavia, nel caso di indagini condotte periodicamente, 2σ può essere sostituito da una stima ottenuta in precedenza, altrimenti occorre eseguire un campionamento pilota. Inizialmente si estrae un piccolo campione al fine di ottenere una stima della varianza, che successivamente si sostituisce a 2σ nella (13.4) per determinare la numerosità campionaria definitiva.

Figura 13.4 zα/2 è tale che ( )/ 2 / 2

1P z Z zα α

α− ≤ ≤

= −

zα/2 -zα/2 0

( )zϕ

1−α α/2 α/2

Page 282: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 268

Esempio 13.4. In una città sono svolte periodicamente indagini per verificare qual è la spesa media mensile delle famiglie in generi alimentari. In un’indagine svolta alcuni anni fa, lo scarto quadratico medio della spesa alimentare mensile delle famiglie è risultato pari a 120 euro. Si intende ora ripetere l’indagine e si vuole determinare n affinché la media campionaria non disti dalla media effettiva di oltre 20 euro con probabilità 0.95.

La probabilità con la quale si vuole raggiungere l’obiettivo di precisione desiderato è 1 0.95α− = , sicché / 2 0.025α = . Per determinare n occorre individuare il valore 0.025z tale che la funzione di ripartizione di una variabile casuale normale standardizzata in 0.025z sia uguale a 1 0.025 0.975− = . Dalle tavole della normale risulta

0.025 1.96z = .

Applicando la (13.4) con 20ε = e utilizzando 1202 come

approssimazione di 2σ si ottiene la numerosità campionaria necessaria per effettuare l’indagine secondo i vincoli previsti

2 2

2

1.96 120 138.3 13820

n ×= = .

Per ogni numerosità campionaria non inferiore a 138, la probabilità che la media campionaria non disti dalla media effettiva di oltre 20 euro è almeno 0.95.

1.96 -1.96 0

( )zϕ

0.95 0.025 0.025

Figura 13.5 Determinazione di zα/2 nell’esempio 13.4

Page 283: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 269

13.8 Determinazione della numerosità campionaria per la proporzione

Si supponga che la popolazione sia descritta da una variabile casuale di Bernoulli, ( )X Ber π∼ , e di voler determinare la numerosità campionaria n affinché la proporzione campionaria p non disti da π di un ammontare superiore a ε con una probabilità 1 α− . Si pone quindi l’obiettivo

( )ˆ 1P p π ε α− < = − .

Poiché π è la media di una popolazione bernoulliana, si può procedere in modo analogo al caso della stima di µ . Dividendo entrambi i membri della disuguaglianza per lo scarto quadratico medio di p si ha

( )( ) ( )

( ) ( ) ( )

ˆˆ

ˆ ˆ

ˆˆ ˆ ˆ

1 .

pP p P

Var p Var p

pPVar p Var p Var p

π επ ε

ε π ε

α

− − < = < − = − < <

= −

Assumendo che n sia sufficientemente grande, per il teorema del limite centrale è possibile approssimare la distribuzione della proporzione campionaria standardizzata mediante quella della variabile casuale normale standardizzata Z. In tal modo si ottiene

( )( ) ( )

ˆ 1 .ˆ ˆ

P p P ZVar p Var pε επ ε α

− < − < < = −

Di conseguenza la quantità ( )ˆVar pε deve essere uguale al valore / 2zα tale che ( )/ 2 / 2 1P z Z zα α α− < < = − . La numerosità campionaria n

è determinata sulla base della relazione

Page 284: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 270

( ) / 2ˆz

Var pα

ε= .

Ricordando che ( ) ( )ˆ 1Var p nπ π= − e risolvendo l’equazione rispetto a n si ha

(13.5) ( ) 2/ 2

2

1 zn απ π

ε−

= .

Come nel caso della media, la (13.5) impone un vincolo sulla varianza dello stimatore

( )2

2/ 2

ˆVar pzα

ε= ,

sicché l’obiettivo di precisione si traduce in un vincolo sull’efficienza della proporzione campionaria.

La numerosità campionaria nella (13.5) dipende da π . Per risolvere il problema si possono adottare due soluzioni alternative. La prima consiste nel procedere con un campionamento pilota in modo da ottenere una stima preliminare di π da inserire nella (13.5). La seconda soluzione consiste nel sostituire a ( )1π π− il suo massimo valore. E’ possibile dimostrare che ( )1π π− al massimo assume valore 0.25 quando 0.5π = . Ci si tutela così rispetto al caso peggiore di massima variabilità e la numerosità campionaria risulta

(13.6) 2

/ 224

zn α

ε= .

Questa soluzione evita di dover ricorrere al campionamento pilota, ma presenta l’inconveniente di utilizzare una numerosità campionaria molto maggiore di quella necessaria per raggiungere l’obiettivo di precisione prefissato quando π è prossimo a zero oppure a 1.

La tabella 13.2 riporta i valori di n ottenuti mediante la (13.5) per 0.01ε = e 0.02ε = e diversi valori di π . Se si usa la (13.6) la

numerosità campionaria è sempre 4900 per 0.01ε = e 1225 per 0.02ε = . L’assenza di un’approssimazione per la probabilità di

Page 285: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 271

successo può indurre a estrarre campioni molto più grandi del necessario quando π è prossimo a zero oppure a 1.

Tabella 13.2 − Numerosità campionaria per la proporzione. π 0.01ε = 0.02ε =

0.10 1·764 441 0.20 3·136 784 0.30 4·116 1·029 0.40 4·704 1·176 0.50 4·900 1·225

Esempio 13.5. Un’azienda alimentare è interessata a conoscere la

proporzione di consumatori che acquistano prodotti dietetici. In un’indagine pilota la proporzione campionaria è risultata 0.18. Si vuole ora determinare la numerosità campionaria affinché la proporzione campionaria non disti dalla proporzione della popolazione di oltre 0.03 con probabilità 0.90.

La probabilità con la quale si vuole raggiungere l’obiettivo di precisione desiderato è 1 0.90α− = , sicché / 2 0.05α = . Di conseguenza il valore della funzione di ripartizione in 0.05z è dato da 0.05 0.90 0.95+ = e consultando le tavole si ottiene 0.05 1.645z = . Applicando la (13.5) con 0.03ε = e utilizzando 0.18 come approssimazione di π si ha

2

2

0.18 (1 0.18) 1.645 443.79 4440.03

n × − ×= = .

Per ottenere la precisione desiderata occorre un campione di almeno 444 osservazioni. In assenza di un’approssimazione per π , la numerosità determinata sulla base della (13.6) sarebbe stata

2

2

1.645 751.67 7524 0.03

n = =×

.

L’informazione sul valore di π ha consentito di ridurre drasticamente il valore di n. Infatti la seconda formula considera il caso

Page 286: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 272

peggiore di massima variabilità, inducendo un atteggiamento che risulta eccessivamente cautelativo quando la probabilità di successo è piccola. 13.9 Cenni al campionamento senza rimessa

Se il campionamento avviene senza rimessa si evita che la stessa unità possa essere estratta più volte nel campione. Il rischio di avere delle replicazioni è particolarmente rilevante quando la numerosità N della popolazione non è molto elevata in relazione alla numerosità campionaria n. In queste circostanze l’estrazione senza rimessa rende gli stimatori più efficienti, facendo sì che la stessa precisione possa essere ottenuta con una minore numerosità campionaria.

La tabella 13.3 riporta la probabilità che, nel campionamento con rimessa, almeno un’unità sia estratta più di una volta. La numerosità campionaria considerata nella tabella è 30n = mentre il numero N di unità della popolazione varia fra 100 e .100 000 .

Tabella 13.3 − Probabilità che almeno un’unità sia estratta più volte in un campione di 30 osservazioni estratto con rimessa.

N n N Probabilità 100 0.3000 0.9922 200 0.1500 0.8988 500 0.0600 0.5884

1·000 0.0300 0.3556 2·000 0.0150 0.1963 5·000 0.0060 0.0835 10·000 0.0030 0.0426 50·000 0.0006 0.0087

100·000 0.0003 0.0043

Si supponga che la popolazione sia descritta da una variabile casuale X con valore atteso µ e varianza 2σ e sia ( )1 2, , , nX X X… un campione casuale estratto senza rimessa. In questo caso le variabili casuali 1 2, , , nX X X… sono identicamente distribuite a X ma sono dipendenti. Il valore atteso della media campionaria coincide sempre

Page 287: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 273

con la media della popolazione µ , E X µ = , ma la varianza è diversa rispetto al campionamento con rimessa. Si dimostra infatti che nel campionamento in blocco la varianza della media campionaria è

(13.7) ( )2

1N nVar X

n Nσ −

=−

.

Poiché le variabili campionarie sono identicamente distribuite, la covarianza è costante: ( ),i jCov X X τ= per qualunque i e j. Dal paragrafo 8.6.2 risulta che la varianza della media di n variabili casuali, che hanno tutte media µ , varianza 2σ e covarianza costante τ , è data da

(13.8) ( )2 1nVar X

n nσ τ−

= + .

Per valutare τ si pone n N= ; in tale circostanza si effettua un censimento sicché la varianza della media è nulla. Di conseguenza, per n N= , la (13.8) diventa

2 1 0NN Nσ τ−

+ = .

Risolvendo questa equazione rispetto a τ si ha 2 /( 1)Nτ σ= − − e sostituendo τ nella (13.8) si ottiene

( )2 2 21

1 1n N nVar X

n n N n Nσ σ σ− −

= − =− −

.

Il termine ( ) ( )1N n N− − nella (13.7) è definito fattore di

correzione per popolazioni finite. Poiché è minore di uno, la media campionaria ottenuta mediante campionamento senza rimessa ha minore varianza ed è quindi più efficiente della media campionaria ottenuta nel campionamento con rimessa. Il guadagno di efficienza è tanto maggiore quanto più n risulta elevato in relazione a N. Tuttavia, quando N diventa infinitamente grande, il fattore di correzione tende a

Page 288: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 274

1 e la differenza fra campionamento con e senza rimessa diventa trascurabile.

La tabella 13.4 riporta il rapporto di efficienza fra la media campionaria ottenuta nel campionamento in blocco e lo stesso stimatore ottenuto nel campionamento con rimessa,

1varianza di X nel campionamento in blocco N ne

varianza di X nel campionamento con rimessa N−

= =−

.

Le numerosità campionarie considerate sono 30n = e 50n = e il numero N di unità della popolazione varia fra 100 e 10·000. Quando n è grande in relazione a N, il campionamento con rimessa dà luogo a una perdita di efficienza piuttosto ampia, tuttavia all’aumentare di N il rapporto di efficienza tende a 1.

Tabella 13.4 − Rapporto di efficienza fra la media campionaria ottenuta nel

campionamento in blocco e lo stesso stimatore ottenuto nel campionamento con rimessa.

N ( )30e n = ( )50e n = 100 0.7071 0.5051 200 0.8543 0.7538 500 0.9419 0.9018

1·000 0.9710 0.9510 2·000 0.9855 0.9755 5·000 0.9942 0.9902 10·000 0.9971 0.9951

Con un procedimento analogo a quello svolto per la

determinazione della numerosità campionaria nel caso di estrazione con rimessa, è possibile dimostrare che affinché si abbia

( ) 1P X µ ε α− < = −

la varianza della media campionaria deve soddisfare il vincolo

( )2 2

2/ 21

N nVar Xn N zα

σ ε−= =

−.

Page 289: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 275

Risolvendo rispetto ad n si ottiene la numerosità

(13.9) 2 2

/ 22 2 2 2

/ 21z Nn

N zα

α

σε σ ε

=− +

necessaria affinché la media campionaria non disti da µ di un ammontare superiore ad ε con probabilità 1 α− .

Esempio 13.6. In un determinato settore operano 300 aziende di piccole dimensioni. Si vuole stimare il fatturato medio in modo tale che la media campionaria non disti dalla media della popolazione di oltre 20 mila euro con probabilità 0.95. In un’indagine pilota lo scarto quadratico medio è risultato 120 migliaia di euro. Si decide di estrarre un campione senza rimessa e occorre determinare la numerosità campionaria.

In questo caso 300N = , 20ε = e un’approssimazione di 2σ è data da 1202. Poiché 1 0.95α− = si ha 0.025 1.96z = . Applicando la (13.9) si ottiene

2 2

2 2 2 2

120 1.96 300 94.88 9520 300 1 120 1.96 / 20

n ×= =

− + ×.

Per raggiungere gli obiettivi prefissati è necessario un campione di almeno 95 unità. Si osservi che nel campionamento con rimessa sarebbe necessario un campione di almeno 138 osservazioni. Per la proporzione campionaria valgono le stesse considerazioni, in quanto si tratta di un caso particolare della media campionaria per una popolazione bernoulliana. Sia ( )X Ber π∼ , la proporzione campionaria p ottenuta da un campione casuale ( )1 2, , , nX X X… ha valore atteso π , [ ]ˆE p π= , e varianza

( ) ( )1ˆ

1N nVar p

n Nπ π− −

=−

.

La numerosità campionaria necessaria affinché p non disti da π di un ammontare superiore ad ε , con probabilità 1 α− , è

Page 290: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 276

(13.10) ( )( )

2/ 2

2 2 2/ 2

11 1

z NnN z

α

α

π πε π π ε−

=− + −

e sostituendo a ( )1π π− il suo valore massimo 0.25 si ottiene

(13.11) ( )

2/ 22 2 2

/ 24 1 4z Nn

N zα

αε ε=

− +.

Esempio 13.7. In un comune vi sono 5000 elettori. In previsione di un ballottaggio per l’elezione del sindaco si vuole stimare la probabilità di successo di un candidato. Nella precedente elezione la coalizione, cui appartiene il candidato, ha ottenuto il 35% dei voti. Utilizzando questo valore come approssimazione della probabilità di successo, si vuole determinare n affinché la proporzione campionaria non disti dalla proporzione effettiva dei voti favorevoli di oltre il 2% con probabilità 0.95. Il campione si estrae in blocco.

Si ha 5000N = , 0.02ε = e un’approssimazione di π è data da 0.35. Dato che 1 0.95α− = , 0.025z risulta pari a 1.96. Applicando la (13.10) si ha

2

2 2 2

0.35 (1 0.35) 1.96 50000.02 5000 1 0.35 (1 0.35) 1.96 / 0.02

1520.70 1521.

n × − ×=

− + × − ×=

Per raggiungere l’obiettivo è necessario un campione di almeno 1521 osservazioni. In assenza di un’approssimazione per π , la numerosità campionaria determinata in base alla (13.11) sarebbe stata

( )2

2 2 2

1.96 5000 1622.29 16224 0.02 5000 1 1.96 / 4 0.02

n = =× − + ×

.

L’informazione sul valore di π consente di utilizzare un campione di minore numerosità.

Page 291: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 277

13.10 Esercizi.

Esercizio 13.1. Sia X una variabile casuale con media µ e varianza 2σ finita. Per stimare µ si estrae con rimessa un campione di n unità ( )1 2, , , nX X X… e sono proposti due stimatori

1,1

1 n

n ii

T Xn =

= ∑ e 2, 11 12 2n nT X X= + .

i) Calcolare la media e la varianza dei due stimatori. ii) Calcolare il rapporto di efficienza. iii) Quale stimatore è preferibile e perché?

Esercizio 13.2. L’età media degli studenti iscritti in un ateneo è

22.5 anni con uno scarto quadratico medio di 2.1. Se si estrae con rimessa un campione di 100 studenti, qual è la probabilità che l’età media sia compresa fra 22 e 23 anni?

Esercizio 13.3. Il consumo energetico di un particolare tipo di lavatrici ha una distribuzione normale con media 0.92 kilowatt per ora e scarto quadratico medio 0.11. Si estrae con rimessa un campione di 10 lavatrici e si rileva per ciascuna di esse il consumo energetico. i) Qual è la probabilità che la media campionaria sia compresa fra

0.90 e 0.95 kilowatt per ora? ii) Qual è la probabilità che la varianza campionaria sia maggiore di

0.0291?

Esercizio 13.4. Il 38% delle abitazioni in una città sono dotate di posto auto. Se si estrae con rimessa un campione di 120 abitazioni, qual è la probabilità che la proporzione campionaria delle abitazioni con posto auto sia compresa fra il 35% e il 40%?

Esercizio 13.5. Un gestore di una stazione di servizio sull’autostrada è interessato a stimare la spesa media degli automobilisti. In un’indagine svolta alcuni mesi prima lo scarto quadratico medio della spesa è risultato 12.50 euro. Determinare la

Page 292: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 278

numerosità campionaria affinché la media campionaria non disti dalla media della popolazione di oltre 1.5 euro con probabilità 0.90.

Esercizio 13.6. Un’azienda produce batterie per telefoni cellulare. Si vuole stimare la durata media della batteria in conversazione. In un’indagine eseguita su prodotti analoghi, lo scarto quadratico medio della durata della batteria è risultato 13 minuti. Determinare la numerosità campionaria affinché la media campionaria non disti dalla media della popolazione di oltre 2 minuti con probabilità 0.95.

Esercizio 13.7. Si vuole stimare il numero medio di chilometri per litro di carburante percorsi da un particolare fuori strada su percorso misto. In un’indagine precedente lo scarto quadratico medio è risultato pari a 2.3 chilometri. Determinare la numerosità campionaria affinché la media campionaria non disti dalla media della popolazione di oltre 0.25 chilometri con probabilità 0.90.

Esercizio 13.8. Un’azienda che produce CD-Rom è interessata a stimare la proporzione di pezzi difettosi. In un’indagine svolta in precedenza la percentuale di pezzi difettosi è risultata pari al 3.5%. i) Utilizzando 0.035 come approssimazione della proporzione nella

popolazione, determinare la numerosità campionaria affinché la proporzione campionaria non disti dalla proporzione effettiva di oltre 0.01 con probabilità 0.95.

ii) In assenza di un’approssimazione per la proporzione della popolazione, qual è la numerosità campionaria che consente di raggiungere lo stesso obiettivo di precisione?

Esercizio 13.9. Un’azienda sanitaria locale è interessata a stimare la percentuale di fumatori che vi sono in città. In un’indagine pilota la percentuale di fumatori risulta pari al 27%. i) Utilizzando 0.27 come approssimazione della proporzione nella

popolazione, determinare la numerosità campionaria affinché la proporzione campionaria non disti dalla proporzione effettiva di oltre 0.01 con probabilità 0.99.

Page 293: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Stima puntuale 279

ii) In assenza di un’approssimazione per la proporzione della popolazione, qual è la numerosità campionaria che consente di raggiungere lo stesso obiettivo di precisione?

Esercizio 13.10. Un editore vuole stimare la proporzione di

famiglie che, in una determinata città, acquista regolarmente un quotidiano. In un’indagine precedente tale proporzione è risultata pari al 38%. i) Utilizzando 0.38 come approssimazione della proporzione nella

popolazione, determinare la numerosità campionaria affinché la proporzione campionaria non disti dalla proporzione effettiva di oltre 0.02 con probabilità 0.95.

ii) In assenza di un’approssimazione per la proporzione della popolazione, qual è la numerosità campionaria che consente di raggiungere lo stesso obiettivo di precisione?

Esercizio 13.11. Nel periodo natalizio un’azienda ha prodotto

mille panettoni. Si vuole stimare il peso medio. Assumendo che lo scarto quadratico medio sia 15 grammi, si determini quanto deve essere grande un campione estratto in blocco affinché la media campionaria non disti dalla media della popolazione di oltre 5 grammi con probabilità 0.95.

Esercizio 13.12. Il prodotto di una multinazionale viene venduto

attraverso 1300 punti vendita. Un dirigente è interessato a stimare il fatturato medio annuo dei punti vendita. In uno studio svolto in precedenza lo scarto quadratico medio del fatturato è risultato pari a 75 mila euro. i) Si determini quanto deve essere grande un campione estratto in

blocco affinché la media campionaria non si discosti dalla media della popolazione di oltre 5 mila euro con probabilità 0.90.

ii) Se il campione fosse estratto con rimessa, quale numerosità campionaria consentirebbe di raggiungere lo stesso obiettivo di precisione? Esercizio 13.13. Una filiale cittadina di una compagnia telefonica

ha emesso 15000 fatture. Si vuole stimare la proporzione di fatture

Page 294: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 280

errate. In uno studio svolto l’anno precedente la proporzione di fatture errate è risultata 0.015. i) Utilizzando 0.015 come approssimazione della proporzione nella

popolazione, determinare la numerosità campionaria affinché nell’estrazione in blocco la proporzione campionaria non disti dalla proporzione effettiva di oltre 0.01 con probabilità 0.90.

ii) In assenza di un’approssimazione per la proporzione della popolazione, qual è la numerosità campionaria che consente di raggiungere lo stesso obiettivo di precisione? Esercizio 13.14. In un’area residenziale vi sono 3500 abitazioni.

Si vuole stimare la proporzione di abitazioni che hanno l’impianto di riscaldamento autonomo. In un campionamento pilota la percentuale di abitazioni con il riscaldamento autonomo è risultata pari a 0.68. i) Utilizzando 0.68 come approssimazione della proporzione nella

popolazione, determinare la numerosità campionaria affinché nell’estrazione in blocco la proporzione campionaria non disti dalla proporzione effettiva di oltre 0.025 con probabilità 0.95.

ii) In assenza di un’approssimazione per la proporzione della popolazione, qual è la numerosità campionaria che consente di raggiungere lo stesso obiettivo di precisione?

iii) Se il campione fosse estratto con rimessa, utilizzando 0.68 come approssimazione della proporzione nella popolazione, quale numerosità campionaria consentirebbe di raggiungere lo stesso obiettivo di precisione?

Page 295: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Intervalli di confidenza 14.1 Introduzione

Gli stimatori puntuali forniscono un unico valore come approssimazione del parametro che in molte circostanze costituisce un’informazione insufficiente. Se lo stimatore è una variabile casuale continua la probabilità che la stima coincida con il parametro è nulla. E’ allora ragionevole chiedersi quale sia un insieme di plausibili valori per il parametro. Questa informazione è fornita da un intervallo di confidenza.

Un intervallo di confidenza riassume il grado di incertezza sul valore del parametro. La precisione di una stima ottenuta da un campione di 1000 osservazioni è ben diversa da quella di una stima ottenuta con 50 osservazioni. Tuttavia la stima puntuale non fornisce alcuna informazione sulla sua affidabilità e sul diverso grado di incertezza di valori ottenuti da campioni di numerosità diversa. La lunghezza degli intervalli di confidenza invece si riduce quando la numerosità campionaria aumenta, individuando insiemi di plausibili valori per il parametro via via più piccoli a evidenza del fatto che l’incertezza sul valore del parametro si riduce.

14.2 Definizione di intervallo di confidenza

Sia ( ; )X f x ϑ∼ la variabile casuale che descrive la popolazione. Un intervallo di confidenza è uno stimatore di ϑ determinato in base a

Page 296: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 282

un campione casuale ( )1 2, ,..., nX X X . A differenza degli stimatori puntuali, che forniscono un singolo valore, gli intervalli di confidenza producono come stima un insieme di plausibili valori per ϑ .

Un intervallo di confidenza è individuato dall’estremo inferiore 1L e dall’estremo superiore 2L , dove 1L e 2L sono funzioni del

campione, ( )( )

1 1 1 2

2 2 1 2

, ,..., ,

, ,..., .n

n

L L X X X

L L X X X

=

=

Si osservi che 1L e 2L sono statistiche campionarie e quindi variabili casuali. Di conseguenza l’intervallo di confidenza ( )1 2,L L è un intervallo casuale. Dopo aver estratto il campione si ottiene la stima per intervallo ( )1 2,l l , dove 1l e 2l sono funzioni del campione osservato,

( )( )

1 1 1 2

2 2 1 2

, ,..., ,

, ,..., .n

n

l L x x x

l L x x x

=

=

La stima per intervallo fornisce un insieme di valori che verosimilmente comprende il parametro. Gli intervalli di confidenza infatti sono costruiti in modo tale da avere elevata probabilità di comprendere il parametro. Questa probabilità, chiamata livello di confidenza, è indicata con 1 α− . Gli estremi dell’intervallo di confidenza sono determinati in modo tale che

( )1 2 1P L Lϑ α≤ ≤ = − .

Un intervallo di confidenza al livello ( )100 1 α− è quindi un intervallo casuale che comprende il parametro con probabilità 1 α− .

La quantità 1 α− è chiamata livello di confidenza perché, dopo aver estratto il campione e ottenuto la stima per intervallo ( )1 2,l l , uno dei due eventi “l’intervallo di confidenza comprende il parametro” o “l’intervallo di confidenza non comprende il parametro” si è già verificato. Il termine livello di confidenza riflette il grado di fiducia che

Page 297: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Intervalli di confidenza 283

lo statistico ha riguardo la circostanza che l’intervallo comprenda il parametro.

Tuttavia la stima per intervallo ( )1 2,l l è soltanto uno dei possibili valori che può assumere l’intervallo di confidenza ( )1 2,L L . A livello teorico è possibile ipotizzare che l’esperimento del campionamento e della costruzione dell’intervallo di confidenza possa essere ripetuto un numero infinitamente grande di volte. Per le modalità con le quali è costruito l’intervallo di confidenza, 1 α− è la frequenza relativa con la quale le stime generate da ( )1 2,L L comprenderebbero il parametro nel campionamento ripetuto. Di conseguenza, sulla base di un approccio frequentista, 1 α− può essere interpretata come probabilità. In sintesi l’intervallo di confidenza appartiene ad una famiglia di intervalli che si possono generare ripetendo il campionamento e che comprendono il parametro con probabilità 1 α− .

14.3 Intervallo di confidenza per la media di una popolazione normale con varianza nota Si consideri una popolazione descritta da una variabile casuale normale ( )2,X N µ σ∼ , con media µ incognita e varianza 2σ nota. Questa situazione, sebbene poco realistica, è utile per finalità didattiche. Si vuole determinare un intervallo di confidenza per µ sulla base di un campione casuale ( )1 2, ,..., nX X X . Per costruire un intervallo di confidenza è necessario individuare una quantità pivot. Essa è una funzione del campione e del parametro la cui distribuzione non dipende da parametri incogniti e pertanto è interamente nota. Nel caso specifico si può considerare la media campionaria standardizzata

/XZ

σ−

= .

Page 298: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 284

Questa variabile dipende dal campione, attraverso la media campionaria X , e dal parametro µ ; inoltre ha una distribuzione normale standardizzata (paragrafo 13.3), ( )0,1Z N∼ , e quindi interamente nota.

Per costruire un intervallo di confidenza, al livello 1 α− , è necessario determinare quel valore / 2zα tale che la probabilità che Z assuma valore nell’intervallo ( )/ 2 / 2,z zα α− sia uguale a 1 α−

(14.1) ( )/ 2 / 2 1P z Z zα α α− ≤ ≤ = − .

Procedendo come nel paragrafo 13.7, / 2zα risulta tale che la

funzione di ripartizione di una variabile casuale normale standardizzata in / 2zα vale 1 / 2α− , cioè ( )/ 2 1 / 2zα αΦ = − . Sostituendo Z nella (14.1) con la media campionaria standardizzata si ottiene un’affermazione sulla distribuzione della quantità pivot

(14.2) / 2 / 2 1/

XP z znα αµ α

σ −− ≤ ≤ = −

.

La (14.2) può essere riscritta in modo tale da ottenere un intervallo di confidenza per µ . Infatti si ha

Figura 14.1 zα/2 è tale che ( )/ 2 / 2

1P z Z zα α

α− ≤ ≤

= −

zα/2 -zα/2 0

( )zϕ

1−α

α/2 α/2

Page 299: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Intervalli di confidenza 285

( )/ 2 / 2/ / 1 ,P z n X z nα ασ µ σ α− ≤ − ≤ = −

( )/ 2 / 2/ / 1 ,P X z n X z nα ασ µ σ α− − ≤ − ≤ − + = −

( )/ 2 / 2/ / 1 .P X z n X z nα ασ µ σ α− ≤ ≤ + = −

Definiti

1 / 2 /L X z nα σ= − e 2 / 2 /L X z nα σ= + ,

si ottiene l’intervallo di confidenza ( )1 2,L L tale che

( )1 2 1P L Lµ α≤ ≤ = − .

Dopo l’estrazione del campione si ottiene il valore osservato della media campionaria x e quindi la stima per intervallo ( )1 2,l l , dove

1 / 2 /l x z nα σ= − e 2 / 2 /l x z nα σ= + .

Esempio 14.1. La distribuzione dei pesi dei pacchetti di arachidi, in grammi, prodotti da un’azienda, ha una distribuzione normale con scarto quadratico medio 5. Per stimare il peso medio si estrae un campione di 12 pacchetti ottenendo i pesi seguenti:

188, 190, 191, 193, 197, 200, 201, 202, 205, 207, 208, 209.

Si vuole costruire un intervallo di confidenza al 90%. La stima puntuale della media è 199.25x = . Il livello di

confidenza è 1 0.90α− = , sicché / 2 0.05α = . Per costruire l’intervallo di confidenza occorre determinare 0.05z in modo che la probabilità che una variabile casuale normale standardizzata assuma valore nell’intervallo 0.05 0.05( , )z z− sia pari a 0.90. Il valore 0.05z è tale che ( )0.05 0.95zΦ = e dalle tavole risulta 0.05 1.645z = . Di conseguenza, lo

stimatore per intervallo è

1 21.645 5 12 1.645 5 12L X L X= − × = + × .

Page 300: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 286

Sostituendo il valore osservato della media campionaria, 199.25x = , si ottiene la stima per intervallo. Gli estremi sono

1

2

199.25 1.645 5 / 12 196.88,

199.25 1.645 5 / 12 201.62.

l

l

= − × =

= + × =

L’intervallo di confidenza al livello del 90% è (196.88, 201.62).

Procedendo in modo analogo è possibile ottenere l’intervallo di confidenza al 95%, dato da (196.42, 202.08), e quello al 99%, dato da (195.53, 202.97).

Figura 14.3 – Intervalli di confidenza per diversi livelli di confidenza.

All’aumentare del livello di confidenza aumenta la lunghezza

degli intervalli. Affinché si possa avere un maggior grado di fiducia nella circostanza che l’intervallo comprenda il parametro è necessario considerare insiemi di plausibili valori di dimensione via via più ampia.

1.645 –1.645 0

( )zϕ

0.90 0.05 0.05

196.88 201.62

196.42 202.08

195.53 202.97

1-α = 0.90

1-α = 0.95

1-α = 0.99

Figura 14.2 Determinazione di zα/2 nell’esempio 14.1

199.25

Page 301: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Intervalli di confidenza 287

Si supponga ora che dalla stessa popolazione di pesi di pacchetti di arachidi si estraggano campioni di numerosità diversa, ad esempio con 12,25,50n = . Per finalità didattiche, si assuma che la stima puntuale della media sia sempre la stessa, 199.25x = , per i diversi valori di n. Per 12n = l’intervallo di confidenza al livello del 95% è (196.42, 202.08), per 25n = l’intervallo di confidenza allo stesso livello è (197.29, 201.21) e per 50n = l’intervallo di confidenza è (197.86, 200.64).

Figura 14.4 – Intervalli di confidenza in corrispondenza di diverse numerosità campionarie. All’aumentare della numerosità campionaria, a parità di livello di confidenza, si riduce la lunghezza degli intervalli in quanto vi è un minor grado di incertezza sul valore del parametro. Aumentando n infatti si raccoglie una maggiore quantità di informazioni e ciò consente una stima più precisa.

Esempio 14.2. Da una popolazione normale standardizzata sono stati estratti venti campioni di numerosità 20n = . Le medie campionarie nei venti campioni hanno assunto i valori seguenti:

0.14, 0.46, 0.12, 0.17, −0.06, −0.07, −0.09, −0.21, 0.22, 0.14, 0.10, −0.13, −0.47, 0.12, 0.06, −0.17, −0.10, 0.22, −0.24, 0.05.

Per ciascun campione è stato costruito un intervallo di confidenza per la media della popolazione 0µ = al livello del 90%. Le stime per

n = 50

197.86 200.64

197.29 201.21

196.42 202.08

199.25

n = 25

n = 12

Page 302: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 288

intervallo sono rappresentate nella figura 14.51. Al variare del campione varia la stima per intervallo e due dei venti intervalli di confidenza non comprendono il parametro, coerentemente alle aspettative basate su un livello di confidenza del 90%.

Figura 14.5 – Venti stime per intervallo per la media di una popolazione

normale standardizzata al livello di confidenza del 90%.

-0.23 0.50.09 0.83

-0.25 0.49-0.19 0.54

-0.43 0.31-0.44 0.29

-0.46 0.28-0.58 0.15

-0.14 0.59-0.22 0.51

-0.27 0.46-0.5 0.24

-0.84 -0.1-0.25 0.49

-0.31 0.43-0.54 0.2

-0.46 0.27-0.15 0.59

-0.6 0.13-0.32 0.41

0

14.4 Intervallo di confidenza per la media di una popolazione normale con varianza incognita Quando la popolazione è normale, ( )2,X N µ σ∼ , con media e varianza incognite, è necessario individuare un’opportuna quantità pivot per la costruzione degli intervalli di confidenza. La media

1 Gli intervalli di confidenza sono tracciati a partire dal basso.

Page 303: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Intervalli di confidenza 289

campionaria standardizzata non può più essere utilizzata perché la varianza non è nota. Tuttavia dal paragrafo 13.5 risulta che nel caso di popolazioni normali la quantità ( ) 2 2ˆ1 /n σ σ− , dove 2σ è lo stimatore non distorto della varianza, ha una distribuzione 2χ con 1n − gradi di libertà. Inoltre la media campionaria e la varianza campionaria sono indipendenti. Di conseguenza la quantità

2 2

/ˆ /

Xnµ

σσ σ

è il rapporto fra una normale standardizzata, ( ) ( )/X nµ σ− , e la radice di una variabile casuale 2

1nχ − rapportata ai suoi gradi di libertà, 2 2ˆ /σ σ . Poiché numeratore e denominatore sono indipendenti questo

rapporto ha una distribuzione t di Student con 1n − gradi di libertà (paragrafo 10.5). Semplificando si ha

1ˆ / nX t

σ −− ∼ .

Questa quantità è chiamata media campionaria “studentizzata” per indicare che, al denominatore, σ è stato sostituito da σ . Poiché la sua distribuzione non dipende da alcun parametro incognito, la media campionaria studentizzata può essere utilizzata come quantità pivot.

Per costruire un intervallo di confidenza, al livello 1 α− , occorre individuare quel valore 1, / 2nt α− tale che una variabile casuale t di Student, con 1n − gradi di libertà, assuma valori nell’intervallo ( )1, / 2 1, / 2,n nt tα α− −− con probabilità 1 α−

(14.3) ( )1, / 2 1 1, / 2 1n n nP t t tα α α− − −− ≤ ≤ = − .

Le aree nelle code, all’esterno dell’intervallo ( )1, / 2 1, / 2,n nt tα α− −− , sono entrambe uguali ad / 2α . Quindi 1, / 2nt α− può essere individuato sulle tavole come quel valore tale che una variabile casuale 1nt − assuma valori maggiori con probabilità / 2α .

Page 304: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 290

Procedendo in modo analogo al caso con varianza nota e sostituendo

1nt − nella (14.3) con la media campionaria studentizzata, si ha

Lo stimatore per intervallo della media di una popolazione normale, al livello di confidenza 1 α− , ha estremi

1 1, / 2 ˆ /nL X t nα σ−= − e 2 1, / 2 ˆ /nL X t nα σ−= +

e la stima per intervallo è

1 1, / 2 ˆ /nl x t nα σ−= − e 2 1, / 2 ˆ /nl x t nα σ−= + .

Esempio 14.3. Una società telefonica vuole stimare il tempo medio, in minuti, che intercorre fra il momento nel quale sono segnalati i guasti e quello in cui avviene la riparazione. Si assume che i tempi si distribuiscano in modo normale. In un campione casuale di 16 richieste

1, / 2nt α−− 0

1−α α/2 α/2

( )1nf t −

1, / 2nt α−

( )( )( )

1, / 2 1, / 2

1, / 2 1, / 2

1, / 2 1, / 2

1, / 2 1, / 2

1 ,

ˆ ˆ/ / 1 ,

ˆ ˆ/ / 1 ,

ˆ ˆ/ / 1 .

ˆ /n n

n n

n n

n n

P t t

P t n X t n

P X t n X t n

P X t n X t n

Xnα α

α α

α α

α α

α

σ µ σ α

σ µ σ α

σ µ σ α

µσ− −

− −

− −

− −

− ≤ ≤ = −

− ≤ − ≤ = −

− − ≤ − ≤ − + = −

− ≤ ≤ + = −

Figura 14.6 ( )1, /2 1 1, /2

1n n nP t t tα α

α− − −− ≤ ≤

= −

Page 305: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Intervalli di confidenza 291

di assistenza, la media è risultata 47x = e lo scarto quadratico medio è risultato ˆ 12σ = . Si vuole costruire un intervallo di confidenza al 95%.

Poiché la numerosità campionaria è 16n = , la media campionaria studentizzata ha una distribuzione t di Student con 15 gradi di libertà. Per l’intervallo di confidenza è necessario determinare il valore 15,0.025t tale che una variabile casuale 15t assuma valori maggiori con probabilità / 2 0.025α = . Dalle tavole risulta 15,0.025 2.131t = .

Gli estremi dell’intervallo di confidenza sono

1 247 2.131 12 / 16 40.61, 47 2.131 12 / 16 53.39l l= − × = = + × = .

Il tempo medio per le riparazioni è compreso fra 40.61 minuti e 53.39 minuti al livello di confidenza del 95%. 14.5 Intervallo di confidenza per la media quando la popolazione non è normale Se si rimuove l’ipotesi di normalità, non è di regola possibile determinare una quantità pivot con una distribuzione nota per qualsiasi numerosità campionaria. Tuttavia è possibile individuare una quantità tale che la distribuzione asintotica sia interamente nota. Si supponga che la popolazione sia descritta da una variabile casuale X con valore atteso µ e varianza 2σ . Per il teorema del limite

2.131 -2.131 0

0.95 0.025 0.025

( )15f t Figura 14.7 Determinazione di tn-1,α/2 nell’esempio 14.3

Page 306: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 292

centrale (paragrafi 11.2.1 e 13.3) la media campionaria standardizzata ha una distribuzione asintotica normale, sicchè per n sufficientemente grande si ha

/ 2 / 2 1/

XP z znα αµ α

σ −− ≤ ≤ −

.

E’ possibile dimostrare che la distribuzione asintotica non risulta modificata se al denominatore σ è sostituito dallo stimatore consistente σ . Di conseguenza anche la media campionaria studentizzata ha una distribuzione asintoticamente normale e quindi, per n sufficientemente grande, si ha

/ 2 / 2 1ˆ /XP z z

nα αµ α

σ −− ≤ ≤ −

.

Questo risultato può essere utilizzato per costruire un intervallo di confidenza approssimato per la media di popolazioni non normali. Al livello di confidenza 1 α− , gli estremi dell’intervallo sono dati da

1 / 2 ˆ /L X z nα σ= − e 2 / 2 ˆ /L X z nα σ= + .

Per n finito, la probabilità che l’intervallo ( )1 2,L L comprenda µ può risultare diversa dal livello di confidenza nominale 1 α− , tuttavia la differenza fra livello di confidenza effettivo e nominale diventa trascurabile al crescere di n.

La tabella 14.1 riporta il livello di confidenza effettivo2 con il quale gli intervalli costruiti per la media di alcune variabili casuali (diverse da quella normale) comprendono µ . Il livello di confidenza nominale 1 α− è 0.95 e le variabili casuali considerate sono la t di Student con 5 gradi di libertà, l’uniforme sull’intervallo ( )0 1, e l’esponenziale negativa con 1λ = . Gli intervalli sono costruiti per 2 Il livello di confidenza effettivo è stato ottenuto mediante simulazione. Per ciascuna variabile casuale e ciascun valore di n, sono stati generati un 1·000·000 di campioni e per ognuno di essi è stato costruito un intervallo di confidenza al livello 1 α− . La frequenza relativa con la quale questi intervalli comprendono il parametro dà un’approssimazione del livello di confidenza effettivo.

Page 307: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Intervalli di confidenza 293

diversi valori di n fra 30 e 1000. Quando la numerosità campionaria n non è molto elevata, il livello di confidenza effettivo può risultare piuttosto diverso da quello nominale, specialmente se la variabile casuale che descrive la popolazione ha una distribuzione asimmetrica. Tuttavia, all’aumentare di n il livello di confidenza effettivo tende a 1 α− .

Tabella 14.1 – Livello di confidenza effettivo degli intervalli costruiti per la media.

n 5t ( )0 1U , ( )1Exp 10 0.9234 0.9165 0.8691 20 0.9380 0.9343 0.9048 30 0.9423 0.9398 0.9178 50 0.9454 0.9437 0.9300 100 0.9478 0.9475 0.9391 200 0.9489 0.9489 0.9445 500 0.9496 0.9493 0.9477 1000 0.9496 0.9496 0.9489

14.6 Intervallo di confidenza per la probabilità di successo di una variabile casuale di Bernoulli Sia ( )X Ber π∼ la variabile casuale che descrive la popolazione. Poiché la probabilità di successo è anche il valore atteso di X, un intervallo di confidenza per π può essere ottenuto come un caso particolare di intervallo di confidenza per la media di una popolazione non normale. Se la popolazione è bernoulliana lo stimatore della media è dato dalla proporzione campionaria p mentre lo stimatore della varianza,

( )( ) 1Var X π π= − , è ( )ˆ ˆ1p p− . Di conseguenza la proporzione campionaria studentizzata risulta

ˆˆ ˆ(1 ) /

pp p n

π−−

.

Page 308: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 294

Questa quantità, per n sufficientemente grande, ha una distribuzione approssimativamente normale standardizzata,

( )/ 2 / 2ˆ

1ˆ ˆ1 /

pP z zp p n

α απ α

− − ≤ ≤ − −

.

Proseguendo si ha

( ) ( )( )( ) ( )( )( ) ( )( )

/ 2 / 2

/ 2 / 2

/ 2 / 2

ˆ ˆ ˆ ˆ ˆ1 / 1 / 1 ,

ˆ ˆ ˆ ˆ ˆ ˆ1 / 1 / 1 ,

ˆ ˆ ˆ ˆ ˆ ˆ1 / 1 / 1 .

P z p p n p z p p n

P p z p p n p z p p n

P p z p p n p z p p n

α α

α α

α α

π α

π α

π α

− − ≤ − ≤ − −

− − − ≤ − ≤ − + − −

− − ≤ ≤ + − −

Pertanto un intervallo di confidenza approssimato per π , al livello 1 α− , è dato da ( )1 2,L L dove

1 / 2ˆ ˆ ˆ(1 ) /L p z p p nα= − − e 2 / 2ˆ ˆ ˆ(1 ) /L p z p p nα= + − .

Esempio 14.4. In un’indagine sull’occupazione nel periodo post-laurea è stato estratto un campione di 250 laureati in Economia. Fra questi 45 hanno deciso di proseguire gli studi seguendo un corso di perfezionamento. Si vuole costruire un intervallo di confidenza al 99% per la percentuale di laureati in Economia che proseguono gli studi dopo la laurea. La popolazione è descritta da una variabile casuale ( )X Ber π∼ , che assume valore 1 se il laureato segue il corso di perfezionamento. La stima puntuale di π è ˆ 45 / 250 0.18.p = = Il livello di confidenza è 0.99, sicché / 2 0.005α = e 0.005 2.575z = . Gli estremi dell’intervallo di confidenza sono

1

2

0.18 2.575 0.18 (1 0.18) / 250 0.117,

0.18 2.575 0.18 (1 0.18) / 250 0.243.

l

l

= − × × − =

= + × × − =

Page 309: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Intervalli di confidenza 295

La percentuale dei laureati in Economia che decidono di proseguire gli studi è compresa fra l’11.7% e il 24.3% al livello di confidenza del 99%.

La tabella 14.2 riporta il livello di confidenza effettivo3 degli intervalli per la probabilità di successo di una popolazione bernoulliana. Il livello di confidenza effettiva può risultare piuttosto diverso da quello nominale specialmente per numerosità campionarie non elevate e π prossimo a zero (oppure a 1).

Tabella 14.2 – Livello di confidenza effettivo degli intervalli costruiti per la probabilità di successo di una variabile casuale di Bernoulli.

n 0 1.π = 0 3.π = 0 5.π = 10 0.6503 0.8402 0.8909 20 0.8756 0.9475 0.9588 30 0.8084 0.9528 0.9573 50 0.8786 0.9345 0.9353 100 0.9324 0.9500 0.9426 200 0.9272 0.9439 0.9442 500 0.9427 0.9491 0.9453 1000 0.9523 0.9463 0.9469

14.7 Esercizi

Esercizio 14.1. Il contenuto di sapone liquido nelle confezioni da 250 millilitri, prodotte da un’azienda, ha una distribuzione normale con scarto quadratico medio 5 millilitri. In un campione di 12 confezioni, la media campionaria è risultata 247.3 millilitri. Costruire un intervallo di confidenza per il contenuto medio di sapone liquido al livello del 90%.

Esercizio 14.2. Il fatturato mensile dei punti vendita di una catena di negozi di abbigliamento ha una distribuzione normale. In un campione di 20 punti vendita, la media campionaria del fatturato risulta 3 Il livello di confidenza effettivo è stato calcolato mediante simulazione su un 1·000·000 di campioni

Page 310: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 296

35 mila euro e lo scarto quadratico medio risulta 4.3 migliaia di euro. Costruire un intervallo di confidenza per il fatturato medio dei punti vendita al livello del 95%.

Esercizio 14.3. I tempi di assemblaggio in una catena di montaggio hanno una distribuzione normale. In un campione di 14 osservazioni, la media campionaria è risultata 12.6 secondi e lo scarto quadratico medio è risultato 2.3 secondi. Costruire un intervallo di confidenza per il tempo medio di assemblaggio al livello del 99%.

Esercizio 14.4. Il contenuto di nicotina, in una particolare marca di sigarette, ha una distribuzione normale. In un campione di 18 sigarette, la media campionaria risulta 3.7 milligrammi e lo scarto quadratico medio risulta 0.6 milligrammi. Costruire un intervallo di confidenza al 90% per il contenuto medio di nicotina.

Esercizio 14.5. Si sperimenta un nuovo farmaco per l’emicrania. In un campione di 250 pazienti, 178 hanno dichiarato che il farmaco è efficace. Costruire un intervallo di confidenza per la proporzione della popolazione per la quale il farmaco è efficace, al livello del 95%. Esercizio 14.6. Una catena di tavole calde vuole verificare qual è la percentuale di clienti che sono soddisfatti della qualità del cibo. In un campione di 500 clienti, 425 si dichiarano soddisfatti. Costruire un intervallo di confidenza per la proporzione dei clienti che sono soddisfatti della qualità del cibo, al livello del 99%.

Esercizio 14.7. Un’azienda produce robot da cucina e ne garantisce il funzionamento per un anno. In un campione di 320 robot, 24 sono stati riportati in azienda entro l’anno per un difetto di funzionamento. Si determini un intervallo di confidenza per la proporzione di robot, prodotti dall’azienda, per i quali si verifica un difetto di funzionamento entro un anno, al livello del 90%.

Page 311: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 15.1. Introduzione

A differenza della teoria della stima, nella quale non si hanno informazioni a priori, nel test delle ipotesi l’obiettivo è verificare se vi è evidenza a sufficienza per sostenere un’ipotesi sulle caratteristiche della distribuzione della variabile casuale che descrive la popolazione.

Un produttore di batterie per computer portatili sostiene che esse in media hanno un’autonomia di almeno sei ore, un messaggio promozionale di un’automobile afferma che con un litro di carburante si percorrono in media almeno 25 chilometri, il direttore di un master assicura che almeno l’80% degli allievi trova occupazione entro un anno dalla fine del corso. La finalità del test è verificare se, sulla base delle osservazioni campionarie, vi è sufficiente evidenza per confermare o respingere affermazioni di questo tipo.

Il test si concretizza in una regola di decisione che valuta la sostenibilità delle ipotesi formulate sulla base dei risultati campionari. Poiché si tratta di un procedimento induttivo vi è il rischio di assumere una decisione errata. A differenza della teoria della stima, nella quale l’obiettivo è scegliere lo stimatore più efficiente in modo da ridurre il più possibile l’ordine di grandezza dell’errore di stima, i metodi inferenziali utilizzati nel test delle ipotesi hanno l’obiettivo di controllare o limitare la probabilità di decisioni errate.

Page 312: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 298

15.2 Le ipotesi statistiche

Le ipotesi sono affermazioni su alcune caratteristiche di un fenomeno di interesse. Per poter essere sottoposte a test esse devono essere formulate come ipotesi statistiche, ossia come affermazioni sulla distribuzione della variabile casuale che descrive la popolazione. Esse possono riguardare il valore dei parametri o la forma della distribuzione. Se una pubblicità afferma che con un litro di carburante un’automobile percorre in media almeno 25 chilometri, l’affermazione può essere formulata come un’ipotesi statistica nella quale si assume che la media della distribuzione dei chilometri percorsi con un litro di carburante è almeno 25. Nel caso del direttore del master che sostiene che l’80% degli allievi trovano un impiego entro un anno, si formula un’ipotesi sulla probabilità di successo di una variabile casuale di Bernoulli. In altre circostanze si possono sottoporre a test ipotesi sulla forma della distribuzione di una variabile casuale, verificando ad esempio se la distribuzione dei pesi delle confezioni di un prodotto alimentare è normale, se la distribuzione del tempo che intercorre fra due interventi di manutenzione di un server è quella di una variabile casuale esponenziale negativa o se le componenti di una variabile casuale doppia sono indipendenti.

In questo capitolo si considera il caso nel quale la popolazione è descritta da una variabile casuale ( ; )X f x ϑ∼ e l’obiettivo è sottoporre a test un’ipotesi sul valore di ϑ .

Le ipotesi sui parametri possono essere semplici oppure composite. Un’ipotesi semplice considera un unico valore 0ϑ per ϑ

0ϑ ϑ= .

Un’ipotesi composita assume invece un insieme di possibili valori per ϑ . Le ipotesi composite possono essere unidirezionali o bidirezionali. In quelle unidirezionali il parametro può assumere soltanto valori minori (o non superiori) o maggiori (o non inferiori) a un valore 0ϑ . Ipotesi unidirezionali sono

Page 313: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 299

0ϑ ϑ< , oppure 0ϑ ϑ> ,

e

0ϑ ϑ≤ oppure 0ϑ ϑ≥ .

Sono invece ipotesi bidirezionali quelle che consentono al parametro di assumere qualsiasi valore diverso da 0ϑ

0ϑ ϑ≠ .

Nell’ambito del test si confronta l’ipotesi nulla con l’ipotesi alternativa. L’ipotesi nulla è considerata vera fino a prova contraria, cioè finché dai dati non emerge evidenza a sufficienza per respingerla. Se un produttore di stampanti laser sostiene che un modello stampa in media almeno 28 pagine al minuto, questa affermazione è ritenuta vera finché i risultati emersi dal campione non consentano di respingerla. L’ipotesi nulla è indicata con 0H .

Il test delle ipotesi è effettuato per verificare la sostenibilità dell’ipotesi nulla. Se l’ipotesi nulla è falsa qualche altra ipotesi deve essere vera. Questa è l’ipotesi alternativa da confrontare con l’ipotesi nulla. Nell’esempio precedente l’ipotesi alternativa assume che l’affermazione del produttore è falsa e quindi il numero medio di pagine stampate al minuto dalla stampante laser è minore di 28. L’ipotesi alternativa è indicata con 1H . Generalmente l’obiettivo del test è verificare se, nelle osservazioni campionarie, vi è evidenza a sufficienza per respingere l’ipotesi nulla e sostenere l’ipotesi alternativa.

Nell’esempio della stampante laser il test riguarda il valore della media µ della distribuzione del numero di pagine stampate al minuto e confronta due ipotesi unidirezionali

0 28H : µ ≥ verso 1 28H : µ < .

Se un dirigente di azienda afferma di non operare discriminazioni nelle assunzioni in base al sesso, la popolazione è descritta da una variabile casuale bernoulliana ( )X Ber π∼ dove π è la probabilità che venga

Page 314: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 300

assunta una donna. L’affermazione del dirigente è sottoposta a test confrontando un’ipotesi nulla semplice su π con un’ipotesi alternativa bidirezionale

0 : 0.5H π = verso 1 : 0.5H π ≠ . 15.3 La regola di decisione

Per poter eseguire il test è necessario definire una regola di

decisione che consenta, dopo aver estratto il campione, di scegliere se respingere o non respingere l’ipotesi nulla.

A tal fine si individua una statistica

( )1 2, ,...,n nT T X X X= ,

che sintetizzi le informazioni campionarie. Essa è definita statistica test e ha la proprietà che la sua distribuzione è nota sotto l’ipotesi nulla,

( )0H

nT f t∼

e ( )f t non dipende da parametri incogniti1.

Si consideri una popolazione descritta da una variabile casuale normale ( )2,X N µ σ∼ con varianza nota. Per sottoporre a test l’ipotesi nulla 0 0:H µ µ= si può utilizzare, come statistica test, la media campionaria X . Per la proprietà riproduttiva della variabile casuale normale (paragrafi 10.1.2 e 13.3) X ha una distribuzione normale. In particolare, se 0H è vera, si ha

( )20 , /

oH

X N nµ σ∼ .

1 La notazione ( )

0H

nT f t∼ significa che “sotto 0H (se 0H è vera) nT si distribuisce come una variabile casuale con funzione di densità ( )f t .

Page 315: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 301

In alternativa si può utilizzare la media campionaria standardizzata, utilizzando come valore di µ quello assunto sotto l’ipotesi nulla 0µ , infatti

( )0 0,1/

oHX Nnµ

σ− ∼ .

Dopo l’estrazione del campione, si ottiene il valore osservato della statistica test

( )1 2, ,...,n nt T x x x= .

La regola di decisione definisce una partizione dell’insieme dei valori assunti dalla statistica test nT in regione di accettazione (R.A.) e regione critica (R.C.). Se nt appartiene alla regione di accettazione, l’ipotesi nulla non è respinta. Se invece nt si trova nella regione critica l’ipotesi nulla è respinta.

Figura 15.1 Regola di decisione

In sintesi la regola di decisione è

0

0

. . ,

. . .n

n

se t R A H non è respintase t R C H è respinta

∈ ⇒ ∈ ⇒

Il valore tα che delimita la regione di accettazione dalla regione critica si chiama valore critico.

tn

Regione di accettazione

R.A.

Regione critica R.C.

H0 è respinta H0 non è respinta

Page 316: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 302

15.4 Errori nel test delle ipotesi L’esito del test delle ipotesi dipende dal valore osservato nt della

statistica test e quindi dai risultati campionari. La decisione se respingere o non respingere l’ipotesi nulla si concretizza nel valutare la coerenza fra l’evidenza emersa nel campione osservato − sintetizzata da nt − e le ipotesi statistiche.

E’ opportuno osservare che nt è soltanto uno dei possibili valori che può assumere la statistica test. Se si ripetesse il campionamento verosimilmente si osserverebbe un diverso valore della statistica test, con una probabilità non nulla di prendere una decisione diversa pur utilizzando la stessa regola di decisione. Poiché la decisione dipende dal campione osservato e non è invece basata sulla conoscenza della popolazione, non vi è mai la certezza di prendere la decisione corretta. Può accadere che l’ipotesi nulla sia vera e non sia respinta o che l’ipotesi nulla sia falsa e sia respinta; in questi due casi non si commettono errori. Tuttavia può anche accadere che l’ipotesi nulla sia vera e sia erroneamente respinta o l’ipotesi nulla sia falsa ma non sia respinta; in questi casi si commettono degli errori.

Quando l’ipotesi nulla è vera ed è respinta si commette un errore di I tipo (primo tipo). Questo errore si verifica quando la statistica test assume valore nella regione critica malgrado sia vera l’ipotesi nulla. Poiché l’errore di I tipo è un evento ha senso calcolare la sua probabilità, che usualmente si indica con α. Si ha

( ) ( )( )

0 0

0

|

. . | .n

P errore di I tipo P respingere H H

P T R C H

α = =

= ∈

La probabilità dell’errore di I tipo è anche chiamata livello di significatività del test.

Quando l’ipotesi nulla è falsa e non è respinta si commette un altro errore definito errore di II tipo (secondo tipo). Esso si verifica quando nT assume valore nella regione di accettazione e 0H è falsa.

Page 317: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 303

Anche l’errore di II tipo è un evento e la sua probabilità è indicata con β. Si ha

( ) ( )( )

0 1

1

|

. . | .n

P errore di II tipo P non respingere H H

P T R A H

β = =

= ∈

Tabella 15.1 − Decisioni nel test delle ipotesi e relative probabilità Decisione 0H vera 0H falsa

0H è respinta

Errore I tipo

Probabilità = α

Decisione Corretta

Probabilità = 1-β

0H non è respinta

Decisione Corretta

Probabilità = 1-α

Errore II tipo

Probabilità = β

Esempio 15.1. La durata delle batterie prodotte da un’azienda è

descritta da una variabile casuale normale ( )2,X N µ σ∼ , con varianza nota 2 100σ = . Si vuole verificare l’ipotesi nulla che la durata media sia 200 ore verso un’ipotesi alternativa che la durata media sia 195 ore. Si confrontano quindi due ipotesi semplici

0 : 200H µ = verso 1 : 195H µ = .

Per verificarle si utilizza, come statistica test, la media campionaria X di un campione di 16 osservazioni. Se l’ipotesi nulla è vera la media campionaria ha una distribuzione normale con media 200 e varianza 100 /16 6.25= : (200, 6.25)X N∼ .

E’ ragionevole assumere una regola di decisione che respinga l’ipotesi nulla per valori piccoli della media campionaria. Si consideri ad esempio una regola che respinge l’ipotesi nulla quando il valore

Page 318: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 304

osservato della media campionaria x è minore di 197, in base alla quale la regione di accettazione risulta

R.A. : 197x ≥ e la regione critica risulta

R.C. : 197x < .

Con questa notazione si intende che la regione di accettazione è costituita dall’insieme dei valori della statistica test X maggiori o uguali a 197, mentre la regione critica è costituita dall’insieme dei valori della statistica test minori di 197. Il valore 197 è il valore critico.

La probabilità dell’errore di I tipo è la probabilità che X assuma valori nella regione critica quando 0H è vera ed è quindi la probabilità dell’evento X < 197 calcolata sotto l’ipotesi nulla 200µ = . Si ha

( ) ( )

( )

0 0

0

. . | : 200 197 | : 200

200 197 200 : 200 1.2 0.1151,6.25 6.25

P X R C H P X H

XP H P Z

α µ µ

µ

= ∈ = = < =

− −= < = = < − =

dove Z è una variabile casuale normale standardizzata. Sotto l’ipotesi alternativa la media campionaria ha una

distribuzione normale con media 195 e la stessa varianza 6.25: (195, 6.25)X N∼ . La probabilità di commettere l’errore di II tipo è la

probabilità che la media campionaria assuma valore nella regione di accettazione, X ≥ 197, quando è vera 1H , cioè µ =195. Si ha

( ) ( )

( )

1 1

1

. . | : 195 197 | : 195

195 197 195 : 195 0.80 0.2119.6.25 6.25

P X R A H P X H

XP H P Z

β µ µ

µ

= ∈ = = ≥ =

− −= ≥ = = ≥ =

Le figure 15.2 e 15.3 illustrano rispettivamente le probabilità degli errori di I e II tipo.

Page 319: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 305

195 197 200

195 197 200

Sarebbe auspicabile ridurre il più possibile entrambe le

probabilità di errore di I e II tipo. Purtroppo ciò non è possibile perché, per una data forma della regione critica2, α e β sono legate inversamente. E’ possibile ridurre la probabilità dell’errore di I tipo 2 La forma della regione critica riguarda la sua collocazione nell’insieme dei valori assunti da nT . Se la regione critica è del tipo nt tα> , essa si colloca nella parte destra di tale insieme. Se invece la regione critica è del tipo nt tα< , essa si colloca nella parte sinistra. Infine la regione critica può essere del tipo nt tα> e in tal caso comprende sia i valori più piccoli che quelli più grandi di nT e si trova “nelle code”. Nell’esempio 15.1, la regola di decisione respinge l’ipotesi nulla quando i valori osservati di X sono minori del valore critico (cioè quando 197x < ) e pertanto la regione critica si trova a sinistra.

( )1|f x H ( )0|f x H

x α

Figura 15.2 Probabilità dell’errore di I tipo nell’esempio 15.1

( )1|f x H ( )0|f x H

x

β

Figura 15.3 Probabilità dell’errore di II tipo nell’esempio 15.1

Page 320: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 306

restringendo la regione critica, in modo da ridurre la probabilità che nT vi appartenga quando 0H è vera. Tuttavia ciò comporta un’estensione della regione di accettazione e quindi della probabilità che nT vi appartenga anche quando è vera l’ipotesi alternativa, sicché la probabilità dell’errore di II tipo aumenta. La figura 15.4 illustra una tipica relazione fra α e β .

1

β

Esempio 15.1 (continuazione). Se si vuole ridurre la probabilità dell’errore di I tipo, nel test delle ipotesi dell’esempio 15.1, è necessario restringere la regione critica. Si può ad esempio modificare la regola di decisione decidendo di respingere l’ipotesi nulla quando

196x < . La probabilità dell’errore di I tipo in questo caso è data da

( )0196 200196 | : 200 0.0548

6.25P X H P Zα µ − = < = = < =

ed è minore di quella ottenuta in precedenza. Tuttavia se si riduce la regione critica aumenta la regione di accettazione e quindi la probabilità di non respingere l’ipotesi nulla anche quando è falsa. Infatti la probabilità dell’errore di II tipo è ora data da

Figura 15.4 Relazione fra le probabilità dell’errore di I e II tipo nel test delle ipotesi

Page 321: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 307

( )1196 195196 | : 195 0.3446.

6.25P X H P Zβ µ − = ≥ = = ≥ =

Per poter ridurre contemporaneamente entrambe le probabilità di

errore è necessario poter disporre di maggiori informazioni. In termini statistici ciò significa che, per una data forma della regione critica, è possibile ridurre sia α sia β soltanto aumentando la numerosità campionaria n.

Esempio 15.1 (continuazione). Si supponga che per verificare le ipotesi si adotti come regione critica 197x < ma si utilizzi un campione di numerosità maggiore con 25n = . In questo caso la varianza della media campionaria è 100 / 25 4= e pertanto

( ), 4X N µ∼ . La probabilità dell’errore di I tipo diventa

( )0197 200197 | : 200 0.0668

2P X H P Zα µ − = < = = < =

;

mentre la probabilità dell’errore di II tipo risulta

( )0197 195197 | : 195 0.1587

2P X H P Zβ µ − = > = = > =

.

La maggiore dimensione campionaria consente di ridurre sia α che β , pur utilizzando la stessa regione critica.

Poiché, per una numerosità campionaria fissata, non è possibile

controllare sia α sia β , nel test delle ipotesi si fissa la probabilità dell’errore di I tipo. Esso è infatti ritenuto più grave perché si respinge erroneamente l’ipotesi nulla cioè l’ipotesi considerata vera fino a prova contraria. La probabilità dell’errore di II tipo risulta quindi determinata di conseguenza.

Il procedimento che si segue nella verifica di un sistema di ipotesi è il seguente. Inizialmente si fissa il livello di significatività α , quindi si individua la statistica test nT e infine, nell’insieme dei valori

Page 322: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 308

assunti da nT , si individua una regione critica tale che la probabilità dell’errore di I tipo sia pari ad α . La forma della regione critica deve essere scelta in modo tale da comprendere tutti quei valori di nT per i quali l’ipotesi nulla risulta meno verosimile. Così, a parità di livello di significatività, è possibile ridurre la probabilità dell’errore di II tipo.

15.5 Test unidirezionale sulla media di una popolazione normale con varianza nota

Sia ( )2,X N µ σ∼ la variabile casuale che descrive la popolazione. Per finalità didattiche inizialmente si considera il caso nel quale la varianza è nota. Si supponga di voler confrontare un’ipotesi nulla semplice sulla media con un’ipotesi alternativa composita unidirezionale

0 0:H µ µ= verso 1 0:H µ µ> .

Nel sottoporre a test un’ipotesi sulla media è naturale utilizzare una statistica test che sia funzione della media campionaria X . Se l’ipotesi nulla è vera la media campionaria standardizzata, ottenuta utilizzando 0µ come valore di µ , ha una distribuzione nota. Infatti si ha

( )0

0 0,1/

H

nXT N

σ−

= ∼ .

E’ ragionevole dubitare che l’ipotesi nulla sia vera quando la media campionaria assume valori elevati. Di conseguenza la regione critica deve essere definita in modo tale che comprenda valori della statistica test corrispondenti a valori elevati di X . Poiché nT è una funzione crescente di X , la regione critica conterrà valori elevati di

nT . Essa sarà quindi individuata a destra dell’insieme dei valori della statistica test. La regione critica è costituita da tutti i valori di nT

Page 323: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 309

maggiori di un valore zα , dove zα è scelto in modo che il livello di significatività sia α .

Si ha R.C. : nt zα> ,

dove il valore critico zα è determinato in modo che

( ) ( ) ( )0 0 0 0

0

| R.C. | |

./

n n

o

P respingere H H P T H P T z H

XP z Hn

α

αµ α

σ

= ∈ = >

−= > =

Dato che sotto 0H si ha ( )0,1nT N∼ , zα è tale che una variabile casuale normale standardizzata Z assuma valori maggiori di zα con probabilità α . Il valore della funzione di ripartizione di Z in zα è 1 α− , sicché zα può essere determinato dalle tavole delle variabile casuale normale in modo che ( ) 1zα αΦ = − . La regione di accettazione, al livello di significatività α , è data da

R.A. : 0

/x z

n αµ

σ−

e la regione critica risulta

R.C. : 0

/x z

n αµ

σ−

> .

R .A . R .C .

α

0

Figura 15.5 Regione di accettazione e regione critica nel test unidirezionale sulla media di una variabile casuale normale con varianza nota

0

/x

σ−

( )zϕ

z zα

Page 324: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 310

La regola di decisione è

00

00

,/

./

xse z H non è respintan

xse z H è respintan

α

α

µσ

µσ

− ≤ ⇒ − > ⇒

Esempio 15.2. Un produttore di fili di rame per impieghi

elettrotecnici assicura che, in media, la percentuale di impurità presente nel suo prodotto è pari al 5%. La percentuale di impurità ha una distribuzione normale con scarto quadratico medio 1.2. In un campione di 18 fili di rame, la media campionaria è risultata 5.4x = . Si vuole verificare l’affermazione del produttore al livello di significatività del 10%.

Sia ( )2,1.2X N µ∼ la variabile casuale che descrive la percentuale di impurità nei fili di rame. L’ipotesi nulla − ritenuta vera fino a prova contraria − assume che il produttore affermi il vero e pertanto 5µ = . E’ interesse di chi acquista i fili di rame verificare se la percentuale media di impurità è maggiore del 5% − il che renderebbe i fili inutilizzabili − e quindi confrontare l’ipotesi nulla con l’ipotesi alternativa 5µ > . Le ipotesi da sottoporre a test sono

0 : 5H µ = verso 1 : 5H µ > .

Sotto l’ipotesi nulla la statistica test, costituita dalla media campionaria standardizzata, ha una distribuzione ( )0,1N . Poiché il livello di significatività è 0.10α = , occorre determinare il valore 0.10z tale che Z assuma valori maggiori con probabilità 0.10, ovvero tale che ( )0.10 1 0.10 0.90zΦ = − = . Dalle tavole risulta 0.10 1.28z = ; pertanto la

regione di accettazione è costituita dall’insieme dei valori della statistica test che non superano 1.28. Si ha

R.A. : 0 1.28/

xnµ

σ−

≤ ,

Page 325: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 311

R.C. : 0 1.28/

xnµ

σ−

> ,

dove 0 5µ = .

R.A. R.C.

0.10

0

Di conseguenza, sostituendo i valori di 0µ , σ e n, si ottiene la regola di decisione

0

0

5 1.28 ,1.2 / 18

5 1.28 .1.2 / 18

xse H non è respinta

xse H è respinta

− ≤ ⇒ − > ⇒

Dato che 5.4x = , il valore osservato della statistica test risulta

0 5.4 5 1.414/ 1.2 / 18n

xtnµ

σ− −

= = = .

Esso si trova nella regione critica. Al livello di significatività del 10%, l’ipotesi nulla che il produttore affermi il vero − ossia che la percentuale di impurità nei fili di rame sia il 5% − è respinta e pertanto non si procede all’acquisto.

0

/x

σ−

( )zϕ

z 1.28

Figura 15.6 Regione di accettazione e regione critica nell’esempio 15.2.

Page 326: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 312

Si osservi che l’esito del test non dipende soltanto dal valore assunto dalla statistica test – ossia dal campione osservato – ma dipende anche dal livello di significatività. Diversi livelli di significatività possono condurre a decisioni diverse. Nel test delle ipotesi vi è un elemento di arbitrarietà in quanto il ricercatore, modificando il livello di significatività, può influenzare l’esito del test.

Esempio 15.2 (continuazione). In precedenza è stata sottoposta a

test l’affermazione del produttore di fili di rame al livello di significatività del 10%. Se il livello di significatività fosse stato pari al 5%, l’esito del test sarebbe stato diverso.

Per 0.05α = il valore critico risulta 0.05 1.645z = , sicché la regola di decisione diventa

0

0

5 1.645 ,1.2 / 18

5 1.645 .1.2 / 18

xse H non è respinta

xse H è respinta

− ≤ ⇒ − > ⇒

Con la nuova regola di decisione, determinata in corrispondenza di un livello di significatività del 5%, il valore osservato della statistica test, pari a 1.414, si trova nella regione di accettazione e pertanto l’ipotesi nulla non è respinta. Se il test fosse stato eseguito al livello di significatività del 5%, l’affermazione del produttore non sarebbe stata confutata e l’acquisto avrebbe avuto luogo.

Quando l’ipotesi nulla è un’ipotesi composita, del tipo 0 0:H µ µ≤ , e si confrontano le due ipotesi unidirezionali

0 0:H µ µ≤ verso 1 0:H µ µ> ,

la regola di decisione rimane inalterata. Continua a essere naturale respingere l’ipotesi nulla per valori elevati di X e quindi della statistica test. Tuttavia, quando l’ipotesi nulla è composita, il livello di significatività α diventa la massima probabilità di commettere l’errore

Page 327: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 313

di I tipo. Infatti, se il valore della media sotto l’ipotesi nulla è esattamente 0µ , la probabilità dell’errore di I tipo coincide con α . Se invece il valore della media è minore di 0µ , risulta meno probabile che la statistica test assuma valori nella regione critica e quindi la probabilità di respingere l’ipotesi nulla, sulla base della regola di decisione definita, è minore di α . In sintesi la regola di decisione assicura che la probabilità dell’errore di I tipo sia al massimo uguale al livello di significatività α . Si supponga ora di avere una popolazione normale

( )2,X N µ σ∼ , con varianza nota, e di voler sottoporre a test un’ipotesi nulla del tipo

0 0:H µ µ= oppure 0 0:H µ µ≥ ,

verso un’ipotesi alternativa unidirezionale

1 0:H µ µ< .

In questo caso è naturale ritenere l’ipotesi nulla meno verosimile quando la media campionaria X assume valori molto più piccoli di

0µ . Di conseguenza, utilizzando come statistica test la media campionaria standardizzata, la regione critica è individuata in un sottoinsieme dei valori di nT minori di un valore critico.

Tale valore critico deve essere tale che la probabilità che la statistica test appartenga alla regione critica, ovvero la media standardizzata assuma valori minori, quando 0µ µ= , sia uguale al livello di significatività α . Poiché la distribuzione della statistica test è normale e quindi simmetrica, il valore critico, che garantisce che nella coda di sinistra della funzione di densità di una variabile casuale normale standardizzata vi sia un’area pari ad α , è zα− ,

( )00/

XP z P Z zn α αµ µ µ α

σ −

< − = = < − =

.

Page 328: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 314

Di conseguenza, la regione di accettazione e la regione critica risultano

R.A. : 0

/x z

n αµ

σ−

≥ − ,

R.C. : 0

/x z

n αµ

σ−

< − .

R .C . R .A .

α

0

La regola di decisione è

00

00

,/

./

xse z H non è respintan

xse z H è respintan

α

α

µσ

µσ

− ≥ − ⇒ − < − ⇒

Esempio 15.3. Un’azienda produce gomma. Per verificare la

qualità del prodotto si espone la gomma a un processo di abrasione costante per un tempo prefissato e si misura la perdita di peso in grammi per ora. Nel passato è stato riscontrato che la perdita di peso della gomma causata dall’abrasione ha una distribuzione normale con media 175.4 grammi per ora e scarto quadratico medio 88.1. Avendo modificato la durezza del prodotto, si estrae un campione di 25 pezzi di gomma di nuova produzione ottenendo una media campionaria pari a

Figura 15.7 Regione di accettazione e regione critica nel test unidirezionale sulla media di una variabile casuale normale con varianza nota

0

/x

σ−

( )zϕ

z zα−

Page 329: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 315

163.8. Assumendo che la varianza sia rimasta invariata, mediante il test si vuole verificare se vi è stata una riduzione nella perdita di peso media dovuta all’abrasione. Si sceglie il livello di significatività del 5%,

La popolazione è descritta da una variabile casuale normale ( )2, 88.1X N µ∼ che rappresenta la perdita di peso dovuta

all’abrasione. L’ipotesi nulla (vera fino a prova contraria) afferma che la variazione nella durezza della gomma è inefficace nel ridurre la perdita di peso media dovuta all’abrasione, sicché 175.4µ ≥ . Mediante il test si vuole verificare se vi sia evidenza a sufficienza per respingere l’ipotesi nulla e sostenere che la modificazione della durezza ha comportato un miglioramento nel prodotto, sicché 175.4µ < . Le ipotesi da sottoporre a test sono

0 : 175.4H µ ≥ verso 1 : 175.4H µ < .

Il livello di significatività del test è 0.05; pertanto il valore critico 0.05z− , tale che la statistica test assuma valori minori con probabilità

0.05, risulta −1.645. La regione di accettazione e la regione critica risultano

R.A. : 0 1.645/

xnµ

σ−

≥ − ,

R.C. : 0 1.645/

xnµ

σ−

< − ,

dove 0 175.4µ = . Sostituendo i valori di 0µ , σ e n, si ottiene la regola di decisione

0

0

175.4 1.645 ,88.1/ 25

175.4 1.645 .88.1/ 25

xse H non è respinta

xse H è respinta

− ≥ − ⇒ − < − ⇒

Page 330: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 316

R.C. R.A.

0.05

0

Dato che 163.8x = , il valore osservato della statistica test è

0 163.8 175.4 0.658/ 88.1/ 25

xnµ

σ− −

= = − .

Esso si trova nella regione di accettazione; pertanto, al livello di significatività del 5%, non vi è evidenza a sufficienza per sostenere che la variazione nella durezza della gomma abbia ridotto la perdita di peso media conseguente all’abrasione.

15.6 Test unidirezionale sulla media di una popolazione normale con varianza incognita

Si consideri una popolazione normale ( )2,X N µ σ∼ e si supponga di voler confrontare due ipotesi unidirezionali

0 0:H µ µ≤ verso 1 0:H µ µ> .

Se la varianza della popolazione non è nota, non è possibile utilizzare come statistica test la media campionaria standardizzata.

Figura 15.8 Regione di accettazione e regione critica nell’esempio 15.3.

0

/x

σ−

( )zϕ

z 1.645−

Page 331: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 317

Tuttavia, quando 0µ µ= , la media campionaria studentizzata, ottenuta utilizzando 0µ come valore di µ , ha una distribuzione nota. Infatti si ha

00

1ˆ /n nXT t

n

µ µµσ

=

−−

= ∼ ,

dove 2σ è lo stimatore non distorto della varianza. Se 0µ µ= , la statistica nT si distribuisce come una variabile casuale t di Student con

1n − gradi di libertà (paragrafo 10.5) e può quindi essere utilizzata come statistica test. Poiché i valori del parametro assunti nell’ipotesi alternativa si trovano a destra dei valori del parametro sotto l’ipotesi nulla, la regione critica è individuata nei valori di nT maggiori di un valore critico e quindi in un sottoinsieme che si trova nella parte destra dell’insieme dei valori assunti da nT . Se α è il livello di significatività fissato per il test, occorre determinare il valore critico 1,nt α− tale che la probabilità che nT sia maggiore di 1,nt α− , quando 0µ µ= , sia pari ad α , cioè

( ) ( )1, 0 1, 0 1 1,| .ˆ /

on n n n n

XP T t P t P t tnα α αµµ µ µ µ α

σ− − − −

−> = = > = = > =

Dato che per 0µ µ= si ha 1n nT t −∼ , 1,nt α− è determinato sulle tavole della t di Student in modo che una variabile casuale 1nt − sia maggiore di 1,nt α− con probabilità α . La regione di accettazione e la regione critica sono

R.A. : 01,ˆ / n

x tn αµ

σ −−

≤ ,

R.C. : 01,ˆ / n

x tn αµ

σ −−

> .

Page 332: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 318

R .A . R .C .

α

0

Esempio 15.4. Un medico vuole verificare l’efficacia della terapia familiare nel trattamento dell’anoressia. A tal fine sottopone un campione di 17 ragazze anoressiche alla terapia familiare e, dopo un tempo prefissato, misura la variazione di peso. La variazione percentuale del peso ha una distribuzione normale. Nel campione la variazione percentuale media di peso è risultata 8.8 con uno scarto quadratico medio pari a 9.1. Si vuole verificare se la terapia familiare è efficace. L’ipotesi nulla, ritenuta vera fino a prova contraria, assume che la terapia familiare è inefficace. E’ invece obiettivo del medico dimostrare che la terapia familiare induce un incremento ponderale. Per il test si sceglie il livello di significatività del 5%.

Sia ( )2,X N µ σ∼ la variabile casuale che descrive l’incremento ponderale percentuale delle ragazze sottoposte a terapia. Le ipotesi da sottoporre a test sono

0 : 0H µ = verso 1 : 0H µ > .

Poiché il campione ha numerosità 17n = , la statistica test sotto l’ipotesi nulla ha una distribuzione t di Student con 16 gradi di libertà. Dato il livello di significatività 0.05α = , per determinare la regola di decisione occorre individuare il valore critico 16,0.05t tale che una

Figura 15.9 Regione di accettazione e regione critica nel test unidirezionale sulla media di una variabile casuale normale.

0

ˆ /x

σ−

( )1nf t −

1nt −

1,nt α−

Page 333: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 319

variabile casuale 16t assuma valori maggiori con probabilità 0.05. Dalle tavole risulta 16,0.05 1.746t = . Pertanto la regione di accettazione e la regione critica risultano

R.A. : 0 1.746ˆ /x

σ−

≤ ,

R.C. : 0 1.746ˆ /x

σ−

> ,

dove 0 0µ = .

R.A. R.C.

0.05

0

Il valore osservato della statistica test risulta

0 8.8 0 3.987ˆ / 9.1/ 17x

σ− −

= =

e si trova nella regione critica. Si può quindi concludere, al livello di significatività del 5%, che la terapia familiare è efficace nel trattamento dell’anoressia.

Quando le ipotesi da sottoporre a test sono

0 0:H µ µ≥ verso 1 0:H µ µ<

Figura 15.10 Regione di accettazione e regione critica nell’esempio 15.4

0

ˆ /x

σ−

( )16f t

16t

1.746

Page 334: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 320

e pertanto l’ipotesi alternativa si trova a sinistra dell’ipotesi nulla, la regione critica è individuata a sinistra nell’insieme dei valori assunti dalla statistica test. Il valore critico deve essere tale che la probabilità che la statistica test assuma valori minori, quando µ = 0µ , sia uguale al livello di significatività α . Poiché la distribuzione della statistica test − la t di Student con 1n − gradi di libertà − è simmetrica, il valore critico che garantisce che nella coda di sinistra vi sia un’area pari ad α è

1,nt α−− ,

( )01, 0 1 1,ˆ / n n n

XP t P t tn α αµ µ µ α

σ − − −

−< − = = < − =

.

Di conseguenza la regione di accettazione e la regione critica sono

R.A. : 01,ˆ / n

x tn αµ

σ −−

≥ − ,

R.C. : 01,ˆ / n

x tn αµ

σ −−

< − .

R .C . R .A .

α

0

Esempio 15.5. Un esperto in ricerche di mercato sostiene che la

spesa media mensile in cosmetici delle donne, che hanno un’età compresa fra 20 e 40 anni e che abitano in una grande città, è almeno

Figura 15.11 Regione di accettazione e regione critica nel test unidirezionale sulla media di una variabile casuale normale

0

ˆ /x

σ−

( )1nf t −

1nt −

1,nt α−−

Page 335: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 321

40 euro. Si assume che la spesa abbia una distribuzione normale. In un campione casuale di 25 osservazioni, la media risulta 38.2 e lo scarto quadratico medio risulta 5.4. Si vuole verificare, al livello di significatività del 10%, se l’esperto afferma il vero.

Sia ( )2,X N µ σ∼ la variabile casuale che descrive la spesa mensile in cosmetici. Le ipotesi da sottoporre a test sono

0 : 40H µ ≥ verso 1 : 40H µ < .

Per 40µ = , la statistica test ha una distribuzione t di Student con 24 gradi di libertà. Di conseguenza il valore critico è 24,0.10 1.318t− = − , sicché la regione di accettazione e la regione critica risultano

R.A. : 0 1.318ˆ /x

σ−

≥ − ,

R.C. : 0 1.318ˆ /x

σ−

< − .

R.C. R.A.

0.10

0

Il valore osservato della statistica test è

0 38.2 40 1.667ˆ / 5.4 / 25x

σ− −

= = − .

Figura 15.12 Regione di accettazione e regione critica nell’esempio 15.5.

0

ˆ /x

σ−

( )24f t

24t1.318−

Page 336: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 322

Essa assume valore nella regione critica e quindi l’ipotesi nulla è respinta. Al livello di significatività del 10%, vi è evidenza a sufficienza per confutare l’affermazione dell’esperto. 15.7 Test bidirezionale sulla media di una popolazione normale

Si consideri una popolazione normale descritta dalla variabile

casuale ( )2,X N µ σ∼ e si supponga di voler verificare un’ipotesi nulla semplice sulla media rispetto a un’ipotesi alternativa bidirezionale

0 0:H µ µ= verso 1 0:H µ µ≠ .

Un’ipotesi alternativa bidirezionale si assume quando non si hanno informazioni sufficienti per ritenere che una deviazione del valore della media, rispetto a quello assunto dall’ipotesi nulla, debba verificarsi necessariamente in una particolare direzione.

In questo caso l’ipotesi nulla appare poco verosimile quando X assume valori distanti da 0µ . Di conseguenza, utilizzando come statistica test la media campionaria studentizzata, è ragionevole collocare la regione di accettazione in un intorno dello zero, al quale corrispondono valori di X vicini a 0µ . La regione critica pertanto è costituita dai valori della statistica test molto piccoli o molto grandi che si trovano quindi nelle code.

Per un dato livello di significatività α , la regione critica si costruisce in modo tale che la probabilità che la statistica test assuma valori in ciascuna delle due code, quando 0H è vera, sia pari ad / 2α . Poiché la statistica test ha una distribuzione t di Student con 1n − gradi di libertà, occorre determinare il valore 1, / 2nt α− tale che le probabilità con le quali una variabile casuale 1nt − assume valori inferiori a 1, / 2nt α−− o superiori a 1, / 2nt α− siano entrambe uguali ad / 2α , cioè

( ) ( )1 1, / 2 1 1, / 2 / 2n n n nP t t P t tα α α− − − −< − = > = .

Page 337: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 323

La regione di accettazione è quindi costituita da

R.A. : 0 01, / 2 1, / 2 1, / 2ˆ ˆ/ /n n n

x xt t tn nα α αµ µ

σ σ− − −− −

− ≤ ≤ ⇔ ≤

e la regione critica è

R.C. :

01, / 2

01, / 2

01, / 2

ˆ /ˆ /

ˆ /

n

n

n

x txn t

x ntn

α

α

α

µµσ

µ σσ

− < − − ⇔ > − >

.

R .A . R .C .R .C .

α /2 α /20

La regola di decisione è

01, / 2 0

01, / 2 0

,ˆ /

.ˆ /

n

n

xse t H non è respintan

xse t H è respintan

α

α

µσ

µσ

−≤ ⇒

− > ⇒

Esempio 15.6. Un produttore di macchine per l’erogazione di

bibite analcoliche afferma che, in media, la quantità di liquido erogato è 250 millilitri. Si assume che la distribuzione della quantità di liquido

Figura 15.13 Regione di accettazione e regione critica nel test bidirezionale sulla media di una variabile casuale normale.

0

ˆ /x

σ−

( )1nf t −

1nt −

1, / 2nt α− 1, / 2nt α−−

Page 338: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 324

sia normale. In un campione di 12 bibite, la quantità media di liquido risulta 265 millilitri e lo scarto quadratico medio è 32. Si vuole sottoporre a test, al livello di significatività del 5%, l’affermazione del produttore.

Sia ( )2,X N µ σ∼ la variabile casuale che descrive la quantità di liquido erogato. Le ipotesi da sottoporre a test sono

0 : 250H µ = verso 1 : 250H µ ≠ .

La statistica test ha una distribuzione t di Student con 11 gradi di libertà. Dato il livello di significatività 0.05α = , occorre determinare il percentile 11,0.025t tale che una variabile casuale 11t sia maggiore di

11,0.025t con probabilità / 2 0.025α = ,

( ) ( )11 11,0.025 11 11,0.025 0.025P t t P t t< − = > = .

Dalle tavole risulta 11,0.025 2.201t = . Pertanto la regione di accettazione e la regione critica sono

R.A. : 0 2.201,ˆ /x

σ−

R.C. : 0 2.201,ˆ /x

σ−

>

dove 0 250.µ = Il valore osservato della statistica test è

0 265 250 1.624ˆ / 32 / 12x

σ− −

= =

e si trova nella regione di accettazione, sicché l’ipotesi nulla non è respinta. Al livello di significatività del 5%, non vi è evidenza a sufficienza per confutare l’affermazione del produttore.

Page 339: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 325

R.A. R.C.R.C.

0.025 0.0252.201-2.201 0

15.8 Test sulla media di una popolazione in assenza di normalità

Si supponga che la popolazione sia descritta da una variabile casuale X con valore atteso µ e varianza 2σ , per la quale non si può assumere una distribuzione normale. Si vuole sottoporre a test un’ipotesi nulla semplice

0 0:H µ µ= ,

oppure un’ipotesi nulla composita unidirezionale come

0 0:H µ µ≤ o 0 0:H µ µ≥ .

Se la popolazione non è normale, non è di regola possibile individuare una statistica test con una distribuzione nota, quando

0µ µ= , per qualsiasi numerosità campionaria n. Tuttavia è possibile individuare una statistica test con una distribuzione nota asintoticamente. Infatti, se 0µ µ= , per il teorema del limite centrale (paragrafi 11.2.1 e 13.3) la media campionaria standardizzata, ( ) ( )0 /X nµ σ− , ha una distribuzione asintotica normale. La distribuzione asintotica non cambia se σ è sostituito da σ , dove 2σ è

Figura 15.14 Regione di accettazione e regione critica nell’esempio 15.6.

0

ˆ /x

σ−

( )11f t

11t

Page 340: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 326

uno stimatore consistente di 2σ . Di conseguenza, per n sufficientemente grande e 0µ µ= , si ha

( )0

ˆ /XP a b P a Z b

σ −

≤ ≤ ≤ ≤

,

dove Z è una variabile casuale normale standardizzata. Il test delle ipotesi può essere eseguito con un approccio simile a

quello considerato per popolazioni normali, a condizione che n sia sufficientemente elevato e utilizzando i valori critici determinati sulla base della distribuzione normale.

Per verificare il sistema di ipotesi

0 0:H µ µ= verso 1 0:H µ µ> ,

oppure il sistema di ipotesi

0 0:H µ µ≤ verso 1 0:H µ µ> ,

la regione critica e la regione di accettazione sono

R.A. : 0

ˆ /x z

n αµ

σ−

≤ ,

R.C. : 0

ˆ /x z

n αµ

σ−

> ,

dove zα è tale che ( )P Z zα α> = . Il livello di significatività effettivo del test, per n finito, può

risultare diverso da quello nominale α , ma la differenza fra livello di significatività effettivo e nominale diventa trascurabile al crescere di n.

Per verificare il sistema di ipotesi

0 0:H µ µ= verso 1 0:H µ µ< ,

oppure il sistema di ipotesi

0 0:H µ µ≥ verso 1 0:H µ µ< ,

la regione di accettazione e la regione critica sono

Page 341: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 327

R.A. : 0

ˆ /x z

n αµ

σ−

≥ − ,

R.C. : 0

ˆ /x z

n αµ

σ−

< − .

Infine nel caso di un sistema di ipotesi bidirezionale,

0 0:H µ µ= verso 1 0:H µ µ≠ , si ha

R.C. : 0/ 2ˆ /

x zn αµ

σ−

> ,

R.A. : 0/ 2ˆ /

x zn αµ

σ−

≤ ,

dove / 2zα è tale che ( ) ( )/ 2 / 2 / 2P Z z P Z zα α α< − = > = .

Esempio 15.7. Il direttore di una catena di ristoranti sostiene che il tempo medio di attesa, prima che i clienti siano serviti, non supera 15 minuti. In un campione di 200 clienti, il tempo medio è risultato 16.5 minuti con uno scarto quadratico medio pari a 6.2. Si vuole verificare, al livello di significatività del 5%, se il direttore afferma il vero.

Sia X la variabile casuale che descrive i tempi di attesa e si indichi con µ il suo valore atteso. Le ipotesi da sottoporre a test sono

0 : 15H µ ≤ verso 1 : 15H µ > .

Al livello di significatività del 5% il valore critico 0.05z , tale che ( )0.05 0.05P Z z> = , è 1.645. Di conseguenza la regione di accettazione

e la regione critica sono

R.A. : 0 1.645ˆ /x

σ−

≤ ,

R.C. : 0 1.645ˆ /x

σ−

> .

Page 342: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 328

Il valore osservato della statistica test

0 16.5 15 3.42ˆ / 6.2 / 200x

σ− −

= =

si trova nella regione critica, pertanto vi è evidenza a sufficienza per respingere l’ipotesi nulla. Al livello di significatività del 5%, il tempo medio di attesa risulta maggiore di 15 minuti.

La velocità con la quale l’effettiva probabilità dell’errore di I tipo converge ad α , dipende dalla velocità con la quale, per il teorema limite centrale, la media campionaria standardizzata converge in distribuzione alla variabile casuale normale e quindi dalle caratteristiche della variabile casuale che descrive la popolazione.

Le tabelle 15.2, 15.3 e 15.4 riportano il livello di significatività effettivo3 del test delle ipotesi sulla media quando la popolazione è descritta rispettivamente da una variabile casuale t di Student con 5 gradi di libertà, da una variabile casuale uniforme sull’intervallo ( )0,1 o da una variabile casuale esponenziale negativa con parametro 1=λ . Il livello di significatività nominale è 0.05 e la numerosità campionaria n varia fra 20 e 500. La convergenza della probabilità dell’errore di I tipo al livello di significatività nominale è più lenta quando la variabile casuale che descrive la popolazione ha una distribuzione asimmetrica. Inoltre, in presenza di asimmetria, la probabilità dell’errore di I tipo converge più rapidamente ad α nei test bidirezionali rispetto a quelli unidirezionali.

3 Il livello di significatività effettivo è stato ottenuto mediante simulazione. Per ciascuna variabile casuale e ciascun valore di n, sono stati generati un 1·000·000 di campioni e per ognuno di essi è stato effettuato il test delle ipotesi al livello di significatività nominale α . La frequenza relativa con la quale l’ipotesi nulla è respinta fornisce un’approssimazione del livello di significatività effettivo

Page 343: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 329

Tabella 15.2 – Livello di significatività effettivo nel test sulla media di una variabile casuale t di Student con 5 gradi di libertà. L’ipotesi nulla è 0 : 0H µ = .

n 1 : 0H µ < 1 : 0H µ ≠ 1 : 0H µ > 20 0.0579 0.0620 0.0573 30 0.0551 0.0577 0.0554 50 0.0527 0.0541 0.0530 100 0.0516 0.0521 0.0510 200 0.0507 0.0511 0.0512 500 0.0503 0.0504 0.0503

Tabella 15.3 – Livello di significatività effettivo nel test sulla media di una variabile casuale ( )0,1U . L’ipotesi nulla è 0 : 0.5H µ = .

n 1 : 0.5H µ < 1 : 0.5H µ ≠ 1 : 0.5H µ > 20 0.0577 0.0655 0.0578 30 0.0549 0.0602 0.0556 50 0.0533 0.0562 0.0532 100 0.0513 0.0528 0.0517 200 0.0506 0.0514 0.0504 500 0.0505 0.0506 0.0504

Tabella 15.4 – Livello di significatività effettivo nel test sulla media di una variabile casuale esponenziale negativa con 1λ = . L’ipotesi nulla è 0 : 1H µ = .

n 1 : 1H µ < 1 : 1H µ ≠ 1 : 1H µ > 20 0.1189 0.0951 0.0246 30 0.1043 0.0821 0.0265 50 0.0903 0.0707 0.0288 100 0.0775 0.0611 0.0330 200 0.0681 0.0555 0.0374 500 0.0609 0.0522 0.0412

15.9 Test sulla probabilità di successo di una variabile casuale di Bernoulli

Sia ( )X Ber π∼ la variabile casuale che descrive la popolazione. Un test sul valore della probabilità di successo π potrebbe essere considerato come un caso particolare del test sulla media di una

Page 344: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 330

popolazione non normale. Tuttavia la variabile casuale di Bernoulli presenta una particolarità perché attribuendo un valore a π non si specifica soltanto un’ipotesi sul valore della media ma anche la varianza risulta determinata, infatti ( )( ) 1Var X π π= − . Assumere

0π π= implica quindi

[ ] 0E X π= e ( )0 0( ) 1Var X π π= − .

Pertanto, se l’ipotesi nulla assume 0π π= , il valore atteso e la varianza della proporzione campionaria p risultano

[ ] 0ˆE p π= , ( ) ( )0 01ˆVar p

nπ π−

= .

Si può quindi utilizzare come statistica test

( )0

0 0

ˆ1 /p

π π−

−,

ossia la media campionaria standardizzata per una popolazione di Bernoulli. Per il teorema del limite centrale (paragrafo 13.4), quando

0π π= , la statistica test ha una distribuzione asintoticamente normale. Di conseguenza, per n sufficientemente grande, si ha

( )( )0

0 0

ˆ1 /pP a b P a Z b

π π

− ≤ ≤ ≤ ≤ −

,

dove Z è una variabile casuale normale standardizzata.

Quando si sottopongono a test le ipotesi

0 0:H π π= verso 1 0:H π π> ,

oppure le ipotesi 0 0:H π π≤ verso 1 0:H π π> ,

la regione di accettazione e la regione critica risultano

Page 345: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 331

R.A. : ( )

0

0 0

ˆ1 /p z

ππ π

−≤

−,

R.C. : ( )

0

0 0

ˆ1 /p z

ππ π

−>

−,

dove zα è tale che ( )P Z zα α> = .

R .A . R .C .

α

0

Se invece si sottopongono a test le ipotesi

0 0:H π π= verso 1 0:H π π< ,

oppure le ipotesi

0 0:H π π≥ verso 1 0:H π π< ,

la regione di accettazione e la regione critica sono

R.A. : ( )

0

0 0

ˆ1 /p z

ππ π

−≥ −

−,

R.C. : ( )

0

0 0

ˆ1 /p z

ππ π

−< −

−.

Figura 15.15 Regione di accettazione e regione critica nel test unidirezionale sulla probabilità di successo di una variabile casuale di Bernoulli.

( )0

0 0

ˆ

1 /p

π π−

( )zϕ

z zα

Page 346: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 332

R .C . R .A .

α

0

Quando infine si considera un test bidirezionale

0 0:H π π= verso 1 0:H π π≠ ,

la regione di accettazione e la regione critica sono

R.A. : ( )

0/ 2

0 0

ˆ1 /p z

ππ π

−≤

−,

R.C. : ( )

0/ 2

0 0

ˆ1 /p z

ππ π

−>

−,

dove / 2zα è tale che ( ) ( )/ 2 / 2 / 2P Z z P Z zα α α< − = > = .

R .A . R .C .R .C .

α /2 α /20

Figura 15.16 Regione di accettazione e regione critica nel test unidirezionale sulla probabilità di successo di una variabile casuale di Bernoulli.

( )0

0 0

ˆ

1 /p

π π−

( )zϕ

z zα−

Figura 15.17 Regione di accettazione e regione critica nel test bidirezionale sulla probabilità di successo di una variabile casuale di Bernoulli.

( )0

0 0

ˆ

1 /p

π π−

( )zϕ

z

/ 2zα / 2zα−

Page 347: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 333

Esempio 15.8. Un produttore ha assemblato una partita di valvole di sicurezza tarate per aprirsi a cinque atmosfere. Egli assicura che la proporzione di valvole difettose − che si aprono a una pressione leggermente superiore − non supera il 5%. Prima di accettare la partita, un acquirente estrae un campione di 100 valvole delle quali 9 risultano difettose. Si vuole verificare, al livello di significatività del 1%, l’affermazione del produttore.

Sia ( )X Ber π∼ la variabile casuale che descrive la popolazione delle valvole di sicurezza; X assume valore 1 se una valvola è difettosa. Le ipotesi da sottoporre a test sono

0 : 0.05H π ≤ verso 1 : 0.05H π > .

Poiché 0.01α = , il valore critico 0.01z risulta pari a 2.33, sicché la regione di accettazione e la regione critica risultano

R.A. : ( )

0

0 0

ˆ2.33

1 /p

π π−

≤−

,

R.C. : ( )

0

0 0

ˆ2.33

1 /p

π π−

>−

.

La proporzione campionaria è ˆ 9 /100 0.09p = = e il valore osservato della statistica test è

( )0

0 0

ˆ 0.09 0.05 1.840.05(1 0.05) /1001 /

pn

ππ π

− −= =

−−.

Il valore 1.84 si trova nella regione di accettazione; quindi, al livello di significatività dell’1%, non vi è motivo di dubitare che il produttore affermi il vero.

Esempio 15.9. Il direttore di un’emittente televisiva locale afferma che almeno il 30% delle famiglie, che abitano in città, seguono il telegiornale della sua emittente nelle ore serali. In un campione di 140 famiglie, 35 dichiarano di seguire il telegiornale dell’emittente. Si

Page 348: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 334

vuole verificare, al livello di significatività del 10%, l’affermazione del direttore.

Sia ( )X Ber π∼ la variabile casuale che descrive la popolazione; X assume valore 1 se una famiglia segue il telegiornale dell’emittente. Le ipotesi da sottoporre a test sono

0 : 0.3H π ≥ verso 1 : 0.3H π < .

In corrispondenza del livello di significatività 0.10α = si ha 0.10 1.28z = . Di conseguenza la regione di accettazione e la regione

critica sono

R.A. : ( )

0

0 0

ˆ1.28

1 /p

π π−

> −−

,

R.C. : ( )

0

0 0

ˆ1.28

1 /p

π π−

< −−

.

Dato che la proporzione campionaria è ˆ 35 /140 0.25p = = , il valore osservato della statistica test risulta

( )0

0 0

ˆ 0.25 0.30 1.290.30(1 0.30) /1401 /

pn

ππ π

− −= = −

−−.

Il valore –1.29 appartiene alla regione critica, pertanto l’ipotesi nulla è respinta. Al livello di significatività del 10%, vi è evidenza a sufficienza per ritenere che il direttore sovrastimi l’audience della sua emittente.

Esempio 15.10. Un esperto in ricerche di mercato sostiene che l’80% dei consumatori, che acquistano detersivi, preferiscono un prodotto economico rispetto a un prodotto di marca. In un campione di 228 consumatori, 171 affermano di preferire detersivi di minor prezzo. Si vuole sottoporre a test, al livello di significatività del 5%, l’affermazione dell’esperto.

Page 349: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 335

Sia ( )X Ber π∼ la variabile casuale che descrive la popolazione; X assume valore 1 se un consumatore preferisce un detersivo economico rispetto a uno di marca. Poiché non vi sono informazioni per ritenere che, quando π non coincide con 0.80, esso debba essere maggiore oppure minore, il test è bidirezionale. Le ipotesi da sottoporre a test sono

0 : 0.8H π = verso 1 : 0.8H π ≠ .

Il valore 0.025 1.96z = garantisce che il livello di significatività del test sia 0.05α = . Di conseguenza si ha

R.A. : ( )

0

0 0

ˆ1.96

1 /p

π π−

≤−

,

R.C. : ( )

0

0 0

ˆ1.96

1 /p

π π−

>−

.

La proporzione campionaria è ˆ 171/ 228 0.75p = = e il valore osservato della statistica test è

0

0 0

ˆ 0.75 0.80 1.89(1 ) / 0.80(1 0.80) / 228p

π π− −

= = −− −

.

La statistica test assume valore nella regione di accettazione e quindi l’ipotesi nulla non è respinta al livello di significatività del 5%. Non vi è evidenza a sufficienza per confutare l’affermazione dell’esperto.

Le tabelle 15.5, 15.6 e 15.7 riportano il livello di significatività effettivo4 del test delle ipotesi sulla probabilità di successo di una variabile casuale di Bernoulli quando il valore del parametro π è rispettivamente 0.1, 0.3 e 0.5. La numerosità campionaria varia fra 50 e 1000 e il livello di significatività nominale è 05.0=α . La convergenza 4 Il livello di significatività effettivo è stato calcolato mediante simulazione su un 1·000·000 di campioni.

Page 350: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 336

della probabilità effettiva dell’errore di I tipo ad α è più lenta per valori di π prossimi a zero (oppure a 1).

Tabella 15.5 – Livello di significatività effettivo nel test sulla probabilità di

successo di una variabile casuale di Bernoulli con 0.1π = . L’ipotesi nulla è 0 : 0.1H π = .

n 1 : 0.1H π < 1 : 0.1H π ≠ 1 : 0.1H π > 50 0.0338 0.0297 0.0577 100 0.0576 0.0640 0.0730 200 0.0564 0.0437 0.0670 500 0.0393 0.0440 0.0464 1000 0.0481 0.0509 0.0534 Tabella 15.6 – Livello di significatività effettivo nel test sulla probabilità di

successo di una variabile casuale di Bernoulli con 0.3π = . L’ipotesi nulla è 0 : 0.3H π = .

n 1 : 0.3H π < 1 : 0.3H π ≠ 1 : 0.3H π > 50 0.0402 0.0435 0.0479 100 0.0476 0.0625 0.0531 200 0.0506 0.0535 0.0543 500 0.0523 0.0453 0.0549 1000 0.0513 0.0492 0.0536 Tabella 15.7 – Livello di significatività effettivo nel test sulla probabilità di

successo di una variabile casuale di Bernoulli con 0.5π = . L’ipotesi nulla è 0 : 0.5H π = .

n 1 : 0.5H π < 1 : 0.5H π ≠ 1 : 0.5H π > 50 0.0596 0.0647 0.0595 100 0.0441 0.0568 0.0442 200 0.0517 0.0556 0.0516 500 0.0493 0.0544 0.0492 1000 0.0466 0.0533 0.0466

Page 351: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 337

15.10 Il p-valore

Nelle applicazioni del test delle ipotesi è sempre più diffusa la prassi di verificare qual è la massima probabilità di commettere l’errore di I tipo dopo aver osservato il valore della statistica test, anziché fissare il livello di significatività a priori.

Come osservato nel paragrafo 15.5, modificando il livello di significatività si può cambiare l’esito del test. Riducendo il livello di significatività, si riduce infatti la probabilità di respingere l’ipotesi nulla sia quando è vera sia quando è falsa. Per questo motivo spesso, anziché fissare la probabilità dell’errore di I tipo a priori, si preferisce osservare il p-valore a posteriori.

Si definisce p-valore il minimo livello di significatività per il quale l’ipotesi nulla può essere respinta.

Per calcolare il p-valore si considera il livello di significatività che si ottiene ponendo il valore critico uguale al valore osservato della statistica test. Ad esempio in un test unidirezionale sulla media di una popolazione normale ( )2,X N µ σ∼ , con ipotesi

0 0:H µ µ≤ verso 1 0:H µ µ> ,

il p-valore è dato dalla probabilità che, quando 0µ µ= , la statistica test assuma valori maggiori del valore osservato,

( )0n nP T t µ µ> = .

Esempio 15.2 (continuazione). Nell’esempio 15.2 sul valore

medio della percentuale di impurità nei fili di rame per impieghi elettrotecnici, diversi livelli di significatività conducono a diversi esiti del test. La statistica test è costituita dalla media campionaria standardizzata e assume valore 1.414.

Il p-valore è la probabilità che la statistica test assuma valori a destra di 1.414, quando 0 5µ µ= = . Poiché sotto 0H la media

Page 352: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 338

campionaria standardizzata ha una distribuzione ( )0,1N , il p-valore è dato da

( ) ( )0 1.414 0.05 1.414 1.41 0.0793/

XP P Z P Znµ µ

σ −

> = = > > =

.

Il p-valore 0.0793 è il minimo livello di significatività per il

quale l’ipotesi nulla può essere respinta. Quindi se si sceglie un valore di α maggiore di 0.0793 l’ipotesi nulla è respinta, se invece α è minore di 0.0793 l’ipotesi nulla non è respinta. Infatti, in precedenza è stato osservato che l’ipotesi nulla non si respinge quando il livello di significatività è 0.05 e si respinge quando 0.10.α =

Nei test unidirezionali, se la regione critica si trova a destra

dell’insieme dei valori assunti dalla statistica test nT , il p-valore è dato dalla probabilità che, sotto l’ipotesi nulla, nT assuma valori maggiori del valore osservato nt ,

( )0n nP T t H> .

Quando invece la regione critica si trova a sinistra dell’insieme dei valori assunti da nT , il p-valore è dato dalla probabilità, calcolata sotto

0H , che nT assuma valori minori di nt ,

z

( )zϕ

p-valore

Figura 15.18 p-valore nell’esempio 15.2.

0.0973

1.414

Page 353: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 339

( )0n nP T t H< .

Se infine il test è bidirezionale, il p-valore è dato dalla probabilità che, sotto l’ipotesi nulla, nT risulti maggiore di nt ,

( )0n nP T t H> .

In questo caso il p-valore è dato dalla somma delle aree, nella distribuzione di nT , a sinistra di nt− e a destra di nt .

Esempio 15.5 (continuazione). Nell’esempio 15.5 sulla media di una popolazione normale (che rappresenta la spesa mensile in cosmetici), la statistica test, per 0 40µ µ= = , ha una distribuzione t di Student con 24 gradi di libertà. La regione critica si trova a sinistra dell’insieme dei valori della statistica test. Poiché il suo valore osservato è 1.667− , il p-valore è

( )0241.667 40 1.667

ˆ /XP P t

nµ µ

σ −

< − = = < −

.

Dalle tavole si ha ( )24 1.711 0.05P t < − = e ( )24 1.318 0.10P t < − = . Di conseguenza, essendo il valore osservato 1.667− compreso nell’intervallo ( )1.711, 1.318− − , il p-valore risulta

24t

( )24f t

p-valore

Figura 15.19 p-valore nell’esempio 15.5.

0.054 -1.667

Page 354: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 340

compreso fra 0.05 e 0.10. Ciò significa che l’ipotesi nulla è respinta per qualsiasi livello di significatività maggiore o uguale a 0.10 e non è respinta per livelli di significatività minori di 0.05. Con il software statistico è possibile determinare esattamente il p-valore che risulta ( )24 1.667 0.054P t < − = . La probabilità 0.054 è il più piccolo livello di

significatività per il quale l’ipotesi nulla può essere respinta.

Esempio 15.10 (continuazione). Nell’esempio 15.10 si esegue un test bidirezionale sulla probabilità di successo π di una variabile casuale di Bernoulli (che rappresenta la popolazione dei consumatori che acquistano detersivi). Sotto l’ipotesi nulla, 0.8π = , la statistica test ha una distribuzione approssimativamente normale. Il suo valore osservato è 1.89− , di conseguenza il p-valore è

( )( )0

0 0

ˆ1.89 0.8 1.89 0.059

1 /pP P Z

nπ π

π π

− > = > = −

.

Nell’esempio il livello di significatività è stato fissato al 5% e pertanto l’ipotesi nulla non è stata respinta. Tuttavia se il livello di significatività fosse stato maggiore di 0.059, ad esempio 0.10, l’ipotesi nulla sarebbe stata respinta.

−1.89 1.89

Figura 15.20 p-valore nell’esempio 15.10.

z

( )zϕ

p-valore

Page 355: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 341

15.11 La potenza del test

Sebbene finora sia stata data maggiore attenzione alla probabilità dell’errore di I tipo, è opportuno considerare anche la probabilità dell’errore di II tipo o, alternativamente, la potenza del test. Quest’ultima è la probabilità di respingere l’ipotesi nulla quando è falsa e si indica con γ . Se è vera l’ipotesi alternativa, si possono verificare due eventi: “non si respinge l’ipotesi nulla” o “si respinge l’ipotesi nulla”. Nel primo caso si commette l’errore di II tipo che ha probabilità β . La potenza del test è la probabilità del secondo evento che si verifica quando, essendo vera l’ipotesi alternativa, si respinge l’ipotesi nulla. Pertanto si ha

( )( )

0 1

1

1 |

. . | .n

P respingere H H

P T R C H

γ β= − =

= ∈

A differenza di α e β , la potenza del test esprime la probabilità che si assuma una decisione corretta.

Esempio 15.1 (continuazione). Nell’esempio 15.1 si verificano

due ipotesi semplici sulla media di una popolazione normale con varianza nota. La regione critica è data dai valori della media campionaria X minori di 197. La potenza del test è la probabilità che la media campionaria assuma valori nella regione critica quando è vera

1H ( )1197 | : 195P X Hγ µ= < = .

Essa è data dal complemento a 1 della probabilità dell’errore di secondo tipo, sicché

1 1 0.2119 0.7881γ β= − = − = .

Questa è la probabilità di respingere correttamente l’ipotesi nulla quando è falsa.

Page 356: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 342

Quando l’ipotesi alternativa è composita, è possibile calcolare la potenza del test per particolari valori del parametro compresi sotto l’ipotesi alternativa. Si consideri una popolazione normale

( )2,X N µ σ∼ , con varianza nota, sulla quale si vogliono verificare le ipotesi

0 0:H µ µ≤ verso 1 0:H µ µ> ,

sulla base di un campione di numerosità n. E’ possibile calcolare la potenza del test quando la media assume un valore 1µ , dove 1µ > 0µ . Poiché la varianza è nota, si utilizza la media campionaria standardizzata come statistica test e la regione critica è

R.C. : 0

/x z

n αµ

σ−

> .

Ciò significa che l’ipotesi nulla è respinta quando il valore osservato della media campionaria x è maggiore di 0 /z nαµ σ+ . La regione critica può pertanto essere ridefinita nel modo seguente

R.C. : 0 /x z nαµ σ> + .

La potenza del test, quando la media è 1µ , è data da

( ) ( )1 0 1/P X z nαγ µ µ σ µ µ= > + = .

Esempio 15.11. Un’azienda assicura che il tempo medio di consegna dei prodotti è al massimo 30 giorni. La distribuzione del numero di giorni necessari per le consegne può essere approssimata da una distribuzione normale con scarto quadratico medio 5. Si decide di verificare, sulla base di un campione di 20 osservazioni, l’affermazione dell’azienda verso un’ipotesi alternativa per la quale il tempo medio supera 30 giorni. Il livello di significatività del test è fissato al 5%. Si vuole calcolare la potenza del test quando il numero medio di giorni necessari per la consegna è 32.5.

Page 357: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 343

Sia ( )2,5X N µ∼ la variabile casuale che descrive il numero di giorni necessari per la consegna dei prodotti. Le ipotesi da sottoporre a test sono

0 : 30H µ ≤ verso 1 : 30H µ > .

Al livello di significatività del 5% la regione critica è

R.C. : 0 1.645/

xnµ

σ−

> ,

sicché l’ipotesi nulla è respinta quando 0 1.645 /x nµ σ> + × 30 1.645 5 / 20 31.84= + × = . La regione critica può quindi essere

riscritta nel modo seguente

R.C. : 31.84x > .

La potenza del test, per 32.5µ = , è data da

( )

( )

(32.5) 31.84 32.5

31.84 32.50 32.5/ 5 / 20

0.59 0.7224.

P X

XPn

P Z

γ µ

µ µσ

= > =

− −= > =

= > − =

31.84 32.5

Figura 15.21 Potenza del test nell’esempio 15.11.

0.7224γ =

( )| 32.5f x µ =

x

Page 358: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 344

Se il livello di significatività è ridotto a 1%, la regione critica diventa

R.C. : 0 2.33/

xnµ

σ−

> .

In questo caso l’ipotesi nulla è respinta quando 0 2.33 / 30 2.33 5 / 20 32.61x nµ σ> + × = + × = , quindi si ha

R.C. : 32.61x > .

In corrispondenza del nuovo livello di significatività la potenza del test è

( )( )

32.61 32.50(32.5) 32.61 32.5 32.5/ 5 / 20

0.10 0.4602.

XP X Pn

P Z

µγ µ µσ − −

= > = = > =

= > =

Riducendo il livello di significatività si riduce la potenza del test. Si riduce infatti la probabilità di respingere l’ipotesi nulla sia quando è vera sia quando è falsa.

La potenza del test può essere calcolata per diversi valori di µ compresi sotto l’ipotesi alternativa. La figura 15.22 illustra come varia

( )γ µ , nell’esempio 15.11, per valori della media maggiori di 30, in corrispondenza del livello di significatività del 5%. La potenza del test aumenta quando il valore di µ si allontana da 0µ : quando il vero valore della media è distante da 0µ è più facile rilevare che l’ipotesi nulla è falsa.

Per valori del parametro compresi sotto l’ipotesi alternativa, la potenza del test varia fra il livello di significatività α e 1.

Page 359: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 345

Aumentando la numerosità campionaria è possibile fare in modo che la potenza del test tenda più rapidamente a 1. Aumentando il numero di osservazioni infatti si ha a disposizione una maggiore quantità di informazioni e ciò aumenta la capacità discriminatoria del test. La figura 15.23 illustra la potenza del test, nell’esempio 15.11, per diversi valori di n, quando il livello di significatività è 0.05.

Si supponga che la popolazione sia descritta da una variabile

casuale di Bernoulli, ( )X Ber π∼ , e sulla probabilità di successo siano confrontate le seguenti ipotesi

0 0:H π π= verso 1 0:H π π≠ .

30 31 32 33 34 35 0.0

0.2

0.4

0.6

0.8

1.0

30 31 32 33 34 35 0.0

0.2

0.4

0.6

0.8

1.0

Figura 15.22 Potenza del test per diversi valori di µ nell’esempio 15.11.

γ

µ

Figura 15.23 Potenza del test per diversi valori di n nell’esempio 15.11.

γ

µ

10n =

20n = 50n =

Page 360: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 346

La regione critica è

R.C. : ( )

0/ 2

0 0

ˆ1 /p z

ππ π

−>

−,

sicché l’ipotesi nulla è respinta quando p è maggiore di

( )0 / 2 0 01 /z nαπ π π+ − oppure quando p è minore di

( )0 / 2 0 01 /z nαπ π π− − . La regione critica può quindi essere riscritta nel modo seguente

R.C. :( )( )

0 / 2 0 0

0 / 2 0 0

ˆ 1 / ,

ˆ 1 / .

p z n

p z n

α

α

π π π

π π π

< − −

> + −

La potenza del test, quando la probabilità di successo assume valore 1π , è data da

( ) ( )( )( )( )

1 0 / 2 0 0 1

0 / 2 0 0 1

ˆ 1 /

ˆ 1 / .

P p z n

P p z n

α

α

γ π π π π π π

π π π π π

= < − − =

+ > + − =

Esempio 15.10 (continuazione). Nell’esempio 15.10 si sottopongono a test le seguenti ipotesi sulla probabilità di successo di una variabile casuale di Bernoulli

0 : 0.8H π = verso 1 : 0.8H π ≠ ,

sulla base di un campione di 228 osservazioni. Si vuole calcolare la potenza del test quando 0.7π = .

Al livello di significatività del 5%, la regione critica è

R.C. : ( )

0

0 0

ˆ1.96

1 /p

π π−

>−

.

Page 361: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 347

Sostituendo a 0π il valore 0.8, l’ipotesi nulla risulta respinta quando il valore della proporzione campionaria p è tale che

( )0 / 2 0 0ˆ 1 / 0.8 1.96 0.8 (1 0.8) / 228 0.85p z nαπ π π> + − = + × × − = ,

oppure

( )0 / 2 0 0ˆ 1 / 0.8 1.96 0.8 (1 0.8) / 228 0.75p z nαπ π π< − − = − × × − = .

Di conseguenza la regione critica può essere riscritta nel modo seguente

R.C. :ˆ 0.75,ˆ 0.85.pp<

>

La potenza del test, per 0.7π = , è data da

( ) ( )

( )

( )( ) ( )

ˆ ˆ(0.7) 0.75 0.7 0.85 0.7

ˆ 0.75 0.70 0.70.70 (1 0.70) / 2281 /

ˆ 0.85 0.70 0.70.70 (1 0.70) / 2281 /

1.65 4.94 0.9505.

P p P p

pPn

pPn

P Z P Z

γ π π

π ππ π

π ππ π

= < = + > =

− − = < = × −−

− − + > = × −− < + > =

La figura 15.24 illustra la potenza del test per diversi valori di π . Anche qui la potenza del test aumenta quando il valore della probabilità di successo si allontana da 0 0.8π = .

Page 362: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 348

Per concludere si possono fare alcune osservazioni sulla potenza del test. La potenza varia fra il livello di significatività α e 1 e aumenta quando il valore del parametro si allontana dai valori considerati sotto l’ipotesi nulla. Inoltre, incrementando il livello di significatività, è possibile aumentare la potenza del test. Infine la potenza del test tende tanto più rapidamente a 1 quanto maggiore è la numerosità campionaria n. 15.12 Intervalli di confidenza e test delle ipotesi bidirezionali

Fra intervalli di confidenza e test delle ipotesi bidirezionali esiste un importante legame. Se la statistica test e la quantità pivot hanno la stessa espressione, avendo a disposizione un intervallo di confidenza, è possibile predire l’esito del test. Inoltre un intervallo di confidenza è costituito da tutti i valori del parametro 0ϑ per i quali l’ipotesi nulla

0ϑ ϑ= non è respinta. Si consideri una popolazione normale, rappresentata dalla

variabile casuale ( )2,X N µ σ∼ , e si supponga di voler sottoporre a test le ipotesi

0 0:H µ µ= verso 1 0:H µ µ≠ ,

0.70 0.75 0.80 0.85 0.90 0.0

0.2

0.4

0.6

0.8

1.0Figura 15.24 Potenza del test nell’esempio 15.10.

γ

π

Page 363: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 349

sulla base di un campione di n osservazioni, al livello di significatività α . Utilizzando la media campionaria studentizzata come statistica test, la regione di accettazione è data da

R.A. : 01, / 2ˆ / n

x tn αµ

σ −−

≤ ,

dove 1, / 2nt α− è tale che una variabile casuale 1nt − assuma valori maggiori con probabilità / 2α . La statistica test ha la stessa espressione della quantità pivot utilizzata nella costruzione degli intervalli di confidenza per la media. Pertanto è possibile dimostrare che l’ipotesi nulla non è respinta quando il valore 0µ è compreso nell’intervallo di confidenza per µ costruito sulla base dello stesso campione osservato.

La statistica test infatti assume valore nella regione di accettazione quando

01, / 2 1, / 2ˆ /n n

xt tnα αµ

σ− −−

− ≤ ≤ ,

ovvero

1, / 2 0 1, / 2

1, / 2 0 1, / 2

ˆ ˆ/ / ,

ˆ ˆ/ / ,n n

n n

t n x t n

x t n x t nα α

α α

σ µ σ

σ µ σ− −

− −

− ≤ − ≤

− − ≤ − ≤ − +

e moltiplicando i termini della disuguaglianza per 1− si ottiene

1 2

1, / 2 0 1, / 2ˆ ˆ/ /n n

l l

x t n x t nα ασ µ σ− −− ≤ ≤ + .

La media campionaria studentizzata appartiene alla regione di accettazione e quindi l’ipotesi nulla non è respinta se e solo se 0µ appartiene all’intervallo di confidenza, al livello 1 α− , per µ ,

1 0 2l lµ≤ ≤ .

Ciò consente di predire l’esito del test sulla base della stima per intervallo. E’ chiaro inoltre che l’intervallo di confidenza, al livello

Page 364: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 350

1 α− , è costituito da tutti i valori 0µ per i quali l’ipotesi nulla 0µ µ= non è respinta al livello di significatività α .

Esempio 15.12. Nell’esempio 14.3 si considera la distribuzione

del tempo che intercorre fra il momento nel quale sono segnalati i guasti a una compagnia telefonica e quello nel quale avviene la riparazione. Si assume che i tempi abbiano una distribuzione normale. Si vuole ora sottoporre a test, al livello di significatività del 5%, l’ipotesi nulla che il tempo medio sia pari a 45 minuti, 0 : 45H µ = , verso un’ipotesi alternativa bidirezionale.

Nell’esempio 14.3, sulla base di un campione di 16 osservazioni, è stato calcolato l’intervallo di confidenza per la media al livello del 95%. Esso risulta ( )40.61, 53.39 . Il valore della media 45, specificato sotto l’ipotesi nulla, è compreso nell’intervallo di confidenza. Pertanto è possibile affermare che il test delle ipotesi, realizzato sullo stesso campione osservato, non respinge l’ipotesi nulla.

La relazione fra stima per intervallo ed esito del test delle ipotesi

bidirezionale non sussiste nel caso della probabilità di successo di una variabile casuale di Bernoulli. In tal caso infatti quantità pivot e statistica test hanno espressioni diverse.

15.13 Esercizi

Esercizio 15.1. L’incremento nelle ore di sonno indotte dalla

somministrazione di un sonnifero ha una distribuzione normale con scarto quadratico medio pari a 75 minuti. Si vuole verificare l’efficacia di un nuovo farmaco. A tal fine, si sottopone a test l’ipotesi nulla che non vi sia variazione nelle ore di sonno − il nuovo farmaco è inefficace − verso un’ipotesi alternativa che vi sia un incremento medio nelle ore di sonno pari a 120 minuti. Si definisce la seguente regola di decisione: l’ipotesi nulla è respinta se in un campione di 15 pazienti, l’incremento medio nelle ore di sonno supera 50 minuti.

Page 365: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 351

i) Calcolare la probabilità dell’errore di I tipo. ii) Calcolare la probabilità dell’errore di II tipo.

Esercizio 15.2. Il consumo settimanale di gas, in decimetri cubi, per il riscaldamento di un’abitazione ha una distribuzione normale con scarto quadratico medio 35. In precedenza è stato osservato un consumo settimanale medio di gas pari a 140 decimetri cubi. Avendo coibentato le mura dell’appartamento, si ritiene che il consumo settimanale medio di gas sia, ora, 115 decimetri cubi. Per confrontare l’ipotesi nulla, che il consumo medio di gas sia rimasto invariato, con l’ipotesi alternativa, in base alla quale il consumo medio di gas è ridotto, si utilizza la seguente regola di decisione: l’ipotesi nulla è respinta se in un campione di 25 osservazioni la media campionaria è minore di 125 decimetri cubi. i) Calcolare la probabilità dell’errore di I tipo. ii) Calcolare la probabilità dell’errore di II tipo. iii) Quale sarebbe la probabilità dell’errore di I tipo se il valore

critico fosse 128 decimetri cubi? iv) Quale sarebbe la probabilità dell’errore di II tipo se il valore

critico fosse 128 decimetri cubi?

Esercizio 15.3. I rendimenti dei fondi obbligazionari, appartenenti a una particolare categoria morningstar, hanno una distribuzione normale con scarto quadratico medio 2.9. Un esperto del mercato finanziario afferma che i rendimenti di tali titoli sono almeno pari a 4.2. In un campione di 22 fondi, il rendimento medio è pari a 4.05. Sottoporre a test l’affermazione dell’esperto al livello di significatività del 5%.

Esercizio 15.4. Un produttore di cartucce per stampanti a getto di inchiostro afferma che con una cartuccia a colori è possibile stampare almeno 500 pagine. Si assume che la distribuzione del numero di pagine stampate sia approssimativamente normale. In un campione di 14 cartucce, il numero medio di pagine stampate risulta 479.3 con uno scarto quadratico medio pari a 18.7. Sottoporre a test, al livello di significatività del 10%, l’affermazione del produttore.

Page 366: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 352

Esercizio 15.5. Un capo reparto del settore produzione di una grande azienda afferma che il tempo medio di assemblaggio di un prodotto non supera i 15 secondi. Si assume che la distribuzione dei tempi di assemblaggio sia normale. In un campione di 26 osservazioni, il tempo medio risulta 15.8 secondi con uno scarto quadratico medio pari a 1.7 secondi. Sottoporre a test, al livello di significatività del 5%, l’affermazione del capo reparto.

Esercizio 15.6. Un’azienda produce salatini per aperitivo. Sulla confezione è indicato un peso netto pari a 200 grammi. Si assume che il peso netto abbia una distribuzione normale. In un campione di 18 confezioni, il peso netto risulta 197.3 grammi e lo scarto quadratico medio risulta 7.9. Sottoporre a test, al livello di significatività del 5%, l’ipotesi che quanto affermato sulla confezione sia vero verso un’ipotesi alternativa in base alla quale il peso netto medio è inferiore a quanto dichiarato.

Esercizio 15.7. Un produttore di lavastoviglie afferma che il

consumo medio in elettricità, di un ciclo di lavaggio standard, non supera 0.90 kilowatt per ora. Il consumo di elettricità ha una distribuzione normale. In un campione di 12 osservazioni, il consumo medio è risultato 0.98 kilowatt con uno scarto quadratico medio pari a 0.13. Sottoporre a test l’affermazione del produttore al livello di significatività del 5%.

Esercizio 15.8. Per soddisfare gli standard di produzione, il

diametro dei bulloni prodotti da un’azienda deve essere pari a 12 millimetri. Il diametro dei bulloni ha una distribuzione normale. In un campione di 30 bulloni, il diametro medio è risultato pari a 11.97 millimetri con uno scarto quadratico medio pari a 0.06. Sottoporre a test, al livello di significatività dell’1%, l’ipotesi nulla in base alla quale la produzione di bulloni soddisfa gli standard di produzione.

Esercizio 15.9. Il direttore commerciale di una compagnia

telefonica sostiene che i giovani di età compresa fra 15 e 20 anni spendono, in media, 8.75 euro al mese per SMS. La spesa ha una distribuzione normale. In un campione di 28 giovani, la spesa media

Page 367: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 353

risulta 9.11 e lo scarto quadratico medio risulta 1.02 euro. Sottoporre a test, al livello di significatività del 10%, l’affermazione del direttore commerciale.

Esercizio 15.10. Un dirigente di un’azienda che eroga servizi di

pubblica utilità, con uffici dislocati su tutto il territorio nazionale, afferma che almeno il 90% degli uffici aperti al pubblico sono attrezzati per l’accesso delle persone disabili. In un campione di 230 uffici, 202 risultano attrezzati per l’accesso delle persone disabili. Verificare, al livello di significatività del 5%, l’affermazione del dirigente.

Esercizio 15.11. Un’azienda farmaceutica sostiene che un

farmaco provoca effetti collaterali indesiderati in non oltre il 3% dei casi. In un campione di 380 pazienti, cui è stato somministrato il farmaco, 18 pazienti hanno subito effetti collaterali. Verificare, al livello di significatività dell’1%, l’affermazione dell’azienda farmaceutica.

Esercizio 15.12. Il direttore di una tavola calda sostiene che

almeno l’80% dei clienti sono soddisfatti della qualità del cibo. In un questionario somministrato a 500 clienti, 385 si dichiarano soddisfatti. Sottoporre a test, al livello di significatività del 10%, l’affermazione del direttore.

Esercizio 15.13. L’assessore all’edilizia di una provincia afferma

che la percentuale di abitazioni nelle quali l’impianto del gas non è in regola non supera il 15%. In un campione di 280 abitazioni, 64 non hanno l’impianto del gas in regola. Sottoporre a test, al livello di significatività del 5%, l’affermazione dell’assessore.

Esercizio 15.14. In relazione a un referendum si prevede una

percentuale di astensioni dal diritto di voto pari al 18%. In un campione di 680 votanti, 109 dichiarano che non andranno a votare. Verificare, al livello di significatività del 5%, se la previsione è corretta.

Page 368: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 354

Esercizio 15.15. Un docente universitario sostiene che il 65% degli studenti che abbandonano gli studi sono indotti a questa scelta da un eccessivo carico didattico. In un campione di 1400 studenti che hanno abbandonato gli studi, 899 hanno motivato la loro scelta in funzione dell’eccessivo carico didattico. Sottoporre a test, al livello di significatività dell’1%, l’affermazione del docente.

Esercizio 15.16. Sull’etichetta delle bottiglie di un’acqua

minerale si dichiara che il contenuto medio di sodio non supera 90 milligrammi. Il contenuto di sodio ha una distribuzione normale con scarto quadratico medio 6.5. In un campione di 50 litri di acqua minerale, il contenuto medio è risultato 91.7. Determinare il p-valore del test.

Esercizio 15.17. Un’agenzia immobiliare sostiene che il prezzo,

per metro quadrato, delle abitazioni di un particolare quartiere è almeno 3000 euro. Il prezzo ha una distribuzione normale con scarto quadratico medio 97 euro. In un campione di 25 abitazioni, il prezzo medio è risultato 2948 euro. Determinare il p-valore del test.

Esercizio 15.18. Un’azienda produce viti. Per rispettare gli

standard di produzione le viti devono essere lunghe 10 millimetri. E’ noto che la distribuzione delle lunghezze delle viti è normale con scarto quadratico medio 0.15 millimetri. Si vuole sottoporre a test l’ipotesi che gli standard di produzione siano rispettati. In un campione di 35 viti, la lunghezza media risulta 10.03 millimetri. Determinare il p-valore del test.

Esercizio 15.19. Determinare il p-valore nell’esercizio 15.3. Esercizio 15.20. Determinare il p-valore nell’esercizio 15.4. Esercizio 15.21. Determinare il p-valore nell’esercizio 15.5. Esercizio 15.22. Determinare il p-valore nell’esercizio 15.9.

Page 369: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test delle ipotesi 355

Esercizio 15.23. Un centro medico dichiara che il proprio programma di disintossicazione dalla dipendenza dall’alcool ha successo in almeno il 95% dei casi. In un campione di 320 pazienti, il programma risulta efficace su 301 soggetti. Sottoporre a test la dichiarazione del centro medico e determinare il p-valore.

Esercizio 15.24. Determinare il p-valore nell’esercizio 15.10.

Esercizio 15.25. Determinare il p-valore nell’esercizio 15.11.

Esercizio 15.26. Determinare il p-valore nell’esercizio 15.14.

Esercizio 15.27. Un produttore di software afferma che, con un particolare tipo di processore, il proprio software è in grado di svolgere determinate operazioni in 35 centesimi di secondo. La distribuzione del tempo impiegato per effettuare le operazioni ha una distribuzione normale con scarto quadratico medio 2.8 centesimi di secondo. Si vuole sottoporre a test l’affermazione del produttore verso un’ipotesi alternativa secondo la quale, per tali operazioni, sono necessari 38 centesimi di secondo. Il livello di significatività è 5% e la numerosità campionaria è 20. Determinare la potenza del test.

Esercizio 15.28. Determinare la potenza del test nell’esercizio

15.1. Esercizio 15.29. Determinare la potenza del test nell’esercizio

15.2 quando i) il valore critico è 125, ii) il valore critico è 128.

Esercizio 15.30. Un produttore di sementi afferma che almeno il

90% dei semi germoglia. Si sottopone a test l’affermazione del produttore al livello di significatività dell’1%. i) Determinare la potenza del test quando l’ipotesi alternativa

afferma che la percentuale di semi che germogliano è l’85% e la numerosità campionaria è 220.

Page 370: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 356

ii) Come varierebbe la potenza del test se l’ipotesi alternativa assumesse che la percentuale di semi che germogliano è l’80%? Esercizio 15.31. Determinare la potenza del test nell’esercizio

15.13, assumendo un’ipotesi alternativa in base alla quale il 18% delle abitazioni non hanno l’impianto del gas in regola.

Esercizio 15.32. Nell’esercizio 14.1 si chiede di costruire un

intervallo di confidenza per il contenuto di sapone liquido nelle confezioni da 250 millilitri prodotte da un’azienda. Utilizzando i risultati dell’esercizio, prevedere qual è l’esito del test che sottopone a verifica, al livello di significatività del 10%, l’ipotesi nulla che il contenuto medio delle confezioni di sapone liquido è 250 millilitri.

Esercizio 15.33. Nell’esercizio 14.2 si chiede di costruire un intervallo di confidenza per il fatturato mensile dei punti vendita di una catena di negozi di abbigliamento. Utilizzando i risultati dell’esercizio, prevedere qual è l’esito del test che sottopone a verifica, al livello di significatività del 5%, l’ipotesi nulla che il fatturato mensile medio è 37 mila euro.

Page 371: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test chi-quadrato

16.1 Introduzione

In molte circostanze è utile verificare se fra due fenomeni esiste una relazione di dipendenza perché, in tal caso, il loro studio non può prescindere dal considerare i legami esistenti ed è correttamente eseguito soltanto se si analizzano i due fenomeni congiuntamente. Se la valutazione di un insegnamento da parte di uno studente dipende dal suo interesse per la disciplina, è opportuno tenerne conto quando si interpretano i risultati conseguiti dal docente nella valutazione della didattica. A parità di altre caratteristiche, il prezzo per metro quadrato di un appartamento può dipendere dalla sua collocazione nei diversi quartieri della città. Nello studio delle cause che possono determinare una particolare patologia, occorre verificare se vi è dipendenza con la quantità di grassi assunti nell’alimentazione, con l’abitudine al fumo, con la residenza in zone con diverso livello di inquinamento atmosferico, con condizioni di vita particolarmente stressanti e così via. Se con uno di tali caratteri vi è dipendenza, esso va considerato come un possibile fattore di rischio.

Viceversa avere consapevolezza che due fenomeni sono indipendenti evita implicazioni errate e agevola notevolmente lo studio, consentendo l’utilizzo delle metodologie di analisi univariata, più semplici di quelle per dati bivariati.

Page 372: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 358

Il presente capitolo introduce un test per verificare l’indipendenza di due fenomeni, applicabile sia a caratteri qualitativi sia quantitativi. Preliminarmente è introdotto il test chi-quadrato sull’adattamento, del quale il test sull’indipendenza costituisce un caso particolare.

16.2 Test chi-quadrato sull’adattamento

Il test sull’adattamento consente di verificare se un modello teorico è adeguato a rappresentare un fenomeno di interesse per il quale è stata osservata la distribuzione di frequenza.

Si consideri un esperimento che possa dar luogo a k eventi: 1 2, , , kA A A… . Tali eventi possono rappresentare le modalità di un

carattere qualitativo, i valori di una variabile casuale discreta o le classi di una variabile casuale continua. A ciascun evento iA è associata una probabilità ( )iP A , per 1, 2, ,i k= … . Si supponga di aver osservato, in n replicazioni dell’esperimento, le frequenze 1 2, , , kn n n… con le quali si sono verificati gli eventi 1 2, , , kA A A… . L’obiettivo è verificare, sulla base della distribuzione di frequenza osservata, se un modello teorico è idoneo a descrivere l’esperimento.

Un modello teorico consiste in una distribuzione di probabilità

( ) ( ) ( )1 1 2 2, , , k kP A p P A p P A p= = =… ,

dove 0ip ≥ , per 1, 2, ,i k= … , e la somma delle probabilità è pari a 1, 1ip =∑ . L’ipotesi nulla che si vuole sottoporre a test è

( )0 : i iH P A p= , per 1, 2, ,i k= … .

L’ipotesi alternativa, sottointesa, assume che la distribuzione di probabilità 1 2, , , kp p p… non è adeguata a rappresentare il fenomeno.

Per sottoporre a test l’ipotesi nulla si confrontano le frequenze osservate 1 2, , , kn n n… con le frequenze teoriche, ossia quelle attese

Page 373: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test chi-quadrato 359

sotto 0H . Se l’ipotesi nulla è vera la frequenza attesa dell’evento iA , in un campione di n osservazioni, è inp . Di conseguenza le frequenze teoriche sono

(16.1) 1 1 2 2ˆ ˆ ˆ, , , k kn np n np n np= = =… .

Il test si esegue confrontando le frequenze teoriche con le frequenze osservate. Quanto più grande è la distanza fra in e ˆin , tanto meno verosimile risulta l’ipotesi nulla. Se invece frequenze teoriche e frequenze osservate non si discostano di molto, l’ipotesi nulla appare plausibile.

Per verificare l’ipotesi nulla si utilizza la statistica test

(16.2) ( )2

1

ˆˆ

ki i

i i

n nQ

n=

−=∑ .

La distribuzione della statistica test, sotto 0H , è nota asintoticamente: al divergere di n, Q si distribuisce come una variabile casuale chi-quadrato (paragrafo 10.4) con 1k − gradi di libertà.

Il valore della statistica test aumenta all’aumentare del quadrato degli scarti ( )ˆi in n− , sicché esso è tanto più elevato quanto maggiore è lo scostamento fra frequenze teoriche e frequenze osservate. E’ ragionevole quindi individuare la regione di accettazione per valori piccoli di Q . Quanto più piccolo è il suo valore osservato, infatti, tanto più plausibile appare l’ipotesi nulla.

Di conseguenza, per n sufficientemente elevato, la regione di accettazione e la regione critica, al livello di significatività α , sono

R.A. : 21,kQ αχ −≤ ,

R.C. : 21,kQ αχ −> ,

dove il valore critico 21,k αχ − è tale che una variabile casuale chi-

quadrato con 1k − gradi di libertà assuma valori maggiori con probabilità α .

Page 374: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 360

Figura 16.1 Regione di accettazione e regione critica nel test sull’adattamento

R.A. R.C.

α

Esempio 16.1. Un’azienda dolciaria produce wafer in tre diversi

gusti: “vaniglia”, “cacao” e “nocciola”. E’ stata svolta un’indagine per verificare le preferenze dei consumatori chiedendo loro quale gusto preferiscono. La distribuzione di frequenza osservata è riportata nella tabella 16.1. Si vuole sottoporre a test, al livello di significatività del 5%, l’ipotesi nulla che per i consumatori il gusto dei wafer sia indifferente.

Tabella 16.1 – Distribuzione di frequenza osservata delle preferenze dei

consumatori. Gusto Vaniglia Cacao Nocciola Frequenza 38 89 74

Il fenomeno di interesse è di tipo qualitativo e assume 3k =

modalità: “vaniglia”, “cacao” e “nocciola”. L’ipotesi nulla assume che i consumatori siano indifferenti rispetto al gusto dei wafer e pertanto le tre modalità hanno la stessa probabilità di verificarsi. Indicando con 1A l’evento “il consumatore preferisce i wafer alla vaniglia”, con 2A l’evento “il consumatore preferisce i wafer al cacao” e con 3A l’evento “il consumatore preferisce i wafer alla nocciola”, l’ipotesi nulla risulta

21,k αχ −

( )21kf χ −

21kχ −

( )2

1

ˆˆ

ki i

i i

n nQ

n=

−=∑

Page 375: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test chi-quadrato 361

( )01:3iH P A = , per 1, 2,3i = .

Poiché 3k = , la statistica test si distribuisce asintoticamente come una variabile casuale chi-quadrato con 1 2k − = gradi di libertà. Dalle tavole si ottiene il valore critico tale che una variabile casuale 2

2χ assume valori maggiori con probabilità 0.05α = ; esso è 2

2,0.05 5.99χ = . Di conseguenza la regione di accettazione e la regione critica risultano

R.A. : 5.99Q ≤ , R.C. : 5.99Q > .

Figura 16.2 Regione di accettazione e regione critica nell’esempio 16.1

R.A. R.C.

L’indagine è stata condotta su un campione di 201n = consumatori, pertanto applicando la (16.1) si ottengono le frequenze teoriche

1 2 31 1 1ˆ ˆ ˆ201 67, 201 67, 201 673 3 3

n n n= × = = × = = × = .

Applicando la (16.2) si ottiene il valore osservato della statistica test

( ) ( ) ( )2 2 238 67 89 67 74 6720.51

67 67 67Q

− − −= + + = .

5.99

( )22f χ

22χ

( )23

1

ˆˆ

i i

i i

n nQ

n=

−= ∑

0.05

Page 376: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 362

Esso si trova nella regione critica e pertanto, al livello di significatività del 5%, l’ipotesi nulla è respinta: i consumatori non sono indifferenti rispetto al gusto dei wafer.

16.3 Test chi-quadrato sull’indipendenza

Si supponga che, in relazione a un esperimento, si possano osservare due insiemi di eventi 1 2, , , kA A A… e 1 2, , , hB B B… che rappresentano le modalità assunte da due caratteri di interesse. Come nel test sull’adattamento, gli eventi possono rappresentare le modalità di un carattere qualitativo, i valori di una variabile casuale discreta o le classi di una variabile casuale continua. In corrispondenza di ogni unità statistica si osserva una coppia ( ),i jA B . Agli eventi 1 2, , , kA A A… e

1 2, , , hB B B… è associata una distribuzione di probabilità congiunta (paragrafo 6.10)

( )i jP A B∩ , per 1, 2, ,i k= … e per 1, 2, ,j h= … .

L’obiettivo è verificare se i due fenomeni sono indipendenti, ossia sottoporre a test l’ipotesi nulla

( ) ( ) ( )0 : i j i jH P A B P A P B∩ = , per qualunque i e j ,

dove ( )iP A è la probabilità marginale di iA e ( )jP B è la probabilità marginale di jB . L’ipotesi alternativa, sottointesa, assume che fra i due fenomeni esista dipendenza.

Per sottoporre a test l’ipotesi di indipendenza si estrae un campione di n unità statistiche sulle quali sono rilevate le modalità di entrambi i caratteri. Il campione osservato è rappresentato mediante una tabella di contingenza (paragrafo 2.7), nella quale si rilevano le frequenze congiunte ijn con le quali è stata osservata ciascuna coppia

Page 377: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test chi-quadrato 363

( ),i jA B , nonché le frequenze marginali in . e jn. con le quali sono osservate rispettivamente le modalità iA e jB .

Tabella 16.2 – Tabella di contingenza.

B A 1B 2B hB Totale

1A 11n 12n 1hn 1n . 2A 21n 22n 2hn 2n .

kA 1kn 2kn khn kn . Totale 1n. 2n. hn. n

L’ipotesi nulla definisce un modello teorico per le probabilità

congiunte, del quale è necessario verificare l’adattamento. Di conseguenza il test si esegue confrontando la distribuzione di frequenza osservata (riportata nella tabella di contingenza) con la distribuzione delle frequenze teoriche attese sotto 0H .

Data una distribuzione di probabilità congiunta, la frequenza attesa della coppia ( ),i jA B , in un campione di numerosità n, è

( )i jnP A B∩ . Poiché, sotto l’ipotesi di indipendenza, le probabilità congiunte sono date dal prodotto delle probabilità marginali, se ( )iP A e ( )jP B fossero note la frequenza attesa della coppia ( ),i jA B sarebbe

( ) ( )i jnP A P B . Poiché le probabilità marginali non sono note, è necessario

stimarle per poter costruire le frequenze teoriche. Per stimare ciascuna delle probabilità marginali ( )iP A , associate al primo carattere, si può considerare una popolazione di Bernoulli nella quale si verifica un successo quando il risultato dell’esperimento è la modalità iA e si verifica un insuccesso altrimenti. Tale popolazione ha probabilità di successo ( )iP A . Di conseguenza ( )iP A può essere stimata mediante la proporzione di modalità iA che si sono verificate nel campione. Quest’ultima è data dalla frequenza relativa . /in n . Analogamente la

Page 378: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 364

probabilità ( )jP B , associata alla modalità jB del secondo fenomeno, è stimata mediante la frequenza relativa . /jn n . Si ottengono così le stime

( ) .ˆ ii

nP An

= , ( ) .ˆ jj

nP B

n= ,

per 1, 2, ,i k= … e per 1, 2, ,j h= … . Le frequenze teoriche sotto l’ipotesi di indipendenza sono

( ) ( ) ..ˆ ˆˆ jiij i j

nnn nP A P B nn n

= =

e semplificando si ottiene

(16.3) . .

ˆ i jij

n nn

n= .

Adattando la (16.2) si ottiene la statistica test

(16.4) ( )2

1 1

ˆˆ

k hij ij

i j ij

n nQ

n= =

−=∑∑

mediante la quale confrontare le frequenze osservate con quelle teoriche. Sotto l’ipotesi nulla, la statistica test Q si distribuisce asintoticamente come una variabile casuale chi-quadrato con ( )( )1 1k h− − gradi di libertà.

Di conseguenza, per n sufficientemente elevato, la regione di accettazione e la regione critica, al livello di significatività α , sono

R.A. : 2( 1)( 1),k hQ αχ − −≤ ,

R.C. : 2( 1)( 1),k hQ αχ − −> ,

dove il valore critico 2( 1)( 1),k h αχ − − è tale che una variabile casuale chi-

quadrato con ( )( )1 1k h− − gradi di libertà assume valori maggiori con probabilità α .

Page 379: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test chi-quadrato 365

Figura 16.3 Regione di accettazione e regione critica nel test sull’indipendenza

R.A. R.C.

α

Esempio 16.2. Una compagnia telefonica propone ai suoi abbonati tre diversi contratti. Il primo, “Telefono e internet”, consente di telefonare e utilizzare internet senza limiti pagando un canone mensile di 85 euro; il secondo, “Telefono”, che comporta un canone mensile di 41 euro, consente di telefonare senza limitazioni mentre la connessione a internet si paga in funzione del tempo di navigazione; infine il terzo, “Internet”, a un canone mensile di 67 euro, consente di navigare in internet senza limitazioni mentre le telefonate sono pagate in base al tempo di conversazione. E’ stata svolta un’indagine campionaria su 200 abbonati per verificare se la scelta del tipo di contratto dipende dalla professione del capo famiglia, considerando le modalità “imprenditore, libero professionista e dirigente”, “impiegato” e “altro”. I risultati sono riportati nella tabella di contingenza 16.3.

Si vuole sottoporre a test l’ipotesi nulla di indipendenza fra il tipo di abbonamento e la professione del capo famiglia al livello di significatività del 5%.

2( 1)( 1),k h αχ − −

( )2( 1)( 1)k hf χ − −

2( 1)( 1)k hχ − −

( )2

1 1

ˆˆ

k hij ij

i j ij

n nQ

n= =

−=∑∑

Page 380: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 366

Tabella 16.3 − Distribuzione di frequenza osservata del tipo di contratto telefonico e della professione del capo famiglia.

Tipo di contratto Professione Telefono ed

internet Telefono Internet Totale

Imprenditore, libero professionista, dirigente 39 26 25 90

Impiegato 21 38 19 78

Altro 8 20 4 32

Totale 68 84 48 200

Entrambi i caratteri sono qualitativi e assumono tre modalità,

sicché 3k = e 3h = . Di conseguenza la distribuzione della statistica test può essere approssimata da quella di una variabile casuale chi-quadrato con ( ) ( )3 1 3 1 4− × − = gradi di libertà. Dalle tavole si ottiene il valore critico 2

4,0.05 9.49χ = , tale che una variabile casuale 24χ assume

valori maggiori con probabilità 0.05α = . La regione di accettazione e la regione critica risultano

R.A. : 9.49Q ≤ ,

R.C. : 9.49Q > .

Figura 16.4 Regione di accettazione e regione critica nell’esempio 16.2

R.A. R.C.

9.49

( )24f χ

24χ

( )23 3

1 1

ˆ

ˆij ij

i j ij

n nQ

n= =

−= ∑∑

0.05

Page 381: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test chi-quadrato 367

Le frequenze teoriche sotto l’ipotesi di indipendenza, calcolate mediante la (16.3), sono riportate nella tabella 16.4.

Tabella 16.4 − Distribuzione di frequenza teorica del tipo di contratto

telefonico e della professione del capo famiglia sotto l’ipotesi di indipendenza. Tipo di contratto

Professione Telefono e internet Telefono Internet Totale

Imprenditore, lib. professionista, dirigente

90 68 30.60200×

= 90 84 37.80200×

= 90 48 21.60200×

= 90

Impiegato 78 68 26.52

200×

= 78 84 32.76200×

= 78 48 18.72200×

= 78

Altro 32 68 10.88

200×

= 32 84 13.44200×

= 32 48 7.68200×

= 32

Totale 68 84 48 200

Applicando la (16.4) si ottiene il valore osservato della statistica

test

( ) ( ) ( )

( ) ( ) ( )

( ) ( ) ( )

2 2 2

2 2 2

2 2 2

39 30.60 26 37.80 25 21.6030.60 37.80 21.60

21 26.52 38 32.76 19 18.7226.52 32.76 18.72

8 10.88 20 13.44 4 7.6814.24.

10.88 13.44 7.68

Q− − −

= + +

− − −+ + +

− − −+ + + =

La statistica test assume valore nella regione critica e pertanto l’ipotesi nulla di indipendenza è respinta. Al livello di significatività del 5%, si può concludere che fra tipo di contratto telefonico e professione del capo famiglia esiste dipendenza.

Page 382: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 368

Una formula, alternativa alla (16.4), per determinare il valore osservato della statistica test, evitando il calcolo delle frequenze teoriche, è la seguente

(16.5) 2

1 11

. .

k hij

i j i j

nQ n

n n= =

= −

∑∑ .

La dimostrazione è in appendice.

Esempio 16.3. Il responsabile di un sito web è interessato a verificare se vi è dipendenza fra l’orario nel quale il sito è visitato e il tempo di navigazione all’interno del sito. Egli ha osservato la distribuzione di frequenza congiunta della fascia oraria nella quale avviene la visita e del tempo di connessione. Per la fascia oraria ha considerato tre modalità: “mattina” dalle 9:00 alle 13:00, “pomeriggio” dalle 13:00 alle 18:00 e “sera e notte” dalle 18:00 alle 9:00 del giorno successivo. Il tempo di navigazione è un carattere continuo ed è stato suddiviso in quattro classi: meno di un minuto, da un minuto a cinque minuti, da cinque a dieci minuti e oltre 10 minuti. La distribuzione di frequenza osservata è riportata nella tabella 16.5. Si vuole sottoporre a test l’ipotesi di indipendenza fra fascia oraria e tempo di connessione al sito web.

Tabella 16.5 − Distribuzione di frequenza osservata del tempo di visita di un

sito web, in minuti, e della fascia oraria nella quale avviene la connessione. Tempo di connessione in minuti Fascia oraria

0 |- 1 1 |- 5 5 |- 10 Oltre 10 Totale Mattina 94 34 27 8 163 Pomeriggio 63 25 15 13 116 Sera e notte 32 19 25 18 94 Totale 189 78 67 39 373

Applicando la (16.5) si ottiene il valore osservato della statistica

test

Page 383: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test chi-quadrato 369

2 2 2 2

2 2 2 2

2 2 2 2

94 34 27 8373163 189 163 78 163 67 163 39

63 25 15 13116 189 116 78 116 67 116 39

32 19 25 18 1 24.42.94 189 94 78 94 67 94 39

Q

= × + + + × × × ×

+ + + +× × × ×

+ + + + − =× × × ×

Non essendo specificato alcun livello di significatività, si procede determinando il p-valore del test. Il primo carattere, la fascia oraria, ha tre modalità sicché 3k = . Il tempo di navigazione invece è stato suddiviso in quattro classi e pertanto 4h = . Di conseguenza la distribuzione della statistica test può essere approssimata da quella di una variabile casuale chi-quadrato con ( ) ( )3 1 4 1 6− × − = gradi di libertà. Dalle tavole risulta che la probabilità che una variabile casuale

26χ assuma valori maggiori di 18.55 è 0.005; pertanto il p-valore è

minore di 0.005. Utilizzando un software statistico il p-valore risulta 0.00044. L’ipotesi nulla di indipendenza fra fascia oraria di connessione e tempo di navigazione sul sito internet può essere respinta per qualsiasi livello di significatività non inferiore a 0.00044.

Figura 16.5 P-valore nell’esempio 16.3

R.A. R.C.

24..42

( )26f χ

26χ

( )23 4

1 1

ˆ

ˆij ij

i j ij

n nQ

n= =

−= ∑∑

p-value= 0.000440.

Page 384: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 370

16.4 Test sull’indipendenza nelle tabelle di contingenza 2×2

Coppie di fenomeni, ciascuno dei quali ha due sole modalità, sono particolarmente ricorrenti nell’analisi dei fenomeni reali. Un consumatore può aver visto o non aver visto la pubblicità di un prodotto e può acquistare o non acquistare il prodotto. Uno studente può aver seguito, o no, un corso e può superare o non superare il relativo esame. Un paziente può essere esposto, o no, a un fattore di rischio e può essere affetto o non essere affetto da una particolare patologia.

Quando i fenomeni hanno due sole modalità, esse possono essere rappresentate come un evento e la sua negazione. Così, nell’esempio del consumatore, si può assumere che si verifica l’evento A se egli ha visto la pubblicità e l’evento A altrimenti e si verifica l’evento B se acquista il prodotto e l’evento B altrimenti. La distribuzione di probabilità congiunta per questi fenomeni è rappresentata nella tabella 16.6.

Tabella 16.6 − Distribuzione di probabilità congiunta di fenomeni con due sole

modalità. B B

A ( )P A B∩ ( )P A B∩ ( )P A

A ( )P A B∩ ( )P A B∩ ( )P A

( )P B ( )P B 1

L’ipotesi nulla di indipendenza che si sottopone a test è

( ) ( ) ( )0 :H P A B P A P B∩ = .

Infatti, se A e B sono indipendenti, lo sono anche A e B , A e B, A e B (paragrafo 6.7). E’ prassi indicare le frequenze osservate come avviene nella tabella 16.7, dove con ovvia notazione a è la frequenza osservata di A B∩ , b è la frequenza osservata di A B∩ , c è la frequenza osservata di A B∩ e infine d è quella di A B∩ .

Page 385: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test chi-quadrato 371

Tabella 16.7 − Tabella di contingenza 2×2. B B

A a b a b+ A c d c d+ a c+ b d+ 1

Nel caso di una tabella di contingenza 2×2, la statistica test Q si distribuisce asintoticamente come una variabile casuale chi-quadrato con un grado di libertà. Inoltre essa può essere agevolmente calcolata mediante la formula

(16.6) ( )( )( )( )( )

2n ad bcQ

a b c d a c b d−

=+ + + +

.

Esempio 16.4. La tabella 16.8 riporta la distribuzione di frequenza osservata in uno studio sulla dipendenza fra l’assunzione di caffeina e i disturbi alle coronarie eseguita su 1718 uomini in età compresa fra 40 e 55 anni (fonte: O. Paul, 1968, Stimulants and coronaries, Postgraduate Medicine, 44). Si vuole verificare, al livello di significatività del 10%, se vi è dipendenza fra assunzione di caffeina e disturbi alle coronarie.

Tabella 16.8 − Distribuzione di frequenza osservata del numero di tazze di

caffè bevute in un mese e della presenza o assenza di disturbi alle coronarie. Numero di tazze di caffè bevute in un mese Disturbi alle

coronarie Meno di 100 tazze 100 tazze e oltre Totale Assenti 889 752 1641 Presenti 39 38 77 Totale 928 790 1718

Il livello di significatività è 0.10α = e dalle tavole si ottiene il valore critico 2

1,0.10 2.71χ = , tale che una variabile casuale chi-quadrato con un grado di libertà risulti maggiore con probabilità 0.10. Pertanto la regola di decisione è

Page 386: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 372

R.A. : 2.71Q ≤ ,

R.C. : 2.71Q > .

Figura 16.6 Regione di accettazione e regione critica nell’esempio 16.4

R.A. R.C.

Applicando la (16.6) si ottiene il valore osservato della statistica

test ( )

( )( )( )( )

21718 889 38 752 390.368

889 752 39 38 889 39 752 38Q

× − ×= =

+ + + +.

Esso è minore del valore critico, sicché l’ipotesi nulla non è respinta. Al livello di significatività del 5%, assunzione di caffeina e disturbi alle coronarie risultano indipendenti. 16.5 Esercizi

Esercizio 16.1 Un ricercatore ha messo a punto una terapia farmacologia per il trattamento di una malattia. La terapia è stata

2.71

( )21f χ

21χ

( )( )( )( )( )

2n ad bcQ

a b c d a c b d−

=+ + + +

0.10

Page 387: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test chi-quadrato 373

sperimentata su 138 pazienti osservando la loro reazione. In alcuni casi vi è stato “un miglioramento”, in altri la condizione del paziente è rimasta “stazionaria” e nei rimanenti casi si è avuta una “progressione” della malattia. Le frequenze osservate sono riportate nella tabella 16.9. Sottoporre a test, al livello di significatività del 10%, l’ipotesi nulla che la terapia è inefficace e pertanto le tre modalità di reazione sono equiprobabili.

Tabella 16.9 – Distribuzione di frequenza osservata delle reazioni dei pazienti a

una terapia. Reazione Miglioramento Stazionaria Progressione Frequenza 77 21 40

Esercizio 16.2. In seguito a un esperimento genetico, nel quale sono stati effettuati degli incroci di piante di pomodori con diverse caratteristiche, un ricercatore si aspetta di ottenere “piante alte con foglie appuntite” con probabilità 9/16, “piante alte con foglie rotonde” e “piante nane con foglie appuntite” con probabilità 3/16 e infine “piante nane con foglie rotonde” con probabilità 1/16. Il risultato dell’esperimento è riassunto nella tabella 16.10. Sottoporre a test, al livello di significatività del 5%, l’ipotesi nulla che la distribuzione di probabilità dei diversi tipi di piante di pomodoro sia quella formulata dal ricercatore (dati riportati da MacArthur, J. W., 1931, Linkage studies with the tomato, Transactions of the Royal Canadian Institute).

Tabella 16.10 – Distribuzione di frequenza osservata di diversi tipi di piante di

pomodoro ottenuti in seguito a un esperimento genetico. Tipo di pianta

Alta con foglie appuntite

Alta con foglie rotonde

Nana con foglie appuntite

Nana con foglie rotonde

Frequenza 926 288 293 104 Esercizio 16.3. In una facoltà è attivato sia il corso di laurea in

Economia sia quello in Statistica. Per studiare la condizione occupazionale dei laureati, a un anno dal conseguimento del titolo, si effettua un’indagine ottenendo i risultati riportati nella tabella 16.11. Sottoporre a test, al livello di significatività del 5%, l’ipotesi nulla di indipendenza fra tipo di laurea e condizione occupazionale.

Page 388: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 374

Tabella 16.11 − Distribuzione di frequenza osservata del tipo di laurea e della condizione occupazionale.

Condizione occupazionale

Laurea Lavora stabilmente

Lavora con contratto di formazione

Lavora occasionalmente Non lavora

Economia 15 6 19 28 Statistica 7 4 6 5

Esercizio 16.4. Per verificare la durata di tre diversi tipi di

pneumatici è stata condotta una prova su 560 autovetture. La distribuzione osservata del tipo di pneumatico e del numero di chilometri percorsi è riportata nella tabella 16.12. Sottoporre a test, al livello di significatività del 10%, l’ipotesi nulla che il tipo di pneumatico e il numero di chilometri percorsi siano indipendenti.

Tabella 16.12 − Distribuzione di frequenza osservata del tipo di pneumatico e

del numero di chilometri percorsi. Migliaia di chilometri percorsi Tipo di pneumatico

0 -| 20 20 -| 40 40 -| 60 A 29 110 151 B 3 44 83 C 1 35 104

Esercizio 16.5. Una società finanziaria offre tre diverse polizze

sanitarie. La più economica copre soltanto le spese dei ricoveri finalizzati a interventi chirurgici; la seconda copre le spese di tutti i ricoveri, anche senza interventi chirurgici; l’ultima copre anche le spese mediche che non comportano un ricovero. E’ stata svolta un’indagine per verificare se vi è dipendenza fra la condizione professionale, lavoratore autonomo o lavoratore dipendente, e il tipo di polizza sanitaria scelto. La distribuzione di frequenza osservata è riportata nella tabella 16.13. Sottoporre a test l’ipotesi nulla che la condizione professionale e il tipo di polizza preferito siano indipendenti e determinare il p-valore del test.

Page 389: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test chi-quadrato 375

Tabella 16.13 − Distribuzione di frequenza osservata della condizione professionale e del tipo di polizza sanitaria preferito

Polizza sanitaria Condizione professionale Soltanto interventi

chirurgici Tutti i ricoveri Tutte le spese mediche

Autonomo 160 120 55 Dipendente 80 45 40

Esercizio 16.6. Un docente è convinto che, tendenzialmente, gli

studenti più preparati − che conseguono voti più elevati − sostengano l’esame nel primo appello utile dopo la fine del corso. La tabella 16.14 riporta la distribuzione di frequenza osservata dei voti, suddivisi in classi, ottenuti da 290 studenti che hanno conseguito l’esame di Statistica e il momento nel quale l’esame è stato sostenuto: nell’appello di fine corso o negli appelli successivi. Si vuole verificare se il voto è indipendente dall’appello, al livello di significatività dell’ 1%.

Tabella 16.14 − Distribuzione di frequenza osservata dell’appello nel quale

l’esame è superato e del voto conseguito. Voto Appello

18-22 23-27 28-30 Fine corso 30 71 76 Successivi 40 50 23

Esercizio 16.7. E’ stata svolta un’indagine per verificare se vi è

dipendenza fra la scelta di acquistare un computer da scrivania oppure portatile e l’utilizzo del computer per finalità professionali o non professionali. I risultati sono riportati nella tabella 16.15. Sottoporre a test, al livello di significatività del 5%, l’ipotesi nulla di indipendenza fra tipo di computer preferito e finalità di utilizzo.

Tabella 16.15 − Distribuzione di frequenza osservata del tipo di computer

acquistato e della finalità di utilizzo. Finalità Computer

Professionali Non professionali Da scrivania 67 51 Portatile 88 28

Page 390: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 376

Esercizio 16.8. Una trasmissione televisiva su temi di attualità politica, che ha luogo in prima serata, è condotta da un giornalista che dichiara apertamente le sue idee politiche. Si vuole verificare se vi è dipendenza fra le idee politiche dei telespettatori e la scelta se seguire la trasmissione. A tal fine è stato estratto un campione di telespettatori, che in prima serata stavano guardando la televisione, e sono stati posti loro i due quesiti seguenti: “ha seguito il programma?” e “condivide le idee politiche del conduttore del programma?”. Entrambi i quesiti prevedono come possibile risposta “si” o “no”. I risultati dell’indagine sono riportati nella tabella 16.16. Sottoporre a test, al livello di significatività del 10%, l’ipotesi nulla di indipendenza fra le idee politiche dei telespettatori e la scelta se seguire o no la trasmissione.

Tabella 16.16 − Distribuzione di frequenza osservata delle risposte

nell’indagine sulle idee politiche dei telespettatori e la scelta se seguire o no la trasmissione

Ha seguito il programma? Condivide le idee politiche del conduttore? Si No Si 146 290 No 97 385 16.6 Appendice: Derivazione della formula (16.5) Sostituendo l’espressione (16.3) delle frequenze teoriche nella (16.4) si ottiene:

( ) ( )2 2

1 1 1 1

. . / . . /. . / . .

k h k hij i j ij i j

i j i ji j i j

n n n n n n n nQ n

n n n n n= = = =

− −= =∑∑ ∑∑ .

Sviluppando il quadrato al numeratore di ogni addendo si ottiene 2 2 2 2

. .

1 1

/ 2 . . /. .

k hij i j ij i j

i j i j

n n n n n n n nQ n

n n= =

+ −= ∑∑

e distribuendo la sommatoria si ha

Page 391: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Test chi-quadrato 377

2

21 1 1 1 1 1

2

1 1 1 1 1 1

. .2

. .

.. 2 .. .

k h k h k hij i j ij

i j i j i ji j

k h k h k hij j iji

i j i j i ji j

n n n nQ n

n n n n

n n nnnn n n n n

= = = = = =

= = = = = =

= + −

= + −

∑∑ ∑∑ ∑∑

∑∑ ∑ ∑ ∑∑

Poiché sia la somma delle frequenze marginali che quella delle frequenze congiunte sono pari ad n si ha

1 1

. 1 . 1k k

ii

i i

n

n nn n= =

= =∑ ∑ , 1 1

. 1 . 1h h

jj

j j

n

nn

n n= =

= =∑ ∑ e 1 1 1 1

1 1k h k h

ijij

i j i j

n

nn

n n= = = =

= =∑∑ ∑∑ .

In tal modo si ottiene la (16.5).

Page 392: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 393: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Correlazione

17.1 Introduzione

Nel capitolo precedente è stato introdotto il test chi-quadrato per verificare l’indipendenza fra due fenomeni di interesse, utile per caratteri sia qualitativi sia quantitativi. In questo capitolo invece si considera una popolazione descritta da una variabile casuale bivariata con l’obiettivo di studiare la dipendenza esistente fra le componenti. Coppie di fenomeni reali rappresentati da variabili casuali bivariate sono molteplici: il tasso di cambio dell’euro rispetto al dollaro statunitense e rispetto allo yen giapponese, il rendimento di due diversi titoli azionari, gli indici dei prezzi all’ingrosso e al dettaglio, il numero di pagine in bianco e nero e a colori stampate al minuto da una stampante, i voti conseguiti dagli studenti in due diverse materie, la cilindrata e il consumo di un’automobile e così via.

In particolare l’attenzione è posta su un legame di tipo lineare fra le variabili casuali che rappresentano la popolazione: l’obiettivo è l’inferenza sul coefficiente di correlazione sulla base di un campione di n osservazioni.

17.2 Analisi grafica Un campione osservato, estratto da una popolazione rappresentata

da una variabile casuale bivariata ( ),X Y , è costituto da n coppie di

Page 394: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 380

valori ( )1 1,x y , ( )2 2,x y , …, ( ),n nx y , dove ix e iy costituiscono i valori assunti dalle variabili casuali X e Y all’i-esima estrazione.

L’intensità della dipendenza lineare fra due variabili casuali è misurata dal coefficiente di correlazione (paragrafi 8.5.4 e 8.5.5)

(17.1) X Y XYXY

X Y X Y

X YE µ µ σρσ σ σ σ

⎡ ⎤⎛ ⎞⎛ ⎞− −= =⎢ ⎥⎜ ⎟⎜ ⎟

⎝ ⎠⎝ ⎠⎣ ⎦,

dove Xµ e Yµ sono i valori attesi delle variabili casuali X e Y, 2Xσ e 2

Yσ sono le varianze e ( )( )XY X YE X Yσ µ µ= − −⎡ ⎤⎣ ⎦ è la covarianza. Il coefficiente XYρ varia nell’intervallo [ ]1, 1− ed è pari a 1, in valore assoluto, nel caso di perfetta dipendenza lineare. Invece 0XYρ = quando vi è assenza di dipendenza lineare, ossia quando le variabili casuali sono incorrelate.

Nello studio della dipendenza lineare fra due variabili casuali può essere opportuno rappresentare le osservazioni campionarie mediante un grafico a dispersione. Quanto più intenso è il legame lineare, ossia quanto più il coefficiente di correlazione XYρ è in valore assoluto prossimo a 1, tanto più le osservazioni appaiono allineate.

Le figure 17.1 e 17.2 illustrano alcuni campioni di 30 osservazioni estratti da popolazioni bivariate con diverso valore del coefficiente di correlazione. In particolare si considerano i valori 1− ,

0.8− , 0.5− , 0, 0.5, 0.8 e 1. Nel caso di perfetta dipendenza lineare, quando 1XYρ = ± , le osservazioni risultano perfettamente allineate. La relazione è positiva quando 0XYρ > e negativa altrimenti. Quando

XYρ si allontana dall’unità la dipendenza lineare diventa via via più debole. La concentrazione delle osservazioni, intorno a una retta, si riduce per 0.8XYρ = ± e diventa ancora più debole per 0.5XYρ = ± . Nel caso limite di assenza di dipendenza lineare, nel quale 0XYρ = , non è possibile percepire alcun allineamento delle osservazioni. E’ opportuno ricordare che l’assenza di dipendenza lineare non esclude che fra le variabili possa sussistere una dipendenza di tipo non lineare.

Page 395: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Correlazione 381

Figura 17.1 – Campioni di 30 osservazioni estratti da popolazioni bivariate con diversi valori del coefficiente di correlazione.

1.0XYρ = −

0.8XYρ = −

ix ix

iy iy

0.5XYρ = −

ix ix

iy iy

ix ix

iy iy 1.0XYρ =

0.8XYρ =

0.5XYρ =

Page 396: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 382

Figura 17.2 – Campioni di 30 osservazioni estratti da popolazioni bivariate con coefficiente di correlazione nullo.

Esempio 17.1. La tabella 17.1 riporta la capacità totale (in litri) e

il prezzo (in euro) di 12 frigocongelatori prodotti da un’azienda di elettrodomestici (fonte: sito web www.mrprice.it, luglio 2003). Le osservazioni sono rappresentate nella figura 17.3 dalla quale si evince un’evidente dipendenza lineare.

Tabella 17.1 − Capacità totale in litri e prezzo in euro di 12 frigocongelatori.

Capacità totale Prezzo Capacità totale Prezzo 230 325 279 564 234 274 308 815 235 412 308 685 235 431 310 556 264 518 326 651 278 460 343 824

0XYρ = 0XYρ =

ix ix

iy iy

Indipendenza Dipendenza non lineare

Page 397: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Correlazione 383

220 240 260 280 300 320 340

300

400

500

600

700

800

17.3 Stima del coefficiente di correlazione

Il coefficiente di correlazione è definito dalla (17.1) come il rapporto fra la covarianza delle variabili casuali X e Y e il prodotto dei rispettivi scarti quadratici medi. Di conseguenza uno stimatore del coefficiente di correlazione può essere ottenuto come rapporto fra la covarianza campionaria e gli stimatori degli scarti quadratici medi.

Dato un campione casuale ( )1 1,X Y , ( )2 2,X Y , …, ( ),n nX Y , uno stimatore di XYσ è la covarianza campionaria

( )( )1

1 n

XY i ii

S X X Y Yn =

= − −∑ ,

dove X e Y sono rispettivamente la media campionaria di X e Y. Utilizzando le varianze del campione,

( )22

1

1 n

X ii

S X Xn =

= −∑ e ( )22

1

1 n

Y ii

S Y Yn =

= −∑ ,

per stimare 2Xσ e 2

Yσ , si ottiene lo stimatore del coefficiente di correlazione

Figura 17.3 Diagramma a dispersione della capacità totale e del prezzo di un campione di 12 frigocongelatori

Capacità totale

Prezzo

Page 398: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 384

( )( )

( ) ( )1

2 2

1 1

1

1 1

n

i iiXY

XY n nX Y

i ii i

X X Y YS nR

S SX X Y Y

n n

=

= =

− −= =

− −

∑ ∑.

Moltiplicando per n il numeratore e il denominatore si ha

( )( )

( ) ( )1

2 2

1 1

n

i ii

XY n n

i ii i

X X Y YR

X X Y Y

=

= =

− −=

− −

∑ ∑.

La quantità al numeratore del coefficiente di correlazione si chiama codevianza, mentre la somma dei quadrati degli scarti di ciascuna variabile dalla media costituisce la devianza. In corrispondenza del campione osservato ( )1 1,x y , ( )2 2,x y , …, ( ),n nx y , la stima del coefficiente di correlazione è

(17.2) ( )( )

( ) ( )1

2 2

1 1

n

i ii

XY n n

i ii i

x x y yr

x x y y

=

= =

− −=

− −

∑ ∑,

dove x e y sono i valori osservati delle medie campionarie di X e Y. Esempio 17.1 (continuazione). Sia X la variabile casuale che

rappresenta la capacità totale (in litri) dei frigocongelatori e Y la variabile casuale che descrive il prezzo (in euro). Sulla base delle osservazioni della tabella 17.1, si vuole stimare il coefficiente di correlazione fra capacità totale e prezzo.

La tabella 17.2 riporta i calcoli per la stima del coefficiente di correlazione. Con ix sono indicate le osservazioni sulla capacità totale e con iy quelle sui prezzi. I valori osservati delle medie campionarie sono 279.2x = e 542.9y = .

Page 399: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Correlazione 385

Tabella 17.2 − Calcoli per la stima del coefficiente di correlazione nell’esempio 17.1.

i ix iy ix x− iy y− ( )2ix x− ( )2

iy y− ( ) ( )i ix x y y− −

1 230 325 -49.2 -217.9 2·420.64 47·480.41 10·720.68 2 234 274 -45.2 -268.9 2·043.04 72·307.21 12·154.28 3 235 412 -44.2 -130.9 1·953.64 17·134.81 5·785.78 4 235 431 -44.2 -111.9 1·953.64 12·521.61 4·945.98 5 264 518 -15.2 -24.9 231.04 620.01 378.48 6 278 460 -1.2 -82.9 1.44 6·872.41 99.48 7 279 564 -0.2 21.1 0.04 445.21 -4.22 8 308 815 28.8 272.1 829.44 74·038.41 7·836.48 9 308 685 28.8 142.1 829.44 20·192.41 4·092.48 10 310 556 30.8 13.1 948.64 171.61 403.48 11 326 651 46.8 108.1 2·190.24 11·685.61 5·059.08 12 343 824 63.8 281.1 4·070.44 79·017.21 17·934.18

Totale 3·350 6·515 17·471.68 342·486.92 69·406.16 Le quantità necessarie per la stima del coefficiente di correlazione

sono la codevianza

( )( )12

1

69 406.16i ii

x x y y ⋅

=

− − =∑

e le devianze

( )12

2 ·

1

17 471.68ii

x x=

− =∑ , ( )12

2 ·

1

342 468.92ii

y y=

− =∑ .

La stima del coefficiente di correlazione risulta

69 406.16 0.89717 471.68 342 468.92

XYr⋅

⋅ ⋅= =

×.

Fra capacità totale e prezzo dei frigocongelatori vi è un’elevata correlazione lineare.

I calcoli per la stima del coefficiente di correlazione possono essere ridotti utilizzando formule abbreviate per il calcolo della codevianza e della devianza. Riguardo alla prima si osservi che

Page 400: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 386

1 1 1

0

( )( ) ( ) ( )n n n

i i i i ii i i

x x y y x x y y x x= = =

=

− − = − − −∑ ∑ ∑ .

Essendo nulla la somma degli scarti delle ix dalla loro media x si ha

1 1 1 1( )( ) ( )

n n n n

i i i i i i ii i i i

ny

x x y y x x y x y x y= = = =

− − = − = −∑ ∑ ∑ ∑ ,

sicché

(17.3) 1 1

( )( )n n

i i i ii i

x x y y x y nx y= =

− − = −∑ ∑ .

La devianza campionaria della X può essere scritta come

2

1 1 1 1

0

2

1 1 1

( ) ( )( ) ( ) ( )

( ) .

n n n n

i i i i i ii i i i

n n n

i i i ii i i

nx

x x x x x x x x x x x x

x x x x x x

= = = =

=

= = =

=

− = − − = − − −

= − = −

∑ ∑ ∑ ∑

∑ ∑ ∑

Pertanto risulta

(17.4.a) 2 2 2

1 1( ) .

n n

i ii i

x x x nx= =

− = −∑ ∑

Analogamente per la devianza campionaria della Y si ha

(17.4.b) 2 2 2

1 1

( ) .n n

i ii i

y y y ny= =

− = −∑ ∑

Sostituendo nella (17.2) la (17.3), la (17.4.a) e la (17.4.b) si ha

(17.5) 1

2 2 2 2

1 1

n

i ii

XY n n

i ii i

x y nx yr

x nx y ny

=

= =

−=

⎛ ⎞⎛ ⎞− −⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠

∑ ∑.

Page 401: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Correlazione 387

Esempio 17.2. La tabella 17.3 riporta, per un campione di 18 automobili, il consumo su percorso misto (in chilometri per litro di carburante) dichiarato dalle case produttrici e il consumo effettivo rilevato mediante cicli di test effettuati dal mensile Quattroruote (dati riportati nel numero 557 di Marzo 2002). Dalla tabella è evidente che consumi dichiarati ed effettivi non coincidono. Le osservazioni sono rappresentate in un diagramma a dispersione nella figura 17.4, dalla quale si evince che la dipendenza lineare, se presente, è moderata. Si vuole stimare il coefficiente di correlazione fra consumi dichiarati ed effettivi.

Tabella 17.3 − Consumi, espressi in chilometri per litro di carburante,

dichiarati dalle case produttrici e rilevati dalla rivista Quattroruote. Marca Modello Dichiarato Quattroruote Audi A2 1.4 TDI Base 22.7 18.5 Fiat Punto 1.9 JTD 5p. HLX 20.4 15.4 Ford Fiesta 1.8 TDdi 3p. Eco 22.2 15.6 Ford Focus 1.8 TDDI 5p. Amb. 20.4 17.0 MCC Smart Smart & Pulse 21.3 17.6 Mercedes A 170 CDI Elegance 20.4 14.0 Opel Corsa 1.7 DTi 5p. Comfort 21.3 18.0 Opel Astra 1.7 DTI SW Club 20.4 18.3 Peugeot 206 1.4 HDi 5p. XT 23.3 16.7 Peugeot 206 2.0 HDi 3p. XR Eco 22.2 15.8 Peugeot 206 2.0 HDi 5p. XT 20.0 16.0 Renault Clio 1.5 dCi 3p. Expressiom 23.3 18.1 Seat Ibiza TDI 130 CV 3p. Sport 20.0 15.0 Seat Toledo 1.9 110 CV Sport 20.0 14.7 Toyota Yaris 1.4 D-4D Sol. 5p. 23.8 18.9 Volkswagen Lupo 1.7 SDI Trendline 22.7 13.8 Volkswagen Polo 1.4 TDi 5p. Confortline 21.7 18.5 Volkswagen Golf 1.9 TDI 110 CV 5p. 20.4 14.7

La tabella 17.4 riporta i calcoli per la stima del coefficiente di

correlazione, fra consumi di carburante dichiarati ed effettivi, utilizzando la (17.5). Con ix sono indicate le osservazioni sui consumi dichiarati e con iy quelle sui consumi effettivi. Si ha

Page 402: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 388

19 20 21 22 23 24

14

15

16

17

18

19

Tabella 17.4 − Calcoli per la stima del coefficiente di correlazione nell’esempio 17.2.

i ix iy 2ix 2

iy i ix y 1 22.7 18.5 515.29 342.25 419.95 2 20.4 15.4 416.16 237.16 314.16 3 22.2 15.6 492.84 243.36 346.32 4 20.4 17.0 416.16 289.00 346.80 5 21.3 17.6 453.69 309.76 374.88 6 20.4 14.0 416.16 196.00 285.60 7 21.3 18.0 453.69 324.00 383.40 8 20.4 18.3 416.16 334.89 373.32 9 23.3 16.7 542.89 278.89 389.11

10 22.2 15.8 492.84 249.64 350.76 11 20.0 16.0 400.00 256.00 320.00 12 23.3 18.1 542.89 327.61 421.73 13 20.0 15.0 400.00 225.00 300.00 14 20.0 14.7 400.00 216.09 294.00 15 23.8 18.9 566.44 357.21 449.82 16 22.7 13.8 515.29 190.44 313.26 17 21.7 18.5 470.89 342.25 401.45 18 20.4 14.7 416.16 216.09 299.88

Totale 386.5 296.6 8⋅327.55 4⋅935.64 6⋅384.44

Figura 17.4 Diagramma a dispersione dei consumi dichiarati ed effettivi di un campione di 18 automobili

Consumi dichiarati

Consumi effettivi

Page 403: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Correlazione 389

18

1

386.5ii

x=

=∑ , 18

1

296.6ii

y=

=∑ ,

sicché le medie campionarie risultano 386.5 /18 21.47x = = e 296.6 /18 16.48y = = . Inoltre dalla tabella 17.4 si ha

182

18327.55i

ix ⋅

=

=∑ , 18

2

14 935.64i

iy ⋅

=

=∑ , 18

16 384.44i i

ix y ⋅

=

=∑ .

La codevianza è

1

6 384.44 18 21.47 16.48 15.58n

i ii

x y nx y ⋅

=

− = − × × =∑ ,

e le devianze sono

2 2 2

1

8327.55 18 21.47 30.25n

ii

x nx ⋅

=

− = − × =∑ ,

2 2 2

1

4 935.64 18 16.48 47.01n

ii

y ny ⋅

=

− = − × =∑ .

Applicando la (17.5) si ottiene la stima del coefficiente di correlazione

15.58 0.41330.25 47.01XYr = =

×.

Esempio 17.3. La figura 17.5 riporta il diagramma a dispersione delle osservazioni rilevate in un appartamento, in 26 settimane consecutive, sulla temperatura esterna in gradi centigradi e sul consumo di gas per riscaldamento in decimetri cubi (i dati sono stati raccolti da D. Whiteside e sono riportati in The Open University, 1984, MDST242 Statistics in Society). Dal grafico si osserva che vi è una correlazione negativa.

Indicando con ix le osservazioni sulla temperatura esterna e con iy quelle sul consumo di gas per riscaldamento, in base ai dati

osservati, si ottiene

Page 404: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 390

0 2 4 6 8 10

80

100

120

140

160

180

200

26

1139.100i

ix

=

=∑ , 26

13 496.285i

iy ⋅

=

=∑ ,

262

1

950.510ii

x=

=∑ , 26

2

1

497 247.408ii

y ⋅

=

=∑ , 26

1

16 408.193i ii

x y ⋅

=

=∑ .

Le medie campionarie osservate sono rispettivamente 5.350x = e 134.473y = . La stima del coefficiente di correlazione risulta

( )( )2 2

16 408.193 26 5.350 134.473 0.972950.510 26 5.350 497 247.408 26 134.473

XYr⋅

− × ×= = −

− × − ×

e conferma l’elevata correlazione negativa percepita nella figura 17.5. 17.4 Stima del coefficiente di correlazione da tabelle di contingenza

Quando le variabili sono discrete e il campione è numeroso, i dati possono essere organizzati (o essere già disponibili) in tabelle di contingenza (paragrafo 2.7). Siano 1 2, , , kx x x… i valori assunti dalla variabile casuale X e siano 1 2, , , hy y y… i valori della variabile casuale

Figura 17.5 Diagramma a dispersione della temperatura esterna e del consumo di gas per riscaldamento in 26 appartamenti

Temperatura

Consumo di gas

Page 405: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Correlazione 391

Y. I risultati campionari possono essere riassunti in una tabella di contingenza come la 17.5, dove le ijn sono le frequenze congiunte con le quali sono osservate le coppie ( ),i jx y e .in e . jn sono le frequenze marginali dei valori ix e jy rispettivamente.

Tabella 17.5 – Tabella di contingenza.

Y X 1y 2y hy Totale

1x 11n 12n 1hn 1n . 2x 21n 22n 2hn 2n .

kx 1kn 2kn khn kn . Totale 1n. 2n. hn. n

Quando è disponibile la distribuzione di frequenza congiunta la

stima del coefficiente di correlazione è data da

(17.6) 1 1

2 2

1 1

. .

k h

i j iji j

XYk h

i i j ji j

x y n nx yr

x n nx y n n y

= =

= =

−=

⎛ ⎞⎛ ⎞− −⎜ ⎟⎜ ⎟⎝ ⎠⎝ ⎠

∑∑

∑ ∑.

Esempio 17.4. Nei questionari sulla valutazione della didattica

sono posti, agli studenti frequentanti, i seguenti quesiti: “il docente espone gli argomenti in modo chiaro?” e “sei globalmente soddisfatto di questo insegnamento?”. Per entrambi i quesiti, le modalità di risposta sono “decisamente no”, “più no che sì”, “più sì che no” e “decisamente sì”. Al tempo della rilevazione, il Comitato Nazionale per la Valutazione del Sistema Universitario attribuiva un punteggio pari a 2 alla risposta “decisamente no”, pari a 5 alla risposta “più no che sì”, pari a 7 alla risposta “più sì che no” e pari a 10 alla risposta “decisamente sì”.

Page 406: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 392

La distribuzione di frequenza congiunta osservata nella somministrazione del questionario agli studenti frequentanti un corso di statistica è riportata nella tabella di contingenza 17.6.

Tabella 17.6 – Distribuzione di frequenza congiunta delle risposte ai quesiti “il

docente espone gli argomenti in modo chiaro?” e “sei globalmente soddisfatto di questo insegnamento?” nell’ambito della valutazione della didattica di un corso di statistica.

Sei globalmente soddisfatto di questo insegnamento? Il docente espone gli argomenti in modo chiaro?” 2 5 7 10 Totale

2 1 2 0 0 3 5 1 5 8 1 15 7 2 2 29 10 43 10 1 0 22 58 81

Totale 5 9 59 69 142

Sia X la variabile casuale che descrive la valutazione degli studenti in risposta al quesito “il docente espone gli argomenti in modo chiaro?”; essa assume i valori 1 2x = , 2 5x = , 3 7x = e 4 10x = . Sia invece Y la variabile casuale che descrive la valutazione degli studenti in risposta al quesito “sei globalmente soddisfatto di questo insegnamento?”; essa assume i valori 1 2y = , 2 5y = , 3 7y = e 4 10y = . Sulla base delle distribuzioni di frequenza marginali si ottiene

4

1

1192i ii

x n ⋅

=

=∑ , 4

1

1158i ii

y n ⋅

=

=∑ , 4

2

1

10 594i ii

x n ⋅

=

=∑ , 4

2

1

10 036i ii

y n ⋅

=

=∑ .

Di conseguenza la valutazione media al primo quesito risulta 8.39x = , mentre per il secondo quesito si ha 8.16y = . Inoltre dalla distribuzione di frequenza congiunta si ha

4 4

1 12 2 1 2 5 2 2 7 0 2 10 0

5 2 1 5 5 5 5 7 8 5 10 17 2 2 7 5 2 7 7 29 7 10 1010 2 1 10 5 0 10 7 22 10 10 58 10 068.

i j iji j

x y n= =

= × × + × × + × × + × ×

+ × × + × × + × × + × ×+ × × + × × + × × + × ×

+ × × + × × + × × + × × =

∑∑

Page 407: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Correlazione 393

Applicando la (17.6) si ottiene la stima del coefficiente di correlazione

( )( )2 2

10 068 142 8.39 8.16 0.5910 594 142 8.39 10 036 142 8.16

XYr⋅

⋅ ⋅

− × ×= =

− × − ×.

17.5 Test sul coefficiente di correlazione per popolazioni normali

In molte circostanze è interessante sottoporre a test l’ipotesi di assenza di correlazione fra due variabili casuali X e Y. E’ possibile eseguire un test esatto − tale che la distribuzione della statistica test, sotto l’ipotesi nulla, sia nota per qualsiasi numerosità campionaria − se la variabile casuale doppia ( ),X Y ha una distribuzione normale bivariata. In tal caso la funzione di densità di ( ),X Y è

( )( )

( )2 2

21 2

2 1

2 2 2

1,2 1

x xY YXY

X Y X YXY

x xy y

X Y XY

f x y eµ µµ µρ

σ σ σ σρ

π σ σ ρ

⎡ ⎤⎛ ⎞ ⎛ ⎞ ⎛ ⎞⎛ ⎞− −− −⎢ ⎥− + −⎜ ⎟ ⎜ ⎟ ⎜ ⎟⎜ ⎟⎢ ⎥− ⎝ ⎠ ⎝ ⎠ ⎝ ⎠⎝ ⎠⎣ ⎦=

−,

dove [ ]X E Xµ = , [ ]Y E Yµ = , ( )2X Var Xσ = , ( )2

Y Var Yσ = e XYρ è il coefficiente di correlazione. Essa è illustrata nella figura 17.6

Figura 17.6 Funzione di densità della variabile casuale normale doppia.

( ),f x y

y

x

Page 408: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 394

La figura 17.7 illustra le curve di livello della funzione di densità della variabile casuale normale bivariata. Esse individuano le aree dove la variabile casuale normale bivariata assume valori con probabilità 0.5, 0.8 e 0.95. Quando il coefficiente di correlazione è nullo, le curve di livello hanno la forma di una circonferenza, mentre via via che il valore (assoluto) di XYρ si avvicina a 1 le curve di livello assumono una forma ellissoidale, sicché la variabile casuale doppia assume con probabilità via via più elevata valori in un intorno di una retta.

Figura 17.7 – Curve di livello della densità di una variabile casuale bivariata

con diversi valori del coefficiente di correlazione.

0.950.8

0.5

0.950.8

0.5

0.950.8

0.5

0.950.8

0.5

Quando la variabile casuale doppia ( ),X Y ha una distribuzione

normale, anche le variabili casuali marginali sono normali.

x

0XYρ = 0.5XYρ =

0.8XYρ = 0.95XYρ =

x

x x

x

y

y y

y

Page 409: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Correlazione 395

Sebbene la variabile casuale normale bivariata abbia diverse altre interessanti proprietà, la loro trattazione esula dal livello del testo. Tuttavia in questo contesto è importante osservare che, se la distribuzione congiunta di ( ),X Y è normale, l’incorrelazione equivale all’indipendenza. Questa proprietà della variabile casuale normale bivariata costituisce un’eccezione alla regola per la quale l’incorrelazione fra due variabili casuali non implica l’indipendenza1.

Si supponga quindi che ( ),X Y abbiano una distribuzione normale bivariata e si vogliano sottoporre a test le ipotesi

0 : 0XYH ρ = verso 1 : 0XYH ρ ≠ .

E’ possibile dimostrare che, sotto l’ipotesi nulla, la statistica test

( ) ( )21 2XY

n

XY

RTR n

=− −

ha una distribuzione t di Student con 2n − gradi di libertà. Di conseguenza la regione di accettazione e la regione critica, al livello di significatività α , risultano

R.A. : 2, / 2n nt t α−≤ ,

R.C. : 2, / 2n nt t α−> , dove

( ) ( )21 2XY

n

XY

rtr n

=− −

è il valore osservato della statistica test. Il valore critico 2, / 2nt α− è tale che una variabile casuale t di Student, con 2n − gradi di libertà, risulta in valore assoluto maggiore di 2, / 2nt α− con probabilità α , cioè

1 L’equivalenza fra incorrelazione e indipendenza vale solo se la distribuzione congiunta è normale. Nel caso in cui le distribuzioni marginali di X e Y sono normali, ma non lo è la loro distribuzione congiunta, l’incorrelazione non implica l’indipendenza.

Page 410: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 396

( ) ( )2 2, / 2 2 2, / 2 / 2n n n nP t t P t tα α α− − − −< − = > = .

R .A . R .C .R .C .

α /2 α /20

Esempio 17.5. Per un periodo di 24 mesi consecutivi sono state osservate le vendite e la spesa in pubblicità di un’azienda che produce prodotti dietetici. Il coefficiente di correlazione stimato risulta 0.63. Assumendo che la distribuzione congiunta delle vendite e della spesa in pubblicità sia normale, si vuole sottoporre a test, al livello di significatività del 5%, l’ipotesi nulla di assenza di correlazione.

Sia X la variabile casuale che descrive le vendite e Y la variabile casuale che descrive la spesa in pubblicità; le ipotesi da sottoporre a test sono

0 : 0XYH ρ = verso 1 : 0XYH ρ ≠ .

Per 24n = , la statistica test si distribuisce come una variabile casuale 22t . Al livello di significatività 0.05α = il valore critico risulta 22,0.025 2.074t = , pertanto la regione di accettazione e la regione critica

sono

R.A. : 2.074nt ≤ ,

R.C. : 2.074nt > .

Figura 17.8 Regione di accettazione e regione critica del test sul coefficiente di correlazione per popolazioni normali.

( ) ( )21 2XY

XY

r

r n− −

( )2nf t −

2nt −

2, / 2nt α− 2, / 2nt α−−

Page 411: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Correlazione 397

La stima del coefficiente di correlazione è 0.63XYr = , sicché il valore osservato della statistica test è

( ) ( )2

0.63 3.8051 0.63 24 2

nt = =− −

.

Esso si trova nella regione critica; pertanto, al livello di significatività del 5%, l’ipotesi nulla è respinta ed è possibile sostenere che esiste correlazione fra le vendite e la spesa in pubblicità.

17.6 Esercizi

Esercizio 17.1. Il mensile Computer Magazine, nel numero 75 del luglio 2003, ha espresso una valutazione, in una scala da 0 a 100, su un campione di 12 fotocamere digitali. Per le stesse macchine la rivista ha fornito anche il prezzo. I dati sono riportati nella tabella 17.7. Rappresentare i dati in un grafico a dispersione e stimare il coefficiente di correlazione fra la valutazione delle fotocamere digitali espressa da Computer Magazine e il prezzo.

Tabella 17.7 − Prezzo (in euro) e valutazione espressa da Computer Magazine

su un campione di 12 fotocamere digitali. Prezzo Valutazione Benq DC2300 199 75 Canon PowerShot A60 349 85 HP photosmart 620 249 81 Toshiba PDR-T20 389 78 Fujifilm FinePix S602Z 882 89 Kodak EasyShare DX6340 449 86 Olympus µ300 Digital 499 85 Sanyo VPC-AZ3EX 617 82 Kyocera Yashica FineCam 744 81 Minolta Dimage 7Hi 1·799 84 Nikon Coolpix 5700 1·299 89 Sony CyberShot F717 1·159 88

Page 412: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 398

Esercizio 17.2. La tabella 5.19 (paragrafo 5.5) riporta il numero di pagine, in bianco e nero e a colori, stampate al minuto da alcune stampanti a getto d’inchiostro. Stimare il coefficiente di correlazione fra numero di pagine stampate in bianco e nero e numero di pagine stampate a colori.

Esercizio 17.3. La tabella 4.1 (paragrafo 4.1) riporta i voti conseguiti da un campione di 14 studenti di un corso post-laurea nell’esame di Probabilità e nell’esame di Inferenza. Rappresentare i dati in un grafico a dispersione e stimare il coefficiente di correlazione fra i voti in Probabilità e i voti in Inferenza.

Esercizio 17.4. In un campione di 41 città americane sono stati rilevati il numero di aziende con oltre 20 dipendenti e la concentrazione media annuale di biossido di zolfo nell’aria, in microgrammi per metro cubo (fonte: Sokal, R.R. e Rohlf F.J, 1981, Biometry). Indicando con

ix le osservazioni sul numero di aziende con oltre 20 dipendenti e con

iy quelle sulla concentrazione media annuale di biossido di zolfo si ha

41

118 987i

ix ⋅

=

=∑ , 41

11232i

iy ⋅

=

=∑ ,

412

121492 949i

ix ⋅ ⋅

=

=∑ , 41

2

159 058i

iy ⋅

=

=∑ , 41

1911645i i

ix y ⋅

=

=∑ .

Determinare la stima del coefficiente di correlazione.

Esercizio 17.5. In un campione di 15 pazienti che soffrono di ipertensione sono state misurate, in posizione supina, la pressione sanguigna sistolica e diastolica (fonte: D. R. Cox e E. J. Snell, 1981, Applied Statistics, Chapman & Hall). Indicando con ix le osservazioni sulla pressione sistolica e con iy quelle sulla pressione diastolica si ha

15

1

2 654ii

x ⋅

=

=∑ , 15

1

1685ii

y ⋅

=

=∑ ,

Page 413: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Correlazione 399

152

1

475 502ii

x ⋅

=

=∑ , 15

2

1

190 817ii

y ⋅

=

=∑ , 15

1

300137i ii

x y ⋅

=

=∑ .

Determinare la stima del coefficiente di correlazione. Esercizio 17.6. La tabella 17.8 riporta il numero di strati di legno

sovrapposti e l’elasticità in una scala da 1 (=molto elastica) a 5 (=rigida) di un campione di racchette da ping-pong (dati raccolti e cortesemente resi disponibili da Fulvio Manganiello). Stimare il coefficiente di correlazione.

Tabella 17.8 – Numero di strati ed elasticità di un campione di racchette da ping-pong.

Elasticità Strati 1 2 3 4 5

5 6 10 10 6 2 7 0 0 3 5 1 9 0 0 0 1 2 11 0 0 2 1 2 17 0 0 0 0 1

Esercizio 17.7. La tabella 17.9 riporta il numero di vani (esclusi i

servizi) e il numero di servizi di un campione di appartamenti in vendita presso alcune agenzie immobiliari di una piccola città, nel maggio 2003 (dati raccolti e cortesemente resi disponibili da Gaetano Di Lauro). Stimare il coefficiente di correlazione.

Tabella 17.9 – Numero di vani e numero di servizi di un campione di

appartamenti in vendita in una piccola città. Vani Servizi 3 4 5 6 7

1 10 6 2 0 0 2 3 8 12 7 2 3 0 0 0 0 2

Esercizio 17.8. In un campione di 28 pezzi di gomma prodotti da

un’azienda sono state misurate la perdita di peso dovuta all’abrasione, in grammi per ora, e la resistenza a trazione, in chilogrammi per

Page 414: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 400

centimetro quadrato. Il coefficiente di correlazione campionario ha assunto valore −0.298. Assumendo che la perdita di peso dovuta all’abrasione e la resistenza a trazione abbiano una distribuzione congiunta normale, sottoporre a test, al livello di significatività del 10%, l’ipotesi nulla di assenza di correlazione.

Esercizio 17.9. La figura 5.13 (paragrafo 5.4) illustra il grafico a

dispersione del rendimento in eccesso delle azioni IBM rispetto al rendimento in eccesso di mercato per un periodo di 120 mesi, da gennaio 1978 a dicembre 1987 (fonte: Berndt, 1990, The practice of econometrics, Addison Wesley). Il coefficiente di correlazione campionario assume valore 0.529. Assumendo che il rendimento in eccesso delle azioni IBM e il rendimento in eccesso di mercato abbiano una distribuzione congiunta normale, sottoporre a test, al livello di significatività del 5%, l’ipotesi di assenza di correlazione.

Page 415: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione

18.1 Introduzione L’analisi della correlazione considerata nel precedente capitolo

consente di valutare l’intensità di una relazione di dipendenza fra due variabili, di natura simmetrica. Il modello di regressione invece consente di rappresentare una dipendenza asimmetrica1, in base alla quale il valore assunto da una delle due variabili dipende da quello assunto dall’altra variabile. La velocità massima in chilometri orari raggiungibile da un’automobile dipende dalla potenza; il tasso di inquinamento atmosferico in un’area geografica dipende dalla numerosità degli insediamenti industriali; il tasso di criminalità è influenzato dal tasso di disoccupazione; l’effetto di un medicinale dipende dalla dose somministrata. Un modello di regressione può essere utilizzato per spiegare le variazioni di una variabile di interesse in funzione di un’altra variabile che ha la capacità di influenzarla.

Un modello costituisce uno schema di rappresentazione della realtà, mediante il quale descrivere e interpretare fenomeni di interesse. Un modello di regressione che spiega il consumo in funzione del reddito consente di valutare la propensione al consumo, mentre un modello che spiega il prezzo in funzione delle caratteristiche tecniche di un prodotto permette di motivare i diversi prezzi dei beni

1 Spesso il modello di regressione si utilizza per descrivere un legame di causa ed effetto.

Page 416: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 402

appartenenti alla stessa categoria. Un’altra finalità del modello di regressione è la previsione. Individuando qual è la relazione fra spesa in pubblicità e volume delle vendite è possibile prevedere qual è la variazione nelle vendite indotta da un incremento o un decremento della spesa in pubblicità, mentre sulla base di un modello che spiega gli investimenti in funzione del tasso di interesse, si può prevedere l’effetto sugli investimenti delle politiche economiche che comportano modifiche del tasso di interesse. 18.2 Il modello di regressione lineare semplice

Nel modello di regressione si distingue fra la variabile dipendente Y e la variabile esplicativa X. La finalità del modello è spiegare il valore della variabile dipendente in funzione di quello assunto dalla variabile esplicativa. In generale il legame fra la Y e la X non è una relazione esatta. In un modello che spiega la velocità massima in chilometri orari di un’automobile in funzione della potenza, a parità di cavalli motore, automobili con diversi pesi e coefficienti di penetrazione dell’aria possono raggiungere diverse velocità. Di conseguenza, per un dato valore x di X, è possibile considerare una distribuzione di valori della Y; sicché l’attenzione è posta sulla loro media. Nel modello di regressione si assume che il valore atteso della Y sia funzione del valore assunto dalla X, definendo così un legame in media fra le due variabili.

In particolare, nel modello di regressione lineare, si assume un legame lineare e pertanto il valore atteso della Y si trova sulla retta di regressione

[ ]|E Y X x xα β= = + .

Il parametro α costituisce l’intercetta del modello di regressione, ossia il valore atteso della Y quando 0X =

[ ]| 0E Y X α= = .

Page 417: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 403

Il parametro β invece è il coefficiente angolare o la pendenza della retta di regressione ed esprime la variazione che subisce il valore atteso della Y per una variazione unitaria della variabile esplicativa. Infatti il valore atteso di Y, quando 1X x= + , è dato da

[ ]| 1 ( 1)E Y X x xα β= + = + + , sicché

[ ] [ ] ( )| 1 | ( 1)E Y X x E Y X x x xα β α β β= + − = = + + − + = .

Quando β è positivo la relazione fra la Y e la X è crescente: un incremento della variabile esplicativa induce una variazione positiva nella media della variabile dipendente. Se invece β è negativo la relazione è decrescente e quindi un incremento della variabile esplicativa comporta una riduzione della media della variabile dipendente.

Poiché la relazione fra variabile dipendente e variabile esplicativa non è esatta, il valore che assume la Y, quando iX x= , quasi certamente non si trova sulla retta di regressione ma piuttosto in un suo intorno. Indicando con iY la variabile casuale che descrive i valori che assume la Y, quando iX x= , si ottiene il modello di regressione

i i iY xα β ε= + + .

[ ]|E Y X x= y xα β= +

x

α

Figura 18.1 Retta di regressione

Page 418: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 404

Nella spiegazione di iY si considera un termine di errore

i i iY xε α β= − − .

Esso è una variabile casuale che rappresenta lo scarto della iY rispetto al suo valore atteso.

I motivi per i quali nella realtà non si riscontra una relazione esatta fra la Y e la X ed è necessario considerare il termine di errore sono diversi. In primo luogo vi è la variabilità del comportamento umano. Nello studio di una relazione fra consumo individuale e reddito disponibile, a parità di reddito, individui diversi possono avere comportamenti diversi: alcuni saranno più parsimoniosi e spenderanno meno, mentre altri possono spendere percentuali molto elevate del loro reddito disponibile. Inoltre la relazione fra la Y e la X può non essere esaustiva. La quantità domandata di un bene dipende innanzi tutto dal prezzo del bene, ma anche da altre variabili, quali il prezzo dei beni succedanei e complementari e il reddito. Queste variabili omesse confluiscono nel termine di errore. Infine possono esservi errori di misurazione nelle variabili o la relazione fra il valore atteso della Y e la X può non essere perfettamente lineare. Ciò fa sì che il valore che assume la iY non si trovi esattamente sulla retta di regressione ma in un suo intorno.

Nel modello di regressione si assumono le seguenti ipotesi sul termine di errore e sulla variabile esplicativa:

1) [ ] 0iE ε = , per qualunque i ;

2) ( ) 2iVar ε σ= , per qualunque i ;

3) ( ), 0, per qualunquei jCov i jε ε = ≠ ; 4) X è una variabile deterministica.

Per la prima ipotesi il valore atteso degli errori è nullo per qualsiasi valore ix di X. Per la seconda, nota anche come ipotesi di omoschedasticità, gli errori hanno tutti la stessa varianza 2σ per qualunque ix . Per la terza ipotesi gli errori iε ed jε , corrispondenti a

Page 419: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 405

due diversi valori di X, ix e jx , sono incorrelati. Infine assumere che la X sia una variabile deterministica, anziché una variabile casuale, significa assumere che i suoi valori siano fissati. In altri termini si ritiene che le ix non siano soggette a variabilità casuale ma siano sotto il controllo del ricercatore2. Un modello di regressione nel quale l’errore e la variabile esplicativa soddisfano le ipotesi 1-4 si definisce modello classico di regressione.

Le ipotesi hanno delle implicazioni sulla distribuzione della variabile dipendente. L’ipotesi che la variabile esplicativa sia deterministica implica che la iY sia costituita dalla somma di una componente deterministica ixα β+ e una variabile casuale iε

(18.1) i i i

variabilecomponentecasualedeterministica

Y xα β ε= + + .

Infatti i valori ix della variabile esplicativa sono fissati e α e β sono parametri e quindi costanti.

La componente deterministica coincide con il valore atteso di iY . Infatti si ha

[ ] [ ] [ ] [ ]i i i i i iE Y E x E x E xα β ε α β ε α β= + + = + + = + ,

poiché [ ]i iE x xα β α β+ = + e, per la prima ipotesi, [ ] 0iE ε = . Il valore atteso della iY si trova quindi sulla retta di regressione.

Per la (18.1) la variabile dipendente iY e la variabile casuale errore iε hanno la stessa distribuzione, fatta eccezione per il valore atteso. La loro distribuzione è illustrata nella figura 18.2, dove i valori che assumono le variabili casuali iY ed iε sono indicati rispettivamente con iy ed ie .

2 Affermare che le ix sono deterministiche significa affermare che se si estraggono diversi campioni i valori 1 2, ,..., nx x x sono sempre gli stessi.

Page 420: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 406

Poiché la forma della distribuzione di iY ed iε è la stessa, queste

due variabili casuali hanno la stessa varianza 2σ . Infatti3

( ) [ ]( ) ( )2 2 2i i i i i iVar Y E Y E Y E Y x Eα β ε = − = − − =

Poiché, per la prima ipotesi [ ] 0iE ε = , si ha

( ) [ ]( )22 2

0

i i i iVar E E Eε ε ε ε=

= − = ,

la varianza della variabile dipendente coincide con quella degli errori e quindi

( ) ( ) 2i iVar Y Var ε σ= =

per qualunque i.

Inoltre, se iε ed jε sono incorrelati, lo sono anche iY e jY . Infatti

( ) [ ]( )( )( )( )

i j i i j j

i i j j i j

Cov Y ,Y E Y E Y Y E Y

E Y x Y x Eα β α β ε ε

= − − = − − − − =

Per la prima ipotesi, il valore atteso i jE ε ε è la covarianza degli errori

3 La varianza di iY può essere ottenuta mediante la (7.3) tenendo presente che nell’espressione i i iY xα β ε= + + il termine ixα β+ è una costante additiva.

Figura 18.2 Distribuzione di iY ed iε

( )if y

ixα β+

( )if e

0

Page 421: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 407

( ) [ ]0 0

i j i j i j i jCov E E E Eε ε ε ε ε ε ε ε= =

= − = .

Di conseguenza si ha

( ) ( ) 0i j i jCov Y ,Y Cov ε ε= =

per qualunque i j≠ 4.

La distribuzione delle variabili iY intorno alla retta di regressione è illustrata nella figura 18.3.

Le ipotesi 1-4 consentono un’agevole trattazione della teoria del modello di regressione; tuttavia devono essere verificate con cautela quando il modello di regressione è applicato a dati reali.

La prima ipotesi è necessaria affinché il valore atteso di iY si trovi sulla retta di regressione.

4 Si ricordi che il coefficiente di correlazione è invariante rispetto alla posizione (par.8.5.5, proprietà 4), pertanto le variabili iY e jY , che sono ottenute aggiungendo un termine costante alle variabili iε ed jε , hanno la stessa covarianza di iε ed jε .

Figura 18.3 Modello di regressione

iY

1x

y xα β= +

x

2x 3x

( )1f y

( )2f y

( )3f y

Page 422: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 408

Vi sono invece circostanze nelle quali la seconda ipotesi (di omoschedasticità) è particolarmente restrittiva. In un modello di regressione che spiega il consumo individuale in funzione del reddito, la variabilità dei consumi in corrispondenza di redditi non elevati è piuttosto moderata in quanto gran parte del reddito è utilizzato per soddisfare i bisogni primari. Tuttavia se aumenta il reddito aumenta anche la possibilità di scelta dell’individuo sul livello dei consumi, sicché il consumo individuale presenta una maggiore variabilità in corrispondenza di redditi elevati. Anche quando le unità statistiche sono costituite da diverse aree geografiche o hanno diverse caratteristiche – ad esempio aziende di piccola, media e grande dimensione – è probabile che vi sia eteroschedasticità.

L’ipotesi di incorrelazione può risultare invece particolarmente restrittiva quando i dati sono costituiti da serie storiche. Nell’errore confluiscono le variabili omesse dal modello; pertanto se le diverse osservazioni sono rilevate in tempi successivi è probabile che le variabili omesse relative a periodi consecutivi siano correlate generando un fenomeno noto come autocorrelazione degli errori.

L’ipotesi che la variabile esplicativa sia deterministica è generalmente soddisfatta quando i dati sono il risultato di esperimenti di laboratorio o di sperimentazioni cliniche. In uno studio sulla crescita di una pianta indotta dalla somministrazione di un fertilizzante è il ricercatore che dosa il fertilizzante. Analogamente, nella sperimentazione dell’effetto che un medicinale contro l’ipertensione ha sul livello della pressione sanguigna del paziente, è il medico a decidere la dose da somministrare. L’ipotesi che la variabile esplicativa sia deterministica può risultare invece poco verosimile in applicazioni su dati economici e sociali. Nello studio della dipendenza del livello degli investimenti dal tasso di interesse, il ricercatore non è in grado di controllare i tassi di interesse di mercato. Inoltre, se la stessa indagine si ripetesse a distanza di qualche tempo, la variabile esplicativa verosimilmente assumerebbe valori diversi.

Page 423: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 409

Vi è infine un’altra ipotesi del modello di regressione da commentare: quella che assume una relazione lineare fra il valore atteso della variabile dipendente e la variabile esplicativa. In effetti non si tratta di un’ipotesi particolarmente restrittiva: relazioni di tipo non lineare spesso possono essere rese lineari trasformando opportunamente le variabili.

Esempio 18.1. Nella figura 18.4.(a) è rappresentata la funzione di

regressione di un modello non lineare 0.20.5 i ix

iY e ε− += ,

dove iε ha valore atteso nullo. La relazione fra la variabile dipendente e la variabile esplicativa può essere linearizzata passando ai logaritmi. Infatti si ottiene

( ) ( )0 5 0 2i i iln Y ln . . x ε= − + ,

sicché il valore atteso del logaritmo della variabile dipendente è una funzione lineare della variabile esplicativa

( ) ( )0 5 0 2i iE ln Y ln . . x= − .

La relazione ottenuta utilizzando ( )iln Y come variabile dipendente è illustrata nella figura 18.4.(b).

Figura 18.4 – Modello di regressione non lineare (a) e modello di regressione reso lineare (b) mediante trasformazione della variabile dipendente

(a) (b)

iy

ix

0.20.5 ixiy e−=

( )iln y

ix

( ) ( )0 5 0 2i iln y ln . . x= −

Page 424: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 410

18.3 Il metodo dei minimi quadrati

Per stimare i parametri α e β del modello di regressione si estrae un campione costituito da n coppie di valori

1 1 2 2( , ), ( , ),..., ( , )n nx y x y x y , dove 1 2, ,..., nx x x sono i valori della variabile esplicativa e 1 2, ,..., ny y y sono i valori assunti dalle variabili casuali 1 2, ,..., nY Y Y . Si ha

i i iy x eα β= + + ,

dove ie è il valore della variabile casuale errore iε . Le osservazioni possono essere illustrate in un grafico a dispersione come esemplificato nella figura 18.5.

Stimare α e β significa stimare l’equazione di una retta che

interpola al meglio i dati. In altri termini l’obiettivo è individuare una retta che renda minima la distanza dai punti e risulti quindi il più possibile vicina ai dati.

Il metodo correntemente utilizzato per stimare α e β è quello dei minimi quadrati. A tal fine si considerano gli scarti delle osservazioni ( , )i ix y dalla retta di regressione. Essi sono dati da

iy

ix

Figura 18.5 Osservazioni sul modello di regressione

Page 425: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 411

( )i iy xα β− + ,

per 1,2,...,i n= . Le stime di α e β devono essere scelte in modo tale da rendere più piccoli possibili tutti gli scarti delle osservazioni ( , )i ix y dalla retta di regressione stimata. Poiché alcuni scarti sono positivi e altri negativi, si considera la somma degli scarti al quadrato

( ) ( )2

1

,n

i ii

Q y xα β α β=

= − −∑ .

Le stime del metodo dei minimi quadrati sono quei valori α e β che minimizzano la somma degli scarti al quadrato, per le quali si ha

( ) ( ),

ˆˆQ , min Q ,α β

α β α β= .

E’ possibile dimostrare (si veda l’appendice 18.10.1) che le stime α e β sono le soluzioni del sistema di equazioni

( )

( )1

1

ˆˆ 0,

ˆˆ 0.

n

i ii

n

i i ii

y x

y x x

α β

α β

=

=

− − = − − =

iy

ixα β+ ( )i iy xα β− +

ix

y xα β= +

x

( , )i ix y y

Figura 18.6 Distanza del punto ( , )i ix y dalla retta di regressione

Page 426: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 412

Queste sono chiamate equazioni normali. Risolvendo il sistema si ottengono le stime (vi veda l’appendice 18.10.1)

(18.2) ˆˆ ,y xα β= −

(18.3) ( )( )

( )1

2

1

ˆ ,

n

i ii

n

ii

x x y y

x xβ =

=

− −=

dove x è la media della X e y è la media campionaria osservata della Y.

Esempio 18.2. La tabella 18.1 riporta quattordici osservazioni sulla resistenza a trazione della carta (espressa in newton per centimetro quadrato) e la percentuale di fibra di legno presente nella pasta con la quale la carta è prodotta (fonte: G. Joglekar, J. H. Schuenemeyer e V. LaRiccia, 1989, American Statistician).

Tabella 18.1 − Resistenza a trazione e percentuale di fibra di legno nella carta. Resistenza a trazione ( )iy

Percentuale di fibra di legno ( )ix

Resistenza a trazione ( )iy

Percentuale di fibra di legno ( )ix

4.3 1.0 23.4 5.5 7.6 1.5 26.3 6.0

13.8 2.0 27.5 6.5 16.6 3.0 29.0 7.0 18.0 4.0 31.8 8.0 20.7 4.5 36.6 9.0 23.3 5.0 35.9 10.0

Il diagramma a dispersione dei dati è illustrato nella figura 18.7. Si vuole spiegare la resistenza a trazione della carta iY in funzione

della percentuale di fibra di legno. Si assume che sussista la relazione

i i iY xα β ε= + + .

Page 427: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 413

2 4 6 8 10

5

10

15

20

25

30

35

La media della variabile esplicativa è 5.21x = e la media campionaria osservata della variabile dipendente è 22.49y = . I calcoli per la stima della retta di regressione sono riportati nella tabella 18.2.

Tabella 18.2 – Calcoli per la stima della retta di regressione nell’esempio 18.2.

i iy ix iy y− ix x− ( ) ( )i ix x y y− − ( )2ix x−

1 4.3 1.0 -18.19 -4.21 76.58 17.72 2 7.6 1.5 -14.89 -3.71 55.24 13.76 3 13.8 2.0 -8.69 -3.21 27.89 10.30 4 16.6 3.0 -5.89 -2.21 13.02 4.88 5 18.0 4.0 -4.49 -1.21 5.43 1.46 6 20.7 4.5 -1.79 -0.71 1.27 0.50 7 23.3 5.0 0.81 -0.21 -0.17 0.04 8 23.4 5.5 0.91 0.29 0.26 0.08 9 26.3 6.0 3.81 0.79 3.01 0.62 10 27.5 6.5 5.01 1.29 6.46 1.66 11 29.0 7.0 6.51 1.79 11.65 3.20 12 31.8 8.0 9.31 2.79 25.97 7.78 13 36.6 9.0 14.11 3.79 53.48 14.36 14 35.9 10.0 13.41 4.79 64.23 22.94

Totale 314.8 73.0 344.32 99.30

iy

ix

Figura 18.7 Dati dell’esempio 18.2

Page 428: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 414

Si ha

( )( )14

1

344.32i ii

x x y y=

− − =∑ , ( )14

2

1

99.30ii

x x=

− =∑ ,

sicché applicando la (18.3) si ottiene la stima di β ,

344.32ˆ 3.4799.30

β = = .

Inoltre applicando la (18.2) si ottiene la stima dell’intercetta,

ˆ 22.49 3.47 5.21 4.41α = − × = .

La retta di regressione stimata è ˆˆˆ 4.41 3.47i i iy x xα β= + = +

ed è illustrata nella figura 18.8.

2 4 6 8 10

5

10

15

20

25

30

35

Il calcolo delle stime dei minimi quadrati può essere reso più veloce utilizzando le formule (17.3) e (17.4.a) per la codevianza e la devianza (paragrafo 17.3), dalle quali risulta ( )( )i ix x y y− −∑

iy

ix

ˆ 4.41 3.47y x= +

Figura 18.8 Retta di regressione stimata nell’esempio 18.2

Page 429: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 415

i ix y n x y= −∑ e ( )2 2 2i ix x x nx− = −∑ ∑ . Si ottiene così una

formula alternativa alla (18.3) per la stima del coefficiente angolare

(18.4) 1

2 2

1

ˆ

n

i ii

n

ii

x y n x y

x nxβ =

=

−=

∑.

Esempio 18.3. La tabella 18.3 riporta i prezzi in euro (iva inclusa) e il numero di pagine stampate al minuto di alcune stampanti laser con risoluzione 600×600 DPI (fonte: Computer Magazine di giugno 2003). Si vogliono spiegare le variazioni del prezzo iY in funzione della velocità di stampa ix , mediante un modello di regressione lineare

i i iY xα β ε= + + .

Tabella 18.3 – Prezzo e numero di pagine stampate al minuto da alcune stampanti laser. Marca e modello Prezzo in euro Velocità di stampa Brother HL 1230 336 12 Brother HL 5030 480 16 Canon LBP 1120 299 10 Canon LBP 810 309 8 Canon LBP 1210 423 14 HP Laser Jet 1000w 249 10 Lexmark Optra E210 372 12 Lexmark Optra E322n 876 16 Olivetti Tecnost PG L12en 666 12 Panasonic KX P7100 497 14 Samsung ML 1210 239 12 Xerox Docuprint P1210 614 12

Page 430: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 416

Tabella 18.4 – Calcoli per la stima della retta di regressione nell’esempio 18.3. i iy ix i ix y 2

ix 1 336 12 4⋅032 144 2 480 16 7⋅680 256 3 299 10 2⋅990 100 4 309 8 2⋅472 64 5 423 14 5⋅922 196 6 249 10 2⋅490 100 7 372 12 4⋅464 144 8 876 16 14⋅016 256 9 666 12 7⋅992 144

10 497 14 6⋅958 196 11 239 12 2868 144 12 614 12 7⋅368 144

Totale 5⋅360 148 69⋅252 1⋅888

I calcoli per la stima della retta di regressione sono riportati nella tabella 18.4. Si ha

12

1

5 360ii

y ⋅

=

=∑ , 12

1

148ii

x=

=∑ , 12

1

69 252i ii

y x ⋅

=

=∑ , 12

2

1

1888ii

x ⋅

=

=∑ .

Di conseguenza le medie risultano 148 /12 12.33x = = e

5 360 /12 446.67y ⋅= = . Applicando la (18.4) si ottiene la stima della pendenza

2

69 252 12 12.33 446.67ˆ 49.6871888 12 12.33

β⋅

− × ×= =

− ×

e successivamente, mediante la (18.2), si ottiene la stima dell’intercetta

ˆ 446.67 49.687 12.33 165.971α = − × = − .

La retta di regressione stimata è

ˆ 165.971 49.687i iy x= − +

ed è illustrata nella figura 18.9.

Page 431: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 417

8 10 12 14 16

300

400

500

600

700

800

900

18.4 Le proprietà degli stimatori dei minimi quadrati

I valori ottenuti per α e β costituiscono le stime dei minimi quadrati ottenute in corrispondenza di un particolare campione osservato 1 1 2 2( , ), ( , ), ..., ( , )n nx y x y x y . Se si ripetesse nuovamente il campionamento, tenendo fissi i valori della variabile esplicativa, si osserverebbero diversi valori della variabile dipendente, ai quali corrisponderebbero stime diverse. Ripetendo infinite volte il campionamento si ottiene una distribuzione di stime. Questa è la distribuzione degli stimatori dei minimi quadrati. Nel seguito gli stimatori si indicheranno con A e B per distinguerli dalle stime α e β .

L’espressione degli stimatori si ottiene sostituendo nelle formule di α e β i valori osservati 1 2, ,..., ny y y con le variabili casuali

1 2, ,..., nY Y Y . Si ha

A Y Bx= − e ( )( )

( )1

2

1

n

i ii

n

ii

x x y YB

x x

=

=

− −=

dove Y è la media campionaria della variabile dipendente.

iy

ix

ˆ 165.971 49.687y x= − +

Figura 18.9 Retta di regressione stimata nell’esempio 18.3

Page 432: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 418

Gli stimatori dei minimi quadrati godono di alcune proprietà che motivano la loro applicazione. La prima proprietà è la linearità: essi possono essere ottenuti come combinazione lineare delle variabili

1 2, ,..., nY Y Y . Si dimostra infatti che (vedi appendice 18.10.2)

(18.5) 1

n

i ii

A a Y=

= ∑ e 1

n

i ii

B bY=

= ∑ ,

dove

1i ia xb

n= − e

( )2

1

ii n

ii

x xbx x

=

−=

−∑.

Gli stimatori dei minimi quadrati inoltre sono non distorti (vedi appendice 18.10.3),

[ ]E A α= , [ ]E B β= .

Di conseguenza l’efficienza è misurata dalla varianza. E’ possibile dimostrare che (vedi appendice 18.10.4)

( )2

2

2

1

1

( )n

ii

xVar An x x

σ

=

= + −

∑,

(18.6) ( )2

2

1( )

n

ii

Var Bx x

σ

=

=−∑

.

La varianza di entrambi gli stimatori dipende dalla devianza della X. Quindi, laddove è possibile scegliere i valori della variabile esplicativa, è opportuno farlo in modo tale che la devianza sia più grande possibile.

Il risultato più importante riguardo le proprietà degli stimatori dei

minimi quadrati è costituito dal seguente teorema.

Page 433: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 419

Teorema di Gauss Markov. Sotto le ipotesi 1-4 del modello di regressione lineare classico, gli stimatori dei minimi quadrati sono i più efficienti nell’insieme degli stimatori lineari e non distorti.

Non è quindi possibile che esista un’altra coppia di stimatori per α e β che siano lineari e non distorti e abbiano varianza minore degli stimatori dei minimi quadrati. Questo teorema costituisce la motivazione principale per l’applicazione del metodo dei minimi quadrati nella stima dei modelli di regressione.5 18.5 Stima della varianza degli errori nel modello di regressione

In aggiunta ad α e β , nel modello di regressione è necessario stimare un ulteriore parametro: la varianza degli errori 2σ . Poiché gli errori iε hanno media nulla, la varianza coincide con il valore atteso dei quadrati

5 Il metodo di stima dei minimi quadrati è un metodo non parametrico in quanto non richiede alcuna ipotesi sulla forma della funzione di densità iε e quindi di iY . Tuttavia è possibile dimostrare che se si assume per iε una distribuzione normale, gli stimatori dei minimi quadrati coincidono con quelli di massima verosimiglianza.

Stimatori di α e β

Stimatori lineari

Stimatori non distorti Sotto le ipotesi

1-4, A e B sono i migliori stimatori in questo insieme.

Figura 18.10 Teorema di Gauss Markov

Stimatori lineari e

non distorti

Page 434: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 420

2 2( )i iVar Eσ ε ε = = .

Di conseguenza, se gli errori fossero osservabili, sarebbe ragionevole stimare 2σ mediante la media campionaria degli errori al quadrato. Sfortunatamente i valori

i i ie y xα β= − − ,

assunti dagli errori iε , non sono osservabili perché i parametri α e β non sono noti. E’ possibile invece calcolare i residui

ˆˆ ˆi i ie y xα β= − − ,

ossia gli scarti delle iy dalla retta di regressione stimata. Indicando con ˆiy il punto sulla retta di regressione corrispondente a ix

ˆˆ ˆi iy xα β= + ,

il residuo ie risulta costituito dalla differenza fra l’osservazione iy e ˆiy ˆ ˆi i ie y y= − .

iy

ˆˆ ˆiiy xα β+=

( )ˆˆ ˆi iie y xα β− +=

ix

ˆˆ ˆy xα β= +

x

( , )i ix y y

Figura 18.11 Residui

Page 435: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 421

E’ possibile dimostrare che uno stimatore non distorto di 2σ è dato da

(18.7) 2 2

1

1ˆ ˆ2

n

ii

en

σ=

=− ∑ .

Si divide la somma dei quadrati dei residui per 2n − , anziché per n, perché vi sono soltanto 2n − residui linearmente indipendenti. Dalle equazioni normali infatti si ha

(18.8.a) ( )1 1

ˆˆ ˆ 0,n n

i i ii i

y x eα β= =

− − = =∑ ∑

(18.8.b) ( )1 1

ˆˆ ˆ 0.n n

i i i i ii i

y x x e xα β= =

− − = =∑ ∑

Nella stima di α e β si impongono due vincoli sui residui: che la loro somma sia nulla e che la somma dei prodotti con le ix sia nulla.

Esempio 18.2 (continuazione). In precedenza è stata stimata la retta di regressione del modello che spiega la resistenza a trazione della carta in funzione della percentuale di fibra di legno contenuta nella carta. La tabella 18.5 riporta i calcoli per la stima della varianza degli errori. I valori ˆiy sono stati ottenuti, sulla base della retta di regressione stimata, nel modo seguente: ˆ 4.41 3.47i iy x= + per 1, ,14i = … . La somma dei quadrati dei residui risulta

142

1

ˆ 41.85ii

e=

=∑ .

Di conseguenza, in base alla (18.7), la stima della varianza è

2 41.85ˆ 3.4914 2

σ = =−

.

Page 436: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 422

Tabella 18.5 – Calcoli per la stima di 2σ nell’esempio 18.2.

i iy ˆiy ˆ

ie 2ˆie

1 4.3 7.88 -3.58 12.82 2 7.6 9.62 -2.02 4.08 3 13.8 11.35 2.45 6.00 4 16.6 14.82 1.78 3.17 5 18.0 18.29 -0.29 0.08 6 20.7 20.03 0.67 0.45 7 23.3 21.76 1.54 2.37 8 23.4 23.50 -0.10 0.01 9 26.3 25.23 1.07 1.14

10 27.5 26.97 0.53 0.28 11 29.0 28.70 0.30 0.09 12 31.8 32.17 -0.37 0.14 13 36.6 35.64 0.96 0.92 14 35.9 39.11 -3.21 10.30

Totale 41.85 La stima della varianza può essere resa più veloce osservando che

( )22

1 1

ˆˆ ˆn n

i i ii i

e y xα β= =

= − −∑ ∑ .

Sostituendo ad α la sua espressione, data dalla (18.2), si ha

( ) ( ) ( )2 22

1 1 1

ˆ ˆ ˆˆn n n

i i i i ii i i

e y y x x y y x xβ β β= = =

= − − − = − − − ∑ ∑ ∑ .

Svolgendo il quadrato, come il quadrato di un binomio, si ottiene

( ) ( ) ( )( )

( ) ( ) ( )( )

2 22 2

1 1

2 22

1 1 1

ˆ ˆˆ 2

ˆ ˆ2 .

n n

i i i i ii i

n n n

i i i ii i i

e y y x x x x y y

y y x x x x y y

β β

β β

= =

= = =

= − + − − − −

= − + − − − −

∑ ∑

∑ ∑ ∑

Se si moltiplica e si divide il terzo termine per la devianza della variabile esplicativa si ha

Page 437: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 423

( ) ( )( )( )

( )( )

( ) ( ) ( )

( ) ( )

2 2 22 2 1

21 1 1 1

1

ˆ

2 2 22 2

1 1 1

2 22

1 1

ˆ ˆˆ 2

ˆ ˆ2

ˆ .

n

i in n n ni

i i i ini i i i

ii

n n n

i i ii i i

n n

i ii i

x x y ye y y x x x x

x x

y y x x x x

y y x x

β

β β

β β

β

=

= = = =

=

=

= = =

= =

− −= − + − − −

= − + − − −

= − − −

∑∑ ∑ ∑ ∑

∑ ∑ ∑

∑ ∑

Ricordando infine che per la (17.4.a) e la (17.4.b) si ha ( )2 2 2

i iy y y ny− = −∑ ∑ e ( )2 2 2i ix x x nx− = −∑ ∑ , si ottiene una

formula abbreviata per il calcolo della devianza dei residui

(18.9) 2 2 2 2 2 2

1 1 1

ˆˆn n n

i i ii i i

e y ny x nxβ= = =

= − − −

∑ ∑ ∑ .

Esempio 18.3 (continuazione). In precedenza è stata stimata, sulla base di 12n = osservazioni, la retta di regressione utile per spiegare il prezzo delle stampanti laser in funzione della velocità di stampa. Nell’esempio le medie della variabile esplicativa e della variabile dipendente risultano rispettivamente 12.33x = e 446.67y = ; inoltre la somma dei quadrati delle ix è 2 1888ix ⋅=∑ e la stima del coefficiente di pendenza è ˆ 49.687β = . L’ultimo dato necessario per la stima della varianza è la somma dei quadrati delle osservazioni sulla variabile dipendente che risulta 2 2 799 550iy ⋅ ⋅=∑ . Applicando la (18.9) si ha

( )12

2 2 2 2

1

ˆ 2 799 550 12 446.67 49.687 1888 12 12.33

248 234.042.

ii

e ⋅ ⋅ ⋅

=

= − × − × − ×

=

Page 438: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 424

Di conseguenza la stima della varianza è

2 248 234.042ˆ 24 823.40412 2

σ⋅

⋅= =−

.

18.6 Indice di determinazione

Quando si costruisce un modello di regressione l’obiettivo è spiegare le variazioni della variabile dipendente mediante le variazioni della variabile esplicativa. Maggiore è la percentuale di variabilità della Y che si riesce a spiegare mediante la dipendenza dalla X, più soddisfacente è il modello. L’informazione sulla percentuale di variabilità della Y spiegata dal modello di regressione è fornita dall’indice di determinazione 2R .

La variazione di iy , rispetto alla media y , si può scomporre nella somma del residuo ie e dello scarto ˆiy y− di ˆiy rispetto alla media y

( ) ( ) ( )ˆ ˆ ˆ ˆi i i i i iy y y y y y e y y− = − + − = + − .

iy

ˆiy ˆie

ix

ˆˆ ˆy xα β= +

x

( , )i ix y y

y

x

ˆiy y−

Figura 18.12 Variazione di

iy rispetto a y

Page 439: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 425

La quantità ˆiy y− è la parte di variazione che è possibile spiegare mediante la funzione di regressione: ˆiy è diverso da y perché ix è diverso da x . Il residuo costituisce invece la parte di variazione che non è possibile spiegare mediante le variazioni della variabile esplicativa.

La devianza totale delle iy è data da

( ) ( )

( ) ( )

22

1 1

22

1 1 1

ˆ ˆ

ˆ ˆ ˆ ˆ2 .

n n

i i ii i

n n n

i i i ii i i

y y e y y

e y y e y y

= =

= = =

− = + −

= + − + −

∑ ∑

∑ ∑ ∑

Per i vincoli (18.8.a) e (18.8.b), imposti sui residui dalle equazioni normali, il doppio prodotto si annulla

( ) ( )1 1 1 1 1 1

0 0 0

ˆ ˆˆ ˆˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ 0.n n n n n n

i i i i i i i i i ii i i i i i

e y y e y y e e x e e xα β α β= = = = = =

= = =

− = − = + = + =∑ ∑ ∑ ∑ ∑ ∑

Di conseguenza la devianza totale si scompone nella somma della devianza spiegata e della devianza residua

( ) ( )2 22

1 1 1

ˆ ˆ .n n n

i i ii i i

Devianza residua Devianza spiegata

y y e y y= = =

− = + −∑ ∑ ∑

L’accostamento del modello ai dati è tanto migliore quanto maggiore è la percentuale di devianza totale costituita dalla devianza spiegata.

L’indice di determinazione 2R è un indice descrittivo che misura la percentuale di devianza totale spiegata dal modello di regressione. Esso è dato dal rapporto fra la devianza spiegata e la devianza totale

( )

( )

2

2 1

2

1

ˆn

iin

ii

y yR

y y

=

=

−=

∑.

Poiché la devianza spiegata è data dalla differenza fra la devianza totale e la devianza residua si ha

Page 440: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 426

( )

( )

2 2

2 1 1

2

1

ˆn n

i ii i

n

ii

y y eR

y y

= =

=

− −=

∑ ∑

∑,

sicché l’indice di determinazione può anche essere calcolato nel modo seguente

(18.10) ( )

2

2 1

2

1

ˆ1

n

ii

n

ii

eR

y y

=

=

= −−

∑.

L’indice di determinazione varia fra zero e 1. E’ pari a 1 quando vi è un perfetto accostamento del modello ai dati (sia che la retta sia inclinata positivamente sia negativamente). In tal caso tutte le osservazioni si trovano sulla retta di regressione stimata ( ˆi iy y= per qualunque i ) e la devianza residua è nulla. L’indice di determinazione invece è nullo quando la retta stimata è parallela all’asse delle ascisse, cioè ˆ 0β = . In tal caso sostituendo ˆ 0β = nella (18.2) si ha ˆ yα = e di conseguenza ˆiy y= , sicché la devianza spiegata è nulla: la X non è in grado di spiegare le variazioni della Y. La figura 18.13 illustra questi due casi estremi.

Figura 18.13 − Diagrammi a dispersione delle osservazioni quando 2 0R = e

2 1R = .

2 0R = 2 1R =

ix ix

iy iy

Page 441: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 427

Nelle applicazioni a dati reali l’indice di determinazione è compreso fra zero e 1 ed è tanto più vicino a 1 quanto migliore è l’adattamento del modello ai dati. In particolare quanto più elevato è l’indice 2R tanto minore è, in percentuale, la devianza residua; il che implica una minore dispersione delle osservazioni intorno alla retta stimata. L’accostamento delle osservazioni alla retta di regressione stimata è rilevante per due motivi. La retta stima il valore atteso della variabile dipendente [ ]i iE Y xα β= + ; pertanto, in analogia a quanto avviene per gli indici di posizione, la stima di [ ]iE Y è tanto più rappresentativa quanto più i valori osservati sono vicini a essa. Inoltre, se vi è minore dispersione delle osservazioni intorno alla retta di regressione, è possibile ottenere previsioni del valore della variabile dipendente più accurate.

Esempio 18.4. In un impianto per la produzione di vapore di un’azienda sono state rilevate 25 osservazioni sulla produzione mensile di vapore e sulla temperatura media in gradi Fahrenheit. Assumendo una relazione lineare fra la produzione di vapore iY e la temperatura ix , si vuole stimare un modello di regressione. Dai dati (riportati in N.R. Draper e H. Smith, 1998, Applied Regression Analysis, J. Wiley) si ha

25

1

235.60ii

y=

=∑ , 25

1

1315.00ii

x ⋅

=

=∑ ,

25

1

11821.43i ii

y x ⋅

=

=∑ , 25

2

1

2 284.11ii

y ⋅

=

=∑ , 25

2

1

76 323.42ii

x ⋅

=

=∑ .

La retta di regressione stimata ha equazione

ˆ 13.632 0.080i iy x= − ,

ed è rappresentata nella figura 18.14. La devianza totale e la somma dei quadrati dei residui sono

( )25

2

163.816i

iy y

=

− =∑ , 25

2

1

ˆ 18.027ii

e=

=∑ .

Page 442: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 428

30 40 50 60 70

7

8

9

10

11

12

Pertanto, applicando la (18.10), si ottiene il coefficiente di determinazione

2 18.0271 0.71863.816

R = − = .

Il 71.8% della variabilità della produzione di vapore è spiegato dalle variazioni della temperatura.

Esempio 18.2 (continuazione). Nell’esempio 18.2, sulla resistenza della carta a trazione, la devianza totale è ( )2 1 235.24iy y ⋅− =∑ e la devianza residua è 2ˆ 41.85ie =∑ ; sicché l’indice di determinazione risulta

2 41.851 0.9661235.24

R ⋅= − = .

La percentuale di fibra di legno presente nella pasta della carta spiega il 96.6% della variabilità della resistenza del prodotto a trazione. In questo esempio vi è un elevato accostamento dei dati alla retta di regressione stimata (vedi figura 18.8).

Esempio 18.3 (continuazione). Nell’esempio 18.3, sul prezzo delle stampanti laser, il coefficiente di determinazione risulta

iy

ix

ˆ 13.632 0.080y x= − −

Figura 18.14 Retta di regressione stimata nell’esempio 18.4

Page 443: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 429

2 0.388R = . Di conseguenza la velocità di stampa spiega il 38.8% della variabilità nel prezzo delle stampanti laser. Rispetto agli esempi 18.2 e 18.4, i dati di questo esempio presentano una maggiore dispersione intorno alla retta di regressione (vedi figura 18.9). 18.7 Il test nel modello di regressione

Sebbene gli stimatori dei minimi quadrati abbiano importanti

proprietà sintetizzate dal teorema di Gauss Markov, le stime α e β sono espressione del particolare campione osservato e quasi certamente non coincidono con i parametri. Di conseguenza per verificare se un’ipotesi formulata sul valore di un parametro trova sostegno nei risultati campionari è necessario procedere al test delle ipotesi. In questo ambito particolare rilevanza ha il test sulla pendenza, in quanto β misura l’effetto che una variazione (unitaria) della variabile esplicativa ha sulla variabile dipendente.

Si supponga di voler sottoporre a test l’ipotesi nulla

0 0:H β β= .

Per poter eseguire il test e avere una statistica test con una distribuzione nota sotto l’ipotesi nulla, è necessario modificare le ipotesi del modello classico aggiungendo l’ulteriore ipotesi di normalità degli errori e rafforzando l’ipotesi di incorrelazione in un’ipotesi di indipendenza. Le ipotesi quindi diventano:

1) ( )20,i Nε σ∼ , per qualunque i ; 2) iε ed jε sono indipendenti, per qualunque i j≠ ; 3) X è una variabile deterministica.

Se gli errori sono normali e indipendenti, lo sono anche le variabili 1 2, , , nY Y Y… . Di conseguenza, per la (18.5), lo stimatore B risulta combinazione lineare di variabili casuali normali e indipendenti

Page 444: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 430

e, per la proprietà riproduttiva della normale (paragrafo 10.1.2), ha anche esso una distribuzione normale con media β e varianza data dalla (18.6). Pertanto si ha

( ) ( )( )

22

1

0,1n

ii

B B NVar B x x

β β

σ=

− −=

−∑∼ .

Questa quantità non può essere utilizzata come statistica test perché dipende da 2σ che non è noto. Tuttavia è possibile dimostrare che la quantità ( ) 2 2ˆ2n σ σ− si distribuisce come una variabile casuale chi-quadrato con 2n − gradi di libertà (due gradi di libertà si perdono a causa del vincoli (18.8.a) e (18.8.b) imposti dalle equazioni normali sui residui). Inoltre le variabili casuali ( ) ( )B Var Bβ− e ( ) 2 2ˆ2n σ σ− sono indipendenti. Di conseguenza la statistica

(18.11) ( ) ( )22

1

2 2ˆ

n

ii

B x xβ σ

σ σ=

− −∑

è costituita dal rapporto fra una variabile casuale normale standardizzata e la radice di una variabile casuale chi-quadrato rapportata ai suoi gradi di libertà e indipendente dal numeratore; pertanto essa ha una distribuzione nota, quella di una variabile casuale t di Student con 2n − gradi di libertà.

Semplificando numeratore e denominatore nella (18.11) e sostituendo al parametro il valore 0β , assunto sotto l’ipotesi nulla, si ottiene la statistica test

(18.12)

( )

0

22

1

ˆn n

ii

BTx x

β

σ=

−=

−∑.

La quantità al denominatore della (18.12) stima lo scarto quadratico medio di B . Il suo valore osservato è solitamente indicato come errore standard di β

Page 445: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 431

( )( )

2 2

2 2 2

1 1

ˆ ˆˆn n

i ii i

ESx x x nx

σ σβ

= =

= =− −∑ ∑

.

Il valore osservato della statistica test è

( )0

ˆˆnt

ESβ β

β−

= .

Di regola, dopo aver stimato il modello di regressione, si sottopone a test l’ipotesi nulla

0 : 0H β = .

In tal modo si verifica se effettivamente esiste una dipendenza della variabile dipendente da quella esplicativa. Infatti, se 0β = , il valore atteso della variabile dipendente è costante e pari ad α per qualsiasi valore di X. Ciò implica l’assenza di un legame in media fra variabile dipendente e variabile esplicativa e, di conseguenza, il modello di regressione risulta inutile. Quando si sottopone a test l’ipotesi che β sia nullo si verifica la significatività della stima del coefficiente di pendenza.

In genere, nelle applicazioni a dati reali, l’ipotesi alternativa è un’ipotesi unidirezionale. Nello studio di una funzione di consumo, nella quale la variabile dipendente è costituita dal consumo delle famiglie e la variabile esplicativa è il reddito disponibile, l’ipotesi alternativa è

1 : 0H β > ,

perché si presuppone che la relazione fra consumo e reddito disponibile sia crescente. In una funzione di domanda, nella quale la variabile dipendente è costituita dalla quantità domandata mentre la variabile esplicativa è costituita dal prezzo, l’ipotesi alternativa è

1 : 0H β < ,

Page 446: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 432

perché si presuppone che un incremento del prezzo provochi una riduzione nella quantità domandata.

Quando l’ipotesi nulla da sottoporre a test è 0 : 0H β = , il valore osservato della statistica test è chiamato t-ratio ed è dato da

( )ˆ

-ratioˆ

tESββ

= .

Pertanto se le ipotesi da sottoporre a test sono

0 : 0H β = verso 1 : 0H β > ,

la regione di accettazione e la regione critica, al livello di significatività α , sono

R.A. : ( ) 2,ˆ ˆ

nES t αβ β −≤ ,

R.C. : ( ) 2,ˆ ˆ

nES t αβ β −> ,

dove il valore critico 2,nt α− è tale che

( )2 2,n nP t t α α− −> = .

Quando invece le ipotesi da sottoporre a test sono

0 : 0H β = verso 1 : 0H β < ,

la regione di accettazione e la regione critica, al livello di significatività α , sono

R.A. : ( ) 2,ˆ ˆ

nES t αβ β −≥ − ,

R.C. : ( ) 2,ˆ ˆ

nES t αβ β −< − .

Se il t-ratio assume valore nella regione di accettazione e l’ipotesi nulla non è respinta, si conclude che la X non ha effetto sulla Y.

Esempio 18.2 (continuazione). Il modello dell’esempio 18.2 spiega la resistenza a trazione della carta in funzione della percentuale

Page 447: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 433

di fibra di legno presente nella pasta. Se esiste una relazione, essa è crescente. Pertanto, per verificare se la variabile esplicativa è in grado di spiegare le variazioni della resistenza a trazione della carta, si sottopongono a test le seguenti ipotesi

0 : 0H β = verso 1 : 0H β > ,

al livello di significatività del 5%. Poiché vi sono 14 osservazioni, la statistica test ha una

distribuzione t di Student con 12 gradi di libertà. Il valore critico, corrispondente al livello di significatività del 5%, è 12,0.05 1.782t = . Pertanto la regione di accettazione e la regione critica sono

R.A. : ( )ˆ ˆ 1.782ESβ β ≤ ,

R.C. : ( )ˆ ˆ 1.782ESβ β > .

Per ottenere il valore della statistica test è necessario calcolare l’errore standard. Ricordando che la stima della varianza è risultata

2ˆ 3.49σ = e la devianza della variabile esplicativa è ( )2 99.30ix x− =∑ , si ha

( ) 3.49ˆ 0.1999.30

ES β = = ,

sicché il t-ratio è dato da

( )ˆ 3.47 18.263

ˆ 0.19ESββ

= = .

Il valore osservato della statistica test si trova nella regione critica e pertanto l’ipotesi nulla è respinta al livello di significatività del 5%. La percentuale di fibra di legno contenuta nella pasta della carta effettivamente contribuisce a spiegare la variabilità della resistenza a trazione.

E’ prassi diffusa nelle applicazioni osservare il p-valore del test, anziché fissare il livello di significatività a priori. Quando l’ipotesi

Page 448: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 434

alternativa è 1 : 0H β > , il p-valore è dato dalla probabilità con la quale una variabile casuale 2nt − risulta maggiore del t-ratio

( )( )2ˆ ˆ-valore np P t ESβ β−= ≥ .

Se invece l’ipotesi alternativa è 1 : 0H β < , si ha

( )( )2ˆ ˆ-valore np P t ESβ β−= ≤ .

Esempio 18.4 (continuazione). Il modello dell’esempio 18.4

spiega la produzione mensile di vapore di un impianto all’interno di un’azienda in funzione della temperatura. Se esiste una relazione fra produzione di vapore e temperatura, essa ha segno negativo: all’aumentare della temperatura si riduce il fabbisogno di vapore. Pertanto le ipotesi da sottoporre a test sono

0 : 0H β = verso 1 : 0H β < .

Essendo disponibili 25 osservazioni, la statistica test si distribuisce come una variabile casuale 23t . La stima della varianza degli errori è 2 0 784ˆ .σ = e la devianza della variabile esplicativa è 7154.420⋅ . Di conseguenza si ha ( ) 0 784 7154 42 0 011ˆES . / . .β ⋅= = . La stima della pendenza è ˆ 0.080β = − e pertanto il valore osservato della statistica test è ( ) 7 273ˆ ˆES .β β = − . Dalle tavole risulta che la probabilità che una variabile casuale 23t sia minore di 2.807− è 0.005. Quindi il p-valore del test è inferiore a 0.005 e l’ipotesi nulla può essere respinta per qualsiasi livello di significatività non inferiore a 0.005. La temperatura quindi contribuisce a spiegare le variazioni nella produzione di vapore.

In alcune circostanze si può avere interesse a sottoporre a test

un’ipotesi nulla sull’intercetta. Con procedimento analogo a quello seguito per il test sulla pendenza, è possibile dimostrare che se l’ipotesi nulla è

Page 449: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 435

0 0:H α α= ,

la statistica

0

2 2 2 2

1

ˆ 1/n

ii

A

n x x nx

α

σ=

+ − ∑

ha una distribuzione t di Student con 2n − gradi di libertà e può quindi essere utilizzata come statistica test.

Anche nel caso dell’intercetta è utile sottoporre a test l’ipotesi nulla 0 : 0H α = verificando la significatività della stima di α . In tal modo si verifica se la retta di regressione passa per l’origine. Quando si sottopongono a test le ipotesi

0 : 0H α = verso 1 : 0H α ≠ ,

il valore osservato della statistica test è

( )ˆ

-ratioˆ

tESαα

= ,

dove

( ) 2 2 2 2

1

ˆ ˆ 1/n

ii

ES n x x nxα σ=

= + − ∑ .

Esempio 18.3 (continuazione). Il modello di regressione dell’esempio 18.3 spiega il prezzo delle stampanti laser in funzione della velocità di stampa. Si vuole verificare la significatività dei coefficienti di regressione al livello del 5%.

Riguardo all’intercetta le ipotesi da sottoporre a test sono

0 : 0H α = verso 1 : 0H α ≠ .

Poiché il test è bidirezionale e 12n = , la regione critica e la regione di accettazione risultano

Page 450: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 436

R.A. : ( )ˆ ˆ 2.228ESα α ≤ ,

R.C. : ( )ˆ ˆ 2.228ESα α > ,

dove 2.228 è il percentile di una variabile casuale 10t che si lascia a destra un’area pari a 0.025.

Quando aumenta la velocità di stampa è ragionevole aspettarsi un incremento del prezzo, sicché le ipotesi sulla pendenza da sottoporre a test sono

0 : 0H β = verso 1 : 0H β > .

La regione critica e la regione di accettazione sono

R.A. : ( )ˆ ˆ 1.812ESβ β ≤ ,

R.C. : ( )ˆ ˆ 1.812ESβ β > ,

dove 1.812 è il percentile di una variabile casuale 10t che si lascia a destra un’area pari a 0.05.

Le stime dei parametri sono ˆ 165.971α = − , ˆ 49.687β = e 2ˆ 24 823.404σ ⋅= ; 12n = , 12 33x .= e la devianza della variabile

indipendente è 63.653. Di conseguenza gli errori standard risultano

( ) 2ˆ 24 823.404 1/12 12.33 63.653 247.703ES α ⋅ = × + = ,

( ) 24 823.404ˆ 19.74863.653

ES β⋅

= = ,

e i t-ratio sono

( )ˆ 165.971 0.670

ˆ 247.703ESαα

= − = − e ( )ˆ 49.687 2.516

ˆ 19.748ESββ

= = .

Nel caso dell’intercetta il valore osservato della statistica test si trova nella regione di accettazione, sicché l’ipotesi nulla non è respinta; mentre per la pendenza il valore osservato della statistica test cade nella

Page 451: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 437

regione critica e pertanto l’ipotesi nulla è respinta. Nel caso di questi dati la retta di regressione passa per l’origine.

Quando l’ipotesi nulla 0α = non è respinta, il modello di regressione risulta

(18.13) i i iY xβ ε= + .

Essendo cambiato il modello si rende necessario stimare nuovamente la pendenza. E’ possibile dimostrare che la stima dei minimi quadrati di β nel modello (18.13) è

(18.14) 1

2

1

ˆ

n

i ii

n

ii

x y

xβ =

=

=∑

∑.

Esempio 18.3 (continuazione). In seguito all’esito del test

sull’intercetta il modello di regressione, che spiega il prezzo delle stampanti in funzione della velocità di stampa, è riformulato come nella (18.13). Dato che 69 252i ix y ⋅=∑ e 2 1888ix ⋅=∑ , applicando la (18.14) si ottiene la stima della pendenza

69 252ˆ 36.6801888

β⋅

⋅= = .

La retta di regressione stimata risulta 36 680i iy . x= ed è illustrata nella figura 18.15.

Quando s’illustrano i risultati, ottenuti stimando un modello di regressione, è prassi riportare anche gli errori standard degli stimatori nel modo seguente

(18.15) ( ) ( )( ) ( )

i iˆˆES ES

ˆˆy xα β

α β= + .

In tal modo il lettore può verificare personalmente la significatività dei coefficienti stimati.

Page 452: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 438

0 5 10 150

200

400

600

800

Esempio 18.2 (continuazione). I risultati ottenuti nella stima del modello di regressione, che spiega la resistenza a trazione della carta in funzione della percentuale di fibra di legno, in base alla (18.15) hanno la rappresentazione seguente

(1 10) (0 19)4 41 3 47i i

. .y . . x .= +

18.8 La previsione

Una delle finalità per le quali si costruisce un modello di regressione è la previsione. Si supponga di aver stimato il modello di regressione

i i iY xα β ε= + + ,

sulla base di n osservazioni, ottenendo il modello empirico ˆˆ ˆi iy xα β= + .

L’obiettivo è prevedere il valore della variabile dipendente quando la variabile esplicativa assume il valore 1nx + . In corrispondenza di

1nX x += si ha

iy

ix

ˆ 36.68y x=

Figura 18.15 Retta di regressione stimata nell’esempio 18.3

Page 453: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 439

1 1 1n n nY xα β ε+ + += + + .

La previsione presenta delle analogie con la teoria della stima; tuttavia l’obiettivo in questo caso è produrre un’approssimazione del valore di una variabile casuale e non di una costante.

La variabile 1nY + è costituita da una parte deterministica, 1nxα β ++ e una componente casuale 1nε + . La migliore previsione del

valore di una variabile casuale è il suo valore atteso. Poiché, per ipotesi, il valore atteso di 1nε + è nullo, la sua previsione è 1ˆ 0nε + = . Di conseguenza la previsione di 1nY + si risolve nella stima del suo valore atteso

[ ]1 1n nE Y xα β+ += + .

L’obiettivo diventa quindi stimare al meglio il punto sulla retta di regressione corrispondente a 1nx + . Per il teorema di Gauss Markov, gli stimatori dei minimi quadrati di α e β sono i più efficienti nell’insieme degli stimatori lineari e non distorti. Sulla base di questo risultato è possibile dimostrare che 1nA Bx ++ è, nell’ambito degli stimatori lineari e non distorti, il migliore stimatore per [ ]1nE Y + . Si motiva così il ricorso al previsore di 1nY +

1 1n nY A Bx+ += + .

Il previsore, analogamente allo stimatore, è una statistica campionaria che ha la funzione di sintetizzare le informazioni contenute nel campione al fine di produrre una previsione del valore di una variabile casuale. La previsione puntuale di 1nY + è data dal valore assunto dal previsore in corrispondenza del campione osservato

1 1ˆˆˆn ny xα β+ += + .

Come nella stima di un parametro emerge l’esigenza di integrare l’informazione fornita da una stima puntuale mediante la costruzione di un intervallo di confidenza, a maggior ragione nell’ambito della previsione un singolo valore può costituire un’informazione insufficiente se l’obiettivo è predire il valore di una variabile casuale.

Page 454: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 440

E’ quindi opportuno procedere alla costruzione di un intervallo di previsione.

Definito

(18.16) ( )

( )

212 2

2

1

1ˆ 1 np n

ii

x xs

n x xσ +

=

− = + + −

∑,

è possibile dimostrare che se gli errori sono distribuiti come variabili casuali normali e indipendenti si ha

1 122

ˆn n

n

p

Y Y ts

+ +−

− ∼ .

Di conseguenza la variabile ( ) 21 1

ˆn n pY Y s+ +− può essere utilizzata

come quantità pivot per la costruzione di un intervallo di previsione. Con sviluppi analoghi a quelli presentati per la costruzione degli intervalli di confidenza (capitolo 14), si ottiene la stima dell’intervallo di previsione al livello 1 α− . Essa è dato da

( )2 21 2, / 2 1 2, / 2ˆ ˆ,n n p n n py t s y t sα α+ − + −− + .

In alcune circostanze può essere utile costruire un intervallo di confidenza anche per il valore atteso di 1nY + . Si dimostra che, al livello 1 α− , la stima dell’intervallo di confidenza è data da

( )2 21 2, / 2 1 2, / 2ˆ ˆ,n n M n n My t s y t sα α+ − + −− + ,

dove

(18.17) ( )

( )

212 2

2

1

1ˆ nM n

ii

x xs

n x xσ +

=

− = + −

∑.

Page 455: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 441

L’intervallo di previsione per 1nY + è più ampio dell’intervallo di confidenza per la media di 1nY + perché deve tener conto sia del grado di incertezza nella stima di [ ]1nE Y + sia della variabilità di 1nY + intorno al suo valore atteso.

Esempio 18.2 (continuazione). Sulla base del modello di

regressione stimato nell’esempio 18.2, si vuole prevedere la resistenza a trazione della carta quando la percentuale di fibra di legno è

1 8.5nx + = . Il modello di regressione stimato è

ˆ 4.41 3.47i iy x= + .

Di conseguenza la previsione puntuale di 1nY + , corrispondente a 1 8.5nx + = , è data da

1ˆ 4.41 3.47 8.5 33.91ny + = + × = .

La previsione puntuale della resistenza a trazione della carta, quando la pasta contiene fibra di legno in percentuale 8.5%, è pari a 33.91 newton per centimetro quadrato. Il valore 33.91 costituisce, al tempo stesso, anche una stima del valore atteso di 1nY + , ossia della resistenza media a trazione che si ha se nella pasta della carta vi è l’8.5% di fibra di legno.

Per costruire l’intervallo di previsione, al livello del 95%, è necessario calcolare 2

ps . Ricordando che 14n = , 5.21x = , 2ˆ 3.49σ = e ( )2 99.30ix x− =∑ e applicando la (18.16) si ha

( )22 8.5 5.2113.49 1 4.12

14 99.30ps −

= × + + =

.

Il valore 12,0.025t , tale che una variabile casuale 12t assuma valori maggiori con probabilità 0.025, è pari a 2.179. Di conseguenza l’estremo inferiore dell’intervallo di previsione per 1nY + è dato da

21 2, / 2ˆ 33.91 2.179 4.12 29.49n n py t sα+ −− = − × = ,

Page 456: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 442

e l’estremo superiore è dato da 2

1 2, / 2ˆ 33.91 2.179 4.12 38.33n n py t sα+ −+ = + × = .

Quando la percentuale di fibra di legno nella pasta della carta è 8.5, la resistenza a trazione è compresa fra 29.49 e 38.33 newton per centimetro quadrato con probabilità 0.95.

La figura 18.16 illustra l’intervallo di previsione per 1nY + e la sua distribuzione stimata.

5 6 7 8 9 10

25

30

35

Per costruire l’intervallo di confidenza per la media è necessario calcolare 2

Ms . Applicando la (18.17) si ottiene

( )22 8.5 5.2113.49 0.63

14 99.30Ms −

= × + =

.

Gli estremi dell’intervallo di confidenza al 95% sono dati da 2

1 2, / 2ˆ 33.91 2.179 0.63 32.18n n My t sα+ −− = − × = , 2

1 2, / 2ˆ 33.91 2.179 0.63 35.64n n My t sα+ −+ = + × = .

iY

ix ˆ 4.41 3.47y x= +

Figura 18.16 Intervallo di previsione per 1nY + nell’esempio 18.2

Page 457: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 443

L’intervallo di confidenza per il valore atteso della resistenza a trazione della carta, corrispondente a una percentuale di fibra di legno pari a 8.5, è (32.18, 35.64) newton per centimetro quadrato.

Questo intervallo è molto più piccolo dell’intervallo di previsione per 1nY + , perché non tiene conto della variabilità dovuta al termine di errore 1nε + . La figura 18.17 illustra l’intervallo di confidenza per il valore atteso di 1nY + e un’approssimazione della distribuzione dello stimatore. La variabilità è molto minore di quella della distribuzione stimata di 1nY + .

5 6 7 8 9 10

25

30

35

18.9 Esercizi

Esercizio 18.1. L’anno 2001 è stato particolarmente sfavorevole per il mercato azionario. La tabella 18.6 riporta la percentuale di titoli azionari contenuti in dieci fondi di investimento e il rendimento annuale (YTD) calcolato al 31 dicembre 2001. Si vuole spiegare, mediante un modello di regressione lineare, le variazioni del rendimento annuale ( )Y in funzione della percentuale di titoli azionari

compresa nel fondo ( )X .

Figura 18.17 Intervallo di confidenza per la media di 1nY +

nell’esempio 18.2

iY

ix ˆ 4.41 3.47y x= +

Page 458: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 444

Tabella 18.6 – Rendimento annuale (YTD) calcolato al gennaio 2001 e percentuale di titoli azionari di 10 fondi di investimento.

Rendimento annuale (YTD)

Percentuale di titoli azionari

Rendimento annuale (YTD)

Percentuale di titoli azionari

3.17 9.2 -3.18 50.4 4.34 10.5 -4.06 56.1 1.42 20.4 -4.34 69.2

-0.08 33.1 -7.09 80.0 -2.87 41.3 -8.49 89.9

i) Rappresentare i dati in un grafico a dispersione. ii) Stimare la retta di regressione e commentare il risultato. iii) Stimare la varianza degli errori. iv) Calcolare il coefficiente di determinazione e commentare il

risultato. v) Sottoporre a test l’ipotesi che la percentuale di titoli azionari

compresi nel fondo di investimento non abbia effetto sul rendimento, al livello di significatività del 5%.

Esercizio 18.2. Un negoziante ha rilevato, per 12 diverse

macchine fotografiche, il numero di macchine vendute in un anno e i prezzi in euro. I dati sono riportati nella tabella 18.7. Si vuole spiegare, mediante un modello di regressione lineare, il numero di macchine fotografiche vendute ( )Y in funzione del prezzo ( )X .

Tabella 18.7 – Numero di macchine fotografiche vendute in un anno e prezzo.

Macchine fotografiche

vendute Prezzo

Macchine fotografiche

vendute Prezzo

87 82 88 127 94 99 48 139 31 108 64 142 46 115 41 157 77 120 24 172 58 124 15 198

i) Rappresentare i dati in un grafico a dispersione. ii) Stimare la retta di regressione e commentare il risultato. iii) Stimare la varianza degli errori.

Page 459: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 445

iv) Calcolare il coefficiente di determinazione e commentare il risultato.

v) Sottoporre a test l’ipotesi che il prezzo non abbia effetto sulle vendite e determinare il p-valore del test.

Esercizio 18.3. La tabella 18.8 riporta il condensato, in milligrammi, e l’emissione di monossido di carbonio, in milligrammi, di 25 marche di sigarette (Fonte: McIntyre, 1994, Using Cigarette Data for An Introduction to Multiple Regression, Journal of Statistics Education). Si vuole spiegare, mediante un modello di regressione lineare, l’emissione di monossido di carbonio ( )Y in funzione del

condensato ( )X .

Tabella 18.8 - Monossido di carbonio emesso da 25 marche di sigarette e condensato.

Marca Monossido di carbonio(mg) Condensato (mg)

Alpine 13.6 14.1 Benson&Hedges 16.6 16.0 BullDurham 23.5 29.8 CamelLights 10.2 8.0 Carlton 5.4 4.1 Chesterfield 15.0 15.0 GoldenLights 9.0 8.8 Kent 12.3 12.4 Kool 16.3 16.6 L&M 15.4 14.9 LarkLights 13.0 13.7 Marlboro 14.4 15.1 Merit 10.0 7.8 MultiFilter 10.2 11.4 NewportLights 9.5 9.0 Now 1.5 1.0 OldGold 18.5 17.0 PallMallLight 12.6 12.8 Raleigh 17.5 15.8 SalemUltra 4.9 4.5 Tareyton 15.9 14.5 True 8.5 7.3

Page 460: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 446

Tabella 18.8 - Monossido di carbonio emesso da 25 marche di sigarette e condensato.

Marca Monossido di carbonio(mg) Condensato (mg)

ViceroyRichLight 10.6 8.6 VirginiaSlims 13.9 15.2 WinstonLights 14.9 12.0 i) Rappresentare i dati in un grafico a dispersione. ii) Stimare la retta di regressione e commentare il risultato. iii) Stimare la varianza degli errori. iv) Calcolare il coefficiente di determinazione e commentare il

risultato. v) Sottoporre a test l’ipotesi che le variazioni del condensato non

abbiano effetto sull’emissione di monossido di carbonio, al livello di significatività dell’1%.

vi) Determinare la previsione puntuale per l’emissione di monossido di carbonio per una marca di sigarette con condensato pari a 15.6 milligrammi.

vii) Costruire l’intervallo di previsione per l’emissione di monossido di carbonio per una marca di sigarette con condensato pari a 15.6 milligrammi, al livello del 95%.

viii) Costruire l’intervallo di confidenza per il valore atteso dell’emissione di monossido di carbonio per una marca di sigarette con condensato pari a 15.6 milligrammi, al livello del 95%, e confrontarlo con l’intervallo di previsione. Esercizio 18.4. La tabella 18.9 riporta i risultati di un esperimento

sulla resistenza della gomma all’abrasione (fonte: O.L. Davies e P.L. Goldsmith (editori), 1972, Statistical Methods in Research and Production, Edinburgh: Oliver and Boyd). Per ciascun pezzo di gomma è stata rilevata la durezza, in gradi Shore, e la perdita di peso conseguente all’abrasione, in grammi per ora. Si vuole spiegare, mediante un modello di regressione lineare, la perdita di peso causata dall’abrasione ( )Y in funzione della durezza della gomma ( )X .

Page 461: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 447

Tabella 18.9 – Perdita di peso della gomma, in grammi per ora, dovuta all’abrasione e durezza della gomma, in gradi Shore. Perdita di

peso Durezza Perdita di peso Durezza Perdita di

peso Durezza

372 45 164 64 219 71 206 55 113 68 186 80 175 61 82 79 155 82 154 66 32 81 114 89 136 71 228 56 341 51 112 71 196 68 340 59 55 81 128 75 283 65 45 86 97 83 267 74 221 53 64 88 215 81 166 60 249 59 148 86

i) Rappresentare i dati in un grafico a dispersione. ii) Stimare la retta di regressione e commentare il risultato. iii) Calcolare il coefficiente di determinazione e commentare il

risultato. iv) Sottoporre a test l’ipotesi che le variazioni nella durezza della

gomma non abbiano effetto sulla perdita di peso dovuta all’abrasione, al livello di significatività del 10%.

v) Determinare la previsione puntuale per la perdita di peso della gomma dovuta all’abrasione quando la durezza è 73 gradi Shore.

vi) Costruire l’intervallo di previsione per la perdita di peso della gomma dovuta all’abrasione quando la durezza è 73 gradi Shore, al livello del 90%.

vii) Costruire l’intervallo di confidenza per il valore atteso della perdita di peso della gomma dovuta all’abrasione quando la durezza è 73 gradi Shore, al livello del 90%, e confrontarlo con l’intervallo di previsione. Esercizio 18.5. La figura 5.13 (paragrafo 5.4) illustra il grafico a

dispersione del rendimento in eccesso delle azioni IBM rispetto al rendimento in eccesso di mercato per un periodo di 120 mesi, da gennaio 1978 a dicembre 1987 (fonte: Berndt, 1990, The practice of econometrics, Addison Wesley). Indicando con iy le osservazioni sul

Page 462: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 448

rendimento in eccesso delle azioni IBM e con ix quelle sul rendimento in eccesso di mercato si ha

120

10.85837i

ix

=

=∑ , 120

10.33337i

iy

=

=∑ ,

1202

10.56624i

ix

=

=∑ , 120

2

10.41937i

iy

=

=∑ , 120

10.25825i i

ix y

=

=∑ .

Si vuole spiegare, mediante un modello di regressione lineare, il rendimento in eccesso delle azioni IBM in funzione del rendimento in eccesso di mercato. i) Stimare la retta di regressione e commentare il risultato. ii) Stimare la varianza degli errori. iii) Calcolare il coefficiente di determinazione e commentare il

risultato. iv) Sottoporre a test l’ipotesi che il rendimento in eccesso delle azioni

IBM non dipenda dal rendimento in eccesso di mercato, al livello di significatività del 5%.

v) Sottoporre a test l’ipotesi che la retta di regressione non abbia intercetta al livello di significatività del 5%

vi) Stimare la retta di regressione senza intercetta e commentare il risultato.

Esercizio 18.6. La tabella 5.20 (paragrafo 5.5) riporta il prodotto

interno lordo e la spesa delle famiglie italiane per abbigliamento in miliardi di euro, a prezzi 1995, dal 1970 al 2001 (fonte: Istat). Indicando con iy le osservazioni sulla spesa per abbigliamento e con

ix quelle sul reddito si ha 32

1

24 425ii

x ⋅

=

=∑ , 32

1

1083ii

y ⋅

=

=∑ ,

322

119 471046i

ix ⋅ ⋅

=

=∑ , 32

2

139 095i

iy ⋅

=

=∑ , 32

1871005i i

ix y ⋅

=

=∑ .

Si vuole spiegare, mediante un modello di regressione lineare, la spesa delle famiglie italiane per abbigliamento in funzione del reddito. i) Stimare la retta di regressione e commentare il risultato.

Page 463: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 449

ii) Calcolare il coefficiente di determinazione e commentare il risultato.

iii) Sottoporre a test l’ipotesi che la spesa per abbigliamento non dipenda dal reddito, al livello di significatività dell’1%.

iv) Determinare la previsione puntuale per la spesa per abbigliamento quando il reddito è pari a 900 miliardi di euro.

v) Costruire l’intervallo di previsione per la spesa per abbigliamento quando il reddito è pari a 900 miliardi di euro, al livello del 99%.

vi) Costruire l’intervallo di confidenza per il valore atteso della spesa per abbigliamento quando il reddito è pari a 900 miliardi di euro, al livello del 99%. Esercizio 18.7. Il contenuto di ferro rinvenibile nelle scorie

polverizzate in un altoforno può essere determinato, in laboratorio, con un test chimico o può essere stimato mediante un test magnetico in modo più veloce ed economico. Per capire con quale precisione il test magnetico predice l’esito del test chimico sono state raccolte 53 osservazioni sugli esiti dei due test (fonte: H. V. Roberts, e R. F. Ung, 1982, Conversational statistics with IDA, McGraw-Hill). Indicando con

ix i risultati del test magnetico e con iy quelli del test chimico, sono stati ottenuti i valori seguenti

53

1

1100ii

x ⋅

=

=∑ , 53

1

1120ii

y ⋅

=

=∑ ,

532

1

24 894ii

x ⋅

=

=∑ , 53

2

1

24 990ii

y ⋅

=

=∑ , 53

1

24 456i ii

x y ⋅

=

=∑ .

Si vuole costruire un modello di regressione lineare per predire l’esito del test chimico sulla base dell’esito del test magnetico. i) Stimare la retta di regressione e commentare il risultato. ii) Calcolare il coefficiente di determinazione e commentare il

risultato. iii) Sottoporre a test l’ipotesi che non vi sia legame in media fra

l’esito dei due test e determinare il p-valore del test. iv) Sottoporre a test l’ipotesi che la retta di regressione non abbia

intercetta e determinare il p-valore del test.

Page 464: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 450

v) Determinare la previsione puntuale per l’esito del test chimico quando l’esito del test magnetico è 20.

vi) Costruire l’intervallo di previsione per l’esito del test chimico quando l’esito del test magnetico è 20, al livello del 95%.

vii) Costruire l’intervallo di confidenza per il valore atteso dell’esito del test chimico quando l’esito del test magnetico è 20, al livello del 95%.

Esercizio 18.8. Nell’esempio 17.2 (paragrafo 17.3) è illustrato il grafico a dispersione delle osservazioni rilevate in un appartamento, in 26 settimane consecutive, sulla temperatura esterna in gradi centigradi e sul consumo di gas per riscaldamento in decimetri cubi (i dati sono stati raccolti da D. Whiteside e sono riportati in The Open University, 1984, MDST242 Statistics in Society). Indicando con ix le osservazioni sulla temperatura esterna e con iy quelle sul consumo di gas per riscaldamento si ha

26

1

139.100ii

x=

=∑ , 26

1

3 496.285ii

y ⋅

=

=∑ ,

262

1

950.510ii

x=

=∑ , 26

2

1

497 247.408ii

y ⋅

=

=∑ , 26

1

16 408.193i ii

x y ⋅

=

=∑ .

Si vuole spiegare, mediante un modello di regressione lineare, il consumo di gas in funzione della temperatura esterna. i) Stimare la retta di regressione e commentare il risultato. ii) Calcolare il coefficiente di determinazione e commentare il

risultato. iii) Sottoporre a test l’ipotesi che il consumo di gas non dipenda dalla

temperatura esterna e determinare il p-valore del test. iv) Determinare la previsione puntuale per il consumo di gas per

riscaldamento in una settimana nella quale la temperatura esterna è 7 gradi centigradi.

v) Costruire l’intervallo di previsione per il consumo di gas per riscaldamento in una settimana nella quale la temperatura esterna è 7 gradi centigradi, al livello del 95%.

Page 465: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 451

Costruire l’intervallo di confidenza per il valore atteso del consumo di gas per riscaldamento in una settimana nella quale la temperatura esterna è 7 gradi centigradi, al livello del 95%. 18.10.1 Appendice: Derivazione degli stimatori dei minimi quadrati.

Per determinare le stime dei minimi quadrati si deve minimizzare ( ) ( )2, i iQ y xα β α β= − −∑ rispetto ad α e β . Derivando si ha

( ) ( )

( ) ( )

1

1

,2 ,

,2 .

n

i ii

n

i i ii

Qy x

Qy x x

α βα β

αα β

α ββ

=

=

∂= − − −

∂∂

= − − −∂

Ponendo le derivate uguali a zero e dividendo entrambi i membri per 2− si ottengono le equazioni normali

( )1

ˆˆ 0n

i ii

y xα β=

− − =∑ e ( )1

ˆˆ 0n

i i ii

y x xα β=

− − =∑ .

Distribuendo la sommatoria nella prima equazione normale si ha

1 1

ˆ ˆˆ ˆ 0n n

i ii i

ny nx

y n x ny n n xα β α β= =

= =

− − = − − =∑ ∑

e, dividendo per n e risolvendo rispetto ad α , si ottiene la stima dell’intercetta (18.2).

Sostituendo la (18.2) nella seconda equazione normale si ha

( ) ( ) ( )

( ) ( )

1 1

1 1

ˆ ˆ ˆ

ˆ 0,

n n

i i i i i ii i

n n

i i i ii i

y y x x x y y x x x

y y x x x x

β β β

β

= =

= =

− − − = − − −

= − − − =

∑ ∑

∑ ∑

Page 466: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 452

da cui

( )

( )1

1

ˆ

n

i iin

i ii

y y x

x x xβ =

=

−=

∑.

E’ immediato verificare che il numeratore coincide con la codevianza e il denominatore con la devianza. Infatti per la proprietà della media che la somma degli scarti è nulla si ha

( )( ) ( ) ( ) ( )1 1 1 1

0

n n n n

i i i i i i ii i i i

x x y y y y x x y y y y x= = = =

=

− − = − − − = −∑ ∑ ∑ ∑

e 2

1 1 1 1

0

( ) ( ) ( ) ( )n n n n

i i i i i ii i i i

x x x x x x x x x x x= = = =

=

− = − − − = −∑ ∑ ∑ ∑ ,

il che dimostra la (18.3). 18.10.2 Appendice: Linearità degli stimatori dei minimi quadrati.

Con passaggi analoghi a quelli dell’Appendice 18.10.1 si ottiene la seguente espressione alternativa per la codevianza

(18.18) ( )( ) ( )1 1

n n

i i i ii i

x x y y x x y= =

− − = −∑ ∑ .

Sostituendo la (18.18) nella (18.3) si ha

( )

( )

( )

( )1

2 21 1

1 1

ˆ

n

i i n nii

i i in ni i

i ii i

x x y x xy b y

x x x xβ =

= =

= =

− − = = = − −

∑∑ ∑

∑ ∑

Page 467: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 453

cui corrisponde l’espressione dello stimatore

1

n

i ii

B bY=

= ∑ .

Sostituendo nella (18.2) l’espressione della media campionaria osservata y e quella di β si ha

1 1 1 1

1 1ˆn n n n

i i i i i i ii i i i

y x b y xb y a yn n

α= = = =

= − = − =

∑ ∑ ∑ ∑ ,

cui corrisponde l’espressione dello stimatore

1

n

i ii

A a Y=

= ∑ .

18.10.3 Appendice: Non distorsione degli stimatori dei minimi quadrati.

Per calcolare i valori attesi degli stimatori sono necessarie le seguenti due quantità

( ) ( )( )

2 21 1 1

01 1

1 0n n n

ii in n

i i ii i

i i

x xb x xx x x x= = =

== =

− = = − = − −

∑ ∑ ∑∑ ∑

,

e

( ) ( )( )

( )21

2 21 1 1

1 1

1 1

n

ii

n n ni

i i i i in ni i i

i ii i x x

x xb x x x x xx x x x

=

= = =

= = = −

− = = − = − − ∑

∑ ∑ ∑∑ ∑

.

Page 468: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 454

Ricordando che il valore atteso di iY è [ ]i iE Y xα β= + si ottiene

[ ] [ ] ( )1 1 1

1 1

1 1 10 1

1

1 1

1

.

n n n

i i i i i ii i i

n n

i i ii i

n n n

i i i ii i i

x

E A E a Y a E Y xb xn

xb xb xn n

x b x x b xn

x x

α β

α β

α α β β

α β β α

= = =

= =

= = =

= = =

= = = − + = − + −

= − + −

= + − =

∑ ∑ ∑

∑ ∑

∑ ∑ ∑

Pertanto il valore atteso di A coincide con il parametro α . Inoltre

[ ] [ ] ( )1 1 1 1 1

0 1

,

n n n n n

i i i i i i i i ii i i i i

E B E bY b E Y b x b b xα β α β

β

= = = = =

= =

= = = + = +

=

∑ ∑ ∑ ∑ ∑

sicché anche B è non distorto. 18.10.4 Appendice: Varianze degli stimatori dei minimi quadrati.

Per calcolare le varianze degli stimatori sono necessarie le seguenti quantità

( )

( ) ( )( )

( )

222

2 221 1 12 2

11 1

1 1n n ni

i i nn ni i iii i

ii i

x xb x x

x xx x x x= = =

== =

−= = − =

−− −

∑ ∑ ∑∑∑ ∑

,

e

Page 469: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Il modello di regressione 455

( )( )

2

1

22 2 2

21 1 1

22 2

21 10

11

1 1 2

1 2 1 .

n

ii

n n n

i i i ii i i

n n

i i ni i

iix x

a xb x b xbn n n

xx b x bn n n x x

=

= = =

= =

=== −

= − = + −

= + − = +−

∑ ∑ ∑

∑ ∑∑

La varianza di A è data da

e la varianza di B risulta

( ) ( )( )

22 2 2

21 1 1

1

n n n

i i i i i ni i i

ii

Var B Var bY b Var Y bx x

σσ= = =

=

= = = = −∑ ∑ ∑

∑.

( ) ( )

( )

2 2 2

1 1 1

22

2

1

1

n n n

i i i i ii i i

n

ii

Var A Var a Y a Var Y a

xn x x

σ

σ

= = =

=

= = = = + −

∑ ∑ ∑

Page 470: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...
Page 471: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Tavole statistiche Note per l’utilizzo delle tavole Tavola della variabile casuale normale standardizzata

La tavola 1 riporta i valori della funzione di ripartizione ( ) ( )z P Z zΦ = ≤ di una variabile casuale normale standardizzata ( )0,1Z N∼ per valori di z non-negativi. Per poter utilizzare la tavola il valore z deve essere rappresentato in modo da avere al massimo due cifre decimali. Il valore di z si ottiene sommando il valore sulla prima colonna con quello sulla prima riga. Il valore corrispondente nella tavola è la funzione di ripartizione in z ossia ( )zΦ .

Ad esempio il valore 1.28 è scomposto come segue 1.28 1.2 0.08= + . La probabilità che Z sia minore di 1.28 è data dal valore che si trova nella cella in cui si incrociano la riga intestata 1.2 e la colonna intestata 0.08. Si ha ( )1.28 0.8997Φ = .

Determinazione della funzione di ripartizione di una variabile casuale normale standardizzata in 1.28.

z 0.00 0.01 0.08 0.09 0.0 0.5000 0.5040 0.5319 0.5359 0.1 0.5398 0.5438 0.5714 0.5753

1.2 0.8849 0.8869 0.8997 0.9015

Se invece si vuole determinare z tale che ( )zΦ assuma un particolare valore, si individua inizialmente la probabilità all’interno della tavola, quindi si ricostruisce il valore di z. Si supponga si essere interessati al valore di z tale che ( ) 0.9750zΦ = . La probabilità 0.9750 si trova nella cella dove si incrocia la riga intestata 1.9 con la colonna intestata 0.06, pertanto il valore è 1.9 0.06 1.96z = + = .

Quando non è possibile individuare una determinata probabilità sulla tavola si può procedere con l’interpolazione. Non è possibile ad esempio individuare sulla tavola la probabilità 0.9500; tuttavia si ha ( )1.64 0.9495Φ = e ( )1.64 0.9505Φ = , pertanto z può essere approssimato nel modo seguente ( )1.64 1.65 / 2 1.645z = + = .

Page 472: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 458

Determinazione del percentile della variabile casuale normale standardizzata tale che la funzione di ripartizione valga 0.975.

z 0.00 0.01 0.06 0.0 0.5000 0.5040 0.5239 0.1 0.5398 0.5438 0.5636

1.9 0.9713 0.9719 0.975

Tavola della variabile casuale chi-quadrato

La tavola 2 riporta i percentili della variabile casuale 2nχ al variare dei gradi di

libertà e per diverse probabilità. Con α è indicata la probabilità che la variabile casuale 2

nχ assuma valori maggiori del percentile, ossia l’area sotto la funzione di densità a destra del percentile. L’intestazione di ogni colonna è data dalla probabilità α e l’intestazione di ogni riga è data dai gradi di libertà n. La cella corrispondente fornisce il percentile 2

,n αχ tale che ( )2 2,n nP αχ χ α≥ = .

Ad esempio il percentile 22,0.05χ tale che una variabile casuale 2

2χ assuma valori maggiori con probabilità 0.05, ( )2 2

2 2,0.05 0.05P χ χ≥ = , è 22,0.05 5.99χ = .

Determinazione del percentile di una variabile casuale 2

2χ tale che l’area nella coda di destra sia 0.05.

α

n 0.995 0.990 0.050

1 0.04393 0.03157 3.84 2 0.0100 0.0201 5.99

Tavola della variabile casuale t di Student

La tavola 3 riporta i percentili della variabile casuale t di Student al variare dei gradi di libertà n e per diverse probabilità. Con α è indicata la probabilità che la variabile casuale nt assuma valori maggiori del percentile, ossia l’area sotto la funzione di densità a destra del percentile. L’intestazione di ogni colonna è data dalla probabilità α e l’intestazione di ogni riga è data dai gradi di libertà n. La cella corrispondente fornisce il percentile ,nt α tale che ( ),n nP t t α α≥ = .

Ad esempio il percentile 15,0.025t tale che una variabile casuale 15t assuma valori maggiori con probabilità 0.025, ( )15 15,0.025 0.025P t t≥ = , è 15,0.025 2.131t = .

Page 473: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Tavole statistiche 459

Determinazione del percentile di una variabile casuale 15t tale che l’area nella coda di destra sia 0.025.

α n 0.100 0.050 0.025 0.010 0.005

1 3.078 6.314 12.706 31.821 63.657 2 1.886 2.920 4.303 6.965 9.925

15 1.341 1.753 2.131 2.602 2.947

Page 474: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 460

Tavola 1 – Funzione di ripartizione della variabile casuale normale standardizzata

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000

z

( )zφ

0

Φ(z)

Page 475: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Tavole statistiche 461

Tavola 2 – Percentili della variabile casuale Chi-quadrato

α n 0.995 0.990 0.975 0.950 0.900 0.100 0.050 0.025 0.010 0.005

1 0.04393 0.03157 0.03982 0.02393 0.0158 2.71 3.84 5.02 6.63 7.88 2 0.0100 0.0201 0.0506 0.103 0.211 4.61 5.99 7.38 9.21 10.60 3 0.072 0.115 0.216 0.352 0.584 6.25 7.81 9.35 11.34 12.84 4 0.207 0.297 0.484 0.711 1.06 7.78 9.49 11.14 13.28 14.86 5 0.412 0.554 0.831 1.145 1.61 9.24 11.07 12.83 15.09 16.75 6 0.676 0.872 1.24 1.64 2.20 10.64 12.59 14.45 16.81 18.55 7 0.989 1.24 1.69 2.17 2.83 12.02 14.07 16.01 18.48 20.28 8 1.34 1.65 2.18 2.73 3.49 13.36 15.51 17.53 20.09 21.95 9 1.73 2.09 2.70 3.33 4.17 14.68 16.92 19.02 21.67 23.59

10 2.16 2.56 3.25 3.94 4.87 15.99 18.31 20.48 23.21 25.19 11 2.60 3.05 3.82 4.57 5.58 17.28 19.68 21.92 24.72 26.76 12 3.07 3.57 4.40 5.23 6.30 18.55 21.03 23.34 26.22 28.30 13 3.57 4.11 5.01 5.89 7.04 19.81 22.36 24.74 27.69 29.82 14 4.07 4.66 5.63 6.57 7.79 21.06 23.68 26.12 29.14 31.32 15 4.60 5.23 6.26 7.26 8.55 22.31 25.00 27.49 30.58 32.80 16 5.14 5.81 6.91 7.96 9.31 23.54 26.30 28.85 32.00 34.27 17 5.70 6.41 7.56 8.67 10.09 24.77 27.59 30.19 33.41 35.72 18 6.26 7.01 8.23 9.39 10.86 25.99 28.87 31.53 34.81 37.16 19 6.84 7.63 8.91 10.12 11.65 27.20 30.14 32.85 36.19 38.58 20 7.43 8.26 9.59 10.85 12.44 28.41 31.41 34.17 37.57 40.00 21 8.03 8.90 10.28 11.59 13.24 29.62 32.67 35.48 38.93 41.40 22 8.64 9.54 10.98 12.34 14.04 30.81 33.92 36.78 40.29 42.80 23 9.26 10.20 11.69 13.09 14.85 32.01 35.17 38.08 41.64 44.18 24 9.89 10.86 12.40 13.85 15.66 33.20 36.42 39.36 42.98 45.56 25 10.52 11.52 13.12 14.61 16.47 34.38 37.65 40.65 44.31 46.93 26 11.16 12.20 13.84 15.38 17.29 35.56 38.89 41.92 45.64 48.29 27 11.81 12.88 14.57 16.15 18.11 36.74 40.11 43.19 46.96 49.64 28 12.46 13.56 15.31 16.93 18.94 37.92 41.34 44.46 48.28 50.99 29 13.12 14.26 16.05 17.71 19.77 39.09 42.56 45.72 49.59 52.34 30 13.79 14.95 16.79 18.49 20.60 40.26 43.77 46.98 50.89 53.67 40 20.71 22.16 24.43 26.51 29.05 51.81 55.76 59.34 63.69 66.77 50 27.99 29.71 32.36 34.76 37.69 63.17 67.50 71.42 76.15 79.49 60 35.53 37.48 40.48 43.19 46.46 74.40 79.08 83.30 88.38 91.95 70 43.28 45.44 48.76 51.74 55.33 85.53 90.53 95.02 100.4 104.2 80 51.17 53.54 57.15 60.39 64.28 96.58 101.9 106.6 112.3 116.3 90 59.20 61.75 65.65 69.13 73.29 107.6 113.2 118.1 124.1 128.3

100 67.33 70.06 74.22 77.93 82.36 118.5 124.3 129.6 135.8 140.2

f(x)

2

,n αχ α

x

Page 476: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 462

Tavola 3 – Percentili della variabile casuale t di Student

α n 0.100 0.050 0.025 0.010 0.005

1 3.078 6.314 12.706 31.821 63.657 2 1.886 2.920 4.303 6.965 9.925 3 1.638 2.353 3.182 4.541 5.841 4 1.533 2.132 2.776 3.747 4.604 5 1.476 2.015 2.571 3.365 4.032 6 1.440 1.943 2.447 3.143 3.707 7 1.415 1.895 2.365 2.998 3.499 8 1.397 1.860 2.306 2.896 3.355 9 1.383 1.833 2.262 2.821 3.250 10 1.372 1.812 2.228 2.764 3.169 11 1.363 1.796 2.201 2.718 3.106 12 1.356 1.782 2.179 2.681 3.055 13 1.350 1.771 2.160 2.650 3.012 14 1.345 1.761 2.145 2.624 2.977 15 1.341 1.753 2.131 2.602 2.947 16 1.337 1.746 2.120 2.583 2.921 17 1.333 1.740 2.110 2.567 2.898 18 1.330 1.734 2.101 2.552 2.878 19 1.328 1.729 2.093 2.539 2.861 20 1.325 1.725 2.086 2.528 2.845 21 1.323 1.721 2.080 2.518 2.831 22 1.321 1.717 2.074 2.508 2.819 23 1.319 1.714 2.069 2.500 2.807 24 1.318 1.711 2.064 2.492 2.797 25 1.316 1.708 2.060 2.485 2.787 26 1.315 1.706 2.056 2.479 2.779 27 1.314 1.703 2.052 2.473 2.771 28 1.313 1.701 2.048 2.467 2.763 29 1.311 1.699 2.045 2.462 2.756 30 1.310 1.697 2.042 2.457 2.750 40 1.303 1.684 2.021 2.423 2.704 50 1.299 1.676 2.009 2.403 2.678 60 1.296 1.671 2.000 2.390 2.660 70 1.294 1.667 1.994 2.381 2.648 80 1.292 1.664 1.990 2.374 2.639 90 1.291 1.662 1.987 2.368 2.632

100 1.290 1.660 1.984 2.364 2.626 120 1.289 1.658 1.980 2.358 2.617 ∞ 1.282 1.645 1.960 2.326 2.576

f(t)

t ,nt α

α

Page 477: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Soluzioni 2 Distribuzioni di frequenza Esercizio 2.1: Distribuzione di frequenza e frequenza relativa del consumo pro-capite di burro.

im 1 2 3 4 6 7 9

in 3 3 4 1 2 2 1

if 0.1875 0.1875 0.2500 0.0625 0.1250 0.1250 0.0625

Esercizio 2.2: Distribuzione di frequenza e frequenza relativa delle gradazioni alcoliche dei vini rossi.

im 11.0 11.5 12.0 12.5

in 5 11 2 3

if 0.238 0.524 0.095 0.143

Esercizio 2.3: Calcoli per la costruzione dell’istogramma degli investimenti in titoli azionari.

Classi if iA ih 0 |– 5 0.082 5 0.016

5 |– 10 0.653 5 0.131 10 |– 15 0.204 5 0.041 15 |– 25 0.061 10 0.006

0 5 10 15 20 250.0

0.02

0.04

0.06

0.08

0.10

0.12

Esercizio 2.4: Calcoli per la costruzione dell’istogramma dei depositi in conto corrente.

Classi if iA ih 0 |– 2 0.15 2 0.075 2 |– 5 0.35 3 0.117

5 |– 10 0.30 5 0.060 10 |– 20 0.20 10 0.020

0 5 10 15 200.0

0.02

0.04

0.06

0.08

0.10

0.12

Page 478: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 464

Esercizio 2.5: Calcoli per la costruzione dell’istogramma della durata delle lampadine da 100 Watt.

Classi if iA ih 6 |– 7 0.08 1 0.08 7 |– 8 0.21 1 0.21 8 |– 9 0.38 1 0.38

9 |– 10 0.21 1 0.21 10 |– 12 0.12 2 0.06

6 7 8 9 10 11 12

0.0

0.1

0.2

0.3

Esercizio 2.6: Calcoli per la costruzione dell’istogramma dei rendimenti dei fondi.

Classi if iA ih -1.0 |– 1.0 0.1125 2 0.056 1.0 |– 2.0 0.2875 1 0.288 2.0 |– 3.0 0.3000 1 0.300 3.0 |– 4.0 0.1000 1 0.100 4.0 |– 6.0 0.1125 2 0.056 6.0 |– 8.0 0.0375 2 0.019

8.0 |– 10.0 0.0375 2 0.019 10.0 |– 12.0 0.0125 2 0.006

0 2 4 6 8 10 120.0

0.05

0.10

0.15

0.20

0.25

0.30

4 1 5 5 5 5 7 6 1 2 6 8 6 0 2 7 5 7 4 4 8 5 6 8

Esercizio 2.9: Diagramma stelo e foglia dei consumi di patate

8 1 4 7

Esercizio 2.10: Diagramma stelo e foglia dei consumi di carne

9 1 7 9 10 7 10 1 5 ╪ ╪ 15 2 15 5 ╪ 23 1 ╪ 29 9 ╪ 32 9

Page 479: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Soluzioni 465

6 2 4 0 4 6 7 1 0 2 3 3 8 5 2 1 3 3 6 9 3 7 3 3

Esercizio 2.11: Diagramma stelo e foglia dei consumi di latte e latticini

10 0 4

Esercizio 2.12: Diagramma stelo e foglia dei consumi di vino

4 2 2 11 4 5 5 8 12 1 6 3 5 13 1 7 14 5 15 2 16 17 18 9 19 5 20 6

3 Indici di posizioneEsercizio 3.1: x = 3.4, med = 3.5, moda = 4. Esercizio 3.2: x = 11.57, med = 11.5, moda = 11.5. Esercizio 3.3: x = 5.22, med = 4.9, moda = 4.7. Distribuzione di frequenza della gradazione alcolica di alcune birre prodotte in Italia.

im 4.5 4.6 4.7 4.8 5.0 5.2 5.6 6.5 7.2

in 2 1 5 3 3 2 2 3 1

Esercizio 3.4: x = 66.25. Esercizio 3.5: x = 8.88. Esercizio 3.6: x = 6.625. Esercizio 3.7: x = 8.65. Esercizio 3.8: 1 2 3 40.0400, 0.0250, 0.0200, 0.0075h h h h= = = = ; x = 16.75.

Esercizio 3.9: 1 2 3 40.0012, 0.0072, 0.0076, 0.0014h h h h= = = = ; x = 2002.5.

Esercizio 3.10: Studenti di sesso femminile x = 104.00; Studenti di sesso maschile x = 99.76.

Esercizio 3.11: x = 78.92, med = 74. Esercizio 3.12: x = 124.69, med = 117.5. Esercizio 3.13: x = 29.94, med = 23.

Page 480: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 466

4 Indici di variabilitàEsercizio 4.1: 2s =0.94, σ =0.97. Esercizio 4.2: 2s =0.22, σ =0.47. Esercizio 4.3: Matematica 2s =5.12, σ =2.26, CV = 0.091; Inferenza 2s =5.06,

σ =2.25, CV = 0.091. Esercizio 4.4: σ =47.35. Esercizio 4.5: σ =3.85. Esercizio 4.6: σ =4.735. Esercizio 4.7: σ =12.28. Esercizio 4.8: σ =55.28, CV = 0.028. Esercizio 4.9: 1 2 3 40.0361, 0.0738, 0.0303, 0.0049h h h h= = = = ; x =12.93,

σ =10.18. Esercizio 4.10: 1 2 3 40.010, 0.080, 0.070, 0.015h h h h= = = = ; x =350.38, σ =5.44,

CV = 0.016. Esercizio 4.11: σ =1.23, CV = 0.142. Esercizio 4.12: Studenti di sesso femminile σ =5.89, CV = 0.057; Studenti di sesso

maschile σ =7.95, CV = 0.080. Esercizio 4.13: σ =0.76, MAD =0.37, DQ =0.90, ( ) ( )1nx x− =2.70.

Esercizio 4.14: σ =28.84, MAD =20.76, DQ =27.00, ( ) ( )1nx x− =114.00.

Esercizio 4.15: σ =42.70, MAD =38.55, DQ =53.50, ( ) ( )1nx x− =144.00.

Esercizio 4.16: σ =19.95, MAD =19.27, DQ =29.00, ( ) ( )1nx x− =61.00.

5 Box-plot e altre rappresentazioni grafiche

Esercizio 5.1: Box-plot dei tempi nella catena di montaggio ( ) ( )1 2, 29,125r r = ,

( ) ( )1 2, 7,161R R = − ,

osservazioni distanti { }130= 60

80

100

120

60

80

100

120

Page 481: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Soluzioni 467

Esercizio 5.2: Box-plot dei consumi di cereali ( ) ( )1 2, 58,90r r = ,

( ) ( )1 2, 46,102R R = , osservazioni molto distanti { }103,121=

60

70

80

90

100

110

120

Grecia

Italia

oo

60

70

80

90

100

110

120

Esercizio 5.3: Box-plot dei consumi di patate ( ) ( )1 2, 19.5,127.5r r = ,

( ) ( )1 2, 21.0,168.0R R = − ,

osservazioni distanti { }155= 40

60

80

100

120

140

160 Portogallo

40

60

80

100

120

140

160

Esercizio 5.4: Box-plot dei consumi di latte e latticini ( ) ( )1 2, 14.75, 228.75r r = 50

100

150

200

50

100

150

200

Esercizio 5.5: Box-plot dei consumi di vino ( ) ( )1 2, 30.5,85.5r r = −

0

20

40

60

0

20

40

60

Page 482: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 468

Esercizio 5.6: Box-plot dei rendimenti dei fondi ( ) ( )1 2, 1.375,6.425r r = − ,

( ) ( )1 2, 4.300,9.350R R = − , osservazioni distanti { }6.7,7.6,8.4,8.6= , osservazioni

molto distanti { }9.4,11.0= -2

0

2

4

6

8

10

12

-2

0

2

4

6

8

10

12 oo

Esercizio 5.7: Box-plot delle ore di lavoro perdute Anno 1999 ( ) ( )1 2, 27.5,60.5r r = − Anno 2000 ( ) ( )1 2, 15.0,61.0r r = −

( ) ( )1 2, 43.5,89.5R R = − osservazioni molto distanti { }143,165=

ooMarzo

Febbraio

0

50

100

150

1999 2000

6 Calcolo delle probabilitàEsercizio 6.1: (i) 0.40, (ii) 0.65, (iii) 0.75, (iv) 0.25. Esercizio 6.2: (i) 0.81, (ii) 0.19. Esercizio 6.3: (i) 0.20, (ii) 0.30, (iii) 0.70. Esercizio 6.4: 0.82. Esercizio 6.5: (i) 0.250, (ii) 0.077. Esercizio 6.6: (i) 0.385, (ii) 0.615, (iii) 0.462, (iv) 0.154, (v) 0.692. Esercizio 6.7: 0.40. Esercizio 6.8: 0.75. Esercizio 6.9: 0.383. Esercizio 6.10: 0.26. Esercizio 6.11: 0.323. Esercizio 6.12: 0.898. Esercizio 6.13: (i) 0.571, (ii) 0.429, (iii) 0.510, (iv) 0.490. Esercizio 6.14: (i) 0.071, (ii) 0.789, (iii) 0.211.

Page 483: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Soluzioni 469

Esercizio 6.15: (i) 0.4425, (ii), 0.6328, (iii) 0.3672. Esercizio 6.16: (i) 0.040, (ii) 0.625, (iii) 0.375. Esercizio 6.17: (i) 0.385, (ii) 0.240, (iii) 0.487, (iv) 0.273. Esercizio 6.18: (i) 0.050, (ii) 0.588, (iii) 0.362. Esercizio 6.19: (i) 0.155, (ii) 0.355, (iii) 0.490.

7 Variabili casuali Esercizio 7.1: ( )( )( )( )

0, per 0;

0.952, per 0 1;

0.983, per 1 2;

1, per 2.

F x x

F x x

F x x

F x x

= <

= ≤ <

= ≤ <

= ≥

µ = 0.065, 2σ = 0.095. 0.0 0.5 1.0 1.5 2.0 2.5

0.0

0.2

0.4

0.6

0.8

1.0

Esercizio 7.2: ( )( )( )( )( )

0, per 0;

0.27, per 0 1;

0.73, per 1 2;

0.91, per 2 3;

1, per 3.

F x x

F x x

F x x

F x x

F x x

= <

= ≤ <

= ≤ <

= ≤ <

= ≥

µ = 1.09 , 2σ = 0.80.

0 1 2 30.0

0.2

0.4

0.6

0.8

1.0

Esercizio 7.3: ( )( )( )( )( )( )

0, per 1.2;

0.05, per 1.2 0.5;

0.19, per 0.5 1.3;

0.56, per 1.3 2.5;

0.81, per 2.5 4.0;

1, per 4.0.

F x x

F x x

F x x

F x x

F x x

F x x

= < −

= − ≤ < −

= − ≤ <

= ≤ <

= ≤ <

= ≥

µ = 1.736 , 2σ = 2.321.

-1 0 1 2 3 40.0

0.2

0.4

0.6

0.8

1.0

Page 484: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 470

Esercizio 7.4: ( )( )( )( )

0, per 2 / 3;

1/ 2, per 2/3 1;

5 / 6, per 1 2;

1, per 2.

F x x

F x x

F x x

F x x

= <

= ≤ <

= ≤ <

= ≥

µ = 1, 2σ = 2/9. 0.0 0.5 1.0 1.5 2.0 2.5

0.0

0.2

0.4

0.6

0.8

1.0

Esercizio 7.5: µ = 75, σ = 152. Esercizio 7.6: µ = 2424.50 , σ = 377.95. Esercizio 7.7: µ = 66 , σ = 84.5.

8 Variabili casuali doppieEsercizio 8.1: i) Distribuzioni marginali ii) Distribuzioni condizionate X ( )P X Y ( )P Y Y ( )| 0P Y X = Y ( )| 1P Y X = 0 0.36 0 0.57 0 0.639 0 0.531 1 0.64 1 0.43 1 0.361 1 0.469

iii) Distribuzione congiunta in caso di indipendenza.

Y X 0 1 0 0.205 0.155 1 0.365 0.275

Esercizio 8.2: i) Distribuzione congiunta e distribuzioni marginali.

Y X 0 1 0 0.35 0.45 0.80 1 0.05 0.15 0.20 0.40 0.60 1

ii) X e Y non sono indipendenti.

iii) Distribuzioni condizionate. Y ( )| 0P Y X = Y ( )| 1P Y X = 0 0.4375 0 0.250 1 0.5625 1 0.750

Page 485: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Soluzioni 471

Esercizio 8.3: i) Distribuzione congiunta e distribuzioni marginali.

Y X 0 1 2 0 0.33 0.22 0.05 0.60 1 0.15 0.15 0.10 0.40 0.48 0.37 0.15 1

ii) X e Y non sono indipendenti.

iii) Distribuzioni condizionate. Y ( )| 0P Y X = Y ( )| 1P Y X = 0 0.550 0 0.375 1 0.367 1 0.375 2 0.083 2 0.250

Esercizio 8.4: i) Distribuzioni marginali.

X 0 1 Y 2000 2750 3250 4000 ( )P X 0.61 0.39 ( )P Y 0.28 0.24 0.23 0.25

ii) [ ]| 0E Y X = = 3114.75, [ ]| 1E Y X = = 2737.18, [ ]E Y = 2967.50,

iii) X e Y non sono indipendenti. Esercizio 8.5: [ ]| 0E Y X = = 0.07, [ ]| 1E Y X = = 0.50, [ ]E Y = 0.35. Esercizio 8.6: 0.11XYρ = − .

Esercizio 8.7: i) Distribuzione congiunta e distribuzioni marginali.

Y X 0 0.125 0.250 0 0.36 0.14 0.10 0.60 10 0.05 0.10 0.10 0.25 20 0.03 0.04 0.08 0.15

0.44 0.28 0.28 1 ii) 0.387XYρ = . Esercizio 8.8: Distribuzione congiunta e distribuzioni marginali.

Y X 0 1 0 0.103 0.230 0.333 1 0.230 0.437 0.667 0.333 0.667 1

Page 486: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 472

Esercizio 8.9: 2100X Yµ + = , 279X Yσ + = . Esercizio 8.10: (2 / 3) (1/ 3) 23.33X Yµ + = , (2 / 3) (1/ 3) 3.20X Yσ + = .

9 Modelli per variabili casuali discreteEsercizio 9.1: (i) 0.493, (ii) 0.352, (iii) 0.155. Esercizio 9.2: (i) 0.393, (ii) 0.262, (iii) 0.901. Esercizio 9.3: (i) 0.315, (ii) 0.599, (iii) 0.914. Esercizio 9.4: (i) 0.368, (ii) 0.810, (iii) 0.190, (iv) 0.80. Esercizio 9.5: (i) 0.080, (ii) 0.920, (iii) 2. Esercizio 9.6: 0.119. Esercizio 9.7: (i) 0.000495, (ii) 0.000019. Esercizio 9.8: (i) 0.0067, (ii) 0.9933, (iii) 50, (iv) 0.0706. Esercizio 9.9: (i) 0.271, (ii) 0.271, (iii) 0.180, (iv) 0.138. Esercizio 9.10: (i) 0.9502, (ii) 0.0025, (iii) 0.0194, (iv) 180. Esercizio 9.11: (i) 0.0407, (ii) 20. Esercizio 9.12: (i) 0.1275, (ii) 0.7225, (iii) 6.67. Esercizio 9.13: (i) 0.221, (ii) 0.670, (iii) 3.030. 10 Modelli per variabili casuali continueEsercizio 10.1: (i) 0.9099, (ii) 0.1210, (iii) 0.0309, (iv) 0.1210, (v) 0.7889, (iv)

0.1875. Esercizio 10.2: (i) 0.7881, (ii) 0.2119, (iii), 0.1587, (iv) 0.8849, (v) 0.7698. Esercizio 10.3: (i) 0.2514, (ii) 0.0918, (iii) 0.6568. Esercizio 10.4: (i) 0.9987, (ii) 0.9987, (iii) 0.4772. Esercizio 10.5: (i) 0.9418, (ii) 0.7611, (iii) 0.6024. Esercizio 10.6: (i) 0.2033, (ii) 0.2033, (iii) 0.2157. Esercizio 10.7: circa 36 giorni. Esercizio 10.8: (i) 0.0062, (ii) 0.1056, (iii) 0.8882, (iv) 200 euro, (v) 96 euro, (vi)

0.0188. Esercizio 10.9: è preferibile 27 all’esame di economia. Esercizio 10.10: 0.2206. Esercizio 10.11: 0.4840. Esercizio 10.12: 0.9652. Esercizio 10.13: (i) 0.7364, (ii) 0.7165, (iii) 0.1455.

Page 487: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Soluzioni 473

Esercizio 10.14: (i) 0.3935, (ii) 0.0821, (iii) 0.1410. Esercizio 10.15: (i) 0.3679, (ii) 10 minuti. Esercizio 10.16: (i) 0.0273, (ii) 0.56 mesi.

11 Teorema del limite centraleEsercizio 11.1: (i) 0.1335, (ii) 0.7704, (iii) 0.6369. Esercizio 11.2: (i) 0.0268, (ii) 0.0455, (iii) 0.9277.

13 Stima puntuale Esercizio 13.1: (i) 1,nE T µ = , 2,nE T µ = , ( ) 2

,1 /nVar T nσ= , ( ) 2,1 / 2nVar T σ= ,

(ii) ( ) ( )2, 1, / 2n ne Var T Var T n= = , (iii) per 2n = i due stimatori coincidono;

mentre per 2n > è preferibile 1,nT sia perché è più efficiente sia perché è funzione di tutte le osservazioni campionarie.

Esercizio 13.2: 0.9826. Esercizio 13.3: (i) 0.5241, (ii) circa 0.01. Esercizio 13.4: 0.4253. Esercizio 13.5: 188. Esercizio 13.6: 162. Esercizio 13.7: 229. Esercizio 13.8: (i) 1298, (ii) 9604. Esercizio 13.9: (i) 13069, (ii) 16577. Esercizio 13.10: (i) 2263, (ii) 2401. Esercizio 13.11: 35. Esercizio 13.12: (i) 415, (ii) 609. Esercizio 13.13 (i) 390, (ii) 4663. Esercizio 13.14: (i) 968, (ii) 1068, (iii) 1338. 14 Intervalli di confidenzaEsercizio 14.1: (244.92, 249.67). Esercizio 14.2: (32.99, 37.01). Esercizio 14.3: (10.75, 14.45). Esercizio 14.4: (3.45, 3.95).

Page 488: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 474

Esercizio 14.5: (0.656, 0.768). Esercizio 14.6: (0.809, 0.891). Esercizio 14.7: (0.051, 0.099). 15 Test delle ipotesiEsercizio 15.1: (i) 0.0049, (ii) 0.0002. Esercizio 15.2: (i) 0.0162, (ii) 0.0764, (iii) 0.0436, (iv) 0.0314. Esercizio 15.3: 0 1: 4.2 : 4.2H vs Hµ µ≥ < , RC: nt < −1.645, nt = −0.24, 0H non

respinta. Esercizio 15.4: 0 1: 500 : 500H vs Hµ µ≥ < , RC: nt < −1.350, nt = −4.142, 0H

respinta. Esercizio 15.5: 0 1: 15 : 15H vs Hµ µ≤ > , RC: nt >1.708, nt = 2.400, 0H respinta. Esercizio 15.6: 0 1: 200 : 200H vs Hµ µ= < , RC: nt < −1.740, nt = −1.450, 0H non

respinta. Esercizio 15.7: 0 1: 0.90 : 0.90H vs Hµ µ≤ > , RC: nt >1.796, nt = 2.132, 0H

respinta. Esercizio 15.8: 0 1: 12 : 12H vs Hµ µ= ≠ , RC: nt >2.756, nt = −2.739, 0H non

respinta. Esercizio 15.9: 0 1: 8.75 : 8.75H vs Hµ µ= ≠ , RC: nt >1.703, nt = 1.868, 0H

respinta. Esercizio 15.10: 0 1: 0.9 : 0.9H vs Hπ π≥ < , RC: nt < −1.645, nt = −1.10, 0H non

respinta. Esercizio 15.11: 0 1: 0.03 : 0.03H vs Hπ π≤ > , RC: nt > 2.33, nt = 1.99, 0H non

respinta. Esercizio 15.12: 0 1: 0.8 : 0.8H vs Hπ π≥ < , RC: nt < −1.28, nt = −1.68, 0H

respinta. Esercizio 15.13: 0 1: 0.15 : 0.15H vs Hπ π≤ > , RC: nt > 1.645, nt = 3.68, 0H

respinta. Esercizio 15.14: 0 1: 0.18 : 0.18H vs Hπ π= ≠ , RC: nt >1.96, nt = −1.34, 0H non

respinta. Esercizio 15.15: 0 1: 0.65 : 0.65H vs Hπ π= ≠ , RC: nt >2.575, nt = −0.62, 0H non

respinta. Esercizio 15.16: 0 1: 90 : 90H vs Hµ µ≤ > , nt = 1.85, -valorep = 0.0322 Esercizio 15.17: 0 1: 3000 : 3000H vs Hµ µ≥ < , nt = −2.68, -valorep = 0.0037. Esercizio 15.18: 0 1: 10 : 10H vs Hµ µ= ≠ , nt = 1.18, -valorep = 0.2380.

Page 489: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Soluzioni 475

Esercizio 15.19: 0.4052. Esercizio 15.20: -valore 0.005p < .

Esercizio 15.21: 0.010 -valore 0.025p< < .

Esercizio 15.22: 0.025 -valore 0.050p< < .

Esercizio 15.23: 0 1: 0.95 : 0.95H vs Hπ π≥ < , nt = −0.77, -valorep = 0.2206.

Esercizio 15.24: 0.1357. Esercizio 15.25: 0.0233. Esercizio 15.26: 0.1802. Esercizio 15.27: RC: x >36.03, γ = 0.9992.

Esercizio 15.28: 0.9998. Esercizio 15.29: (i) 0.9236, (ii) 0.9686. Esercizio 15.30: (i) RC: p < 0.853, γ = 0.5517, (ii) aumenterebbe.

Esercizio 15.31: RC: p > 0.185, γ = 0.4129.

Esercizio 15.32: 0H respinta.

Esercizio 15.33: 0H non respinta. 16 Test chi-quadratoEsercizio 16.1: 35.26Q = , 0H respinta. Esercizio 16.2: 1.47Q = , 0H non respinta. Esercizio 16.3: 3.50Q = , 0H non respinta. Esercizio 16.4: 30.25Q = , 0H respinta. Esercizio 16.5: 6.02Q = , -valore 0.05p < . Esercizio 16.6: 20.31Q = , 0H respinta. Esercizio 16.7: 9.53Q = , 0H respinta. Esercizio 16.8: 21.00Q = , 0H respinta. 17 Correlazione Esercizio 17.1: XYr = 0.539. Esercizio 17.2: XYr = 0.878. Esercizio 17.3: XYr = 0.432. Esercizio 17.4: XYr = 0.645.

Page 490: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 476

Esercizio 17.5: XYr = 0.665. Esercizio 17.6: XYr = 0.472. Esercizio 17.7: XYr = 0.655. Esercizio 17.8: nt = 1.592, 0H non respinta. Esercizio 17.9: nt = 6.772, 0H respinta. 18 Modello di regressioneEsercizio 18.1: (ii) ˆ 4.666 0.148i iy x= − , (iii) 2σ = 0.688, (iv) 2R = 0.966, (v)

-ratiot = −15.086, 0H respinta.

Esercizio 18.2: (ii) ˆ 134.641 0.596i iy x= − , (iii) 2σ = 360.808, (iv) 2R = 0.529, (v) -ratiot = −3.350, p-valore<0.005 (0.0037).

Esercizio 18.3: (ii) ˆ 2.743 0.801i iy x= + , (iii) 2σ = 1.951, (iv) 2R = 0.917, (v) -ratiot = 15.918, 0H respinta, (vi) 1ny + = 15.239, (vii) (12.271, 18.206), (viii)

(14.562, 15.915). Esercizio 18.4: (ii) ˆ 550.415 5.337i iy x= − , (iii) 2R = 0.544, (iv) -ratiot = −5.782,

0H respinta, (v) 1ny + = 160.847, (vi) (56.104, 265.590), (vii) (141.567, 180.127).

Esercizio 18.5: (i) ˆ 0.00049 0.45682i iy x= − + , (ii) 2σ = 0.00256, (iii) 2R = 0.279,

(iv) -ratiot = 6.763, 0H respinta, (v) -ratiot = −0.106, 0H non respinta, (vi) 0 4561i iy . x= .

Esercizio 18.6: (i) ˆ 7.064 0.054i iy x= − + , (ii) 2R = 0.974, (iii) -ratiot = 33.353, 0H respinta, (iv) 1ny + = 41.171, (v) (37.044, 45.299), (vi) (40.238, 42.104).

Esercizio 18.7: (i) ˆ 8.957 0.587i iy x= + , (ii) 2R = 0.537, (iii) -ratiot = 7.695, p-valore<0.005 (iv) -ratiot = 5.421, p-valore<0.005 (v) 1ny + = 20.689, (vi) (13.670, 27.709), (vii) (19.727, 21.651).

Esempio 18.8: (i) ˆ 194.03 11.133i iy x= − , (ii) 2R = 0.944, (iv) -ratiot = −20.078, p-valore<0.005 (v) 1ny + = 138.369, (vi) (121.613, 155.125), (vii) (135.120, 141.618).

Page 491: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indice analitico A Adattamento - vedi Indice di

determinazione, test sull’adattamento Asimmetria 2.5.2, 2.6, 5.2,11.2.1 - vedi

anche asimmetria, distribuzione simmetrica e asimmetrica

Autocorrelazione 18.2 B Box-plot 5.1, 5.2, 5.3 C Campionamento 2.1, 12.1, 12.2, 13.6,

13.7-13.9, 14.2, 15.4 Campione 2.1, 6.1, 12.1, 12.4, 12.5, 13.1-

13.7, 13.9, 14.1-14.3, 15.2-15.5, 15.11,15.12, 16.2-16.3, 17.1-17.4, 18.3, 18.4, 18.7, 18.8 osservato 12.4, 12.5, 13.2, 13.6, 14.2, 15.4-15.5, 15.12, 16.3, 17.2, 17.3, 18.7, 18.8

Campo di variazione 4.4 Carattere statistico 2.1, 2.2, 2.3, 2.7, 3.1,

16.2-16.3 qualitativo 2.1, 2.2, 2.3, 2.7, 3.4, 16.2-16.3 quantitativo 2.1, 2.2, 2.3, 2.7, 3.1, 16.2-16.3

Causa ed effetto 6.6, 18.1 Censimento 2.1, 12.1, 12.2, 13.9 Classe modale 2.5.2 Classi 2.3, 2.5, 2.6, 3.2.1, 4.2.1, 16.1, 16.2 Codevianza 17.3, 18.3 Coefficiente angolare - vedi pendenza Coefficiente di correlazione – vedi correlazione Coefficiente di variazione 4.2.2 Combinazioni 6.9, 9.3, 9.4 Combinazioni lineari di variabili casuali

8.6, 10.1.2, 13.2, 18.4, 18.7 Concordanza 8.5.2, 8.5.3

Consistenza in probabilità 13.2, 13.3, 13.4, 13.5, 13.7, 14.5, 15.8

Correlazione 8.5.4, 8.5.5, 17.1-17.5, 18.2 Covarianza 8.5.2, 8.5.3, 13.9, 17.2, 17.3 D Densità 2.5.1 Devianza 17.3, 18.3

spiegata 18.6 residua 18.6 le 18.6

Diagramma di Venn 6.2 Diagramma stelo e foglia 2.6 Diagramma - vedi grafico Differenza interquartile 4.4, 5.2, 5.3 Dipendenza lineare 8.5.3, 8.5.4, 8.5.5,

17.1-17.5, 18.2, 18.7 Dipendenza non lineare 8.5.3, 8.5.5, 17.2,

18.2 Discordanza 8.5.3 Dispersione 4.1, 4.2, 7.7, 10.5, 13.2, 17.2,

18.6 Disposizioni 6.9 Distanza 3.2.2, 3.3.2, 4.2.1, 5.3, 18.3 Distorsione - vedi non distorsione Distribuzione asimmetrica 2.5.1, 2.5.2,

10.4, 11.2.1 - vedi anche simmetria e asimmetria

Distribuzione asintotica 13.3, 13.4, 14.5, 14.6, 15.8, 15.9, 16.2-16.4

Distribuzione di frequenza 2.2, 3.2.1, 4.2.1 congiunta 2.7, 17.4, 16.3

Distribuzione di probabilità 7.3, 16.2 condizionata 8.2, 8.3.2 congiunta 6.10, 8.2, 8.3.1, 8.3.3, 8.5.3, 17.5, 16.3-16.4 marginale 8.2, 8.3.1, 8.3.3, 16.3

Distribuzioni simmetriche 2.5.2, 4.3, 5.2, 10.1.1, 10.5, 12.2.2, 15.5, 15.6 - vedi anche simmetria e asimmetria

Disuguaglianza di Cauchy Schwarz 8.5.3, 8.5.5

Page 492: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 478

Disuguaglianza di Chebyshev 4.2.2, 7.7 E Efficienza 9.4, 12.4, 13.2, 13.7, 13.8, 13.9,

18.4 Equazioni normali 18.3, 18.5-18.7, 18.10 Errore quadratico medio 13.2, 13.3, 13.4 Errore standard 18.7 Errori nel modello di regressione 18.2 Errori nel test delle ipotesi 15.4, 15.11 Esperimento casuale 6.2, 6.3, 6.5, 6.9,

6.10, 7.1, 7.2, 7.6, 8.1, 8.2, 8.5, 9.2-9.6, 12.1, 16.2-16.3 con esito dicotomico 9.1, 9.2, 9.3, 9.6 ripetibile 6.3

Estrazione con rimessa 6.6, 6.7, 9.4, 12.4, 13.3, 13.7, 13.8, 13.9

Estrazione in blocco (senza rimessa) 6.6, 6.7, 6.9, 7.2, 8.2, 9.4, 12.4, 13.9

Eventi equiprobabili 6.5 incompatibili 6.2, 6.4, 6.5, 6.7, 6.8, 6.10, 7.3, 8.3.1, 9.3 indipendenti 6.7, 6.10 necessari 6.2, 6.5, 6.10, 8.3.1

Evento 6.2, 6.4, Evento certo 6.2, 6.3, 6.4, 7.4, 8.3.1 Evento elementare 6.2, 6.5, 6.10 Evento impossibile 6.2, 6.3, 6.4, 7.4, 8.3.1 F Fattore di correzione per popolazioni finite 13.9 Frequenza 2.2, 2.3, 2.4, 2.5, 3.2.1, 4.2.1

congiunta 2.7 marginale 2.7

Frequenza relativa 2.4, 2.5, 3.2.1, 4.2, 6.3, 13.4, 14.2, 16.3

Frequenze osservate 16.2-16.4 Frequenze teoriche 16.2-16.4 Funzione di densità 7.4, 7.5, 7.6, 10.1-

10.5, 11.2, 12.3, 12.5, 13.6, 17.5 congiunta 8.4 marginale 8.4

Funzione di ripartizione 7.5, 7.6, 10.1-10.3 della variabile casuale normale 10.1, 1.2, 13.7, 14.3, 15.5

Funzione di verosimiglianza 13.6

G Gradi di libertà - vedi variabili casuali chi-

quadrato e t di Student Grafico a barre 5.4 Grafico a barre multiple 5.4 Grafico a barre suddivise 5.4 Grafico a dispersione 5.4, 17.2, 18.3 Grafico a torta 5.4 I Impostazione assiomatica 6.4 Incertezza 2.1, 6.1, 14.1, 14.3, 18.8 Incorrelazione 8.5.3, 8.5.5, 8.6.2, 17.2,

17.5 degli errori nel modello di regressione 18.2, 18.7

Indice di determinazione 18.6 Indici di posizione 3.1- 3.5, 4.1, 4.2.1, 4.3,

5.2, 7.6, 18.6 Indici di variabilità 3.1, 4.1-4.4, 7.6 Indipendenza

test 16.3-16.4, 17.4 di variabili casuali doppie 8.3.3, 8.4 di variabili casuali multivariate 8.3.3, 8.4 - vedi anche eventi indipendenti e variabili casuali indipendenti

Intercetta (nel modello di regressione) 18.2, 18.7

Intersezione di eventi 6.2, 6.4, 6.6, 6.7, 6.10, 16.3, 16.4

Intervallo di confidenza 14.1, 14.2, 15.12 per la media 14.3-14.5, 15.12 per la media nel modello di regressione 18.8 per la probabilità di successo 14.6

Intervallo di previsione 18.8 Ipotesi nel modello di regressione Ipotesi statistica 15.2, 15.3-15.12, 17.5,

18.7 bidirezionale 15.2,15.7-15.12, 17.5, 18.7 composita 15.2, 15.5-15.12 semplice 15.2,15.4-15.12, 17.5, 18.7 unidirezionale 15.2, 15.6, 15.8-15.11, 18.7

Istogramma 2.5, 2.6, 3.1

Page 493: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indice analitico 479

L Legame in media 18.2 Legame lineare - vedi dipendenza lineare Legge debole dei grandi numeri 13.3 Livello di confidenza 14.2, 14.3-14.6,

15.12 Livello di significatività 15.4, 15.5-15.12,

16.2-16.4, 17.5, 18.7 M MAD 4.3 Massima verosimiglianza 13.6 Media 3.1, 3.2, 3.3.2, 4.2., 4.3, 13.5

di una variabile casuale 7.6, 7.7, 7.8, 8.5.5, 9.1, 12.3, 12.5, 13.1, 13.4, 13.5, 13.6, 14.3, 15.2, 15.3, 18.2, 18.5, - vedi anche valore atteso condizionata 8.3.2, 18.2

Media campionaria 12.4, 13.1,13.2, 13.3, 13.4-13.7, 13.9, 14.3-14.5, 15.3-15.4, 15.10-15.11, 17.3, 18.3. standardizzata 13.3, 14.3, 15.3, 15.5, 15.10, 15.11 studentizzata 14.4, 14.5, 15.6-15.8, 15.10, 15.12

Media di variabili casuali 8.6.2, 11.1, 11.2.1, 11.2.2, 12.3 normali indipendenti 10.1.2

Mediana 3.3, 4.3 campionaria 13.2

Mediana degli scarti assoluti dalla mediana 4.3

Metodi di costruzione degli stimatori 13.6, 18.3

Minimi quadrati 18.3, 18.4, 18.10 Moda 3.4 Modalità 2.1, 2.2, 2.4, 2.7, 3.4, 5.4, 16.2-

16.4 Modello di regressione 18.1, 18.2, 18.3-

18.8 Modello per variabili casuali 9.1, 12.3,

12.4 continue 10.1-10.5 discrete 9.1- 9.6

Mutabile 2.1

N Negazione di un evento 6.2, 6.4, 9.3, 9.5,

16.4 Non distorsione 13.2, 13.3, 13.4, 13.5,

13.7, 18.4 Numerosità campionaria 13.1, 13.2, 13.7-

13.9, 14.1, 14.3, 14.5, 15.4, 15.8, 15.11, 17.5

O Omoschedasticità 18.2 Osservazioni anomale 3.3.2, 4.3, 4.4, 5.3

distanti 5.3 molto distanti 5.3

P Parametri 9.2-9.6, 10.1-10.5, 11.3, 12.3,

12.5, 13.1-13.7, 14.1-14.4, 15.2, 15.3, 15.6, 15.11, 15.12, 18.2, 18.3, 18.5, 18.7, 18.8

Partizione 6.2, 6.5, 6.10, 7.3 Pendenza (nel modello di regressione)

18.2, 18.3, 18.4, 18.6-18.7 Percentile 10.4, 10.5 Permutazioni 6.9 Popolazione 2.1, 6.1, 12.1, 12.2, 12.3,

12.4, 12.5, 13.1-13.9, 14.2, 14.6, 15.1-15.4, 17.1, 17.2 non normale 14.5, 15.8 normale 13.3, 13.5, 14.3, 14.4, 15.5-15.7, 15.10-15.12 - vedi anche variabile casuale normale

Postulati della probabilità 6.4, 6.5, 7.3, 8.3.1

Potenza del test 15.11 Prevedibilità 8.5.3 Previsione 18.1, 18.6, 18.8 Previsore 18.8 Probabilità 6.3, 6.4-6.10

a posteriori 6.8 a priori 6.8 condizionata 6.6, 6.7, 8.3.2 congiunta 6.10, 8.3.1, 8.3.3, 16.3-16.4 definizione frequentista 6.3, 14.2 definizione soggettivista 6.3 di eventi indipendenti 6.7 marginale 6.10, 8.2.1

Page 494: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 480

misurata come rapporto fra casi favorevoli e casi possibili 6.5, 6.9, 9.4 postulati 6.4 probativa 6.8 teoremi 6.4

Probabilità di successo 9.2, 9.3, 9.4, 9.6, 12.3, 13.1, 13.4, 13.6, 13.8, 13.9, 14.6, 15.2, 15.9-15.12, 16.3

Profondità della mediana 3.3, 4.4 del quartile 4.4

Proporzione campionaria 13.1, 13.4, 13.6, 13.8, 13.9, 14.6, 15.9-15.11

Proprietà degli stimatori 13.1, 13.2, 13.3-13.5, 18.4, 18.5 della media 3.2.2 della mediana 3.3.2 della varianza 4.4.2

Proprietà riproduttiva - vedi variabile casuale normale

Prove dipendenti 6.6, 6.7, 9.4, 12.4 Prove indipendenti 6.7, 9.3, 9.6, 12.4 p-valore 15.10, 16.3, 18.7 Q Quantità pivot 14.3, 14.4-14.6, 15.12, 18.8 Quartili 4.4, 5.2, 5.3 R Rapporto di efficienza 13.2 Rappresentazione in classi - vedi classi Recinto interno ed esterno 5.3 Regione critica - vedi regola di decisione Regione di accettazione - vedi regola di

decisione Regola di decisione 15.3, 15.4-15.9, 15.11,

16.2-16.4, 17.5, 18.7 Residui 18.5, 18.6, 18.7 Retta di regressione 18.2, 18.3, 18.5-18.8 Rilevazione 2.1, 3.3.2, 6.6, 6.10, 12.1,

12.2, 12.4, 13.7

S Scarti dalla media 3.2.2, 4.2.1, 4.2.2, 7.7,

8.5.2, 13.5, 17.3, 18.2, 18.6 dalla mediana 3.3.2, 4.3

Scarto quadratico medio 4.2.1, 4.2.2, 4.3, 7.7, 13.5, 13.7, 13.8, 18.7

Serie storica 5.4

Simmetria 2.5.2, 5.2, 11.3 Somma di variabili casuali 8.6, 9.3, 11.2.2,

11.3. Spazio campionario 12.4 Spazio degli eventi 6.2, 6.4, 6.10, 7.2, 7.3 Statistica campionaria 12.5, 13.1, 13.2,

14.2, 18.8 Statistica test 15.3, 15.4-15.9, 15.12, 17.5,

18.7 Stima 12.3, 13.1, 13.2

dei coefficienti di regressione 18.3, 18.4 del coefficiente di correlazione 17.3, 17.4 della covarianza 17.3 della media 13.3, 13.7, 13.9, 14.3-14.5 della probabilità di successo 13.4 della varianza 13.5, 17.3 della varianza degli errori nel modello di regressione 18.5 per intervallo 14.2, 14.3-14.6 puntuale 13.1, 13.2, 13.3-13.9, 14.1, 14.2

Stimatore 13.1, 13.2, 13.3, 13.4, 13.5, 13.6, 13.7, 13.8, 13.9, 18.3-18.5 lineare e non distorto 18.4, 18.8 metodi di costruzione 13.6, 18.3 per intervallo 14.2,14.3-14.6 proprietà 13.2

T Tabella di contingenza 2.7, 16.3, 16.4,

17.4 Tavola 10.1.1, 10.4, 10.5, 14.4, 15.5, 15.6,

16.3, 18.7 - vedi anche Variabile casuale normale, chi-quadrato e t di Student

Tempi di interarrivo 10.3 Teorema del limite centrale 11.1, 11.2,

11.3, 13.3, 13.4, 13.7, 13.8, 14.5, 14.6, 15.8, 15.9

Teorema di Bayes 6.8 Teorema di Gauss Markov 18.4, 18.7, 18.8 Teoremi della probabilità 6.4 Test delle ipotesi 12.3, 15.1-15.12, 16.2-

16.4, 17.5, 18.7 (chi-quadrato) sull’adattamento 16.1, 16.2, 16.3 (chi-quadrato) sull’indipendenza 16.1, 16.3-16.4

Page 495: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Indice analitico 481

sul coefficiente di correlazione 17.5 sulla media 15.4-15.8, 15.12, sulla probabilità di successo 15.9 sui coefficienti di regressione 18.7

Trasformazione lineare 3.2.2, 3.3.2, 4.2.2, 7.6, 7.7, 7.8, 8.5.3, 8.5.5, 10.1.1, 18.2

t-ratio 18.7 U Unione di eventi 6.2, 6.4, 6.5, 6.7, 6.10,

8.3.1 Unità statistica 2.1, 2.2, 2.4, 2.7, 5.4, 8.1,

12.2, 12.4, 16.3 V Valore anomalo - vedi osservazione

anomala Valore atteso 7.6, 7.7, 9.2-9.6, 10.1-10.5,

11.2, 11.3, 13.2-13.5, 14.5, 14.6, 15.8, 15.9, 18.2, 18.5-18.8 - vedi anche media di una variabile casuale condizionato 8.3.2, 18.2 di una combinazione lineare di variabili casuali 8.6 di una funzione di una variabile casuale 7.6 di una funzione di una variabile casuale doppia 8.5.1, 8.5.2-8.5.5 marginale 8.3.1, 8.3.2

Valore centrale 2.3, 3.2.1, 4.2.1, 11.2 Valore critico 15.4, 15.5, 15.6, 15.10,

16.2, 16.3, 15.7, 18.7 Valore modale 2.5 Valori adiacenti 5.3 Variabile casuale 7.1, 7.2, 7.3-7.8, 11.1,

11.2, 12.3-12.5, 13.2, 13.3, 13.5-13.7, 13.9, 14.1-14.5, 15.1, 15.2, 15.8, 16.2, 16.3, 18.2, 18.8 continua 7.2, 7.4, 7.5-7.7, 10.1-10.5, 11.2, 13.2, 14.1, 16.2, 16.3 discreta 7.2, 7.3, 7.5-7.8, 11.2, 16.2, 16.3

Variabile casuale Binomiale 9.3, 9.4, 9.5, 11.3

Variabile casuale bivariata – vedi variabile casuale doppia

Variabile casuale chi-quadrato 10.4, 10.5, 13.5, 14.4, 16.2-16.4, 18.7

Variabile casuale di Bernoulli 9.2, 9.3, 11.3, 12.3, 13.1, 13.4, 13.6, 13.8, 13.9, 14.6, 15.2, 15.9-15.12, 16.3

Variabile casuale di Poisson 9.5, 10.3, 12.3, 13.6

Variabile casuale doppia 8.1-8.6, 15.2, 17.1, 17.2, 17.5. continua 8.2, 8.4 discreta 8.2, 8.3, 8.5

Variabile casuale esponenziale negativa 10.3, 11.2.1, 12.3, 13.6, 15.2

Variabile casuale geometrica 9.6, 13.6 Variabile casuale ipergeometrica 6.9, 9.4 Variabile casuale marginale 8.2 Variabile casuale multivariata 8.1, 8.4,

8.3.3, 13.6 Variabile casuale normale 10.1, 11.1, 11.2,

11.3, 12.3, 13.2-13.9, 14.3, 14.4, 15.2- 5.7, 15.10-15.12, 18.7 bivariata 17.5 proprietà riproduttiva 10.1.2, 13.3, 15.3, 18.7 standardizzata 10.1.1, 10.5, 11.2-11.3, 13.3, 13.4, 13.7-13.9, 14.3-14.6, 15.4, 15.5, 15.8, 15.9, 18.7

Variabile casuale standardizzata 7.6 - vedi anche variabile casuale normale

Variabile casuale t di Student 10.5, 14.4, 15.6, 15.7, 15.10, 15.12, 17.5, 18.7

Variabile casuale uniforme 10.2, 11.2.1 Variabile dipendente 18.2, 18.4, 18.6-18.8 Variabile esplicativa 18.2, 18.4, 18.6-18.8 Variabile statistica 2.1, 2.3, 3.1-3.4, 4.1-

4.4 continua 2.1, 2.3, 3.2.1, 4.2.1 discreta 2.1, 2.3, 3.2.1, 3.4, 4.2.1

Variabili casuali indipendenti 8.3.3, 8.4, 8.5.3, 8.5.5, 8.6, 11.1, 11.2, 12.4, 15.2 e identicamente distribuite 10.1.2, 12.4, 13.3, 13.6 normali 10.1.2, 10.4, 13.5, 18.7

Variabilità 2.1, 4.1, 4.4, 5.2, 7.6, 9.4, 10.1.1, 13.2, 13.8, 18.2, 18.6, 18.8

Varianza 4.2, 4.3 una variabile casuale 7.7, 7.8, 8.5.5, 9.2-9.6, 10.1-10.4, 11.2, 11.3, 12.3, 13.1-13.3, 13.5-13.9, 14.3-14.5, 15.3-15.6, 15.8, 15.9, 15.11, 18.4, 18.7 condizionata 8.3.2

Page 496: A Pietro e a Valentino - Luiss Guido Carlidocenti.luiss.it/protected-uploads/586/2015/10/20151006130203... · 13.2 Proprietà degli stimatori 250 13.3 La media campionaria 255 . ...

Introduzione alla Statistica 482

degli errori nel modello di regressione 18.2, 18.5 di una combinazione lineare di variabili casuali 8.6

marginale 8.3.1 Varianza campionaria 13.1, 13.5, 13.6,

14.4, 15.6, 15.8 Verosimiglianza 6.8, 13.6