Unità 4
-
Upload
keely-morrison -
Category
Documents
-
view
27 -
download
0
description
Transcript of Unità 4
![Page 1: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/1.jpg)
1
Unità 4
La curva gaussiana
Variabili standardizzate
![Page 2: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/2.jpg)
2
L’espressione matematica della distribuzione gaussiana è data da
Osservazione.Osservazione. Questa funzione densità probabilità è completamente definita dai parametri e .
La curva corrispondente ha una forma a campana del tipo in figura sotto ed è simmetrica rispetto al valore medio.
xexf
x2
2
2
)(
2
1)(
X
0,68
0,16 0,16
![Page 3: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/3.jpg)
3
Essendo la curva simmetrica rispetto al valore medio, è chiaro che le aree sottese alla curva stessa fra – e e fra e +, valgono entrambi 0,5. In altre parole c’è una probabilità pari al 50% che la variabile casuale X assuma un valore più basso o più alto del valore medio.
Il valore medio coincide quindi con la mediana.
Il valore medio coincide anche con la moda.
Valore medio, moda e mediana coincidono.
X
0,68
0,16 0,16
![Page 4: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/4.jpg)
4
Le ascisse – e + individuano i due punti (punti di flesso) in cui la curva cambia la concavità.
L’area sottesa alla curva nell’intervallo [ – , + ] è circa il 68% dell’area sottesa a tutta la curva (vale infatti 0,6827).
A ciascuna delle due rimanenti code della curva corrisponde perciò un’area pari a circa 0,16.
L’area che sta sotto la curva nell’intervallo [–1,96, +1,96] vale 0,95; c’è cioè una probabilità del 95% che un’osservazione cada all’interno di questo intervallo.
Tale probabilità sale al 99% se si considera l’intervallo [–2,58, +2,58].
X
0,68
0,16 0,16
![Page 5: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/5.jpg)
5
![Page 6: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/6.jpg)
6
In generale la probabilità che un’osservazione cada all’interno di un generico intervallo [[ –– hh, , ++ hh ]], con h arbitrario, può essere facilmente dedotta da tabelle riportate nei principali manuali di statistica.
Il parametro (valore medio) (valore medio) individua la posizione occupata dalla curva nel piano. Infatti, tenendo costante e facendo variare , la curva trasla semplicemente lungo l’asse delle ascisse, come è mostrato in figura sotto.
x
![Page 7: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/7.jpg)
7
Il parametro parametro (deviazione standard) (deviazione standard) dà invece informazioni su come i valori sono più o meno dispersi attorno alla media.
Ciò è evidente guardando la figura sotto che riporta tre diverse curve gaussiane aventi lo stesso valore di , ma valori differenti per . All’aumentare di la curva diventa più piatta, poiché i valori sono più dispersi attorno alla media.
X
![Page 8: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/8.jpg)
8
LA STANDARDIZZAZIONE
La standardizzazione è un procedimento che riconduce una variabile aleatoria distribuita con media μμ e deviazione standard σ, ad una variabile aleatoria con distribuzione standard, ossia con media zero e deviazione standard pari a 1.
È particolarmente utile nel caso della variabile casuale normale per il calcolo della funzione densità di probabilità e dei percentili con le tavole della gaussiana standard.
Infatti i valori della distribuzione normale sono tabulati per media zero e varianza unitaria.
![Page 9: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/9.jpg)
9
Il procedimento prevede di sottrarre alla variabile aleatoria la sua media e dividere il tutto per la deviazione standard, passando così dalla variabile originaria XX ad una nuova variabile ZZ (Z-score o standard score):
X
Z
Z
Curva gaussiana standardizzata
![Page 10: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/10.jpg)
10
Area a destra
di Z
Area sottesa alla curva di Gauss standardizzata nella coda a destra di ZArea sottesa alla curva di Gauss standardizzata nella coda a destra di Z
![Page 11: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/11.jpg)
11
Area a sinistra
di Z
Area sottesa alla curva Area sottesa alla curva di Gauss standardizzata di Gauss standardizzata a sinistra di Za sinistra di Z
![Page 12: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/12.jpg)
12
Uso della tavola di probabilità gaussiana
Due sono gli usi della tavola di probabilità:
Definito un intervallo di valori per X, si vuole calcolare la probabilità che un valore x cada al suo interno.
Definita una probabilità, si vuole calcolare l’intervallo dei valori X che corrisponde a tale probabilità.
![Page 13: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/13.jpg)
13
Esercizio 1Esercizio 1
Si consideri una popolazione con altezza distribuita in maniera gaussiana con media (µ) pari a 172,5 cm e con deviazione standard (σ) pari a 6,25 cm.
Qual è la probabilità di incontrare un individuo estratto da tale popolazione di altezza superiore a cm 190?
Z = (190 – 172,5) / 6,25 = 2,8
Dalla tavola precedente risulta
P = 1 – 0,9974 = 0,0026P = 1 – 0,9974 = 0,0026
Quindi la probabilità di trovare un soggetto più alto di 190 cm è inferiore a 0,3%.
![Page 14: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/14.jpg)
14
Esercizio 2Esercizio 2
Qual è la probabilità di incontrare un individuo estratto dalla popolazione dell’esercizio 1 con un’altezza compresa tra cm 165 e175?
Z1= (165 – 172,5) / 6,25 = -1,2Z2= (175 – 172,5) / 6,25 = 0,4
P(Z1) = 0,115
P(Z2) = 0,345
P(165 ≤ X ≤ 175) =P(165 ≤ X ≤ 175) == P(-1,2 ≤ Z ≤ 0,4) = = P(-1,2 ≤ Z ≤ 0,4) = = 1- [0,115 + 0,345] = 0,54= 1- [0,115 + 0,345] = 0,54
![Page 15: Unità 4](https://reader035.fdocumenti.com/reader035/viewer/2022062517/568136f1550346895d9e878e/html5/thumbnails/15.jpg)
15
Esercizio 3Esercizio 3
Qual è quel valore di altezza che delimita il 5% superiore della distribuzione?
P = 0,05 z = 1,645
z = (x-172,5)/6,25 = 1,645
↓ ↓x = 172,5 + 6,25x = 172,5 + 6,25∙∙1,645 = 182,781,645 = 182,78
Circa il 5% della popolazione in studio ha un’altezza superiore di 182,78 cm.