La SCALA di Probabilità varia tra 0.00 e 1.00. DISTRIBUZIONE NORMALE.pdf · ctrasformazione delle...

37
CHE COS’E’ LA PROBABILITA’ La probabilità è la MISURA dell’incertezza di un evento, cioè come noi classifichiamo gli eventi rispetto alla loro incertezza. La SCALA di Probabilità varia tra 0.00 e 1.00. 0.00 = Evento Impossibile 1.00 = Evento Certo .50 = Evento massimamente incerto

Transcript of La SCALA di Probabilità varia tra 0.00 e 1.00. DISTRIBUZIONE NORMALE.pdf · ctrasformazione delle...

CHE COS’E’ LA PROBABILITA’La probabilità è la MISURA dell’incertezza di un evento, cioè come noi classifichiamo gli eventi rispetto alla loro incertezza.

• La SCALA di Probabilità varia tra 0.00 e 1.00.

0.00 = Evento Impossibile

1.00 = Evento Certo

.50 = Evento massimamente

incerto

CHE COS’E’ LA PROBABILITA’Gli statistici Misurano la Probabilità di un evento come:

Il rapporto tra i casi (teoricamente) favorevoli all’evento ed i casi (teoricamente) possibili.La frequenza relativa dell’evento in un esperimento (cioè, quante volte si verifica l’evento relativamente ad un certo numero di repliche di un esperimento).Il grado di fiducia che un individuo ha sul verificarsi di un evento (cioè, quanto egli è disposto a scommettere sull’evento).

DISTRIBUZIONE DI PROBABILITA’

I possibili risultati di un esperimento costituiscono uno spazio campionario di neventi A ciascun evento possiamo associare la probabilità del suo verificarsi

DISTRIBUZIONE DI PROBABILITA’definita da tutti i possibili risultati e le corrispondenti probabilità

DISTRIBUZIONE NORMALELa distribuzione NORMALE èrappresentata da una particolare curva continua a forma campanulare(gaussiana)

Y

Risposta ad un Item Vero-Falso: k= “Totale Risposte Corrette” con p=0.5

p

k0 1

0.5

n=1 Item

Risposta a 4 Item Vero-Falso: k= “Totale Risposte Corrette” con p=0.5

p

k0 1 2 3 4

0.375

0.25

.0625

n=4 Item

•• •

••

Risposta a 10 Item Vero-Falso: k= “Totale Risposte Corrette” con p=0.5

p

k0 1 2 3 4 5 6 7 8 9 10

0.246

0.205

.0117

0.44

0.010

0.001

n=10 Item

•• •

••

• •• •

• •

DISTRIBUZIONE NORMALE Per qualsiasi valore x che la variabile può

assumere, attraverso la funzione si calcola la ycorrispondente, cioè la probabilità

Y

yi

xi

2

21

21 ⎟

⎠⎞

⎜⎝⎛ −

= σμ

πσ

ix

i ey

DISTRIBUZIONE NORMALE

Y

πσμ 21

=y

μ-σ

CRESCENTE per -∞<x<μ e DECRESCENTEper μ<x<+∞ due punti di flesso a ± σda μ

μ+σ

Punti di flesso

-∞ +∞

Asintotica

Media=Moda=Mediana

DISTRIBUZIONE NORMALELa curva NORMALE è definita dai parametri μ e σ famiglia di distribuzioni normali con medie e deviazioni standard diverse

Y

Xμ1

μ1≠ μ2 ≠ μ3

μ2 μ3

σ1≠ σ 2 ≠ σ 3

DISTRIBUZIONE NORMALE famiglia di distribuzioni normali con

una diversa media e con la stessa deviazione standard

Y

Xμ1

μ1≠ μ2 ≠ μ3

μ2 μ3

σ1=σ 2 =σ 3

DISTRIBUZIONE NORMALEQualsiasi siano i parametri μ e σ, l’area della porzione di curva delimitata dalla media e un ordinata espressa in termini di deviazioni standard è costante

μ+σ= 34.13% della distribuzione μ+2σ= 47.73% della distribuzione μ+3σ= 49.86% della distribuzione

DISTRIBUZIONE NORMALE

Y

Xμμ-σ μ+σ μ+2σ μ+3σμ-3σ μ-2σ

68.26%95.46%99.73%

Porzioni della distribuzione comprese tra ± 1,2,3 deviazioni standard da μ (in %)

STANDARDIZZAZIONE PUNTI ZConsentono riferire una misura ad una scala standard con media uguale a zero e deviazione standard uguale a 1.

La trasformazione dei valori xi in valori zi significa esprimere i valori come distanza dalla media in termini di deviazioni standard (cioè, usare la deviazione standard come unità di misura)

Il segno del punteggio z indica immediatamente la posizione del soggetto sopra (+) o sotto la media (-)

STANDARDIZZAZIONE PUNTI Z

Il punto zi indica la distanza dalla mediadel valore xi dell’i-esimo soggetto, distanza espressa in deviazioni standard.Per calcolare i punti z:

sMx

z ii

−=

STANDARDIZZAZIONE PUNTI Z

Esempio: In un test di percezione visiva la media è

21.25 con una deviazione standard di 6.74. Trasformare in punti z i seguenti punteggi ottenuti da 6 soggetti dislessici.

Sogg. 1 2 3 4 5 6xi 8 14 17 20 25 28

STANDARDIZZAZIONE PUNTI Z

Si standardizzano i punteggi:

97.174.6

25.2181 −=

−=z 10.1

74.625.2114

2 −=−

=z

63.074.6

25.21173 −=

−=z 18.0

74.625.2120

4 −=−

=z

56.074.6

25.21255 =

−=z 00.1

74.625.2128

6 =−

=z

STANDARDIZZAZIONE PUNTI Z

• Il soggetto n°6 con 25 è circa mezza deviazione standard sopra la media e dista da questa circa la metà rispetto al soggetto n°7.• Il soggetto n°1 con 8 è circa due deviazioni standard sotto la media e dista da questa circa il doppio rispetto al soggetto n°2.

xi 8 14 17 20 21.25 25 28zi -1.97 -1.10 -0.63 -0.18 0 0.56 1.00

(MEDIA)

DISTRIBUZIONE NORMALE STANDARDIZZATA

Trasformando i valori di x in punti z si ottiene una distribuzione STANDARDIZZATA con μ=0 e σ=1

( )2

21

21 z

ezfY−

==π

Y Z

μμ-σ μ+σ μ+2σ μ+3σμ-3σ μ-2σ

Y

-3 -2 -1 0 +1 +2 +3

μ σ

μ=0 σ=1

X

DISTRIBUZIONE NORMALEData una variabile continua possiamo associare ai possibili valori la probabilità del loro verificarsi La probabilità associata ai valori di una variabile continua è sempre definita entro un intervallo i cui estremi delimitano un’area

DISTRIBUZIONE DI PROBABILITA’NORMALE

DISTRIBUZIONE NORMALEL’area si ottiene risolvendo un’integrale

Il valore che si ottiene è sempre compreso tra 0 e 1( probabilità)

Moltiplicando tale valore per 100 si ottiene la percentuale della distribuzione compresa tra x1e x2

∫=<<2

1

)()( 21

x

x

dxxfxxxp

Y X

Y

∫∞−

=<<−∞1

)()( 1

x

dxxfxxp

x1

Area totalesottesaalla curva

Porzione di area sottesa alla curva

∫∞

∞−

==∞<<−∞ 1)()( dxxfxp

X

Y X

Y( )dxxfxxp

x∫∞

=∞<<1

)( 1

∫=<<2

1

)()( 21

x

x

dxxfxxxp

x1 x2

x1

Porzione di area sottesa alla curva

Porzione di area sottesa alla curva

X

DISTRIBUZIONE NORMALEPer la curva normale standardizzata (μ=0; σ=1) sono stati tabulati i valori degli integrali per tutti i valori di z, cioè di tutte le aree comprese tra 0 (media) e un qualsiasi z

DISTRIBUZIONE DI PROBABILITA’NORMALE STANDARDIZZATA

TAVOLA DI Z

Z 0 1 2 3 4 5 6 7 8 90.00.10.20.3..1.0

1.1...3.9∞

Valoredi z con la 1° cifra decimale

2° cifra decimale di z

area tra 0 e zi

0 zi

∫=<<iz

i dzzfzzp0

)()0(

Riporta le aree comprese tra μ=0 e z

Esempio: Se z = 1.03 (0<z<1.03)=.3485

Z 0 1 2 3 4 5 6 7 8 90.00.10.2...1.0

1.1...3.9∞

.3485= area tra 0 e 1.03(circa il 35% della distribuzione)

3485.)()03.10(03.1

0

==<< ∫ dzzfzp

0 1.03 z

Uso della Tavola di z: Per avere la probabilità associata ad un

intervallo i cui estremi sono valori x: trasformazione delle x in punti z attraverso la tavola si risale all’area

delimitata da questi valori. Questa area rappresenta la probabilità ad essi associata

TAVOLA DI Z

Esempio a: Data una distribuzione con μ=100 e σ=10 qual è la probabilità che un valore sia compreso tra la media e 110?

Si trasformano gli estremi dell’intervallo in punti z: μ=100 z = 0

x=110

Si cerca sulla tavola l’area tra 0 e z=1.00

3413.)()10()110100(1

0

==<<=<< ∫ dzzfzpxp

0 1

110

100110=

−=z

.3413

z

Esempio b: Qual è la probabilità che un valore sia compreso tra 90 e la media?

Si trasformano gli estremi dell’intervallo in punti z: μ=100 z = 0;

x=90 Si cerca sulla tavola l’area tra 0 e z=1.00 che data la

simmetria della curva è identica a quella tra -1 e 0

3413.)()01()10090(0

1

==<<−=<< ∫−

dzzfzpxp

-1 0

110

10090−=

−=z

.3413

z

Esempio c: Qual è la probabilità che un valore sia compreso tra 90 e 110?p(90<x<110)= p(90<x<100)+ p(100<x<110)

p(90<x<110)= p(-1<z<1)= .3413+.3413=.6824

3413.)()01()10090(0

1

==<<−=<< ∫−

dzzfzpxp

-1 0 1

110

100901 −=

−=z 1

10100110

2 =−

=z

3413.)()10()110100(1

0

==<<=<< ∫ dzzfzpxp

.6824

z

Esempio d: Qual è la probabilità che un valore sia minore di 110?

p(x<110)= p(-∞<x<100)+ p(100<x<110)

p(x<110) = p(z<1) = .5000 + .3413 = .8413

3413.)()10()110100(1

0

==<<=<< ∫ dzzfzpxp

0 1

110

100110=

−=z

5000.)()0()100(0

==<<−∞=<<−∞ ∫∞−

dzzfzpxp

.8413

z

Esempio e: Qual è la probabilità che un valore sia maggiore di 110?

p(x>110)= p(100<x<∞)- p(100<x<110)

p(x>110) = p(z>1) = .5000 - .3413 = .1587

3413.)()10()110100(1

0

==<<=<< ∫ dzzfzpxp

0 1

110

100110=

−=z

5000.)()0()100(0

==∞<<=∞<< ∫∞

dzzfzpxp

.1587z

Esempio f: Qual è la probabilità che un valore sia compreso tra 108 e 110?

p(108<x<110)= p(100<x<110)- p(100<x<108)

p(108<x<110)= p(0.8<z<1)= .3413 - .2881 = .0532

3413.)()10()110100(1

0

==<<=<< ∫ dzzfzpxp

0 0.8 1

8.010

1001081 =

−=z 1

10100110

2 =−

=z

2881.)()8.00()108100(8.0

0

==<<=<< ∫ dzzfzpxp

.0532

z

DISTRIBUZIONE NORMALESe si conosce la porzione di area (ovvero la probabilità associata) delimitata da due valori (grezzi o standardizzati) di una distribuzione normale con N noto è possibile risalire alle frequenze teoriche comprese in quella porzione di area

f= Area × N

Esempio a: Data una distribuzione normale con N=1000, l’area compresa tra 0 e z = .3413. Quali sono le frequenze teoriche comprese nell’intervallo?

Le frequenze comprese nell’intervallo tra la media e z sono 341

f = .3413 × 1000 = 341

Esempio b: Data una distribuzione normale con N=1000, μ=100 e σ=10 quali sono le frequenze teoriche comprese tra 108 e 110?

Dall’esempio f sappiamo che: x1=108 z1 =0.8 x2=110 z2 =1 0532.)18.0( =<< zp

f = .0532 × 1000 = 53