Teoria della Probabilità e Statistica -...

65
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 1 Teoria della Probabilità e Statistica Cenni su teoria della probabilità e statistica Definizione di popolazione e campione Variabili aleatorie Definizione funzione di distribuzione Definizione funzione densità di probabilità Definizione media e varianza Funzioni di una variabile aleatoria Variabili aleatorie vettoriali Funzioni di variabili aleatorie vettoriali Teoria della probabilità – Statistica classica Motivazioni Gli esiti di un singolo esperimento non sono prevedibili, anche dopo ripetute esecuzioni nelle stesse condizioni Ciò è dovuto all’inevitabile errore sperimentale Si possono comunque individuare delle regolarità nell’insieme dei risultati di un numero elevato di ripetizioni dello stesso esperimento ovvero si può modellare la casualità presente in una misura sperimentale La modellazione dell’errore sperimentale è quindi una modellazione di tipo statistico

Transcript of Teoria della Probabilità e Statistica -...

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 1

Teoria della Probabilità e Statistica

Cenni su teoria della probabilità e statistica

Definizione di popolazione e campione

Variabili aleatorie

Definizione funzione di distribuzione

Definizione funzione densità di probabilità

Definizione media e varianza

Funzioni di una variabile aleatoria

Variabili aleatorie vettoriali

Funzioni di variabili aleatorie vettoriali

Teoria della probabilità – Statistica

classicaMotivazioni

• Gli esiti di un singolo esperimento non sono prevedibili, anche dopo ripetute esecuzioni nelle stesse condizioni

• Ciò è dovuto all’inevitabile errore sperimentale

• Si possono comunque individuare delle regolarità nell’insieme dei risultati di un numero elevato di ripetizioni dello stesso esperimento

– ovvero si può modellare la casualità presente in una misura sperimentale

• La modellazione dell’errore sperimentale è quindi una modellazione di tipo statistico

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 2

Teoria della probabilità – Statistica

classica

Teoria della probabilità. Definizione popolazione e campione

• POPOLAZIONE

• Insieme di tutte le possibili osservazioni, di dimensione N

• Esempi:

– Le misure sperimentali, in linea di principio infinite, che possono essere effettuate

– I risultati delle elezioni politiche in un paese, ottenuti dallo spoglio dei voti.

Teoria della probabilità – Statistica

classica

Teoria della probabilità. Definizione popolazione e campione

• CAMPIONE

• Insieme dei valori osservati. È pertanto un sottoinsieme della popolazione.

• La dimensione del campione n è il numero di valori osservati.

• In genere:

n « N

• Esempi:

– Il numero finito di prove sperimentali che si è, nella realtà, effettuato.

– Le proiezioni dei risultati elettorali ottenute grazie ai cosiddetti “exit poll”.

• N.B. Il numero di possibili campioni che si può estrarre da una popolazione è pari a:

– Per N→∞ i possibili campioni sono infiniti

!!

!

nNn

N

-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 3

Teoria della probabilità – Statistica

classica

Teoria della probabilità. Definizione popolazione e campione.

• In genere non è possibile conoscere il dettaglio di tutta la popolazione:

– La popolazione è costituita da un insieme infinito (come nel caso delle possibili misure sperimentali)

– È comunque dal punto di vista pratico impossibile (come nel caso delle elezioni politiche)

– Non ha comunque senso applicativo (esempio: crash test delle vetture)

Teoria della probabilità – Statistica

classica

Teoria della probabilità. Definizione popolazione e campione.

• Interpretazione grafica

Popolazione

Campione

Campagna sperimentale

Inferenza statistica

Dal campione si intende ottenere informazioni sulla popolazione generatrice non nota

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 4

Teoria della probabilità – Statistica

classica

Teoria della probabilità. Definizione popolazione e campione.

• Riepilogo Popolazione

Campione

Processo induttivo

Processo deduttivo

Caratterizzazione Campione: Statistica descrittiva

(introdotta nella precedente sezione)

Caratterizzazione Popolazione: Teoria della probabilità e statistica (nella sezione

corrente)

Teoria della probabilità – Statistica

classica

Introduzione concetto processo aleatorio

• Un processo si dice aleatorio se:

– Esso è replicabile sempre nelle stesse condizioni

– Il suo risultato cambia al variare delle esperienza in quanto è affetta da una componente casuale.

– Nei fatti, una esperienza aleatoria non restituisce mai lo stesso risultato se ripetuta più volte.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 5

Teoria della probabilità – Statistica

classica

Introduzione concetto processo aleatorio

• Schema di un esperimento

Valore verodella quantità

misurata

Errore sperimentale

e

Misura sperimentale

ottenuta

y=+e+

Teoria della probabilità – Statistica

classica

Teoria della probabilitàModellazione Esperimento Aleatorio

• Il modello matematico di un processo aleatorio ha lo scopo di prevedere le regolarità (statistiche) di un’esperienza, non il singolo esito!

• Esempi:

• Lancio di un dado

– Quale è, per esempio, la frequenza della comparsa dei lati in cui sono rappresentati i numeri pari

• Lancio di una moneta

– La frequenza della comparsa della testa e/o della croce

• Misure sperimentali

– Il modello matematico deve prevedere, se esiste, il trend centrale delle misure sperimentali.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 6

Teoria della probabilità – Statistica

classica

Teoria della ProbabilitàSpazio campione - Definizione

• L’insieme di tutti i possibili risultati che può registrare una esperienza aleatoria prende il nome di spazio campione

• Uno spazio campione può essere finito o infinito, a seconda che esso sia costituito da un numero finito o infinito di elementi.

• Esempi:

• Lancio dei dadi:

• Risultato di una misura sperimentale:

esempio: Misura di una temperatura in un reattore

• Nel primo caso lo spazio campione è un insieme discreto finito, nel secondo caso è un insieme infinito continuo

, , , , , ={ }

=R+

Teoria della probabilità – Statistica

classica

Teoria della ProbabilitàEvento

• Un evento E è un qualunque sottoinsieme dello spazio campione

• Esempi:

• Numeri pari nel lancio dei dadi:

• Risultati sperimentali: temperature osservate superiori a 100 K

E = {T>100.0}

• Oppure che si osservi la temperatura T = 273.5 K

E = 273.5 K

• L’ultimo evento introdotto è un evento elementare. Per definizione, gli eventi elementari non possono essere l’unione di altri eventi

, ,E ={ }

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 7

Teoria della probabilità – Statistica

classica

Teoria della ProbabilitàEvento

• Si possono introdurre i concetti di eventi complementari secondo le regole di insiemistica.

EC = - E

• Nel caso dei dadi:

• Nel caso del primo esempio di temperatura nel reattore:

EC={T ≤ 100.0}

• Un evento in cui non vi siano elementi si chiama evento impossibile e si indica con il simbolo Ø.

, ,EC = – E ={ }

Teoria della probabilità – Statistica

classica

Rappresentazione grafica degli eventi

Insiemistica - Diagrammi di Venn

Ew

w evento elementare ω ∈ E ⊂ �

A B

�⋃�

AB A

B

�⋃� �⋂�

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 8

Teoria della probabilità – Statistica

classica

Rappresentazione grafica degli eventi

Insiemistica - Diagrammi di Venn

E

Ec = - E:

Ec: Evento complementareA - B

A

B

AB

A B

A e B mutuamente esclusivi

�⋂� = ∅ � ⊂ �

Teoria della probabilità – Statistica

classica

Definizione Probabilità – Approccio frequentista

• Il concetto di probabilità emerge direttamente dal concetto di frequenza relativa.

• Consideriamo il caso dei lanci dei dadi ed effettuiamo 10 lanci.

, , , , , , , ,{ }

N( )/NTOT=0.00

N( )/NTOT=0.50

N( )/NTOT=0.20• Si calcola la frequenza relativa per i diversi eventi elementari dello spazio campione: N( )/NTOT=0.10

N( )/NTOT=0.10

N( )/NTOT=0.10

,

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 9

Teoria della probabilità – Statistica

classica

Definizione Probabilità – Approccio frequentista

• Aumentando le dimensioni del campione di dati sperimentali (per esempio n=50) si può avere

• Le frequenze relative tendono asintoticamente a dei valori che non cambiano più all’aumentare delle dimensioni del campione

N( )/NTOT=0.15

N( )/NTOT=0.19

N( )/NTOT=0.16

N( )/NTOT=0.17

N( )/NTOT=0.18

N( )/NTOT=0.15

N( )/NTOT=1/6

N( )/NTOT=1/6

N( )/NTOT=1/6

N( )/NTOT=1/6

N( )/NTOT=1/6

N( )/NTOT=1/6

Caso n = 50 Caso n → ∞

Teoria della probabilità – Statistica

classica

Definizione Probabilità – Approccio frequentista

• Teoricamente per n → ∞ le frequenze relative non cambiano più.

La frequenza con cui si verifica un evento elementare rimane costante all’aumentare delle prove.

• Questo è vero anche per tutti gli eventi A dello spazio campione (per esempio: numeri pari/dispari etc.)

Definizione frequentista della funzione probabilità:

• È possibile quindi definire in modo rigoroso la funzione probabilità del processo casuale in esame:

• N.B. Questo concetto è applicabile solo per processi replicabili.

lim limNN N

N EP E F E

N

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 10

Teoria della probabilità – Statistica

classica

Definizione Probabilità (Approccio Frequentista)

• Rappresentazione intuitiva dell’approccio frequentista

Popolazione

Campione

Campione →

PopolazioneN →∞

Teoria della probabilità – Statistica

classicaAssiomi di Kolmogorov (1933)

• Una volta introdotto il concetto di probabilità per un evento di un processo stocastico, tutta la teoria della probabilità può essere sviluppate partendo da tre assiomi fondamentali:

1.

2.

3.

Nel caso di spazi campioni infiniti la 3. può essere scritta:

3 bis.

0 1P E E

1P

0 BAseBPAPBAP

1

0 ,j j i kjj

P E P E se E E i k

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 11

Teoria della probabilità – Statistica

classica

Assiomi di Probabilità –Kolmogoroff (1933)

• Sfruttando gli assiomi di Kolmogoroff è possibile ricavare tutte le proprietà della probabilità:

• Esempio – Regola per insiemi complementari

• Dimostrazione:

1CP A P A -

0 CC AAeAA

CAPAPP 1

Teoria della probabilità – Statistica

classica

Assiomi di Probabilità –Kolmogoroff (1933)

• Altre proprietà che possono essere ricavate:

1. Regola di addizione per un numero finito di eventi mutualmente esclusivi:

2. Regola di addizione per eventi arbitrari

3. Probabilità dell’evento impossibile: P(Ø) = 0

n

jj

n

jjki APAPkiAA

11

,0

BAPBPAPBAP -

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 12

Teoria della probabilità – Statistica

classicaDefinizione Probabilità Condizionata

• Probabilità che si verifichi B se A si è verificato:

• In maniera analoga si può definire la probabilità dell’evento A condizionato dall’evento B.

• La 1) e la 2) sono valide se, rispettivamente, P(A)≠0 e P(B)≠0

)1AP

BAPABP

)2BP

BAPBAP

Teoria della probabilità – Statistica

classica

Probabilità Condizionata -Definizione

• Le probabilità condizionate sono delle funzioni probabilità dato che soddisfano gli assiomi di Kolmogoroff per un qualunque insieme M

1. P(A|M) ≥ 0 per ogni evento A

2. P(|M) = 1

3. Nel caso A e B disgiunti

– P(A B|M) = P(A|M) + P(B|M)

• Se B A allora P(A|B) = 1

• Se {Ai M Ø}, Ai = 1,2, … sono mutualmente esclusivi, allora P(A1 A2 … |M) = P(A1|M) + P(A2|M) + …

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 13

Teoria della probabilità – Statistica

classicaProbabilità Condizionata - Esempio

• Esempio:

• Uno scatola contiene 10 viti di cui 3 difettose. Estraiamo due viti a caso. Determinare la probabilità che nessuna vite estratta sia difettosa

• Evento A: Prima vite non difettosa

• Evento B: Seconda vite non difettosa

• P(A)=7/10

• Una volta estratta 1 vite restano nella scatola 9 viti quindi: P(B|A)=6/9=2/3

• La probabilità che anche la seconda vite sia difettosa è quindi:

P(AB)=P(A) P(B|A)=47%

Teoria della probabilità – Statistica

classica

Indipendenza stocastica -Definizione

• La nozione di indipendenza stocastica di eventi è fondamentale nella teoria della probabilità e nella pratica della sperimentazione:

Definizione: Due eventi si dicono indipendenti se:

• Dalla definizione di probabilità condizionata:

� � ∩ � = � �|� � �

• Nel caso in cui P(A B)=P(A) P(B) si ottiene:

� �|� = � �

• Ovvero qualunque cosa accada a B essa non dà informazioni su A. Quindi A e B sono indipendenti

BPAPBAP

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 14

Teoria della probabilità – Statistica

classicaIndipendenza stocastica – Esempio

• Riesaminiamo l’esempio delle viti considerando di reimmettere nella scatola la vite estratta inizialmente.

• Intuitivamente, questo implica la perdita di informazione acquisita con il precedente risultato

• P(A) = P(B) = 0.7

• P(AB) = P(A) P(B) = 49 %

• Nota: Non si devono confondere eventi disgiunti con eventi indipendenti.

• Infatti due eventi disgiunti non sono indipendenti:

Teoria della probabilità – Statistica

classica

Indipendenza stocastica –Considerazioni

• Da notare la profonda differenza concettuale tra i due esempi

• Nel primo caso, il verificarsi di un evento condiziona la probabilità degli eventi successivi.

• Nel secondo caso, il reimmettere la vite nel contenitore azzera le informazioni acquisite nella prima esperienza.

• Informazioni pregresse, da un punto di vista logico, possono implicare dipendenza tra i dati sperimentali.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 15

Teoria della probabilità – Statistica

classica

Indipendenza stocastica – Esempi con i diagrammi di Venn

A

B

AB

AB

AB

P(A|B) = 1 P(B|A) = P(A B)/P(A) = P(B)/P(A)

P(A|B) ≠ P(A) P(A|B) = P(B|A) = 0

Teoria della probabilità – Statistica

classicaVariabili aleatorie - Introduzione

• In presenza di un processo aleatorio, si associa implicitamente un numero ad un risultato dell’esperienza

• Da un punto di vista matematico, è necessario sempreassociare ad un esito di un esperimento aleatorio un numero che individui univocamente l’esito osservato.

• Associare ad un processo aleatorio (scalare) un numero reale è un procedimento che facciamo sempre in modo intuitivo

Deformazione molla R

Numero reale

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 16

Teoria della probabilità – Statistica

classica

• Lancio del dado

Teoria della probabilità –Esempi Variabili Aleatorie

1

2

3

4

5

6

Y

Lancio Moneta

0

1

Y

Esempi di Variabili aleatorie Discrete: il processo casuale può assumere valori al più in

un insieme numerabile

Teoria della probabilità – Statistica

classicaVariabili aleatorie – Definizione

• Una variabile aleatoria è una funzione che associa ad ogni esito di un processo aleatorio, un distinto numero reale

Insieme dei possibili risultati del processo aleatorio

Variabile aleatoria Y

Insieme valori numerici che assume

la funzione Y• In termini rigorosi

Y : wW → y=Y(w)

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 17

Teoria della probabilità – Statistica

classicaVariabili aleatorie - Definizione

• La variabile aleatoria Y è una funzione che assume valori tali che dipendono dal “caso”

• Proprietà:

– Y è definita nello spazio degli esperimenti ed assume valori nel codominio sottoinsieme dei numeri reali.

– Qualunque sottoinsieme del codominio (evento) ha una probabilità ben definita di accadere

Teoria della probabilità – Statistica

classicaVariabili aleatorie – Definizione

• Da notare che Y è una funzione (variabile aleatoria) mentre i valori assunti da tale funzione y=Y(w), valori calcolabili quando l’esito dell’esperimento sia noto, sono numeri reali

• Nel seguito:

Y → variabile aleatoria

y → singolo esito osservato della VA

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 18

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• Definizione

• Secondo la definizione classica, la funzione di distribuzione emerge automaticamente dalle proprietà asintotiche di un campione di dimensioni infinite.

• Si può facilmente dimostrare che, per ogni variabile aleatoria Y, la funzione (reale di una variabile reale) distribuzione di probabilità (CDF: Cumulative Distribution Function)

è sufficiente per definire la probabilità di un qualunque evento pertinente al processo aleatorio.

N

yYNyYPyF

NY

lim

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• Proprietà della distribuzione di probabilità

• Inoltre:

1. FY(+ ) = 1, FY(-) = 0

2. FY è una funzione non decrescente

3. Se FY(y0)=0 allora FY(y)=0 se y <y0

4. P {Y >y1 } = 1- FY(y1)

5. FY è una funzione continua da destra: FY(y+) = FY(y)

6. P {y1 < Y y2} = FY(y2)-FY(y1)

1,0: yyFY

È facile dimostrare come tali proprietà derivino dagli assiomi di Kolmogoroff

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 19

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• Esempio di calcolo di probabilità di un evento dalla funzione di distribuzione.

E1

a b

FY(a)

FY(b)

E2

c d

FY(c)FY(d)

E = E1 E2

P{y E} =

P{a < y b}+P{c < y < d}

=FY(b)-FY(a)+ FY(d)-FY(c)y

Calcolo probabilità che y cada in E

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• In molte circostanze, per la caratterizzazione delle variabili aleatorie è molto più utile ricorrere alla derivata della funzione di distribuzione

• La funzione fY(y) prende il nome di funzione densità di probabilità (pdf)

• Proprietà della funzione densità di probabilità

– fY(y) ≥ 0 sempre

– ∫ ����

��� �� = 1

– � �� < � ≤ �� = �� �� − �� �� = ∫ �� � ����

��

ovvero y

Y Y Y

df y F y F y f u du

dy-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 20

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• Esempio di calcolo di probabilità di un evento dalla funzione densità di probabilità

E1 E2

fY(y)

y

1 2

1 2

Y Y

E E

b d

Y Y

a c

P y E

P y E P y E

f y dy f y dy

f y dy f y dy

a b c d

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• Nei casi di maggiore interesse la variabile aleatoria Y è di tipo continuo, ovvero può assumere un qualunque valore lungo l’intervallo in cui è definito

• In tal caso la funzione di distribuzione è una funzione di tipo continua e la probabilità che si verifichi un evento elementare è pari a zero:

• � � = � = lim�→�

�� � − �� � − �

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 21

Teoria della probabilità – Statistica

classica

Distribuzione di probabilitàDefinizione media e varianza

• Spesso, è sufficiente per caratterizzare una variabile aleatoria (almeno in forma approssimata) conoscere solo alcune grandezze che sono calcolabili dalle funzioni densità di probabilità come ad esempio media e varianza.

• Il valore medio di una variabile aleatoria è dato da:

• Tale valore prende anche il nome di VALORE ATTESO della variabile aleatoria Y ed è indicato con il simbolo

Y=EY[Y]

• Se una distribuzione è simmetrica rispetto a y=c, (f(c+y)=f(c-y)) si vede che =c

Y y f y dy

-

Teoria della probabilità – Statistica

classica

Variabili aleatorie: Altre misure del trend centrale

• Mediana di una variabile aleatoria Y

• Il valore m per cui:

• Moda di una variabile aleatoria Y

• Il valore c per cui la funzione densità di probabilità assume valore massimo:

• Se la distribuzione è simmetrica, media e mediana coincidono.

2

1mFY

max:Yfc

y0 2 4 6 8

f Y(y

)

0.0

0.1

0.2

0.3

0.4

0.5

Area = 0.5

Area = 0.5

y0 2 4 6 8

f Y(y

)

0.0

0.1

0.2

0.3

0.4

0.5

fY(y) max

Mediana

Moda

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 22

Teoria della probabilità – Statistica

classica

y0 2 4 6 8

f Y(y

)

0.0

0.1

0.2

0.3

0.4

0.5 Moda

Mediana

Media

Variabili aleatorie: Altre misure del trend centrale

• Nel caso generale di distribuzioni non simmetriche media, mediana e moda non coincidono

Teoria della probabilità – Statistica

classica

Variabili aleatorie: Indici di posizione e dispersione

• Varianza: è una misura della dispersione della distribuzione intorno al suo valore atteso. Per definizione:

se esiste.

• La varianza è sempre non negativa

• Altra grandezza usata per valutare la dispersione della distribuzione è la deviazione standard (ha la stessa unità di misura della media)

-

-

-

continua

discreta

22

22

Ydyyfy

Yyfy

YYY

jjYYjY

s

s

2

YYss

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 23

Teoria della probabilità – Statistica

classica

x-4 -2 0 2 4

f(x)

0.0

0.1

0.2

0.3

0.4

-3.2 1.5 x-4 -2 0 2 4

f(x)

0.0

0.4

0.8

1.2

-1.1 0.4

Distribuzione di probabilitàDefinizione media e varianza

• Qualitativamente: al diminuire della varianza, la pdf si restringe intorno al suo valore medio

• Diminuisce l’incertezza nel processo aleatorio

(1) (2)

2 21 2s s

L’intervallo di valori in cui gli esiti del processo aleatorio ricadono più frequentemente è molto più ampio nel primo caso che nel secondo

Area=

0.95

Teoria della probabilità – Statistica

classica

Distribuzione di probabilità –Definizione momenti

• Possiamo generalizzare media e varianza con i momenti:

• La media è quindi il momento primo della distribuzione, mentre la varianza è il momento centrale di ordine 2.

• N.B. E’ possibile valutare i momenti di una distribuzione solo se essi sono definiti.

nn

n

n

m y f y dy

M y f y dy

-

-

-

momento n-esimo

momento centrale n-esimo

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 24

Teoria della probabilità – Statistica

classica

Variabili aleatorieFunzioni continue - Esempi

• Funzione di distribuzione uniforme

1,

0 ,Y

se y a bf y b a

se y a b

-

fY(y)

ya b

1/(b-a)

FY(y)

ya b

1

pdf cdf

Dipende da due parametri: a e b

Teoria della probabilità – Statistica

classica

Variabili aleatorieFunzioni continue - Esempi

• Distribuzione uniforme

• È possibile calcolare la media e varianza di tale funzione di distribuzione:

1

2

b

Y

a

a by f y dy y dy

b a

-

-

2222 1

2 12

b

Y

a

a ba by f y dy y dy

b as

-

- - -

-

Questo risultato poteva essere

intuitivo dato che la funzione è

simmetrica rispetto al suo punto medio

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 25

Teoria della probabilità – Statistica

classica

Variabili aleatorieFunzioni continue - Esempi

• Distribuzione di tipo Esponenziale

exp0

1 exp

f y yy

F y y

l l

l

-

- -

La funzione ha un solo parametro: l

l

1

2

2 1

ls

y y

pdf cdf1

l

fY(y)FY(y)

Teoria della probabilità – Statistica

classica

Variabili aleatorieFunzioni continue - Esempi

• Distribuzione di tipo Weibull

0

exp1

exp1

l--

l-l -

y

k

yyF

k

yyyf

k

kk

-

ls

l

22

2

1

12

11

k

k

k

kk

k

k

k

Y

k

Y

N.B. per k = 1 la Weibull

degenera nella distribuzione di

tipo esponenziale

In letteratura la sua espressione non è univoca e si trovano altre

formulazioni equivalenti

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 26

Teoria della probabilità – Statistica

classica

Variabili aleatorieFunzioni continue - Esempi

• Distribuzione di tipo Weibull

0 0.5 1 1.5 2 2.5 3 3.5 40

0.5

1

1.5

2

2.5

y

y(y

)

k<1

k=1k>1

Teoria della probabilità – Statistica

classica

Variabili aleatorie:Teorema limite centrale

“Sia {Xi} una successione di variabili aleatorie indipendenti di media e varianza s2, indipendenti ed

identicamente distribuite, allora la somma

converge asintoticamente verso una variabile aleatoria normale (o altrimenti detta Gaussiana)”

n

iin

XS1

se le sorgenti di errore in una osservazione sono infinite ed indipendenti, la variabile aleatoria può essere assunta di

tipo Normale

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 27

Teoria della probabilità – Statistica

classicaCarl Friedrich Gauss

Gaussiana

Teoria della probabilità – Statistica

classicaFunzione di distribuzione Gaussiana

• Una variabile aleatoria (continua) si dice normale o Gaussiana se la sua densità di probabilità è:

• La funzione è definita lungo tutto l’asse reale (ovvero un qualunque numero reale può essere un esito di una VA di tipo normale)

• Il grafico di tale funzione è una curva a campana simmetrica rispetto a y=Y

• La distribuzione dipende da due parametri, e s2.

• La maggior parte delle variabili aleatorie con cui si avrà a che fare sono Gaussiane (o comunque derivate dalla Gaussiana).

2

2

1 1exp

22

YY

YY

yf

s s

- -

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 28

Teoria della probabilità – Statistica

classicaFunzione di distribuzione Gaussiana

• La gaussiana è simmetrica rispetto al valore Y pertanto la media coincide con il valore Y

• Si può verificare matematicamente che il parametro s2 definito nell’espressione coincide con la varianza della funzione di distribuzione.

Teoria della probabilità – Statistica

classicaFunzione di distribuzione Gaussiana

In figura sono riportate tre gaussiane con egual media e varianza 0.25, 0.5, 1

• La distribuzione di probabilità non è disponibile analiticamente ma esiste sotto forma tabulare.

-2 -1 1 2 3 4

0.25

0.5

0.75

1

1.25

1.5 Varianza s2 = 0.25

Varianza s2 = 1

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 29

Teoria della probabilità – Statistica

classica

-s s s s-s-s

Funzione di distribuzione Gaussiana

68.26%

95.46%

99.73%

Aree sottese dalla distribuzione normale

N.B.

Questo è vero per ogni valore

di e s nel caso della Gaussiana!

Teoria della probabilità – Statistica

classica

Distribuzione normale (o di tipo Gaussiano)

• Al diminuire di s, i risultati dell’esperienza aleatoria assumono valori in intervalli sempre più piccoli

• L’incertezza diventa sempre più piccola

• Non esistono delle tabelle per calcolare le probabilità per i generici valori di e s.

• Vedremo nel seguito come è possibile ricondurre il calcolo della probabilità sempre alla VA di tipo standard

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 30

Teoria della probabilità – Statistica

classica

Variabili aleatorie: Distribuzioni –Riepilogo concetti

• Rappresentazione casualità tramite:

– Introduzione concetto Variabile Aleatoria (VA)

– Caratterizzazione proprietà VA tramite funzioni a valori reali

• Definizione funzioni di distribuzione e densità di probabilità

– Proprietà

– Esempi

• VA di tipo Uniforme

• Esponenziale

• Weibull

• Gaussiana (o Normale)

– Teorema del limite centrale

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria. Esempio con VA discreta

• Il seguente gioco assegna le seguenti vincite per un lancio di dadi:

– 0.10 euro se esce un numero dispari

– 0.20 euro se esce il 2

– 0.30 euro se esce il 4

– 0.40 euro se esce il 6

• Quale è la probabilità che il giocatore vinca 0.2 euro nella singola giocata?

• La possibilità che si vinca una certa cifra con questo gioco è una variabile aleatoria?

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 31

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria.Caso discreto

• I possibili eventi elementari per la nuova VA vincita al gioco possono essere :

w1 = {0.1, 0.2, 0.3, 0.4}

• Se il dado è regolare, è possibile ricavare quale è la probabilità che si verifichi il singolo evento.

• È possibile quindi definire una funzione di una variabile aleatoria. In questo caso associo ad ogni evento dello spazio campione un altro elemento di uno spazio 1

0.1 1,3,5

0.2 2

0.3 4

0.4 6

0

euro y

euro y

g y euro y

euro y

altrove

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria.Esempio caso discreto

Funzione densità di probabilità del lancio di dadi

Funzione densità probabilità vincita di euro

y1 2 3 4 5 6

f Y(y)

1/6

z0.1 0.2 0.3 0.4

f Z(z)

½

1/6

Z = g(Y)

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 32

Teoria della probabilità – Statistica

classicaFunzioni di una variabile aleatoria

Y(w)

Spazio campione

W

g(Y)

Codominio della VA Y

=Spazio campione della

VAY

Insieme dei valori che può assumere la Y

1

Codominio della funzione della VA

=Spazio campione della

VA Z=g(Y)

Insieme dei valori che può assumere la Z = g(Y)

Insieme dei risultati possibili

R 1 R

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria.Valore atteso

• Funzione vincita al gioco dei dadi

• Quanto si deve pagare per il singolo lancio affinché il gioco sia equo?

• Dovrei pagare per il singolo lancio una quota che sia la media delle possibili vittorie (ovvero l’esito della nuova variabile aleatoria) per la singola esperienza.

• Nel caso in esame:

• Il valore ottenuto si definisce il valore atteso della funzione g(y) e si indica con il simbolo E(g(y))

1 1 1 1 10.10 0.20 0.30 0.40

2 6 6 6 5

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 33

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria.Valore atteso

• Definizione:

• Sia Y una variabile aleatoria e g( · ) una funzione misurabile, si definisce quindi media (o valore atteso) di g(Y) lo scalare:

• N.B. La g(y) deve essere definita per ogni Y per cui la funzione pdf fY(y) non è nulla.

-

continuoCasodyyfygYgE

discretoCasoyfygYgEj

jj

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria –Valore atteso

• Esempio – Si consideri la seguente trasformazione

• È immediato verificare che il valore atteso di tale funzione coincide con la varianza della VA Y:

66

2

YYYg -

22

YYYYdyyfydyyfygYgE s-

-

-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 34

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoriaProprietà del valore atteso

• Altre proprietà del valore atteso:

1 1 2 2 1 1 2 2

E c c

E c g Y c E g Y

E c g Y c g Y c E g Y c E g Y

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria. Determinazione della media

• Data una variabile aleatoria Y ed una trasformazione g(y) formiamo la nuova Variabile Aleatoria Z=g(Y).

• La media di Z è

• Se è nota la distribuzione di Y non è necessario conoscere la fZper determinare la media di Z.

• Teorema della media:

• Siano Y e Z due variabili aleatorie tali che Z = g(Y), è valida la seguente proprietà (N.B. se esistono gli integrali presi in considerazione)

Z ZE Z z f z dz

-

( )ZZ YZ YE g Y g yE Z z f z d fz y dy

- -

Valutato in Z Valutato in Y

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 35

Teoria della probabilità – Statistica

classica

Trasformazioni affini di una Variabile Aleatoria

• Definizione trasformazione affine:

• In genere ci si riferisce a tale trasformazione come lineare

(ma rigorosamente non lo è dato che non rispetta il principio di sovrapposizione degli effetti)

Z = g(Y)=aY+b a,b

Teoria della probabilità – Statistica

classica

Trasformazioni affini–Determinazione media

• Problema: Non si conosce di che tipo di variabile aleatoria sia Y ma ne conosciamo media e varianza, è possibile determinare la media e la varianza di Z?

• Se g(Y) è una trasformazione affine:

Z = g(Y)=aY+b

ba

bYEabaYE

ZE

Y

YY

ZZ

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 36

Teoria della probabilità – Statistica

classica

Trasformazioni affini variabile aleatoria – Calcolo della varianza

• Anche per la varianza è possibile determinare una espressione analitica

222222

22222

22 YYYYY

YYZZZ

aabYbaEaYEa

babYaEZE

s--

--s

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoriaCalcolo della varianza

• Anche detta legge di propagazione degli errori.

• Sia data una legge Z = g(Y), si intende calcolare la varianza della nuova VA

22

2 2 2

2 2

Z

Z Z

Z E Z

E g Y E g Y

E g Y E g Y

s

-

- -

-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 37

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria. Determinazione di media e varianza

• Invece se la trasformazione è non lineare si possono solo stimare in modo approssimato la media e la varianza di Z

• Si linearizza g intorno a Y:

• Troncando al primo ordine:

2

2

2

1

2Y Y

Y Y Y

dg d gg y g y y

dy dy

- -

Y

Z Y Y Y Y Y

dgE Z g y f y dy g y f y dy g

dy

- -

-

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria. Determinazione di media e varianza

• Troncando al secondo ordine:

• Per la varianza

2

2

2

1

2Y

Z Y Y

d gg

dy

s

2

2 2

Y

Z Y

dg

dy

s s

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 38

Teoria della probabilità – Statistica

classica

Funzioni di variabile aleatoria.Caratterizzazione completa VA.

• Ci si può domandare come sia distribuita Z. Procediamo per gradi e supponiamo per semplicità che la funzione g sia monotona in modo da avere una corrispondenza biunivoca tra Y e Z.

z=g(y)

y

z

Dominio yy(y)

Dom

inio

zy

(z)

P{y≤Y ≤y+dy}=P{z≤Z≤z+dz}= y(y)dy=y(z)dz

dy

dz

P{y≤Y ≤y+dy}=y(y)dy

P{z≤Z≤z+dz}=y(z)dz

Teoria della probabilità – Statistica

classica

Funzioni di variabile aleatoria.Caratterizzazione completa VA.

• z e dz non sono qualunque ma corrispondono a y e dy

• Obiettivo: conoscere fZ(z)

dzzfdzzZzP

dyyfdfdyyYyP

Z

Y

dyy

y

Y

1

z g y

y g z-

zgy

YYZYZ

dy

dz

zgf

dy

dz

yfzfdyyfdzzf

1

1

-

-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 39

Teoria della probabilità – Statistica

classica

Funzioni di variabile aleatoria.Caratterizzazione completa VA.

• Esempio: Trasformazione affine

Z=aY+b

• Da cui:

g’(y)=a

• L’equazione z=ay+b ha una unica soluzione:

• Quindi:

• Se la funzione di trasformazione è affine non cambia il tipo di variabile aleatoria. Questo è vero qualunque sia Y.

a

bzy

-

-

a

bzf

azf YZ

1

Teoria della probabilità – Statistica

classica

• Da cui, esplicitando la dipendenza inversa di y da z

--

---

-

-

-

2

2

222

22

2

2

2

2

1exp

2

1

2

1exp

2

1

2

1exp

2

11

Z

z

Z

YZ

YZ

Y

Y

y

Y

Y

Y

Z

z

a

ba

a

abz

a

a

bz

azf

s

s

ss

s

s

s

sLa nuova VA è

ancora una

Gaussiana di media

Z=a+bY

e varianza

sZ2=a2sY

2

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 40

Teoria della probabilità – Statistica

classica

Funzioni di VA GaussianeTrasformazioni lineari

• Data una variabile aleatoria Y (di tipo gaussiano) di media Y e

varianza sY2

• Si consideri la seguente trasformazione lineare:

• Di che tipo è la nuova variabile aleatoria?

• Quale è la media e la varianza della nuova variabile?

• È facile verificare che:

Y

YYZ

s

-

Gaussiana di tipo standard1

02

Z

Z

s

Teoria della probabilità – Statistica

classica

Funzioni di VA GaussianeTrasformazioni lineari

• Nota la funzione di distribuzione standard è possibile ricavare le proprietà di una qualsiasi distribuzione gaussiana

• In particolare, è possibile calcolare la probabilità che si verifichi un dato evento per un generico processo, con media e varianza note.

• Questo è possibile sapendo solo i valori della distribuzione di tipo standard.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 41

Teoria della probabilità – Statistica

classica

Calcolo probabilità per una Gaussiana generica

-5 0 5 10 15

= 10; s2 = 0.5

(y – )z =

s

-2.83

8

-1.58 1.58-5 0 5 10 15

Normale standard

100-5 5 15

= 5; s2 = 10

0

10

Teoria della probabilità – Statistica

classica

Calcolo probabilità per una Gaussiana generica

• Esempio: calcolare quale è la probabilità che si verifichi un evento appartenente all’intervallo [0,5] per la variabile aleatoria di media 3 e deviazione standard 2:

• Si deve calcolare quale è la probabilità che la variabile aleatoria di tipo standard assuma un valore nell’intervallo corrispondente.

82

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 42

Teoria della probabilità – Statistica

classica

Calcolo probabilità per una Gaussiana generica

• Dobbiamo calcolare la probabilità:

• Gli estremi dell’intervallo corrispondente per la distribuzione di tipo standard possono essere facilmente calcolati

0 5P X

11

0 3

2X

X

xz

s

- -

22

5 31

2X

X

xz

s

- -

0 5

1.5 1

0.8413 0.0668 77.4%

P X

P Z

-

-

Teoria della probabilità – Statistica

classica

Calcolo probabilità per una Gaussiana generica

• Esercizi

• Sia Y una variabile aleatoria di tipo normale, di media = 16 e varianza s2 = 25

• Calcolare:

– P(Y > 20)

– P(20 < Y < 25)

– P(Y < 10)

– P(12 < Y < 24)

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 43

Teoria della probabilità – Statistica

classica

Funzioni di VA Gaussiane –Esempio trasformazioni non lineari

• Esempio: Trasformazione non lineari

• Data una variabile aleatoria Y di tipo normale, descritta dalla seguente distribuzione

• si consideri la seguente trasformazione non lineare

• Si intende calcolare la distribuzione della variabile aleatoria Z.

• Innanzitutto quali valori può assumere la VA Z?

YeZ

2

2

1 1exp

22

YY

YY

yf

s s

- -

Teoria della probabilità – Statistica

classica

Funzioni di VA Gaussiane –Esempio trasformazioni non lineari

• Una variabile aleatoria di tipo gaussiano può assumere un qualunque valore reale.

– Il suo esponenziale ovviamente no

– Questa indicazione è già sufficiente per stabilire che l’esponenziale di una variabile aleatoria di tipo Gaussiano non è più dello stesso tipo.

• Questa proprietà è vera per qualunque tipo di variabile aleatoria: una trasformazione non lineare implica una trasformazione del tipo di variabile aleatoria.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 44

Teoria della probabilità – Statistica

classica

Funzioni di VA Gaussiane –Esempio trasformazioni non lineari

• Come visto precedentemente

• Si può facilmente vedere che

• Da cui

• Ed è uguale a zero per z < 0.

• Tale distribuzione prende il nome di distribuzione Lognormale

z

Y

z

YZ

yg

zgf

dy

dz

yfzf

'

1-

zzg log1 -

zeygzy

y

z

log'

0

log

2

1exp

2

12

2

-- z

z

zzf

Y

Y

Y

Zs

s

Teoria della probabilità – Statistica

classica

Funzioni di VA Gaussiane: Distribuzione Lognormale

• Grafico e proprietà della distribuzione Lognormale

• È un tipico esempio di distribuzione asimmetrica

z

0 2 4 6 8 10

f(z)

0.0

0.1

0.2

0.3

2exp

2Y

YZZEs

222 2exp1exp YYYZ sss -

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 45

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoriaTrasformazioni non biunivoche

• Nel caso di trasformazione non biunivoca le cose si complicano dal punto di vista operativo, ma concettualmente il problema non è molto diverso

z+dz

g’(y3)

z

y3 y3+dy3y2 y2+dy2

g’(y2)

y1 y1+dy1

g’(y1)

Z=g(Y)

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoriaTrasformazioni non biunivoche

• Dalla corrispondenza degli eventi riguardanti la VA Z e la VA Y è facile dimostrare che

• Per i valori di z per i quali l’equazione Z = g(Y) ha le soluzioni y1,y2,…,yn e

• Per i valori di z per cui l’equazione z=g(y) non ammette soluzioni

1 2

1 2

...' ' '

Y Y Y n

Z

n

f y f y f yf z

g y g y g y

0Zf z

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 46

Teoria della probabilità – Statistica

classicaVariabili Aleatorie Vettoriali

• Spesso negli esperimenti si osservano molte quantità contemporaneamente.

• E’ evidente che è possibile generalizzare il concetto di variabile aleatoria introducendo la VA vettoriale:

• Una VA vettoriale ad N componenti è rappresentabile in uno spazio ad N dimensioni.

• Se N=2 gli eventi sono sottoinsiemi del piano.

1 2 , ...,,T

NYY YY

Teoria della probabilità – Statistica

classicaVariabili Aleatorie Vettoriali

• Se in un esperimento stocastico osserviamo 2 quantità dobbiamo associare all’esperimento due variabili aleatorie: Y1 ed Y2.

• Ogni esecuzione dell’esperimento fornisce una coppia di numeri (y1 ed y2)

• Se si conosce la probabilità:

a1 b1

b2

a2

Y1

Y2

1 1 1 2 2 2,P a Y b a Y b

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 47

Teoria della probabilità – Statistica

classica

VA vettoriali – Funzione densità di probabilità congiunta

• La distribuzione di probabilità della VA vettoriale Y è:

• La funzione densità di probabilità congiunta fY(y1,y2) è tale che:

1 2 1 1 2 2, ,F y y P Y y Y y

1 1 1 2 2 2 1 2 1 2 1 2 1 2, , , , ,P a Y b a Y b F b b F a b F b a F a a - -

1 2

1 2, ,y y

F y y f w v dwdv- -

2 1

2 1

1 1 1 2 2 2, ,b b

a a

P a Y b a Y b f w v dwdv

, 1f w v dwdv

- -

Teoria della probabilità – Statistica

classica

V.A. VETTORIALI –Distribuzioni Marginali

• Ad ogni distribuzione bidimensionale possiamo associare 2 distribuzioni monodimensionali che sono dette distribuzioni marginali:

• Analogamente, si può osservare:

• Le distribuzioni marginali fY1 e fY2 rappresentano le probabilità che si verifichino, rispettivamente, gli eventi Y1 e Y2, indipendentemente dall’esito dell’altra componente

1

1 1 1 1 2, ,y

YF y P Y y Y f w v dwdv

- -

-

1

2

1 ,

2 ,

Y

Y

f y f w v dv

f y f w v dw

-

-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 48

Teoria della probabilità – Statistica

classica

VA vettoriali – Funzione densità di probabilità congiunta

• Esempi di pdf bidimensionali

Rappresentazione tridimensionale Curve di isolivello

fY(y1,y2)

Teoria della probabilità – Statistica

classica

V.A. VETTORIALI –Distribuzioni Marginali

• La F della VA vettoriale si dice congiunta. Nel caso generico N-dimensionale si ha una F congiunta ed N marginali.

• Importante:

• Dalla funzione densità di probabilità (distribuzione) congiunta è sempre possibile risalire alle funzioni densità di probabilità (distribuzioni) marginali, mentre non è in genere vero il contrario

96

Distribuzione congiunta

Distribuzioni marginali

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 49

Teoria della probabilità – Statistica

classica

V.A. VETTORIALI –Distribuzioni Marginali

• Distribuzioni marginali -Esempio

fY2(y2)

fY1(y1)

Teoria della probabilità – Statistica

classicaV.A. INDIPENDENTI: Definizione

• Due VA Y1 ed Y2 di congiunta FY(y1, y2) si dicono indipendenti se:

• In tal caso, per ogni coppia di eventi {a1<Y1b1} e {a2<Y2b2} vale:

cioè se e solo se i due eventi sono indipendenti. Ovviamente il discorso è generalizzabile ad N dimensioni.

1 1 1 2 2 2 1 1 1 2 2 2,P a Y b a Y b P a Y b P a Y b

�� ��, �� = ����� � ���

��

�� ��, �� = ����� � ���

��

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 50

Teoria della probabilità – Statistica

classica

VA Vettoriali –Definizione VA indipendenti

• Esempio 2D

• Due VA Y1 ed Y2 di congiunta F(y1, y2) si dicono indipendenti se:

• In tal caso:

1 2

1 2

1 2 1 2

1 2 1 2

,

,

y y

y y

F y y F y F y

f y y f y f y

Distribuzione congiunta

Distribuzioni marginali

Teoria della probabilità – Statistica

classica

VA Vettoriali – Funzione densità di probabilità condizionata

• Concetto di funzione densità di probabilità condizionata.

• Per semplicità si assuma Y 2 un vettore di variabili aleatorie tale che:

– Probabilità di Y1 condizionata dalla componente Y2:

– Probabilità di Y2 condizionata dalla componente Y1:

RYRYY

Y

21

2

1 ,Y

2

21

21

,21 yf

yyfyyf

yy

Y2

Y

11

21

12

,12 yf

yyfyyf

y

yy

Y

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 51

Teoria della probabilità – Statistica

classica

VA Vettoriali – Funzione densità di probabilità condizionata

• Caso particolare: VA vettoriali bidimensionali

RYYY

Y

21

2

1 ,Y

0,;,

12122

2

21

2121

2

-

dyyyfyfyf

yyfyyf y

y

YY Y

Y

0,;,

22111

1

21

1212

1

-

dyyyfyfyf

yyfyyf y

y

YY Y

Y

Teoria della probabilità – Statistica

classica

VA Vettoriali – Funzione densità di probabilità condizionata

• Esempi di probabilità condizionate:

y2=a

y1=b

ayf

ayyfayyf

Y

aYY

2

2121

2

21

,Y

byf

ybyfbyyf

Y

bYY

1

21

12

1

12

,Y

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 52

Teoria della probabilità – Statistica

classica

VA Vettoriali – Funzione densità di probabilità condizionata

• Da notare che nel caso di variabili aleatorie Y1 e Y2 indipendenti:

• si ha:

• Quando due VA sono indipendenti qualunque evento dell’una non è condizionato dagli eventi dell’altra.

2121 21, yfyfyyf YYY

21212

12121

2

1

yfyyf

yfyyf

YYY

YYY

Teoria della probabilità – Statistica

classicaVariabili Aleatorie Vettoriali

• Caso Gaussiano:

• Se le due VA sono indipendenti allora la congiunta:

• NB: la congiunta contiene 4 parametri

s

--

s

s

--

s

ss

22

2

22

2

21

2

11

1

2222

2111

2

1exp

2

1

2

1exp

2

1

,~,~

2

1

yf

yf

NYNY

Y

Y

--

--

22

2

2221

2

11

21 2

1

2

1exp

2

1

s

s

ss

yyfY

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 53

Teoria della probabilità – Statistica

classica

Variabili aleatorie vettoriali Caso coppia di VA Gaussiane

• Una coppia di variabili aleatorie Y = (Y1, Y2) si dicono congiuntamente gaussiane (o normali) e si denotano con il simbolo

• se la loro pdf congiunta assume la seguente espressione:

• I parametri di tale pdf sono:

– Il vettore è il vettore delle medie

– La matrice , simmetrica, definita positiva, è la matrice di covarianza

1

exp22 det

f

- - - -

T1

Y

y μ V y μy

V

μV

21 12

212 2

s s

s sV

VμY ,~ N

Teoria della probabilità – Statistica

classica

Variabili aleatorie vettoriali Caso Gaussiano

• Gli elementi della matrice di covarianza sono:

• Non è vero generalmente il contrario (ma per Gaussiane si)

• Per convincersi che la matrice di covarianza V caratterizza la dispersione dei dati si può vedere che, per una coppia di VA congiuntamente gaussiane le linee di isolivello della pdf hanno equazione:

21221112

2

2

2222

1

2

1121

Y e YVA delle covarianza

YVA della varianza

YVA della varianza

s

s

s

--

-

-

YYE

YE

YE

VA Y1 e Y2 indipendenti La covarianza è nulla

(y-)TV-1(y-) = cost

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 54

Teoria della probabilità – Statistica

classica

Variabili aleatorie vettorialiCoefficiente di correlazione

• Dalla matrice di covarianza è possibile determinare la correlazione tra due variabili aleatorie.

• Siano date due variabili aleatorie Y1 e Y2. Il coefficiente di correlazione è definito come:

• Per come è definito:

21

12

21

2112

,cov

ss

sr

YVYV

YY

11 12 - r

Teoria della probabilità – Statistica

classica

Variabili aleatorie vettoriali Caso Gaussiano VA Indipendenti

-2

0

2

-2

0

2

00.0250.05

0.0750.1

-2

0

2

-3 -2 -1 0 1 2 3

-3

-2

-1

0

1

2

3

1 0 0

0 2 0 V μ

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 55

Teoria della probabilità – Statistica

classica

Variabili Aleatorie Vettoriali di tipo Normale – VA indipendenti

• Nel caso di variabili aleatorie di tipo Gaussiano indipendenti:

• La congiunta assume la seguente forma:

• NB: la congiunta contiene 4 parametri

--

--

22

2

22

2

21

2

11

1

2222

2111

2

1exp

2

1

2

1exp

2

1

,~,~

2

1

s

s

s

s

ss

yf

yf

NYNY

Y

Y

--

--

22

2

222

1

2

11

21

212

1

2

1exp

2

1

s

s

ss

yyfff YYY

Teoria della probabilità – Statistica

classica

y1-3 -2 -1 0 1 2 3

Variabili aleatorie vettoriali Caso Gaussiano VA Indipendenti

• Rappresentazione distribuzioni marginali e probabilità condizionate

-3 -2 -1 0 1 2 3

-3

-2

-1

0

1

2

3

fY2

fY1

y1-3 -2 -1 0 1 2 3

y 1-3 -2 -1 0 1 2 3

21 2 1 1| 1.5 0, 1Yf y y s

21 2 1 1| 1.5 0, 1Yf y y s -

La probabilità dell’evento y1

non cambia con il valore di y2

=0s2=2

=0s2=1

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 56

Teoria della probabilità – Statistica

classica

Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti

1 0

2 0

V μ

-2 -1 0 1 2

-2

-1

0

1

2

-2

0

2

-2

0

2

0

0.1

0.2

-2

0

2

Teoria della probabilità – Statistica

classica

-3 -2 -1 0 1 2 3

Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti

• Rappresentazione distribuzioni marginali e probabilità condizionate

y1-3 -2 -1 0 1 2 3

fY1 =0s2=1

fY2

=0s2=2

21 2 1 1| 1.5 1.2, 0.36Yf y y s

-3 -2 -1 0 1 2 3

21 2 1 1| 1.5 1.2, 0.36Yf y y s - -

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 57

Teoria della probabilità – Statistica

classica

Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti

• Nel caso di correlazione |r| = 1 la distribuzione degenera in una retta.

-2

0

2

-2

0

2

0

0.2

0.4

-2

0

2

-3 -2 -1 0 1 2 3

-3

-2

-1

0

1

2

3

Domanda: in questo caso come si comportano le marginali e le probabilità condizionate?

Teoria della probabilità – Statistica

classica

Variabili Aleatorie di tipo Normale Vettoriali – Caso Generico

• Nel caso generico di n componenti la variabile aleatoria vettoriale assume la forma:

• I parametri di tale pdf sono raccolti nel vettore e nella matrice V:

• = (1, , ... , n);

• V, matrice (n × n) definita positiva, è la matrice di covarianza.

• Ancora, se le VA componenti sono indipendenti, la matrice V è diagonale perché tutte le covarianze sono nulle.

--- - μyVμy

Vy 1T

Y2

1exp

det2

12/n

f

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 58

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali

• I concetti esposti per le trasformazioni di variabili scalari possono essere estesi al caso vettoriale.

• Si consideri la generica trasformazione non lineare:

• Vogliamo determinare la densità di probabilità congiunta di Z.

1 1 21

2 1 22

,

,

o, equivalentemente

g Y YY

g Y YY

Y Z

Z g Y

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali

• Il ruolo della derivata nella trasformazione è assunto dallo Jacobiano, ma i passaggi sono concettualmente analoghi al caso scalare:

1 1 1 2

2 2 1 2

1 2

1 1

1 21 2

1 2 21 2

1 2

,

,

,

,

,

YZ

i i

Nradi i

i i i

z g y y

z g y y

y y Radici del sistema

z z

y yf y yf J

z zJ y y

y y

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 59

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare

• Se si usa una trasformazione lineare:

• La conoscenza della sola media Y e della matrice di covarianza VY

della VA Y permette la determinazione della media Z e della matrice di covarianza della VA VZ

• Come nel caso scalare risulta inoltre che solo le trasformazioni lineari conservano il tipo di Variabile aleatoria

1 1 1n n n n n

TZ a Y b

TZ Z

TZ Y

μ a μ b

V a V a

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare

• Nel caso lineare è possibile anche analizzare trasformazioni di VA vettoriali di dimensioni differenti, per esempio da una VA vettoriale Y di dimensioni (n × 1) ad una W di dimensioni (p × 1)

• Generalizzando le relazioni precedenti si ottiene:

111

pnnpp

dYcW T

TW Z

TW Z

μ c μ d

V c V c

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 60

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare

• Un caso particolare di interesse è quando p = 1.

• In tal caso si ottiene, almeno per VA vettoriali indipendenti:

• Per esempio, nel caso W = Y1 + Y2+ … +Yn

222

222

21

21

2

2211

...

...

YnnYYW

YnnYYW

ccc

dcdcdc

ssss

222

21

2

21

...

...

YnYYW

YnYYW

ssss

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali

• Particolare importanza hanno le trasformazioni di una VA vettoriale Y in una VA scalare (caso m=1)

• Sono, ad esempio, di uso molto comune alcune VA scalari che derivano (attraverso trasformazioni non lineari) da variabili aleatorie vettoriali gaussiane Y ad n componenti, con vettore delle

medie = 0 e matrice di covarianza V = I.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 61

Teoria della probabilità – Statistica

classica

Variabili Aleatorie derivate dalla

gaussiana - Variabile

• Si consideri una VA vettoriale ad n componenti Y = (Y1, Y2, …, Yn)

• Le componenti sono quindi tutte indipendenti e gaussiane di media nulla e varianza unitaria. La variabile aleatoria scalare

• prende il nome di variabile aleatoria 2 ad n gradi di libertà.

• Tale variabile aleatoria è caratterizzata completamente da un solo parametro, il numeri di gradi di libertà n.

Y~N(0,I)

222

21 ... nYYYZ

Teoria della probabilità – Statistica

classicaVariabile aleatoria

• Funzione densità di probabilità

0 1 2 3 4 5 6 7 8 9 100

0.1

0.2

0.3

0.4

0.5

n = 1n = 2n = 4n = 6

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 62

Teoria della probabilità – Statistica

classicaVariabile aleatoria

• Proprietà di una variabile aleatoria 2 ad n gradi di libertà

• Il massimo si ha per y = n-2. Da osservare che per n → ∞ la distribuzione 2 tende ad una gaussiana.

--

00

0

2

22

2

2

2

2

y

yeyK

n

nE

yn

nn

n

s

2/2

1

2 n

Knn

Teoria della probabilità – Statistica

classica

VA derivate dalla gaussiana Distribuzione t-Student

• Sia Y una variabile aleatoria gaussiana di media 0 e varianza unitaria, e Z una 2 ad r gradi di libertà

• Inoltre Y e Z siano tra loro indipendenti. La variabile aleatoria data da:

è una distribuzione t di Student ad r gradi di libertà.

r

YT

r2

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 63

Teoria della probabilità – Statistica

classica

VA derivate dalla GaussianaDistribuzione t-Student

• In figura sono mostrate le funzioni densità per 1,3,6 gradi di libertà.

• La T è simmetrica rispetto a y=0

• Per r →+∞ la t di Student tende ad una gaussiana di tipo standard.

William SealyGosset

“creatore” della t di Student

y-4 -2 0 2 4

f Y(y

)

0.0

0.1

0.2

0.3

0.4n =2

n = 4Distribuzione Standard

n

Teoria della probabilità – Statistica

classica

VA derivate dalla GaussianaDistribuzione t-Student

• Espressione analitica della t di Student

• Essendo K una costante di normalizzazione.

• Proprietà:

• Dipende da un solo parametro il numero intero r

Ry

r

yKyf rr

,

1

1

2

12

2

2

1

K

0Y

22

2 -

sYMedia: Varianza:

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 64

Teoria della probabilità – Statistica

classica

VA derivate dalla GaussianaLa distribuzione F di Fisher

• Se le variabili aleatorie Y e W sono VA di tipo 2 rispettivamente ad m ed n gradi di libertà, la VA scalare Z

è una VA di tipo F di Fisher ad (m,n) gradi di libertà.

• La VA ha due parametri, m ed n.

nWm

YZ

Teoria della probabilità – Statistica

classica

VA derivate dalla GaussianaLa distribuzione F di Fisher

• Espressione analitica della F di Fisher

Nnm

altrove

y

yn

m

y

m

n

nm

nm

nmyf

nm

mn

Y

-

,

0

0

122

2

,;

2

2

22/

2,2

-

nn

nY

2

22

24

22

--

-

nnm

nnmY

sMedia: Varianza:

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 65

Teoria della probabilità – Statistica

classica

VA derivate dalla GaussianaLa distribuzione F di Fisher

• Grafici della F di Fisher al variare dei gradi di libertà

y0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

f Y(y)

0.0

0.2

0.4

0.6

0.8

1.0

1.2(10, 4) g.d.l.

(10, 10) g.d.l

(10, 50) g.d.l.

(10, Infinity) g.d.l.

Sir Ronald AylmerFisher

1890 - 1962