Download - Teoria della Probabilità e Statistica - people.unica.itpeople.unica.it/massimilianogrosso/files/2018/10/StatisticaTeoria.pdf · aleatorio • Schema di un esperimento Valore vero

Transcript

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 1

Teoria della Probabilità e Statistica

Cenni su teoria della probabilità e statistica

Definizione di popolazione e campione

Variabili aleatorie

Definizione funzione di distribuzione

Definizione funzione densità di probabilità

Definizione media e varianza

Funzioni di una variabile aleatoria

Variabili aleatorie vettoriali

Funzioni di variabili aleatorie vettoriali

Teoria della probabilità – Statistica

classicaMotivazioni

• Gli esiti di un singolo esperimento non sono prevedibili, anche dopo ripetute esecuzioni nelle stesse condizioni

• Ciò è dovuto all’inevitabile errore sperimentale

• Si possono comunque individuare delle regolarità nell’insieme dei risultati di un numero elevato di ripetizioni dello stesso esperimento

– ovvero si può modellare la casualità presente in una misura sperimentale

• La modellazione dell’errore sperimentale è quindi una modellazione di tipo statistico

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 2

Teoria della probabilità – Statistica

classica

Teoria della probabilità. Definizione popolazione e campione

• POPOLAZIONE

• Insieme di tutte le possibili osservazioni, di dimensione N

• Esempi:

– Le misure sperimentali, in linea di principio infinite, che possono essere effettuate

– I risultati delle elezioni politiche in un paese, ottenuti dallo spoglio dei voti.

Teoria della probabilità – Statistica

classica

Teoria della probabilità. Definizione popolazione e campione

• CAMPIONE

• Insieme dei valori osservati. È pertanto un sottoinsieme della popolazione.

• La dimensione del campione n è il numero di valori osservati.

• In genere:

n « N

• Esempi:

– Il numero finito di prove sperimentali che si è, nella realtà, effettuato.

– Le proiezioni dei risultati elettorali ottenute grazie ai cosiddetti “exit poll”.

• N.B. Il numero di possibili campioni che si può estrarre da una popolazione è pari a:

– Per N→∞ i possibili campioni sono infiniti

!!

!

nNn

N

-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 3

Teoria della probabilità – Statistica

classica

Teoria della probabilità. Definizione popolazione e campione.

• In genere non è possibile conoscere il dettaglio di tutta la popolazione:

– La popolazione è costituita da un insieme infinito (come nel caso delle possibili misure sperimentali)

– È comunque dal punto di vista pratico impossibile (come nel caso delle elezioni politiche)

– Non ha comunque senso applicativo (esempio: crash test delle vetture)

Teoria della probabilità – Statistica

classica

Teoria della probabilità. Definizione popolazione e campione.

• Interpretazione grafica

Popolazione

Campione

Campagna sperimentale

Inferenza statistica

Dal campione si intende ottenere informazioni sulla popolazione generatrice non nota

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 4

Teoria della probabilità – Statistica

classica

Teoria della probabilità. Definizione popolazione e campione.

• Riepilogo Popolazione

Campione

Processo induttivo

Processo deduttivo

Caratterizzazione Campione: Statistica descrittiva

(introdotta nella precedente sezione)

Caratterizzazione Popolazione: Teoria della probabilità e statistica (nella sezione

corrente)

Teoria della probabilità – Statistica

classica

Introduzione concetto processo aleatorio

• Un processo si dice aleatorio se:

– Esso è replicabile sempre nelle stesse condizioni

– Il suo risultato cambia al variare delle esperienza in quanto è affetta da una componente casuale.

– Nei fatti, una esperienza aleatoria non restituisce mai lo stesso risultato se ripetuta più volte.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 5

Teoria della probabilità – Statistica

classica

Introduzione concetto processo aleatorio

• Schema di un esperimento

Valore verodella quantità

misurata

Errore sperimentale

e

Misura sperimentale

ottenuta

y=+e+

Teoria della probabilità – Statistica

classica

Teoria della probabilitàModellazione Esperimento Aleatorio

• Il modello matematico di un processo aleatorio ha lo scopo di prevedere le regolarità (statistiche) di un’esperienza, non il singolo esito!

• Esempi:

• Lancio di un dado

– Quale è, per esempio, la frequenza della comparsa dei lati in cui sono rappresentati i numeri pari

• Lancio di una moneta

– La frequenza della comparsa della testa e/o della croce

• Misure sperimentali

– Il modello matematico deve prevedere, se esiste, il trend centrale delle misure sperimentali.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 6

Teoria della probabilità – Statistica

classica

Teoria della ProbabilitàSpazio campione - Definizione

• L’insieme di tutti i possibili risultati che può registrare una esperienza aleatoria prende il nome di spazio campione

• Uno spazio campione può essere finito o infinito, a seconda che esso sia costituito da un numero finito o infinito di elementi.

• Esempi:

• Lancio dei dadi:

• Risultato di una misura sperimentale:

esempio: Misura di una temperatura in un reattore

• Nel primo caso lo spazio campione è un insieme discreto finito, nel secondo caso è un insieme infinito continuo

, , , , , ={ }

=R+

Teoria della probabilità – Statistica

classica

Teoria della ProbabilitàEvento

• Un evento E è un qualunque sottoinsieme dello spazio campione

• Esempi:

• Numeri pari nel lancio dei dadi:

• Risultati sperimentali: temperature osservate superiori a 100 K

E = {T>100.0}

• Oppure che si osservi la temperatura T = 273.5 K

E = 273.5 K

• L’ultimo evento introdotto è un evento elementare. Per definizione, gli eventi elementari non possono essere l’unione di altri eventi

, ,E ={ }

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 7

Teoria della probabilità – Statistica

classica

Teoria della ProbabilitàEvento

• Si possono introdurre i concetti di eventi complementari secondo le regole di insiemistica.

EC = - E

• Nel caso dei dadi:

• Nel caso del primo esempio di temperatura nel reattore:

EC={T ≤ 100.0}

• Un evento in cui non vi siano elementi si chiama evento impossibile e si indica con il simbolo Ø.

, ,EC = – E ={ }

Teoria della probabilità – Statistica

classica

Rappresentazione grafica degli eventi

Insiemistica - Diagrammi di Venn

Ew

w evento elementare ω ∈ E ⊂ �

A B

�⋃�

AB A

B

�⋃� �⋂�

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 8

Teoria della probabilità – Statistica

classica

Rappresentazione grafica degli eventi

Insiemistica - Diagrammi di Venn

E

Ec = - E:

Ec: Evento complementareA - B

A

B

AB

A B

A e B mutuamente esclusivi

�⋂� = ∅ � ⊂ �

Teoria della probabilità – Statistica

classica

Definizione Probabilità – Approccio frequentista

• Il concetto di probabilità emerge direttamente dal concetto di frequenza relativa.

• Consideriamo il caso dei lanci dei dadi ed effettuiamo 10 lanci.

, , , , , , , ,{ }

N( )/NTOT=0.00

N( )/NTOT=0.50

N( )/NTOT=0.20• Si calcola la frequenza relativa per i diversi eventi elementari dello spazio campione: N( )/NTOT=0.10

N( )/NTOT=0.10

N( )/NTOT=0.10

,

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 9

Teoria della probabilità – Statistica

classica

Definizione Probabilità – Approccio frequentista

• Aumentando le dimensioni del campione di dati sperimentali (per esempio n=50) si può avere

• Le frequenze relative tendono asintoticamente a dei valori che non cambiano più all’aumentare delle dimensioni del campione

N( )/NTOT=0.15

N( )/NTOT=0.19

N( )/NTOT=0.16

N( )/NTOT=0.17

N( )/NTOT=0.18

N( )/NTOT=0.15

N( )/NTOT=1/6

N( )/NTOT=1/6

N( )/NTOT=1/6

N( )/NTOT=1/6

N( )/NTOT=1/6

N( )/NTOT=1/6

Caso n = 50 Caso n → ∞

Teoria della probabilità – Statistica

classica

Definizione Probabilità – Approccio frequentista

• Teoricamente per n → ∞ le frequenze relative non cambiano più.

La frequenza con cui si verifica un evento elementare rimane costante all’aumentare delle prove.

• Questo è vero anche per tutti gli eventi A dello spazio campione (per esempio: numeri pari/dispari etc.)

Definizione frequentista della funzione probabilità:

• È possibile quindi definire in modo rigoroso la funzione probabilità del processo casuale in esame:

• N.B. Questo concetto è applicabile solo per processi replicabili.

lim limNN N

N EP E F E

N

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 10

Teoria della probabilità – Statistica

classica

Definizione Probabilità (Approccio Frequentista)

• Rappresentazione intuitiva dell’approccio frequentista

Popolazione

Campione

Campione →

PopolazioneN →∞

Teoria della probabilità – Statistica

classicaAssiomi di Kolmogorov (1933)

• Una volta introdotto il concetto di probabilità per un evento di un processo stocastico, tutta la teoria della probabilità può essere sviluppate partendo da tre assiomi fondamentali:

1.

2.

3.

Nel caso di spazi campioni infiniti la 3. può essere scritta:

3 bis.

0 1P E E

1P

0 BAseBPAPBAP

1

0 ,j j i kjj

P E P E se E E i k

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 11

Teoria della probabilità – Statistica

classica

Assiomi di Probabilità –Kolmogoroff (1933)

• Sfruttando gli assiomi di Kolmogoroff è possibile ricavare tutte le proprietà della probabilità:

• Esempio – Regola per insiemi complementari

• Dimostrazione:

1CP A P A -

0 CC AAeAA

CAPAPP 1

Teoria della probabilità – Statistica

classica

Assiomi di Probabilità –Kolmogoroff (1933)

• Altre proprietà che possono essere ricavate:

1. Regola di addizione per un numero finito di eventi mutualmente esclusivi:

2. Regola di addizione per eventi arbitrari

3. Probabilità dell’evento impossibile: P(Ø) = 0

n

jj

n

jjki APAPkiAA

11

,0

BAPBPAPBAP -

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 12

Teoria della probabilità – Statistica

classicaDefinizione Probabilità Condizionata

• Probabilità che si verifichi B se A si è verificato:

• In maniera analoga si può definire la probabilità dell’evento A condizionato dall’evento B.

• La 1) e la 2) sono valide se, rispettivamente, P(A)≠0 e P(B)≠0

)1AP

BAPABP

)2BP

BAPBAP

Teoria della probabilità – Statistica

classica

Probabilità Condizionata -Definizione

• Le probabilità condizionate sono delle funzioni probabilità dato che soddisfano gli assiomi di Kolmogoroff per un qualunque insieme M

1. P(A|M) ≥ 0 per ogni evento A

2. P(|M) = 1

3. Nel caso A e B disgiunti

– P(A B|M) = P(A|M) + P(B|M)

• Se B A allora P(A|B) = 1

• Se {Ai M Ø}, Ai = 1,2, … sono mutualmente esclusivi, allora P(A1 A2 … |M) = P(A1|M) + P(A2|M) + …

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 13

Teoria della probabilità – Statistica

classicaProbabilità Condizionata - Esempio

• Esempio:

• Uno scatola contiene 10 viti di cui 3 difettose. Estraiamo due viti a caso. Determinare la probabilità che nessuna vite estratta sia difettosa

• Evento A: Prima vite non difettosa

• Evento B: Seconda vite non difettosa

• P(A)=7/10

• Una volta estratta 1 vite restano nella scatola 9 viti quindi: P(B|A)=6/9=2/3

• La probabilità che anche la seconda vite sia difettosa è quindi:

P(AB)=P(A) P(B|A)=47%

Teoria della probabilità – Statistica

classica

Indipendenza stocastica -Definizione

• La nozione di indipendenza stocastica di eventi è fondamentale nella teoria della probabilità e nella pratica della sperimentazione:

Definizione: Due eventi si dicono indipendenti se:

• Dalla definizione di probabilità condizionata:

� � ∩ � = � �|� � �

• Nel caso in cui P(A B)=P(A) P(B) si ottiene:

� �|� = � �

• Ovvero qualunque cosa accada a B essa non dà informazioni su A. Quindi A e B sono indipendenti

BPAPBAP

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 14

Teoria della probabilità – Statistica

classicaIndipendenza stocastica – Esempio

• Riesaminiamo l’esempio delle viti considerando di reimmettere nella scatola la vite estratta inizialmente.

• Intuitivamente, questo implica la perdita di informazione acquisita con il precedente risultato

• P(A) = P(B) = 0.7

• P(AB) = P(A) P(B) = 49 %

• Nota: Non si devono confondere eventi disgiunti con eventi indipendenti.

• Infatti due eventi disgiunti non sono indipendenti:

Teoria della probabilità – Statistica

classica

Indipendenza stocastica –Considerazioni

• Da notare la profonda differenza concettuale tra i due esempi

• Nel primo caso, il verificarsi di un evento condiziona la probabilità degli eventi successivi.

• Nel secondo caso, il reimmettere la vite nel contenitore azzera le informazioni acquisite nella prima esperienza.

• Informazioni pregresse, da un punto di vista logico, possono implicare dipendenza tra i dati sperimentali.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 15

Teoria della probabilità – Statistica

classica

Indipendenza stocastica – Esempi con i diagrammi di Venn

A

B

AB

AB

AB

P(A|B) = 1 P(B|A) = P(A B)/P(A) = P(B)/P(A)

P(A|B) ≠ P(A) P(A|B) = P(B|A) = 0

Teoria della probabilità – Statistica

classicaVariabili aleatorie - Introduzione

• In presenza di un processo aleatorio, si associa implicitamente un numero ad un risultato dell’esperienza

• Da un punto di vista matematico, è necessario sempreassociare ad un esito di un esperimento aleatorio un numero che individui univocamente l’esito osservato.

• Associare ad un processo aleatorio (scalare) un numero reale è un procedimento che facciamo sempre in modo intuitivo

Deformazione molla R

Numero reale

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 16

Teoria della probabilità – Statistica

classica

• Lancio del dado

Teoria della probabilità –Esempi Variabili Aleatorie

1

2

3

4

5

6

Y

Lancio Moneta

0

1

Y

Esempi di Variabili aleatorie Discrete: il processo casuale può assumere valori al più in

un insieme numerabile

Teoria della probabilità – Statistica

classicaVariabili aleatorie – Definizione

• Una variabile aleatoria è una funzione che associa ad ogni esito di un processo aleatorio, un distinto numero reale

Insieme dei possibili risultati del processo aleatorio

Variabile aleatoria Y

Insieme valori numerici che assume

la funzione Y• In termini rigorosi

Y : wW → y=Y(w)

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 17

Teoria della probabilità – Statistica

classicaVariabili aleatorie - Definizione

• La variabile aleatoria Y è una funzione che assume valori tali che dipendono dal “caso”

• Proprietà:

– Y è definita nello spazio degli esperimenti ed assume valori nel codominio sottoinsieme dei numeri reali.

– Qualunque sottoinsieme del codominio (evento) ha una probabilità ben definita di accadere

Teoria della probabilità – Statistica

classicaVariabili aleatorie – Definizione

• Da notare che Y è una funzione (variabile aleatoria) mentre i valori assunti da tale funzione y=Y(w), valori calcolabili quando l’esito dell’esperimento sia noto, sono numeri reali

• Nel seguito:

Y → variabile aleatoria

y → singolo esito osservato della VA

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 18

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• Definizione

• Secondo la definizione classica, la funzione di distribuzione emerge automaticamente dalle proprietà asintotiche di un campione di dimensioni infinite.

• Si può facilmente dimostrare che, per ogni variabile aleatoria Y, la funzione (reale di una variabile reale) distribuzione di probabilità (CDF: Cumulative Distribution Function)

è sufficiente per definire la probabilità di un qualunque evento pertinente al processo aleatorio.

N

yYNyYPyF

NY

lim

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• Proprietà della distribuzione di probabilità

• Inoltre:

1. FY(+ ) = 1, FY(-) = 0

2. FY è una funzione non decrescente

3. Se FY(y0)=0 allora FY(y)=0 se y <y0

4. P {Y >y1 } = 1- FY(y1)

5. FY è una funzione continua da destra: FY(y+) = FY(y)

6. P {y1 < Y y2} = FY(y2)-FY(y1)

1,0: yyFY

È facile dimostrare come tali proprietà derivino dagli assiomi di Kolmogoroff

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 19

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• Esempio di calcolo di probabilità di un evento dalla funzione di distribuzione.

E1

a b

FY(a)

FY(b)

E2

c d

FY(c)FY(d)

E = E1 E2

P{y E} =

P{a < y b}+P{c < y < d}

=FY(b)-FY(a)+ FY(d)-FY(c)y

Calcolo probabilità che y cada in E

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• In molte circostanze, per la caratterizzazione delle variabili aleatorie è molto più utile ricorrere alla derivata della funzione di distribuzione

• La funzione fY(y) prende il nome di funzione densità di probabilità (pdf)

• Proprietà della funzione densità di probabilità

– fY(y) ≥ 0 sempre

– ∫ ����

��� �� = 1

– � �� < � ≤ �� = �� �� − �� �� = ∫ �� � ����

��

ovvero y

Y Y Y

df y F y F y f u du

dy-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 20

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• Esempio di calcolo di probabilità di un evento dalla funzione densità di probabilità

E1 E2

fY(y)

y

1 2

1 2

Y Y

E E

b d

Y Y

a c

P y E

P y E P y E

f y dy f y dy

f y dy f y dy

a b c d

Teoria della probabilità – Statistica

classica

Funzioni distribuzione e densità di probabilità di una VA scalare

• Nei casi di maggiore interesse la variabile aleatoria Y è di tipo continuo, ovvero può assumere un qualunque valore lungo l’intervallo in cui è definito

• In tal caso la funzione di distribuzione è una funzione di tipo continua e la probabilità che si verifichi un evento elementare è pari a zero:

• � � = � = lim�→�

�� � − �� � − �

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 21

Teoria della probabilità – Statistica

classica

Distribuzione di probabilitàDefinizione media e varianza

• Spesso, è sufficiente per caratterizzare una variabile aleatoria (almeno in forma approssimata) conoscere solo alcune grandezze che sono calcolabili dalle funzioni densità di probabilità come ad esempio media e varianza.

• Il valore medio di una variabile aleatoria è dato da:

• Tale valore prende anche il nome di VALORE ATTESO della variabile aleatoria Y ed è indicato con il simbolo

Y=EY[Y]

• Se una distribuzione è simmetrica rispetto a y=c, (f(c+y)=f(c-y)) si vede che =c

Y y f y dy

-

Teoria della probabilità – Statistica

classica

Variabili aleatorie: Altre misure del trend centrale

• Mediana di una variabile aleatoria Y

• Il valore m per cui:

• Moda di una variabile aleatoria Y

• Il valore c per cui la funzione densità di probabilità assume valore massimo:

• Se la distribuzione è simmetrica, media e mediana coincidono.

2

1mFY

max:Yfc

y0 2 4 6 8

f Y(y

)

0.0

0.1

0.2

0.3

0.4

0.5

Area = 0.5

Area = 0.5

y0 2 4 6 8

f Y(y

)

0.0

0.1

0.2

0.3

0.4

0.5

fY(y) max

Mediana

Moda

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 22

Teoria della probabilità – Statistica

classica

y0 2 4 6 8

f Y(y

)

0.0

0.1

0.2

0.3

0.4

0.5 Moda

Mediana

Media

Variabili aleatorie: Altre misure del trend centrale

• Nel caso generale di distribuzioni non simmetriche media, mediana e moda non coincidono

Teoria della probabilità – Statistica

classica

Variabili aleatorie: Indici di posizione e dispersione

• Varianza: è una misura della dispersione della distribuzione intorno al suo valore atteso. Per definizione:

se esiste.

• La varianza è sempre non negativa

• Altra grandezza usata per valutare la dispersione della distribuzione è la deviazione standard (ha la stessa unità di misura della media)

-

-

-

continua

discreta

22

22

Ydyyfy

Yyfy

YYY

jjYYjY

s

s

2

YYss

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 23

Teoria della probabilità – Statistica

classica

x-4 -2 0 2 4

f(x)

0.0

0.1

0.2

0.3

0.4

-3.2 1.5 x-4 -2 0 2 4

f(x)

0.0

0.4

0.8

1.2

-1.1 0.4

Distribuzione di probabilitàDefinizione media e varianza

• Qualitativamente: al diminuire della varianza, la pdf si restringe intorno al suo valore medio

• Diminuisce l’incertezza nel processo aleatorio

(1) (2)

2 21 2s s

L’intervallo di valori in cui gli esiti del processo aleatorio ricadono più frequentemente è molto più ampio nel primo caso che nel secondo

Area=

0.95

Teoria della probabilità – Statistica

classica

Distribuzione di probabilità –Definizione momenti

• Possiamo generalizzare media e varianza con i momenti:

• La media è quindi il momento primo della distribuzione, mentre la varianza è il momento centrale di ordine 2.

• N.B. E’ possibile valutare i momenti di una distribuzione solo se essi sono definiti.

nn

n

n

m y f y dy

M y f y dy

-

-

-

momento n-esimo

momento centrale n-esimo

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 24

Teoria della probabilità – Statistica

classica

Variabili aleatorieFunzioni continue - Esempi

• Funzione di distribuzione uniforme

1,

0 ,Y

se y a bf y b a

se y a b

-

fY(y)

ya b

1/(b-a)

FY(y)

ya b

1

pdf cdf

Dipende da due parametri: a e b

Teoria della probabilità – Statistica

classica

Variabili aleatorieFunzioni continue - Esempi

• Distribuzione uniforme

• È possibile calcolare la media e varianza di tale funzione di distribuzione:

1

2

b

Y

a

a by f y dy y dy

b a

-

-

2222 1

2 12

b

Y

a

a ba by f y dy y dy

b as

-

- - -

-

Questo risultato poteva essere

intuitivo dato che la funzione è

simmetrica rispetto al suo punto medio

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 25

Teoria della probabilità – Statistica

classica

Variabili aleatorieFunzioni continue - Esempi

• Distribuzione di tipo Esponenziale

exp0

1 exp

f y yy

F y y

l l

l

-

- -

La funzione ha un solo parametro: l

l

1

2

2 1

ls

y y

pdf cdf1

l

fY(y)FY(y)

Teoria della probabilità – Statistica

classica

Variabili aleatorieFunzioni continue - Esempi

• Distribuzione di tipo Weibull

0

exp1

exp1

l--

l-l -

y

k

yyF

k

yyyf

k

kk

-

ls

l

22

2

1

12

11

k

k

k

kk

k

k

k

Y

k

Y

N.B. per k = 1 la Weibull

degenera nella distribuzione di

tipo esponenziale

In letteratura la sua espressione non è univoca e si trovano altre

formulazioni equivalenti

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 26

Teoria della probabilità – Statistica

classica

Variabili aleatorieFunzioni continue - Esempi

• Distribuzione di tipo Weibull

0 0.5 1 1.5 2 2.5 3 3.5 40

0.5

1

1.5

2

2.5

y

y(y

)

k<1

k=1k>1

Teoria della probabilità – Statistica

classica

Variabili aleatorie:Teorema limite centrale

“Sia {Xi} una successione di variabili aleatorie indipendenti di media e varianza s2, indipendenti ed

identicamente distribuite, allora la somma

converge asintoticamente verso una variabile aleatoria normale (o altrimenti detta Gaussiana)”

n

iin

XS1

se le sorgenti di errore in una osservazione sono infinite ed indipendenti, la variabile aleatoria può essere assunta di

tipo Normale

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 27

Teoria della probabilità – Statistica

classicaCarl Friedrich Gauss

Gaussiana

Teoria della probabilità – Statistica

classicaFunzione di distribuzione Gaussiana

• Una variabile aleatoria (continua) si dice normale o Gaussiana se la sua densità di probabilità è:

• La funzione è definita lungo tutto l’asse reale (ovvero un qualunque numero reale può essere un esito di una VA di tipo normale)

• Il grafico di tale funzione è una curva a campana simmetrica rispetto a y=Y

• La distribuzione dipende da due parametri, e s2.

• La maggior parte delle variabili aleatorie con cui si avrà a che fare sono Gaussiane (o comunque derivate dalla Gaussiana).

2

2

1 1exp

22

YY

YY

yf

s s

- -

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 28

Teoria della probabilità – Statistica

classicaFunzione di distribuzione Gaussiana

• La gaussiana è simmetrica rispetto al valore Y pertanto la media coincide con il valore Y

• Si può verificare matematicamente che il parametro s2 definito nell’espressione coincide con la varianza della funzione di distribuzione.

Teoria della probabilità – Statistica

classicaFunzione di distribuzione Gaussiana

In figura sono riportate tre gaussiane con egual media e varianza 0.25, 0.5, 1

• La distribuzione di probabilità non è disponibile analiticamente ma esiste sotto forma tabulare.

-2 -1 1 2 3 4

0.25

0.5

0.75

1

1.25

1.5 Varianza s2 = 0.25

Varianza s2 = 1

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 29

Teoria della probabilità – Statistica

classica

-s s s s-s-s

Funzione di distribuzione Gaussiana

68.26%

95.46%

99.73%

Aree sottese dalla distribuzione normale

N.B.

Questo è vero per ogni valore

di e s nel caso della Gaussiana!

Teoria della probabilità – Statistica

classica

Distribuzione normale (o di tipo Gaussiano)

• Al diminuire di s, i risultati dell’esperienza aleatoria assumono valori in intervalli sempre più piccoli

• L’incertezza diventa sempre più piccola

• Non esistono delle tabelle per calcolare le probabilità per i generici valori di e s.

• Vedremo nel seguito come è possibile ricondurre il calcolo della probabilità sempre alla VA di tipo standard

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 30

Teoria della probabilità – Statistica

classica

Variabili aleatorie: Distribuzioni –Riepilogo concetti

• Rappresentazione casualità tramite:

– Introduzione concetto Variabile Aleatoria (VA)

– Caratterizzazione proprietà VA tramite funzioni a valori reali

• Definizione funzioni di distribuzione e densità di probabilità

– Proprietà

– Esempi

• VA di tipo Uniforme

• Esponenziale

• Weibull

• Gaussiana (o Normale)

– Teorema del limite centrale

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria. Esempio con VA discreta

• Il seguente gioco assegna le seguenti vincite per un lancio di dadi:

– 0.10 euro se esce un numero dispari

– 0.20 euro se esce il 2

– 0.30 euro se esce il 4

– 0.40 euro se esce il 6

• Quale è la probabilità che il giocatore vinca 0.2 euro nella singola giocata?

• La possibilità che si vinca una certa cifra con questo gioco è una variabile aleatoria?

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 31

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria.Caso discreto

• I possibili eventi elementari per la nuova VA vincita al gioco possono essere :

w1 = {0.1, 0.2, 0.3, 0.4}

• Se il dado è regolare, è possibile ricavare quale è la probabilità che si verifichi il singolo evento.

• È possibile quindi definire una funzione di una variabile aleatoria. In questo caso associo ad ogni evento dello spazio campione un altro elemento di uno spazio 1

0.1 1,3,5

0.2 2

0.3 4

0.4 6

0

euro y

euro y

g y euro y

euro y

altrove

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria.Esempio caso discreto

Funzione densità di probabilità del lancio di dadi

Funzione densità probabilità vincita di euro

y1 2 3 4 5 6

f Y(y)

1/6

z0.1 0.2 0.3 0.4

f Z(z)

½

1/6

Z = g(Y)

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 32

Teoria della probabilità – Statistica

classicaFunzioni di una variabile aleatoria

Y(w)

Spazio campione

W

g(Y)

Codominio della VA Y

=Spazio campione della

VAY

Insieme dei valori che può assumere la Y

1

Codominio della funzione della VA

=Spazio campione della

VA Z=g(Y)

Insieme dei valori che può assumere la Z = g(Y)

Insieme dei risultati possibili

R 1 R

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria.Valore atteso

• Funzione vincita al gioco dei dadi

• Quanto si deve pagare per il singolo lancio affinché il gioco sia equo?

• Dovrei pagare per il singolo lancio una quota che sia la media delle possibili vittorie (ovvero l’esito della nuova variabile aleatoria) per la singola esperienza.

• Nel caso in esame:

• Il valore ottenuto si definisce il valore atteso della funzione g(y) e si indica con il simbolo E(g(y))

1 1 1 1 10.10 0.20 0.30 0.40

2 6 6 6 5

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 33

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria.Valore atteso

• Definizione:

• Sia Y una variabile aleatoria e g( · ) una funzione misurabile, si definisce quindi media (o valore atteso) di g(Y) lo scalare:

• N.B. La g(y) deve essere definita per ogni Y per cui la funzione pdf fY(y) non è nulla.

-

continuoCasodyyfygYgE

discretoCasoyfygYgEj

jj

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria –Valore atteso

• Esempio – Si consideri la seguente trasformazione

• È immediato verificare che il valore atteso di tale funzione coincide con la varianza della VA Y:

66

2

YYYg -

22

YYYYdyyfydyyfygYgE s-

-

-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 34

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoriaProprietà del valore atteso

• Altre proprietà del valore atteso:

1 1 2 2 1 1 2 2

E c c

E c g Y c E g Y

E c g Y c g Y c E g Y c E g Y

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria. Determinazione della media

• Data una variabile aleatoria Y ed una trasformazione g(y) formiamo la nuova Variabile Aleatoria Z=g(Y).

• La media di Z è

• Se è nota la distribuzione di Y non è necessario conoscere la fZper determinare la media di Z.

• Teorema della media:

• Siano Y e Z due variabili aleatorie tali che Z = g(Y), è valida la seguente proprietà (N.B. se esistono gli integrali presi in considerazione)

Z ZE Z z f z dz

-

( )ZZ YZ YE g Y g yE Z z f z d fz y dy

- -

Valutato in Z Valutato in Y

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 35

Teoria della probabilità – Statistica

classica

Trasformazioni affini di una Variabile Aleatoria

• Definizione trasformazione affine:

• In genere ci si riferisce a tale trasformazione come lineare

(ma rigorosamente non lo è dato che non rispetta il principio di sovrapposizione degli effetti)

Z = g(Y)=aY+b a,b

Teoria della probabilità – Statistica

classica

Trasformazioni affini–Determinazione media

• Problema: Non si conosce di che tipo di variabile aleatoria sia Y ma ne conosciamo media e varianza, è possibile determinare la media e la varianza di Z?

• Se g(Y) è una trasformazione affine:

Z = g(Y)=aY+b

ba

bYEabaYE

ZE

Y

YY

ZZ

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 36

Teoria della probabilità – Statistica

classica

Trasformazioni affini variabile aleatoria – Calcolo della varianza

• Anche per la varianza è possibile determinare una espressione analitica

222222

22222

22 YYYYY

YYZZZ

aabYbaEaYEa

babYaEZE

s--

--s

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoriaCalcolo della varianza

• Anche detta legge di propagazione degli errori.

• Sia data una legge Z = g(Y), si intende calcolare la varianza della nuova VA

22

2 2 2

2 2

Z

Z Z

Z E Z

E g Y E g Y

E g Y E g Y

s

-

- -

-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 37

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria. Determinazione di media e varianza

• Invece se la trasformazione è non lineare si possono solo stimare in modo approssimato la media e la varianza di Z

• Si linearizza g intorno a Y:

• Troncando al primo ordine:

2

2

2

1

2Y Y

Y Y Y

dg d gg y g y y

dy dy

- -

Y

Z Y Y Y Y Y

dgE Z g y f y dy g y f y dy g

dy

- -

-

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoria. Determinazione di media e varianza

• Troncando al secondo ordine:

• Per la varianza

2

2

2

1

2Y

Z Y Y

d gg

dy

s

2

2 2

Y

Z Y

dg

dy

s s

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 38

Teoria della probabilità – Statistica

classica

Funzioni di variabile aleatoria.Caratterizzazione completa VA.

• Ci si può domandare come sia distribuita Z. Procediamo per gradi e supponiamo per semplicità che la funzione g sia monotona in modo da avere una corrispondenza biunivoca tra Y e Z.

z=g(y)

y

z

Dominio yy(y)

Dom

inio

zy

(z)

P{y≤Y ≤y+dy}=P{z≤Z≤z+dz}= y(y)dy=y(z)dz

dy

dz

P{y≤Y ≤y+dy}=y(y)dy

P{z≤Z≤z+dz}=y(z)dz

Teoria della probabilità – Statistica

classica

Funzioni di variabile aleatoria.Caratterizzazione completa VA.

• z e dz non sono qualunque ma corrispondono a y e dy

• Obiettivo: conoscere fZ(z)

dzzfdzzZzP

dyyfdfdyyYyP

Z

Y

dyy

y

Y

1

z g y

y g z-

zgy

YYZYZ

dy

dz

zgf

dy

dz

yfzfdyyfdzzf

1

1

-

-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 39

Teoria della probabilità – Statistica

classica

Funzioni di variabile aleatoria.Caratterizzazione completa VA.

• Esempio: Trasformazione affine

Z=aY+b

• Da cui:

g’(y)=a

• L’equazione z=ay+b ha una unica soluzione:

• Quindi:

• Se la funzione di trasformazione è affine non cambia il tipo di variabile aleatoria. Questo è vero qualunque sia Y.

a

bzy

-

-

a

bzf

azf YZ

1

Teoria della probabilità – Statistica

classica

• Da cui, esplicitando la dipendenza inversa di y da z

--

---

-

-

-

2

2

222

22

2

2

2

2

1exp

2

1

2

1exp

2

1

2

1exp

2

11

Z

z

Z

YZ

YZ

Y

Y

y

Y

Y

Y

Z

z

a

ba

a

abz

a

a

bz

azf

s

s

ss

s

s

s

sLa nuova VA è

ancora una

Gaussiana di media

Z=a+bY

e varianza

sZ2=a2sY

2

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 40

Teoria della probabilità – Statistica

classica

Funzioni di VA GaussianeTrasformazioni lineari

• Data una variabile aleatoria Y (di tipo gaussiano) di media Y e

varianza sY2

• Si consideri la seguente trasformazione lineare:

• Di che tipo è la nuova variabile aleatoria?

• Quale è la media e la varianza della nuova variabile?

• È facile verificare che:

Y

YYZ

s

-

Gaussiana di tipo standard1

02

Z

Z

s

Teoria della probabilità – Statistica

classica

Funzioni di VA GaussianeTrasformazioni lineari

• Nota la funzione di distribuzione standard è possibile ricavare le proprietà di una qualsiasi distribuzione gaussiana

• In particolare, è possibile calcolare la probabilità che si verifichi un dato evento per un generico processo, con media e varianza note.

• Questo è possibile sapendo solo i valori della distribuzione di tipo standard.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 41

Teoria della probabilità – Statistica

classica

Calcolo probabilità per una Gaussiana generica

-5 0 5 10 15

= 10; s2 = 0.5

(y – )z =

s

-2.83

8

-1.58 1.58-5 0 5 10 15

Normale standard

100-5 5 15

= 5; s2 = 10

0

10

Teoria della probabilità – Statistica

classica

Calcolo probabilità per una Gaussiana generica

• Esempio: calcolare quale è la probabilità che si verifichi un evento appartenente all’intervallo [0,5] per la variabile aleatoria di media 3 e deviazione standard 2:

• Si deve calcolare quale è la probabilità che la variabile aleatoria di tipo standard assuma un valore nell’intervallo corrispondente.

82

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 42

Teoria della probabilità – Statistica

classica

Calcolo probabilità per una Gaussiana generica

• Dobbiamo calcolare la probabilità:

• Gli estremi dell’intervallo corrispondente per la distribuzione di tipo standard possono essere facilmente calcolati

0 5P X

11

0 3

2X

X

xz

s

- -

22

5 31

2X

X

xz

s

- -

0 5

1.5 1

0.8413 0.0668 77.4%

P X

P Z

-

-

Teoria della probabilità – Statistica

classica

Calcolo probabilità per una Gaussiana generica

• Esercizi

• Sia Y una variabile aleatoria di tipo normale, di media = 16 e varianza s2 = 25

• Calcolare:

– P(Y > 20)

– P(20 < Y < 25)

– P(Y < 10)

– P(12 < Y < 24)

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 43

Teoria della probabilità – Statistica

classica

Funzioni di VA Gaussiane –Esempio trasformazioni non lineari

• Esempio: Trasformazione non lineari

• Data una variabile aleatoria Y di tipo normale, descritta dalla seguente distribuzione

• si consideri la seguente trasformazione non lineare

• Si intende calcolare la distribuzione della variabile aleatoria Z.

• Innanzitutto quali valori può assumere la VA Z?

YeZ

2

2

1 1exp

22

YY

YY

yf

s s

- -

Teoria della probabilità – Statistica

classica

Funzioni di VA Gaussiane –Esempio trasformazioni non lineari

• Una variabile aleatoria di tipo gaussiano può assumere un qualunque valore reale.

– Il suo esponenziale ovviamente no

– Questa indicazione è già sufficiente per stabilire che l’esponenziale di una variabile aleatoria di tipo Gaussiano non è più dello stesso tipo.

• Questa proprietà è vera per qualunque tipo di variabile aleatoria: una trasformazione non lineare implica una trasformazione del tipo di variabile aleatoria.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 44

Teoria della probabilità – Statistica

classica

Funzioni di VA Gaussiane –Esempio trasformazioni non lineari

• Come visto precedentemente

• Si può facilmente vedere che

• Da cui

• Ed è uguale a zero per z < 0.

• Tale distribuzione prende il nome di distribuzione Lognormale

z

Y

z

YZ

yg

zgf

dy

dz

yfzf

'

1-

zzg log1 -

zeygzy

y

z

log'

0

log

2

1exp

2

12

2

-- z

z

zzf

Y

Y

Y

Zs

s

Teoria della probabilità – Statistica

classica

Funzioni di VA Gaussiane: Distribuzione Lognormale

• Grafico e proprietà della distribuzione Lognormale

• È un tipico esempio di distribuzione asimmetrica

z

0 2 4 6 8 10

f(z)

0.0

0.1

0.2

0.3

2exp

2Y

YZZEs

222 2exp1exp YYYZ sss -

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 45

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoriaTrasformazioni non biunivoche

• Nel caso di trasformazione non biunivoca le cose si complicano dal punto di vista operativo, ma concettualmente il problema non è molto diverso

z+dz

g’(y3)

z

y3 y3+dy3y2 y2+dy2

g’(y2)

y1 y1+dy1

g’(y1)

Z=g(Y)

Teoria della probabilità – Statistica

classica

Funzioni di una variabile aleatoriaTrasformazioni non biunivoche

• Dalla corrispondenza degli eventi riguardanti la VA Z e la VA Y è facile dimostrare che

• Per i valori di z per i quali l’equazione Z = g(Y) ha le soluzioni y1,y2,…,yn e

• Per i valori di z per cui l’equazione z=g(y) non ammette soluzioni

1 2

1 2

...' ' '

Y Y Y n

Z

n

f y f y f yf z

g y g y g y

0Zf z

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 46

Teoria della probabilità – Statistica

classicaVariabili Aleatorie Vettoriali

• Spesso negli esperimenti si osservano molte quantità contemporaneamente.

• E’ evidente che è possibile generalizzare il concetto di variabile aleatoria introducendo la VA vettoriale:

• Una VA vettoriale ad N componenti è rappresentabile in uno spazio ad N dimensioni.

• Se N=2 gli eventi sono sottoinsiemi del piano.

1 2 , ...,,T

NYY YY

Teoria della probabilità – Statistica

classicaVariabili Aleatorie Vettoriali

• Se in un esperimento stocastico osserviamo 2 quantità dobbiamo associare all’esperimento due variabili aleatorie: Y1 ed Y2.

• Ogni esecuzione dell’esperimento fornisce una coppia di numeri (y1 ed y2)

• Se si conosce la probabilità:

a1 b1

b2

a2

Y1

Y2

1 1 1 2 2 2,P a Y b a Y b

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 47

Teoria della probabilità – Statistica

classica

VA vettoriali – Funzione densità di probabilità congiunta

• La distribuzione di probabilità della VA vettoriale Y è:

• La funzione densità di probabilità congiunta fY(y1,y2) è tale che:

1 2 1 1 2 2, ,F y y P Y y Y y

1 1 1 2 2 2 1 2 1 2 1 2 1 2, , , , ,P a Y b a Y b F b b F a b F b a F a a - -

1 2

1 2, ,y y

F y y f w v dwdv- -

2 1

2 1

1 1 1 2 2 2, ,b b

a a

P a Y b a Y b f w v dwdv

, 1f w v dwdv

- -

Teoria della probabilità – Statistica

classica

V.A. VETTORIALI –Distribuzioni Marginali

• Ad ogni distribuzione bidimensionale possiamo associare 2 distribuzioni monodimensionali che sono dette distribuzioni marginali:

• Analogamente, si può osservare:

• Le distribuzioni marginali fY1 e fY2 rappresentano le probabilità che si verifichino, rispettivamente, gli eventi Y1 e Y2, indipendentemente dall’esito dell’altra componente

1

1 1 1 1 2, ,y

YF y P Y y Y f w v dwdv

- -

-

1

2

1 ,

2 ,

Y

Y

f y f w v dv

f y f w v dw

-

-

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 48

Teoria della probabilità – Statistica

classica

VA vettoriali – Funzione densità di probabilità congiunta

• Esempi di pdf bidimensionali

Rappresentazione tridimensionale Curve di isolivello

fY(y1,y2)

Teoria della probabilità – Statistica

classica

V.A. VETTORIALI –Distribuzioni Marginali

• La F della VA vettoriale si dice congiunta. Nel caso generico N-dimensionale si ha una F congiunta ed N marginali.

• Importante:

• Dalla funzione densità di probabilità (distribuzione) congiunta è sempre possibile risalire alle funzioni densità di probabilità (distribuzioni) marginali, mentre non è in genere vero il contrario

96

Distribuzione congiunta

Distribuzioni marginali

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 49

Teoria della probabilità – Statistica

classica

V.A. VETTORIALI –Distribuzioni Marginali

• Distribuzioni marginali -Esempio

fY2(y2)

fY1(y1)

Teoria della probabilità – Statistica

classicaV.A. INDIPENDENTI: Definizione

• Due VA Y1 ed Y2 di congiunta FY(y1, y2) si dicono indipendenti se:

• In tal caso, per ogni coppia di eventi {a1<Y1b1} e {a2<Y2b2} vale:

cioè se e solo se i due eventi sono indipendenti. Ovviamente il discorso è generalizzabile ad N dimensioni.

1 1 1 2 2 2 1 1 1 2 2 2,P a Y b a Y b P a Y b P a Y b

�� ��, �� = ����� � ���

��

�� ��, �� = ����� � ���

��

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 50

Teoria della probabilità – Statistica

classica

VA Vettoriali –Definizione VA indipendenti

• Esempio 2D

• Due VA Y1 ed Y2 di congiunta F(y1, y2) si dicono indipendenti se:

• In tal caso:

1 2

1 2

1 2 1 2

1 2 1 2

,

,

y y

y y

F y y F y F y

f y y f y f y

Distribuzione congiunta

Distribuzioni marginali

Teoria della probabilità – Statistica

classica

VA Vettoriali – Funzione densità di probabilità condizionata

• Concetto di funzione densità di probabilità condizionata.

• Per semplicità si assuma Y 2 un vettore di variabili aleatorie tale che:

– Probabilità di Y1 condizionata dalla componente Y2:

– Probabilità di Y2 condizionata dalla componente Y1:

RYRYY

Y

21

2

1 ,Y

2

21

21

,21 yf

yyfyyf

yy

Y2

Y

11

21

12

,12 yf

yyfyyf

y

yy

Y

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 51

Teoria della probabilità – Statistica

classica

VA Vettoriali – Funzione densità di probabilità condizionata

• Caso particolare: VA vettoriali bidimensionali

RYYY

Y

21

2

1 ,Y

0,;,

12122

2

21

2121

2

-

dyyyfyfyf

yyfyyf y

y

YY Y

Y

0,;,

22111

1

21

1212

1

-

dyyyfyfyf

yyfyyf y

y

YY Y

Y

Teoria della probabilità – Statistica

classica

VA Vettoriali – Funzione densità di probabilità condizionata

• Esempi di probabilità condizionate:

y2=a

y1=b

ayf

ayyfayyf

Y

aYY

2

2121

2

21

,Y

byf

ybyfbyyf

Y

bYY

1

21

12

1

12

,Y

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 52

Teoria della probabilità – Statistica

classica

VA Vettoriali – Funzione densità di probabilità condizionata

• Da notare che nel caso di variabili aleatorie Y1 e Y2 indipendenti:

• si ha:

• Quando due VA sono indipendenti qualunque evento dell’una non è condizionato dagli eventi dell’altra.

2121 21, yfyfyyf YYY

21212

12121

2

1

yfyyf

yfyyf

YYY

YYY

Teoria della probabilità – Statistica

classicaVariabili Aleatorie Vettoriali

• Caso Gaussiano:

• Se le due VA sono indipendenti allora la congiunta:

• NB: la congiunta contiene 4 parametri

s

--

s

s

--

s

ss

22

2

22

2

21

2

11

1

2222

2111

2

1exp

2

1

2

1exp

2

1

,~,~

2

1

yf

yf

NYNY

Y

Y

--

--

22

2

2221

2

11

21 2

1

2

1exp

2

1

s

s

ss

yyfY

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 53

Teoria della probabilità – Statistica

classica

Variabili aleatorie vettoriali Caso coppia di VA Gaussiane

• Una coppia di variabili aleatorie Y = (Y1, Y2) si dicono congiuntamente gaussiane (o normali) e si denotano con il simbolo

• se la loro pdf congiunta assume la seguente espressione:

• I parametri di tale pdf sono:

– Il vettore è il vettore delle medie

– La matrice , simmetrica, definita positiva, è la matrice di covarianza

1

exp22 det

f

- - - -

T1

Y

y μ V y μy

V

μV

21 12

212 2

s s

s sV

VμY ,~ N

Teoria della probabilità – Statistica

classica

Variabili aleatorie vettoriali Caso Gaussiano

• Gli elementi della matrice di covarianza sono:

• Non è vero generalmente il contrario (ma per Gaussiane si)

• Per convincersi che la matrice di covarianza V caratterizza la dispersione dei dati si può vedere che, per una coppia di VA congiuntamente gaussiane le linee di isolivello della pdf hanno equazione:

21221112

2

2

2222

1

2

1121

Y e YVA delle covarianza

YVA della varianza

YVA della varianza

s

s

s

--

-

-

YYE

YE

YE

VA Y1 e Y2 indipendenti La covarianza è nulla

(y-)TV-1(y-) = cost

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 54

Teoria della probabilità – Statistica

classica

Variabili aleatorie vettorialiCoefficiente di correlazione

• Dalla matrice di covarianza è possibile determinare la correlazione tra due variabili aleatorie.

• Siano date due variabili aleatorie Y1 e Y2. Il coefficiente di correlazione è definito come:

• Per come è definito:

21

12

21

2112

,cov

ss

sr

YVYV

YY

11 12 - r

Teoria della probabilità – Statistica

classica

Variabili aleatorie vettoriali Caso Gaussiano VA Indipendenti

-2

0

2

-2

0

2

00.0250.05

0.0750.1

-2

0

2

-3 -2 -1 0 1 2 3

-3

-2

-1

0

1

2

3

1 0 0

0 2 0 V μ

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 55

Teoria della probabilità – Statistica

classica

Variabili Aleatorie Vettoriali di tipo Normale – VA indipendenti

• Nel caso di variabili aleatorie di tipo Gaussiano indipendenti:

• La congiunta assume la seguente forma:

• NB: la congiunta contiene 4 parametri

--

--

22

2

22

2

21

2

11

1

2222

2111

2

1exp

2

1

2

1exp

2

1

,~,~

2

1

s

s

s

s

ss

yf

yf

NYNY

Y

Y

--

--

22

2

222

1

2

11

21

212

1

2

1exp

2

1

s

s

ss

yyfff YYY

Teoria della probabilità – Statistica

classica

y1-3 -2 -1 0 1 2 3

Variabili aleatorie vettoriali Caso Gaussiano VA Indipendenti

• Rappresentazione distribuzioni marginali e probabilità condizionate

-3 -2 -1 0 1 2 3

-3

-2

-1

0

1

2

3

fY2

fY1

y1-3 -2 -1 0 1 2 3

y 1-3 -2 -1 0 1 2 3

21 2 1 1| 1.5 0, 1Yf y y s

21 2 1 1| 1.5 0, 1Yf y y s -

La probabilità dell’evento y1

non cambia con il valore di y2

=0s2=2

=0s2=1

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 56

Teoria della probabilità – Statistica

classica

Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti

1 0

2 0

V μ

-2 -1 0 1 2

-2

-1

0

1

2

-2

0

2

-2

0

2

0

0.1

0.2

-2

0

2

Teoria della probabilità – Statistica

classica

-3 -2 -1 0 1 2 3

Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti

• Rappresentazione distribuzioni marginali e probabilità condizionate

y1-3 -2 -1 0 1 2 3

fY1 =0s2=1

fY2

=0s2=2

21 2 1 1| 1.5 1.2, 0.36Yf y y s

-3 -2 -1 0 1 2 3

21 2 1 1| 1.5 1.2, 0.36Yf y y s - -

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 57

Teoria della probabilità – Statistica

classica

Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti

• Nel caso di correlazione |r| = 1 la distribuzione degenera in una retta.

-2

0

2

-2

0

2

0

0.2

0.4

-2

0

2

-3 -2 -1 0 1 2 3

-3

-2

-1

0

1

2

3

Domanda: in questo caso come si comportano le marginali e le probabilità condizionate?

Teoria della probabilità – Statistica

classica

Variabili Aleatorie di tipo Normale Vettoriali – Caso Generico

• Nel caso generico di n componenti la variabile aleatoria vettoriale assume la forma:

• I parametri di tale pdf sono raccolti nel vettore e nella matrice V:

• = (1, , ... , n);

• V, matrice (n × n) definita positiva, è la matrice di covarianza.

• Ancora, se le VA componenti sono indipendenti, la matrice V è diagonale perché tutte le covarianze sono nulle.

--- - μyVμy

Vy 1T

Y2

1exp

det2

12/n

f

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 58

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali

• I concetti esposti per le trasformazioni di variabili scalari possono essere estesi al caso vettoriale.

• Si consideri la generica trasformazione non lineare:

• Vogliamo determinare la densità di probabilità congiunta di Z.

1 1 21

2 1 22

,

,

o, equivalentemente

g Y YY

g Y YY

Y Z

Z g Y

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali

• Il ruolo della derivata nella trasformazione è assunto dallo Jacobiano, ma i passaggi sono concettualmente analoghi al caso scalare:

1 1 1 2

2 2 1 2

1 2

1 1

1 21 2

1 2 21 2

1 2

,

,

,

,

,

YZ

i i

Nradi i

i i i

z g y y

z g y y

y y Radici del sistema

z z

y yf y yf J

z zJ y y

y y

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 59

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare

• Se si usa una trasformazione lineare:

• La conoscenza della sola media Y e della matrice di covarianza VY

della VA Y permette la determinazione della media Z e della matrice di covarianza della VA VZ

• Come nel caso scalare risulta inoltre che solo le trasformazioni lineari conservano il tipo di Variabile aleatoria

1 1 1n n n n n

TZ a Y b

TZ Z

TZ Y

μ a μ b

V a V a

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare

• Nel caso lineare è possibile anche analizzare trasformazioni di VA vettoriali di dimensioni differenti, per esempio da una VA vettoriale Y di dimensioni (n × 1) ad una W di dimensioni (p × 1)

• Generalizzando le relazioni precedenti si ottiene:

111

pnnpp

dYcW T

TW Z

TW Z

μ c μ d

V c V c

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 60

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare

• Un caso particolare di interesse è quando p = 1.

• In tal caso si ottiene, almeno per VA vettoriali indipendenti:

• Per esempio, nel caso W = Y1 + Y2+ … +Yn

222

222

21

21

2

2211

...

...

YnnYYW

YnnYYW

ccc

dcdcdc

ssss

222

21

2

21

...

...

YnYYW

YnYYW

ssss

Teoria della probabilità – Statistica

classica

Trasformazioni di Variabili aleatorie Vettoriali

• Particolare importanza hanno le trasformazioni di una VA vettoriale Y in una VA scalare (caso m=1)

• Sono, ad esempio, di uso molto comune alcune VA scalari che derivano (attraverso trasformazioni non lineari) da variabili aleatorie vettoriali gaussiane Y ad n componenti, con vettore delle

medie = 0 e matrice di covarianza V = I.

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 61

Teoria della probabilità – Statistica

classica

Variabili Aleatorie derivate dalla

gaussiana - Variabile

• Si consideri una VA vettoriale ad n componenti Y = (Y1, Y2, …, Yn)

• Le componenti sono quindi tutte indipendenti e gaussiane di media nulla e varianza unitaria. La variabile aleatoria scalare

• prende il nome di variabile aleatoria 2 ad n gradi di libertà.

• Tale variabile aleatoria è caratterizzata completamente da un solo parametro, il numeri di gradi di libertà n.

Y~N(0,I)

222

21 ... nYYYZ

Teoria della probabilità – Statistica

classicaVariabile aleatoria

• Funzione densità di probabilità

0 1 2 3 4 5 6 7 8 9 100

0.1

0.2

0.3

0.4

0.5

n = 1n = 2n = 4n = 6

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 62

Teoria della probabilità – Statistica

classicaVariabile aleatoria

• Proprietà di una variabile aleatoria 2 ad n gradi di libertà

• Il massimo si ha per y = n-2. Da osservare che per n → ∞ la distribuzione 2 tende ad una gaussiana.

--

00

0

2

22

2

2

2

2

y

yeyK

n

nE

yn

nn

n

s

2/2

1

2 n

Knn

Teoria della probabilità – Statistica

classica

VA derivate dalla gaussiana Distribuzione t-Student

• Sia Y una variabile aleatoria gaussiana di media 0 e varianza unitaria, e Z una 2 ad r gradi di libertà

• Inoltre Y e Z siano tra loro indipendenti. La variabile aleatoria data da:

è una distribuzione t di Student ad r gradi di libertà.

r

YT

r2

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 63

Teoria della probabilità – Statistica

classica

VA derivate dalla GaussianaDistribuzione t-Student

• In figura sono mostrate le funzioni densità per 1,3,6 gradi di libertà.

• La T è simmetrica rispetto a y=0

• Per r →+∞ la t di Student tende ad una gaussiana di tipo standard.

William SealyGosset

“creatore” della t di Student

y-4 -2 0 2 4

f Y(y

)

0.0

0.1

0.2

0.3

0.4n =2

n = 4Distribuzione Standard

n

Teoria della probabilità – Statistica

classica

VA derivate dalla GaussianaDistribuzione t-Student

• Espressione analitica della t di Student

• Essendo K una costante di normalizzazione.

• Proprietà:

• Dipende da un solo parametro il numero intero r

Ry

r

yKyf rr

,

1

1

2

12

2

2

1

K

0Y

22

2 -

sYMedia: Varianza:

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 64

Teoria della probabilità – Statistica

classica

VA derivate dalla GaussianaLa distribuzione F di Fisher

• Se le variabili aleatorie Y e W sono VA di tipo 2 rispettivamente ad m ed n gradi di libertà, la VA scalare Z

è una VA di tipo F di Fisher ad (m,n) gradi di libertà.

• La VA ha due parametri, m ed n.

nWm

YZ

Teoria della probabilità – Statistica

classica

VA derivate dalla GaussianaLa distribuzione F di Fisher

• Espressione analitica della F di Fisher

Nnm

altrove

y

yn

m

y

m

n

nm

nm

nmyf

nm

mn

Y

-

,

0

0

122

2

,;

2

2

22/

2,2

-

nn

nY

2

22

24

22

--

-

nnm

nnmY

sMedia: Varianza:

Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 65

Teoria della probabilità – Statistica

classica

VA derivate dalla GaussianaLa distribuzione F di Fisher

• Grafici della F di Fisher al variare dei gradi di libertà

y0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0

f Y(y)

0.0

0.2

0.4

0.6

0.8

1.0

1.2(10, 4) g.d.l.

(10, 10) g.d.l

(10, 50) g.d.l.

(10, Infinity) g.d.l.

Sir Ronald AylmerFisher

1890 - 1962