Teoria della Probabilità e Statistica -...
Transcript of Teoria della Probabilità e Statistica -...
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 1
Teoria della Probabilità e Statistica
Cenni su teoria della probabilità e statistica
Definizione di popolazione e campione
Variabili aleatorie
Definizione funzione di distribuzione
Definizione funzione densità di probabilità
Definizione media e varianza
Funzioni di una variabile aleatoria
Variabili aleatorie vettoriali
Funzioni di variabili aleatorie vettoriali
Teoria della probabilità – Statistica
classicaMotivazioni
• Gli esiti di un singolo esperimento non sono prevedibili, anche dopo ripetute esecuzioni nelle stesse condizioni
• Ciò è dovuto all’inevitabile errore sperimentale
• Si possono comunque individuare delle regolarità nell’insieme dei risultati di un numero elevato di ripetizioni dello stesso esperimento
– ovvero si può modellare la casualità presente in una misura sperimentale
• La modellazione dell’errore sperimentale è quindi una modellazione di tipo statistico
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 2
Teoria della probabilità – Statistica
classica
Teoria della probabilità. Definizione popolazione e campione
• POPOLAZIONE
• Insieme di tutte le possibili osservazioni, di dimensione N
• Esempi:
– Le misure sperimentali, in linea di principio infinite, che possono essere effettuate
– I risultati delle elezioni politiche in un paese, ottenuti dallo spoglio dei voti.
Teoria della probabilità – Statistica
classica
Teoria della probabilità. Definizione popolazione e campione
• CAMPIONE
• Insieme dei valori osservati. È pertanto un sottoinsieme della popolazione.
• La dimensione del campione n è il numero di valori osservati.
• In genere:
n « N
• Esempi:
– Il numero finito di prove sperimentali che si è, nella realtà, effettuato.
– Le proiezioni dei risultati elettorali ottenute grazie ai cosiddetti “exit poll”.
• N.B. Il numero di possibili campioni che si può estrarre da una popolazione è pari a:
– Per N→∞ i possibili campioni sono infiniti
!!
!
nNn
N
-
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 3
Teoria della probabilità – Statistica
classica
Teoria della probabilità. Definizione popolazione e campione.
• In genere non è possibile conoscere il dettaglio di tutta la popolazione:
– La popolazione è costituita da un insieme infinito (come nel caso delle possibili misure sperimentali)
– È comunque dal punto di vista pratico impossibile (come nel caso delle elezioni politiche)
– Non ha comunque senso applicativo (esempio: crash test delle vetture)
Teoria della probabilità – Statistica
classica
Teoria della probabilità. Definizione popolazione e campione.
• Interpretazione grafica
Popolazione
Campione
Campagna sperimentale
Inferenza statistica
Dal campione si intende ottenere informazioni sulla popolazione generatrice non nota
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 4
Teoria della probabilità – Statistica
classica
Teoria della probabilità. Definizione popolazione e campione.
• Riepilogo Popolazione
Campione
Processo induttivo
Processo deduttivo
Caratterizzazione Campione: Statistica descrittiva
(introdotta nella precedente sezione)
Caratterizzazione Popolazione: Teoria della probabilità e statistica (nella sezione
corrente)
Teoria della probabilità – Statistica
classica
Introduzione concetto processo aleatorio
• Un processo si dice aleatorio se:
– Esso è replicabile sempre nelle stesse condizioni
– Il suo risultato cambia al variare delle esperienza in quanto è affetta da una componente casuale.
– Nei fatti, una esperienza aleatoria non restituisce mai lo stesso risultato se ripetuta più volte.
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 5
Teoria della probabilità – Statistica
classica
Introduzione concetto processo aleatorio
• Schema di un esperimento
Valore verodella quantità
misurata
Errore sperimentale
e
Misura sperimentale
ottenuta
y=+e+
Teoria della probabilità – Statistica
classica
Teoria della probabilitàModellazione Esperimento Aleatorio
• Il modello matematico di un processo aleatorio ha lo scopo di prevedere le regolarità (statistiche) di un’esperienza, non il singolo esito!
• Esempi:
• Lancio di un dado
– Quale è, per esempio, la frequenza della comparsa dei lati in cui sono rappresentati i numeri pari
• Lancio di una moneta
– La frequenza della comparsa della testa e/o della croce
• Misure sperimentali
– Il modello matematico deve prevedere, se esiste, il trend centrale delle misure sperimentali.
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 6
Teoria della probabilità – Statistica
classica
Teoria della ProbabilitàSpazio campione - Definizione
• L’insieme di tutti i possibili risultati che può registrare una esperienza aleatoria prende il nome di spazio campione
• Uno spazio campione può essere finito o infinito, a seconda che esso sia costituito da un numero finito o infinito di elementi.
• Esempi:
• Lancio dei dadi:
• Risultato di una misura sperimentale:
esempio: Misura di una temperatura in un reattore
• Nel primo caso lo spazio campione è un insieme discreto finito, nel secondo caso è un insieme infinito continuo
, , , , , ={ }
=R+
Teoria della probabilità – Statistica
classica
Teoria della ProbabilitàEvento
• Un evento E è un qualunque sottoinsieme dello spazio campione
• Esempi:
• Numeri pari nel lancio dei dadi:
• Risultati sperimentali: temperature osservate superiori a 100 K
E = {T>100.0}
• Oppure che si osservi la temperatura T = 273.5 K
E = 273.5 K
• L’ultimo evento introdotto è un evento elementare. Per definizione, gli eventi elementari non possono essere l’unione di altri eventi
, ,E ={ }
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 7
Teoria della probabilità – Statistica
classica
Teoria della ProbabilitàEvento
• Si possono introdurre i concetti di eventi complementari secondo le regole di insiemistica.
EC = - E
• Nel caso dei dadi:
• Nel caso del primo esempio di temperatura nel reattore:
EC={T ≤ 100.0}
• Un evento in cui non vi siano elementi si chiama evento impossibile e si indica con il simbolo Ø.
, ,EC = – E ={ }
Teoria della probabilità – Statistica
classica
Rappresentazione grafica degli eventi
Insiemistica - Diagrammi di Venn
Ew
w evento elementare ω ∈ E ⊂ �
A B
�⋃�
AB A
B
�⋃� �⋂�
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 8
Teoria della probabilità – Statistica
classica
Rappresentazione grafica degli eventi
Insiemistica - Diagrammi di Venn
E
Ec = - E:
Ec: Evento complementareA - B
A
B
AB
A B
A e B mutuamente esclusivi
�⋂� = ∅ � ⊂ �
Teoria della probabilità – Statistica
classica
Definizione Probabilità – Approccio frequentista
• Il concetto di probabilità emerge direttamente dal concetto di frequenza relativa.
• Consideriamo il caso dei lanci dei dadi ed effettuiamo 10 lanci.
, , , , , , , ,{ }
N( )/NTOT=0.00
N( )/NTOT=0.50
N( )/NTOT=0.20• Si calcola la frequenza relativa per i diversi eventi elementari dello spazio campione: N( )/NTOT=0.10
N( )/NTOT=0.10
N( )/NTOT=0.10
,
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 9
Teoria della probabilità – Statistica
classica
Definizione Probabilità – Approccio frequentista
• Aumentando le dimensioni del campione di dati sperimentali (per esempio n=50) si può avere
• Le frequenze relative tendono asintoticamente a dei valori che non cambiano più all’aumentare delle dimensioni del campione
N( )/NTOT=0.15
N( )/NTOT=0.19
N( )/NTOT=0.16
N( )/NTOT=0.17
N( )/NTOT=0.18
N( )/NTOT=0.15
N( )/NTOT=1/6
N( )/NTOT=1/6
N( )/NTOT=1/6
N( )/NTOT=1/6
N( )/NTOT=1/6
N( )/NTOT=1/6
Caso n = 50 Caso n → ∞
Teoria della probabilità – Statistica
classica
Definizione Probabilità – Approccio frequentista
• Teoricamente per n → ∞ le frequenze relative non cambiano più.
La frequenza con cui si verifica un evento elementare rimane costante all’aumentare delle prove.
• Questo è vero anche per tutti gli eventi A dello spazio campione (per esempio: numeri pari/dispari etc.)
Definizione frequentista della funzione probabilità:
• È possibile quindi definire in modo rigoroso la funzione probabilità del processo casuale in esame:
• N.B. Questo concetto è applicabile solo per processi replicabili.
lim limNN N
N EP E F E
N
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 10
Teoria della probabilità – Statistica
classica
Definizione Probabilità (Approccio Frequentista)
• Rappresentazione intuitiva dell’approccio frequentista
Popolazione
Campione
Campione →
PopolazioneN →∞
Teoria della probabilità – Statistica
classicaAssiomi di Kolmogorov (1933)
• Una volta introdotto il concetto di probabilità per un evento di un processo stocastico, tutta la teoria della probabilità può essere sviluppate partendo da tre assiomi fondamentali:
1.
2.
3.
Nel caso di spazi campioni infiniti la 3. può essere scritta:
3 bis.
0 1P E E
1P
0 BAseBPAPBAP
1
0 ,j j i kjj
P E P E se E E i k
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 11
Teoria della probabilità – Statistica
classica
Assiomi di Probabilità –Kolmogoroff (1933)
• Sfruttando gli assiomi di Kolmogoroff è possibile ricavare tutte le proprietà della probabilità:
• Esempio – Regola per insiemi complementari
• Dimostrazione:
1CP A P A -
0 CC AAeAA
CAPAPP 1
Teoria della probabilità – Statistica
classica
Assiomi di Probabilità –Kolmogoroff (1933)
• Altre proprietà che possono essere ricavate:
1. Regola di addizione per un numero finito di eventi mutualmente esclusivi:
2. Regola di addizione per eventi arbitrari
3. Probabilità dell’evento impossibile: P(Ø) = 0
n
jj
n
jjki APAPkiAA
11
,0
BAPBPAPBAP -
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 12
Teoria della probabilità – Statistica
classicaDefinizione Probabilità Condizionata
• Probabilità che si verifichi B se A si è verificato:
• In maniera analoga si può definire la probabilità dell’evento A condizionato dall’evento B.
• La 1) e la 2) sono valide se, rispettivamente, P(A)≠0 e P(B)≠0
)1AP
BAPABP
)2BP
BAPBAP
Teoria della probabilità – Statistica
classica
Probabilità Condizionata -Definizione
• Le probabilità condizionate sono delle funzioni probabilità dato che soddisfano gli assiomi di Kolmogoroff per un qualunque insieme M
1. P(A|M) ≥ 0 per ogni evento A
2. P(|M) = 1
3. Nel caso A e B disgiunti
– P(A B|M) = P(A|M) + P(B|M)
• Se B A allora P(A|B) = 1
• Se {Ai M Ø}, Ai = 1,2, … sono mutualmente esclusivi, allora P(A1 A2 … |M) = P(A1|M) + P(A2|M) + …
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 13
Teoria della probabilità – Statistica
classicaProbabilità Condizionata - Esempio
• Esempio:
• Uno scatola contiene 10 viti di cui 3 difettose. Estraiamo due viti a caso. Determinare la probabilità che nessuna vite estratta sia difettosa
• Evento A: Prima vite non difettosa
• Evento B: Seconda vite non difettosa
• P(A)=7/10
• Una volta estratta 1 vite restano nella scatola 9 viti quindi: P(B|A)=6/9=2/3
• La probabilità che anche la seconda vite sia difettosa è quindi:
P(AB)=P(A) P(B|A)=47%
Teoria della probabilità – Statistica
classica
Indipendenza stocastica -Definizione
• La nozione di indipendenza stocastica di eventi è fondamentale nella teoria della probabilità e nella pratica della sperimentazione:
Definizione: Due eventi si dicono indipendenti se:
• Dalla definizione di probabilità condizionata:
� � ∩ � = � �|� � �
• Nel caso in cui P(A B)=P(A) P(B) si ottiene:
� �|� = � �
• Ovvero qualunque cosa accada a B essa non dà informazioni su A. Quindi A e B sono indipendenti
BPAPBAP
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 14
Teoria della probabilità – Statistica
classicaIndipendenza stocastica – Esempio
• Riesaminiamo l’esempio delle viti considerando di reimmettere nella scatola la vite estratta inizialmente.
• Intuitivamente, questo implica la perdita di informazione acquisita con il precedente risultato
• P(A) = P(B) = 0.7
• P(AB) = P(A) P(B) = 49 %
• Nota: Non si devono confondere eventi disgiunti con eventi indipendenti.
• Infatti due eventi disgiunti non sono indipendenti:
Teoria della probabilità – Statistica
classica
Indipendenza stocastica –Considerazioni
• Da notare la profonda differenza concettuale tra i due esempi
• Nel primo caso, il verificarsi di un evento condiziona la probabilità degli eventi successivi.
• Nel secondo caso, il reimmettere la vite nel contenitore azzera le informazioni acquisite nella prima esperienza.
• Informazioni pregresse, da un punto di vista logico, possono implicare dipendenza tra i dati sperimentali.
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 15
Teoria della probabilità – Statistica
classica
Indipendenza stocastica – Esempi con i diagrammi di Venn
A
B
AB
AB
AB
P(A|B) = 1 P(B|A) = P(A B)/P(A) = P(B)/P(A)
P(A|B) ≠ P(A) P(A|B) = P(B|A) = 0
Teoria della probabilità – Statistica
classicaVariabili aleatorie - Introduzione
• In presenza di un processo aleatorio, si associa implicitamente un numero ad un risultato dell’esperienza
• Da un punto di vista matematico, è necessario sempreassociare ad un esito di un esperimento aleatorio un numero che individui univocamente l’esito osservato.
• Associare ad un processo aleatorio (scalare) un numero reale è un procedimento che facciamo sempre in modo intuitivo
Deformazione molla R
Numero reale
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 16
Teoria della probabilità – Statistica
classica
• Lancio del dado
Teoria della probabilità –Esempi Variabili Aleatorie
1
2
3
4
5
6
Y
Lancio Moneta
0
1
Y
Esempi di Variabili aleatorie Discrete: il processo casuale può assumere valori al più in
un insieme numerabile
Teoria della probabilità – Statistica
classicaVariabili aleatorie – Definizione
• Una variabile aleatoria è una funzione che associa ad ogni esito di un processo aleatorio, un distinto numero reale
Insieme dei possibili risultati del processo aleatorio
Variabile aleatoria Y
Insieme valori numerici che assume
la funzione Y• In termini rigorosi
Y : wW → y=Y(w)
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 17
Teoria della probabilità – Statistica
classicaVariabili aleatorie - Definizione
• La variabile aleatoria Y è una funzione che assume valori tali che dipendono dal “caso”
• Proprietà:
– Y è definita nello spazio degli esperimenti ed assume valori nel codominio sottoinsieme dei numeri reali.
– Qualunque sottoinsieme del codominio (evento) ha una probabilità ben definita di accadere
Teoria della probabilità – Statistica
classicaVariabili aleatorie – Definizione
• Da notare che Y è una funzione (variabile aleatoria) mentre i valori assunti da tale funzione y=Y(w), valori calcolabili quando l’esito dell’esperimento sia noto, sono numeri reali
• Nel seguito:
Y → variabile aleatoria
y → singolo esito osservato della VA
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 18
Teoria della probabilità – Statistica
classica
Funzioni distribuzione e densità di probabilità di una VA scalare
• Definizione
• Secondo la definizione classica, la funzione di distribuzione emerge automaticamente dalle proprietà asintotiche di un campione di dimensioni infinite.
• Si può facilmente dimostrare che, per ogni variabile aleatoria Y, la funzione (reale di una variabile reale) distribuzione di probabilità (CDF: Cumulative Distribution Function)
è sufficiente per definire la probabilità di un qualunque evento pertinente al processo aleatorio.
N
yYNyYPyF
NY
lim
Teoria della probabilità – Statistica
classica
Funzioni distribuzione e densità di probabilità di una VA scalare
• Proprietà della distribuzione di probabilità
• Inoltre:
1. FY(+ ) = 1, FY(-) = 0
2. FY è una funzione non decrescente
3. Se FY(y0)=0 allora FY(y)=0 se y <y0
4. P {Y >y1 } = 1- FY(y1)
5. FY è una funzione continua da destra: FY(y+) = FY(y)
6. P {y1 < Y y2} = FY(y2)-FY(y1)
1,0: yyFY
È facile dimostrare come tali proprietà derivino dagli assiomi di Kolmogoroff
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 19
Teoria della probabilità – Statistica
classica
Funzioni distribuzione e densità di probabilità di una VA scalare
• Esempio di calcolo di probabilità di un evento dalla funzione di distribuzione.
E1
a b
FY(a)
FY(b)
E2
c d
FY(c)FY(d)
E = E1 E2
P{y E} =
P{a < y b}+P{c < y < d}
=FY(b)-FY(a)+ FY(d)-FY(c)y
Calcolo probabilità che y cada in E
Teoria della probabilità – Statistica
classica
Funzioni distribuzione e densità di probabilità di una VA scalare
• In molte circostanze, per la caratterizzazione delle variabili aleatorie è molto più utile ricorrere alla derivata della funzione di distribuzione
• La funzione fY(y) prende il nome di funzione densità di probabilità (pdf)
• Proprietà della funzione densità di probabilità
– fY(y) ≥ 0 sempre
– ∫ ����
��� �� = 1
– � �� < � ≤ �� = �� �� − �� �� = ∫ �� � ����
��
ovvero y
Y Y Y
df y F y F y f u du
dy-
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 20
Teoria della probabilità – Statistica
classica
Funzioni distribuzione e densità di probabilità di una VA scalare
• Esempio di calcolo di probabilità di un evento dalla funzione densità di probabilità
E1 E2
fY(y)
y
1 2
1 2
Y Y
E E
b d
Y Y
a c
P y E
P y E P y E
f y dy f y dy
f y dy f y dy
a b c d
Teoria della probabilità – Statistica
classica
Funzioni distribuzione e densità di probabilità di una VA scalare
• Nei casi di maggiore interesse la variabile aleatoria Y è di tipo continuo, ovvero può assumere un qualunque valore lungo l’intervallo in cui è definito
• In tal caso la funzione di distribuzione è una funzione di tipo continua e la probabilità che si verifichi un evento elementare è pari a zero:
• � � = � = lim�→�
�� � − �� � − �
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 21
Teoria della probabilità – Statistica
classica
Distribuzione di probabilitàDefinizione media e varianza
• Spesso, è sufficiente per caratterizzare una variabile aleatoria (almeno in forma approssimata) conoscere solo alcune grandezze che sono calcolabili dalle funzioni densità di probabilità come ad esempio media e varianza.
• Il valore medio di una variabile aleatoria è dato da:
• Tale valore prende anche il nome di VALORE ATTESO della variabile aleatoria Y ed è indicato con il simbolo
Y=EY[Y]
• Se una distribuzione è simmetrica rispetto a y=c, (f(c+y)=f(c-y)) si vede che =c
Y y f y dy
-
Teoria della probabilità – Statistica
classica
Variabili aleatorie: Altre misure del trend centrale
• Mediana di una variabile aleatoria Y
• Il valore m per cui:
• Moda di una variabile aleatoria Y
• Il valore c per cui la funzione densità di probabilità assume valore massimo:
• Se la distribuzione è simmetrica, media e mediana coincidono.
2
1mFY
max:Yfc
y0 2 4 6 8
f Y(y
)
0.0
0.1
0.2
0.3
0.4
0.5
Area = 0.5
Area = 0.5
y0 2 4 6 8
f Y(y
)
0.0
0.1
0.2
0.3
0.4
0.5
fY(y) max
Mediana
Moda
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 22
Teoria della probabilità – Statistica
classica
y0 2 4 6 8
f Y(y
)
0.0
0.1
0.2
0.3
0.4
0.5 Moda
Mediana
Media
Variabili aleatorie: Altre misure del trend centrale
• Nel caso generale di distribuzioni non simmetriche media, mediana e moda non coincidono
Teoria della probabilità – Statistica
classica
Variabili aleatorie: Indici di posizione e dispersione
• Varianza: è una misura della dispersione della distribuzione intorno al suo valore atteso. Per definizione:
se esiste.
• La varianza è sempre non negativa
• Altra grandezza usata per valutare la dispersione della distribuzione è la deviazione standard (ha la stessa unità di misura della media)
-
-
-
continua
discreta
22
22
Ydyyfy
Yyfy
YYY
jjYYjY
s
s
2
YYss
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 23
Teoria della probabilità – Statistica
classica
x-4 -2 0 2 4
f(x)
0.0
0.1
0.2
0.3
0.4
-3.2 1.5 x-4 -2 0 2 4
f(x)
0.0
0.4
0.8
1.2
-1.1 0.4
Distribuzione di probabilitàDefinizione media e varianza
• Qualitativamente: al diminuire della varianza, la pdf si restringe intorno al suo valore medio
• Diminuisce l’incertezza nel processo aleatorio
(1) (2)
2 21 2s s
L’intervallo di valori in cui gli esiti del processo aleatorio ricadono più frequentemente è molto più ampio nel primo caso che nel secondo
Area=
0.95
Teoria della probabilità – Statistica
classica
Distribuzione di probabilità –Definizione momenti
• Possiamo generalizzare media e varianza con i momenti:
• La media è quindi il momento primo della distribuzione, mentre la varianza è il momento centrale di ordine 2.
• N.B. E’ possibile valutare i momenti di una distribuzione solo se essi sono definiti.
nn
n
n
m y f y dy
M y f y dy
-
-
-
momento n-esimo
momento centrale n-esimo
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 24
Teoria della probabilità – Statistica
classica
Variabili aleatorieFunzioni continue - Esempi
• Funzione di distribuzione uniforme
1,
0 ,Y
se y a bf y b a
se y a b
-
fY(y)
ya b
1/(b-a)
FY(y)
ya b
1
pdf cdf
Dipende da due parametri: a e b
Teoria della probabilità – Statistica
classica
Variabili aleatorieFunzioni continue - Esempi
• Distribuzione uniforme
• È possibile calcolare la media e varianza di tale funzione di distribuzione:
1
2
b
Y
a
a by f y dy y dy
b a
-
-
2222 1
2 12
b
Y
a
a ba by f y dy y dy
b as
-
- - -
-
Questo risultato poteva essere
intuitivo dato che la funzione è
simmetrica rispetto al suo punto medio
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 25
Teoria della probabilità – Statistica
classica
Variabili aleatorieFunzioni continue - Esempi
• Distribuzione di tipo Esponenziale
exp0
1 exp
f y yy
F y y
l l
l
-
- -
La funzione ha un solo parametro: l
l
1
2
2 1
ls
y y
pdf cdf1
l
fY(y)FY(y)
Teoria della probabilità – Statistica
classica
Variabili aleatorieFunzioni continue - Esempi
• Distribuzione di tipo Weibull
0
exp1
exp1
l--
l-l -
y
k
yyF
k
yyyf
k
kk
-
ls
l
22
2
1
12
11
k
k
k
kk
k
k
k
Y
k
Y
N.B. per k = 1 la Weibull
degenera nella distribuzione di
tipo esponenziale
In letteratura la sua espressione non è univoca e si trovano altre
formulazioni equivalenti
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 26
Teoria della probabilità – Statistica
classica
Variabili aleatorieFunzioni continue - Esempi
• Distribuzione di tipo Weibull
0 0.5 1 1.5 2 2.5 3 3.5 40
0.5
1
1.5
2
2.5
y
y(y
)
k<1
k=1k>1
Teoria della probabilità – Statistica
classica
Variabili aleatorie:Teorema limite centrale
“Sia {Xi} una successione di variabili aleatorie indipendenti di media e varianza s2, indipendenti ed
identicamente distribuite, allora la somma
converge asintoticamente verso una variabile aleatoria normale (o altrimenti detta Gaussiana)”
n
iin
XS1
se le sorgenti di errore in una osservazione sono infinite ed indipendenti, la variabile aleatoria può essere assunta di
tipo Normale
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 27
Teoria della probabilità – Statistica
classicaCarl Friedrich Gauss
Gaussiana
Teoria della probabilità – Statistica
classicaFunzione di distribuzione Gaussiana
• Una variabile aleatoria (continua) si dice normale o Gaussiana se la sua densità di probabilità è:
• La funzione è definita lungo tutto l’asse reale (ovvero un qualunque numero reale può essere un esito di una VA di tipo normale)
• Il grafico di tale funzione è una curva a campana simmetrica rispetto a y=Y
• La distribuzione dipende da due parametri, e s2.
• La maggior parte delle variabili aleatorie con cui si avrà a che fare sono Gaussiane (o comunque derivate dalla Gaussiana).
2
2
1 1exp
22
YY
YY
yf
s s
- -
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 28
Teoria della probabilità – Statistica
classicaFunzione di distribuzione Gaussiana
• La gaussiana è simmetrica rispetto al valore Y pertanto la media coincide con il valore Y
• Si può verificare matematicamente che il parametro s2 definito nell’espressione coincide con la varianza della funzione di distribuzione.
Teoria della probabilità – Statistica
classicaFunzione di distribuzione Gaussiana
In figura sono riportate tre gaussiane con egual media e varianza 0.25, 0.5, 1
• La distribuzione di probabilità non è disponibile analiticamente ma esiste sotto forma tabulare.
-2 -1 1 2 3 4
0.25
0.5
0.75
1
1.25
1.5 Varianza s2 = 0.25
Varianza s2 = 1
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 29
Teoria della probabilità – Statistica
classica
-s s s s-s-s
Funzione di distribuzione Gaussiana
68.26%
95.46%
99.73%
Aree sottese dalla distribuzione normale
N.B.
Questo è vero per ogni valore
di e s nel caso della Gaussiana!
Teoria della probabilità – Statistica
classica
Distribuzione normale (o di tipo Gaussiano)
• Al diminuire di s, i risultati dell’esperienza aleatoria assumono valori in intervalli sempre più piccoli
• L’incertezza diventa sempre più piccola
• Non esistono delle tabelle per calcolare le probabilità per i generici valori di e s.
• Vedremo nel seguito come è possibile ricondurre il calcolo della probabilità sempre alla VA di tipo standard
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 30
Teoria della probabilità – Statistica
classica
Variabili aleatorie: Distribuzioni –Riepilogo concetti
• Rappresentazione casualità tramite:
– Introduzione concetto Variabile Aleatoria (VA)
– Caratterizzazione proprietà VA tramite funzioni a valori reali
• Definizione funzioni di distribuzione e densità di probabilità
– Proprietà
– Esempi
• VA di tipo Uniforme
• Esponenziale
• Weibull
• Gaussiana (o Normale)
– Teorema del limite centrale
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoria. Esempio con VA discreta
• Il seguente gioco assegna le seguenti vincite per un lancio di dadi:
– 0.10 euro se esce un numero dispari
– 0.20 euro se esce il 2
– 0.30 euro se esce il 4
– 0.40 euro se esce il 6
• Quale è la probabilità che il giocatore vinca 0.2 euro nella singola giocata?
• La possibilità che si vinca una certa cifra con questo gioco è una variabile aleatoria?
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 31
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoria.Caso discreto
• I possibili eventi elementari per la nuova VA vincita al gioco possono essere :
w1 = {0.1, 0.2, 0.3, 0.4}
• Se il dado è regolare, è possibile ricavare quale è la probabilità che si verifichi il singolo evento.
• È possibile quindi definire una funzione di una variabile aleatoria. In questo caso associo ad ogni evento dello spazio campione un altro elemento di uno spazio 1
0.1 1,3,5
0.2 2
0.3 4
0.4 6
0
euro y
euro y
g y euro y
euro y
altrove
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoria.Esempio caso discreto
Funzione densità di probabilità del lancio di dadi
Funzione densità probabilità vincita di euro
y1 2 3 4 5 6
f Y(y)
1/6
z0.1 0.2 0.3 0.4
f Z(z)
½
1/6
Z = g(Y)
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 32
Teoria della probabilità – Statistica
classicaFunzioni di una variabile aleatoria
Y(w)
Spazio campione
W
g(Y)
Codominio della VA Y
=Spazio campione della
VAY
Insieme dei valori che può assumere la Y
1
Codominio della funzione della VA
=Spazio campione della
VA Z=g(Y)
Insieme dei valori che può assumere la Z = g(Y)
Insieme dei risultati possibili
R 1 R
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoria.Valore atteso
• Funzione vincita al gioco dei dadi
• Quanto si deve pagare per il singolo lancio affinché il gioco sia equo?
• Dovrei pagare per il singolo lancio una quota che sia la media delle possibili vittorie (ovvero l’esito della nuova variabile aleatoria) per la singola esperienza.
• Nel caso in esame:
• Il valore ottenuto si definisce il valore atteso della funzione g(y) e si indica con il simbolo E(g(y))
1 1 1 1 10.10 0.20 0.30 0.40
2 6 6 6 5
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 33
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoria.Valore atteso
• Definizione:
• Sia Y una variabile aleatoria e g( · ) una funzione misurabile, si definisce quindi media (o valore atteso) di g(Y) lo scalare:
• N.B. La g(y) deve essere definita per ogni Y per cui la funzione pdf fY(y) non è nulla.
-
continuoCasodyyfygYgE
discretoCasoyfygYgEj
jj
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoria –Valore atteso
• Esempio – Si consideri la seguente trasformazione
• È immediato verificare che il valore atteso di tale funzione coincide con la varianza della VA Y:
66
2
YYYg -
22
YYYYdyyfydyyfygYgE s-
-
-
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 34
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoriaProprietà del valore atteso
• Altre proprietà del valore atteso:
1 1 2 2 1 1 2 2
E c c
E c g Y c E g Y
E c g Y c g Y c E g Y c E g Y
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoria. Determinazione della media
• Data una variabile aleatoria Y ed una trasformazione g(y) formiamo la nuova Variabile Aleatoria Z=g(Y).
• La media di Z è
• Se è nota la distribuzione di Y non è necessario conoscere la fZper determinare la media di Z.
• Teorema della media:
• Siano Y e Z due variabili aleatorie tali che Z = g(Y), è valida la seguente proprietà (N.B. se esistono gli integrali presi in considerazione)
Z ZE Z z f z dz
-
( )ZZ YZ YE g Y g yE Z z f z d fz y dy
- -
Valutato in Z Valutato in Y
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 35
Teoria della probabilità – Statistica
classica
Trasformazioni affini di una Variabile Aleatoria
• Definizione trasformazione affine:
• In genere ci si riferisce a tale trasformazione come lineare
(ma rigorosamente non lo è dato che non rispetta il principio di sovrapposizione degli effetti)
Z = g(Y)=aY+b a,b
Teoria della probabilità – Statistica
classica
Trasformazioni affini–Determinazione media
• Problema: Non si conosce di che tipo di variabile aleatoria sia Y ma ne conosciamo media e varianza, è possibile determinare la media e la varianza di Z?
• Se g(Y) è una trasformazione affine:
Z = g(Y)=aY+b
ba
bYEabaYE
ZE
Y
YY
ZZ
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 36
Teoria della probabilità – Statistica
classica
Trasformazioni affini variabile aleatoria – Calcolo della varianza
• Anche per la varianza è possibile determinare una espressione analitica
222222
22222
22 YYYYY
YYZZZ
aabYbaEaYEa
babYaEZE
s--
--s
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoriaCalcolo della varianza
• Anche detta legge di propagazione degli errori.
• Sia data una legge Z = g(Y), si intende calcolare la varianza della nuova VA
22
2 2 2
2 2
Z
Z Z
Z E Z
E g Y E g Y
E g Y E g Y
s
-
- -
-
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 37
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoria. Determinazione di media e varianza
• Invece se la trasformazione è non lineare si possono solo stimare in modo approssimato la media e la varianza di Z
• Si linearizza g intorno a Y:
• Troncando al primo ordine:
2
2
2
1
2Y Y
Y Y Y
dg d gg y g y y
dy dy
- -
Y
Z Y Y Y Y Y
dgE Z g y f y dy g y f y dy g
dy
- -
-
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoria. Determinazione di media e varianza
• Troncando al secondo ordine:
• Per la varianza
2
2
2
1
2Y
Z Y Y
d gg
dy
s
2
2 2
Y
Z Y
dg
dy
s s
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 38
Teoria della probabilità – Statistica
classica
Funzioni di variabile aleatoria.Caratterizzazione completa VA.
• Ci si può domandare come sia distribuita Z. Procediamo per gradi e supponiamo per semplicità che la funzione g sia monotona in modo da avere una corrispondenza biunivoca tra Y e Z.
z=g(y)
y
z
Dominio yy(y)
Dom
inio
zy
(z)
P{y≤Y ≤y+dy}=P{z≤Z≤z+dz}= y(y)dy=y(z)dz
dy
dz
P{y≤Y ≤y+dy}=y(y)dy
P{z≤Z≤z+dz}=y(z)dz
Teoria della probabilità – Statistica
classica
Funzioni di variabile aleatoria.Caratterizzazione completa VA.
• z e dz non sono qualunque ma corrispondono a y e dy
• Obiettivo: conoscere fZ(z)
dzzfdzzZzP
dyyfdfdyyYyP
Z
Y
dyy
y
Y
1
z g y
y g z-
zgy
YYZYZ
dy
dz
zgf
dy
dz
yfzfdyyfdzzf
1
1
-
-
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 39
Teoria della probabilità – Statistica
classica
Funzioni di variabile aleatoria.Caratterizzazione completa VA.
• Esempio: Trasformazione affine
Z=aY+b
• Da cui:
g’(y)=a
• L’equazione z=ay+b ha una unica soluzione:
• Quindi:
• Se la funzione di trasformazione è affine non cambia il tipo di variabile aleatoria. Questo è vero qualunque sia Y.
a
bzy
-
-
a
bzf
azf YZ
1
Teoria della probabilità – Statistica
classica
• Da cui, esplicitando la dipendenza inversa di y da z
--
---
-
-
-
2
2
222
22
2
2
2
2
1exp
2
1
2
1exp
2
1
2
1exp
2
11
Z
z
Z
YZ
YZ
Y
Y
y
Y
Y
Y
Z
z
a
ba
a
abz
a
a
bz
azf
s
s
ss
s
s
s
sLa nuova VA è
ancora una
Gaussiana di media
Z=a+bY
e varianza
sZ2=a2sY
2
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 40
Teoria della probabilità – Statistica
classica
Funzioni di VA GaussianeTrasformazioni lineari
• Data una variabile aleatoria Y (di tipo gaussiano) di media Y e
varianza sY2
• Si consideri la seguente trasformazione lineare:
• Di che tipo è la nuova variabile aleatoria?
• Quale è la media e la varianza della nuova variabile?
• È facile verificare che:
Y
YYZ
s
-
Gaussiana di tipo standard1
02
Z
Z
s
Teoria della probabilità – Statistica
classica
Funzioni di VA GaussianeTrasformazioni lineari
• Nota la funzione di distribuzione standard è possibile ricavare le proprietà di una qualsiasi distribuzione gaussiana
• In particolare, è possibile calcolare la probabilità che si verifichi un dato evento per un generico processo, con media e varianza note.
• Questo è possibile sapendo solo i valori della distribuzione di tipo standard.
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 41
Teoria della probabilità – Statistica
classica
Calcolo probabilità per una Gaussiana generica
-5 0 5 10 15
= 10; s2 = 0.5
(y – )z =
s
-2.83
8
-1.58 1.58-5 0 5 10 15
Normale standard
100-5 5 15
= 5; s2 = 10
0
10
Teoria della probabilità – Statistica
classica
Calcolo probabilità per una Gaussiana generica
• Esempio: calcolare quale è la probabilità che si verifichi un evento appartenente all’intervallo [0,5] per la variabile aleatoria di media 3 e deviazione standard 2:
• Si deve calcolare quale è la probabilità che la variabile aleatoria di tipo standard assuma un valore nell’intervallo corrispondente.
82
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 42
Teoria della probabilità – Statistica
classica
Calcolo probabilità per una Gaussiana generica
• Dobbiamo calcolare la probabilità:
• Gli estremi dell’intervallo corrispondente per la distribuzione di tipo standard possono essere facilmente calcolati
0 5P X
11
0 3
2X
X
xz
s
- -
22
5 31
2X
X
xz
s
- -
0 5
1.5 1
0.8413 0.0668 77.4%
P X
P Z
-
-
Teoria della probabilità – Statistica
classica
Calcolo probabilità per una Gaussiana generica
• Esercizi
• Sia Y una variabile aleatoria di tipo normale, di media = 16 e varianza s2 = 25
• Calcolare:
– P(Y > 20)
– P(20 < Y < 25)
– P(Y < 10)
– P(12 < Y < 24)
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 43
Teoria della probabilità – Statistica
classica
Funzioni di VA Gaussiane –Esempio trasformazioni non lineari
• Esempio: Trasformazione non lineari
• Data una variabile aleatoria Y di tipo normale, descritta dalla seguente distribuzione
• si consideri la seguente trasformazione non lineare
• Si intende calcolare la distribuzione della variabile aleatoria Z.
• Innanzitutto quali valori può assumere la VA Z?
YeZ
2
2
1 1exp
22
YY
YY
yf
s s
- -
Teoria della probabilità – Statistica
classica
Funzioni di VA Gaussiane –Esempio trasformazioni non lineari
• Una variabile aleatoria di tipo gaussiano può assumere un qualunque valore reale.
– Il suo esponenziale ovviamente no
– Questa indicazione è già sufficiente per stabilire che l’esponenziale di una variabile aleatoria di tipo Gaussiano non è più dello stesso tipo.
• Questa proprietà è vera per qualunque tipo di variabile aleatoria: una trasformazione non lineare implica una trasformazione del tipo di variabile aleatoria.
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 44
Teoria della probabilità – Statistica
classica
Funzioni di VA Gaussiane –Esempio trasformazioni non lineari
• Come visto precedentemente
• Si può facilmente vedere che
• Da cui
• Ed è uguale a zero per z < 0.
• Tale distribuzione prende il nome di distribuzione Lognormale
z
Y
z
YZ
yg
zgf
dy
dz
yfzf
'
1-
zzg log1 -
zeygzy
y
z
log'
0
log
2
1exp
2
12
2
-- z
z
zzf
Y
Y
Y
Zs
s
Teoria della probabilità – Statistica
classica
Funzioni di VA Gaussiane: Distribuzione Lognormale
• Grafico e proprietà della distribuzione Lognormale
• È un tipico esempio di distribuzione asimmetrica
z
0 2 4 6 8 10
f(z)
0.0
0.1
0.2
0.3
2exp
2Y
YZZEs
222 2exp1exp YYYZ sss -
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 45
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoriaTrasformazioni non biunivoche
• Nel caso di trasformazione non biunivoca le cose si complicano dal punto di vista operativo, ma concettualmente il problema non è molto diverso
z+dz
g’(y3)
z
y3 y3+dy3y2 y2+dy2
g’(y2)
y1 y1+dy1
g’(y1)
Z=g(Y)
Teoria della probabilità – Statistica
classica
Funzioni di una variabile aleatoriaTrasformazioni non biunivoche
• Dalla corrispondenza degli eventi riguardanti la VA Z e la VA Y è facile dimostrare che
• Per i valori di z per i quali l’equazione Z = g(Y) ha le soluzioni y1,y2,…,yn e
• Per i valori di z per cui l’equazione z=g(y) non ammette soluzioni
1 2
1 2
...' ' '
Y Y Y n
Z
n
f y f y f yf z
g y g y g y
0Zf z
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 46
Teoria della probabilità – Statistica
classicaVariabili Aleatorie Vettoriali
• Spesso negli esperimenti si osservano molte quantità contemporaneamente.
• E’ evidente che è possibile generalizzare il concetto di variabile aleatoria introducendo la VA vettoriale:
• Una VA vettoriale ad N componenti è rappresentabile in uno spazio ad N dimensioni.
• Se N=2 gli eventi sono sottoinsiemi del piano.
1 2 , ...,,T
NYY YY
Teoria della probabilità – Statistica
classicaVariabili Aleatorie Vettoriali
• Se in un esperimento stocastico osserviamo 2 quantità dobbiamo associare all’esperimento due variabili aleatorie: Y1 ed Y2.
• Ogni esecuzione dell’esperimento fornisce una coppia di numeri (y1 ed y2)
• Se si conosce la probabilità:
a1 b1
b2
a2
Y1
Y2
1 1 1 2 2 2,P a Y b a Y b
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 47
Teoria della probabilità – Statistica
classica
VA vettoriali – Funzione densità di probabilità congiunta
• La distribuzione di probabilità della VA vettoriale Y è:
• La funzione densità di probabilità congiunta fY(y1,y2) è tale che:
1 2 1 1 2 2, ,F y y P Y y Y y
1 1 1 2 2 2 1 2 1 2 1 2 1 2, , , , ,P a Y b a Y b F b b F a b F b a F a a - -
1 2
1 2, ,y y
F y y f w v dwdv- -
2 1
2 1
1 1 1 2 2 2, ,b b
a a
P a Y b a Y b f w v dwdv
, 1f w v dwdv
- -
Teoria della probabilità – Statistica
classica
V.A. VETTORIALI –Distribuzioni Marginali
• Ad ogni distribuzione bidimensionale possiamo associare 2 distribuzioni monodimensionali che sono dette distribuzioni marginali:
• Analogamente, si può osservare:
• Le distribuzioni marginali fY1 e fY2 rappresentano le probabilità che si verifichino, rispettivamente, gli eventi Y1 e Y2, indipendentemente dall’esito dell’altra componente
1
1 1 1 1 2, ,y
YF y P Y y Y f w v dwdv
- -
-
1
2
1 ,
2 ,
Y
Y
f y f w v dv
f y f w v dw
-
-
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 48
Teoria della probabilità – Statistica
classica
VA vettoriali – Funzione densità di probabilità congiunta
• Esempi di pdf bidimensionali
Rappresentazione tridimensionale Curve di isolivello
fY(y1,y2)
Teoria della probabilità – Statistica
classica
V.A. VETTORIALI –Distribuzioni Marginali
• La F della VA vettoriale si dice congiunta. Nel caso generico N-dimensionale si ha una F congiunta ed N marginali.
• Importante:
• Dalla funzione densità di probabilità (distribuzione) congiunta è sempre possibile risalire alle funzioni densità di probabilità (distribuzioni) marginali, mentre non è in genere vero il contrario
96
Distribuzione congiunta
Distribuzioni marginali
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 49
Teoria della probabilità – Statistica
classica
V.A. VETTORIALI –Distribuzioni Marginali
• Distribuzioni marginali -Esempio
fY2(y2)
fY1(y1)
Teoria della probabilità – Statistica
classicaV.A. INDIPENDENTI: Definizione
• Due VA Y1 ed Y2 di congiunta FY(y1, y2) si dicono indipendenti se:
• In tal caso, per ogni coppia di eventi {a1<Y1b1} e {a2<Y2b2} vale:
cioè se e solo se i due eventi sono indipendenti. Ovviamente il discorso è generalizzabile ad N dimensioni.
1 1 1 2 2 2 1 1 1 2 2 2,P a Y b a Y b P a Y b P a Y b
�� ��, �� = ����� � ���
��
�� ��, �� = ����� � ���
��
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 50
Teoria della probabilità – Statistica
classica
VA Vettoriali –Definizione VA indipendenti
• Esempio 2D
• Due VA Y1 ed Y2 di congiunta F(y1, y2) si dicono indipendenti se:
• In tal caso:
1 2
1 2
1 2 1 2
1 2 1 2
,
,
y y
y y
F y y F y F y
f y y f y f y
Distribuzione congiunta
Distribuzioni marginali
Teoria della probabilità – Statistica
classica
VA Vettoriali – Funzione densità di probabilità condizionata
• Concetto di funzione densità di probabilità condizionata.
• Per semplicità si assuma Y 2 un vettore di variabili aleatorie tale che:
– Probabilità di Y1 condizionata dalla componente Y2:
– Probabilità di Y2 condizionata dalla componente Y1:
RYRYY
Y
21
2
1 ,Y
2
21
21
,21 yf
yyfyyf
yy
Y2
Y
11
21
12
,12 yf
yyfyyf
y
yy
Y
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 51
Teoria della probabilità – Statistica
classica
VA Vettoriali – Funzione densità di probabilità condizionata
• Caso particolare: VA vettoriali bidimensionali
RYYY
Y
21
2
1 ,Y
0,;,
12122
2
21
2121
2
-
dyyyfyfyf
yyfyyf y
y
YY Y
Y
0,;,
22111
1
21
1212
1
-
dyyyfyfyf
yyfyyf y
y
YY Y
Y
Teoria della probabilità – Statistica
classica
VA Vettoriali – Funzione densità di probabilità condizionata
• Esempi di probabilità condizionate:
y2=a
y1=b
ayf
ayyfayyf
Y
aYY
2
2121
2
21
,Y
byf
ybyfbyyf
Y
bYY
1
21
12
1
12
,Y
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 52
Teoria della probabilità – Statistica
classica
VA Vettoriali – Funzione densità di probabilità condizionata
• Da notare che nel caso di variabili aleatorie Y1 e Y2 indipendenti:
• si ha:
• Quando due VA sono indipendenti qualunque evento dell’una non è condizionato dagli eventi dell’altra.
2121 21, yfyfyyf YYY
21212
12121
2
1
yfyyf
yfyyf
YYY
YYY
Teoria della probabilità – Statistica
classicaVariabili Aleatorie Vettoriali
• Caso Gaussiano:
• Se le due VA sono indipendenti allora la congiunta:
• NB: la congiunta contiene 4 parametri
s
--
s
s
--
s
ss
22
2
22
2
21
2
11
1
2222
2111
2
1exp
2
1
2
1exp
2
1
,~,~
2
1
yf
yf
NYNY
Y
Y
--
--
22
2
2221
2
11
21 2
1
2
1exp
2
1
s
s
ss
yyfY
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 53
Teoria della probabilità – Statistica
classica
Variabili aleatorie vettoriali Caso coppia di VA Gaussiane
• Una coppia di variabili aleatorie Y = (Y1, Y2) si dicono congiuntamente gaussiane (o normali) e si denotano con il simbolo
• se la loro pdf congiunta assume la seguente espressione:
• I parametri di tale pdf sono:
– Il vettore è il vettore delle medie
– La matrice , simmetrica, definita positiva, è la matrice di covarianza
1
exp22 det
f
- - - -
T1
Y
y μ V y μy
V
μV
21 12
212 2
s s
s sV
VμY ,~ N
Teoria della probabilità – Statistica
classica
Variabili aleatorie vettoriali Caso Gaussiano
• Gli elementi della matrice di covarianza sono:
• Non è vero generalmente il contrario (ma per Gaussiane si)
• Per convincersi che la matrice di covarianza V caratterizza la dispersione dei dati si può vedere che, per una coppia di VA congiuntamente gaussiane le linee di isolivello della pdf hanno equazione:
21221112
2
2
2222
1
2
1121
Y e YVA delle covarianza
YVA della varianza
YVA della varianza
s
s
s
--
-
-
YYE
YE
YE
VA Y1 e Y2 indipendenti La covarianza è nulla
(y-)TV-1(y-) = cost
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 54
Teoria della probabilità – Statistica
classica
Variabili aleatorie vettorialiCoefficiente di correlazione
• Dalla matrice di covarianza è possibile determinare la correlazione tra due variabili aleatorie.
• Siano date due variabili aleatorie Y1 e Y2. Il coefficiente di correlazione è definito come:
• Per come è definito:
21
12
21
2112
,cov
ss
sr
YVYV
YY
11 12 - r
Teoria della probabilità – Statistica
classica
Variabili aleatorie vettoriali Caso Gaussiano VA Indipendenti
-2
0
2
-2
0
2
00.0250.05
0.0750.1
-2
0
2
-3 -2 -1 0 1 2 3
-3
-2
-1
0
1
2
3
1 0 0
0 2 0 V μ
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 55
Teoria della probabilità – Statistica
classica
Variabili Aleatorie Vettoriali di tipo Normale – VA indipendenti
• Nel caso di variabili aleatorie di tipo Gaussiano indipendenti:
• La congiunta assume la seguente forma:
• NB: la congiunta contiene 4 parametri
--
--
22
2
22
2
21
2
11
1
2222
2111
2
1exp
2
1
2
1exp
2
1
,~,~
2
1
s
s
s
s
ss
yf
yf
NYNY
Y
Y
--
--
22
2
222
1
2
11
21
212
1
2
1exp
2
1
s
s
ss
yyfff YYY
Teoria della probabilità – Statistica
classica
y1-3 -2 -1 0 1 2 3
Variabili aleatorie vettoriali Caso Gaussiano VA Indipendenti
• Rappresentazione distribuzioni marginali e probabilità condizionate
-3 -2 -1 0 1 2 3
-3
-2
-1
0
1
2
3
fY2
fY1
y1-3 -2 -1 0 1 2 3
y 1-3 -2 -1 0 1 2 3
21 2 1 1| 1.5 0, 1Yf y y s
21 2 1 1| 1.5 0, 1Yf y y s -
La probabilità dell’evento y1
non cambia con il valore di y2
=0s2=2
=0s2=1
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 56
Teoria della probabilità – Statistica
classica
Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti
1 0
2 0
V μ
-2 -1 0 1 2
-2
-1
0
1
2
-2
0
2
-2
0
2
0
0.1
0.2
-2
0
2
Teoria della probabilità – Statistica
classica
-3 -2 -1 0 1 2 3
Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti
• Rappresentazione distribuzioni marginali e probabilità condizionate
y1-3 -2 -1 0 1 2 3
fY1 =0s2=1
fY2
=0s2=2
21 2 1 1| 1.5 1.2, 0.36Yf y y s
-3 -2 -1 0 1 2 3
21 2 1 1| 1.5 1.2, 0.36Yf y y s - -
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 57
Teoria della probabilità – Statistica
classica
Variabili Aleatorie Vettoriali di tipo Normale – VA non indipendenti
• Nel caso di correlazione |r| = 1 la distribuzione degenera in una retta.
-2
0
2
-2
0
2
0
0.2
0.4
-2
0
2
-3 -2 -1 0 1 2 3
-3
-2
-1
0
1
2
3
Domanda: in questo caso come si comportano le marginali e le probabilità condizionate?
Teoria della probabilità – Statistica
classica
Variabili Aleatorie di tipo Normale Vettoriali – Caso Generico
• Nel caso generico di n componenti la variabile aleatoria vettoriale assume la forma:
• I parametri di tale pdf sono raccolti nel vettore e nella matrice V:
• = (1, , ... , n);
• V, matrice (n × n) definita positiva, è la matrice di covarianza.
• Ancora, se le VA componenti sono indipendenti, la matrice V è diagonale perché tutte le covarianze sono nulle.
--- - μyVμy
Vy 1T
Y2
1exp
det2
12/n
f
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 58
Teoria della probabilità – Statistica
classica
Trasformazioni di Variabili aleatorie Vettoriali
• I concetti esposti per le trasformazioni di variabili scalari possono essere estesi al caso vettoriale.
• Si consideri la generica trasformazione non lineare:
• Vogliamo determinare la densità di probabilità congiunta di Z.
1 1 21
2 1 22
,
,
o, equivalentemente
g Y YY
g Y YY
Y Z
Z g Y
Teoria della probabilità – Statistica
classica
Trasformazioni di Variabili aleatorie Vettoriali
• Il ruolo della derivata nella trasformazione è assunto dallo Jacobiano, ma i passaggi sono concettualmente analoghi al caso scalare:
1 1 1 2
2 2 1 2
1 2
1 1
1 21 2
1 2 21 2
1 2
,
,
,
,
,
YZ
i i
Nradi i
i i i
z g y y
z g y y
y y Radici del sistema
z z
y yf y yf J
z zJ y y
y y
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 59
Teoria della probabilità – Statistica
classica
Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare
• Se si usa una trasformazione lineare:
• La conoscenza della sola media Y e della matrice di covarianza VY
della VA Y permette la determinazione della media Z e della matrice di covarianza della VA VZ
• Come nel caso scalare risulta inoltre che solo le trasformazioni lineari conservano il tipo di Variabile aleatoria
1 1 1n n n n n
TZ a Y b
TZ Z
TZ Y
μ a μ b
V a V a
Teoria della probabilità – Statistica
classica
Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare
• Nel caso lineare è possibile anche analizzare trasformazioni di VA vettoriali di dimensioni differenti, per esempio da una VA vettoriale Y di dimensioni (n × 1) ad una W di dimensioni (p × 1)
• Generalizzando le relazioni precedenti si ottiene:
111
pnnpp
dYcW T
TW Z
TW Z
μ c μ d
V c V c
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 60
Teoria della probabilità – Statistica
classica
Trasformazioni di Variabili aleatorie Vettoriali – Caso Lineare
• Un caso particolare di interesse è quando p = 1.
• In tal caso si ottiene, almeno per VA vettoriali indipendenti:
• Per esempio, nel caso W = Y1 + Y2+ … +Yn
222
222
21
21
2
2211
...
...
YnnYYW
YnnYYW
ccc
dcdcdc
ssss
222
21
2
21
...
...
YnYYW
YnYYW
ssss
Teoria della probabilità – Statistica
classica
Trasformazioni di Variabili aleatorie Vettoriali
• Particolare importanza hanno le trasformazioni di una VA vettoriale Y in una VA scalare (caso m=1)
• Sono, ad esempio, di uso molto comune alcune VA scalari che derivano (attraverso trasformazioni non lineari) da variabili aleatorie vettoriali gaussiane Y ad n componenti, con vettore delle
medie = 0 e matrice di covarianza V = I.
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 61
Teoria della probabilità – Statistica
classica
Variabili Aleatorie derivate dalla
gaussiana - Variabile
• Si consideri una VA vettoriale ad n componenti Y = (Y1, Y2, …, Yn)
• Le componenti sono quindi tutte indipendenti e gaussiane di media nulla e varianza unitaria. La variabile aleatoria scalare
• prende il nome di variabile aleatoria 2 ad n gradi di libertà.
• Tale variabile aleatoria è caratterizzata completamente da un solo parametro, il numeri di gradi di libertà n.
Y~N(0,I)
222
21 ... nYYYZ
Teoria della probabilità – Statistica
classicaVariabile aleatoria
• Funzione densità di probabilità
0 1 2 3 4 5 6 7 8 9 100
0.1
0.2
0.3
0.4
0.5
n = 1n = 2n = 4n = 6
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 62
Teoria della probabilità – Statistica
classicaVariabile aleatoria
• Proprietà di una variabile aleatoria 2 ad n gradi di libertà
• Il massimo si ha per y = n-2. Da osservare che per n → ∞ la distribuzione 2 tende ad una gaussiana.
--
00
0
2
22
2
2
2
2
y
yeyK
n
nE
yn
nn
n
s
2/2
1
2 n
Knn
Teoria della probabilità – Statistica
classica
VA derivate dalla gaussiana Distribuzione t-Student
• Sia Y una variabile aleatoria gaussiana di media 0 e varianza unitaria, e Z una 2 ad r gradi di libertà
• Inoltre Y e Z siano tra loro indipendenti. La variabile aleatoria data da:
è una distribuzione t di Student ad r gradi di libertà.
r
YT
r2
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 63
Teoria della probabilità – Statistica
classica
VA derivate dalla GaussianaDistribuzione t-Student
• In figura sono mostrate le funzioni densità per 1,3,6 gradi di libertà.
• La T è simmetrica rispetto a y=0
• Per r →+∞ la t di Student tende ad una gaussiana di tipo standard.
William SealyGosset
“creatore” della t di Student
y-4 -2 0 2 4
f Y(y
)
0.0
0.1
0.2
0.3
0.4n =2
n = 4Distribuzione Standard
n
Teoria della probabilità – Statistica
classica
VA derivate dalla GaussianaDistribuzione t-Student
• Espressione analitica della t di Student
• Essendo K una costante di normalizzazione.
• Proprietà:
• Dipende da un solo parametro il numero intero r
Ry
r
yKyf rr
,
1
1
2
12
2
2
1
K
0Y
22
2 -
sYMedia: Varianza:
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 64
Teoria della probabilità – Statistica
classica
VA derivate dalla GaussianaLa distribuzione F di Fisher
• Se le variabili aleatorie Y e W sono VA di tipo 2 rispettivamente ad m ed n gradi di libertà, la VA scalare Z
è una VA di tipo F di Fisher ad (m,n) gradi di libertà.
• La VA ha due parametri, m ed n.
nWm
YZ
Teoria della probabilità – Statistica
classica
VA derivate dalla GaussianaLa distribuzione F di Fisher
• Espressione analitica della F di Fisher
Nnm
altrove
y
yn
m
y
m
n
nm
nm
nmyf
nm
mn
Y
-
,
0
0
122
2
,;
2
2
22/
2,2
-
nn
nY
2
22
24
22
--
-
nnm
nnmY
sMedia: Varianza:
Analisi dei Processi Chimici e Biotecnologici - Statistica Teoria 65
Teoria della probabilità – Statistica
classica
VA derivate dalla GaussianaLa distribuzione F di Fisher
• Grafici della F di Fisher al variare dei gradi di libertà
y0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
f Y(y)
0.0
0.2
0.4
0.6
0.8
1.0
1.2(10, 4) g.d.l.
(10, 10) g.d.l
(10, 50) g.d.l.
(10, Infinity) g.d.l.
Sir Ronald AylmerFisher
1890 - 1962