IntroduzioneStatistica
-
Upload
alessio-mohamed -
Category
Documents
-
view
4 -
download
0
description
Transcript of IntroduzioneStatistica
-
Insegnamento integrato di:Misure e Strumentazione Industriale Laboratorio di EnergeticaIntroduzione alla Statistica Statistica nelle misureSezione di Misure e Tecniche Sperimentali
2
Introduzione alla statistica
Fenomeni aleatori2
I fenomeni aleatori (o casuali) sono fenomeni empirici il cui risultato non prevedibile a priori, caratterizzati cio dalla propriet che la loro osservazione in un insieme fissato di circostanze non conduce sempre agli stessi risultati.
Non si ha una regolarit deterministica, bens di tipo statistico, in quanto nell'osservazione del fenomeno in oggetto si pu notare che, nonostante l'irregolare comportamento dei singoli risultati, questi nel loro complesso manifestano determinati caratteri di regolarit.
-
3
Introduzione alla statistica
Probabilit discreta: dado a 6 facce3
4
Introduzione alla statistica
-2 -1 0 1 2 3 4 5 6 7 80
0.5
1
Evento: faccia dado
Prob
abilit
ev
ento
Funzione di densit discreta f(x)
-2 -1 0 1 2 3 4 5 6 7 8
0
0.5
1
Evento: faccia dado
Prob
abilit
cu
mul
ata
even
to
Funzione di probabilit cumulata discreta F(x)
Probabilit discreta: funzioni statistiche
1/6
2/61/6
3/64/6
5/61
punti massa
4
-
5
Introduzione alla statistica
Valore atteso
Valore atteso:
Il valore atteso indica il baricentro della distribuzione e pu non coincidere con uno dei suoi punti di massa.
Nel caso del dado a 6 facce:
5
6
Introduzione alla statistica
Varianza e deviazione standard
Varianza:
Indica il momento di inerzia della distribuzione, cio la sua dispersione attorno al valore medio.
Deviazione standard (scarto quadratico medio):
6
-
7
Introduzione alla statistica
Variabili aleatorie continue
Ipotizziamo di avere un serbatoio il cui livello pu variare con continuit fra 0 e 100 e che non presenti valori di livello pi probabili di altri.
Quanto vale la probabilit associata ad un preciso valore di livello:
h
-1 -0.5 00.5 1
-1-0.500.51
0
10
20
30
40
50
60
70
80
90
100
7
8
Introduzione alla statistica
Serbatoio: 100 osservazioni
Aggiungere una struttura con un clic
5 15 25 35 45 55 65 75 85 950
5
10
15
Livello serbatoio
Num
ero
occo
rrenz
e
Istogramma occorrenze - N = 100
5 15 25 35 45 55 65 75 85 950
0.005
0.01
0.015
0.02
Livello serbatoio
f(x)
Istogramma - N = 100
8
-
9
Introduzione alla statistica
Serbatoio: 1000 e 100mila osservazioni
5 15 25 35 45 55 65 75 85 950
50
100
Livello serbatoio
Num
ero
occo
rrenz
e
Istogramma occorrenze - N = 1000
5 15 25 35 45 55 65 75 85 950
0.005
0.01
0.015
Livello serbatoio
f(x)
Istogramma - N = 1000
5 15 25 35 45 55 65 75 85 950
5000
10000
Livello serbatoio
Num
ero
occo
rrenz
e
Istogramma occorrenze - N = 100000
5 15 25 35 45 55 65 75 85 950
0.005
0.01
0.015
Livello serbatoio
f(x)
Istogramma - N = 100000
L'aumento delle osservazioni porta ad una maggiore conoscenza del fenomeno aleatorio
9
10
Introduzione alla statistica
Serbatoio: 100mila osservazioni
Riducendo le ampiezze delle basi degli istogrammi (aumentando la risoluzione) il fenomeno non mantiene la propria regolarit
5 15 25 35 45 55 65 75 85 950
5000
10000
Livello serbatoio
Num
ero
occo
rrenz
e
Istogramma occorrenze - N = 100000
5 15 25 35 45 55 65 75 85 950
0.005
0.01
0.015
Livello serbatoio
f(x)
Istogramma - N = 100000
0 10 20 30 40 50 60 70 80 90 1000
0.002
0.004
0.006
0.008
0.01
0.012
Livello serbatoio
f(x)
Istogramma - N = 100000
10
-
11
Introduzione alla statistica
Serbatoio: 10 milioni di osservazioni
Riducendo le ampiezze delle basi degli istogrammi il fenomeno ora mantiene la propria regolarit
5 15 25 35 45 55 65 75 85 950
5
10x 10
5
Livello serbatoio
Num
ero
occo
rrenz
e
Istogramma occorrenze - N = 10000000
5 15 25 35 45 55 65 75 85 950
0.005
0.01
0.015
Livello serbatoio
f(x)
Istogramma - N = 10000000
0 10 20 30 40 50 60 70 80 90 1000
0.002
0.004
0.006
0.008
0.01
0.012
Livello serbatoio
f(x)
Istogramma - N = 10000000
11
12
Introduzione alla statistica
Si intuisce che se avessimo una conoscenza completa del fenomeno aleatorio N , potremmo fare tendere a 0 la base degli istogrammi. Si continuerebbe ad avere un numero finito di osservazioni in ogni intervallo.
Questo passaggio al limite ci consente di ottenere una funzione continua: la funzione densit di probabilit (per v.a. continue).
Funzione densit di probabilit per v.a. continue12
-
13
Introduzione alla statistica
Distribuzione continua uniforme o rettangolare13
14
Introduzione alla statistica
Indici statistici14
-
15
Introduzione alla statistica
f(x) discrete Vs f(x) continue
La differenza fra le funzioni densit discrete e continue non solo formale (sostituzione delle sommatorie con gli integrali):
f(x) per v.a. discrete esprimono una probabilit
f(x) per v.a. continue esprimono una densit di probabilit: la probabilit associata ad intervalli e si determina quindi mediante un'operazione di integrazione
15
16
Introduzione alla statistica
v.a. continue: calcolo probabilit16
-
17
Introduzione alla statistica
Famiglie di distribuzioni
Tutte le funzioni che soddisfano le propriet analizzate precedentemente sono possibili funzioni densit di probabilit
Solo alcune di esse sono per adeguate per modellare particolari fenomeni fisici
In questo corso sono di interesse: Uniforme (gi analizzata) Normale o Gaussiana T-Student
17
18
Introduzione alla statistica
Distribuzione Normale o Gaussiana
2
2
2
21),,(
x
exf
x
La normale o gaussiana la distribuzione che descrive la maggior parte dei fenomeni fisici in campo ingegneristico.
-4 -3 -2 -1 0 1 2 3 40
0.1
0.2
0.3
0.4
X
f(x)
PDF gaussiana standardizzata
-4 -3 -2 -1 0 1 2 3 40
0.5
1
X
F(x
)
CDF gaussiana standardizzata
18
-
19
Introduzione alla statistica
Distribuzione normale o gaussiana N(,2)
-5 0 50
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4Influenza della media
012
-5 0 50
0.1
0.2
0.3
0.4
0.5
0.6
0.7Influenza della deviazione standard
0.512
La distribuzione gaussiana completamente descritta da due parametri: media media e varianza 22.
19
20
Introduzione alla statistica
circa il 68% della distribuzione compreso nellintervallo centrato su e di estremi
circa il 95.5% della distribuzione compreso nellintervallo centrato su e di estremi 2
circa il 99.7% della distribuzione compreso nellintervallo centrato su e di estremi 3
20
Caratteristiche della Gaussiana
-
21
Introduzione alla statistica
Di particolare importanza la normale standard, ovvero la distribuzione normale che ha media 0 e varianza (e deviazione standard) pari a 1 (si indica con N(0,1)).
Propriet: se X N(,2)
se X una variabile distribuita secondo una normale di media e varianza 22, la variabile distribuita secondo una normale standard.
Z definita variabile standardizzata: consente un semplice uso delle tabelle e consente di effettuare delle valutazioni normalizzate (es: entro l'intervallo media 2 deviazioni standard compreso circa il 95% della distribuzione, per qualsiasi distribuzione gaussiana).
21
Distribuzione normale standard N(,1)
22
Introduzione alla statistica
Distribuzione t-Student
Aggiungere una struttura con un clic
22
-
23
Introduzione alla statistica
Tabelle statistiche
23
24
Introduzione alla statistica
Relazioni utili
Per le distribuzioni simmetriche (Gaussiana, t-Student, ) valgono le seguenti propriet:
Se la distribuzione a media nulla:
-
25
Introduzione alla statistica
25
26
Introduzione alla statistica
26
-
27
Introduzione alla statistica
Si calcolino gli estremi dell'intervallo simmetrico rispetto alla media che sottende il 90% di una N(30,4).
Esempio uso tabelle statistiche
22 24 26 28 30 32 34 36 380
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
0.2
X
f(x)
0.05 0.05
0.90
27
28
Introduzione alla statistica
22 24 26 28 30 32 34 36 380
0.05
0.1
0.15
0.2
X
f(x)
22 24 26 28 30 32 34 36 380
0.05
0.1
0.15
0.2
X
f(x) 0.05
0.05 0.050.90
0.95
28
-
29
Introduzione alla statistica
Applicazione della statistica alle misure
29
30
Introduzione alla statistica
Quando si effettua una misura si cerca di ottenere un valore misurato che sia il pi vicino possibile al valore vero (sconosciuto e non conoscibile) della grandezza di interesse.
-
31
Introduzione alla statistica
Se si fanno ripetere le misure di lunghezza del pesce a diversi pescatori si otterranno valori diversi. Le cause della diversit delle misure rilevata sono molte, e si possono schematizzare in due gruppi:
effetti sistematici (tirare la coda, misurare lungo la corda) effetti casuali
32
Introduzione alla statistica
effetti sistematici + casuali effetti casuali
Come trattare tutte queste misure diverse ???Soluzione: LA STATISTICA
Altro esempio: misure ripetute nel tempo
-
33
Introduzione alla statistica
Numero rilevazione
Lettura [kPa]
1 10.02
2 10.20
3 10.26
4 10.20
5 10.22
6 10.13
7 9.97
8 10.12
9 10.09
10 9.90
11 10.05
12 10.17
13 10.42
14 10.21
15 10.23
16 10.11
17 9.98
18 10.10
19 10.04
20 9.81
Si sono effettuate 20 misure di Si sono effettuate 20 misure di pressione in un recipiente:pressione in un recipiente:
Le misure Le misure nonnon sono tutte uguali! sono tutte uguali!
Quale la misura che possiamo dire Quale la misura che possiamo dire essere il valore di pressione esistente essere il valore di pressione esistente nel recipiente ?nel recipiente ?
Altro esempio: misure di pressione di un recipiente
34
Introduzione alla statistica 3434
Si pu procedere cos: si dispongano i dati rilevati in Si pu procedere cos: si dispongano i dati rilevati in ordine crescente e si suddividano in intervalli omogenei ordine crescente e si suddividano in intervalli omogenei (in questo caso si sceglie 0.05 kPa). (in questo caso si sceglie 0.05 kPa).
Si definisca: Si definisca: n = numero di letture in un intervallon = numero di letture in un intervallo N = numero totale di lettureN = numero totale di letture a = ampiezza di un intervalloa = ampiezza di un intervallo
e infine la e infine la funzione densit di probabilit discreta funzione densit di probabilit discreta (Z)(Z)::
aNnZ
-
35
Introduzione alla statistica
Se si traccia un Se si traccia un intervallo di altezza Z intervallo di altezza Z per ogni intervallo si per ogni intervallo si ottiene:ottiene:
ZZ
Numero di Numero di letture letture
nellintervallonellintervallo
nnaN
nZ 05.020
36
Introduzione alla statistica
Ipotizzando:Ipotizzando:
0aN
Densit di probabilit Densit di probabilit discretadiscreta
Densit di probabilit Densit di probabilit continuacontinua
-
37
Introduzione alla statistica
b
a
dxxfbXap
a
dxxfaXF
Probabilit Probabilit che a
-
39
Introduzione alla statistica
ex
xf 22
22
1
LA FUNZIONE DI DENSITA NORMALE o LA FUNZIONE DI DENSITA NORMALE o GAUSSIANAGAUSSIANA
x
x
dxxfxF
40
Introduzione alla statistica
LA GAUSSIANA E COMPLETAMENTE DESCRITTA DA LA GAUSSIANA E COMPLETAMENTE DESCRITTA DA DUE PARAMETRI:DUE PARAMETRI:
MEDIAMEDIA
DEVIAZIONE STANDARD DEVIAZIONE STANDARD
( o la varianza ( o la varianza 22 ) )
-
41
Introduzione alla statistica
MEDIAMEDIA
DEVIAZIONE STANDARDDEVIAZIONE STANDARD
INFLUENZA DI MEDIA E DEVIAZIONE STANDARDINFLUENZA DI MEDIA E DEVIAZIONE STANDARD
42
Introduzione alla statistica
NUMERO INFINITO DI CAMPIONI:NUMERO INFINITO DI CAMPIONI:
: MEDIA: MEDIA : DEVIAZIONE STANDARD: DEVIAZIONE STANDARD
MA NON SI POSSONO EFFETTUARE UN MA NON SI POSSONO EFFETTUARE UN NUMERO INFINITO DI RILEVAZIONI :NUMERO INFINITO DI RILEVAZIONI :
SI DEVE TROVARE UN SISTEMA PER SI DEVE TROVARE UN SISTEMA PER STIMARESTIMARE MEDIA E DEVIAZ. ST.MEDIA E DEVIAZ. ST.
-
43
Introduzione alla statistica
N
xx
N
ii
1
1
1
2
N
Xxs
N
ii
Con xi= singola lettura e N = numero rilevazioni
Media campionaria
SI UTILIZZANO I SEGUENTI SI UTILIZZANO I SEGUENTI STIMATORISTIMATORI
Deviazione standard
campionaria
44
Introduzione alla statistica
X
DISTRIBUZIONE DISTRIBUZIONE DELLE MEDIE DELLE MEDIE
CAMPIONARIECAMPIONARIEmm, , mm
DISTRIBUZIONE DISTRIBUZIONE CAMPIONARIACAMPIONARIA
, ,
AVENDO AVENDO DIVERSE SERIEDIVERSE SERIE DI MISURAZIONI DI MISURAZIONI POTREMO CALCOLARE PER OGNUNA DI POTREMO CALCOLARE PER OGNUNA DI QUESTE LA MEDIA, ESSE NON SARANNO QUESTE LA MEDIA, ESSE NON SARANNO
TUTTE UGUALI E SI DISTRIBUIRANNO SU TUTTE UGUALI E SI DISTRIBUIRANNO SU UNA UNA GAUSSIANAGAUSSIANA
mm==
Nm
-
45
Introduzione alla statistica
circa il 68% della distribuzione compreso nellintervallo centrato su e di estremi
circa il 95.5% della distribuzione compreso nellintervallo centrato su e di estremi 2
circa il 99.7% della distribuzione compreso nellintervallo centrato su e di estremi 3
45Caratteristiche della Gaussiana
46
Introduzione alla statistica
Circa il 68%degli intervalli cos costruiti contiene il valore vero (livello di confidenza 68%)
NsX 2
NsX
NsX 3
Si pu quindi stimare che:46
Circa il 95.5%degli intervalli cos costruiti contiene il valore vero (livello di confidenza 95.5%)
Circa il 99.7%degli intervalli cos costruiti contiene il valore vero (livello di confidenza 99.7%)