IntroduzioneStatistica

23
  Insegnamento integrato di: Misure e Strumentazione Industriale Laboratorio di Energetica Introduzi one alla Statis tica Sta ti stic a nelle misure Se zione di M isure e Tecniche Sperimentali  2 Introduzione alla statistica Fenomeni aleatori 2 I fenomeni aleatori (o casuali) sono fenomeni empirici il cui risultato non è prevedibile a priori, caratterizzati cioè dalla proprietà che la loro osservazione in un insieme fissato di circostanze non conduce sempre agli stessi risultati. Non si ha una regolarità deterministica, bensì di tipo statistico, in quanto nell'osservazione del fenomeno in oggetto si può notare che, nonostante l'irregolare comportamento dei singoli risultati, questi nel loro complesso manifestano determinati caratteri di regolarità.

description

IntroduzioneStatistica

Transcript of IntroduzioneStatistica

  • Insegnamento integrato di:Misure e Strumentazione Industriale Laboratorio di EnergeticaIntroduzione alla Statistica Statistica nelle misureSezione di Misure e Tecniche Sperimentali

    2

    Introduzione alla statistica

    Fenomeni aleatori2

    I fenomeni aleatori (o casuali) sono fenomeni empirici il cui risultato non prevedibile a priori, caratterizzati cio dalla propriet che la loro osservazione in un insieme fissato di circostanze non conduce sempre agli stessi risultati.

    Non si ha una regolarit deterministica, bens di tipo statistico, in quanto nell'osservazione del fenomeno in oggetto si pu notare che, nonostante l'irregolare comportamento dei singoli risultati, questi nel loro complesso manifestano determinati caratteri di regolarit.

  • 3

    Introduzione alla statistica

    Probabilit discreta: dado a 6 facce3

    4

    Introduzione alla statistica

    -2 -1 0 1 2 3 4 5 6 7 80

    0.5

    1

    Evento: faccia dado

    Prob

    abilit

    ev

    ento

    Funzione di densit discreta f(x)

    -2 -1 0 1 2 3 4 5 6 7 8

    0

    0.5

    1

    Evento: faccia dado

    Prob

    abilit

    cu

    mul

    ata

    even

    to

    Funzione di probabilit cumulata discreta F(x)

    Probabilit discreta: funzioni statistiche

    1/6

    2/61/6

    3/64/6

    5/61

    punti massa

    4

  • 5

    Introduzione alla statistica

    Valore atteso

    Valore atteso:

    Il valore atteso indica il baricentro della distribuzione e pu non coincidere con uno dei suoi punti di massa.

    Nel caso del dado a 6 facce:

    5

    6

    Introduzione alla statistica

    Varianza e deviazione standard

    Varianza:

    Indica il momento di inerzia della distribuzione, cio la sua dispersione attorno al valore medio.

    Deviazione standard (scarto quadratico medio):

    6

  • 7

    Introduzione alla statistica

    Variabili aleatorie continue

    Ipotizziamo di avere un serbatoio il cui livello pu variare con continuit fra 0 e 100 e che non presenti valori di livello pi probabili di altri.

    Quanto vale la probabilit associata ad un preciso valore di livello:

    h

    -1 -0.5 00.5 1

    -1-0.500.51

    0

    10

    20

    30

    40

    50

    60

    70

    80

    90

    100

    7

    8

    Introduzione alla statistica

    Serbatoio: 100 osservazioni

    Aggiungere una struttura con un clic

    5 15 25 35 45 55 65 75 85 950

    5

    10

    15

    Livello serbatoio

    Num

    ero

    occo

    rrenz

    e

    Istogramma occorrenze - N = 100

    5 15 25 35 45 55 65 75 85 950

    0.005

    0.01

    0.015

    0.02

    Livello serbatoio

    f(x)

    Istogramma - N = 100

    8

  • 9

    Introduzione alla statistica

    Serbatoio: 1000 e 100mila osservazioni

    5 15 25 35 45 55 65 75 85 950

    50

    100

    Livello serbatoio

    Num

    ero

    occo

    rrenz

    e

    Istogramma occorrenze - N = 1000

    5 15 25 35 45 55 65 75 85 950

    0.005

    0.01

    0.015

    Livello serbatoio

    f(x)

    Istogramma - N = 1000

    5 15 25 35 45 55 65 75 85 950

    5000

    10000

    Livello serbatoio

    Num

    ero

    occo

    rrenz

    e

    Istogramma occorrenze - N = 100000

    5 15 25 35 45 55 65 75 85 950

    0.005

    0.01

    0.015

    Livello serbatoio

    f(x)

    Istogramma - N = 100000

    L'aumento delle osservazioni porta ad una maggiore conoscenza del fenomeno aleatorio

    9

    10

    Introduzione alla statistica

    Serbatoio: 100mila osservazioni

    Riducendo le ampiezze delle basi degli istogrammi (aumentando la risoluzione) il fenomeno non mantiene la propria regolarit

    5 15 25 35 45 55 65 75 85 950

    5000

    10000

    Livello serbatoio

    Num

    ero

    occo

    rrenz

    e

    Istogramma occorrenze - N = 100000

    5 15 25 35 45 55 65 75 85 950

    0.005

    0.01

    0.015

    Livello serbatoio

    f(x)

    Istogramma - N = 100000

    0 10 20 30 40 50 60 70 80 90 1000

    0.002

    0.004

    0.006

    0.008

    0.01

    0.012

    Livello serbatoio

    f(x)

    Istogramma - N = 100000

    10

  • 11

    Introduzione alla statistica

    Serbatoio: 10 milioni di osservazioni

    Riducendo le ampiezze delle basi degli istogrammi il fenomeno ora mantiene la propria regolarit

    5 15 25 35 45 55 65 75 85 950

    5

    10x 10

    5

    Livello serbatoio

    Num

    ero

    occo

    rrenz

    e

    Istogramma occorrenze - N = 10000000

    5 15 25 35 45 55 65 75 85 950

    0.005

    0.01

    0.015

    Livello serbatoio

    f(x)

    Istogramma - N = 10000000

    0 10 20 30 40 50 60 70 80 90 1000

    0.002

    0.004

    0.006

    0.008

    0.01

    0.012

    Livello serbatoio

    f(x)

    Istogramma - N = 10000000

    11

    12

    Introduzione alla statistica

    Si intuisce che se avessimo una conoscenza completa del fenomeno aleatorio N , potremmo fare tendere a 0 la base degli istogrammi. Si continuerebbe ad avere un numero finito di osservazioni in ogni intervallo.

    Questo passaggio al limite ci consente di ottenere una funzione continua: la funzione densit di probabilit (per v.a. continue).

    Funzione densit di probabilit per v.a. continue12

  • 13

    Introduzione alla statistica

    Distribuzione continua uniforme o rettangolare13

    14

    Introduzione alla statistica

    Indici statistici14

  • 15

    Introduzione alla statistica

    f(x) discrete Vs f(x) continue

    La differenza fra le funzioni densit discrete e continue non solo formale (sostituzione delle sommatorie con gli integrali):

    f(x) per v.a. discrete esprimono una probabilit

    f(x) per v.a. continue esprimono una densit di probabilit: la probabilit associata ad intervalli e si determina quindi mediante un'operazione di integrazione

    15

    16

    Introduzione alla statistica

    v.a. continue: calcolo probabilit16

  • 17

    Introduzione alla statistica

    Famiglie di distribuzioni

    Tutte le funzioni che soddisfano le propriet analizzate precedentemente sono possibili funzioni densit di probabilit

    Solo alcune di esse sono per adeguate per modellare particolari fenomeni fisici

    In questo corso sono di interesse: Uniforme (gi analizzata) Normale o Gaussiana T-Student

    17

    18

    Introduzione alla statistica

    Distribuzione Normale o Gaussiana

    2

    2

    2

    21),,(

    x

    exf

    x

    La normale o gaussiana la distribuzione che descrive la maggior parte dei fenomeni fisici in campo ingegneristico.

    -4 -3 -2 -1 0 1 2 3 40

    0.1

    0.2

    0.3

    0.4

    X

    f(x)

    PDF gaussiana standardizzata

    -4 -3 -2 -1 0 1 2 3 40

    0.5

    1

    X

    F(x

    )

    CDF gaussiana standardizzata

    18

  • 19

    Introduzione alla statistica

    Distribuzione normale o gaussiana N(,2)

    -5 0 50

    0.05

    0.1

    0.15

    0.2

    0.25

    0.3

    0.35

    0.4Influenza della media

    012

    -5 0 50

    0.1

    0.2

    0.3

    0.4

    0.5

    0.6

    0.7Influenza della deviazione standard

    0.512

    La distribuzione gaussiana completamente descritta da due parametri: media media e varianza 22.

    19

    20

    Introduzione alla statistica

    circa il 68% della distribuzione compreso nellintervallo centrato su e di estremi

    circa il 95.5% della distribuzione compreso nellintervallo centrato su e di estremi 2

    circa il 99.7% della distribuzione compreso nellintervallo centrato su e di estremi 3

    20

    Caratteristiche della Gaussiana

  • 21

    Introduzione alla statistica

    Di particolare importanza la normale standard, ovvero la distribuzione normale che ha media 0 e varianza (e deviazione standard) pari a 1 (si indica con N(0,1)).

    Propriet: se X N(,2)

    se X una variabile distribuita secondo una normale di media e varianza 22, la variabile distribuita secondo una normale standard.

    Z definita variabile standardizzata: consente un semplice uso delle tabelle e consente di effettuare delle valutazioni normalizzate (es: entro l'intervallo media 2 deviazioni standard compreso circa il 95% della distribuzione, per qualsiasi distribuzione gaussiana).

    21

    Distribuzione normale standard N(,1)

    22

    Introduzione alla statistica

    Distribuzione t-Student

    Aggiungere una struttura con un clic

    22

  • 23

    Introduzione alla statistica

    Tabelle statistiche

    23

    24

    Introduzione alla statistica

    Relazioni utili

    Per le distribuzioni simmetriche (Gaussiana, t-Student, ) valgono le seguenti propriet:

    Se la distribuzione a media nulla:

  • 25

    Introduzione alla statistica

    25

    26

    Introduzione alla statistica

    26

  • 27

    Introduzione alla statistica

    Si calcolino gli estremi dell'intervallo simmetrico rispetto alla media che sottende il 90% di una N(30,4).

    Esempio uso tabelle statistiche

    22 24 26 28 30 32 34 36 380

    0.02

    0.04

    0.06

    0.08

    0.1

    0.12

    0.14

    0.16

    0.18

    0.2

    X

    f(x)

    0.05 0.05

    0.90

    27

    28

    Introduzione alla statistica

    22 24 26 28 30 32 34 36 380

    0.05

    0.1

    0.15

    0.2

    X

    f(x)

    22 24 26 28 30 32 34 36 380

    0.05

    0.1

    0.15

    0.2

    X

    f(x) 0.05

    0.05 0.050.90

    0.95

    28

  • 29

    Introduzione alla statistica

    Applicazione della statistica alle misure

    29

    30

    Introduzione alla statistica

    Quando si effettua una misura si cerca di ottenere un valore misurato che sia il pi vicino possibile al valore vero (sconosciuto e non conoscibile) della grandezza di interesse.

  • 31

    Introduzione alla statistica

    Se si fanno ripetere le misure di lunghezza del pesce a diversi pescatori si otterranno valori diversi. Le cause della diversit delle misure rilevata sono molte, e si possono schematizzare in due gruppi:

    effetti sistematici (tirare la coda, misurare lungo la corda) effetti casuali

    32

    Introduzione alla statistica

    effetti sistematici + casuali effetti casuali

    Come trattare tutte queste misure diverse ???Soluzione: LA STATISTICA

    Altro esempio: misure ripetute nel tempo

  • 33

    Introduzione alla statistica

    Numero rilevazione

    Lettura [kPa]

    1 10.02

    2 10.20

    3 10.26

    4 10.20

    5 10.22

    6 10.13

    7 9.97

    8 10.12

    9 10.09

    10 9.90

    11 10.05

    12 10.17

    13 10.42

    14 10.21

    15 10.23

    16 10.11

    17 9.98

    18 10.10

    19 10.04

    20 9.81

    Si sono effettuate 20 misure di Si sono effettuate 20 misure di pressione in un recipiente:pressione in un recipiente:

    Le misure Le misure nonnon sono tutte uguali! sono tutte uguali!

    Quale la misura che possiamo dire Quale la misura che possiamo dire essere il valore di pressione esistente essere il valore di pressione esistente nel recipiente ?nel recipiente ?

    Altro esempio: misure di pressione di un recipiente

    34

    Introduzione alla statistica 3434

    Si pu procedere cos: si dispongano i dati rilevati in Si pu procedere cos: si dispongano i dati rilevati in ordine crescente e si suddividano in intervalli omogenei ordine crescente e si suddividano in intervalli omogenei (in questo caso si sceglie 0.05 kPa). (in questo caso si sceglie 0.05 kPa).

    Si definisca: Si definisca: n = numero di letture in un intervallon = numero di letture in un intervallo N = numero totale di lettureN = numero totale di letture a = ampiezza di un intervalloa = ampiezza di un intervallo

    e infine la e infine la funzione densit di probabilit discreta funzione densit di probabilit discreta (Z)(Z)::

    aNnZ

  • 35

    Introduzione alla statistica

    Se si traccia un Se si traccia un intervallo di altezza Z intervallo di altezza Z per ogni intervallo si per ogni intervallo si ottiene:ottiene:

    ZZ

    Numero di Numero di letture letture

    nellintervallonellintervallo

    nnaN

    nZ 05.020

    36

    Introduzione alla statistica

    Ipotizzando:Ipotizzando:

    0aN

    Densit di probabilit Densit di probabilit discretadiscreta

    Densit di probabilit Densit di probabilit continuacontinua

  • 37

    Introduzione alla statistica

    b

    a

    dxxfbXap

    a

    dxxfaXF

    Probabilit Probabilit che a

  • 39

    Introduzione alla statistica

    ex

    xf 22

    22

    1

    LA FUNZIONE DI DENSITA NORMALE o LA FUNZIONE DI DENSITA NORMALE o GAUSSIANAGAUSSIANA

    x

    x

    dxxfxF

    40

    Introduzione alla statistica

    LA GAUSSIANA E COMPLETAMENTE DESCRITTA DA LA GAUSSIANA E COMPLETAMENTE DESCRITTA DA DUE PARAMETRI:DUE PARAMETRI:

    MEDIAMEDIA

    DEVIAZIONE STANDARD DEVIAZIONE STANDARD

    ( o la varianza ( o la varianza 22 ) )

  • 41

    Introduzione alla statistica

    MEDIAMEDIA

    DEVIAZIONE STANDARDDEVIAZIONE STANDARD

    INFLUENZA DI MEDIA E DEVIAZIONE STANDARDINFLUENZA DI MEDIA E DEVIAZIONE STANDARD

    42

    Introduzione alla statistica

    NUMERO INFINITO DI CAMPIONI:NUMERO INFINITO DI CAMPIONI:

    : MEDIA: MEDIA : DEVIAZIONE STANDARD: DEVIAZIONE STANDARD

    MA NON SI POSSONO EFFETTUARE UN MA NON SI POSSONO EFFETTUARE UN NUMERO INFINITO DI RILEVAZIONI :NUMERO INFINITO DI RILEVAZIONI :

    SI DEVE TROVARE UN SISTEMA PER SI DEVE TROVARE UN SISTEMA PER STIMARESTIMARE MEDIA E DEVIAZ. ST.MEDIA E DEVIAZ. ST.

  • 43

    Introduzione alla statistica

    N

    xx

    N

    ii

    1

    1

    1

    2

    N

    Xxs

    N

    ii

    Con xi= singola lettura e N = numero rilevazioni

    Media campionaria

    SI UTILIZZANO I SEGUENTI SI UTILIZZANO I SEGUENTI STIMATORISTIMATORI

    Deviazione standard

    campionaria

    44

    Introduzione alla statistica

    X

    DISTRIBUZIONE DISTRIBUZIONE DELLE MEDIE DELLE MEDIE

    CAMPIONARIECAMPIONARIEmm, , mm

    DISTRIBUZIONE DISTRIBUZIONE CAMPIONARIACAMPIONARIA

    , ,

    AVENDO AVENDO DIVERSE SERIEDIVERSE SERIE DI MISURAZIONI DI MISURAZIONI POTREMO CALCOLARE PER OGNUNA DI POTREMO CALCOLARE PER OGNUNA DI QUESTE LA MEDIA, ESSE NON SARANNO QUESTE LA MEDIA, ESSE NON SARANNO

    TUTTE UGUALI E SI DISTRIBUIRANNO SU TUTTE UGUALI E SI DISTRIBUIRANNO SU UNA UNA GAUSSIANAGAUSSIANA

    mm==

    Nm

  • 45

    Introduzione alla statistica

    circa il 68% della distribuzione compreso nellintervallo centrato su e di estremi

    circa il 95.5% della distribuzione compreso nellintervallo centrato su e di estremi 2

    circa il 99.7% della distribuzione compreso nellintervallo centrato su e di estremi 3

    45Caratteristiche della Gaussiana

    46

    Introduzione alla statistica

    Circa il 68%degli intervalli cos costruiti contiene il valore vero (livello di confidenza 68%)

    NsX 2

    NsX

    NsX 3

    Si pu quindi stimare che:46

    Circa il 95.5%degli intervalli cos costruiti contiene il valore vero (livello di confidenza 95.5%)

    Circa il 99.7%degli intervalli cos costruiti contiene il valore vero (livello di confidenza 99.7%)