formulario statistica

60
se vale zero indica che la distribuzione è simmetrica rispetto alla media Statistica descrittiva se positivo denota una coda verso destra se negativo denota una coda verso sinistra indici coefficiente di curtosi indici (o misure) di posizione n media campionaria di n osservazioni x curt=1 xi x4 1, x2, ..., xn n i=1 n misura quanto la distribuzione è appuntita x=1 x n i i=1 correlazioni per k campioni ripetuti ciascuno con frequenza k covarianza x=1 x f n i i di n osservazioni congiunte di 2 variabili {(x1,y1), (x2,y2), ..., (xn,yn)}: i=1 n n proprietà =1 x x y xy n i x yi y= 1 n i

description

contiene tutte le formule per calcoli statistici

Transcript of formulario statistica

se vale zero indica che la distribuzione è simmetrica rispetto alla media Statistica descrittiva se positivo denota una coda verso destra se negativo denota una coda verso sinistra indici coefficiente di curtosi indici (o misure) di posizione n media campionaria di n osservazioni x curt=1 ∑ xi− x4 1, x2, ..., xn n i=1 n misura quanto la distribuzione è appuntita x=1 ∑ x n i i=1 correlazioni per k campioni xì ripetuti ciascuno con frequenza fi k covarianza x=1 ∑ x f n i i di n osservazioni congiunte di 2 variabili (x1,y1), (x2,y2), ..., (xn,yn): i=1 n n proprietà =1 ∑ x − − ∑ x y − xy n i x yi y= 1 n i i x y Posto y i=1 i=1 i= a xi b : y= a x se

m ediana m d i n o sservazioni x xy 0 x e y sono direttamente correlate: a valori grandi (piccoli) di 1 ≤ x2 ≤ ... ≤ xn x corrispondo valori grandi (piccoli) di y; se n è dispari: m= x n1/2 se xy0 x e y sono inversamente correlate: a valori grandi (piccoli) x di x corrispondo valori piccoli (grandi) di y; se n è pari: m= n/2 x n/21 2 se xy=0 x e y sono incorrelate; moda coefficiente di correlazione punto di massimo della distribuzione di frequenza xy una distribuzione con un solo punto di massimo è detta unimodale xy= ; −1 xy 1 una distribuzione con più punti di massimo è detta plurimodale x y indice normalizzato, adimensionale ed invariante per trasformazioni indici di dispersione lineari delle variabili v arianza d i n o sservazioni x regressione lineare 1, x2, ..., xn n retta y= a x b che meglio approssima la nuvola di punti x , y i i 2=1 ∑ x − n i x2 xy xy i=1

a= 2 ; b= y− x 2 per k campioni x ì ripetuti ciascuno con frequenza fi x x k k 2=1 ∑ x − = 1 ∑ x 2 f − valori stimati n i x2 f i n i i x2 i=1 i=1 yi= a xi b proprietà rappresentano i valori stimati di y a partire dalla retta di regressione posto y 2 2 lineare i= a xi b : = a 2 y x deviazione standard o scarto quadratico medio residui r =2 i= yi− yi differenza tra i valori reali e stimati ra nge d i n o sservazioni x1 ≤ x2 ≤ ... ≤ xn valore previsto differenza tra massima e minima osservazione y range= x

0= a x 0 b n − x 1 x0 è un valore diverso dai valori xi già osservati p -esimo quantile (o 100p-esimo percentile) di d i cambiamento di scala n o sservazioni x1 ≤ x2 ≤ ... ≤ xn log y= a log x b p∈ℝ 0,1 , si considera il numero np y=e b x a se np non è intero: k è l'intero successivo , Q p= xk devianza totale x se np è intero: k = np , Q k xk 1 n p = 2 DEV = DEV DEV = y − TOT REG RES ∑ i y2 quartili i=1 n n Q1 primo quartile: quantile per p = 0.25 DEV REG=∑ yi− y2 ; DEV RES=∑ yi− yi2 Q2 secondo quartile: quantile per p = 0.5 (= mediana) i =1 i=1 Q3 terzo quartile: quantile per p = 0.75 coefficiente di determinazione differenza interquartile (IQR – InterQuartile DEV DEV 2 REG RES Range)

R 2= =1− = y ; DEV DEV 0≤ R 2≤1 2 IQR= Q TOT TOT y 3 − Q 1 tanto più esso si avvicina ad uno tanto più la funzione di regressione indici di forma trovata è buona. coefficiente di asimmetria (skewness) n sk= 1 ∑ xi− x3 n i=1 Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni ([email protected] – www.tecnick.com) *** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. *** 1 Probabilità proprietà P =1 definizioni P ∅=0 eventi elementari P A=1− P A tutti i possibili esiti di un esperimento aleatorio P A∪ B= P A P B− P A∩ B ∞ evento P ∪∞ A P n=1 n =∑ An , con Ai∩ A j=∅ se i≠ j n =1 ogni sottoinsieme di uno spazio campionario discreto probabilità classica spazio campionario la probabilità di un evento è il rapporto dei casi favorevoli ed il numero insieme di tutti gli eventi elementari; può essere:

dei casi possibili discreto posto Ω di N elementi k (k = 1, 2, .., N) e se gli elementi sono un numero finito o un'infinità numerabile P k= p , eventi elementari equiprobabili , A evento P k= pk qualunque continuo P A= ∑ P = p∣ A∣=∣ A∣=∣ A∣ se è più numeroso (ad esempio: tutti i numeri reali in un certo k N ∈ A ∣ ∣ k intervallo) ∣ A∣ èil numerodi elementi di A linguaggio permutazione di n oggetti insiemi eventi è ogni allineamento di n oggetti distinti in n caselle P , intero spazio campionario evento certo n= n!= n n−1 n−2 ⋯3⋅2 proprietà di n! (n fattoriale) ∅ , insieme vuoto evento impossibile 0!=1 insieme A l'evento si verifica n! = n−1! insieme A complementare di A l'evento non si verifica n n! A∪ B , (unione) si verifica almeno uno dei due eventi = n n−1 n−2⋯ m1 , con m n m! A∩ B , (intersezione) gli eventi si verificano simultaneamente disposizione di n oggetti in k posti A ∖ B , ( sottrazione = A∩ B ) si verifica A e non si verifica B

è ogni allineamento di k oggetti scelti tra n oggetti distinti in k posti D A∩ B=∅ n , k= n n−1 n−2 ⋯ n− k 1 , con 1≤ k ≤ n , eventi disgiunti gli eventi sono incompatibili Dn ,n= Pn= n! B⊆ A ( B incluso in A ) B implica A disposizione con ripetizione di n oggetti in k proprietà eventi A, B, C sottoinsiemi di Ω posti A∪ A= A è ogni allineamento di k oggetti scelti tra n oggetti e ripetibili, in k posti A∩ A= A D∗ = nk , con k≥1 n , k A∪ B= B∪ A combinazione di n oggetti di classe k A∩ B= B∩ A è ogni sottoinsieme di k elementi dell'insieme di n oggetti A∪ B∪ C= A∪ C ∪ C (modi per scegliere k oggetti tra n) A∩ B∩ C = A∩ C∩ C Dn,k n n−1 n−2⋯ n− k 1 A∪ B∩ C= A∪ B∩ A∪ C C , n , k= = n= P k k! A∩ B∪ C= A∩ B ∪ A∩ C k con n≥1 ; 0≤ k ≤ n A∪∅= A A∩∅=∅ coefficiente Binomiale A∪= n= n = Cn,k ; n= n ; n= n=1 A∩= A k n− k 1 0 n

A∪ A= combinazione con ripetizione di k oggetti scelti A∩ A=∅ fra n A ∪ B= A∩ B ogni gruppo formato di k oggetti scelti fra n, che possono essere ripetuti A ∩ B= A∪ B (modi per disporre k oggetti uguali in n posti) ∗ A= A Cn ,k= n k−1= n k−1 k n−1 p robabilità su Ω permutazione con ripetizione di n oggetti uguali P : P [0,1] fra loro a gruppi (allineamento in n posti di n oggetti) P∗ = n! k 1, k 2,. .. kr k ! k ! k ! 1 2 r Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni ([email protected] – www.tecnick.com) *** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. *** 2 probabilità condizionata legge (o distribuzione) di una v.a. probabilità dell'evento A, condizionata a B applicazione che associa ad ogni intervallo I ⊆ℝ il numero: P X ∈ I = P ∈ : X ∈ I P A∩ B P A∣ B= P B densità discreta di X funzione che ad ogni valore assunto da X associa la probabilità che X proprietà assuma quel valore

P A∩ B= P B∩ A= P A∣ B PB= P B∣ A P A p P B∣ A P A X x k = P X = x k P A∣ B= proprietà P B P A∣ B=1− P A∣ B probabilità dell'evento X ∈ I : probabilità totali P X ∈ I =∑ p x , purché la serie converga X k n x ∈ I k P A=∑ P A∣ B ⋅ P B , j j v.a. indipendenti j=1 con ∪ n B se scelti n intervalli I I , I ⊆ℝ 1, 2, n si ha j=1 j= , B i∩ B j=∅ per i≠ j , P B j≠0 per ogni j P X caso notevole: 1∈ I 1, X 2∈ I 2, , X n∈ I n = P X 1∈ I 1 ⋅ P X 2∈ I 2⋯ P X n ∈ I n P A= P A∣ B P B P A∣ B P B , valore atteso, o media , o speranza matematica con B , B partizione di = EX =∑ x p x , per X discreta formula di Bayes X k X k k P A∣ B P B k P Bk , per ogni k t k∣ A =

⋅ f n X = EX =∫ X t dt , per X continua ∑ P A∣ B ℝ j⋅ P B j j=1 proprietà indipendenza di eventi E aX b= a EX b , con a , b∈ℝ E X eventi A, B indipendenti 1 X 2 X n= EX 1 EX 2 EX n E X , lo sono se soddisfano una delle seguenti condizioni 1⋅ X 2 ⋯ X n = EX 1⋅ EX 2⋯ EX n con X X v.a. indipendenti P A∩ B= P A⋅ P B 1, 2, , X n P A∣ B= P A Ef X =∑ f x p x , purchéla serie converga P B∣ A= P B k X k k famiglia di eventi indipendenti E aX n eventi A 1 b= aEX 1 b , per ogni a , b∈ℝ per v.a. continue 1, A2, ..., An costituiscono una famiglia di eventi indipendenti se per ogni sottofamiglia di r eventi ( 2≤ r ≤ n ), la probabilità di E g X g t f t dt , per g :ℝ ℝ per v.a. continue intersezione di questi r eventi è uguale al prodotto delle probabilità di 1 =∫ X 1 ℝ ciascuno di essi: P A varianza i∩ A j= P Ai P A j , per ogni coppia di indici i≠ j P A X v.a. discreta:

i∩ A j∩ ∩ An = P Ai P A j P A n 2 data una famiglia di eventi indipendenti, anche sostituendo alcuni A X = VarX = E X − EX 2= E X 2− EX 2 i X v.a. continua: con i complementari Ai , rimane una famiglia di eventi indipendenti. Affidabilità di un sistema 2 t 2 f t f X = VarX = E X 2− EX 2=∫ X t dt −∫ X t dt 2 ℝ ℝ componenti in serie proprietà il sistema funziona se e solo se funzionano tutti i componenti VarX ≥0 affidabilità (probabilità che il sistema funzioni) VarX = E X 2− EX 2 a= a 1⋅ a 2⋯ an Var c=0 , per ogni costante c componenti in parallelo Var aX b= a 2 VarX , per ogni a ,b∈ℝ il sistema funziona se e solo se funziona almeno un componente VarX =∑ x x 2 p affidabilità (probabilità che il sistema funzioni) k− EX 2 p X x k =∑ k X xk − EX 2 k k a=1−1− a Var X , 1 ⋅ 1− a 2 ⋯1− an 1 X 2 X n = VarX 1 VarX 2 VarX n con X indipendenti variabili aleatorie e modelli probabilistici i deviazione standard o scarto quadratico medio variabili aleatorie 2 X = X= VarX

variabile aleatoria (v.a.) discreta covarianza è una qualunque funzione: Cov X ,Y = E X − EX ⋅ Y − EY = E XY − EX⋅ EY , X : ℝ con X , Y v.a. con varianza finita X ∈ I , con I⊆ℝ è un'abbreviazione di ∈ : X ∈ I Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni ([email protected] – www.tecnick.com) *** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. *** 3 proprietà Binomiale di parametri n e p Cov X , X = VarX X ~ B n , p Cov X ,c=0 , per ogni costantec conta il numero complessivo di successi ottenuti in n prove (estrazione Cov X ,Y = Cov Y , X con reimissione) Cov X Y , Z= Cov X , Z Cov Y ,Z p k = X n pk1− p n− k, k=0,1,2,... ,n Cov Y ,Y Z = Cov X ,Y Cov X ,Z k Cov aX , Y = aCov X ,Y EX = np ; VarX = np1− p Cov X ,aY = aCov X ,Y 1− 2p 1 sk X = − 6p 1− p ; curt X =3 Var X Y = VarX VarY 2Cov X ,Y np1− np np1− p ∣ Cov X ,Y ∣ ≤ VarX⋅ VarY dis.Cauchy− Swartz il numero di oggetti di tipo K che si trovano in un campione di n oggetti correlazione estratti con reimmissione da un insieme di N oggetti che contiene K due v.a. con varianza finita si dicono incorrelate se: oggetti di un tipo e (N-K) oggetti di un'altro è: Cov X , Y =0 K X ~ B n , in tal caso: N

Var X Y = Var X Var Y processo di Bernoulli illimitato coefficiente di correlazione di X, Y sequenza infinita di prove Cov XY X ,Y , dove Binomiale negativa di parametri -n e p XY≡ ≡ −1≤ XY ≤1 X⋅ Y VarX⋅ VarY X ~ B − n , p se conta il numero di insuccessi che si ottengono prima di ottenere n XY è vicino a zero: X e Y sono quasi indipendenti se successi XY è positivo: ad X grande corrisponderà in genere una Y grande se p XY è negativo: ad X grande corrisponderà in genere una Y piccola X k = n k−1 pn1− p k , k=0,1,2,... k se XY=±1 le v.a. sono una funzione lineare dell'altra: Y = aX b 1− p standardizzata di X EX = n ; VarX = n 1− p p p 2 è una v.a. ottenuta da una v.a. X con media e varianza finite: X − il numero Y di prove necessarie per ottenere n successi: X ∗= X X P Y= k = P X n= k= P X = k− n= k−1 pn1− p k− n, EX ∗=0 ; Var X∗=1 k − n disuguaglianza di Cebicev per k = n ,n1, n2,. .. sia X una v.a. di valore atteso 2

Geometrica di parametro p X e varianza finite, allora per X X ogni 0 : ~ G p conta il numero di prove necessarie per ottenere il primo successo P ∣ X − ∣≥ ≤ 1 X X p 2 , ovvero X k = p 1− p k −1 , per k=1,2,3,... EX = 1 P ∣ X − ∣ = P − X ≥1− 1 ; VarX = 1− p p X X X X X X p 2 2 Geometrica traslata di parametro p processo di Bernoulli X ~ G ' p sequenza di esperimenti di Bernoulli indipendenti di uguale parametro conta il numero di insuccessi prima del primo successo p pX k = p1− p k , per k=0,1,2,. .. esperimento bernulliano o prova di Bernoulli EX =1− p ; VarX = 1− p è un esperimento aleatorio che può avere solo due esiti possibili: p p 2 • successo : con probabilità p Ipergeometrica di parametri (N, K, n) • insuccesso : con probabilità (1-p) X ~ G N , K , n , con N ≥ k ; N ≥ n p è il parametro della prova di Bernoulli conta il numero di oggetti di tipo K che si trovano in un campione di n processo di Bernoulli limitato oggetti estratti senza reimmissione da un insieme di N oggetti che contiene K oggetti di un tipo e (N-K) oggetti di un altro. il numero di prove è finito

bernulliana di parametro p K N− K k n− k X ~ B p pX k = descrive l'esito di ogni prova di Bernoulli N , con 0≤ k≤ n ; k≤ K ; n− k≤ N− K p n X 1= p ; pX 0=1− p EX = p K K ; VarX = p1− p K EX = n ; VarX = n 1− N− n N N N N −1 la probabilità di ottenere, in n prove, una particolare sequenza di k approssimazione Binomiale successi e (n-k) insuccessi è: per N (e quindi K) molto grandi (N > 10n) è come se estraessimo con pk 1− p n− k reimissione: la probabilità di ottenere, in n prove, almeno un successo è: K X 1−1− p n ~ G N , K , n X ~ B n , , per N ∞ N Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni ([email protected] – www.tecnick.com) *** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. *** 4 K densità di Cauchy pX k n pk1− p n− k , per N ∞ , p= k N

f t= 1 X 1 t 2 EX = np ; VarX = np1− p N− n N −1 b P a X b=∫1 =1/arctan b−arctan a N − n (fattore di correzione per la popolazione finita (< 1)) a 1 t 2 N −1 densità Normale Standard P oisson di parametro λ > 0 “curva a campana” di Gauss, o curva degli errori Y ~ P 0 , con0 f t= 1 e− t 2/2 permette di descrivere quantitativamente situazioni in cui non abbiamo X 2 accesso ai valori di N e p, ma possediamo un unica informazione b 1 numerica: il parametro λ (numero medio di arrivi) P a X b=∫ e− t 2/2 dt a 2 p k =e− k Y k! , per k=0,1,2, funzione di ripartizione di X (f.d.r.) EY = ; VarY = equivale alla densità discreta nel caso continuo 1 1 F sk X = X t : ℝ [ 0,1 ] ; curt X =3 F X t= P X ≤ t , per ogni t ∈ℝ t proprietà F

f X t =∫ X y dy , per X continua se X ~ P −∞ i 0 i allora: X X X ~ P 1 2 n 0 1 2 n F t=∑ p x , per X discreta X X k approssimazione della Binomiale x ≤ t k per N molto grande e p molto piccolo: proprietà X ~ B N , p Y ~ P Np , P X = k P Y = k se t , X ≤ t 0 1 t 2 1 ⊆ X ≤ t 2 , P X ≤ t 1≤ P X ≤ t2 , F processo Poisson di intensità ν X t è monotona crescente F permette di calcolare probabilità di eventi che accadono in un certo X t 1 per t ∞ intervallo di tempo diverso da quello su cui abbiamo informazioni di F X t 0 per t −∞ partenza; F X b− F X a= P X ≤ b− P X ≤ a= P a X ≤ b , posto = t con numero medio di arrivi nell'unità di tempo, il con a , b∈ℝ , a b numero X la f.d.r. di una v.a. continua è sempre una funzione continua t di arrivi nell'intervallo di tempo [0, t ] è dato da X ~ P nei punti in cui la densità è continua; in questi punti è derivabile: t 0 t

' F t= f t t k X X p k =e− t X q uantile α -e simo (q t k! , per k =0,1,2, α) EX = t = t P X ≤ q = , con q ∈ a ,b⊆ℝ , ∈0,1 t ; VarX t variabili aleatorie continue variabili aleatorie legate al processo di densità continua fx Poisson determina la legge della v.a. continua X; è una densità di probabilità le gge Esponenziale di parametro ν P X ∈ I ≡∫ f Y ~ Esp , con 0 x t dt , con I ⊆ℝ misura l'istante del primo arrivo in un processo di Poisson X I t di intensità ν, o il tempo di attesa tra due arrivi successivi; f : f è l'unico modello adeguato a rappresentare il tempo di vita di un x ℝ ℝ ; f x t≥0 , per ogni t ∈ℝ ; ∫ x t dt=1 ℝ apparecchio non soggetto ad usura

proprietà FY t=1−e− t , per t0 P X = t=0 , per ogni t∈ℝ (la probabilità che assuma un F t=0 , per t≤0 Y valore fissato è nulla (integrale di un punto)) f Y t =e− t , per t0 P X ≤ a= P X a f t =0 , per t0 P a≤ X b= P a X b Y 1 1 esempi di densità continue E Y = ; VarY =2 densità uniforme sk X =2 ; curt X =9 f t= 1 I t , a ,b∈ℝ , a b stimatore non distorto per legge Esponenziale X b− a a,b n−1 n−1 I U = T = n con a ,b t=1 , per t∈ a , b n I t=0 , per t ∉ a ,b (funzione indicatrice) ∑ X a ,b i i=1 P X ∈ J =∫ 1 I ∣ a , b∩ J∣ b− a a,b t dt= 1 b− a J Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni ([email protected] – www.tecnick.com) *** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. *** 5 n

n 1 = −1 = −1 , stima di modello Normale n ∑ n X X n legge Normale standard i i=1 Z ~ N 0,1 le gge Gamma di parametri n (intero positivo) e ν 1 t − y 2 (intero positivo) F e 2 dy Z t = ∫ ≡ t 2 −∞ Y ~ n , − t 2 misura l'istante dell'ennesimo arrivo in un processo di Poisson X 1 2 t di f e Z t = ≡ t intensità ν 2 n−1 E Z =0 ; Var Z =1 F e− t t k , per t Y t =1−∑ 0 proprietà

k=0 k ! F − t=1− t , simmetria Y t =0 , per t≤0 calcoli con i quantili f tn−1e− t , per t Y t = e− t t n −1 = C 0 , n−1! n , posto z quantile α-esimo della legge Normale standard: f Y t =0 , per t0 z=− z 1− n C P Z z= n , = n−1 ! P Z z = 1− n n E Y = P ∣ Z∣ z ; Var Y =2 1−/2 = P ∣ Z ∣ z1 /2= le gge Gamma di parametri r e ν ( reali positivi) le gge Normale (o gaussiana) di media µ e Y ~ r , v arianza σ 2 descrive il tempo di vita di un apparecchio la cui propensione al guasto cresce col tempo, fino al limite ν X ~ N , 2 f tr−1 e− t , per t rappresenta bene gli errori di approssimazione Y t = C r ,

0 f t− Y t =0 , per t0 F X t= r r E Y = − t−2 ; Var Y =2 1 t− 1 f e 22 X t = = assenza di memoria 2 P Y≥ T − t∣ Y ≥ T = P Y ≥ t EX = ; Var X =2 P Y≥ T t= P Y ≥ t⋅ P Y ≥ T sk X =0 ; curt X =3 se una v.a. continua soddisfa questa proprietà, allora ha legge X − la v.a. Z = ha legge Normale standard Esponenziale se è continua e legge Geometrica traslata se discreta istantaneous failure rate (propensione istantanea proprietà al guasto) posto X ~ N 2 , X ~ N 2 indipendenti: 1 1, 1 2 2, 2 f 2 2

Z t = Y t X X ~ N 1 2 1 2, 1 2 1− FY t posto a ,b∈ℝ : per la legge Esponenziale: aX b~ N a b , a 2 2 1 1 1 Z t = , per t0 relazione tra legge Normale e legge Normale standard per la legge Gamma: Z ~ N 0,1 ⇒ Z~ N , 2 tn−1 n tn−1 X − Z t = Cn = X n−1 n−1 ~ N , 2 ⇒ ~ N 0,1 ∑ t k n−1 ! ∑ t k k=0 k! k=0 k! errori densità di Weibull Y = misura di una grandezza fisica utile a rappresentare il tempo di vita di un apparecchio = valore vero posto Z t = c t si trova: X = errore di misura − c t1 = errore sistematico

F 1 , con Y t =1−e −1 Ec= errore casuale − c t1 2= inacuratezza della misura f 1 Y t = c t e X ~ N , 2 , X = E se 0 l'apparecchio invecchia c se −1 0 l'apparecchio migliora col tempo Ec~ N 0,2 se =0 si ritrova la legge Esponenziale E E =0 c EY = media campionaria se X ~ N i , 2 sono v.a. indipendenti ed identicamente Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni ([email protected] – www.tecnick.com) *** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. *** 6 distribuite (i.i.d.): sk 3 2 X = = E [ X−3] X 3 /2 n ~ N , n 2 µ

E X 2 c oefficiente di curtosi di una v.a. X con ' 4 finito n = ; Var X = n n misura quanto la densità di X sia appuntita media campionaria standardizzata 4 X curt X = = E [ X−4] , = EX , 2= Var X 2 S∗ n − , n 2 n= =1,2,3, / n teorema del limite centrale statistica inferenziale P S∗ n≤ t t per n∞ , t ∈ℝ campionamento e stime approssimazione Normale definizioni Date X v.a.i.i.d. , EX = , VarXi=2 con n abbastanza i i grande: modello statistico famiglia di leggi di v.a., dipendenti da uno o più parametri incogniti: 2 X p n ≃ N , ossia P X

n n t ≃ n t− X x ; : ∈ I è un vettore di parametri n n ∑ X X campione casuale di ampiezza n i≃ N n , n 2 ossia P ∑ i t ≃ t− n i=1 i=1 n estratto da una popolazione di densità p x ; X è una ennupla di v.a. approssimazione Normale di Gamma per n grande: indipendenti e identicamente distribuite (i.i.d) X X 1, 2, , X n , Y ~ n , ciascuna avente legge p x ; X . n n Y ≃ N , stima di parametri e stimatori 2 stima puntuale dei parametri F stimare il valore vero del parametro (o dei parametri) a partire dal Y t = P Y t ≃ t− n n campione casuale approssimazione Normale della Binomiale: stima del parametro p della popolazione bernulliana approssimazione utile in problemi di campionamento p= x , con x valorieffettivamente osservati n i NOTA: vale se: np5 ; n1− p5 statistica T Y ~ B n , p

Y ≃ N np ,np 1− p è una qualsiasi v.a. T funzione del campione casuale X X 1, 2, , X n di ampiezza n estratto da una popolazione di legge p x , X : FY t= P Y ≤ t≃ t− np , perv.a.continua np 1− p T = f X X 1, 2, , X n , con f : ℝ n ℝ stimatore del parametro ϑ FY k= P Y ≤ k ≃ k0.5− np , np1− p statistica che viene usata per stimare il valore del parametro k=0,1,2, , n , per v.a. discreta è corretto (non distorto) se ET = altrimenti è detto distorto momenti ed indici di forma per v.a. stima del parametro ϑ = f x x momento r-esimo di X 1, 2, , x n , calcolato acampionamento eseguito stimatore consistente ' = E X r r var T stimatore corretto di n 0 per n ∞ , conT n ' =∑ xr p x , per X discreta valore atteso della media campionaria r k X k k E

X n= ' xr f r =∫ X x dx , per X continua varianza della media campionaria ℝ 2 momento r-esimo centrato di X Var X = n n = E X − EX r r legge dei grandi numeri =∑ x − r p x , con = EX , per X discreta P ∣ X r k X k n− ∣ 0 , per n ∞ k stime r =∫ x− r f X x dx , per X continua ℝ stima di 2= h coefficiente di asimmetria (skewness) di una v.a. n X con µ ' S 2≡ 1 ∑ X − X 2 , varianza campionaria 3 finito n n−1 i n misura l'assimetria di X rispetto al valore atteso i =1 a campionamento effettuato: Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni ([email protected] – www.tecnick.com) *** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette.

Usatele a vostro rischio. *** 7 n n di legge N , 2 , allora: s 2≡ 1 ∑ x − 2= 1 ∑ x 2− n 2 n n−1 i xn n i n xn X − i=1 −1 i=1 −1 n ~ t n−1 stima popolazione Normale S 2/ n n = xn calcoli con i quantili 2= s 2 posto t n n quantile α-esimo della legge t(n): se µ è nota: P T t n= n P T t 2= 1 ∑ X −2 1− n= n i P ∣ T∣ t i=1 1− /2 n = stima popolazione Gamma P ∣ T ∣ t

n= 1 /2 2 t n−1≃ z , approssimazione per n120 1 1 = xn − ; r= xn 2 2 s 2 s 2 n n approssimazione di quantili tramite leggi interpolazione lineare legge Chi quadro con n gradi di libertà y= mx q , equazione della rettache passa per i punti q 1 1, t q 1 , q 2, t q 2 Y ~ X 2 n ≡ Y ~ n , t q − t q 2 2 t x= t q − 2 1 x− q , con q x q 1 1 1 2 X q − q i sono v.a. indipendenti, ciascuna di legge N(0,1) 2 1 n −1 − t f t = c t 2 e 2 , per t0

legge di fisher con m e n gradi di libertà Y n f t =0 , per t0 X ~ F m , n ; con X = U / m , U ~ X 2 m , V ~ X 2 n Y EY = n ; Var Y = 2n V / n proprietà proprietà 1 posto Y ~ F n ,m 1 ~ X 2 n 1 , Y 2 ~ X 2 n 2 indipendenti: X Y Y ~ X 2 n n 1 2 1 2 P X F m ,n= intervallo a cui una v.a. di legge Chi quadro appartiene con probabilità α: 1 1 P =1− P X 2 n Y X 2 n= X F m ,n 1− 1 2 2 1 = F approssimazione Normale di Chi quadro per n grande F 1 − n , m m , n 2 X 2 n≃ N n , 2n , per n grande S 1 = F m−1, n−1 2 P Y t≃ t− n S 2

2n in tervallo di confidenza al livello del 100α % per X 2 n≃ z 2n n h(ϑ) approssimazioni Sia X X , X 1, 2, n un campione casuale estratto da una Sia X , X , X i 2, n un campione casuale estratto da una popolazione popolazione di densità f x ; ; siano T X 1= t 1 X 1, 2, , X n , di legge N , 2 , allora: T X 2 = t 2 X 1, 2, , X n due statistiche, e sia h una funzione n ∑ X − i~ del parametro che si vuole stimare; fissato un numero ∈0,1 , X 2 n l'intervallo aleatorio (T1, T2) si dice intervallo di confidenza al 100α% i=1 n per h(ϑ) se: ∑ Xi− Xn~ X 2 n−1 P T h T = 1 2 i=1 a campionamento eseguito l'intervallo (t1,t2) si dice “calcolato al n−1 S 2 n campione”; ~ X 2 n−1

2 h(ϑ) appartiene all'intervallo (t1, t2) con una confidenza del 100α%; t S 2 e X sono tra loro indipendenti 1 e t2 sono detti limiti di confidenza n n intervallo di confidenza per la media legge t di student a n gradi di libertà (di una popolazione Normale o popolazione qualsiasi con n grande T ~ t n ; con T = Z , Z ~ N 0,1 , Y ~ X 2 n n≥30 ) Y / n = X ± z = X ± E , con varianza nota n 1 / 2 n n f t = c 1 t 2− n12 , pert∈ℝ T n n 2 ET =0 , tranne per n=1 per cui nonesiste finito = X ± t n−1 Sn , convarianzaincognita n 1 n per t ∞ la t di student tende alla Normale standard 2 approssimazioni Sia X , X , X i 2, n un campione casuale estratto da una popolazione Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni ([email protected] – www.tecnick.com) *** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. ***

8 stima dell'ampiezza per limitare l'errore E0 H0 H1 rifiutare H0 se n= t 2 = ∣ z∣ z n−1 2 , con varianza nota 1 / 2 0 ≠0 1−/ 2 E 20 ≤ z z intervallo di confidenza per la frequenza p 0 0 1− valido per una popolazione bernoulliana e per grandi campioni ≥ z 0 0 − z 1 − n≥30 1− X test sulla media di una popolazione Normale di p= X ± z n ; se: n 5 , n1− 5 n 1 /2 Xn n xn xn varianza incognita stima dell'ampiezza per limitare l'errore E0 t= xn−0 sn / n

n= z1 /22 2 E H0 H1 rifiutare H0 se 0 E = ∣ t∣ t 0 corrisponde a metà dell'intervallo di confidenza. 0 ≠0 1−/2 n−1 test di ipotesi ≤ t 0 0 t 1− n−1 ipotesi statistica ≥ t 0 0 − t 1− n−1 è un'asserzione sul valore vero di un parametro incognito; si dice semplice se specifica completamente il valore del parametro, test sulla frequenza p di una popolazione altrimenti si dice composta bernoulliana ipotesi nulla H0 x z= n− p 0 H : ∈ 0 0 p 01− p 0/ n ipotesi che si ritiene vera “fino a prova contraria”; H rifiuteremo H 0 H1 rifiutare H0 se 0 solo se i dati campionari forniranno una forte evidenza

statistica contro di essa p= p p ∣ z∣ 0 ≠ p 0 z 1−/2 ipotesi alternativa H1 p≤ p p p z z H : 0 0 1− 1 ∉0 ipotesi vera solo se H p≥ p p p z− z 0 è falsa 0 0 1− errore di tipo I test sulla differenza di due medie con varianze rifiutiamo H0 quando è vera; note questo è considerato l'errore più grave estraiamo due campioni n,m da due popolazioni normali indipendenti errore di tipo II con varianze note; accettiamo H0 quando è falsa questo test non va usato quando una varianza è almeno 4 volte l'altra regione critica o regione di rifiuto X z= n− Y m− è l'insieme R dei possibili risultati campionari che portano a rifiutare H0 2 2 data la regola di decisione: si rifiuti H seT X X , X ∈ I X Y 0 1, 2,

n : n n R= x x ,x :T x x , x ∈ I 1, 2, n 1, 2, n H la probabilità di rifiutare H 0 H1 rifiutare H0 se 0 prima del campionamento: P T X X , X ∈ I 1, 2, n X = Y X≠ Y ∣ z∣ z 1−/2 ampiezza del test (o livello di significatività) X≤ Y X Y z z 1− = sup P T X X , X ∈ I ∈ 1, 2, n 0 rappresenta la massima probabilità di rifiutare l'ipotesi nulla quando X ≥ Y X Y z− z 1− questa è vera; test sulla differenza di due medie con varianze va stabilito piccolo a priori prima di eseguire il campionamento incognite p-value

estraiamo due campioni n, m da due popolazioni normali indipendenti numero pari al minimo livello di significatività a cui i dati campionari con varianze incognite; consentono di rifiutare l'ipotesi nulla; questo test non va usato quando una varianza è almeno 4 volte l'altra se p-value = 0 siamo praticamente certi di non sbagliare X n− Y n− varianza campionaria pesata t= 2 m−1 S 2 media pesata delle varianze campionarie di due campioni n, m 1 1 n−1 SX Y n n n m n m−2 ∑ X − X ∑ Y − Y 2 H m−1 S 2 i n i n 0 H1 rifiutare H0 se S 2= n−1 S X Y = i=1 i=1 n m−2 n m−2 X= Y X≠ Y ∣ t∣ t 1−/2 n m−2 test sulla media di una popolazione Normale di X≤ Y X Y t t 1− n m−2 varianza nota − X ≥ Y

X Y t− t 1− n m−2 z= xn 0 nel caso di campioni osservazioni accoppiate si considerano le / n differenze delle medie Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni ([email protected] – www.tecnick.com) *** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. *** 9 test su due frequenze di due popolazioni k bernoulliane indipendenti classi A1 A2 ... Ak ∑ i =1 estraiamo due campioni n, m da due popolazioni bernoulliane freq. rel. attese p p 1 2 ... pk 1 indipendenti X ~ B p , Y ~ B p 1 2 ; freq. ass. attese np np 1 2 ... npk n n m

freq. ass. questa procedura è valida se ∑ x y N N i 5 ; ∑ i5 osservate 1 2 ... N k n i=1 i=1 x n x scarti quad. np − N 2 np − N 2 np − N 2 1 1 2 2 k k z= n− ym n m ym ... Q con p= pesati np np np 1 1 n m 1 2

k p1− p le classi andranno accorpate in maniera tale che le frequenze assolute n m attese siano tutte maggiori o uguali a 5; H Chi quadro calcolato dal campione: 0 H1 rifiutare H0 se k p p ∣ z∣ np − N 2 i i 1= p 2 1≠ p 2 z 1−/2 Q=∑ np p p z i =1 i 1≤ p 2 1 p 2 z 1− Q X 2 k−1 per n ∞ , con p assegnate a priori i p p z 1≥ p 2 1 p 2 − z 1− Q X 2 k−1− r per n∞ , con p calcolate dopo i inferenze su una varianza aver stimato r parametri incogniti fissato α, si stabilisce la regola di decisione: n−1 s 2 2 X 2= n si rifiuti H se Q X

k −1− r 0 1− (si calcola tramite tabelle) 20 il p-value corrispondente al valore Q è: H = P X Q , con X ~ X 2 k −1− r 0 H1 rifiutare H0 se 2=2 2≠2 X 2 X 2 n−1 o X 2 X 2 n−1 test Chi quadro di indipendenza 0 0 1− /2 /2 verifica l'indipendenza o meno di due variabili; 2≤2 22 X 2 X 2 n−1 si costruisce una tabella di contingenza di rs classi: 0 0 1− A A 1 2 ... Ar Tot. 2≥2 2 X 2 2 0 20 X n−1 B n n n 1

11 21 ... nr1 ⋅1 intervallo di confidenza B n n n 2 12 22 ... nr1 ⋅2 ... ... ... ... ... ... n−1 s 2 n−1 s 2 n , n B n n n s 1s 2s ... nrs ⋅ s X 2 n−1 X 2 n−1 1 1− Tot. n

n 1⋅ 2⋅ ... nr⋅ n 2 2 inferenze su due varianze si costruisce una tabella di rs classi: A A estraiamo due campioni n, m da due popolazioni normali indipendenti 1 2 ... Ar con medie incognite; n ⋅ n n n B 1 1 2⋅ n 1 ... r⋅ n 1 s 2 1 n n n F = X s 2 n n n 1⋅ n 2 2⋅ n 2 r⋅ n 2 Y B 2 ... n n n H0 H1

rifiutare H0 se ... ... ... ... ... 2 =2 2 ≠2 F F n n n X Y X Y 1−/2 n−1, m−1 B 1⋅ ns 2⋅ n s ... r⋅ ns F F n−1, m−1 s n n n /2 ni⋅ n⋅ j 2 ≤2 2 2 F F ciascuna delle frequenze attese deve essere: ≥5 X Y X Y 1− n−1, m−1 n 2 ≥2 2 ≤2 F F si calcola il chi-quadro: X Y X Y 1− n−1, m−1 2 intervallo di confidenza r

s n − ni⋅ n⋅ j ij n Q=∑ ∑ 1 s 2 s 2 X 1 n , X i =1 j=1 i⋅ n⋅ j F 2 F 2 1 n−1, m−1 s n−1, m−1 s n Y 1 − Y 2 2 fissato α, si stabilisce la regola di decisione: test Chi quadro di adattamento si rifiuti H se Q X 2 r−1 s−1 0 1− ha lo scopo di verificare se certi dati empirici si adattino bene ad una (si calcola tramite tabelle) distribuzione teorica assegnata; si costruisce la seguente tabella: il p-value corrispondente al valore Q è: = P X Q , con X ~ X 2 r−1 s−1 Formulario di Probabilità e Statistica [2005-07-24] - Copyright © 2005 Nicola Asuni ([email protected] – www.tecnick.com) *** ATTENZIONE: Non posso garantire che le seguenti informazioni siano corrette. Usatele a vostro rischio. *** 10

Document Outline

Statistica descrittiva indici indici (o misure) di posizione media campionaria di n osservazioni x1, x2, ..., xn proprietà mediana m di n osservazioni x1 x2 ... xn moda indici di dispersione varianza di n osservazioni x1, x2, ..., xn proprietà deviazione standard o scarto quadratico medio range di n osservazioni x1 x2 ... xn p-esimo quantile (o 100p-esimo percentile) di di n osservazioni x1 x2 ... xn quartili differenza interquartile (IQR – InterQuartile Range) indici di forma coefficiente di asimmetria (skewness) coefficiente di curtosi correlazioni covarianza coefficiente di correlazione regressione lineare valori stimati residui valore previsto cambiamento di scala devianza totale coefficiente di determinazione Probabilità definizioni eventi elementari evento spazio campionario discreto continuo linguaggio proprietà eventi A, B, C sottoinsiemi di probabilità su proprietà probabilità classica permutazione di n oggetti proprietà di n! (n fattoriale) disposizione di n oggetti in k posti disposizione con ripetizione di n oggetti in k posti combinazione di n oggetti di classe k coefficiente Binomiale combinazione con ripetizione di k oggetti scelti fra n permutazione con ripetizione di n oggetti uguali fra loro a gruppi probabilità condizionata probabilità dell'evento A, condizionata a B proprietà probabilità totali formula di Bayes indipendenza di eventi eventi A, B indipendenti famiglia di eventi indipendenti Affidabilità di un sistema componenti in serie affidabilità (probabilità che il sistema funzioni) componenti in parallelo affidabilità (probabilità che il sistema funzioni) variabili aleatorie e modelli probabilistici variabili aleatorie variabile aleatoria (v.a.) discreta legge (o distribuzione) di una v.a. densità discreta di X proprietà v.a. indipendenti valore atteso, o media , o speranza matematica proprietà varianza proprietà deviazione standard o scarto quadratico medio covarianza proprietà correlazione coefficiente di correlazione di X, Y standardizzata di X disuguaglianza di Cebicev processo di Bernoulli esperimento bernulliano o prova di Bernoulli processo di Bernoulli limitato bernulliana di parametro p Binomiale di parametri n e p processo di Bernoulli illimitato Binomiale negativa di parametri -n e p Geometrica di parametro p Geometrica traslata di parametro p Ipergeometrica di parametri (N, K, n) approssimazione Binomiale Poisson di parametro > 0 proprietà approssimazione della Binomiale processo Poisson di intensità variabili aleatorie continue densità continua fx proprietà esempi di densità continue densità uniforme densità di Cauchy densità Normale Standard funzione di ripartizione di X (f.d.r.) proprietà quantile -esimo (q) variabili aleatorie legate al processo di Poisson legge Esponenziale di parametro stimatore non distorto per legge Esponenziale legge Gamma di parametri n (intero positivo) e (intero positivo) legge Gamma di parametri r e (reali positivi) assenza di memoria istantaneous failure rate (propensione istantanea al guasto) per la legge Esponenziale: per la legge Gamma: densità di Weibull modello Normale legge Normale standard proprietà calcoli con i quantili legge Normale (o gaussiana) di media e varianza 2 proprietà relazione tra legge Normale e legge Normale standard errori media campionaria media campionaria standardizzata teorema del limite centrale approssimazione Normale approssimazione Normale di Gamma per n grande: approssimazione Normale della Binomiale: momenti ed indici di forma per v.a. momento r-esimo di X momento r-esimo centrato di X coefficiente di asimmetria (skewness) di una v.a. X con '3 finito coefficiente di curtosi di una v.a. X con '4 finito statistica inferenziale campionamento e stime definizioni modello statistico campione casuale di ampiezza n stima di parametri e stimatori stima puntuale dei parametri stima del parametro p della popolazione bernulliana statistica T stimatore del parametro stima del parametro stimatore consistente valore atteso della media campionaria varianza della media campionaria legge dei grandi numeri stime stima di stima

popolazione Normale stima popolazione Gamma leggi legge Chi quadro con n gradi di libertà proprietà approssimazione Normale di Chi quadro per n grande approssimazioni legge t di student a n gradi di libertà approssimazioni calcoli con i quantili approssimazione di quantili tramite interpolazione lineare legge di fisher con m e n gradi di libertà proprietà intervallo di confidenza al livello del 100% per h() intervallo di confidenza per la media stima dell'ampiezza per limitare l'errore E0 intervallo di confidenza per la frequenza p stima dell'ampiezza per limitare l'errore E0 test di ipotesi ipotesi statistica ipotesi nulla H0 ipotesi alternativa H1 errore di tipo I errore di tipo II regione critica o regione di rifiuto ampiezza del test (o livello di significatività) p-value varianza campionaria pesata test sulla media di una popolazione Normale di varianza nota test sulla media di una popolazione Normale di varianza incognita test sulla frequenza p di una popolazione bernoulliana test sulla differenza di due medie con varianze note test sulla differenza di due medie con varianze incognite test su due frequenze di due popolazioni bernoulliane indipendenti inferenze su una varianza intervallo di confidenza inferenze su due varianze intervallo di confidenza test Chi quadro di adattamento test Chi quadro di indipendenza