Appunti statistica

4
sabato 21 giugno 2014 Risoluzione esercizi di statistica con R Frequenza relativa: - Creo l’array con i dati all’interno: x<-c(X1, X2, X3,…, X10) - Creo la funzione: bond=seq(da n° di inizio, a n° finale, by=n) - Es. Se ho 10 dati e voglio la frequenza relativa da 0 a 25: bond=seq(0,25, by=25) ciò mi permetterà di fare la frequenza relativa del valori da 0 a 25: table(cut(x,bond)) / n° di dati di X Gradi di libertà In una tabella di contingenza da R righe ed S colonne, i gradi di libertà (test chi-quadro) sono: (n° di righe - 1)*(n° di colonne -1) Regressione lineare (retta) - Creo il set di dato: x<-c(X1, X2, X3,…, X10) y<-c(Y1, Y2, Y3,…, Y10) modello= lm(formula=x~y) Test Chi-quadro Per ottenere il test del chi-quadro creo un array con il set di dati fornito: x=c(…………) chisq.test (x) Covarianza, Deviazione standard, Quantili, quartini, Correlazione varianza-covarianza Innanzitutto creo i set di dati: 1 N.B. Il simbolo “~” si scrive premendo ALT + 926 su Windows e ALT + 5 su OSX

description

appunti di statistica

Transcript of Appunti statistica

Page 1: Appunti statistica

sabato 21 giugno 2014

Risoluzione esercizi di statistica con R!

Frequenza relativa:!- Creo l’array con i dati all’interno:!

! x<-c(X1, X2, X3,…, X10)!

- Creo la funzione:!

! bond=seq(da n° di inizio, a n° finale, by=n)!

- Es.Se ho 10 dati e voglio la frequenza relativa da 0 a 25:bond=seq(0,25, by=25)ciò mi permetterà di fare la frequenza relativa del valori da 0 a 25:table(cut(x,bond)) / n° di dati di X!

Gradi di libertà!

In una tabella di contingenza da R righe ed S colonne, i gradi di libertà (test chi-quadro) sono:!

! (n° di righe - 1)*(n° di colonne -1)!

Regressione lineare (retta)!- Creo il set di dato:!

! x<-c(X1, X2, X3,…, X10)! y<-c(Y1, Y2, Y3,…, Y10)! modello= lm(formula=x~y)!

Test Chi-quadro!

Per ottenere il test del chi-quadro creo un array con il set di dati fornito:!

! x=c(…………)! chisq.test (x)!

Covarianza, Deviazione standard, Quantili, quartini, Correlazione varianza-covarianza!

Innanzitutto creo i set di dati:!

�1

N.B. Il simbolo “~” si scrive premendo ALT + 926 su Windows e ALT + 5 su OSX

Page 2: Appunti statistica

sabato 21 giugno 2014x<-c(X1, X2, X3,…, X10)y<-c(Y1, Y2, Y3,…, Y10)!

Dopodiché darò i seguenti comandi:!

Se il set di dati è composto da dati ripetuti, la tabella verrà popolata aggiungendo il comando:!

rep(n, n ripetizioni)!

Es.!

rip_tab <-c(rep(5,111),rep(8,271))!

tramite questo comando ho popolato la tabella “rip_tab” con il numero 5 ripetuto 111 volte ed il numero 8 ripetuto 271 volte; successivamente è possibili utilizzare i comandi riportati sopra.!

Metodo dei rettangoli!

Dato un integrale, prendo il valore più alto e lo inserisco in un array “a”, il valore più piccolo in un array “b” ed uso la seguente formula:!

! (b-a)*(f(b)-f(a) !

! n!

! ! ! ! ! ! ! ! Dove a=4 e b=2!

In R sarà:!

! a<-c(4)!

! b<-c(2)!

Sostituisco la x ad a, quindi:!

! Fa<-c(2+(a^2)+a)!

! Fb<-c(2+(b^2)+a)!

! ((b-a)*(Fa-Fb)/n Dove n= n° dei rettangoli per avere una data soglia d’errore!

Covarianza Deviazione standard Quantili e quartili Correlazione varianza-covarianza

cov (x,y) sd (x) quantile (x) cor (x,y)

�2

= Soglia d’errore

Z 4

2(2 + x

2 + x)dx

Page 3: Appunti statistica

sabato 21 giugno 2014

Errore standard e limiti di fiducia (t student)!

Nella pratica, l'errore standard serve per calcolare l'intervallo fiduciale o intervallo di confidenza (sinonimo: limiti fiduciali) della proporzione. L'intervallo di confidenza è l'intervallo di valori entro i quali si stima che cada, con un livello di probabilità scelto a piacere, il valore vero della popolazione. In realtà si sceglie quasi sempre un livello di probabilità di 0.95 o, più raramente, 0.99, ottenendo rispettivamente l'intervallo di confidenza al 95% o al 99%.!

!

!!!!!

Es.!

Si consideri una variabile normale. Nel corso di un esperimento tale variabile viene misurata 10 volte. la media del campione è 12 e la deviazione standard campionaria è 2. L’intervallo di confidenza al 95% per la media della variabile è:!

! 2/sqrt(x=10)= 0.63 ! 12+2.26*0.63=13.42 ! 12-2.26*0.63= 10.57!

Quindi l’intervallo di confidenza al 95% per la media della variabile è da 10.57 a 13.42.!

Distribuzione normale!

• ha due parametri, μ e σ, che corrispondono al valore atteso e alla deviazione standard;!

• presenta una tipica forma a campana;!

• è simmetrica intorno alla media, ovvero X=μ; la media coincide con il massimo della distribuzione (ricordiamo, moda) e con il punto che i valori della variabile casuale in due regioni di uguale probabilità (ricordiamo, mediana).!

• il valore massimo della distribuzione nel punto è i n v e r s a m e n t e proporzionale alla deviazione standard. !

• la curva è tanto più appiattita quanto maggiore è il valore della deviazione standard.!

�3

La media è composta da deviazione standard diviso la radice del numero di dati campione.

t è un coefficiente desumibile dalla «Tabella dei valori t per la distribuzione di Student». Nell’uso della tabella, devi tener conto che i gradi di libertà si calcolano come: numerosità del campione - 1.

Page 4: Appunti statistica

sabato 21 giugno 2014

Variabile normale!

si consideri una variabile normale con valore atteso μ=8 e deviazione standard σ=3. Con quale probabilità il valore X risulta compreso tra 7.8 e 8.2?!

Dove x è il valore compreso!

!Quindi:!

Compiere l’operazione per entrambi i valori, sommarli e vedere il corrispettivo sulla tabella gaussiana.!

0.06 —> equivale a 0.0239 (*2) 0.0478, quindi 47,8%!

�4

Z1x� µ

Z18.2� 8

3=0.2

3=0.06