Appunti statistica
-
Upload
fionamurtaj -
Category
Documents
-
view
4 -
download
1
description
Transcript of Appunti statistica
sabato 21 giugno 2014
Risoluzione esercizi di statistica con R!
Frequenza relativa:!- Creo l’array con i dati all’interno:!
! x<-c(X1, X2, X3,…, X10)!
- Creo la funzione:!
! bond=seq(da n° di inizio, a n° finale, by=n)!
- Es.Se ho 10 dati e voglio la frequenza relativa da 0 a 25:bond=seq(0,25, by=25)ciò mi permetterà di fare la frequenza relativa del valori da 0 a 25:table(cut(x,bond)) / n° di dati di X!
Gradi di libertà!
In una tabella di contingenza da R righe ed S colonne, i gradi di libertà (test chi-quadro) sono:!
! (n° di righe - 1)*(n° di colonne -1)!
Regressione lineare (retta)!- Creo il set di dato:!
! x<-c(X1, X2, X3,…, X10)! y<-c(Y1, Y2, Y3,…, Y10)! modello= lm(formula=x~y)!
Test Chi-quadro!
Per ottenere il test del chi-quadro creo un array con il set di dati fornito:!
! x=c(…………)! chisq.test (x)!
Covarianza, Deviazione standard, Quantili, quartini, Correlazione varianza-covarianza!
Innanzitutto creo i set di dati:!
�1
N.B. Il simbolo “~” si scrive premendo ALT + 926 su Windows e ALT + 5 su OSX
sabato 21 giugno 2014x<-c(X1, X2, X3,…, X10)y<-c(Y1, Y2, Y3,…, Y10)!
Dopodiché darò i seguenti comandi:!
Se il set di dati è composto da dati ripetuti, la tabella verrà popolata aggiungendo il comando:!
rep(n, n ripetizioni)!
Es.!
rip_tab <-c(rep(5,111),rep(8,271))!
tramite questo comando ho popolato la tabella “rip_tab” con il numero 5 ripetuto 111 volte ed il numero 8 ripetuto 271 volte; successivamente è possibili utilizzare i comandi riportati sopra.!
Metodo dei rettangoli!
Dato un integrale, prendo il valore più alto e lo inserisco in un array “a”, il valore più piccolo in un array “b” ed uso la seguente formula:!
! (b-a)*(f(b)-f(a) !
! n!
! ! ! ! ! ! ! ! Dove a=4 e b=2!
In R sarà:!
! a<-c(4)!
! b<-c(2)!
Sostituisco la x ad a, quindi:!
! Fa<-c(2+(a^2)+a)!
! Fb<-c(2+(b^2)+a)!
! ((b-a)*(Fa-Fb)/n Dove n= n° dei rettangoli per avere una data soglia d’errore!
Covarianza Deviazione standard Quantili e quartili Correlazione varianza-covarianza
cov (x,y) sd (x) quantile (x) cor (x,y)
�2
= Soglia d’errore
Z 4
2(2 + x
2 + x)dx
sabato 21 giugno 2014
Errore standard e limiti di fiducia (t student)!
Nella pratica, l'errore standard serve per calcolare l'intervallo fiduciale o intervallo di confidenza (sinonimo: limiti fiduciali) della proporzione. L'intervallo di confidenza è l'intervallo di valori entro i quali si stima che cada, con un livello di probabilità scelto a piacere, il valore vero della popolazione. In realtà si sceglie quasi sempre un livello di probabilità di 0.95 o, più raramente, 0.99, ottenendo rispettivamente l'intervallo di confidenza al 95% o al 99%.!
!
!!!!!
Es.!
Si consideri una variabile normale. Nel corso di un esperimento tale variabile viene misurata 10 volte. la media del campione è 12 e la deviazione standard campionaria è 2. L’intervallo di confidenza al 95% per la media della variabile è:!
! 2/sqrt(x=10)= 0.63 ! 12+2.26*0.63=13.42 ! 12-2.26*0.63= 10.57!
Quindi l’intervallo di confidenza al 95% per la media della variabile è da 10.57 a 13.42.!
Distribuzione normale!
• ha due parametri, μ e σ, che corrispondono al valore atteso e alla deviazione standard;!
• presenta una tipica forma a campana;!
• è simmetrica intorno alla media, ovvero X=μ; la media coincide con il massimo della distribuzione (ricordiamo, moda) e con il punto che i valori della variabile casuale in due regioni di uguale probabilità (ricordiamo, mediana).!
• il valore massimo della distribuzione nel punto è i n v e r s a m e n t e proporzionale alla deviazione standard. !
• la curva è tanto più appiattita quanto maggiore è il valore della deviazione standard.!
�3
La media è composta da deviazione standard diviso la radice del numero di dati campione.
t è un coefficiente desumibile dalla «Tabella dei valori t per la distribuzione di Student». Nell’uso della tabella, devi tener conto che i gradi di libertà si calcolano come: numerosità del campione - 1.
sabato 21 giugno 2014
Variabile normale!
si consideri una variabile normale con valore atteso μ=8 e deviazione standard σ=3. Con quale probabilità il valore X risulta compreso tra 7.8 e 8.2?!
Dove x è il valore compreso!
!Quindi:!
Compiere l’operazione per entrambi i valori, sommarli e vedere il corrispettivo sulla tabella gaussiana.!
0.06 —> equivale a 0.0239 (*2) 0.0478, quindi 47,8%!
�4
Z1x� µ
�
Z18.2� 8
3=0.2
3=0.06