Statistica descrittiva - Università degli Studi della …oldPassoPasso 22: Determinare l’ampiezza...
Transcript of Statistica descrittiva - Università degli Studi della …oldPassoPasso 22: Determinare l’ampiezza...
Statistica descrittiva
a.a. 2011/12 - Laboratorio
Problema: assegnato un insieme di valori numerici che restituisce il tempo di vita
di un prototipo, quale modello stocastico è possibile impiegare per descrivere il
tempo di vita del prototipo messo poi in produzione? Come è possibile validare
tale modello?
Popolazione: (insieme dei dispositivi che verranno messi in produzione) insieme
Dataset: collegarsi al sito http://www.unibas.it/utenti/dinardo/tempi.txt
Salvare il file in matlab/work
Popolazione: (insieme dei dispositivi che verranno messi in produzione) insieme
finito o infinito sul quale si desidera avere informazioni.
Campione casuale: (prototipi) sottoinsieme della popolazione scelta in modo casuale.
Unità statistica o campionaria: (un prototipo) un elemento del campione casuale
Taglia del campione: (numero di prototipi realizzati) numero di unità statistiche
Descrizione per via graficaDescrizione per via grafica Descrizione per via numericaDescrizione per via numerica
a.a. 2011/12 - Laboratorio
Statistica descrittiva
Primo obbiettivo: Costruire una tabella riassuntiva del tipo:
Età in mesi Frequenza dei guasti
0-26.9877 127
26.9877-54.9877 70
54.9877-82.9877 27
82.9877- 110.9877 15
110.9877-138.9877 11
138.9877-166.9877 7
166.9877-194.9877 3
194.9877-222.9877 1
222.9877-250.9877 1
TOTALE 262
Distribuzione di frequenza assoluta
TOTALE 262
a.a. 2011/12 - Laboratorio
Frequenza assoluta: numero di unità statistiche che presentano la modalità x o
la cui modalità appartiene alla classe individuata.
Modalità o classe di modalità: i diversi modi con cui il carattere si presenta
nelle unità statistiche della popolazione (e quindi del campione)
Carattere: ogni aspetto elementare oggetto di rilevazione nelle unità statistiche
della popolazione (e quindi del campione)
?
PassoPasso 11:: Decidere il numero delle classi usando
la formula
22kk > n> ndove k=numero di classi
n=taglia del campione
In questo caso k=9, perché 2^9=512
dove H=massimo valore, L=minimo valore
PassoPasso 22: Determinare l’ampiezza della classe, o ilpeso, con la formula
Max Max –– MinMinkk
h >(249.84- 0.1263)/9=27.74
a.a. 2011/12 - Laboratorio
PassoPasso 33: Determinare i limiti di ciascuna classe
Siccome 28*9=252>249.7227, la quantità 252-249.7227= 2.2773 va equamente ri-
partita a sinistra del minimo e a destra del massimo.
Ossia min(tempi)-1.1386 = -1.0123 e max(tempi)+1.1386= 250.9876
Prima classa è ( -1.0123, -1.0123+28 = 26.9877]
Seconda classe è (26.9877, 26.9877 +28 = ….]
In Matlab: >> x(1)= -1.0123;In Matlab: >> x(1)= -1.0123;
>> for i=2:10
x(i)=x(i-1)+ 28;
end
>> x
x =
-1.0123 26.9877 54.9877 82.9877 110.9877 138.9877 166.9877 194.9877 222.9877 250.9877
a.a. 2011/12 - Laboratorio
PassoPasso 44: Contare il numero di dati contenuti in
ciascuna classe
Usare la function histc(tempi,x)
>>n= histc(tempi,x)
n =
1271277027151173110
Numero di dati del c.c. checoincidono con l’ultimo estremo
a.a. 2011/12 - Laboratorio
Pertanto la distribuzione di frequenza risulta essere
Età in mesi Frequenza dei guasti
0-26.9877 127
26.9877-54.9877 70
54.9877-82.9877 27
82.9877- 110.9877 15
110.9877-138.9877 11
138.9877-166.9877 7
Sia per la costruzione
dei grafici che per il
calcolo degli indici può
tornare utile…
166.9877-194.9877 3
194.9877-222.9877 1
222.9877-250.9877 1
PuntoPunto mediomedio delladella classeclasse: massimo + minimo
2
a.a. 2011/12 - Laboratorio
Costruire un vettore contenente i centri delle classi:
>> c(1)=(x(1)+x(2))/2;>> for i=2:9c(i)=c(i-1)+28;end
>> c
c =
12.9877 40.9877 68.9877 96.9877 124.9877 152.9877 180.9877 208.9877 236.9877
Con I centri va usata la function >> [n,xout]=hist(tempi,c)
>> [n,xout]=hist(tempi,c)
n =
127 70 27 15 11 7 3 1 1
xout =
12.9877 40.9877 68.9877 96.9877 124.9877 152.9877 180.9877 208.9877 236.9877
a.a. 2011/12 - Laboratorio
La DistribuzioneDistribuzione didi FrequenzaFrequenza relativarelativa mostra la
percentuale di osservazioni in ciascuna classe.
Per costruirla, bisogna dvidere il parametro di output n di hist per la taglia del campione:
>> fr=n/262
fr =
0.4847 0.2672 0.1031 0.0573 0.0420 0.0267 0.0115 0.0038 0.0038
>> sum(fr)
ans =
1.0000
a.a. 2011/12 - Laboratorio
Quale proprietà caratterizza una distribuzione di
frequenza relativa?
Quando è opportuno usare la distribuzione di
frequenza relativa?
Un Istogramma è un grafico in cui i punti medi
delle classi sono riportati sull’asse orizzontale
(assieme agli estremi eventualmente) e le frequenze
I 3 grafici comunemente usati sono
IstogrammiIstogrammi, , PoligoniPoligoni didi frequenzafrequenza e
DistribuzioneDistribuzione didi FrequenzaFrequenza cumulativacumulativa.
(assieme agli estremi eventualmente) e le frequenze
associate a ciascuna classe sono riportate sull’asse
verticale. Le frequenze forniscono l’altezza delle
barre che insistono sui punti medi e vengono
disegnate una di fianco all’altro.
a.a. 2011/12 - Laboratorio
Si può utilizzare la function hist(tempi,c) oppure bar(c,n)
60
80
100
120
140
-50 0 50 100 150 200 250 3000
20
40
a.a. 2011/12 - Laboratorio
Per le frequenze relative bar(c,fr)
0.25
0.3
0.35
0.4
0.45
0.5
0 50 100 150 200 2500
0.05
0.1
0.15
0.2
0.25
Qualche didascalia…
a.a. 2011/12 - Laboratorio
>> title('Frequenze relative')>> xlabel('Tempo di vita del prototipo')>> text(200,0.45,'Istogramma')
0.35
0.4
0.45
0.5Frequenze relative
Istogramma
0 50 100 150 200 2500
0.05
0.1
0.15
0.2
0.25
0.3
Tempo di vita del prototipo
a.a. 2011/12 - Laboratorio
Le barre si toccano
-50 0 50 100 150 200 250 3000
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5
Barre orizzontali>> bar(c,fr,1)
0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5-50
0
50
100
150
200
250
300
>> barh(c,fr,1)
-50
0
50
100
150
200
250
300
0
0.1
0.2
0.3
0.4
0.5
>> bar3(c,fr,1,'r')
Grafici 3-D
a.a. 2011/12 - Laboratorio
Un PoligonoPoligono didi frequenzafrequenza consiste di pezzi di linea
retta che collegano i punti medi delle classi alle rispettive
frequenze.
0.3
0.35
0.4
0.45
0.5
>> plot(c,fr,'--rs')
0 50 100 150 200 2500
0.05
0.1
0.15
0.2
0.25
0.3
a.a. 2011/12 - Laboratorio
IN MATLAB – La function plot
Vari tipi di grafici e vari colori possono caratterizzare I vostri grafici. PLOT(X,Y,S) dove S è una stringa di caratteri costruita con uno, due
o tre elementi, presi ciascuno dalla seguente colonna:
b blu . punto - linea continuag verde o cerchio : a puntir rosso x x -. a punti e linee c fosfor. + piu’ -- doppio tratteggio m magenta * stellay giallo s quadratok nero d rombo
v triangolo (su)^ triangolo (giu’)< triangolo (sinistra)> triangolo (destra)p pentagrammah esagramma
a.a. 2011/12 - Laboratorio
Una
DistribuzioneDistribuzione didiFrequenzaFrequenzacumulativacumulativa è
usata per determinare quantio quale percentuale
Sul piano cartesiano si
riportano i dati del c.c.
ordinati in senso cre-
scente. Le ordinate sono
o quale percentualedi valori del campione sono al di sotto (o uguali) ad un prefissatovalore.
n
xxF
(i)
i
≤=
dati di numero)( )(
a.a. 2011/12 - Laboratorio
Per effettuare un grafico della distribuzione di frequenza cumulativa, si può usare la function cdfplot:
0.7
0.8
0.9
1Empirical CDF
>> cdfplot(tempi)
0 50 100 150 200 2500
0.1
0.2
0.3
0.4
0.5
0.6
x
F(x
)
a.a. 2011/12 - Laboratorio
Problema: Supponiamo che i dati siano stati raccolti in forma tabellare. Come è possibile costruire allora le distribuzioni di frequenze assolute? Quelle delle distribuzioni di frequenze relative? E quelle cumulative?
Età in mesi Frequenza dei guasti
0-26.9877 127
26.9877-54.9877 70
54.9877-82.9877 27
82.9877- 110.9877 1582.9877- 110.9877 15
110.9877-138.9877 11
138.9877-166.9877 7
166.9877-194.9877 3
194.9877-222.9877 1
222.9877-250.9877 1
a.a. 2011/12 - Laboratorio
Per costruire un poligono di frequenza cumulativa
raggruppato, rappresentare il limite superiore di
ciascuna classe sull’asse delle X e la corrispondente
frequenza cumulata lungo l’asse delle Y.
DistribuzioneDistribuzione didi frequenzafrequenza cumulativacumulativa
raggruppataraggruppata per per classiclassi
≤
n
sup dati di numero esima,-i classe sup
a.a. 2011/12 - Laboratorio
( )1
1 1
Se la classe -esima risulta essere ( , ) rappresentare le coppie
( , )
i i
i i
i x x
x F x
+
+ +
Intanto per le ordinate è possibile usare la function cumsum
>> y=cumsum(n)/262
y =
0.4847 0.7519 0.8550 0.9122 0.9542 0.9809 0.9924 0.9962 1.0000
…E poi la function stairs….
0.9
1
0 50 100 150 200 250 3000.4
0.5
0.6
0.7
0.8
0.9
>> stairs(x(2:10),y)
a.a. 2011/12 - Laboratorio
Con l’ausilio di questi grafici, è possibile “ipotizzare” un modello stocastico per descrivere il tempo di vita del dispositivo.
0.2
0.25
0.3
0.35
0.4
0.45
0.5 Ad esempio: prendiamo il poligono di frequenza.
Ricorda qualcuna delle
densità che avete
visto?
0 50 100 150 200 2500
0.05
0.1
0.15
0.2
disttool
Perché f(0) sono diverse?
a) Servono dei metodi per individuare i parametri….
b) Serve un metodo per confrontare PDF con poligoni di frequenza…
a.a. 2011/12 - Laboratorio
La Media Media aritmeticaaritmetica è
l’indice di posizione
maggiormente impiegato e
mostra il valore centrale dei
dati.
Principali caratteristiche:
>>mean(tempi)
1
1 n
i
i
x xn =
= ∑
�Richiede dati di tipo numerico.
�Vengono usati tutti i valori.
�E’ unica.
�La somma delle distanze dalla media è 0.
Principali caratteristiche:
a.a. 2011/12 - Laboratorio
[ ]( ) (3 5) (8 5) (4 5) 0i
x xΣ − = − + − + − =
Si consideri il seguente insieme di
dati: 3, 8, e 4. La mediamedia è 5.
Si consideri ora il seguente insieme di
dati: 3, 8, 1000. La mediamedia è 337.
a.a. 2011/12 - Laboratorio
La media campionaria non è un indicatore robusto…Ossia può falsare le informazioni.
Cosa succede se i dati sono già in forma tabellare? Come viene calcolata la media campionaria?
Età in mesi Frequenza dei guasti
0-26.9877 127
26.9877-54.9877 70
54.9877-82.9877 27
82.9877- 110.9877 15
110.9877-138.9877 11
138.9877-166.9877 7138.9877-166.9877 7
166.9877-194.9877 3
194.9877-222.9877 1
222.9877-250.9877 1
Si usa la formula
1
1 k
i i
i
x c nn =
= ∑ >> media=sum(c.*n)/262
media = 43.0182Confronta con
> mean(tempi) ans = 42.0714a.a. 2011/12 - Laboratorio
Al di sotto e al di sopra della mediana deve comparire lo stesso numero di dati.
La MedianaMediana è il punto
medio dei valori del
campione, una volta messi
in ordine crescente.
La mediana
numero di dati.
Per un insieme pari di valori, la mediana è la media aritmetica dei due valori di posto n/2 e (n+1)/2 nel
campione ordinato
A quale tipo di dati si applica?
a.a. 2011/12 - Laboratorio
L’età di un campione di 5 studenti universitari è:
21, 25, 19, 20, 22.
Ordinando i dati in ordine crescente:
19, 20, 21, 22, 25.
La mediana è 21.
a.a. 2011/12 - Laboratorio
Ordinando i dati in
ordine crescente:
L’altezza di 4 giocatori di basket (in pollici) è:
76, 73, 80, 75.
73, 75, 76, 80
Allora la mediana è 75.5.
La mediana si trova
al posto (n+1)/2 =
(4+1)/2 =2.5th
a.a. 2011/12 - Laboratorio
�La mediana è unica per ogni insieme di dati.
�La mediana è una statistica robusta.
�Può essere calcolata anche per dati raggruppati.
Proprietà della Mediana
>>>> median(tempi)0.45
0.5
ans =
28.9202
0 50 100 150 200 2500
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
a.a. 2011/12 - Laboratorio
Cosa ci dice il confrontocon la media, 43.01?
2
nCF
Mediana L hf
−
= +
La MedianaMediana di un campione di dati organizzati in
distribuzione di frequenza è calcolata con la
seguente formula:
?
dove L è il minimo della classe cui la mediana
appartiene, CF è la frequenza cumulata nell’estremo
destro della classe, f è la frequenza della classe cui
la mediana appartiene e h è l’ampiezza della classecui la mediana appartiene .
a.a. 2011/12 - Laboratorio
Per calcolare la mediana di dati raggruppati
Costruire una distribuzione di frequenza cumulata.
Dividere la taglia del campione per 2.
Determinare quale classe contiene questo valore. Ad
esempio se n=262, 262/2 = 131, allora determinare
quale classe contiene il valore di posto 131.quale classe contiene il valore di posto 131.
Età in mesi Frequenza dei guasti
0-26.9877 127
26.9877-54.9877 197
54.9877-82.9877 224
82.9877- 110.9877 239
110.9877-138.9877 250
138.9877-166.9877 257
166.9877-194.9877 260
194.9877-222.9877 261
222.9877-250.9877 262
TOTALE 262a.a. 2011/12 - Laboratorio
Età in mesi Frequenza dei guasti
0-26.9877 127
26.9877-54.9877 197
54.9877-82.9877 224
82.9877- 110.9877 239
110.9877-138.9877 250
138.9877-166.9877 257
166.9877-194.9877 260
194.9877-222.9877 261
222.9877-250.9877 262
TOTALE 262
2
nCF
Mediana L hf
−
= +
L=26.9877, n=262, f=70,
i=28, CF=127
>> 26.9877+(262/2-127)/70*28
dove L è il minimo della classe cui la mediana
appartiene, CF è la frequenza cumulata che precede
quella della classe cui la mediana appartiene, f è la
frequenza della classe cui la mediana appartiene e i è
l’ampiezza della classe cui la mediana appartiene .
>> 26.9877+(262/2-127)/70*28
ans = 28.5877
a.a. 2011/12 - Laboratorio
Esempio 6Esempio 6:: I punteggi di un esame per 10 studenti
sono i seguenti (in centesimi) : 81, 93, 84, 75, 68, 87,
81, 75, 81, 87. Poichè il punteggio 81 appare più
La ModaModa è un altro indice di posizione e rappresenta
il valore del campione casuale che appare più frequentemente.
La moda
81, 75, 81, 87. Poichè il punteggio 81 appare più
frequentemente di tutti gli altri, è la moda.
Un campione può avere anche più di una moda: se ne
ha due si parla di campione bimodale, se ne ha tre si
parla di campione trimodale e così via.
La ModaModa per dati raggruppati è approssimativamente il
punto medio della classe con frequenza più grande
Asimmetria nulla Media
=Mediana
=Moda
Le posizioni relative di Media, Mediana, e Moda in una
Distribuzione simmetrica
Mode
Median
Mean
• Con coda destra (asimmetria positiva): Media e mediana sono
a destra della moda.
Media>Mediana>Moda
Le posizioni relative di Media, Mediana, e Moda in una
distribuzione asimmetrica con coda destra
Mode
Median
Mean
Con coda sinistra (asimmetria negativa): Media e Mediana sono a
sinistra della Moda.
Media<Mediana<Moda
Le posizioni relative di Media, Mediana, e Moda in
una distribuzione asimmetrica con coda sinistra
ModeMean
Median
IN MATLAB – Calcolo coefficiente di asimmetria
>> primo=[1;2*ones(2,1);3*ones(3,1);4*ones(4,1);5*ones(5,1);
6*ones(6,1);7*ones(7,1)];
>>hist(primo,[1,2,3,4,5,6,7])
>>secondo=[ones(7,1);2*ones(6,1);3*ones(5,1);4*ones(4,1);
5*ones(3,1);6*ones(2,1);7]
>>hist(secondo,[1,2,3,4,5,6,7])
>>[mean(primo),mean(secondo),median(primo),median(secondo)]
ans =
5 3 5 3
>> skewness(primo)
ans =ans =
-0.5774
>> skewness(secondo)
ans =
0.5774
DispersioneDispersione= variabilità o
diffusione dei
dati
0
5
10
15
20
25
30
0 2 4 6 8 10 12
Misure di dispersione sono: range, range, varianzavarianza e e
deviazionedeviazione standardstandard.
Misure di dispersione
>> range=max(tempi)-min(tempi)
range =
249.7227
VarianzaVarianza:: la
media aritmetica
dei quadrati delle
Range Range = Massimo – Minimo
>> var(tempi)
ans =dei quadrati delle
deviazioni dalla
media.
DeviazioneDeviazione
standardstandard:Radice quadrata
della varianza.
1.7873e+003
std(tempi)
ans =
42.2759
Varianza campionaria (sVarianza campionaria (s22))
2 2
1
1( )
( 1)
n
i
i
s x xn =
= −−∑
Deviazione standard campionaria (s)Deviazione standard campionaria (s)
2ss =
Varianza e Deviazione standard campionarie
Regola empirica Regola empirica : Per ogni distribuzione
simmetrica a forma di campana risulta
�Circa il 68% delle osservazioni distano dalla media
meno di 1 una volta la deviazione standard.
3- 43
�Circa il 95% delle osservazioni distano dalla media
meno di 2 volte la deviazione standard.
�Virtualmente tutte le osservazioni distano dalla
media meno di 3 volte la deviazione standard.
Interpretazione e uso della
deviazione standard
. e trarelazione la mostra che campana di forma a Curva µσ
68%
3- 44
µµµµ−−−−3σ3σ3σ3σ µµµµ−−−−2σ2σ2σ2σ µµµµ−−−−1σ1σ1σ1σ µµµµ µ+1σµ+1σµ+1σµ+1σ µ+2σµ+2σµ+2σµ+2σ µ+ 3µ+ 3µ+ 3µ+ 3σσσσ
68%
95%
99.7%
In genere se s<< range/4 i dati sono concentrati attorno alla media campionaria
Curtosi di una distribuzione =
Maggiore o minore appuntimento della curva
CURTOSICURTOSI
Indice di Curtosi
32
2
42 −=
m
mγ
>> kurtosis(tempi)-3
ans =
3.5747
<
=
>
piatte onidistribuziper 0
gaussiana onedistribuzi laper 0
appuntite onidistribuziper 0
2
2
2
γ
γ
γ
Coefficiente di variazione
Una proprietà desiderabile per un indice di variabilità è che non dipenda dall’unità di misura in cui è espresso il carattere.
Es: altezza di 5 studenti: 172, 175, 176, 178, 180
La media risulta essere 176,2 cm e la dev standard risulta essere 2,71.
Se esprimiamo in metri, la media diviene 1,762 e la dev.standard 0,0271.
a.a. 2011/12 - Laboratorio
Esempio: Un processo industriale produce bustine di camomilla del peso mediodi 2 grammi. La dev. standard è 0,034. Un secondo processo industriale produ-ce confezioni di pasta alimentare del peso di 500 grammi. La dev. standard è 2.7. Quale tra i due processi è più “preciso”?
Questa comparazione può essere effettuata in modo appropriato esprimendo la
deviazione standard di ciascun processo come percentuale della rispettiva media.
0.034 2.7100 1.7 100 0.5
2 500× = × =
96
92
91
88
86
85
12
11
1098
750esimo percentile: Mediana
Media tra la sesta e la settima
75esimo percentile
Media tra la nona e la decima
osservazione = (88 + 91)/2 = 89.5
Q3
Q4
85
84
83
82
79
78
69
765
432
1
25esimo percentile
Media tra la terza e la quarta osservazio-
ne = (79 + 82)/2 = 80.5
Media tra la sesta e la settima
osservazione = (84+85)/2 = 84.5
Q1
Q2
IN MATLAB
>> prctile(tempi,25), prctile(tempi,50), prctile(tempi,75)
ans =
12.5160
ans =
a.a. 2011/12 - Laboratorio
ans =
28.9202
ans =
53.5340
Il campo interquartile
(o intervallo
interquartile) è la
differenza tra il III
quartile Q3 e il I
quartile Q1.
Questa distanza
ingloba il 50% delle
informazioni.
Campo interquartile = Q3 - Q1
>> prctile(tempi,75) - prctile(tempi,25)
ans =
41.0180
>> iqr(tempi)
ans =
41.0180
5 dati sono necessari alla
Un box plot è un grafico che aiuta a descrivere le caratteristiche qualitative
di un insieme di dati.
necessari alla costruzione:
il minimo:
il I quartile;
la mediana;
il III quartile;
il massimo.
Basandosi su un campione di 20 consegne,
Buddy’s Pizza determina la seguente informazione. Il
minimo tempo impiegato per la consegna è 13 minuti ed il massimo tempo impiegato è massimo tempo impiegato è 30 minuti. Il I quartile vale 15 minuti, la mediana 18 ed il III
quartile vale 22 minuti. Costruire un box plot per il
tempo di consegna.
Q1 Q3MaxMin Median
12 14 16 18 20 22 24 26 28 30 32
100
150
200
250
Valu
es
IN MATLAB: >> boxplot(tempi)
a.a. 2011/12 - Laboratorio
1
0
50
Column Number
a.a. 2011/12 - Laboratorio
ESERCITAZIONE
Tempi di attesa ad un centralino telefonico. Tempi di attesa ad un centralino telefonico. Tempi di attesa ad un centralino telefonico. Tempi di attesa ad un centralino telefonico. >> load >> load >> load >> load ---- ascii esempio3 ascii esempio3 ascii esempio3 ascii esempio3
1. Costruire l’istogramma (n=?) >> 2^7
ans =
128
2. Costruire il vettore contenente gli estremi delle classi2. Costruire il vettore contenente gli estremi delle classi
>> campo=max(es3)>> campo=max(es3)>> campo=max(es3)>> campo=max(es3)----min(es3), amp=campo/7min(es3), amp=campo/7min(es3), amp=campo/7min(es3), amp=campo/7>> amp=0.7>> amp=0.7>> amp=0.7>> amp=0.7>> % minimo dei tempi=0 >> % minimo dei tempi=0 >> % minimo dei tempi=0 >> % minimo dei tempi=0 >>x(1)=0.0, >>x(1)=0.0, >>x(1)=0.0, >>x(1)=0.0, for i=2:8for i=2:8for i=2:8for i=2:8x(i)=x(ix(i)=x(ix(i)=x(ix(i)=x(i----1)+amp;1)+amp;1)+amp;1)+amp;endendendend
3.3.3.3. Distribuzione di frequenzaDistribuzione di frequenzaDistribuzione di frequenzaDistribuzione di frequenza
>> histc(es3,x)>> histc(es3,x)>> histc(es3,x)>> histc(es3,x)
ans =ans =ans =ans =
525252522727272713131313111111113333222222220000
4. Istogramma
>>c=(x(1:7)+x(2:8))/2>>c=(x(1:7)+x(2:8))/2>>c=(x(1:7)+x(2:8))/2>>c=(x(1:7)+x(2:8))/2>>hist(es3,c)>>hist(es3,c)>>hist(es3,c)>>hist(es3,c)
5.5.5.5. Poligono di frequenzaPoligono di frequenzaPoligono di frequenzaPoligono di frequenza
>> n=hist(es3,c)/30;>> n=hist(es3,c)/30;>> n=hist(es3,c)/30;>> n=hist(es3,c)/30;>> plot(c,n,'r*>> plot(c,n,'r*>> plot(c,n,'r*>> plot(c,n,'r*--------')')')')>> title('Poligono di frequenza')>> title('Poligono di frequenza')>> title('Poligono di frequenza')>> title('Poligono di frequenza')
>> loc=[median(es3), mode(es3), mean(es3)]
loc =
0.6558 1.0117 0.9621
6.6.6.6. Indici statisticiIndici statisticiIndici statisticiIndici statistici
>> disp=[iqr(es3), range(es3), var(es3), std(es3)]>> disp=[iqr(es3), range(es3), var(es3), std(es3)]
disp =
0.9001 4.6074 0.6691 0.9468
>> altri=[skewness(es3), kurtosis(es3), loc(3)/disp(5)]altri =
2.0133 7.3505 1.0161
7. Box Plot
>> boxplot(es3)
OUTLIERS
>> [max(es3),min(es3)]ans =
4.6191 0.0117
>> cdfplot(es3)
8. Cumulativa empirica