Statistica descrittiva - Università degli Studi della …oldPassoPasso 22: Determinare l’ampiezza...

Post on 25-Aug-2020

3 views 0 download

Transcript of Statistica descrittiva - Università degli Studi della …oldPassoPasso 22: Determinare l’ampiezza...

Statistica descrittiva

a.a. 2011/12 - Laboratorio

Problema: assegnato un insieme di valori numerici che restituisce il tempo di vita

di un prototipo, quale modello stocastico è possibile impiegare per descrivere il

tempo di vita del prototipo messo poi in produzione? Come è possibile validare

tale modello?

Popolazione: (insieme dei dispositivi che verranno messi in produzione) insieme

Dataset: collegarsi al sito http://www.unibas.it/utenti/dinardo/tempi.txt

Salvare il file in matlab/work

Popolazione: (insieme dei dispositivi che verranno messi in produzione) insieme

finito o infinito sul quale si desidera avere informazioni.

Campione casuale: (prototipi) sottoinsieme della popolazione scelta in modo casuale.

Unità statistica o campionaria: (un prototipo) un elemento del campione casuale

Taglia del campione: (numero di prototipi realizzati) numero di unità statistiche

Descrizione per via graficaDescrizione per via grafica Descrizione per via numericaDescrizione per via numerica

a.a. 2011/12 - Laboratorio

Statistica descrittiva

Primo obbiettivo: Costruire una tabella riassuntiva del tipo:

Età in mesi Frequenza dei guasti

0-26.9877 127

26.9877-54.9877 70

54.9877-82.9877 27

82.9877- 110.9877 15

110.9877-138.9877 11

138.9877-166.9877 7

166.9877-194.9877 3

194.9877-222.9877 1

222.9877-250.9877 1

TOTALE 262

Distribuzione di frequenza assoluta

TOTALE 262

a.a. 2011/12 - Laboratorio

Frequenza assoluta: numero di unità statistiche che presentano la modalità x o

la cui modalità appartiene alla classe individuata.

Modalità o classe di modalità: i diversi modi con cui il carattere si presenta

nelle unità statistiche della popolazione (e quindi del campione)

Carattere: ogni aspetto elementare oggetto di rilevazione nelle unità statistiche

della popolazione (e quindi del campione)

?

PassoPasso 11:: Decidere il numero delle classi usando

la formula

22kk > n> ndove k=numero di classi

n=taglia del campione

In questo caso k=9, perché 2^9=512

dove H=massimo valore, L=minimo valore

PassoPasso 22: Determinare l’ampiezza della classe, o ilpeso, con la formula

Max Max –– MinMinkk

h >(249.84- 0.1263)/9=27.74

a.a. 2011/12 - Laboratorio

PassoPasso 33: Determinare i limiti di ciascuna classe

Siccome 28*9=252>249.7227, la quantità 252-249.7227= 2.2773 va equamente ri-

partita a sinistra del minimo e a destra del massimo.

Ossia min(tempi)-1.1386 = -1.0123 e max(tempi)+1.1386= 250.9876

Prima classa è ( -1.0123, -1.0123+28 = 26.9877]

Seconda classe è (26.9877, 26.9877 +28 = ….]

In Matlab: >> x(1)= -1.0123;In Matlab: >> x(1)= -1.0123;

>> for i=2:10

x(i)=x(i-1)+ 28;

end

>> x

x =

-1.0123 26.9877 54.9877 82.9877 110.9877 138.9877 166.9877 194.9877 222.9877 250.9877

a.a. 2011/12 - Laboratorio

PassoPasso 44: Contare il numero di dati contenuti in

ciascuna classe

Usare la function histc(tempi,x)

>>n= histc(tempi,x)

n =

1271277027151173110

Numero di dati del c.c. checoincidono con l’ultimo estremo

a.a. 2011/12 - Laboratorio

Pertanto la distribuzione di frequenza risulta essere

Età in mesi Frequenza dei guasti

0-26.9877 127

26.9877-54.9877 70

54.9877-82.9877 27

82.9877- 110.9877 15

110.9877-138.9877 11

138.9877-166.9877 7

Sia per la costruzione

dei grafici che per il

calcolo degli indici può

tornare utile…

166.9877-194.9877 3

194.9877-222.9877 1

222.9877-250.9877 1

PuntoPunto mediomedio delladella classeclasse: massimo + minimo

2

a.a. 2011/12 - Laboratorio

Costruire un vettore contenente i centri delle classi:

>> c(1)=(x(1)+x(2))/2;>> for i=2:9c(i)=c(i-1)+28;end

>> c

c =

12.9877 40.9877 68.9877 96.9877 124.9877 152.9877 180.9877 208.9877 236.9877

Con I centri va usata la function >> [n,xout]=hist(tempi,c)

>> [n,xout]=hist(tempi,c)

n =

127 70 27 15 11 7 3 1 1

xout =

12.9877 40.9877 68.9877 96.9877 124.9877 152.9877 180.9877 208.9877 236.9877

a.a. 2011/12 - Laboratorio

La DistribuzioneDistribuzione didi FrequenzaFrequenza relativarelativa mostra la

percentuale di osservazioni in ciascuna classe.

Per costruirla, bisogna dvidere il parametro di output n di hist per la taglia del campione:

>> fr=n/262

fr =

0.4847 0.2672 0.1031 0.0573 0.0420 0.0267 0.0115 0.0038 0.0038

>> sum(fr)

ans =

1.0000

a.a. 2011/12 - Laboratorio

Quale proprietà caratterizza una distribuzione di

frequenza relativa?

Quando è opportuno usare la distribuzione di

frequenza relativa?

Un Istogramma è un grafico in cui i punti medi

delle classi sono riportati sull’asse orizzontale

(assieme agli estremi eventualmente) e le frequenze

I 3 grafici comunemente usati sono

IstogrammiIstogrammi, , PoligoniPoligoni didi frequenzafrequenza e

DistribuzioneDistribuzione didi FrequenzaFrequenza cumulativacumulativa.

(assieme agli estremi eventualmente) e le frequenze

associate a ciascuna classe sono riportate sull’asse

verticale. Le frequenze forniscono l’altezza delle

barre che insistono sui punti medi e vengono

disegnate una di fianco all’altro.

a.a. 2011/12 - Laboratorio

Si può utilizzare la function hist(tempi,c) oppure bar(c,n)

60

80

100

120

140

-50 0 50 100 150 200 250 3000

20

40

a.a. 2011/12 - Laboratorio

Per le frequenze relative bar(c,fr)

0.25

0.3

0.35

0.4

0.45

0.5

0 50 100 150 200 2500

0.05

0.1

0.15

0.2

0.25

Qualche didascalia…

a.a. 2011/12 - Laboratorio

>> title('Frequenze relative')>> xlabel('Tempo di vita del prototipo')>> text(200,0.45,'Istogramma')

0.35

0.4

0.45

0.5Frequenze relative

Istogramma

0 50 100 150 200 2500

0.05

0.1

0.15

0.2

0.25

0.3

Tempo di vita del prototipo

a.a. 2011/12 - Laboratorio

Le barre si toccano

-50 0 50 100 150 200 250 3000

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

0.45

0.5

Barre orizzontali>> bar(c,fr,1)

0 0.05 0.1 0.15 0.2 0.25 0.3 0.35 0.4 0.45 0.5-50

0

50

100

150

200

250

300

>> barh(c,fr,1)

-50

0

50

100

150

200

250

300

0

0.1

0.2

0.3

0.4

0.5

>> bar3(c,fr,1,'r')

Grafici 3-D

a.a. 2011/12 - Laboratorio

Un PoligonoPoligono didi frequenzafrequenza consiste di pezzi di linea

retta che collegano i punti medi delle classi alle rispettive

frequenze.

0.3

0.35

0.4

0.45

0.5

>> plot(c,fr,'--rs')

0 50 100 150 200 2500

0.05

0.1

0.15

0.2

0.25

0.3

a.a. 2011/12 - Laboratorio

IN MATLAB – La function plot

Vari tipi di grafici e vari colori possono caratterizzare I vostri grafici. PLOT(X,Y,S) dove S è una stringa di caratteri costruita con uno, due

o tre elementi, presi ciascuno dalla seguente colonna:

b blu . punto - linea continuag verde o cerchio : a puntir rosso x x -. a punti e linee c fosfor. + piu’ -- doppio tratteggio m magenta * stellay giallo s quadratok nero d rombo

v triangolo (su)^ triangolo (giu’)< triangolo (sinistra)> triangolo (destra)p pentagrammah esagramma

a.a. 2011/12 - Laboratorio

Una

DistribuzioneDistribuzione didiFrequenzaFrequenzacumulativacumulativa è

usata per determinare quantio quale percentuale

Sul piano cartesiano si

riportano i dati del c.c.

ordinati in senso cre-

scente. Le ordinate sono

o quale percentualedi valori del campione sono al di sotto (o uguali) ad un prefissatovalore.

n

xxF

(i)

i

≤=

dati di numero)( )(

a.a. 2011/12 - Laboratorio

Per effettuare un grafico della distribuzione di frequenza cumulativa, si può usare la function cdfplot:

0.7

0.8

0.9

1Empirical CDF

>> cdfplot(tempi)

0 50 100 150 200 2500

0.1

0.2

0.3

0.4

0.5

0.6

x

F(x

)

a.a. 2011/12 - Laboratorio

Problema: Supponiamo che i dati siano stati raccolti in forma tabellare. Come è possibile costruire allora le distribuzioni di frequenze assolute? Quelle delle distribuzioni di frequenze relative? E quelle cumulative?

Età in mesi Frequenza dei guasti

0-26.9877 127

26.9877-54.9877 70

54.9877-82.9877 27

82.9877- 110.9877 1582.9877- 110.9877 15

110.9877-138.9877 11

138.9877-166.9877 7

166.9877-194.9877 3

194.9877-222.9877 1

222.9877-250.9877 1

a.a. 2011/12 - Laboratorio

Per costruire un poligono di frequenza cumulativa

raggruppato, rappresentare il limite superiore di

ciascuna classe sull’asse delle X e la corrispondente

frequenza cumulata lungo l’asse delle Y.

DistribuzioneDistribuzione didi frequenzafrequenza cumulativacumulativa

raggruppataraggruppata per per classiclassi

n

sup dati di numero esima,-i classe sup

a.a. 2011/12 - Laboratorio

( )1

1 1

Se la classe -esima risulta essere ( , ) rappresentare le coppie

( , )

i i

i i

i x x

x F x

+

+ +

Intanto per le ordinate è possibile usare la function cumsum

>> y=cumsum(n)/262

y =

0.4847 0.7519 0.8550 0.9122 0.9542 0.9809 0.9924 0.9962 1.0000

…E poi la function stairs….

0.9

1

0 50 100 150 200 250 3000.4

0.5

0.6

0.7

0.8

0.9

>> stairs(x(2:10),y)

a.a. 2011/12 - Laboratorio

Con l’ausilio di questi grafici, è possibile “ipotizzare” un modello stocastico per descrivere il tempo di vita del dispositivo.

0.2

0.25

0.3

0.35

0.4

0.45

0.5 Ad esempio: prendiamo il poligono di frequenza.

Ricorda qualcuna delle

densità che avete

visto?

0 50 100 150 200 2500

0.05

0.1

0.15

0.2

disttool

Perché f(0) sono diverse?

a) Servono dei metodi per individuare i parametri….

b) Serve un metodo per confrontare PDF con poligoni di frequenza…

a.a. 2011/12 - Laboratorio

La Media Media aritmeticaaritmetica è

l’indice di posizione

maggiormente impiegato e

mostra il valore centrale dei

dati.

Principali caratteristiche:

>>mean(tempi)

1

1 n

i

i

x xn =

= ∑

�Richiede dati di tipo numerico.

�Vengono usati tutti i valori.

�E’ unica.

�La somma delle distanze dalla media è 0.

Principali caratteristiche:

a.a. 2011/12 - Laboratorio

[ ]( ) (3 5) (8 5) (4 5) 0i

x xΣ − = − + − + − =

Si consideri il seguente insieme di

dati: 3, 8, e 4. La mediamedia è 5.

Si consideri ora il seguente insieme di

dati: 3, 8, 1000. La mediamedia è 337.

a.a. 2011/12 - Laboratorio

La media campionaria non è un indicatore robusto…Ossia può falsare le informazioni.

Cosa succede se i dati sono già in forma tabellare? Come viene calcolata la media campionaria?

Età in mesi Frequenza dei guasti

0-26.9877 127

26.9877-54.9877 70

54.9877-82.9877 27

82.9877- 110.9877 15

110.9877-138.9877 11

138.9877-166.9877 7138.9877-166.9877 7

166.9877-194.9877 3

194.9877-222.9877 1

222.9877-250.9877 1

Si usa la formula

1

1 k

i i

i

x c nn =

= ∑ >> media=sum(c.*n)/262

media = 43.0182Confronta con

> mean(tempi) ans = 42.0714a.a. 2011/12 - Laboratorio

Al di sotto e al di sopra della mediana deve comparire lo stesso numero di dati.

La MedianaMediana è il punto

medio dei valori del

campione, una volta messi

in ordine crescente.

La mediana

numero di dati.

Per un insieme pari di valori, la mediana è la media aritmetica dei due valori di posto n/2 e (n+1)/2 nel

campione ordinato

A quale tipo di dati si applica?

a.a. 2011/12 - Laboratorio

L’età di un campione di 5 studenti universitari è:

21, 25, 19, 20, 22.

Ordinando i dati in ordine crescente:

19, 20, 21, 22, 25.

La mediana è 21.

a.a. 2011/12 - Laboratorio

Ordinando i dati in

ordine crescente:

L’altezza di 4 giocatori di basket (in pollici) è:

76, 73, 80, 75.

73, 75, 76, 80

Allora la mediana è 75.5.

La mediana si trova

al posto (n+1)/2 =

(4+1)/2 =2.5th

a.a. 2011/12 - Laboratorio

�La mediana è unica per ogni insieme di dati.

�La mediana è una statistica robusta.

�Può essere calcolata anche per dati raggruppati.

Proprietà della Mediana

>>>> median(tempi)0.45

0.5

ans =

28.9202

0 50 100 150 200 2500

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

a.a. 2011/12 - Laboratorio

Cosa ci dice il confrontocon la media, 43.01?

2

nCF

Mediana L hf

= +

La MedianaMediana di un campione di dati organizzati in

distribuzione di frequenza è calcolata con la

seguente formula:

?

dove L è il minimo della classe cui la mediana

appartiene, CF è la frequenza cumulata nell’estremo

destro della classe, f è la frequenza della classe cui

la mediana appartiene e h è l’ampiezza della classecui la mediana appartiene .

a.a. 2011/12 - Laboratorio

Per calcolare la mediana di dati raggruppati

Costruire una distribuzione di frequenza cumulata.

Dividere la taglia del campione per 2.

Determinare quale classe contiene questo valore. Ad

esempio se n=262, 262/2 = 131, allora determinare

quale classe contiene il valore di posto 131.quale classe contiene il valore di posto 131.

Età in mesi Frequenza dei guasti

0-26.9877 127

26.9877-54.9877 197

54.9877-82.9877 224

82.9877- 110.9877 239

110.9877-138.9877 250

138.9877-166.9877 257

166.9877-194.9877 260

194.9877-222.9877 261

222.9877-250.9877 262

TOTALE 262a.a. 2011/12 - Laboratorio

Età in mesi Frequenza dei guasti

0-26.9877 127

26.9877-54.9877 197

54.9877-82.9877 224

82.9877- 110.9877 239

110.9877-138.9877 250

138.9877-166.9877 257

166.9877-194.9877 260

194.9877-222.9877 261

222.9877-250.9877 262

TOTALE 262

2

nCF

Mediana L hf

= +

L=26.9877, n=262, f=70,

i=28, CF=127

>> 26.9877+(262/2-127)/70*28

dove L è il minimo della classe cui la mediana

appartiene, CF è la frequenza cumulata che precede

quella della classe cui la mediana appartiene, f è la

frequenza della classe cui la mediana appartiene e i è

l’ampiezza della classe cui la mediana appartiene .

>> 26.9877+(262/2-127)/70*28

ans = 28.5877

a.a. 2011/12 - Laboratorio

Esempio 6Esempio 6:: I punteggi di un esame per 10 studenti

sono i seguenti (in centesimi) : 81, 93, 84, 75, 68, 87,

81, 75, 81, 87. Poichè il punteggio 81 appare più

La ModaModa è un altro indice di posizione e rappresenta

il valore del campione casuale che appare più frequentemente.

La moda

81, 75, 81, 87. Poichè il punteggio 81 appare più

frequentemente di tutti gli altri, è la moda.

Un campione può avere anche più di una moda: se ne

ha due si parla di campione bimodale, se ne ha tre si

parla di campione trimodale e così via.

La ModaModa per dati raggruppati è approssimativamente il

punto medio della classe con frequenza più grande

Asimmetria nulla Media

=Mediana

=Moda

Le posizioni relative di Media, Mediana, e Moda in una

Distribuzione simmetrica

Mode

Median

Mean

• Con coda destra (asimmetria positiva): Media e mediana sono

a destra della moda.

Media>Mediana>Moda

Le posizioni relative di Media, Mediana, e Moda in una

distribuzione asimmetrica con coda destra

Mode

Median

Mean

Con coda sinistra (asimmetria negativa): Media e Mediana sono a

sinistra della Moda.

Media<Mediana<Moda

Le posizioni relative di Media, Mediana, e Moda in

una distribuzione asimmetrica con coda sinistra

ModeMean

Median

IN MATLAB – Calcolo coefficiente di asimmetria

>> primo=[1;2*ones(2,1);3*ones(3,1);4*ones(4,1);5*ones(5,1);

6*ones(6,1);7*ones(7,1)];

>>hist(primo,[1,2,3,4,5,6,7])

>>secondo=[ones(7,1);2*ones(6,1);3*ones(5,1);4*ones(4,1);

5*ones(3,1);6*ones(2,1);7]

>>hist(secondo,[1,2,3,4,5,6,7])

>>[mean(primo),mean(secondo),median(primo),median(secondo)]

ans =

5 3 5 3

>> skewness(primo)

ans =ans =

-0.5774

>> skewness(secondo)

ans =

0.5774

DispersioneDispersione= variabilità o

diffusione dei

dati

0

5

10

15

20

25

30

0 2 4 6 8 10 12

Misure di dispersione sono: range, range, varianzavarianza e e

deviazionedeviazione standardstandard.

Misure di dispersione

>> range=max(tempi)-min(tempi)

range =

249.7227

VarianzaVarianza:: la

media aritmetica

dei quadrati delle

Range Range = Massimo – Minimo

>> var(tempi)

ans =dei quadrati delle

deviazioni dalla

media.

DeviazioneDeviazione

standardstandard:Radice quadrata

della varianza.

1.7873e+003

std(tempi)

ans =

42.2759

Varianza campionaria (sVarianza campionaria (s22))

2 2

1

1( )

( 1)

n

i

i

s x xn =

= −−∑

Deviazione standard campionaria (s)Deviazione standard campionaria (s)

2ss =

Varianza e Deviazione standard campionarie

Regola empirica Regola empirica : Per ogni distribuzione

simmetrica a forma di campana risulta

�Circa il 68% delle osservazioni distano dalla media

meno di 1 una volta la deviazione standard.

3- 43

�Circa il 95% delle osservazioni distano dalla media

meno di 2 volte la deviazione standard.

�Virtualmente tutte le osservazioni distano dalla

media meno di 3 volte la deviazione standard.

Interpretazione e uso della

deviazione standard

. e trarelazione la mostra che campana di forma a Curva µσ

68%

3- 44

µµµµ−−−−3σ3σ3σ3σ µµµµ−−−−2σ2σ2σ2σ µµµµ−−−−1σ1σ1σ1σ µµµµ µ+1σµ+1σµ+1σµ+1σ µ+2σµ+2σµ+2σµ+2σ µ+ 3µ+ 3µ+ 3µ+ 3σσσσ

68%

95%

99.7%

In genere se s<< range/4 i dati sono concentrati attorno alla media campionaria

Curtosi di una distribuzione =

Maggiore o minore appuntimento della curva

CURTOSICURTOSI

Indice di Curtosi

32

2

42 −=

m

>> kurtosis(tempi)-3

ans =

3.5747

<

=

>

piatte onidistribuziper 0

gaussiana onedistribuzi laper 0

appuntite onidistribuziper 0

2

2

2

γ

γ

γ

Coefficiente di variazione

Una proprietà desiderabile per un indice di variabilità è che non dipenda dall’unità di misura in cui è espresso il carattere.

Es: altezza di 5 studenti: 172, 175, 176, 178, 180

La media risulta essere 176,2 cm e la dev standard risulta essere 2,71.

Se esprimiamo in metri, la media diviene 1,762 e la dev.standard 0,0271.

a.a. 2011/12 - Laboratorio

Esempio: Un processo industriale produce bustine di camomilla del peso mediodi 2 grammi. La dev. standard è 0,034. Un secondo processo industriale produ-ce confezioni di pasta alimentare del peso di 500 grammi. La dev. standard è 2.7. Quale tra i due processi è più “preciso”?

Questa comparazione può essere effettuata in modo appropriato esprimendo la

deviazione standard di ciascun processo come percentuale della rispettiva media.

0.034 2.7100 1.7 100 0.5

2 500× = × =

96

92

91

88

86

85

12

11

1098

750esimo percentile: Mediana

Media tra la sesta e la settima

75esimo percentile

Media tra la nona e la decima

osservazione = (88 + 91)/2 = 89.5

Q3

Q4

85

84

83

82

79

78

69

765

432

1

25esimo percentile

Media tra la terza e la quarta osservazio-

ne = (79 + 82)/2 = 80.5

Media tra la sesta e la settima

osservazione = (84+85)/2 = 84.5

Q1

Q2

IN MATLAB

>> prctile(tempi,25), prctile(tempi,50), prctile(tempi,75)

ans =

12.5160

ans =

a.a. 2011/12 - Laboratorio

ans =

28.9202

ans =

53.5340

Il campo interquartile

(o intervallo

interquartile) è la

differenza tra il III

quartile Q3 e il I

quartile Q1.

Questa distanza

ingloba il 50% delle

informazioni.

Campo interquartile = Q3 - Q1

>> prctile(tempi,75) - prctile(tempi,25)

ans =

41.0180

>> iqr(tempi)

ans =

41.0180

5 dati sono necessari alla

Un box plot è un grafico che aiuta a descrivere le caratteristiche qualitative

di un insieme di dati.

necessari alla costruzione:

il minimo:

il I quartile;

la mediana;

il III quartile;

il massimo.

Basandosi su un campione di 20 consegne,

Buddy’s Pizza determina la seguente informazione. Il

minimo tempo impiegato per la consegna è 13 minuti ed il massimo tempo impiegato è massimo tempo impiegato è 30 minuti. Il I quartile vale 15 minuti, la mediana 18 ed il III

quartile vale 22 minuti. Costruire un box plot per il

tempo di consegna.

Q1 Q3MaxMin Median

12 14 16 18 20 22 24 26 28 30 32

100

150

200

250

Valu

es

IN MATLAB: >> boxplot(tempi)

a.a. 2011/12 - Laboratorio

1

0

50

Column Number

a.a. 2011/12 - Laboratorio

ESERCITAZIONE

Tempi di attesa ad un centralino telefonico. Tempi di attesa ad un centralino telefonico. Tempi di attesa ad un centralino telefonico. Tempi di attesa ad un centralino telefonico. >> load >> load >> load >> load ---- ascii esempio3 ascii esempio3 ascii esempio3 ascii esempio3

1. Costruire l’istogramma (n=?) >> 2^7

ans =

128

2. Costruire il vettore contenente gli estremi delle classi2. Costruire il vettore contenente gli estremi delle classi

>> campo=max(es3)>> campo=max(es3)>> campo=max(es3)>> campo=max(es3)----min(es3), amp=campo/7min(es3), amp=campo/7min(es3), amp=campo/7min(es3), amp=campo/7>> amp=0.7>> amp=0.7>> amp=0.7>> amp=0.7>> % minimo dei tempi=0 >> % minimo dei tempi=0 >> % minimo dei tempi=0 >> % minimo dei tempi=0 >>x(1)=0.0, >>x(1)=0.0, >>x(1)=0.0, >>x(1)=0.0, for i=2:8for i=2:8for i=2:8for i=2:8x(i)=x(ix(i)=x(ix(i)=x(ix(i)=x(i----1)+amp;1)+amp;1)+amp;1)+amp;endendendend

3.3.3.3. Distribuzione di frequenzaDistribuzione di frequenzaDistribuzione di frequenzaDistribuzione di frequenza

>> histc(es3,x)>> histc(es3,x)>> histc(es3,x)>> histc(es3,x)

ans =ans =ans =ans =

525252522727272713131313111111113333222222220000

4. Istogramma

>>c=(x(1:7)+x(2:8))/2>>c=(x(1:7)+x(2:8))/2>>c=(x(1:7)+x(2:8))/2>>c=(x(1:7)+x(2:8))/2>>hist(es3,c)>>hist(es3,c)>>hist(es3,c)>>hist(es3,c)

5.5.5.5. Poligono di frequenzaPoligono di frequenzaPoligono di frequenzaPoligono di frequenza

>> n=hist(es3,c)/30;>> n=hist(es3,c)/30;>> n=hist(es3,c)/30;>> n=hist(es3,c)/30;>> plot(c,n,'r*>> plot(c,n,'r*>> plot(c,n,'r*>> plot(c,n,'r*--------')')')')>> title('Poligono di frequenza')>> title('Poligono di frequenza')>> title('Poligono di frequenza')>> title('Poligono di frequenza')

>> loc=[median(es3), mode(es3), mean(es3)]

loc =

0.6558 1.0117 0.9621

6.6.6.6. Indici statisticiIndici statisticiIndici statisticiIndici statistici

>> disp=[iqr(es3), range(es3), var(es3), std(es3)]>> disp=[iqr(es3), range(es3), var(es3), std(es3)]

disp =

0.9001 4.6074 0.6691 0.9468

>> altri=[skewness(es3), kurtosis(es3), loc(3)/disp(5)]altri =

2.0133 7.3505 1.0161

7. Box Plot

>> boxplot(es3)

OUTLIERS

>> [max(es3),min(es3)]ans =

4.6191 0.0117

>> cdfplot(es3)

8. Cumulativa empirica