frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età...

28
Corso di Laurea: Economia Aziendale Insegnamento: Statistica (I a parte) Docente: G.Latorre, D.Costanzo, M.Misuraca Lezione n° 03 1 – Frequenze cumulate Nl i il d lità d l tt i di t ò it t t di Docente: G.Latorre, D.Costanzo, M.Misuraca Nel caso in cuile modalità del carattere in esame sono ordinate può essere interessantestudiare la frequenza con cui si presentano nel collettivo in esame modalità inferiori o uguali ad un certa soglia. Le frequenze cumulate sono utili quando vogliamo fissare una delle modalità e leggere i dati della distribuzione rispetto a questa dati della distribuzione rispetto a questa Ricarica telefonica frequenza assoluta fr. assoluta cumulata 10 10 10 50 6 16 100 5 21 Totale 21 Totale 21 Se vogliamo sapere quanti individui hanno acquistato una ricarica con un taglio inferiore o uguale ad una certa soglia basta leggere la frequenza cumulata in corrispondenza della modalità che ci ad una certa soglia basta leggere la frequenza cumulata in corrispondenza della modalità che ci interessa: ad es. se vogliamo il numero di unità statistiche che hanno ricaricato massimo (al più) 50 € (minore o uguale) è pari a 16 (10+6) Se vogliamo sapere quanti individui hanno acquistato una ricarica con un taglio inferiore a una Se vogliamo sapere quanti individui hanno acquistato una ricarica con un taglio inferiore a una certa soglia basta leggere la frequenza cumulata della modalità precedente a quella che ci interessa: ad es. le unità che hanno ricaricato meno di 50 € sono 10

Transcript of frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età...

Page 1: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 031 – Frequenze cumulate

N l i i l d lità d l tt i di t ò i t t t di

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Nel caso in cui le modalità del carattere in esame sono ordinate può essere interessante studiare la frequenza con cui si presentano nel collettivo in esame modalità inferiori o uguali ad un certa soglia. Le frequenze cumulate sono utili quando vogliamo fissare una delle modalità e leggere i dati della distribuzione rispetto a questadati della distribuzione rispetto a questa

Ricaricatelefonica

frequenzaassoluta

fr. assolutacumulata

10 10 1050 6 16100 5 21Totale 21Totale 21 ‐

Se vogliamo sapere quanti individui hanno acquistato una ricarica con un taglio inferiore o uguale ad una certa soglia basta leggere la frequenza cumulata in corrispondenza della modalità che ciad una certa soglia basta leggere la frequenza cumulata in corrispondenza della modalità che ci interessa: ad es. se vogliamo il numero di unità statistiche che hanno ricaricato massimo (al più) 50 € (minore o uguale) è pari a 16 (10+6)

Se vogliamo sapere quanti individui hanno acquistato una ricarica con un taglio inferiore a unaSe vogliamo sapere quanti individui hanno acquistato una ricarica con un taglio inferiore a una certa soglia basta leggere la frequenza cumulata della modalità precedente a quella che ci interessa: ad es. le unità che hanno ricaricato meno di 50 € sono 10

Page 2: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 032 – Notazione

Docente:  G.Latorre, D.Costanzo, M.Misuraca

È possibile calcolare le frequenze cumulate a partire dalle frequenze assolute, relative o percentuali. Per distinguere le frequenze cumulate vengono indicate con la lettera maiuscola corrispondente

X N F P

x1 N1 F1 P1

Nel prosieguo indicheremo con:xi la generica i‐esima modalità del carattere X (con i=1,2,…,k)

x1 N1 F1 P1

x2 N2 F2 P2

… … … …

Ni la i‐esima frequenza assoluta cumulata delle prime i modalitàFi la i‐esima frequenza relativa cumulata delle prime i modalitàPi la i‐esima frequenza percentuale cumulata delle prime i modalità

xi Ni Fi Pi

… … … …

∑i

∑i

xk Nk Fk Pk

totale - - -∑=

==1j

ji k,...,2,1i,nN ∑=

==1j

ji k,...,2,1i,fF

i

∑=

==i

1jji k,...,2,1i,pP

Page 3: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 033 – I diversi tipi di frequenza (e distribuzione) 

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Page 4: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 034 – Esercizio

Docente:  G.Latorre, D.Costanzo, M.Misuraca

X n X n0 5 0 20

Consideriamo nuovamente i due collettivi di famiglie e le distribuzioni del n° di figli per famiglia

ETTIVO

 A

0 5 0 20

ETTIVO

 B1 12 1 102 19 2 353 9 3 15

COLLE

COLLE

4 4 4 105 1 5 10

Totale 50 Totale 100

• Quante sono le famiglie che hanno al più un figlio?

Relativamente al solo collettivo A:

• Qual è la percentuale di famiglie che hanno al massimo 2 figli?

• Qual è la percentuale di famiglie che hanno almeno 2 figli?

• Quante sono le famiglie che hanno meno di 3 figli?

• Quante sono le famiglie che hanno non meno di 4 figli?

Page 5: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 035 – Soluzione

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Collettivo ACollettivo AX n N F P0 5 5 0,10 10%1 12 17 0,34 34%

Calcoliamo innanzi tutto le frequenze cumulate

2 19 36 0,72 72%3 9 45 0,90 90%4 4 49 0,98 98%5 1 50 1 100%

Totale 50 ‐ ‐ ‐

Page 6: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 036 – Rappresentazione grafica delle fr. cumulate

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Spesso è utile rappresentare graficamente la distribuzione delle frequenze cumulate

In generale è possibile utilizzare un grafico “a gradini” del tipo riportato qui di seguito 

F(x)Questo tipo di rappresentazione consente di

0,8

1

( )Questo tipo di rappresentazione consente di visualizzare la cosiddetta “funzione di ripartizione empirica”: se ad es. stiamo studiando un carattere di tipo discreto 

0

0,6

ppotremmo essere interessati alla fr. relativa (o %) di unità del collettivo sulle quali si è osservata una quantità inferiore ad una soglia prefissata

0,2

0,4 soglia prefissata

Per rilevare la frequenza basta leggere il dato in corrispondenza del gradino che ci 

f(X≤6)

01 2 3 4 5 6 7 8 9 10 11 12 13

X interessa

Page 7: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 037 – Poligono delle frequenze

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Un altro modo per rappresentare le frequenze cumulate è utilizzare il Poligono delle frequenze

0 94

1.00

0 90

1.00Distribuzione delle aziende per n° di addetti

n. di addetti ni fi Fi

5 6 0,04 0,04

0.86

0.94

0.60

0.70

0.80

0.90

10 12 0,09 0,1315 32 0,23 0,3620 27 0,20 0,5625 41 0,30 0,86

0.36

0.56

0.30

0.40

0.50

25 41 0,30 0,8630 11 0,08 0,9435 8 0,06 1,00

137 1,00

0.040.13

0.00

0.10

0.20

Dall’analisi della tabella e del grafico possiamo immediatamente rilevare che le aziende con meno di 15 addetti sono il 36% del collettivo mentre le aziende con meno di 20 addetti rappresentano

5 10 15 20 25 30 35

di 15 addetti sono il 36% del collettivo, mentre le aziende con meno di 20 addetti rappresentano complessivamente il 56% del collettivo (ovviamente includendo anche le aziende che ne hanno meno di 15) 

Page 8: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 038 – Esercizio

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Page 9: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 039 – Esercizio

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Il responsabile del settore personale del Comune di Cosenza conosce la distribuzione degli impiegati secondo la qualifica funzionale

Qualifica Impiegati

III

58308

IIIIVVVI

287715228

Il Comune ha bandito un concorso per quattro posti riservati agli interni con qualifica non inferiore alla VVI

VII2812

816

riservati agli interni con qualifica non inferiore alla V

Qual è la percentuale dei possibili candidati al concorso?

Qual è il collettivo statistico e qual è il carattere oggetto di studio?

Come traduciamo in termini statistici il quesito del responsabile del personale?

Page 10: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0310 – Distribuzione in classi

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Quando si analizza un fenomeno che può essere espresso per mezzo di un carattere discreto con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui(es. peso, altezza), è possibile che le distribuzioni di frequenza assolute o relative non siano idonee e non migliorino la comprensione dei dati

In questi casi può essere adoperata un’altra rappresentazione dei dati: le modalità (discrete o continue) sono organizzate in intervalli di valori dette classi, e le frequenze associate a ciascun intervallo rappresentano il n° di unità sulle quali è osservato/misurato un valore appartenente all’intervallo stesso

Bisogna dire che se la rappresentazione in classi presenta la stessa facilità di lettura di unal i i di t ib i di f ( l t l ti ) è ò lt tt t i di tqualsiasi distribuzione di frequenze (assolute o relative) non è però altrettanto immediata e 

di facile costruzione a partire dalla distribuzione unitaria dei dati. È infatti necessario tenerein considerazione diversi elementi: il numero di classi adeguato al problema, l’ampiezza dellediverse classi la possibilità di includere tutte le modalità del carattere e così viadiverse classi, la possibilità di includere tutte le modalità del carattere, e così via

Page 11: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0311 – Caratteristiche delle classi (1)

Docente:  G.Latorre, D.Costanzo, M.Misuraca

‐ In generale una classe può essere vista come un intervallo di valori numerici: ciascuno di questi intervalli deve essere disgiunto, non devono cioè esserci sovrapposizioni, in modo che ogni unità appartenga ad una e una sola classe

‐ L’ampiezza di ciascuna classe può essere costante oppure differente: nel primo caso si parla diclassi equiampie, nel secondo caso si parla di classi non equiampie. La scelta di un tipo dipende talvolta dalle scelte soggettive del ricercatore ma spesso è strettamente legata a fenomeno chetalvolta dalle scelte soggettive del ricercatore ma spesso è strettamente legata a fenomeno chesi vuole rappresentare: 

CLASSE Criterio

Da 0 a 5 anni Età prescolare

Da 6 a 10 anni Scuola elementare

In questo caso la suddivisione in classi del carattere età è dettata da un criterio esterno che fornisce comunque un interessante punto di vista rispetto al tipo di fenomeno che si staDa 6 a 10 anni Scuola elementare

Da 11 a 13 anni Scuola media

Da 14 a 18 anni Scuola superiore

vista rispetto al tipo di fenomeno che si sta studiando

NB: le classi non devono mai essere vuote (cioè … … con 0 unità statistiche)

Page 12: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0312 – Caratteristiche delle classi (2)

Docente:  G.Latorre, D.Costanzo, M.Misuraca

È possibile parlare di classi aperte o chiuse a seconda che gli estremi siano inclusi o meno nell’intervallo: la modalità più piccola della classe è detta estremo inferiore, la modalità più grande è detta invece estremo superioregrande è detta invece estremo superiore

Se l’estremo inferiore è incluso nello classe mentre non lo è quello superiore allora si parladi classe chiusa a sinistra e aperta a destra; se invece l’estremo inferiore della classe non è p ;incluso nella classe mentre lo è quello superiore si parla di classe aperta a sinistra e chiusaa destra. Se includiamo sia l’estremo inferiore che superiore allora parliamo genericamentedi classe chiusa: questo tipo di classi è però idoneo per rappresentare i soli caratteri discreti

La scelta di includere o meno uno degli estremi è univoca: se decidiamo che la prima classe della distribuzione è chiusa a sinistra e aperta a destra (o viceversa), allora tutte le classi della distribuzione saranno dello stesso tipodistribuzione saranno dello stesso tipo

Un particolare tipo di classi sono quelle non limitate inferiormente o superiormente: in tal caso si utilizza la notazione matematica < (minore di) e > (maggiore di), oppure si ricorre ad esempio ( ) ( gg ), pp pa locuzioni del tipo “fino a” (<) o “più di” (>)

Page 13: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0313 – Determinazione del numero di classi

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Non esiste un modo univoco per determinare il numero di classi: molte volte, a seconda del fenomeno oggetto di studio, la scelta è lasciata all’esperienza di chi effettua lo studio

La regola da seguire è che non bisogna scegliere un n° di classi eccessivamente piccolo per non perdere dettaglio nella rappresentazione del fenomeno, ma al contempo non bisogna scegliere un n° di classi eccessivamente grande per non “sacrificare” la leggibilità della distribuzione

Nel corso degli anni sono state proposte diverse soluzioni per determinare in modo oggettivo il numero di classi ideale per una popolazione di numerosità pari a N: una possibile soluzione è quella di considerare il numero k di classi ottenuto dalla regola di Sturgesquella di considerare il numero k di classi ottenuto dalla regola di Sturges

≅ i 10k 1+3,322 log (N)REGOLA DI STURGES

N° DI CLASSI DA CONSIDERARENELLA DISTRIBUZIONE

Page 14: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0314 – Determinazione dell’ampiezza

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Una volta determinato il numero delle classi è necessario stabilire se si vogliono considerare classi di uguale ampiezza o meno

Nel caso in cui si considerano classi di ampiezza diversa bisogna chiaramente procedere ad unaNel caso in cui si considerano classi di ampiezza diversa bisogna chiaramente procedere ad una scelta coerente con il fenomeno che si sta analizzando, come illustrato in precedenza con l’esempio della distribuzione per età costruita sulla base del livello scolastico

Se invece si considerano classi di ampiezza uguale allora è necessario trovare un modo per determinare in modo pratico e veloce la quantità che si assume costante per ogni intervallo

Tale quantità può essere ottenuta facilmente considerando l’ampiezza della distribuzione, a partire dalla differenza della modalità più grande e della modalità più piccola osservata nella distribuzione unitaria dei dati e dividendo per il numero di classi definito precedentemente:

≅(N) (1)x - xω

k

La lettera omega dell’alfabeto greco è utilizzata per convenzione per indicare l’ampiezza della classe: va

k chiaramente approssimata al numero intero più vicino

Page 15: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0315 – Notazione

Docente:  G.Latorre, D.Costanzo, M.Misuraca

In generale una distribuzione in classi per un carattere con k classi distinte si presenta come:

Nel prosieguo indicheremo con:xi‐1‐xi la generica i‐esima classe di modalità del carattere X (con i=1,2,…,k)n la i esima frequenza della classe x x

X n

x1-x2 n1

ni la i‐esima frequenza della classe xi‐1‐xi

La frequenza indica equivalentemente:1) il numero di volte che la classe di modalità è stata rilevata sul collettivo

x2-x3 n2

… …

xi-1-xi ni 1) il numero di volte che la classe di modalità è stata rilevata sul collettivo2) il numero di unità statistiche che appartengono ad una classe

k

N ∑

… …

xk-1-xk nk

totale Ni 1 2 i k

i = 1

N = n = n + n + . . . + n + . . . + n∑totale N

Si legge “sommatoria per i che va da 1 a k di n con i”Si legge  sommatoria per i che va da 1 a k di n con i

Page 16: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0316 – Classi aperte e chiuse

I l i di l è t hi d t i i t i tili l t

Docente:  G.Latorre, D.Costanzo, M.Misuraca

In generale per indicare se una classe è aperta o chiusa a destra o a sinistra si utilizza la seguente notazione:

xi‐1 ‐| xi oppure (xi‐1 , xi] ‐> la classe è chiusa a destra e aperta a sinistra (le unità che presentano xi‐1non sono incluse nella classe, quelle che presentano xi invece lo sono)

xi‐1 |‐ xi oppure [xi‐1 , xi) ‐> la classe è aperta a destra e chiusa a sinistra (le unità che presentano xi‐1sono incluse nella classe, quelle che presentano xi invece non lo sono)

xi‐1 ‐ xi oppure [xi‐1 , xi] ‐>  la classe è chiusa a destra e sinistra (sia le unità con xi‐1 che quelle che presentano xi sono incluse nella classe)

Page 17: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0317 – Rappresentazione dei dati

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Una volta ottenute le classi e “contate” quante sono le unità statistiche appartenente ad ogni classe abbiamo di fatto ottenuto una distribuzione di frequenze assolute come quelle viste nelle precedenti lezioni, con la differenza che non abbiamo tutte le modalità osservate ma intervalli p ,di modalità

Così come per le distribuzioni di frequenze è possibile leggere in modo differente i dati, ad esempio considerando le frequenze relative o percentuali, oppure calcolando le frequenze cumulate (assolute o relative)

In tutti i casi in cui è necessario effettuare delle operazioni sulle distribuzioni in classe risultaIn tutti i casi in cui è necessario effettuare delle operazioni sulle distribuzioni in classe risulta difficile ritornare ad una distribuzione di frequenze o unitaria: a tal scopo per convenzione si fa riferimento ad un valore rappresentativo dell’intera classe, detto “valore centrale”, che può essere calcolato dalla semisomma degli estremi inferiore e superiore di ciascuna classeesse e ca co ato da a se so a deg est e e o e e supe o e d c ascu a c asse

estr. inferiore + estr. superiorevalore centrale= valore centrale

2

Page 18: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0318 – V. centrale e ampiezza costante

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Una volta definito il numero delle classi e l’ampiezza di ciascuna di esse per ottenere gli estremi inferiore e superiore di ciascuna di esse si procede come segue: innanzi tutto è necessario ordinare tutte le modalità in senso crescente, dalla più piccola alla più grande, p p p g

1a classe  ‐> x1 ‐|x2 =          x1 ‐| x1 + ω2a classe  ‐> x2 ‐|x3 =   x1 + ω ‐| x1 + 2ω oppure  x2 ‐| x2 + ω3a classe  ‐> x3 ‐|x4 = x1 + 2ω ‐| x1 + 3ω oppure  x3 ‐| x3 + ω…

In generale  ‐> xi 1 ‐|xi = x1 + (i‐1)⋅ω ‐|x1 + i⋅ωg i‐1 | i 1 ( ) | 1

Quindi una volta individuato l’estremo inferiore della classe è possibile ottenere l’estremo Qu d u a o ta d duato est e o e o e de a c asse è poss b e otte e e est e osuperiore aggiungendo la quantità relativa all’ampiezza

Per calcolare il valore centrale di ciascuna classe è sufficiente a questo punto aggiungere ad ogni estremo inferiore delle classi la metà dell’ampiezza ω/2

Page 19: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0319 – Esempio

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Consideriamo la seguente distribuzione unitariaper un collettivo di 200 unità statistiche

ω non eqquiampie

ω

equiamppie

Page 20: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0320 – Esercizio

Docente:  G.Latorre, D.Costanzo, M.Misuraca

A 150 studenti iscritti al Corso di Laurea Triennale in Economa e Commercio è stato chiesto il Numero di Crediti Formativi ottenendo il seguente elenco grezzo di modalità:

C l l il di l i‐ Calcolare il numero di classi

‐ Costruire delle classi equiampiechiuse a sinistrachiuse a sinistra

‐ Calcolare il valore centrale

Page 21: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0321 – Soluzione

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Considerando 150 unità statistichepossiamo considerare 8 classi

i 101+3,322 log (150)=8,229Alla luce del numero di classi e dei valori della distribuzione possiamo assumere un’ampiezza pari a 23 =

180 - 0 22,58

10, g ( ) ,

,8

1 0 |‐ 23 11.52 23 |‐ 463 46 |‐ 694 69 |‐ 925 92 | 115

34.557.580.5103 5

valore cen

Calcolate adesso, sulla base della tabella precedente, le frequenze assolute, relative, 5 92 |‐ 115

6 115 |‐ 1387 138 |‐ 1618 161 |‐ 184

103.5126.5149.5172.5

ntrale

p qe percentuali

|

Page 22: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0322 – Uso delle distribuzioni di frequenza

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Abbiamo visto come sia possibile dare un’idea efficace e immediata della manifestazione di un fenomeno, in un collettivo, attraverso la costruzione di distribuzioni di frequenza e l’utilizzo delle rappresentazioni grafiche

Nel caso in cui abbiamo tanti dati è spesso più utile la costruzione di una distribuzione di frequenza in classi: perdiamo informazioni ma la lettura è più facile

Codiceintervista

ETA’ Codiceintervista

ETA’

1 6 11 45

Classi di Età Frequenze ni

6 |‐ 14 31 6 11 452 18 12 503 10 13 324 12 14 655 14 15 72

6 | 14 3

14 |‐ 25 4

25 |‐ 40 55 14 15 726 35 16 167 40 17 248 60 18 389 25 19 52

40 |‐ 65 6

>65 2

Totale 209 25 19 5210 37 20 43

Totale 20

Page 23: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0323 – Rappresentazione in classi e grafici

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Quando consideriamo una distribuzione di frequenze possiamo rappresentarla graficamente attraverso l’utilizzo di un grafico a torta se ad esempio siamo interessati alla composizione (percentuale) del collettivo in relazione al fenomeno studiato oppure se il carattere è di tipo(percentuale) del collettivo in relazione al fenomeno studiato, oppure se il carattere è di tipo quantitativo a mettere a confronto l’intensità dei diversi modi di presentarsi del fenomeno (le modalità) attraverso una rappresentazione a barre

Cosa accade nel caso di rappresentazioni statistiche in cui il carattere è sintetizzato mediante l’utilizzo di classi?

Possiamo ancora rappresentare graficamente la composizione del collettivo utilizzando un grafico a torta, ma se vogliamo comparare l’intensità delle diverse modalità del carattere nel collettivo allora è necessario prendere in considerazione il fatto che le classi possano avere lacollettivo allora è necessario prendere in considerazione il fatto che le classi possano avere la stessa ampiezza o essere di ampiezza diversa: in questo secondo caso infatti vogliamo tener conto del fatto che un carattere si sia potuto manifestare in un certo modo in una classe piùo meno ampia, perché questo ha di fatto ha una diversa interpretazionep , p q p

Page 24: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0324 – L’istogramma

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Lo strumento grafico utilizzato per visualizzare le distribuzioni di frequenze in classi è il cosiddetto istogramma: sull’asse orizzontale sono rappresentate le classi, su quello verticale è invece espressa l’intensità del fenomeno (in termini di frequenza assoluta, relativa o %)

10 50%

4

6

8

20%

30%

40%

0

2

10 30 50 70 900%

10%

10 30 50 70 90

L’area di ciascuna barra sarà proporzionale all’intensità: la proporzione ovviamente è la stessasia che l’intensità è misurata con le frequenze assolute che l’intensità è espressa, ad esempio, in termini percentuali. Le barre non sono tra loro distanziate per dare un’idea di continuità nella rappresentazione del carattere

Page 25: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0325 – Istogramma per classi non equiampie

Docente:  G.Latorre, D.Costanzo, M.Misuraca

Nel caso di classi con ampiezza diversa è ancora possibile l’utilizzo dell’istogramma come rappresentazione grafica

In questo caso assume però un significato differente il fatto che l’intensità in una specificaIn questo caso assume però un significato differente il fatto che l intensità in una specifica classe sia maggiore o minore, perché i possibili valori osservati sulle unità statistiche sono “pochi” o “molti” a seconda che l’ampiezza della classe sia minore o maggiore

Per poter allora ottenere delle barre proporzionali all’intensità espressa nella classe e allo stesso tempo considerareza classe, e allo stesso tempo considerare l’ampiezza della stessa, si utilizza come misura dell’intensità non più la frequenza ma la cosiddetta densità di frequenza :it

à di freq

uenz

f q

Area = base x altezza

Den

si

Classi di etàArea ‐> frequenza base ‐> ampiezza

altezza ‐> densità di frequenza

Page 26: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0326 – Esempio

Docente:  G.Latorre, D.Costanzo, M.Misuraca

4ni Ni fi Fi di

2

315 ‐| 20 4 4 0,4 0,4 0,08

20 ‐| 25 3 7 0,3 0,7 0,06

25 | 30 1 8 0 1 0 8 0 02

0

1

25 ‐| 30 1 8 0,1 0,8 0,02

30 ‐| 35 2 10 0,2 1 0,04

10 10

15 20 25 30 35

Leggendo i dati in tabella e nel grafico corrispondente si rileva come ci sia una maggiore incidenza della classe 15 ‐| 20 : tale aspetto è verificato anche dalle frequenze relative edalle densità di frequenza, dal momento che tutte le classi hanno la stessa ampiezza

Page 27: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0327 – Esempio

Docente:  G.Latorre, D.Costanzo, M.Misuraca

classi di età amp. classe freq. % densità0 ‐|   5 5 17,0 3,45 ‐| 15 10 40,0 4,0| , ,15 ‐| 30 15 37,0 2,530 ‐| 35 5 6,0 1,2

à di freq

uenza

Dall’analisi della tabella si vede come la frequenza percentuale più alta sia stata osservata in corrispondenza della classedi età 5 | 15: ciò vuol dire che le unità

Den

sità

di età 5 ‐| 15: ciò vuol dire che le unità statistiche che hanno una età tra i 5 e i 15 anni sono quelle più presenti

Classi di età

Se consideriamo le classi 0 ‐| 5 e 15 ‐|30 osserviamo che sono rispettivamente la terza e la seconda classe più osservata: calcolando però le densità di frequenza vediamo che in realtà, tenendo conto della diversa ampiezza delle classi la classe 0 ‐| 5 è “più importante” della classe 15 ‐|30 perché ledella diversa ampiezza delle classi, la classe 0 ‐| 5 è  più importante  della classe 15 ‐|30 perché le unità statistiche sono meno disperse, cioè assumono meno valori rispetto a quelli dell’altra classe

Page 28: frequenze cumulate distribuzione rispetto - ecostat.unical.it · con numerose modalità, (es. età in anni compiuti) oppure quando si usano caratteri continui (es. peso, altezza),

Corso di Laurea: Economia Aziendale

Insegnamento:  Statistica (Ia parte)

Docente: G.Latorre, D.Costanzo, M.Misuraca

Lezione n° 0328 – Altri utilizzi degli istogrammi

Docente:  G.Latorre, D.Costanzo, M.Misuraca

È possibile accoppiare due istogrammi, rappresentanti ad esempio la misura di un fenomeno quantitativo su due sottopopolazioni omogenee per una certa caratteristica, in modo da avere una idea immediata delle diverse intensità nei due gruppi

Popolazione straniera residente in Italia – 2001 (ISTAT)

Esempio – Piramide delle etàEsempio  Piramide delle età

Tale rappresentazione è usata soprattutto nello studio per età 

60 6465 ‐ 6970 ‐ 7475 ‐ 7980 ‐ 8485 ‐ 89

> 90MASCHI FEMMINE

delle popolazioni: è possibile rilevare ad esempio, oltre alla composizione, i momenti storici d i li i d ll25 29

30 ‐ 3435 ‐ 3940 ‐ 4445 ‐ 4950 ‐ 5455 ‐ 5960 ‐ 64

durante i quali ci sono state delle flessioni o degli aumenti delle nascite

1 10 0 10 1

0 ‐ 45 ‐ 9

10 ‐ 1415 ‐ 1920 ‐ 2425 ‐ 29

15 10 5 0 5 10 15