Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione...

17
Distribuzione di frequenza relativa e percentuale: esempio Sesso % F 60 M 40 Totale 100 Sesso Freq. assol. F 3 M 2 Totale 5 Sesso % F 60 M 40 Totale 100 Sesso Freq. assol. F 180 M 120 Totale 300 Attenzione: le distribuzioni percentuali implicano la perdita dell’informazio ne sulla numerosità dei collettivi Pagina 56 Pagina 57

Transcript of Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione...

Page 1: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Distribuzione di frequenza relativa e percentuale: esempio

Sesso %

F 60

M 40

Totale 100

Sesso Freq. assol.

F 3

M 2

Totale 5

Sesso %

F 60

M 40

Totale 100

Sesso Freq. assol.

F 180

M 120

Totale 300

Attenzione: le distribuzioni percentuali implicano la perdita dell’informazione sulla numerosità dei collettivi

Pagina 56

Pagina 57

Page 2: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 58

Gruppo A

EffettoFrequenze

assolute

peggiorato 80

invariato 20

migliorato 50

TOT. 150

Frequenze relative

Frequenze percentuali

0,53 53,33

0,14 14,00

0,33 33,33

1,00 100,00

EffettoFrequenze

assolute

peggiorato 53

invariato 14

migliorato 33

TOT. 100

Frequenze relative

Frequenze percentuali

0,53 53,00

0,14 14,00

0,33 33,00

1,00 100,00

Gruppo B

Cosa si può affermare?

Confronto tra collettivi di diversa numerosità: frequenze assolute

Collettivo A Collettivo B

Carattere

Stato Civile

Frequenza assoluta Carattere

Stato Civile

Frequenza

assoluta

Nubile/celibe 7 Nubile/celibe 9

Sposato 3 Sposato 20

Divorziato 1 Divorziato 15

Vedovo 4 Vedovo 6

Totale 15 Totale 50

Dal confronto di tali distribuzioni si può dedurre che nel collettivo A sono meno numerose le persone non sposate (celibi o nubili) e le persone vedove rispetto alla situazione osservata nel collettivo B (rispettivamente 7 contro 9 e 4 contro 6)

Pagina 59

Page 3: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Confronto tra collettivi di diversa numerosità: frequenze percentuali

Collettivo A Collettivo B

Carattere

Stato Civile

Frequenza

percentuale

Carattere

Stato Civile

Frequenza

percentuale

Nubile/celibe 46,7 Nubile/celibe 18

Sposato 20,0 Sposato 40

Divorziato 6,7 Divorziato 30

Vedovo 26,6 Vedovo 12

Totale 100,0 Totale 100

In realtà, la quota di persone non sposate nel collettivo A (46,7%) è di gran lunga superiore (più del doppio) della corrispondente quota presente nel collettivo B (18%) e lo stesso accade per la modalità “vedovo” che è presente nel 26,6% di casi nel collettivo A e solo nel 12% di individui del collettivo B

Pagina 60

Pagina 2

Frequenze Cumulate

Hanno senso solo se il carattere in esame è almeno un carattere qualitativo ordinale

La frequenza cumulata associata alla modalità xi

del carattere rappresenta il numero di u.s che presentano una modalità non superiore a xi

Frequenze Cumulate

si ottengono sommando le frequenze assolute (relative o percentuali) associate alle modalità inferiori o uguali alla modalità per la quale si sta calcolando la frequenza cumulata

Page 4: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 62

Osservazione

Sommatoria x : indica in modo sintetico la somma di un insieme di numeri x

Sia x1=3, x2=5, x3=1, x4=9, x5=15

�= �� = � + � + � + � + � = + + + =

Pagina 63

Calcolo delle frequenze cumulate

Frequenza Assoluta Cumulata della modalità xi

Frequenza Relativa Cumulata della modalità xi

Frequenza Percentuale Cumulata della modalità xi

� = ℎ=� �ℎ = � + � +⋯+ ���� =ℎ=� �ℎ = � + � +⋯+ ���� =ℎ=� �ℎ = � + � +⋯+ ��

Page 5: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 64

Calcolo delle frequenze cumulate

Ovviamente in corrispondenza della modalità più grande xK si avrà

Frequenza assoluta cumulata NK=n

Frequenza relativa cumulata FK=1

Frequenza percentuale cumulata PK=100

Pagina 65

In sintesi

Frequenza

Assoluta

Frequenza

Cumulata

n i N i

x 1 n 1 N 1=n 1

x 2 n 2 N 2=n 1+n 2. . .

. . .

. . .

x i n i N i=n 1+n 2+…+n i

. . .

. . .

. . .

x K n K N K=n

Totale n

Carattere

X

Page 6: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 66

Esempio: frequenze cumulate

Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 secondo la Soddisfazione della Scelta universitaria

Soddisfazione ni Ni

Per nulla 4 4

Poco 34 38

Abbastanza 185 223

Pienamente 60 283

Totale 283

= � + � + � = + + == + � = + =oppure

Pagina 67

Indici sintetici di dimensione

Obiettivo dell’analisi dei dati : studiare i fenomeni collettivi che si manifestano in modo diverso da unità a unità variabilità

Sintesi della distribuzione del carattere con una sola modalità (valore)Indici sintetici di dimensione: medieLa media dà un’idea sintetica della

distribuzione del carattere sul collettivo in esame

Page 7: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 68

Le medieEsistono molti tipi di media a seconda dell’informazione che si vuole fornire e del tipo di situazione che si sta analizzando

La media deve essere

un valore omogeneo con i dati osservati

compreso tra le modalità della distribuzione(tra le modalità minima e massima se si è in presenza di una mutabile ordinale o di una variabile (principio di Cauchy))

Si distinguono:

medie di posizione

medie analitiche

Pagina 69

Medie di Posizione

Moda e Mediana

Si possono calcolare sia per caratteri qualitativi che quantitativi

Modalità che occupano particolari posizioni all’interno della distribuzione del carattere Non necessariamente cambiano se

cambiano i dati della distribuzione

Sfruttano solo parzialmente l’informazione disponibile

Page 8: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 70

Moda

Si può calcolare sia per caratteri qualitativiche quantitativi

Modalità cui corrisponde la max frequenza (assoluta, relativa o percentuale)

Può non essere unica

Distribuzione multimodale: due o più mode

Pagina 71

Esempio: qual è la moda?

Soddisfazione ni fi pi

Per nulla 4 0,014 1,4

Poco 34 0,120 12,0

Abbastanza 185 0,654 65,4

Pienamente 60 0,212 21,2

Totale 283 1,000 100.0

Distribuzione dei laureati di SDC nell’a.a. 2003/2004 per Corso di Laurea

Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 secondo la Soddisfazione della Scelta Universitaria

La moda è “ABBASTANZA”

CDL ni

STC 48

SCPO 71

COOP 6

Totale 125

La moda è “SCPO”

Page 9: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 72

Esempio: qual è la moda?

Num. Corsi Freq. ni

1 15

2 43

3 103

4 80

5 32

6 8

7 2

Totale 283

Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi Frequentati

Num. Corsi Freq. ni

1 15

2 43

3 103

4 80

5 32

6 8

7 2

Totale 283

La moda è “3”

Pagina 73

Esempio: distribuzione multimodaleDistribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Tipo di Maturità

Tipo di

Maturità n i f i p i

Classica 12 0,300 30,0

Scientifica 12 0,300 30,0

Tecnica 7 0,175 17,5

Altro 9 0,225 22,5

Totale 40 1.000 100.0

La distribuzione è bimodale

Le mode sono

“Classica” e “Scientifica”

Tipo di

Maturità n i f i p i

Classica 12 0,300 30,0

Scientifica 12 0,300 30,0

Tecnica 7 0,175 17,5

Altro 9 0,225 22,5

Totale 40 1.000 100.0

Page 10: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 74

MedianaSi può calcolare per caratteri qualitativi ordinati e per caratteri quantitativi

Definizione

modalità che bipartisce la graduatoria (crescente o decrescente) delle osservazioni

U.S. Alice Marco Elisa Lucia Fabio

Modalità Basso Basso Medio Medio Alto

Mediana

Pagina 75

Calcolo della mediana per una variabile: 1

Collettivo di n=5 unità

Variabile osservata X = Altezza

1. Ordino le unità secondo un ordine crescente di Altezza

Page 11: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 76

Calcolo della mediana per una variabile: 2

Collettivo di n=5 unità

Variabile osservata X = Altezza

2. Identifico l’unità centrale nella serie ordinata dei dati

Pagina 77

Me=155 cm

3. La mediana è il valore che la variabile Altezzaassume sull’unità che divide il collettivo in due parti numericamente uguali

Calcolo della mediana per una variabile: 3

Page 12: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 78

Me

N.B. Le misure di posizione sono VALORI, NON FREQUENZE!!

Me=x[(n+1)/2]=x[(5+1)/2]=x3Formalmente

n dispari

Pagina 79

EsempioDistribuzione unitaria dei giudizi di 5 studenti

U.S. Giudizio

U1 Buono

U2 Insuf.

U3 Discreto

U4 Suff.

U5 Ottimo

Senza ordine

Posto U.S. Giudizio

1 U2 Insuf.

2 U4 Suff.

3 U3 Discreto

4 U1 Buono

5 U5 Ottimo

Ordine crescente

La mediana è

“Discreto”

Page 13: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 80

Esempio

Distribuzione unitaria dei voti di 8 studenti

U.S. Voto

U1 22

U2 30

U3 28

U4 18

U5 27

U6 20

U7 25

U8 28

Senza ordine

Posto U.S. Voto

1 U4 18

2 U6 20

3 U1 22

4 U7 25

5 U5 27

6 U3 28

7 U8 28

8 U2 30

Ordine crescenteLe mediane sono

“25” e “27”

Pagina 81

Mediana: il calcolo1) Ordinare in senso crescente (decrescente) le u.s.

rispetto alle modalità su di esse osservate del carattere in esame

2) Individuare l’unità che occupa il posto centrale n dispari

Il posto centrale è

n pari

Ci sono due posti centrali :

2

1n

2

n1

2

ne

Page 14: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 82

Mediana: il calcolo3) Calcolare la Mediana: è la modalità presentata dall’unità

individuata al punto 2)

n dispari

La mediana è la modalità dell’u.s. che occupa il posto

n pari

La mediana è rappresentata dalla coppia di modalità delle u.s. che occupano i posti n/2 e (n/2)+1 cioè

Me= x(n/2) e Me=x(n/2)+1

Se il carattere è quantitativo, la mediana è la semisomma delle 2 modalità individuate cioè

2

1n

2

1nx

2

122

nn xx

Me

cioè Me=

Pagina 83

EsempioDistribuzione unitaria dei giudizi di 5 studenti

U.S. Giudizio

U1 Buono

U2 Insuf.

U3 Discreto

U4 Suff.

U5 Ottimo

Senza ordine

5n 32

1

n

Posto U.S. Giudizio

1 U2 Insuf.

2 U4 Suff.

3 U3 Discreto

4 U1 Buono

5 U5 Ottimo

Ordine crescente

La mediana è

“Discreto”

Discretoxxn 3

2

1

Page 15: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 84

Esempio

Distribuzione unitaria dei voti di 8 studenti

U.S. Voto

U1 22

U2 30

U3 28

U4 18

U5 27

U6 20

U7 25

U8 28

Senza ordine

Posto U.S. Voto

1 U4 18

2 U6 20

3 U1 22

4 U7 25

5 U5 27

6 U3 28

7 U8 28

8 U2 30

Ordine crescente

8n 512

n

42

n

254

2

xxn 2751

2

xxn

262

2725

22

541

22

xx

xx

Me

nn

Le mediane sono

“25” e “27”

Pagina 85

Esempio: mediana per una distribuzione di frequenzaDistribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 secondo la Soddisfazione della Scelta universitaria

283n 1422

1

n Abbastanza142

2

1 xxn

La mediana è

“Abbastanza”

Soddisfazione ni Ni

Per nulla 4 4

Poco 34 38

Abbastanza 185 223

Pienamente 60 283

Totale 283

Posti in graduatoria

Da 1 a 4

Da 5 a 38

Da 39 a 223

Da 224 a 283

Page 16: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 86

Proprietà della Mediana

1) E’ sempre compresa tra la modalità minima x1 e la modalità massima xK del carattere

2) E’ robusta cioè è poco sensibile ai cambiamenti che possono avvenire sulle modalità estreme della distribuzione del carattere

Pagina 87

Medie Analitiche

Media aritmetica

Si possono calcolare solo per caratteri quantitativi (variabili continue o discrete)

Sono funzioni matematiche di tutti i dati osservati

Cambiano se si cambia anche un solo dato

Sfruttano completamente l’informazione statistica disponibile

Page 17: Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi

Pagina 88

Media Aritmetica: il calcolo

1) Distribuzione unitaria semplice del carattere X

x1, x2, …, xi, … xn

U.S. Voto Maturità

1 98

2 100

3 70

4 72

5 70

6 100

7 85

8 65

9 60

10 88

8.8010

808

10

8860658510070727010098

M

10n

= � + � +⋯+ �� +⋯+ ��� = σ�=� ����= �� = + + + + + + + + + =

Ammontare del carattere

Pagina 89

Media Aritmetica: il calcolo

2) Distribuzione semplice di frequenze assolute del carattere X

Car. XFREQUENZE ASSOLUTE

FREQUENZE RELATIVE

x1 n1 f1

x2 n2 f2

… … …

xi ni fi

… … …

xK nK fK

Totale n 1

MEDIA ARITMETICA PONDERATA

= � � + � � +⋯+ ���� +⋯+ �����= σ�=1� ����� =σ�=� ����