Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione...
Transcript of Distribuzione di frequenza relativa e percentuale: esempio · 6 8 7 2 Totale 283 Distribuzione...
Distribuzione di frequenza relativa e percentuale: esempio
Sesso %
F 60
M 40
Totale 100
Sesso Freq. assol.
F 3
M 2
Totale 5
Sesso %
F 60
M 40
Totale 100
Sesso Freq. assol.
F 180
M 120
Totale 300
Attenzione: le distribuzioni percentuali implicano la perdita dell’informazione sulla numerosità dei collettivi
Pagina 56
Pagina 57
Pagina 58
Gruppo A
EffettoFrequenze
assolute
peggiorato 80
invariato 20
migliorato 50
TOT. 150
Frequenze relative
Frequenze percentuali
0,53 53,33
0,14 14,00
0,33 33,33
1,00 100,00
EffettoFrequenze
assolute
peggiorato 53
invariato 14
migliorato 33
TOT. 100
Frequenze relative
Frequenze percentuali
0,53 53,00
0,14 14,00
0,33 33,00
1,00 100,00
Gruppo B
Cosa si può affermare?
Confronto tra collettivi di diversa numerosità: frequenze assolute
Collettivo A Collettivo B
Carattere
Stato Civile
Frequenza assoluta Carattere
Stato Civile
Frequenza
assoluta
Nubile/celibe 7 Nubile/celibe 9
Sposato 3 Sposato 20
Divorziato 1 Divorziato 15
Vedovo 4 Vedovo 6
Totale 15 Totale 50
Dal confronto di tali distribuzioni si può dedurre che nel collettivo A sono meno numerose le persone non sposate (celibi o nubili) e le persone vedove rispetto alla situazione osservata nel collettivo B (rispettivamente 7 contro 9 e 4 contro 6)
Pagina 59
Confronto tra collettivi di diversa numerosità: frequenze percentuali
Collettivo A Collettivo B
Carattere
Stato Civile
Frequenza
percentuale
Carattere
Stato Civile
Frequenza
percentuale
Nubile/celibe 46,7 Nubile/celibe 18
Sposato 20,0 Sposato 40
Divorziato 6,7 Divorziato 30
Vedovo 26,6 Vedovo 12
Totale 100,0 Totale 100
In realtà, la quota di persone non sposate nel collettivo A (46,7%) è di gran lunga superiore (più del doppio) della corrispondente quota presente nel collettivo B (18%) e lo stesso accade per la modalità “vedovo” che è presente nel 26,6% di casi nel collettivo A e solo nel 12% di individui del collettivo B
Pagina 60
Pagina 2
Frequenze Cumulate
Hanno senso solo se il carattere in esame è almeno un carattere qualitativo ordinale
La frequenza cumulata associata alla modalità xi
del carattere rappresenta il numero di u.s che presentano una modalità non superiore a xi
Frequenze Cumulate
si ottengono sommando le frequenze assolute (relative o percentuali) associate alle modalità inferiori o uguali alla modalità per la quale si sta calcolando la frequenza cumulata
Pagina 62
Osservazione
Sommatoria x : indica in modo sintetico la somma di un insieme di numeri x
Sia x1=3, x2=5, x3=1, x4=9, x5=15
�= �� = � + � + � + � + � = + + + =
Pagina 63
Calcolo delle frequenze cumulate
Frequenza Assoluta Cumulata della modalità xi
Frequenza Relativa Cumulata della modalità xi
Frequenza Percentuale Cumulata della modalità xi
� = ℎ=� �ℎ = � + � +⋯+ ���� =ℎ=� �ℎ = � + � +⋯+ ���� =ℎ=� �ℎ = � + � +⋯+ ��
Pagina 64
Calcolo delle frequenze cumulate
Ovviamente in corrispondenza della modalità più grande xK si avrà
Frequenza assoluta cumulata NK=n
Frequenza relativa cumulata FK=1
Frequenza percentuale cumulata PK=100
Pagina 65
In sintesi
Frequenza
Assoluta
Frequenza
Cumulata
n i N i
x 1 n 1 N 1=n 1
x 2 n 2 N 2=n 1+n 2. . .
. . .
. . .
x i n i N i=n 1+n 2+…+n i
. . .
. . .
. . .
x K n K N K=n
Totale n
Carattere
X
Pagina 66
Esempio: frequenze cumulate
Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 secondo la Soddisfazione della Scelta universitaria
Soddisfazione ni Ni
Per nulla 4 4
Poco 34 38
Abbastanza 185 223
Pienamente 60 283
Totale 283
= � + � + � = + + == + � = + =oppure
Pagina 67
Indici sintetici di dimensione
Obiettivo dell’analisi dei dati : studiare i fenomeni collettivi che si manifestano in modo diverso da unità a unità variabilità
Sintesi della distribuzione del carattere con una sola modalità (valore)Indici sintetici di dimensione: medieLa media dà un’idea sintetica della
distribuzione del carattere sul collettivo in esame
Pagina 68
Le medieEsistono molti tipi di media a seconda dell’informazione che si vuole fornire e del tipo di situazione che si sta analizzando
La media deve essere
un valore omogeneo con i dati osservati
compreso tra le modalità della distribuzione(tra le modalità minima e massima se si è in presenza di una mutabile ordinale o di una variabile (principio di Cauchy))
Si distinguono:
medie di posizione
medie analitiche
Pagina 69
Medie di Posizione
Moda e Mediana
Si possono calcolare sia per caratteri qualitativi che quantitativi
Modalità che occupano particolari posizioni all’interno della distribuzione del carattere Non necessariamente cambiano se
cambiano i dati della distribuzione
Sfruttano solo parzialmente l’informazione disponibile
Pagina 70
Moda
Si può calcolare sia per caratteri qualitativiche quantitativi
Modalità cui corrisponde la max frequenza (assoluta, relativa o percentuale)
Può non essere unica
Distribuzione multimodale: due o più mode
Pagina 71
Esempio: qual è la moda?
Soddisfazione ni fi pi
Per nulla 4 0,014 1,4
Poco 34 0,120 12,0
Abbastanza 185 0,654 65,4
Pienamente 60 0,212 21,2
Totale 283 1,000 100.0
Distribuzione dei laureati di SDC nell’a.a. 2003/2004 per Corso di Laurea
Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 secondo la Soddisfazione della Scelta Universitaria
La moda è “ABBASTANZA”
CDL ni
STC 48
SCPO 71
COOP 6
Totale 125
La moda è “SCPO”
Pagina 72
Esempio: qual è la moda?
Num. Corsi Freq. ni
1 15
2 43
3 103
4 80
5 32
6 8
7 2
Totale 283
Distribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Num. Corsi Frequentati
Num. Corsi Freq. ni
1 15
2 43
3 103
4 80
5 32
6 8
7 2
Totale 283
La moda è “3”
Pagina 73
Esempio: distribuzione multimodaleDistribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 per Tipo di Maturità
Tipo di
Maturità n i f i p i
Classica 12 0,300 30,0
Scientifica 12 0,300 30,0
Tecnica 7 0,175 17,5
Altro 9 0,225 22,5
Totale 40 1.000 100.0
La distribuzione è bimodale
Le mode sono
“Classica” e “Scientifica”
Tipo di
Maturità n i f i p i
Classica 12 0,300 30,0
Scientifica 12 0,300 30,0
Tecnica 7 0,175 17,5
Altro 9 0,225 22,5
Totale 40 1.000 100.0
Pagina 74
MedianaSi può calcolare per caratteri qualitativi ordinati e per caratteri quantitativi
Definizione
modalità che bipartisce la graduatoria (crescente o decrescente) delle osservazioni
U.S. Alice Marco Elisa Lucia Fabio
Modalità Basso Basso Medio Medio Alto
Mediana
Pagina 75
Calcolo della mediana per una variabile: 1
Collettivo di n=5 unità
Variabile osservata X = Altezza
1. Ordino le unità secondo un ordine crescente di Altezza
Pagina 76
Calcolo della mediana per una variabile: 2
Collettivo di n=5 unità
Variabile osservata X = Altezza
2. Identifico l’unità centrale nella serie ordinata dei dati
Pagina 77
Me=155 cm
3. La mediana è il valore che la variabile Altezzaassume sull’unità che divide il collettivo in due parti numericamente uguali
Calcolo della mediana per una variabile: 3
Pagina 78
Me
N.B. Le misure di posizione sono VALORI, NON FREQUENZE!!
Me=x[(n+1)/2]=x[(5+1)/2]=x3Formalmente
n dispari
Pagina 79
EsempioDistribuzione unitaria dei giudizi di 5 studenti
U.S. Giudizio
U1 Buono
U2 Insuf.
U3 Discreto
U4 Suff.
U5 Ottimo
Senza ordine
Posto U.S. Giudizio
1 U2 Insuf.
2 U4 Suff.
3 U3 Discreto
4 U1 Buono
5 U5 Ottimo
Ordine crescente
La mediana è
“Discreto”
Pagina 80
Esempio
Distribuzione unitaria dei voti di 8 studenti
U.S. Voto
U1 22
U2 30
U3 28
U4 18
U5 27
U6 20
U7 25
U8 28
Senza ordine
Posto U.S. Voto
1 U4 18
2 U6 20
3 U1 22
4 U7 25
5 U5 27
6 U3 28
7 U8 28
8 U2 30
Ordine crescenteLe mediane sono
“25” e “27”
Pagina 81
Mediana: il calcolo1) Ordinare in senso crescente (decrescente) le u.s.
rispetto alle modalità su di esse osservate del carattere in esame
2) Individuare l’unità che occupa il posto centrale n dispari
Il posto centrale è
n pari
Ci sono due posti centrali :
2
1n
2
n1
2
ne
Pagina 82
Mediana: il calcolo3) Calcolare la Mediana: è la modalità presentata dall’unità
individuata al punto 2)
n dispari
La mediana è la modalità dell’u.s. che occupa il posto
n pari
La mediana è rappresentata dalla coppia di modalità delle u.s. che occupano i posti n/2 e (n/2)+1 cioè
Me= x(n/2) e Me=x(n/2)+1
Se il carattere è quantitativo, la mediana è la semisomma delle 2 modalità individuate cioè
2
1n
2
1nx
2
122
nn xx
Me
cioè Me=
Pagina 83
EsempioDistribuzione unitaria dei giudizi di 5 studenti
U.S. Giudizio
U1 Buono
U2 Insuf.
U3 Discreto
U4 Suff.
U5 Ottimo
Senza ordine
5n 32
1
n
Posto U.S. Giudizio
1 U2 Insuf.
2 U4 Suff.
3 U3 Discreto
4 U1 Buono
5 U5 Ottimo
Ordine crescente
La mediana è
“Discreto”
Discretoxxn 3
2
1
Pagina 84
Esempio
Distribuzione unitaria dei voti di 8 studenti
U.S. Voto
U1 22
U2 30
U3 28
U4 18
U5 27
U6 20
U7 25
U8 28
Senza ordine
Posto U.S. Voto
1 U4 18
2 U6 20
3 U1 22
4 U7 25
5 U5 27
6 U3 28
7 U8 28
8 U2 30
Ordine crescente
8n 512
n
42
n
254
2
xxn 2751
2
xxn
262
2725
22
541
22
xx
xx
Me
nn
Le mediane sono
“25” e “27”
Pagina 85
Esempio: mediana per una distribuzione di frequenzaDistribuzione degli studenti di SDC frequentanti la facoltà nell’a.a. 2001/2002 secondo la Soddisfazione della Scelta universitaria
283n 1422
1
n Abbastanza142
2
1 xxn
La mediana è
“Abbastanza”
Soddisfazione ni Ni
Per nulla 4 4
Poco 34 38
Abbastanza 185 223
Pienamente 60 283
Totale 283
Posti in graduatoria
Da 1 a 4
Da 5 a 38
Da 39 a 223
Da 224 a 283
Pagina 86
Proprietà della Mediana
1) E’ sempre compresa tra la modalità minima x1 e la modalità massima xK del carattere
2) E’ robusta cioè è poco sensibile ai cambiamenti che possono avvenire sulle modalità estreme della distribuzione del carattere
Pagina 87
Medie Analitiche
Media aritmetica
Si possono calcolare solo per caratteri quantitativi (variabili continue o discrete)
Sono funzioni matematiche di tutti i dati osservati
Cambiano se si cambia anche un solo dato
Sfruttano completamente l’informazione statistica disponibile
Pagina 88
Media Aritmetica: il calcolo
1) Distribuzione unitaria semplice del carattere X
x1, x2, …, xi, … xn
U.S. Voto Maturità
1 98
2 100
3 70
4 72
5 70
6 100
7 85
8 65
9 60
10 88
8.8010
808
10
8860658510070727010098
M
10n
= � + � +⋯+ �� +⋯+ ��� = σ�=� ����= �� = + + + + + + + + + =
Ammontare del carattere
Pagina 89
Media Aritmetica: il calcolo
2) Distribuzione semplice di frequenze assolute del carattere X
Car. XFREQUENZE ASSOLUTE
FREQUENZE RELATIVE
x1 n1 f1
x2 n2 f2
… … …
xi ni fi
… … …
xK nK fK
Totale n 1
MEDIA ARITMETICA PONDERATA
= � � + � � +⋯+ ���� +⋯+ �����= σ�=1� ����� =σ�=� ����