Lezio02sito-2014frequenze
-
Upload
francesco-altamura -
Category
Documents
-
view
9 -
download
3
description
Transcript of Lezio02sito-2014frequenze
1
SCALE DI MISURA
Si basano su tre elementi interconnessi:
Un sistema empirico: insieme di entità non numeriche (persone, o stimoli, o item)
Un sistema numerico
Una regola: per passare dalle entità ai numeri
*le proprietà del sistema empirico condizionano la scelta del sistema numerico
* le proprietà del sistema numerico determinano la scelta della regola di passaggio
* i diversi tipi di scale di misura sono caratterizzati dai tre elementi
Scale di misura che analizzeremo
Scala nominale
Scala ordinale
Scala a rapporti equivalenti
Scala a intervalli equivalenti
SCALA NOMINALE
E’ il livello più basso di misurazione. Qualitativo, si tratta di una semplice categorizzazione.
I numeri stanno al posto dei nomi delle categorie, ma non hanno un valore vero e proprio ne’ una relazione d’ordine.
Sistema empirico: suddivisione in categorie distinte che si escludono l’una con l’altra
Sistema numerico: numeri usati come simboli
Regola: attribuire numeri uguali agli elementi appartenenti alla stessa categoria, e numeri diversi ad elementi
appartenenti a categorie diverse
PROPRIETA' DEL SIMBOLO NUMERICO: SOLO FORMA DIVERSA DEL SIMBOLO
Esempio 1:
sistema empirico: “genere”, le entità (persone) sono suddivise in categorie “maschi” e “femmine”
sistema numerico: numeri: “1” e “2”
regola: attribuire “1” ai maschi e “2” alle femmine
1 = MASCHI
2 = FEMMINE
ma anche
sistema numerico: numeri “1” e “2”
regola: attribuire “1” alle femmine e “2” ai maschi
1 = FEMMINE
2 = MASCHI
oppure
sistema numerico: numeri “3” e “7”
regola: attribuire “3” ai maschi e “7” alle femmine
3 = MASCHI
7 = FEMMINE
E’ PIU’ CORRETTO DEFINIRE QUESTE VARIABILI CON IL TERMINE DI MUTABILI
2
Esempio 2:
sistema empirico: “malattia mentale”, le entità (persone) sono pazienti di un reparto psichiatrico suddivisi secondo la
patologia
sistema numerico: numeri: della scala naturale
regola: attribuire “1” ai depressi, “2” ai nevrotici, “3” agli psicotici, ecc.
SCALA ORDINALE
SI PUO' CONSIDERARE UNA PRIMA FORMA DI QUANTIFICAZIONE
(CONFRONTO TRA ESEMPIO DI categorie per RELIGIONE e di RAGGRUPPAMENTO per CETO SOCIALE
definito attraverso classi di reddito e livello di istruzione)
1 = CETO SUPERIORE 2 = CETO MEDIO
3 = CETO MEDIO-INFERIORE 4 = CETO SVANTAGGIATO
E' INTRODOTTO IL CONCETTO DI ORDINE
LE CATEGORIE POSSONO ESSERE ORDINATE RISPETTO A RELAZIONI DI TIPO "MAGGIORE DI...",
"MINORE DI..."
E' POSSIBILE FORMARE UNA GRADUATORIA
ATTRIBUIRE UN RANGO
IL "CETO MEDIO" E', IN UNA GRADUATORIA DI LIVELLO SOCIO-CULTURALE, SUPERIORE AL "CETO
SVANTAGGIATO", MA NON E' DEFINITO "DI QUANTO" SUPERIORE.
IL NUMERO CHE VIENE ASSOCIATO A CIASCUNA CATEGORIA ESPRIME QUINDI UNA
RELAZIONE D'ORDINE
TRA LE QUANTITA'
SIA X LA CARATTERISTICA OGGETTO DI STUDIO (risposta ad una domanda su quante volte il soggetto si sente
depresso la mattina al risveglio)
in tre categorie così definite: mai, qualche volta, spesso.
“1” = mai
“2” = qualche volta
“3” = spesso
Possiamo affermare che i soggetti cui viene attribuito lo stesso numero presentano la stessa quantità della caratteristica
X
(rispondono nello stesso modo)
Possiamo affermare che la quantità di caratteristica X associata a “spesso” è maggiore di quella associata a “qualche
volta”, ma non che la distanza tra “spesso” e “qualche volta” è la stessa di quella tra “qualche volta” e “mai”, anche se si
attribuisce punteggio 3 a “spesso”, 2 a “qualche volta” e 1 a “mai”.
Possiamo affermare che i soggetti a cui viene attribuito il numero “1” presentano una quantità della caratteristica X
minore rispetto a quelli cui viene attribuito il numero “2”, ma sarebbe un errore ritenere, per esempio, che i soggetti col
numero “2” abbiano la caratteristica X in quantità doppia.
OPERAZIONI POSSIBILI: CALCOLO DELLE FREQUENZE E
ALTRI INDICI STATISTICI (COME MEDIANA, CORRELAZIONI TRA RANGHI)
3
DUE MODI DI CONSIDERARE UNA MISURA ORDINALE
1) POSSIAMO IMMAGINARE UN CONTINUUM SUL QUALE VENGONO POSTI I SOGGETTI IN ORDINE
SECONDO LA QUANTITA' MAGGIORE O MINORE DI UNA CERTA CARATTERISTICA X.
SE X E' LA GRADUATORIA SECONDO I RISULTATI DI UN TEST DI SELEZIONE, IN UN PUNTO DEL
CONTINUUM CI SARA' UN SOLO SOGGETTO:
NOME. ANT BRU CAR DAR ENZ GIO ....
CLASSIFICA 3° 6° 1° 4° 2° 5°
1° 2° 3° 4° 5° 6° 7° ........
car enz ant dar gio bru xxx
CAR > ENZ > ANT. ....
SE DUE SOGGETTI OTTENGONO RISULTATO IDENTICO (TAGLIANO INSIEME IL TRAGUARDO IN UNA
GARA DEI 100m, O SONO GIUDICATI EQUIVALENTI NELLA PROVA DI SELEZIONE), IL RANGO
ATTRIBUITO A CIASCUNO DEI DUE E' LA MEDIA DEI DUE RANGHI CHE AVREBBERO OCCUPATO IN
GRADUATORIA:
ES: GIO E DAR SONO EQUIVALENTI (pari merito) . A CHI ASSEGNARE IL 4° E A CHI IL 5° POSTO?
SI ASSEGNA A TUTTI E DUE IL POSTO 4.5 [(4+5):2], POI BRU AVRA' NORMALMENTE IL 6°
2) SE INVECE CONSIDERIAMO LA CLASSIFICAZIONE DI 55 SOGGETTI SECONDO LA CARATTERISTICA
X = RISPOSTA ALLA DOMANDA, SI AVRANNO MOLTI SOGGETTI CLASSIFICATI IN CIASCUNA DELLE 3
DIFFERENTI CATEGORIE IDENTIFICATE (1 = mai, 2 = qualche volta, 3 = spesso).
Risposta: NUMERO DI SOGGETTI
1 10
2 20
3 25
MENTRE PER LA MUTABILE GENERE ERA INDIFFERENTE ASSEGNARE
1 = MASCHIO 2 = FEMMINA oppure
1 = FEMMINA 2 = MASCHIO
NEL CASO della risposta X OCCORRE RISPETTARE L'ORDINE.
NON SAREBBE CORRETTO, PER ESEMPIO
1 = qualche volta
2 = spesso
3 = mai
ALTRO ESEMPIO DI VARIABILE ORDINALE:
X = ASSIDUITA' DI FREQUENZA ALLE LEZIONI
RISPOSTE POSSIBILI:
a) FREQUENTO TUTTE LE LEZIONI
b) FREQUENTO UNA/DUE VOLTE A SETTIMANA
c) FREQUENTO UNA/DUE VOLTE AL MESE
d) FREQUENTO SALTUARIAMENTE
e)NON FREQUENTO MAI LE LEZIONI
4
a = 1 (massima frequenza), b = 2, c = 3, d = 4,
e = 5 (frequenza minima)
oppure: a = 5 (massima frequenza), b = 4, c = 3, d = 2,
e = 1 (frequenza minima)
ma sarebbe scorretto 1 = c, 2 = e, 3 = b, ecc…
vedremo dopo la scala a intervalli.
SCALA A RAPPORTI EQUIVALENTI
Detta anche “PROPORZIONALE” e “RAZIONALE”
E' IL LIVELLO SUPERIORE DI MISURA
E' UNA VERA E PROPRIA MISURA QUANTITATIVA
OLTRE ALLA RELAZIONE D'ORDINE, SI AGGIUNGE IL CONCETTO DI UNITA' DI MISURA COSTANTE
(PER ES. METRI, MINUTI, CM), CHE PERMETTE DI INDICARE L'ESATTA DISTANZA TRA DUE SOGGETTI
INOLTRE ESISTE LO "ZERO ASSOLUTO", CIOE' LA MANCANZA TOTALE DELLA CARATTERISTICA X
(ANCHE SOLO TEORICA), CHE PORTA ALLA COSTANZA DEL RAPPORTO TRA I VALORI (ANCHE SE SI
CAMBIA UNITA' DI MISURA)
CON QUESTO LIVELLO DI MISURA, LE CUI CARATTERISTICHE SPECIFICHE SONO:
LO “ZERO ASSOLUTO” e la “COSTANZA DEL RAPPORTO TRA I VALORI UTILIZZATI”
SONO POSSIBILI TUTTI I TIPI DI CALCOLO
MA
NON ESISTONO SCALE DI QUESTO TIPO PER MISURARE CARATTERISTICHE PSICOLOGICHE.
SI TRATTA, DI SOLITO, DI MISURE DI TIPO FISICO.
Sistema empirico: è possibile stabilire un’UNITA’ DI MISURA (es. misura del tempo, secondo) e anche identificare un
elemento di intensità nulla (lo zero assoluto)
ESEMPIO: X = TEMPO IN MINUTI IMPIEGATO DAI SOGGETTI PER COMPLETARE UN TEST
UNITA' DI MISURA = MINUTI
Sistema numerico e Regola: gode di tutte le proprietà dei numeri reali. E’ possibile stabilire le entità delle differenze di
intensità della caratteristica ma anche l’uguaglianza del rapporto fra due elementi
DISTANZA : TRA 3 MIN E 2 MIN, C'E' DISTANZA 3-2 = 1
TRA 4 MIN E 3 MIN, C'E' DISTANZA 4-3 = 1
E IL SECONDO VALORE "1" E' UNA QUANTITA' UGUALE AL PRIMO VALORE "1"
(INVECE LA DISTANZA FRA qualche volta (2) E mai(1) NON SI PUO' DIRE CHE ABBIA VALORE "1" COME LA
DISTANZA TRA spesso (3) E qualche volta (2))
RAPPORTO: A) 2 MINUTI E' IL DOPPIO DI 1 MINUTO: 2:1 = 2
B) 12 MINUTI E' IL TRIPLO DI 4 MINUTI: 12:4 = 3
E IL RAPPORTO RESTA COSTANTE ANCHE SE CAMBIAMO UNITA' DI MISURA, PER ES. TRASFORMANDO I
MINUTI IN SECONDI
1 MINUTO = 60 SECONDI
A) 120 SEC E' IL DOPPIO DI 60 SEC: 120:60 = 2
B) 720 SEC E' IL TRIPLO DI 240 SEC: 720:240 = 3
5
SCALA A INTERVALLI EQUIVALENTI
E’ UN LIVELLO DI MISURA SUPERIORE ALLA SCALA ORDINALE, MA INFERIORE ALLA SCALA A
RAPPORTI EQUIVALENTI.
IN PSICOLOGIA E' RARO POTER MISURARE VARIABILI CON SCALA A RAPPORTI EQUIVALENTI
SPESSO LO "ZERO" NON INDICA MANCANZA TOTALE DELLA CARATTERISTICA X, MA E' UN VALORE
ARBITRARIO ASSEGNATO COME VALORE MINIMO SU UNA SCALA DI VALORI CHE RAPPRESENTANO
UN CONTINUUM DELLA CARATTERISTICA X.
NON SI PUO' PENSARE A INTELLIGENZA = 0, o NEVROTICISMO = 0
COSI' COME NON E' VERO CHE INTELLIGENZA 110 E' IL DOPPIO DI INTELLIGENZA 55
LA SCALA PIU' USATA IN PSICOLOGIA E' QUELLA
A INTERVALLI EQUIVALENTI
SI POSSONO APPLICARE TUTTE LE OPERAZIONI ALGEBRICHE TRA I PUNTEGGI E SULLE DIFFERENZE
TRA NUMERI
CONSENTE L'USO DI TUTTE LE TECNICHE STATISTICHE
Sistema empirico: è possibile stabilire un’UNITA’ DI MISURA (QUESTA è LA SUA CARATTERISTICA)
Sistema numerico e Regola: è possibile stabilire le entità delle differenze di intensità della caratteristica
(ma non l’uguaglianza del rapporto fra due elementi)
SE SI ADOPERA UNA SCALA CHE MISURA, PER ES, L'ANSIA, E SI ASSEGNANO PUNTEGGI DA 10 A 60:
SOGGETTO PUNTEGGIO
A 15
B 30
C 55
D 20
E 40
E' VERO CHE LA DISTANZA TRA I SOGGETTI E-B e B-D E' UGUALE (EQUIVALENTE)
E - B 40-30 = 10
B - D 30-20 = 10
MA NON E' VERO CHE IL SOGGETTO "E" HA UN PUNTEGGIO DOPPIO DEL SOGGETTO "D"
ATTENZIONE
E’ possibile passare da una scala di livello superiore a una di livello inferiore MA NON VICEVERSA
Per esempio: passare da una scala a intervalli ad una ordinale
1) da “età” a “classi di età”
0-12 anni = 1 (bambini)
13-18 anni = 2 (adolescenti)
19-30 anni = 3 (giovani)
31-60 = 4 (adulti)
> 60 = 5 (anziani)
2) da tempi impiegati dai piloti in una corsa di Formula1 a graduatoria di arrivo
da voti ottenuti in un test attitudinale a graduatoria per la selezione del personale
6
ma non è possibile fare il contrario, per esempio conoscendo solo la graduatoria di arrivo in Formula1, indurre le
distanze tra i tempi impiegati dai vari piloti
Ricordiamo
VARIABILI CONTINUE
LE VARIABILI CHE POSSONO ASSUMERE QUALSIASI VALORE DELLA SCALA NUMERICA
ES: ALTEZZA, TEMPI DI REAZIONE
VARIABILI DISCRETE
LE VARIABILI CHE POSSONO ASSUMERE SOLO ALCUNI VALORI DELLA SERIE NUMERICA
ES: IL NUMERO DI COMPONENTI IL NUCLEO FAMILIARE
IN REALTA' LA MAGGIOR PARTE DELLE VARIABILI E' CONSIDERATA DISCRETA SOLO PER
L'IMPRECISIONE DELLO STRUMENTO
MA SI SUPPONGONO INSERITE IN UN CONTINUUM SOTTOSTANTE
PER I TEMPI DI REAZIONE, POSSIAMO AVERE UNA MISURA ESPRESSA IN MINUTI. I VALORI CHE X
PUO' ASSUMERE SARANNO SOLO 1, 2, ...10 ...
ECC. SE DISPONIAMO DI UNO STRUMENTO CHE MISURA ANCHE I SECONDI, POSSIAMO AVERE
MISURE DEL TIPO: 1' e 30", OPPURE 90".
SE DISPONIAMO DI UN CRONOMETRO, I VALORI CHE X PUO' ASSUMERE SONO PIU' PRECISI, ANCHE
FINO AI MILLESIMI DI SECONDO.
ESPRIMERE IL TEMPO IN MINUTI (1,2, 4.....) NON VUOL DIRE CHE IL TEMPO E' UNA VARIABILE
DISCRETA, MA SOLO CHE NON DISPONIAMO DI UNO STRUMENTO ADATTO A RILEVARNE LA
CONTINUITA'.
LA RILEVAZIONE DEI DATI
DATO:
RISULTATO DI UNA MISURA EFFETTUATA SU DI UN ELEMENTO DELLA POPOLAZIONE OSSERVATA;
PUO’ TRATTARSI DI UN OGGETTO O DI UN INDIVIDUO
LA SCELTA DEGLI STRUMENTI PER LA RILEVAZIONE (RACCOLTA) DEI DATI E' LEGATA:
ALLA NATURA DELLE VARIABILI DA STUDIARE, MA ANCHE AD ASPETTI PRATICI COME COSTI E
TEMPI
TRA I VARI METODI DI RACCOLTA DEI DATI:
OSSERVAZIONE IN LABORATORIO
OSSERVAZIONE SUL CAMPO
ANALISI DI FONTI UFFICIALI
INTERVISTE
SOMMINISTRAZIONE DI QUESTIONARI
SCALE TIPO "LIKERT"
SOMMINISTRAZIONE DI TEST
7
TABULAZIONE DEI DATI
DOPO AVER RACCOLTO I DATI, BISOGNA ORGANIZZARLI PER POTERLI ELABORARE AI FINI DELLA
LORO DESCRIZIONE, SINTESI, TRADURLI IN INFORMAZIONI.
SUPPONIAMO DI AVER SVOLTO UN’INDAGINE SOTTOPONENDO A 15 SOGGETTI DI VARIE ETA’ UNA
SCALA CHE MISURA IL LIVELLO DI AUTORITARISMO.
VARIABILE X = PUNTEGGIO DI AUTORITARISMO (10 = NON AUTORITARIO……60 = MOLTO
AUTORITARIO)
VARIABILE Y = GENERAZIONE (1 = GIOVANI; 2 = ADULTI; 3 = ANZIANI)
N = NUMEROSITA' DEL CAMPIONE N = 15
DATI GREZZI:
Il soggetto A , giovane, ha ottenuto X = 30; il soggetto H, anziano, ha ottenuto X = 20; e così via.
Dati grezzi
Sogg A B C D E F G H I L M N O P Q
Y 1 3 2 1 1 3 2 3 2 1 2 3 1 2 3
X 30 50 40 20 30 60 40 20 20 50 30 40 30 40 40
ORGANIZZIAMO, RAGGRUPPIAMO I DATI PER POTERLI DESCRIVERE:
X INDICA GENERICAMENTE LA VARIABILE AUTORITARISMO CHE PUO' ASSUMERE K = 6 VALORI
DIVERSI (10, 20, 30, 40, 50, 60)
Xi i INDICE DEI K VALORI DIVERSI CHE PUO' ASSUMERE X (QUINDI i VA DA 1 A 6)
X1 =valore10; X2 = valore 20; X3 =valore 30....ECC.
QUANTE VOLTE COMPARE, NEL CAMPIONE DI N= 15 SOGGETTI, IL VALORE X2 = 20?
CONTANDO RISULTA 3 VOLTE
Fi INDICA LA FREQUENZA CON CUI COMPARE IL VALORE i-esimo; F2 = 3 indica che la FREQUENZA del
valore X2 è 3
DISTRIBUZIONE DI FREQUENZA
Xi X Fi
X1 10 0
X2 20 3
X3 30 4
X4 40 5
X5 50 2
X6 60 1
Fi E' IL NUMERO DI VOLTE IN CUI SI VERIFICA UN DETERMINATO EVENTO IN UN GRUPPO DI EVENTI
POSSIBILI CIOE' IL NUMERO DI CASI CHE ASSUMONO UN CERTO VALORE Xi DI X, TRA I K VALORI
POSSIBILI
8
NATURALMENTE LA SOMMA DI TUTTE LE FREQUENZE Fi DEVE ESSERE UGUALE A N
F Fi
i
k
i
1 1
6
0 3 4 5 2 1 15
X (PUNTEGGIO DI AUTORITARISMO) E' UNA VARIABILE MISURATA SU SCALA INTERVALLO
E’ QUINDI POSSIBILE FARE LA SOMMA DEI 15 VALORI X
PARTENDO DAI DATI GREZZI:
Sogg A B C D E F G H I L M N O P Q
Y 1 3 2 1 1 3 2 3 2 1 2 3 1 2 3
X 30 50 40 20 30 60 40 20 20 50 30 40 30 40 40
X = 30 + 50 + 40 + 20 + 30 +60 + 40 +20 +20 + 50 +30 + 40+
+30 + 40 +40 = 540
UTILIZZANDO LA DISTRIBUZIONE DI FREQUENZA
Xi X Fi XiFi
X1 10 0 0 (10 x 0)
X2 20 3 60 (20 x 3)
X3 30 4 120 (30 x 4)
X4 40 5 200 (40 x 5)
X5 50 2 100 (50 x 2)
X6 60 1 60 (60 x 1)
-----------------
15 540
Xi Fi = X1 F1 + X2 F2 +....+ X6 F6 = 0 + 60 + 120 +200 +100 +60 = 540
CONSIDERIAMO ORA Y, CIOE' LA "GENERAZIONE"
SI TRATTA DI UNA VARIABILE MISURATA SU SCALA ORDINALE, SI TRATTA COMUNQUE DI
CATEGORIE,: Y PUO' ASSUMERE K = 3 VALORI ( 1 = GIOVANI; 2 = ADULTI; 3 = ANZIANI)
DISTRIBUZIONE DI FREQUENZA
Yi Y Fi
Y1 1 5
Y2 2 5
Y3 3 5
-----
15
NON HA SENSO FARE LA X DAI DATI GREZZI NE' LA XF
SI PUO' FARE SOLO LA SOMMATORIA DELLE FREQUENZE, CHE DEVE NATURALMENTE RISULTARE
UGUALE A N: Fi = 5 + 5 + 5 = 15
9
DISTRIBUZIONE DELLE FREQUENZE PERCENTUALI
N = NUMERO TOTALE DI CASI (SOGGETTI O OSSERVAZIONI)
Fi = FREQUENZA DI CASI CHE ASSUMONO VALORE Xi
Fi% = PERCENTUALE DEI CASI CHE ASSUMONO VALORI Xi
Fi% SIGNIFICA CHE SI E' FATTA UNA TRASFORMAZIONE DA N A 100, IN MODO CHE LA PROPORZIONE
SIA PIU' IMMEDIATAMENTE COMPRENSIBILE
PER IL CALCOLO DELLA PERCENTUALE:
DALLA PROPORZIONE . Fi% : 100 = Fi : N CHE SI PUO' SCRIVERE
F F
Ni i%
100
SI RICAVA
N
FF i
i
100%
NATURALMENTE LA SOMMA DI TUTTE LE Fi% DEVE RISULTARE = 100
ANCHE SE NON HA MOLTO SENSO FARE LA % QUANDO N E' PICCOLO PERCHE' SI "GONFIANO" I DATI
E’ SEMPRE POSSIBILE TRASFORMARE UNA DISTRIBUZIONE DI FREQUENZA IN DISTRIBUZIONE
PERCENTUALE
PER L'ESEMPIO
Yi Y Fi Fi%
Y1 1 5 33.33 (5 x 100) : 15
Y2 2 5 33.33
Y3 3 5 33.34
------ -----------
15 100.00
PER LA VARIABILE AUTORITARISMO
Xi X Fi Fi%
X1 10 0 0.00
X2 20 3 20.00 (3 x 100) : 15 = 20.00
X3 30 4 26.67 (4 x 100) : 15 = 26.6666
X4 40 5 33.33 (5 x 100) : 15 = 33.3333
X5 50 2 13.33 (2 x 100) : 15 = 13.3333
X6 60 1 6.67 (1 x 100) : 15 = 6.6666
------ ---------
15 100.00
10
(CONSIDERARE IL PROBLEMA DEGLI ARROTONDAMENTI)
PROBLEMA INVERSO
CONOSCENDO LA PERCENTUALE E LA BASE N, SI PUO' RICOSTRUIRE LA Fi, USANDO LA FORMULA
INVERSA
FF N
ii%
100
PER ES: percentuale 33.33 (del punteggio X = 40) e N = 15, a quale F corrisponde?
999.4100
1533.33
F
(arrotondando) F = 5
ATTENZIONE A RISULTATI RIFERITI IN MODO DISTORTO
ESEMPIO:
DA UNA INDAGINE RISULTA CHE L'80% DEI SOGGETTI RITIENE CHE LA LEGGE SUL DIVORZIO VADA
ABROGATA.
BASE N = 350
DOMANDA 1 ) RITIENI CHE LA LEGGE SUL DIVORZIO DEBBA ESSERE MODIFICATA O LASCIATA
COME E'?
MODIFICATA F = 100 F% = 28.57% LASCIATA F = 250 F% = 71.43%
DOMANDA 2) SE HAI RISPOSTO "MODIFICATA", RITIENI CHE IL DIVORZIO DEBBA ESSERE ABROGATO
O LIBERALIZZATO? BASE = 100
ABROGATO F = 80 F% = 80.00% LIBERALIZZATO F = 20 F% = 20.00%
MA IN REALTA' QUANTI DEI 350 INTERVISTATI HA RISPOSTO "ABROGATA"?
SOLO 80 SU UNA BASE DI 350, CIOE' IL 22.86%
FREQUENZE CUMULATE
Per ogni valore di Xi si calcola la somma delle frequenze FINO a quel valore compreso. La frequenza cumulata ci dice
“quanti soggetti/osservazioni hanno un valore X Xi”
ESEMPIO
Xi fi fcum
----------------------------------------
18 2 2
19 2 4
20 3 7
21 1 8
22 2 10
23 2 12
----
12
11
Considerando X = 18, n = 2 soggetti hanno punteggio 18.
Considerando X = 22, n = 10 soggetti hanno punteggio 22.
L’ultima frequenza cumulata, cioè quella corrispondente all’ultimo valore di X, è necessariamente = N (nell’esempio =
12)
Si possono cumulare anche le frequenze percentuali e si leggono nello stesso modo.
Xi fi f% f%CUM
-------------------------------------
18 2 16.7 16.7
19 2 16.7 33.4
20 3 25.0 58.4
21 1 8.3 66.7
22 2 16.7 83.4
23 2 16.6 100.00
-------------------
12 100.0
Considerando X = 22, l’83,4% dei soggetti ha punteggio 22.
L’ultima frequenza percentuale cumulata, cioè quella corrispondente all’ultimo valore di X, è necessariamente = 100,00
(nell’esempio = 12)
ESEMPIO
1) DATI GREZZI X = voto esame universitario rilevato su 12 studenti:
18 19 20 20 22 18 22 19 20 23 21 23
Xi
N
1
=[ i va da 1 a N (1 a 12), è un indice del soggetto]
X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12 =
18 +19 +20 +20 +22+18 +22 +19 +20 +23 + 21 +23 = 245
costruiamo la
2) DISTRIBUZIONE DI FREQUENZA di
18 19 20 20 22 18 22 19 20 23 21 23
Xi fi Xi fi
--------------------------------------------------
i=1 18 2 36
i=2 19 2 38
i=3 20 3 60
i=4 21 1 21
i=5 22 2 44
i=6 23 2 46
----- -----
12 245
in questo caso “i” è un indice dei k diversi valori che può assumere X, e va da 1 a 6.
X fi
K
i
1
= [i va da 1 a k, (1 a 6) è un indice del numero dei k valori diversi, ordinati, che X può assumere]
= X1 f1 + X2 f2 + X3 f3 + X4 f4 + X5 f5 +X6 f6 =
= 182 + 192 + 203 + 211 + 222 + 232 = 36 + 38 + 60 + 21 + 44 + 46 = 245
12
3) trasformiamo le frequenze in percentuali
Xi fi f%
-----------------------------------------
18 2 16.7
19 2 16.7
20 3 25.0
21 1 8.3
22 2 16.7
23 2 16.6
------ ----------
12 100.0
classi di punteggi
SE I VALORI DIVERSI CHE X PUO’ ASSUMERE SONO TANTI, E’ OPPORTUNO FARE UN
ULTERIORE RAGGRUPPAMENTO, COSTRUENDO INTERVALLI DI AMPIEZZA SUPERIORE A 1,
CIOE’ CLASSI DI VALORI CHE CONTENGANO PIU’ VALORI DI X
PER ESEMPIO, SIA X L’ETA’ (UNITA’ DI MISURA: ANNI) MISURATA SU N = 30 SOGGETTI, DISTRIBUITA
COME SEGUE:
X (età) f
----------------------
18 3
19 3
20 4
21 6
22 5
23 4
24 3
25 2
--------
30
E’ POSSIBILE PERO’ RAGGRUPPARE I VALORI DI X IN CLASSI, per esempio DI AMPIEZZA 2, creare
cioè degli INTERVALLI CHE CONTENGONO ciascuno 2 VALORI DI X
CLASSI f
------------------------------
18 - 19 6 (3 + 3) fr. 3 di X = 18 + freq. 3 di X = 19
20 - 21 10 (4 + 6)
22 - 23 9 (5 + 4)
24 - 25 5 (3 + 2)
---
30
naturalmente N (numero totale di soggetti) resterà uguale, N = 30
POTREMMO COSTRUIRE INTERVALLI DI AMPIEZZA superiore a due, MA ANCHE DI AMPIEZZE
DIVERSE in diverse classi, DIPENDE DA QUANTI E QUALI VALORI PUO’ ASSUMERE X.
LA DISTRIBUZIONE CON LE FREQUENZE ATTRIBUITE A CIASCUN SINGOLO VALORE DI X è
considerata come distribuzione in classi di AMPIEZZA UNITARIA
X f
---------------------
18 3
19 3
20 4
21 6
22 5
23 4
24 3
25 2
-------
30
13
AMPIEZZA 3 AMPIEZZE DIVERSE
CLASSI ampiezza f CLASSI ampiezza f
------------------------------------------ ----------------------------------------------
18 - 20 3 10 18 - 19 2 6
21 - 23 3 15 20 - 22 3 15
24 - 26 3 5 23 - 25 3 9
----------- ------
30 30
ESTREMI DI UNA CLASSE:
IN UNA CLASSE il VALORE PIU’ BASSO E’ IL LIMITE INFERIORE (limi)
E IL VALORE PIU’ ALTO E’ IL LIMITE SUPERIORE (lims)
L’ampiezza (a) si calcola: a = (lims - limi)+ 1
classe 18 - 19 a = (19 - 18) + 1 = 2 classe 20 - 22 a = (22 - 20) + 1 = 3
QUESTI SI DICONO LIMITI TABULATI COSTRUENDO INTERVALLI DI AMPIEZZA > 1 SI
SINTETIZZA ULTERIORMENTE L’INFORMAZIONE
PROBLEMI:
QUANTI INTERVALLI/CLASSI COSTRUIRE? QUALE DEVE ESSERE L’AMPIEZZA?
TRE CRITERI - GUIDA DA TENERE PRESENTI:
1 - COPRIRE L’INTERA GAMMA DEI PUNTEGGI
2 - INTERVALLI DI UGUALE AMPIEZZA (SE POSSIBILE)
3 - MUTUALMENTE ESCLUSIVI
1 - E’ INTUITIVO. SE, NELL’ESEMPIO, IL PRIMO INTERVALLO FOSSE
20-22, PERDEREIMMO TUTTI I SOGGETTI DI 18 E 19 ANNI
2 - DIPENDE DAL TIPO DI MISURA E DALLA DISTRIBUZIONE DEI PUNTEGGI. SE E’ POSSIBILE, E’
MEGLIO AVERE INTERVALLI DI UGUALE AMPIEZZA (SONO COMPARABILI TRA LORO, E’ PIU’
FACILE LA RAPPRESENTAZIONE GRAFICA ECC.). DI SOLITO AMPIEZZA 3, 5, 10,
O MULTIPLI DI 10.
NUMERO DI INTERVALLI: NON TROPPI (<= 20),
NON TROPPO POCHI (>= 5)
3 -DEVE ESSERE CHIARO DOVE VA INSERITO OGNI SOGGETTO
CLASSI
----------
18 – 19
19 - 20
20 - 21
UN SOGGETO DI ETÀ X = 19, DOVE VA INSERITO? NELLA PRIMA O NELLA SECONDA CLASSE’
14
PER ESEMPIO, SE X E’ UNA VARIABILE DISCRETA CHE PUO’ ASSUMERE SOLO VALORI INTERI
DA 4 A 12, QUESTA DISTRIBUZIONE IN CLASSI NON CREA PROBLEMI:
CLASSI
----------
4 - 6
7 - 9
10 - 12
MA SE X FOSSE UNA VARIABILE CONTINUA CHE PUO’ ASSUMERE VALORI FINO A DUE
DECIMALI, IN QUALE CLASSE SI INSERIREBBE UN SOGGETTO CHE OTTIENE PUNTEGGIO DI
X=6.35? E UNO CON X = 9.89?
DIPENDE DAL TIPO DI MISURA, MA SEMPRE OCCORRE PRECISARE
QUALI SONO I LIMITI REALI (O CONFINI) DELLA CLASSE, OLTRE QUELLI CHE SONO INDICATI
NELLA TABELLA, CHE SI DICONO
LIMITI TABULATI
DI SOLITO SI AGGIUNGE 0.5 (O .05, O .005) AL LIMITE TABULATO SUPERIORE E SI SOTTRAE 0.5
AL LIMITE TABULATO INFERIORE, PER DARE IL SENSO DELLA CONTINUITA’.
Limiti Limiti
tabulati reali a f
------------ -------------------------------------------------------------
18 - 20 17.5-20.5 3 10
21 - 23 20.5-23.5 3 15
24 - 26 23.5-26.5 3 5
30
oppure per ogni classe si può calcolare la semisomma del lim(sup) tabulato della classe precedente e lim(inf)
tabulato della classe successiva.
Per esempio il limite reale superiore della prima classe è: (20+21)/2 = 20.5 che è anche il limite reale inferiore
della seconda classe mentre il limite reale superiore della seconda classe sarà: (23+24)/2 = 23.5
PER EVITARE AMBIGUITA’, I LIMITI REALI (confini) DELLE CLASSI NON DOVREBBERO
COINCIDERE CON LE OSSERVAZIONI REALI.
SI PRECISA POI CHE UNA CERTA CLASSE, PER ES. LA 17.5-20.5, COMPRENDE I PUNTEGGI X FINO
A 20.50 (X < = 20.50), MENTRE LA CLASSE SUCCESSIVA, LA 20.5-23.5, COMPRENDE I PUNTEGGI
MAGGIORI DI 20.50 (CIOE’ DA 20.51 IN SU; X > 20.50)
Con il simbolo -| si intende <=
ALTRO ESEMPI:
X assume tutti i valori da 0 a N, con due cifre decimali
Limiti Disambiguazione Limiti reali
Tabulati
0 - 1 0 -| 1 0.00 – 1.00 0.000 – 1.005
1 - 2 1 -| 2 1.01 – 2.00 1.005 – 2.005
2 - 3 2 -| 3 2.01 – 3.00 2.005 – 3.005
….
Esempio di classi di ampiezza unitaria per X discreto:
18 17.5 - 18.5
19 18.5 - 19.5
20 19.5 - 20.5
…
15
Quando X è una misura discreta, per calcolare l’ampiezza di una classe si può applicare la formula:
a = LIM.REALE SUP. - LIM.REALE INF.
PUNTO CENTRALE DI UN INTERVALLO
X f
----------------------
18 3
19 3
20 4
21 6
22 5
23 4
24 3
25 2
--------
30
possiamo calcolare la somma
ΣXi fi = (18x3)+(19x3)+(20x4)+(21x6)+...+(25x2) = 641
CLASSI f
-----------------------
18 - 19 6
20 - 21 10
22 - 23 9
24 - 25 5
-------
30
COME SI FA LA SOMMA X f ?
PER OGNI INTERVALLO occorre calcolare un valore che rappresenta l’intervallo stesso, cioè IL PUNTO
CENTRALE (O MEDIO)
Indichiamo con Xc tale punto CHE, PER CONVENZIONE, RAPPRESENTA LA CLASSE:
CLASSI f
-----------------------
18 - 19 6
20 - 21 10
22 - 23 9
24 - 25 5
-------
30
Xc = SEMISOMMA DEI LIMITI (TABULATI O REALI)
INTERVALLO 18-19 Xc = 18+19 = 37 = 18.5
2 2
OPPURE 17.5-19.5 Xc = 17.5+19.5 = 37 = 18.5
2 2
CLASSI lim.reali Xc f Xc f
-------------------------------------------------------------------------------
18 - 19 17.5-19.5 18.5 6 111
20 - 21 19.5-21.5 20.5 10 205
22 - 23 21.5-23.5 22.5 9 202.5
24 - 25 23.5-25.5 24.5 5 122.5
----- -------
30 641
16
IN CASO DI CLASSI DI AMPIEZZA UNITARIA, Xc CORRISPONDE ESATTAMENTE AL VALORE X:
PER ES. ETA’ 19, LIMITI REALI 18.5-19.5, Xc =19.
Per le frequenze cumulate delle distribuzioni in classi, si applica la stessa procedura vista precedentemente:
Classi f fcum f% f%cum
18 –19 6 6 20.0 20.0
20 – 21 10 16 33.3 53.3
22 – 23 9 25 30.0 83.3
24 – 25 5 30 16.7 100.0
---- ------
30 100.0
25 soggetti hanno un punteggio X 23 Il 53.3% dei soggetti ha un punteggio X 21
Esercizio: considerando la distribuzione di X:
X f
10 2
20 3
30 4
40 5
50 7
Calcolare: N = f Xf fX 2
Organizzazione dei calcoli
X f X f X2 X
2 f
10 2 20 100 200
20 3 60 400 1200
30 4 120 900 3600
40 5 200 1600 8000
50 7 350 2500 17500
Tot 21 750 30500
f
Xf fX 2