Lezio02sito-2014frequenze

16
1 SCALE DI MISURA Si basano su tre elementi interconnessi: Un sistema empirico: insieme di entità non numeriche (persone, o stimoli, o item) Un sistema numerico Una regola: per passare dalle entità ai numeri *le proprietà del sistema empirico condizionano la scelta del sistema numerico * le proprietà del sistema numerico determinano la scelta della regola di passaggio * i diversi tipi di scale di misura sono caratterizzati dai tre elementi Scale di misura che analizzeremo Scala nominale Scala ordinale Scala a rapporti equivalenti Scala a intervalli equivalenti SCALA NOMINALE E’ il livello più basso di misurazione. Qualitativo, si tratta di una semplice categorizzazione. I numeri stanno al posto dei nomi delle categorie, ma non hanno un valore vero e proprio ne’ una relazione d’ordine. Sistema empirico: suddivisione in categorie distinte che si escludono l’una con l’altra Sistema numerico: numeri usati come simboli Regola: attribuire numeri uguali agli elementi appartenenti alla stessa categoria, e numeri diversi ad elementi appartenenti a categorie diverse PROPRIETA' DEL SIMBOLO NUMERICO: SOLO FORMA DIVERSA DEL SIMBOLO Esempio 1: sistema empirico: “genere”, le entità (persone) sono suddivise in categorie “maschi” e “femmine” sistema numerico: numeri: “1” e “2” regola: attribuire “1” ai maschi e “2” alle femmine 1 = MASCHI 2 = FEMMINE ma anche sistema numerico: numeri “1” e “2” regola: attribuire “1” alle femmine e “2” ai maschi 1 = FEMMINE 2 = MASCHI oppure sistema numerico: numeri “3” e “7” regola: attribuire “3” ai maschi e “7” alle femmine 3 = MASCHI 7 = FEMMINE E’ PIU’ CORRETTO DEFINIRE QUESTE VARIABILI CON IL TERMINE DI MUTABILI

description

.

Transcript of Lezio02sito-2014frequenze

Page 1: Lezio02sito-2014frequenze

1

SCALE DI MISURA

Si basano su tre elementi interconnessi:

Un sistema empirico: insieme di entità non numeriche (persone, o stimoli, o item)

Un sistema numerico

Una regola: per passare dalle entità ai numeri

*le proprietà del sistema empirico condizionano la scelta del sistema numerico

* le proprietà del sistema numerico determinano la scelta della regola di passaggio

* i diversi tipi di scale di misura sono caratterizzati dai tre elementi

Scale di misura che analizzeremo

Scala nominale

Scala ordinale

Scala a rapporti equivalenti

Scala a intervalli equivalenti

SCALA NOMINALE

E’ il livello più basso di misurazione. Qualitativo, si tratta di una semplice categorizzazione.

I numeri stanno al posto dei nomi delle categorie, ma non hanno un valore vero e proprio ne’ una relazione d’ordine.

Sistema empirico: suddivisione in categorie distinte che si escludono l’una con l’altra

Sistema numerico: numeri usati come simboli

Regola: attribuire numeri uguali agli elementi appartenenti alla stessa categoria, e numeri diversi ad elementi

appartenenti a categorie diverse

PROPRIETA' DEL SIMBOLO NUMERICO: SOLO FORMA DIVERSA DEL SIMBOLO

Esempio 1:

sistema empirico: “genere”, le entità (persone) sono suddivise in categorie “maschi” e “femmine”

sistema numerico: numeri: “1” e “2”

regola: attribuire “1” ai maschi e “2” alle femmine

1 = MASCHI

2 = FEMMINE

ma anche

sistema numerico: numeri “1” e “2”

regola: attribuire “1” alle femmine e “2” ai maschi

1 = FEMMINE

2 = MASCHI

oppure

sistema numerico: numeri “3” e “7”

regola: attribuire “3” ai maschi e “7” alle femmine

3 = MASCHI

7 = FEMMINE

E’ PIU’ CORRETTO DEFINIRE QUESTE VARIABILI CON IL TERMINE DI MUTABILI

Page 2: Lezio02sito-2014frequenze

2

Esempio 2:

sistema empirico: “malattia mentale”, le entità (persone) sono pazienti di un reparto psichiatrico suddivisi secondo la

patologia

sistema numerico: numeri: della scala naturale

regola: attribuire “1” ai depressi, “2” ai nevrotici, “3” agli psicotici, ecc.

SCALA ORDINALE

SI PUO' CONSIDERARE UNA PRIMA FORMA DI QUANTIFICAZIONE

(CONFRONTO TRA ESEMPIO DI categorie per RELIGIONE e di RAGGRUPPAMENTO per CETO SOCIALE

definito attraverso classi di reddito e livello di istruzione)

1 = CETO SUPERIORE 2 = CETO MEDIO

3 = CETO MEDIO-INFERIORE 4 = CETO SVANTAGGIATO

E' INTRODOTTO IL CONCETTO DI ORDINE

LE CATEGORIE POSSONO ESSERE ORDINATE RISPETTO A RELAZIONI DI TIPO "MAGGIORE DI...",

"MINORE DI..."

E' POSSIBILE FORMARE UNA GRADUATORIA

ATTRIBUIRE UN RANGO

IL "CETO MEDIO" E', IN UNA GRADUATORIA DI LIVELLO SOCIO-CULTURALE, SUPERIORE AL "CETO

SVANTAGGIATO", MA NON E' DEFINITO "DI QUANTO" SUPERIORE.

IL NUMERO CHE VIENE ASSOCIATO A CIASCUNA CATEGORIA ESPRIME QUINDI UNA

RELAZIONE D'ORDINE

TRA LE QUANTITA'

SIA X LA CARATTERISTICA OGGETTO DI STUDIO (risposta ad una domanda su quante volte il soggetto si sente

depresso la mattina al risveglio)

in tre categorie così definite: mai, qualche volta, spesso.

“1” = mai

“2” = qualche volta

“3” = spesso

Possiamo affermare che i soggetti cui viene attribuito lo stesso numero presentano la stessa quantità della caratteristica

X

(rispondono nello stesso modo)

Possiamo affermare che la quantità di caratteristica X associata a “spesso” è maggiore di quella associata a “qualche

volta”, ma non che la distanza tra “spesso” e “qualche volta” è la stessa di quella tra “qualche volta” e “mai”, anche se si

attribuisce punteggio 3 a “spesso”, 2 a “qualche volta” e 1 a “mai”.

Possiamo affermare che i soggetti a cui viene attribuito il numero “1” presentano una quantità della caratteristica X

minore rispetto a quelli cui viene attribuito il numero “2”, ma sarebbe un errore ritenere, per esempio, che i soggetti col

numero “2” abbiano la caratteristica X in quantità doppia.

OPERAZIONI POSSIBILI: CALCOLO DELLE FREQUENZE E

ALTRI INDICI STATISTICI (COME MEDIANA, CORRELAZIONI TRA RANGHI)

Page 3: Lezio02sito-2014frequenze

3

DUE MODI DI CONSIDERARE UNA MISURA ORDINALE

1) POSSIAMO IMMAGINARE UN CONTINUUM SUL QUALE VENGONO POSTI I SOGGETTI IN ORDINE

SECONDO LA QUANTITA' MAGGIORE O MINORE DI UNA CERTA CARATTERISTICA X.

SE X E' LA GRADUATORIA SECONDO I RISULTATI DI UN TEST DI SELEZIONE, IN UN PUNTO DEL

CONTINUUM CI SARA' UN SOLO SOGGETTO:

NOME. ANT BRU CAR DAR ENZ GIO ....

CLASSIFICA 3° 6° 1° 4° 2° 5°

1° 2° 3° 4° 5° 6° 7° ........

car enz ant dar gio bru xxx

CAR > ENZ > ANT. ....

SE DUE SOGGETTI OTTENGONO RISULTATO IDENTICO (TAGLIANO INSIEME IL TRAGUARDO IN UNA

GARA DEI 100m, O SONO GIUDICATI EQUIVALENTI NELLA PROVA DI SELEZIONE), IL RANGO

ATTRIBUITO A CIASCUNO DEI DUE E' LA MEDIA DEI DUE RANGHI CHE AVREBBERO OCCUPATO IN

GRADUATORIA:

ES: GIO E DAR SONO EQUIVALENTI (pari merito) . A CHI ASSEGNARE IL 4° E A CHI IL 5° POSTO?

SI ASSEGNA A TUTTI E DUE IL POSTO 4.5 [(4+5):2], POI BRU AVRA' NORMALMENTE IL 6°

2) SE INVECE CONSIDERIAMO LA CLASSIFICAZIONE DI 55 SOGGETTI SECONDO LA CARATTERISTICA

X = RISPOSTA ALLA DOMANDA, SI AVRANNO MOLTI SOGGETTI CLASSIFICATI IN CIASCUNA DELLE 3

DIFFERENTI CATEGORIE IDENTIFICATE (1 = mai, 2 = qualche volta, 3 = spesso).

Risposta: NUMERO DI SOGGETTI

1 10

2 20

3 25

MENTRE PER LA MUTABILE GENERE ERA INDIFFERENTE ASSEGNARE

1 = MASCHIO 2 = FEMMINA oppure

1 = FEMMINA 2 = MASCHIO

NEL CASO della risposta X OCCORRE RISPETTARE L'ORDINE.

NON SAREBBE CORRETTO, PER ESEMPIO

1 = qualche volta

2 = spesso

3 = mai

ALTRO ESEMPIO DI VARIABILE ORDINALE:

X = ASSIDUITA' DI FREQUENZA ALLE LEZIONI

RISPOSTE POSSIBILI:

a) FREQUENTO TUTTE LE LEZIONI

b) FREQUENTO UNA/DUE VOLTE A SETTIMANA

c) FREQUENTO UNA/DUE VOLTE AL MESE

d) FREQUENTO SALTUARIAMENTE

e)NON FREQUENTO MAI LE LEZIONI

Page 4: Lezio02sito-2014frequenze

4

a = 1 (massima frequenza), b = 2, c = 3, d = 4,

e = 5 (frequenza minima)

oppure: a = 5 (massima frequenza), b = 4, c = 3, d = 2,

e = 1 (frequenza minima)

ma sarebbe scorretto 1 = c, 2 = e, 3 = b, ecc…

vedremo dopo la scala a intervalli.

SCALA A RAPPORTI EQUIVALENTI

Detta anche “PROPORZIONALE” e “RAZIONALE”

E' IL LIVELLO SUPERIORE DI MISURA

E' UNA VERA E PROPRIA MISURA QUANTITATIVA

OLTRE ALLA RELAZIONE D'ORDINE, SI AGGIUNGE IL CONCETTO DI UNITA' DI MISURA COSTANTE

(PER ES. METRI, MINUTI, CM), CHE PERMETTE DI INDICARE L'ESATTA DISTANZA TRA DUE SOGGETTI

INOLTRE ESISTE LO "ZERO ASSOLUTO", CIOE' LA MANCANZA TOTALE DELLA CARATTERISTICA X

(ANCHE SOLO TEORICA), CHE PORTA ALLA COSTANZA DEL RAPPORTO TRA I VALORI (ANCHE SE SI

CAMBIA UNITA' DI MISURA)

CON QUESTO LIVELLO DI MISURA, LE CUI CARATTERISTICHE SPECIFICHE SONO:

LO “ZERO ASSOLUTO” e la “COSTANZA DEL RAPPORTO TRA I VALORI UTILIZZATI”

SONO POSSIBILI TUTTI I TIPI DI CALCOLO

MA

NON ESISTONO SCALE DI QUESTO TIPO PER MISURARE CARATTERISTICHE PSICOLOGICHE.

SI TRATTA, DI SOLITO, DI MISURE DI TIPO FISICO.

Sistema empirico: è possibile stabilire un’UNITA’ DI MISURA (es. misura del tempo, secondo) e anche identificare un

elemento di intensità nulla (lo zero assoluto)

ESEMPIO: X = TEMPO IN MINUTI IMPIEGATO DAI SOGGETTI PER COMPLETARE UN TEST

UNITA' DI MISURA = MINUTI

Sistema numerico e Regola: gode di tutte le proprietà dei numeri reali. E’ possibile stabilire le entità delle differenze di

intensità della caratteristica ma anche l’uguaglianza del rapporto fra due elementi

DISTANZA : TRA 3 MIN E 2 MIN, C'E' DISTANZA 3-2 = 1

TRA 4 MIN E 3 MIN, C'E' DISTANZA 4-3 = 1

E IL SECONDO VALORE "1" E' UNA QUANTITA' UGUALE AL PRIMO VALORE "1"

(INVECE LA DISTANZA FRA qualche volta (2) E mai(1) NON SI PUO' DIRE CHE ABBIA VALORE "1" COME LA

DISTANZA TRA spesso (3) E qualche volta (2))

RAPPORTO: A) 2 MINUTI E' IL DOPPIO DI 1 MINUTO: 2:1 = 2

B) 12 MINUTI E' IL TRIPLO DI 4 MINUTI: 12:4 = 3

E IL RAPPORTO RESTA COSTANTE ANCHE SE CAMBIAMO UNITA' DI MISURA, PER ES. TRASFORMANDO I

MINUTI IN SECONDI

1 MINUTO = 60 SECONDI

A) 120 SEC E' IL DOPPIO DI 60 SEC: 120:60 = 2

B) 720 SEC E' IL TRIPLO DI 240 SEC: 720:240 = 3

Page 5: Lezio02sito-2014frequenze

5

SCALA A INTERVALLI EQUIVALENTI

E’ UN LIVELLO DI MISURA SUPERIORE ALLA SCALA ORDINALE, MA INFERIORE ALLA SCALA A

RAPPORTI EQUIVALENTI.

IN PSICOLOGIA E' RARO POTER MISURARE VARIABILI CON SCALA A RAPPORTI EQUIVALENTI

SPESSO LO "ZERO" NON INDICA MANCANZA TOTALE DELLA CARATTERISTICA X, MA E' UN VALORE

ARBITRARIO ASSEGNATO COME VALORE MINIMO SU UNA SCALA DI VALORI CHE RAPPRESENTANO

UN CONTINUUM DELLA CARATTERISTICA X.

NON SI PUO' PENSARE A INTELLIGENZA = 0, o NEVROTICISMO = 0

COSI' COME NON E' VERO CHE INTELLIGENZA 110 E' IL DOPPIO DI INTELLIGENZA 55

LA SCALA PIU' USATA IN PSICOLOGIA E' QUELLA

A INTERVALLI EQUIVALENTI

SI POSSONO APPLICARE TUTTE LE OPERAZIONI ALGEBRICHE TRA I PUNTEGGI E SULLE DIFFERENZE

TRA NUMERI

CONSENTE L'USO DI TUTTE LE TECNICHE STATISTICHE

Sistema empirico: è possibile stabilire un’UNITA’ DI MISURA (QUESTA è LA SUA CARATTERISTICA)

Sistema numerico e Regola: è possibile stabilire le entità delle differenze di intensità della caratteristica

(ma non l’uguaglianza del rapporto fra due elementi)

SE SI ADOPERA UNA SCALA CHE MISURA, PER ES, L'ANSIA, E SI ASSEGNANO PUNTEGGI DA 10 A 60:

SOGGETTO PUNTEGGIO

A 15

B 30

C 55

D 20

E 40

E' VERO CHE LA DISTANZA TRA I SOGGETTI E-B e B-D E' UGUALE (EQUIVALENTE)

E - B 40-30 = 10

B - D 30-20 = 10

MA NON E' VERO CHE IL SOGGETTO "E" HA UN PUNTEGGIO DOPPIO DEL SOGGETTO "D"

ATTENZIONE

E’ possibile passare da una scala di livello superiore a una di livello inferiore MA NON VICEVERSA

Per esempio: passare da una scala a intervalli ad una ordinale

1) da “età” a “classi di età”

0-12 anni = 1 (bambini)

13-18 anni = 2 (adolescenti)

19-30 anni = 3 (giovani)

31-60 = 4 (adulti)

> 60 = 5 (anziani)

2) da tempi impiegati dai piloti in una corsa di Formula1 a graduatoria di arrivo

da voti ottenuti in un test attitudinale a graduatoria per la selezione del personale

Page 6: Lezio02sito-2014frequenze

6

ma non è possibile fare il contrario, per esempio conoscendo solo la graduatoria di arrivo in Formula1, indurre le

distanze tra i tempi impiegati dai vari piloti

Ricordiamo

VARIABILI CONTINUE

LE VARIABILI CHE POSSONO ASSUMERE QUALSIASI VALORE DELLA SCALA NUMERICA

ES: ALTEZZA, TEMPI DI REAZIONE

VARIABILI DISCRETE

LE VARIABILI CHE POSSONO ASSUMERE SOLO ALCUNI VALORI DELLA SERIE NUMERICA

ES: IL NUMERO DI COMPONENTI IL NUCLEO FAMILIARE

IN REALTA' LA MAGGIOR PARTE DELLE VARIABILI E' CONSIDERATA DISCRETA SOLO PER

L'IMPRECISIONE DELLO STRUMENTO

MA SI SUPPONGONO INSERITE IN UN CONTINUUM SOTTOSTANTE

PER I TEMPI DI REAZIONE, POSSIAMO AVERE UNA MISURA ESPRESSA IN MINUTI. I VALORI CHE X

PUO' ASSUMERE SARANNO SOLO 1, 2, ...10 ...

ECC. SE DISPONIAMO DI UNO STRUMENTO CHE MISURA ANCHE I SECONDI, POSSIAMO AVERE

MISURE DEL TIPO: 1' e 30", OPPURE 90".

SE DISPONIAMO DI UN CRONOMETRO, I VALORI CHE X PUO' ASSUMERE SONO PIU' PRECISI, ANCHE

FINO AI MILLESIMI DI SECONDO.

ESPRIMERE IL TEMPO IN MINUTI (1,2, 4.....) NON VUOL DIRE CHE IL TEMPO E' UNA VARIABILE

DISCRETA, MA SOLO CHE NON DISPONIAMO DI UNO STRUMENTO ADATTO A RILEVARNE LA

CONTINUITA'.

LA RILEVAZIONE DEI DATI

DATO:

RISULTATO DI UNA MISURA EFFETTUATA SU DI UN ELEMENTO DELLA POPOLAZIONE OSSERVATA;

PUO’ TRATTARSI DI UN OGGETTO O DI UN INDIVIDUO

LA SCELTA DEGLI STRUMENTI PER LA RILEVAZIONE (RACCOLTA) DEI DATI E' LEGATA:

ALLA NATURA DELLE VARIABILI DA STUDIARE, MA ANCHE AD ASPETTI PRATICI COME COSTI E

TEMPI

TRA I VARI METODI DI RACCOLTA DEI DATI:

OSSERVAZIONE IN LABORATORIO

OSSERVAZIONE SUL CAMPO

ANALISI DI FONTI UFFICIALI

INTERVISTE

SOMMINISTRAZIONE DI QUESTIONARI

SCALE TIPO "LIKERT"

SOMMINISTRAZIONE DI TEST

Page 7: Lezio02sito-2014frequenze

7

TABULAZIONE DEI DATI

DOPO AVER RACCOLTO I DATI, BISOGNA ORGANIZZARLI PER POTERLI ELABORARE AI FINI DELLA

LORO DESCRIZIONE, SINTESI, TRADURLI IN INFORMAZIONI.

SUPPONIAMO DI AVER SVOLTO UN’INDAGINE SOTTOPONENDO A 15 SOGGETTI DI VARIE ETA’ UNA

SCALA CHE MISURA IL LIVELLO DI AUTORITARISMO.

VARIABILE X = PUNTEGGIO DI AUTORITARISMO (10 = NON AUTORITARIO……60 = MOLTO

AUTORITARIO)

VARIABILE Y = GENERAZIONE (1 = GIOVANI; 2 = ADULTI; 3 = ANZIANI)

N = NUMEROSITA' DEL CAMPIONE N = 15

DATI GREZZI:

Il soggetto A , giovane, ha ottenuto X = 30; il soggetto H, anziano, ha ottenuto X = 20; e così via.

Dati grezzi

Sogg A B C D E F G H I L M N O P Q

Y 1 3 2 1 1 3 2 3 2 1 2 3 1 2 3

X 30 50 40 20 30 60 40 20 20 50 30 40 30 40 40

ORGANIZZIAMO, RAGGRUPPIAMO I DATI PER POTERLI DESCRIVERE:

X INDICA GENERICAMENTE LA VARIABILE AUTORITARISMO CHE PUO' ASSUMERE K = 6 VALORI

DIVERSI (10, 20, 30, 40, 50, 60)

Xi i INDICE DEI K VALORI DIVERSI CHE PUO' ASSUMERE X (QUINDI i VA DA 1 A 6)

X1 =valore10; X2 = valore 20; X3 =valore 30....ECC.

QUANTE VOLTE COMPARE, NEL CAMPIONE DI N= 15 SOGGETTI, IL VALORE X2 = 20?

CONTANDO RISULTA 3 VOLTE

Fi INDICA LA FREQUENZA CON CUI COMPARE IL VALORE i-esimo; F2 = 3 indica che la FREQUENZA del

valore X2 è 3

DISTRIBUZIONE DI FREQUENZA

Xi X Fi

X1 10 0

X2 20 3

X3 30 4

X4 40 5

X5 50 2

X6 60 1

Fi E' IL NUMERO DI VOLTE IN CUI SI VERIFICA UN DETERMINATO EVENTO IN UN GRUPPO DI EVENTI

POSSIBILI CIOE' IL NUMERO DI CASI CHE ASSUMONO UN CERTO VALORE Xi DI X, TRA I K VALORI

POSSIBILI

Page 8: Lezio02sito-2014frequenze

8

NATURALMENTE LA SOMMA DI TUTTE LE FREQUENZE Fi DEVE ESSERE UGUALE A N

F Fi

i

k

i

1 1

6

0 3 4 5 2 1 15

X (PUNTEGGIO DI AUTORITARISMO) E' UNA VARIABILE MISURATA SU SCALA INTERVALLO

E’ QUINDI POSSIBILE FARE LA SOMMA DEI 15 VALORI X

PARTENDO DAI DATI GREZZI:

Sogg A B C D E F G H I L M N O P Q

Y 1 3 2 1 1 3 2 3 2 1 2 3 1 2 3

X 30 50 40 20 30 60 40 20 20 50 30 40 30 40 40

X = 30 + 50 + 40 + 20 + 30 +60 + 40 +20 +20 + 50 +30 + 40+

+30 + 40 +40 = 540

UTILIZZANDO LA DISTRIBUZIONE DI FREQUENZA

Xi X Fi XiFi

X1 10 0 0 (10 x 0)

X2 20 3 60 (20 x 3)

X3 30 4 120 (30 x 4)

X4 40 5 200 (40 x 5)

X5 50 2 100 (50 x 2)

X6 60 1 60 (60 x 1)

-----------------

15 540

Xi Fi = X1 F1 + X2 F2 +....+ X6 F6 = 0 + 60 + 120 +200 +100 +60 = 540

CONSIDERIAMO ORA Y, CIOE' LA "GENERAZIONE"

SI TRATTA DI UNA VARIABILE MISURATA SU SCALA ORDINALE, SI TRATTA COMUNQUE DI

CATEGORIE,: Y PUO' ASSUMERE K = 3 VALORI ( 1 = GIOVANI; 2 = ADULTI; 3 = ANZIANI)

DISTRIBUZIONE DI FREQUENZA

Yi Y Fi

Y1 1 5

Y2 2 5

Y3 3 5

-----

15

NON HA SENSO FARE LA X DAI DATI GREZZI NE' LA XF

SI PUO' FARE SOLO LA SOMMATORIA DELLE FREQUENZE, CHE DEVE NATURALMENTE RISULTARE

UGUALE A N: Fi = 5 + 5 + 5 = 15

Page 9: Lezio02sito-2014frequenze

9

DISTRIBUZIONE DELLE FREQUENZE PERCENTUALI

N = NUMERO TOTALE DI CASI (SOGGETTI O OSSERVAZIONI)

Fi = FREQUENZA DI CASI CHE ASSUMONO VALORE Xi

Fi% = PERCENTUALE DEI CASI CHE ASSUMONO VALORI Xi

Fi% SIGNIFICA CHE SI E' FATTA UNA TRASFORMAZIONE DA N A 100, IN MODO CHE LA PROPORZIONE

SIA PIU' IMMEDIATAMENTE COMPRENSIBILE

PER IL CALCOLO DELLA PERCENTUALE:

DALLA PROPORZIONE . Fi% : 100 = Fi : N CHE SI PUO' SCRIVERE

F F

Ni i%

100

SI RICAVA

N

FF i

i

100%

NATURALMENTE LA SOMMA DI TUTTE LE Fi% DEVE RISULTARE = 100

ANCHE SE NON HA MOLTO SENSO FARE LA % QUANDO N E' PICCOLO PERCHE' SI "GONFIANO" I DATI

E’ SEMPRE POSSIBILE TRASFORMARE UNA DISTRIBUZIONE DI FREQUENZA IN DISTRIBUZIONE

PERCENTUALE

PER L'ESEMPIO

Yi Y Fi Fi%

Y1 1 5 33.33 (5 x 100) : 15

Y2 2 5 33.33

Y3 3 5 33.34

------ -----------

15 100.00

PER LA VARIABILE AUTORITARISMO

Xi X Fi Fi%

X1 10 0 0.00

X2 20 3 20.00 (3 x 100) : 15 = 20.00

X3 30 4 26.67 (4 x 100) : 15 = 26.6666

X4 40 5 33.33 (5 x 100) : 15 = 33.3333

X5 50 2 13.33 (2 x 100) : 15 = 13.3333

X6 60 1 6.67 (1 x 100) : 15 = 6.6666

------ ---------

15 100.00

Page 10: Lezio02sito-2014frequenze

10

(CONSIDERARE IL PROBLEMA DEGLI ARROTONDAMENTI)

PROBLEMA INVERSO

CONOSCENDO LA PERCENTUALE E LA BASE N, SI PUO' RICOSTRUIRE LA Fi, USANDO LA FORMULA

INVERSA

FF N

ii%

100

PER ES: percentuale 33.33 (del punteggio X = 40) e N = 15, a quale F corrisponde?

999.4100

1533.33

F

(arrotondando) F = 5

ATTENZIONE A RISULTATI RIFERITI IN MODO DISTORTO

ESEMPIO:

DA UNA INDAGINE RISULTA CHE L'80% DEI SOGGETTI RITIENE CHE LA LEGGE SUL DIVORZIO VADA

ABROGATA.

BASE N = 350

DOMANDA 1 ) RITIENI CHE LA LEGGE SUL DIVORZIO DEBBA ESSERE MODIFICATA O LASCIATA

COME E'?

MODIFICATA F = 100 F% = 28.57% LASCIATA F = 250 F% = 71.43%

DOMANDA 2) SE HAI RISPOSTO "MODIFICATA", RITIENI CHE IL DIVORZIO DEBBA ESSERE ABROGATO

O LIBERALIZZATO? BASE = 100

ABROGATO F = 80 F% = 80.00% LIBERALIZZATO F = 20 F% = 20.00%

MA IN REALTA' QUANTI DEI 350 INTERVISTATI HA RISPOSTO "ABROGATA"?

SOLO 80 SU UNA BASE DI 350, CIOE' IL 22.86%

FREQUENZE CUMULATE

Per ogni valore di Xi si calcola la somma delle frequenze FINO a quel valore compreso. La frequenza cumulata ci dice

“quanti soggetti/osservazioni hanno un valore X Xi”

ESEMPIO

Xi fi fcum

----------------------------------------

18 2 2

19 2 4

20 3 7

21 1 8

22 2 10

23 2 12

----

12

Page 11: Lezio02sito-2014frequenze

11

Considerando X = 18, n = 2 soggetti hanno punteggio 18.

Considerando X = 22, n = 10 soggetti hanno punteggio 22.

L’ultima frequenza cumulata, cioè quella corrispondente all’ultimo valore di X, è necessariamente = N (nell’esempio =

12)

Si possono cumulare anche le frequenze percentuali e si leggono nello stesso modo.

Xi fi f% f%CUM

-------------------------------------

18 2 16.7 16.7

19 2 16.7 33.4

20 3 25.0 58.4

21 1 8.3 66.7

22 2 16.7 83.4

23 2 16.6 100.00

-------------------

12 100.0

Considerando X = 22, l’83,4% dei soggetti ha punteggio 22.

L’ultima frequenza percentuale cumulata, cioè quella corrispondente all’ultimo valore di X, è necessariamente = 100,00

(nell’esempio = 12)

ESEMPIO

1) DATI GREZZI X = voto esame universitario rilevato su 12 studenti:

18 19 20 20 22 18 22 19 20 23 21 23

Xi

N

1

=[ i va da 1 a N (1 a 12), è un indice del soggetto]

X1+X2+X3+X4+X5+X6+X7+X8+X9+X10+X11+X12 =

18 +19 +20 +20 +22+18 +22 +19 +20 +23 + 21 +23 = 245

costruiamo la

2) DISTRIBUZIONE DI FREQUENZA di

18 19 20 20 22 18 22 19 20 23 21 23

Xi fi Xi fi

--------------------------------------------------

i=1 18 2 36

i=2 19 2 38

i=3 20 3 60

i=4 21 1 21

i=5 22 2 44

i=6 23 2 46

----- -----

12 245

in questo caso “i” è un indice dei k diversi valori che può assumere X, e va da 1 a 6.

X fi

K

i

1

= [i va da 1 a k, (1 a 6) è un indice del numero dei k valori diversi, ordinati, che X può assumere]

= X1 f1 + X2 f2 + X3 f3 + X4 f4 + X5 f5 +X6 f6 =

= 182 + 192 + 203 + 211 + 222 + 232 = 36 + 38 + 60 + 21 + 44 + 46 = 245

Page 12: Lezio02sito-2014frequenze

12

3) trasformiamo le frequenze in percentuali

Xi fi f%

-----------------------------------------

18 2 16.7

19 2 16.7

20 3 25.0

21 1 8.3

22 2 16.7

23 2 16.6

------ ----------

12 100.0

classi di punteggi

SE I VALORI DIVERSI CHE X PUO’ ASSUMERE SONO TANTI, E’ OPPORTUNO FARE UN

ULTERIORE RAGGRUPPAMENTO, COSTRUENDO INTERVALLI DI AMPIEZZA SUPERIORE A 1,

CIOE’ CLASSI DI VALORI CHE CONTENGANO PIU’ VALORI DI X

PER ESEMPIO, SIA X L’ETA’ (UNITA’ DI MISURA: ANNI) MISURATA SU N = 30 SOGGETTI, DISTRIBUITA

COME SEGUE:

X (età) f

----------------------

18 3

19 3

20 4

21 6

22 5

23 4

24 3

25 2

--------

30

E’ POSSIBILE PERO’ RAGGRUPPARE I VALORI DI X IN CLASSI, per esempio DI AMPIEZZA 2, creare

cioè degli INTERVALLI CHE CONTENGONO ciascuno 2 VALORI DI X

CLASSI f

------------------------------

18 - 19 6 (3 + 3) fr. 3 di X = 18 + freq. 3 di X = 19

20 - 21 10 (4 + 6)

22 - 23 9 (5 + 4)

24 - 25 5 (3 + 2)

---

30

naturalmente N (numero totale di soggetti) resterà uguale, N = 30

POTREMMO COSTRUIRE INTERVALLI DI AMPIEZZA superiore a due, MA ANCHE DI AMPIEZZE

DIVERSE in diverse classi, DIPENDE DA QUANTI E QUALI VALORI PUO’ ASSUMERE X.

LA DISTRIBUZIONE CON LE FREQUENZE ATTRIBUITE A CIASCUN SINGOLO VALORE DI X è

considerata come distribuzione in classi di AMPIEZZA UNITARIA

X f

---------------------

18 3

19 3

20 4

21 6

22 5

23 4

24 3

25 2

-------

30

Page 13: Lezio02sito-2014frequenze

13

AMPIEZZA 3 AMPIEZZE DIVERSE

CLASSI ampiezza f CLASSI ampiezza f

------------------------------------------ ----------------------------------------------

18 - 20 3 10 18 - 19 2 6

21 - 23 3 15 20 - 22 3 15

24 - 26 3 5 23 - 25 3 9

----------- ------

30 30

ESTREMI DI UNA CLASSE:

IN UNA CLASSE il VALORE PIU’ BASSO E’ IL LIMITE INFERIORE (limi)

E IL VALORE PIU’ ALTO E’ IL LIMITE SUPERIORE (lims)

L’ampiezza (a) si calcola: a = (lims - limi)+ 1

classe 18 - 19 a = (19 - 18) + 1 = 2 classe 20 - 22 a = (22 - 20) + 1 = 3

QUESTI SI DICONO LIMITI TABULATI COSTRUENDO INTERVALLI DI AMPIEZZA > 1 SI

SINTETIZZA ULTERIORMENTE L’INFORMAZIONE

PROBLEMI:

QUANTI INTERVALLI/CLASSI COSTRUIRE? QUALE DEVE ESSERE L’AMPIEZZA?

TRE CRITERI - GUIDA DA TENERE PRESENTI:

1 - COPRIRE L’INTERA GAMMA DEI PUNTEGGI

2 - INTERVALLI DI UGUALE AMPIEZZA (SE POSSIBILE)

3 - MUTUALMENTE ESCLUSIVI

1 - E’ INTUITIVO. SE, NELL’ESEMPIO, IL PRIMO INTERVALLO FOSSE

20-22, PERDEREIMMO TUTTI I SOGGETTI DI 18 E 19 ANNI

2 - DIPENDE DAL TIPO DI MISURA E DALLA DISTRIBUZIONE DEI PUNTEGGI. SE E’ POSSIBILE, E’

MEGLIO AVERE INTERVALLI DI UGUALE AMPIEZZA (SONO COMPARABILI TRA LORO, E’ PIU’

FACILE LA RAPPRESENTAZIONE GRAFICA ECC.). DI SOLITO AMPIEZZA 3, 5, 10,

O MULTIPLI DI 10.

NUMERO DI INTERVALLI: NON TROPPI (<= 20),

NON TROPPO POCHI (>= 5)

3 -DEVE ESSERE CHIARO DOVE VA INSERITO OGNI SOGGETTO

CLASSI

----------

18 – 19

19 - 20

20 - 21

UN SOGGETO DI ETÀ X = 19, DOVE VA INSERITO? NELLA PRIMA O NELLA SECONDA CLASSE’

Page 14: Lezio02sito-2014frequenze

14

PER ESEMPIO, SE X E’ UNA VARIABILE DISCRETA CHE PUO’ ASSUMERE SOLO VALORI INTERI

DA 4 A 12, QUESTA DISTRIBUZIONE IN CLASSI NON CREA PROBLEMI:

CLASSI

----------

4 - 6

7 - 9

10 - 12

MA SE X FOSSE UNA VARIABILE CONTINUA CHE PUO’ ASSUMERE VALORI FINO A DUE

DECIMALI, IN QUALE CLASSE SI INSERIREBBE UN SOGGETTO CHE OTTIENE PUNTEGGIO DI

X=6.35? E UNO CON X = 9.89?

DIPENDE DAL TIPO DI MISURA, MA SEMPRE OCCORRE PRECISARE

QUALI SONO I LIMITI REALI (O CONFINI) DELLA CLASSE, OLTRE QUELLI CHE SONO INDICATI

NELLA TABELLA, CHE SI DICONO

LIMITI TABULATI

DI SOLITO SI AGGIUNGE 0.5 (O .05, O .005) AL LIMITE TABULATO SUPERIORE E SI SOTTRAE 0.5

AL LIMITE TABULATO INFERIORE, PER DARE IL SENSO DELLA CONTINUITA’.

Limiti Limiti

tabulati reali a f

------------ -------------------------------------------------------------

18 - 20 17.5-20.5 3 10

21 - 23 20.5-23.5 3 15

24 - 26 23.5-26.5 3 5

30

oppure per ogni classe si può calcolare la semisomma del lim(sup) tabulato della classe precedente e lim(inf)

tabulato della classe successiva.

Per esempio il limite reale superiore della prima classe è: (20+21)/2 = 20.5 che è anche il limite reale inferiore

della seconda classe mentre il limite reale superiore della seconda classe sarà: (23+24)/2 = 23.5

PER EVITARE AMBIGUITA’, I LIMITI REALI (confini) DELLE CLASSI NON DOVREBBERO

COINCIDERE CON LE OSSERVAZIONI REALI.

SI PRECISA POI CHE UNA CERTA CLASSE, PER ES. LA 17.5-20.5, COMPRENDE I PUNTEGGI X FINO

A 20.50 (X < = 20.50), MENTRE LA CLASSE SUCCESSIVA, LA 20.5-23.5, COMPRENDE I PUNTEGGI

MAGGIORI DI 20.50 (CIOE’ DA 20.51 IN SU; X > 20.50)

Con il simbolo -| si intende <=

ALTRO ESEMPI:

X assume tutti i valori da 0 a N, con due cifre decimali

Limiti Disambiguazione Limiti reali

Tabulati

0 - 1 0 -| 1 0.00 – 1.00 0.000 – 1.005

1 - 2 1 -| 2 1.01 – 2.00 1.005 – 2.005

2 - 3 2 -| 3 2.01 – 3.00 2.005 – 3.005

….

Esempio di classi di ampiezza unitaria per X discreto:

18 17.5 - 18.5

19 18.5 - 19.5

20 19.5 - 20.5

Page 15: Lezio02sito-2014frequenze

15

Quando X è una misura discreta, per calcolare l’ampiezza di una classe si può applicare la formula:

a = LIM.REALE SUP. - LIM.REALE INF.

PUNTO CENTRALE DI UN INTERVALLO

X f

----------------------

18 3

19 3

20 4

21 6

22 5

23 4

24 3

25 2

--------

30

possiamo calcolare la somma

ΣXi fi = (18x3)+(19x3)+(20x4)+(21x6)+...+(25x2) = 641

CLASSI f

-----------------------

18 - 19 6

20 - 21 10

22 - 23 9

24 - 25 5

-------

30

COME SI FA LA SOMMA X f ?

PER OGNI INTERVALLO occorre calcolare un valore che rappresenta l’intervallo stesso, cioè IL PUNTO

CENTRALE (O MEDIO)

Indichiamo con Xc tale punto CHE, PER CONVENZIONE, RAPPRESENTA LA CLASSE:

CLASSI f

-----------------------

18 - 19 6

20 - 21 10

22 - 23 9

24 - 25 5

-------

30

Xc = SEMISOMMA DEI LIMITI (TABULATI O REALI)

INTERVALLO 18-19 Xc = 18+19 = 37 = 18.5

2 2

OPPURE 17.5-19.5 Xc = 17.5+19.5 = 37 = 18.5

2 2

CLASSI lim.reali Xc f Xc f

-------------------------------------------------------------------------------

18 - 19 17.5-19.5 18.5 6 111

20 - 21 19.5-21.5 20.5 10 205

22 - 23 21.5-23.5 22.5 9 202.5

24 - 25 23.5-25.5 24.5 5 122.5

----- -------

30 641

Page 16: Lezio02sito-2014frequenze

16

IN CASO DI CLASSI DI AMPIEZZA UNITARIA, Xc CORRISPONDE ESATTAMENTE AL VALORE X:

PER ES. ETA’ 19, LIMITI REALI 18.5-19.5, Xc =19.

Per le frequenze cumulate delle distribuzioni in classi, si applica la stessa procedura vista precedentemente:

Classi f fcum f% f%cum

18 –19 6 6 20.0 20.0

20 – 21 10 16 33.3 53.3

22 – 23 9 25 30.0 83.3

24 – 25 5 30 16.7 100.0

---- ------

30 100.0

25 soggetti hanno un punteggio X 23 Il 53.3% dei soggetti ha un punteggio X 21

Esercizio: considerando la distribuzione di X:

X f

10 2

20 3

30 4

40 5

50 7

Calcolare: N = f Xf fX 2

Organizzazione dei calcoli

X f X f X2 X

2 f

10 2 20 100 200

20 3 60 400 1200

30 4 120 900 3600

40 5 200 1600 8000

50 7 350 2500 17500

Tot 21 750 30500

f

Xf fX 2