Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X=...

26
1 Fonti e strumenti statistici per la comunicazione La costruzione di misure relative semplici e complesse Prof.ssa Isabella Mingo A.A. 2017-2018 Numeri indice complessi Si usano quando l’obiettivo dell’analisi è quello di descrivere in modo sintetico la variazione di un insieme di fenomeni connessi tra loro. Esempi: Analizzare le variazioni dei prezzi di un insieme di beni e/o di servizi: es. Indici dei prezzi al consumo. Analizzare le variazioni del benessere di una collettività : es. Indici di Qualità della vita Tali indici sono valori sintetici che quantificano le “variazioni congiunte” che possono avvenire in situazioni differenti territoriali o temporali. FSSC - I.Mingo 2017-2018

Transcript of Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X=...

Page 1: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

1

Fonti e strumenti statistici per la comunicazione

La costruzione di misure relative semplici e complesse

Prof.ssa Isabella Mingo

A.A. 2017-2018

Numeri indice complessi

Si usano quando l’obiettivo dell’analisi è quello didescrivere in modo sintetico la variazione di un insieme difenomeni connessi tra loro.

Esempi: Analizzare le variazioni dei prezzi di un insieme di beni

e/o di servizi: es. Indici dei prezzi al consumo. Analizzare le variazioni del benessere di una collettività :

es. Indici di Qualità della vita

Tali indici sono valori sintetici che quantificano le “variazionicongiunte” che possono avvenire in situazioni differentiterritoriali o temporali.

FSSC - I.Mingo 2017-2018

Page 2: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

2

Numeri indice complessi: procedura di costruzione

Fasi:1. Scelta dei caratteri “elementari” (ad esempio quali beni e

servizi o quali aspetti della qualità della vita) dovrannoessere considerati;

2. Costruzione di indici semplici, scegliendo la “base” delrapporto, ossia la situazione a cui ciascun carattere deveessere confrontato;

3. Individuazione di un eventuale sistema di “pesi”, qualora sivoglia attribuire importanza diversa ai singoli caratterielementari presi in considerazione;

4. Scelta della formula di sintesi degli indici semplici.

FSSC - I.Mingo 2017-2018

Approfondimento:Sintesi delle informazioni quantitative

Le informazioni contenute in una matrice di dati possonoessere sintetizzate secondo i due versi della matrice, lecolonne e le righe

Gli indici di tendenza centrale (le medie), di variabilità edispersione, ecc., rappresentano dei valori di sintesi perciascuna colonna, rappresentano cioè, per ciascunavariabile, un solo valore calcolato considerando tutti i valoriassunti dalle unità statistiche rappresentate nelle righe dellamatrice;

Altri indici possono invece essere costruiti operando dellesintesi per ciascuna riga, in modo che rappresentino, perciascuna unità statistica, più variabili rilevate su di essa eposte nelle colonne della matrice.

FSSC - I.Mingo 2017-2018

Page 3: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

3

FSC - I.Mingo 2017-2018

Matrice di dati e sintesi dei valori assunti da ciascuna unità statistica ( sintesi per ogni riga)

X =

I1

I11

I21

Ii1

In1

X1 X2 … Xj … Xk

u1 x11 x12… x1j

… x1k

u2 x21 x22… x2j

… x2k

… … … … … … …

ui xi1 xi2… xij

… xik

… … … … … … …

un xn1 xn2… xnj

… Xnk

FSSC - I.Mingo 2017-2018

FSSC - I.Mingo 2017-2018Il sole 24Ore12 dicembre 2016

Page 4: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

4

FSSC - I.Mingo 2017-2018

http://www.ilsole24ore.com/speciali/qvita_2016_dati/home.shtml

FSSC - I.Mingo 2017-2018

Le variabili del 2016

Page 5: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

5

FSC - I.Mingo 2017-2018

Un caso di studio Gli indici QdV secondo il Sole 24 Ore

Il concetto di qualità della vita viene:1. scomposto in sei dimensioni differenti :

• tenore di vita, affari e lavoro, servizi e ambiente, criminalità,popolazione, tempo libero

2. Operazionalizzato utilizzando trentasei variabili, sei perdimensione.

Le variabili utilizzate hanno le seguenti caratteristiche:•sono rapporti statistici, espressi in unità di misure diverse (persone,euro, domande..) con campi di variazione eterogenei;

•si muovono in direzioni diverse: alcuni di essi sono indicatori positividi qualità della vita (es. depositi bancari, importo delle pensioni,numero di ristoranti..) altri hanno invece una valenza negativa rispettoa tale concetto (es: numero di rapine, di furti, di divorzi…).E’ evidente pertanto che gli indicatori elementari non possono essereutilizzati per ottenere indici sintetici senza una preventivatrasformazione.

FSC - I.Mingo 2017-2018

Sintesi delle informazioni quantitative: problemi

Nella pratica di ricerca non è raro il caso in cui le variabiliconsiderate:

si riferiscono a unità di misura incommensurabili: numerodi persone, quantità di moneta, numero di ore, numero diabitazioni e così via. Hanno «direzione» differente (positiva o negativa)rispetto al fenomeno che quantificano .

Per una corretta procedura di sintesi è opportuno tenere sotto controllo:

•La direzione delle variabili, indicatori elementari del concetto•La diversa unità di misura variabili, indicatori elementari del concettoSpesso sono necessarie delle trasformazioni delle variabili originarie !

Page 6: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

6

FSSC - I.Mingo 2017-2018

QdV secondo il Sole 24 Ore

La trasformazione delle variabili: i numeri indiceNel caso di indicatori positivi di qualità della vita, latrasformazione viene effettuata come rapporto dal valoremassimo e cioè

Nel caso di indicatori negativi, in cui è il valore minimo dell’indicatore adesprimere un elevata qualità della vita, il rapporto viene invertito:

=

Esempio - Metodo dei numeri indiceIndicatore di qualità nella classifica della QdV del Sole 24 Ore

4486/33126x1000=135,4

FSSC - I.Mingo 2017-2018

Page 7: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

7

Esempio - Metodo dei numeri indice

Indicatore di disagio nella classifica della QdV del Sole 24 Ore

66,91/494,96*1000=135,2

FSSC - I.Mingo 2017-2018

EsercizioNormalizzare indicatori di disagio

Sapendo che l’indicatore % di disoccupati in alcune province consideratevaria da 1,34 a 27,74, applicando il metodo dei numeri indice utilizzatonello studio sulla Qdv del Sole 24ore, normalizzare il valore di unaprovincia che è pari a 21,41.

Si tratta di un indicatore di disagio, negativamente correlato con la qualitàdella vita, pertanto l’indicatore normalizzato sarà pari a:

valore minimo/ valore effettivo * 1000

1,34 / 21,41 *1000= 62,58

FSSC - I.Mingo 2017-2018

Page 8: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

8

EsercizioNormalizzare indicatori di qualità

Sapendo che l’indicatore importo medio mensile delle pensioni inalcune province considerate varia da 395 euro a 849 euro,applicando il metodo dei numeri indice utilizzato nello studio sullaQdv del Sole 24ore, normalizzare il valore di una provincia che èpari a 518 euro.

Si tratta di un indicatore di qualità, positivamente correlato con laqualità della vita, pertanto l’indicatore normalizzato sarà pari a:

valore effettivo/ valore massimo *1000,

518/849 *1000= 610,13

FSSC - I.Mingo 2017-2018

EserciziNormalizzare indicatori con il metodo dei numeri indice

1- Sapendo che l’indicatore importo medio dei protesti per abitanti in alcuneprovince considerate varia da 9.17 euro a 1767 euro, applicando il metododei numeri indice utilizzato nello studio sulla Qdv del Sole 24ore,normalizzare il valore di una provincia che è pari a 102 euro.

valore minimo/ valore effettivo *10009.17/102*1000=89.90

2- Sapendo che l’indicatore “Nuove iscrizioni di imprese alla Camera dicommercio in rapporto alle cessazioni” in alcune province consideratevaria da 0.89 imprese a 2.19, applicando il metodo dei numeri indiceutilizzato nello studio sulla Qdv del Sole 24ore, normalizzare il valore diuna provincia che è pari a 1.07 .

valore effettivo/valore massimo *10001.07/2.19*1000=488.58

FSSC - I.Mingo 2017-2018

Page 9: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

9

Indici sintetici di dimensione e di Qdv

Per ogni dimensione l’indice sintetico perciascuna provincia è dato dalla media aritmeticasemplice dei 6 indicatori elementari trasformatiche appartengono a quella dimensione.

L’indice finale di Qdv è dato dalla mediaaritmetica semplice di tutti i 36 indicatorielementari trasformati.

FSSC - I.Mingo 2017-2018

provincia tenore di vita (media dei 6 indicatori elementari trasformati)

affari e lavoro ( media dei 6 indicatori elementari trasformati)

popolazione (media dei 6 indicatori elementari trasformati)

servizi (media dei 6 indicatori elementari trasformati)

criminalità (media dei 6 indicatori elementari trasformati)

tempo libero (media dei 6 indicatori elementari trasformati)

Bologna 672 588,48 355,53 581,95 193,03 641,72 505,45Milano 797,88 568,82 349,22 546,2 218,15 546,72 504,50Trento 550,25 529,17 471,68 559,68 478,45 431,33 503,43Forlì 595,78 456,55 400,07 552,9 360 637,93 500,54Firenze 610,95 514,2 416,6 563,3 237,42 643,2 497,61Siena 554,63 433,62 460,83 540,28 432,8 544,3 494,41Aosta 702,85 397,42 467,15 497,08 369,95 527,38 493,64Trieste 596,78 517,5 304,52 685,95 313,6 531,7 491,68Bolzano 542,93 541,88 376,73 551,47 476,05 438,02 487,85Gorizia 598,05 479,27 351,15 534,28 489,33 468,27 486,73….. ….. ….. ….. ….. ….. ….. …..

Indici Medi di dimensione Indice QDV complessivo (media aritmetica dei 6 Indici medi di dimensione)

Tab.FSSC - I.Mingo 2017-2018

Page 10: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

10

QdV Sole 24 Ore

Schema del processo di sintesi: matrici e procedure

Matrice indicatori elementariProvince x 36 indicatori elementari

Matrice indicatori elementari trasformatiProvince x 36 indicatori elementari trasformati

Matrice indici sintetici di dimensione

Province x 6 indici sintetici

Matrice indice sintetico di QDV(vettore colonna)Province x 1 indice sintetico

X =

Xnk…Xnj…Xn2Xn1Un

…………………Xik…Xij…Xi2Xi1Ui

…………………X2k…X2j…X22X21U2

X1k…X1j…X12X11U1

Vk…Vj…V2V1

Xnk…Xnj…Xn2Xn1Un

…………………Xik…Xij…Xi2Xi1Ui

…………………X2k…X2j…X22X21U2

X1k…X1j…X12X11U1

Vk…Vj…V2V1

In1

…Ii1…I21

I11

I1

In1

…Ii1…I21

I11

I1

Trasformazione in numeri indice

Sintesi

Sintesi

FSSC - I.Mingo 2017-2018

Calcolo dell’Indice sintetico di QdvEsercizio

FSSC- I.Mingo 2017-2018

A partire dai punteggi della tabella, si applichi la procedura di sintesi utilizzata dal Sole 24Ore, per calcolare l’indice sintetico di qualità della vita per le seguenti Provincie. In quale Provincia si vive meglio?

L’indice sintetico di Qdv per ciascuna provincia sarà uguale alla media aritmetica dei punteggi ottenuti nelle diverse sottodimensioni. L’indice di Ragusa, ad esempio, sarà:

QDVRG= (521+427+540+539+307+346)/6= 466,67Indice di QDV

Ragusa 446,67Perugia 536,67Roma 557,50

Page 11: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

11

La costruzione di indici complessi: fasi

In definitiva, la costruzione di indici compelssi compositi passa per le fasiseguenti:

Individuazione delle dimensioni ritenute rilevanti per la misurazionedel fenomeno

Operativizzazione delle singole dimensioni (costruzione e/o sceltadelle variabili)

Costruzione di indici semplici ed eventuale trasformazione pereliminare l’effetto delle diverse unità di misura, o della diversadirezione

Eventuale ponderazione delle dimensioni o nel loro ambito degliindici semplici (ponderazione)

Ricombinazione degli indici semplici per dimensione (scelta delmetodo di sintesi)

Ricombinazione degli indici di dimensione nell’indice sintetico finale(scelta del metodo di sintesi).

FSSC - I.Mingo 2017-2018

Ancora sui metodi di trasformazione

Per eliminare i problemi relativi alle diverse unità di misura Trasformare i caratteri in numeri indice (es.

QdV sole 24 ore)

Per controllarne anche la diversa variabilità si può: Relativizzare i valori con il campo di variazione Standardizzare

FSSC - I.Mingo 2017-2018

Page 12: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

12

La relativizzazione con il campo di variazione

Tra i diversi metodi utilizzabili per eliminare l’influenza della diversità delcampo di variazione, si può adottare il seguente metodo che trasformala distribuzione di ogni variabile in modo che il suo valore minimo valga0, il suo valore massimo valga 1 o multipli di 10 , mentre gli altri valorivengono riscalati e ricollocati tra questi due estremi:

Questo tipo di trasformazione è utile nei casi in cui si voglionoconfrontare distribuzioni che presentano campi di variazioni differenti.

FSSC - I.Mingo 2017-2018

Rendere omogenei i campi di variazioneEsempio

Tabella 10.17. Trasformazione del campo di variazione: esempio.

Regione

Speranza di vita

Reddito Pro-

capite

Speranza di vita

trasformato

Reddito pro-capite

trasformato Regione

A 82,5 770 0,72 0,16

Regione B

77,4 2400 0,00 1,00

Regione C

84,5 1670 1,00 0,63

Regione D

79,6 450 0,31 0,00

Regione E

78,2 560 0,11 0,06

Min 77,4 450 0,00 0,00 Max 84,5 2400 1,00 1,00

FSSC - I.Mingo 2017-2018

Page 13: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

13

Relativizzare con il campo di variazione esercizio

Si trasformi la seguente distribuzione in modo da ottenere una nuova variabile con min=0 e max=1

Es.

FSSC - I.Mingo 2017-2018

Normalizzare la variabilità: il metodo della standardizzazione

Seguendo questo metodo i valori delle variabili vengono espressicome differenza dalla media aritmetica e rapportati allo scartoquadratico medio, in modo da ottenere una nuova variabile(dettastandardizzata) con media 0 e varianza pari a 1.

zij = (xij – Mx)/σ

M= media aritmeticaσ = scarto quadratico medio

A seguito di questa trasformazione i valori originari inferiori alla media diventano negativi mentre quelli superiori positivi.

Gli indicatori così trasformati risultano liberati dall’unità di misura e dalla differente variabilità, in quanto ciascun indicatore presenta media uguale a 0 e varianza unitaria

FSSC - I.Mingo 2017-2018

Page 14: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

14

FSC - I.Mingo 2017-2018

Metodo della standardizzazione: esempio

FSSC - I.Mingo 2017-2018

EsercizioStandardizzare un valore

Sapendo che la media di una variabile X è pari a 1550 e lo scarto quadratico medio è 8,5, calcolare il punteggio standardizzato dell’unità statistica i che presenta il valore x=1140.

La formula di standardizzazione è: zi = (xi – Mx)/σ

Nel nostro caso :zi=(1140 – 1550)/ 8,5 = - 48,24.

Page 15: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

15

EserciziStandardizzare un valore

Sapendo che la media di una variabile X è pari a 50.5 e lo scarto quadratico medio è 5.5, calcolare il punteggio standardizzato del valore x= 75.

z= (75 – 50.5)/ 5.5 = 4.45

Sapendo che la media di una variabile X è pari a 180 e lo scarto quadratico medio è 9, calcolare il punteggio standardizzato del valore x= 135.

z= (135 – 180)/ 9 = -5

FSSC - I.Mingo 2017-2018

Esercizio

FSSC-FSSC - I.Mingo 2017-2018

Trasformare il seguente carattere, che ha media 118,65 e = 10, 39, applicando: 1- Il metodo della standardizzazione (2,5 punti) 2- La relativizzazione con il campo di variazione (2,5 punti) (esplicitare in entrambi i casi le caratteristiche della distribuzione ottenuta e la formula applicata.)

prov1 X1 Trend delitti Z1 (X1standardizzato

Y1 (X1 relativizzato con il campo di variazione)

Avellino 125,60 Catania 99,36 Enna 113,97 Pesaro 132,67 Sondrio 121,67

Page 16: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

16

FSSC - I.Mingo 2017-2018

Esercizi

Sapendo che l’indicatore % di disoccupati in alcune province considerate varia da 1,74 a 28,15,applicando il metodo dei numeri indice utilizzato nello studio sulla Qdv del Sole 24ore, normalizzare ilvalore di una provincia che è pari a 20,35.

Sapendo che l’indicatore Associazioni culturali su 1000 abitanti in alcune province considerate variada da 40,5 a 96,38 abitanti, applicando il metodo dei numeri indice utilizzato nello studio sulla Qdvdel Sole 24ore, normalizzare il valore di una provincia che è pari a 53,34.

Applicando il metodo della relativizzazione con campo di variazione, si relativizzi l'indicatoreSperanza di vita alla nascita che in un Paese assume un valore pari a 79, sapendo che il minimo è 25e il massimo 86.

Applicando il metodo della relativizzazione con campo di variazione, si relativizzi l'indicatoreRapporto lordo di iscrizione che in un Paese assume un valore pari a 85., sapendo che il minimo è 15e il massimo 98.

Sapendo che la media di una variabile X è pari a 80 e lo scarto quadratico medio è 1,5, calcolare ilpunteggio standardizzato del valore x= 86,4.

Sapendo che la media di una variabile X è pari a 18 e lo scarto quadratico medio è 2, calcolare il punteggio standardizzato del valore x= 24.

Esempi di uso di indici compositi:il BES Il progetto BES, realizzato dall’Istat con lo scopo di individuare

gli indicatori statistici più adeguati al fine di misurare le dimensioni del «Benessere equo e sostenibile»

Complessivamente sono stati individuati 12 domini e 130indicatori, che tengono conto sia di aspetti che hanno undiretto impatto sul benessere umano ed ambientale sia di quelliche misurano gli elementi funzionali al miglioramento delbenessere della collettività e dell’ambiente che la circonda.

Questi indicatori sono diventati strumenti di programmazione e valutazione della politica economica nazionale, come previsto dalla riforma della Legge di Bilancio, entrata in vigore nel settembre 2015.

FSSC - I.Mingo 2017-2018

Page 17: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

17

I dominio del BES

FSSC - I.Mingo 2017-2018

Costruzione di indici compositi per alcuni domini

FSSC - I.Mingo 2017-2018

Page 18: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

18

Indici compositi nel tempo

FSSC - I.Mingo 2017-2018

Diagramma a radar: caratteristiche

FSSC- Mingo 2017-2018

• E’ un grafico bidimensionale in cui si rappresenta unasequenza di raggi che si originano da un puntocentrale e formano angoli uguali tra loro.

• Ogni raggio può rappresentare una delle unitàstatistiche, oppure una diversa modalità di una o piùcaratteri.

• La distanza dal centro a ciascuno dei punti segnati suogni raggio è proporzionale all’intensità o allafrequenza che si rappresenta, rispetto al valoremassimo raggiungibile.

• I punti sui raggi vengono congiunti con segmenti, cosìche il grafico ha la forma di una stella o di unaragnatela.

Page 19: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

19

FSSC - I.Mingo 2017-2018

Indici compositi nel tempoper ripartizione

Analisi dei dati per la comunicazione

Introduzione all’analisi bivariata: il caso di caratteri qualitativi

Prof.ssa Isabella Mingo

A.A. 2017-2018

Page 20: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

20

Che cosa è l’analisi bivariata?

ADC-FSSC

E’ lo studio congiunto di due caratteri• Esempio nel casi di caratteri qualitativi:

I valori delle celle derivano dall’analisi della tabella unitaria!

Distribuzione doppia di frequenze: caratteristiche

Tabella che consente di sintetizzare l’informazionedisponibile su due caratteri osservati contemporaneamentesul medesimo collettivo di n u.s.

In colonna : Lista di modalità del carattere 1

In riga : Lista di modalità del carattere 2

Nella tabella si considerano tutte le possibili coppie dimodalità (una del car. 1 ed una del car. 2).

I valori rappresentati sono il conteggio, ossia le frequenzeassolute, del numero di u.s. del collettivo considerato chepresentano una coppia di modalità dei 2 caratteri.

ADC-FSSC

Page 21: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

21

Distribuzione doppia di frequenze: struttura

Distribuzioni marginali di riga e di colonna

Distribuzioni condizionate

Ha un numero di righe uguale al numero di modalità dellavariabile rappresentata in riga più 1 e un numero di colonneuguale a quello delle modalità della variabile rappresentata incolonna più 1.

ADC-FSSC

Dalla distribuzione unitaria multipla alla distribuzione doppia di frequenza: esempio

ADC-FSSC

1- Costruiamo un tabella che ha:• un numero di righe uguale al numero di

modalità della variabile che vogliamorappresentare in riga più 1 per i totali dicolonna

• un numero di colonne uguale a quellodelle modalità della variabile che vogliamorappresentare in colonna più 1 per i totalidi riga.

Page 22: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

22

Dalla distribuzione unitaria multipla alla distribuzione doppia di frequenza: esercizio (segue)

ADC-FSSC

2 – Contiamo per ciascun carattere le unitàche presentano una stessa modalità escriviamo i totali nelle rispettive cellemarginali della tabella.3- Contiamo le unità statistiche chepresentano congiuntamente le modalità a duea due e scriviamo le frequenze nelle rispettivecelle condizionate4- verifichiamo che le somme dei valori sianocoerenti.

Sesso Uso_PC1-Si 2-No Totale

1-Maschio somma dei maschi2-Femmina somma delle femmineTotale somma dei SI somma dei NO Totale unità

Frequenze assolute del carattere XDistribuzione marginale di X

Frequenze assolute del carattere YDistribuzione marginale di Y

x 1 x 2 … x j … x K

y 1 n 11 n 12 … n 1j … n 1K n 1.y 2 n 21 n 22 … n 2j … n 2K n 2.: : : … : … : :

y i n i 1 n i 2 … n ij … n iK n i .: : : … : … : :

y H n H 1 n H 2 … n Hj … n HK n H .n .1 n .2 … n .j … n .K n

X

Y

Tot.

Tot.

ADC-FSSC

…la formalizzazione

Page 23: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

23

…la formalizzazione

x 1 x 2 … x j … x K

y 1 n 11 n 12 … n 1j … n 1K

y 2 n 21 n 22 … n 2j … n 2K

: : : … : … :y i n i 1 n i 2 … n ij … n iK

: : : … : … :y H n H 1 n H 2 … n Hj … n HK

n

Y

Tot.

Tot.

X

Frequenze assoluta della coppia di modalità (yi, xj)

ADC-FSSC

x 1 x 2 … x j … x K

y 1 n 11 n 12 … n 1j … n 1K n 1.y 2 n 21 n 22 … n 2j … n 2K n 2.: : : … : … : :

y i n i 1 n i 2 … n ij … n iK n i .: : : … : … : :

y H n H 1 n H 2 … n Hj … n HK n H .n .1 n .2 … n .j … n .K n

X

Y

Tot.

Tot.

Tot. Somma Frequenze n.j

Tot. Somma Frequenze ni.

Colonna jRiga i

ADC-FSSC

Page 24: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

24

Esempio

CDL 1 2 3 4 5 6 7 TotaleSTC 12 19 50 47 20 3 1 152SCPO 2 23 49 32 12 5 1 124SCOSV 1 1 4 1 0 0 0 7Totale 15 43 103 80 32 8 2 283

Numero Corsi Frequentati

Distribuzione degli studenti di Scienze dellaComunicazione frequentanti il corso di Analisidei dati nell’a.a. 2011/2012 per Corso di Laureae Numero di Corsi Frequentati

n.6n24

n2.

nADC-FSSC

CDL 1 2 3 4 5 6 7 TotaleSTC 12 19 50 47 20 3 1 152SCPO 2 23 49 32 12 5 1 124SCOSV 1 1 4 1 0 0 0 7Totale 15 43 103 80 32 8 2 283

Numero Corsi Frequentati

Distribuzione condizionata del carattere CDL alla modalità x5=5 del carattereNum.Corsi Freq.

Distribuzione condizionata del carattere Num.Corsi Freq. alla modalità y1=STC del carattere CDL

Esempio

ADC-FSSC

Page 25: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

25

Osserviamo che…

CDL 1 2 3 4 5 6 7 TotaleSTC 12 19 50 47 20 3 1 152SCPO 2 23 49 32 12 5 1 124SCOSV 1 1 4 1 0 0 0 7Totale 15 43 103 80 32 8 2 283

Numero Corsi Frequentati

CDL nj

STC 152

SCPO 124

SCOSV 7

Totale 283

Num. Corsi Freq. nj

1 15

2 43

3 103

4 80

5 32

6 8

7 2

Totale 283

Distribuzione marginale del CDL

• Distribuzione marginale del Num. Corsi Freq.

AdC

Frequenze assolute

FSC

Tipi di distribuzioni doppie: assolute e percentuali

Frequenze percentuali sul totale (n=43290)20757/43290 *100=47,9%

1179/43290 *100=2,7%

Page 26: Fonti e strumenti statistici per la comunicazione · unità statistica ( sintesi per ogni riga) X= I 1 I 11 I 21 ... popolazione, tempolibero 2. Operazionalizzato utilizzando trentasei

26

Frequenze percentuali (sui totali=ni. ) profili di riga %

ADC-FSSC

Tipi di distribuzioni doppie : profili di riga %

Frequenze assolute

5370/43290 *100=12,4%

2514/22533 *100=11,2%

2856/20757 *100=13,8%

Frequenze percentuali (sui totali=n.j ) : profili di colonna %

FSC

Tipi di distribuzioni doppie : profili di colonna%

Frequenze assolute

22533/43290 *100=52,1%18947/35669*100=63,1% 2514/5370*100=46,8%1072/2251*100=47,6