Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione...

57
Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 2019-2020

Transcript of Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione...

Page 1: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Fonti e strumenti statistici per la comunicazione

Prof.ssa Isabella MingoA.A. 2019-2020

Page 2: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

a.a. 2019-2020 Pagina 2

A chi è rivolto il corso?

Agli studenti del secondo anno delle lauree triennali (ord. 270) in

Comunicazione Pubblica e d’Impresa

Superando l'esame si ottengono 6 CFU

Page 3: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

a.a. 2019-2020 Pagina 3

Frequenza

E’ richiesto lo stesso programma di esame ai frequentanti e ai non frequentanti.La frequenza non è obbligatoria, ma è consigliata per facilitare la comprensione degli argomenti trattati.Chi decide di frequentare deve iscriversi al corso entro la seconda settimana.La frequenza verrà rilevata raccogliendo le firme in modo casuale nel corso delle lezioni.

Page 4: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

a.a. 2019-2020 Pagina 4

TESTI D’ESAME OBBLIGATORI Fonti e Strumenti Statistici per la Comunicazione

Fonti statistiche per la Comunicazione(6 cfu - ord. 270)

L. Bocci, I. Mingo(2013), Statistiche, istruzioni per l’uso. Fonti e strumenti per l’analisi dei dati. Edizioni Nuova Cultura

E’ in preparazione una nuova edizione:L. Bocci, I. Mingo(2019), Statistiche, tra produzione e fruizione. Fonti e strumenti per l’analisi dei dati. Edizioni Nuova Cultura

ISTAT, BES 2018 Il benessere equo sostenibile in Italia. (fino a pag. 94)

(https://www.istat.it/it/files//2018/12/Bes_2018.pdf)

Le slide delle lezioni saranno pubblicate in bacheca alla fine di ogni settimana del corso

Page 5: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

a.a. 2019-2020 Pagina 5

Bibliografia aggiuntiva (testi di approfondimento facoltativi)

Libri di esercizi: R. Baragona, A. Bonacci, C. Grassetti, M. Gungui, I. Tedesco,

Complementi ed esercizi di Statistica, Edizioni SEAM, Roma, 1998

M. Fraire, A. Rizzi, Esercizi di statistica, Carocci, 2001

Page 6: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

a.a. 2019-2020 Pagina 6

6 domande aperte e/o esercizi: ciascunadomanda avrà il punteggio assegnato per unarisposta corretta e completa; la somma deipunti di ciascuna domanda è pari a 30Durata 2 ore.L’esame si considera superato se il votomaggiore o uguale a 18La prenotazione è obbligatoria, tramite Infostud

ESAMEFonti e Strumenti statistici per la Comunicazione

Fonti statistiche per la Comunicazione(6 cfu - ord. 270)

Page 7: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Per i frequentanti

L’esame può essere svolto in tre steps:1)una prova intermedia scritta a metà del corso, sulle parti di programma svolte (analisi monovariata).

2)un project work, riguardante la trattazione di un argomento concordato con il docente, utilizzando dati di fonti statistiche. I project works vengono presentati alla fine del corso in aula.

3)una prova finale scritta, sui restanti argomenti (indici,rapporti, analisi bivariata), svolta durante gli appelli previstidal calendario didattico.

a.a. 2019-2020

Page 8: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Il project work• I frequentanti possono svolgere un project work che li

esonererà da una parte della prova di esame (2 quesiti delvalore massimo di 10 punti)

• Il project work deve avere come obiettivo generale quello dicomunicare, ad un target prescelto alcune informazioniquantitative su un tema individuato dal gruppo di lavoro,costituito da 3-4 studenti.

• I prodotti del project work da presentare sono i seguenti:

– Una presentazione di 8/10 slides che dovranno essere presentate incirca 10/12 minuti durante una lezione a fine corso. Le slides possonoessere sostituite da un video di circa 5 minuti.

– Un razionale (relazione scritta di 3 cartelle di circa 6000 caratteri) in cui si illustra la presentazione (o il video)a.a. 2011-2012ADFSC - InformazioniADFSC Pagina 8

Page 9: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Pagina 9

Programma e testi d’esame per studenti dell’ordinamento 509

Fonti statistiche e indicatori socio-culturali-Statistica sociale

Esame da 4 CFU L. Bocci, I. Mingo, (2012). Statistiche, istruzioni per

l’uso, Nuova Cultura [capp.1 (par.1.1, 1.2, 1.5, 1.6), 2, 3, 4, 5, 10]

I. Mingo, M. Savioli (2011), Tempi di vita moderni, Il loisir della società italiana. Guerini Scientifica, [esclusi capp. 3, 4, 7]

Page 10: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

I contenuti e le lezioni

Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre)Parte I : I dati: introduzione alla terminologia; L’analisi monovariata (lezioni dal 26 settembre al 17 ottobre)Parte II : La costruzione e l’uso di variabili “complesse” (lezioni dal 24 ottobre al 31 ottobre)Parte III : Le fonti statistiche e l’analisi secondaria (lezioni dal 5 novembre al 21 novembre)Parte IV: L’analisi bivariata per caratteri qualitativi e quantitativi lezioni dal 26 novembre al 12 dicembre)

FSSC - I.Mingo

Page 11: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

a.a. 2019-2020 Pagina 11

InformazioniTutte le informazioni sul corso sono pubblicate sulla bacheca elettronica sul sito di Dipartimento CoRis

(http://www.coris.uniroma1.it/corso/26428)

Contatti:Isabella Mingo e-mail: [email protected] ricevimento: merc. 10.00-12.00, stanza B11A

(I piano sede via Salaria 113) tel.0649918447

Page 12: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

a.a. 2011-2012

Obiettivi del corso• Fornire le conoscenze e le competenze necessarie

per : un uso consapevole delle informazioni quantitative,

che non può prescindere dalla conoscenza dellacomplessità dei processi di produzione dei dati ad operadelle fonti statistiche nazionali e internazionali.

interpretare e analizzare in senso critico taliinformazioni, organizzate sempre più spesso in banchedati di grandi dimensioni disponibili on-line.

• Alla fine del corso lo studente avrà acquisito:– le conoscenze necessarie per l'individuazione delle fonti

statistiche adeguate ai propri bisogni conoscitivi .– le competenze per l'uso e la rielaborazione dei

prodotti statistici nell'ambito di un proprio progetto diindagine, in cui le statistiche diventano indicatori difenomeni semplici e complessi.

Page 13: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Concetti chiave

Fonti statistiche

Prodotti statistici

Analisi dei dati statistici

a.a. 2019-2020

Page 14: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

E’ una scienza che ha per oggetto lo studio,mediante metodi matematici, di fenomenicollettivi suscettibili di misurazione e didescrizione quantitativa.

Si basa sulla raccolta di dati riguardanti lemanifestazioni individuali con cui tali fenomeni simanifestano.

Fornisce regole, strumenti e tecniche checonsentono la raccolta e l’analisi quantitativa dellecaratteristiche dei fenomeni collettivi.

Che cos’è la statistica?

Page 15: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Che cosa sono i fenomeni collettivi? Fenomeni relativi a una collettività di casi singoli

o a una collettività di osservazioni su un singolocaso. Richiedono un insieme di osservazioni detti

individuali o singoli.

Esempi di fenomeni collettivi: reddito nazionale natalità occupazione e disoccupazione soddisfazione degli utenti consumi culturali • …..

Le caratteristiche che ci permettono di analizzare e descrivere un fenomeno vengono denominate caratteri o variabili statistiche.

Page 16: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Fenomeni collettivi semplici o complessi

Sono fenomeni collettivi semplici quelli delineabili attraversoun solo carattereEs.: L’età degli individui è un fenomeno completamentedescritto dal carattere che misura il numero di anni cheintercorrono dalla nascita al momento in cui si rileval’informazione.

Sono fenomeni collettivi complessi o multivariati quellidescritti da un insieme di caratteri.

Es.: Il consumo culturale degli individui è un fenomenocollettivo multivariato poiché può essere descrittoconsiderando molti caratteri: numero di libri letti, spettacoliteatrali, cinematografici a cui si è assistito, musei visitati…

Page 17: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Statistica descrittiva/inferenziale

Statistica descrittiva• ha l’obiettivo di organizzare,

riassumere e presentare i dati sottoforma tabellare e grafica in modoordinato.

• I suoi strumenti permettono di:– sistematizzare l’informazione mediante

distribuzioni semplici e complesse– sintetizzare l’informazione attraverso

famiglie di indici: valori percentuali,medi, indici di variabilità, rapportistatistici, relazioni statistiche, ecc.

Statistica inferenziale: • Procedure, messe a punto con

l'ausilio della Teoria dellaProbabilità, che consentono digeneralizzare le osservazioniottenute su una parte di unapopolazione statistica- dettacampione – all’intera popolazione.

• Si ottengono così le stime deglielementi distintivi dei caratteri chedefiniscono il fenomeno nellapopolazione, e che vengonogeneralmente chiamate stime deiparametri nella popolazione.

Page 18: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Carattere statistico: caratteristica da studiare, rilevata sulle unità statistiche.

Unità statistica (u.s.): unità elementare che presenta le caratteristiche (caratteri) oggetto di studio.

Popolazione statistica: insieme di u.s. omogenee rispetto ad uno o più caratteri.

Alcuni concetti preliminari

Page 19: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Esempio:Qual è la regione italiana più estesa?

Unità statistiche

Caratteristica o carattere o variabile

Fonte:Istat 2011

a.a. 2019-2020

Page 20: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Esempio:Gli utenti di un servizio erogato dai Municipi di RomaCaratteri e unitàNella tabella seguente:- quali e quanti sono i caratteri?- quali e quante sono le unità statistiche?- qual è la popolazione di riferimento?

I.Mingo 2014

Intervistati Municipio Sesso Cittadinanza Età Titolo di studio Reddito mensileAP 001 IX MUNICIPIO femmina italiana 30 medio superiore 1500AP 004 IX MUNICIPIO maschio estera 41 laurea magistrale 2800BO 005 VIII MUNICIPIO maschio italiana 52 laurea magistrale 1900BO 007 VIII MUNICIPIO maschio italiana 73 medio inferiore 850BO 008 VIII MUNICIPIO maschio italiana 44 medio superiore 1200BR 018 XVII MUNICIPIO femmina estera 35 post laurea 900BR 020 XVII MUNICIPIO femmina italiana 61 laurea magistrale 3000FL 043 IV MUNICIPIO femmina italiana 72 laurea magistrale 2800FL 079 IV MUNICIPIO maschio estera 78 medio inferiore 1100FL 085 IV MUNICIPIO maschio italiana 69 medio inferiore 750FM 001 II MUNICIPIO femmina italiana 45 medio superiore 2300

Page 21: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Unità statisticaE’ un’entità reale (persona, animale, oggetto, territorio) o virtuale (es. evento) che presenta le caratteristiche oggetto di studio.

•Non è necessariamente una persona fisica• Es: nello studio del fenomeno «vendita di quotidiani» le

unità statistiche di riferimento potrebbero essere sono lediverse Testate;

• Es: nello studio delle Imprese che producono automobili leunità statistiche di riferimento sono le imprese

•Non è necessariamente rappresentata da un singolo elemento.• Es: nello studio del fenomeno relativo al consumo delle

famiglie, l’unità statistica di riferimento è la famiglia e quindi un insieme di individui.

Termini equivalenti per indicare una unità statistica sono elemento, soggetto, oggetto, caso o individuo.

Page 22: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Popolazione statisticaL’ insieme di unità statistiche, omogenee rispetto ad una o più caratteri osservabili su di esse.Può essere:

Finita, se costituito da un numero finito di unità statistiche.Es. aziende esistenti in una certa area in un determinatoperiodo .

Infinita, se costituita da un numero illimitato di unitàstatistiche, tanto che non è possibile definirne una listacompiuta. Es. pezzi producibili da una fabbrica a ciclo continuo.

Reale (o empirica) quando tutte le unità della popolazionesono osservabili;

Teorica (o virtuale) quando alcune unità, che potrebbero odovrebbero far parte della popolazione statistica diriferimento, non sono rilevabili. Es. visitatori potenziali di un museo.

a.a. 2019-2020

Page 23: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Caratteri statistici

Modalità: modi in cui un carattere si può presentare Esaustive : devono rappresentare tutti i possibili

modi di essere del carattere Non sovrapposte : ogni u.s. presenta una ed una

sola modalità

Osservare o rilevare un carattere sulle u.s. significa attribuire a tali u.s. una modalità del carattere secondo determinate regole e con certi contenuti

u x

x rappresenta la modalità del carattere Xassociata all’u.s. u

Page 24: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Esempio:Caratteri e modalità

Nella tabella seguente:- quali sono i caratteri?- quali sono le modalità?

I.Mingo 2014

Intervistati Municipio Sesso Cittadinanza Età Titolo di studio Reddito mensileAP 001 IX MUNICIPIO femmina italiana 30 medio superiore 1500AP 004 IX MUNICIPIO maschio estera 41 laurea magistrale 2800BO 005 VIII MUNICIPIO maschio italiana 52 laurea magistrale 1900BO 007 VIII MUNICIPIO maschio italiana 73 medio inferiore 850BO 008 VIII MUNICIPIO maschio italiana 44 medio superiore 1200BR 018 XVII MUNICIPIO femmina estera 35 post laurea 900BR 020 XVII MUNICIPIO femmina italiana 61 laurea magistrale 3000FL 043 IV MUNICIPIO femmina italiana 72 laurea magistrale 2800FL 079 IV MUNICIPIO maschio estera 78 medio inferiore 1100FL 085 IV MUNICIPIO maschio italiana 69 medio inferiore 750FM 001 II MUNICIPIO femmina italiana 45 medio superiore 2300

modalità

Page 25: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Tipi di caratteri (1/2)

• Caratteri qualitativi (mutabili statistiche)

• Le modalità sono espresse da attributi.

• E’ possibile associare a ciascuna modalità unnumero intero che tuttavia non ha alcun valorenumerico: rappresenta solo un codiceconvenzionale

Page 26: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Codifica dei caratteri qualitativi: esempio

a.a. 2019-2020

IdentificativoMunicipio Sesso Nazionalità Età Titolo di studio RedditoAP 001 9 2 1 30 3 1500AP 004 9 1 2 41 5 2800BO 005 8 1 1 52 5 1900BO 007 8 1 1 73 2 850BO 008 8 1 1 44 3 1200BR 018 17 2 2 35 6 900BR 020 17 2 1 61 5 3000FL 043 4 2 1 72 5 2800FL 079 4 1 1 69 2 1100FL 085 4 1 1 69 2 750FM 001 2 2 1 45 3 2300

Sesso1= Maschio2= Femmina

Nazionalità1= Italiana2= Estera

Page 27: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Caratteri qualitativi : esempi

Carattere Modalità

Sesso M (0), F (1)

Stato civile nubile/celibe (2), coniugato (4), divorziato (6), vedovo (8)

Settore attività economica

agricoltura (1), industria (2), servizi (o terziario) (3)

Titolo di studio Nessun Titolo (1), Lic. El.(2), Lic. Media inf. (3), Diploma (4), DL1 (5), DL2 (6) Dottorato (7)

Statura Bassa, Media, Alta

Page 28: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Tipi di caratteri (2/2)• Caratteri Quantitativi (Variabile Statistica):

modalità espresse da valori numerici.Possono essere:Discreti: le modalità sono numeri che

costituiscono un insieme discreto di valori;possono, quindi, essere i numeri interi. Esempi: numero di figli, di nati, di maschi, di

anziani, di imprese.

Continui: le modalità possono essere tutti inumeri, anche non interi, cioè reali,compresi entro un intervallo di valori in cui ilcarattere è misurabile. Esempi: peso, altezza, reddito

a.a.2011-2012

Page 29: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Caratteri, Unità, Popolazione: esempiScopo dell’indagine

•Indagine sulle carriere degli iscritti ai Corso di Laurea triennali in Comunicazione della Sapienza di Roma

POPOLAZIONE

•Studenti iscritti ai Corsi di Comunicazione Pubblica e d’Impresa e di Scienze e tecnologie della Comunicazione

UNITÀ STATISTICA

•Studente

CARATTERI

•Anno di corso, Esami sostenuti, Età, Tipo di diploma

a.a. 2019-2020

Scopo dell’indagine

•Indagine sulla qualità della vita dei residenti nella provincia di Rieti

POPOLAZIONE

•Popolazione residente nella provincia di Rieti

UNITÀ STATISTICHE

•Persone residenti

CARATTERI

•Genere, età, Professione, Reddito, Soddisfazione

Page 30: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Caratteri, Unità, Popolazione: esempi

Scopo dell’indagine

•Indagine sulle condizioni economiche dei Paesi UE

POPOLAZIONE

•Paesi dell’UE

UNITÀ STATISTICHE

•Singoli Stati UE

CARATTERI

•Esportazioni, Importazioni, PIL, Tasso di disoccupazione

a.a. 2019-2020

Scopo dell’indagine

•Indagine sulle condizioni economiche delle imprese italiane

POPOLAZIONE

•Imprese italiane

UNITÀ STATISTICHE

•Singole Imprese italiane

CARATTERI

•Fatturato, Numero dei dipendenti

Page 31: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

“Misurazione” : caratteri qualitativi Scala nominale o Mutabile Sconnessa

Nessun ordine tra le modalità Date due modalità è possibile affermare solo se

sono uguali o diverse

Es: Sesso, Stato civile, Sett. attività economica

Scala Ordinale o Mutabile Ordinata Esiste un ordine tra le modalità Date due modalità è possibile non solo affermare

se queste sono uguali o diverse, ma anche stabilireun ordinamento oggettivo, specificando qualeprecede l’altra.

Mutabili rettilinee: Tit. studio, Grado militare Mutabili cicliche: Mese di nascita, Giorno della

settimana di nascita …a.a. 2011-2012

Page 32: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Esiste un’unità di misura delle modalità numeriche

Variabile a scala di intervalli non esiste uno zero assoluto: il valore (modalità) 0

non significa assenza di proprietà del carattere, ma indica una situazione convenzionale.

Operazioni: uguale/diverso; maggiore/minore; somma/sottrazione.

Esempi: Temperatura Celsius, Q.I.

Variabile a scala di rapporti esiste uno zero assoluto, naturale e non arbitrario Operazioni: uguale/diverso; maggiore/minore;

somma/sottrazione; moltiplicazione/divisione Esempi: Nati, Morti, Reddito, Peso

a.a. 2011-2012

Misurazione: caratteri quantitativi

Page 33: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Esempio: variabile a scala di intervalliTemperatura in gradi Celsius e Farenheit

F=32 +1,8 x C

Città C F

Mosca -17,8 0,0

Milano 0,0 32,0

Roma 5,0 41,0

Napoli 10,0 50,0

Palermo 20,0 68,0

Differenze di 10 gradi C corrispondono a differenze di 18 gradi FUna temperatura doppia in gradi C non corrisponde al doppio in gradi F

Page 34: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

In sintesi:

a.a. 2011-2012

Page 35: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Livelli di misura e operazioni logico-matematiche

= o > o < + o - x o /

Sconnessa si no no no

Ordinale si si no no

Scala intervalli si si si no

Scala rapporti si si si si

Page 36: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Classificazione gerarchica

Page 37: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Stabilire il tipo dei seguenti caratteri(Qualitativo Sconnesso, Qualitativo Ordinale, Quantitativo Discreto,

Quantitativo continuo):

• Livello di istruzione• Partito votato nelle ultime elezioni• Salario in Euro• Marca di cellulare preferita• Città di residenza• Tempo dedicato allo sport alla settimana (ore)• Numero di film visti in una settimana• Condizione professionale • Grado di soddisfazione di un cliente (per niente /moltissimo)• Corso di Laurea

Esercizio

Page 38: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Trasformazioni della scala di misura

ADA

Nominale Ordinale Scala di intervalli

Scala di rapporti

Nominale Introdurre parametri

Introdurre parametri

Introdurre parametri

Ordinale Non tenere conto dell’ordine

Introdurre parametri

Introdurre parametri

Introdurre parametri

Scala di intervalli

Suddividere in classi e non tenere conto dell’ordine

Suddividere in classi

Scala di rapporti

Suddividere in classi e non tenere conto dell’ordine

Suddividere in classi

Page 39: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Trasformazione di un carattere: da quantitativo a qualitativo ordinale, esempio

• Supponiamo di aver rilevato il reddito annuo lordo su un collettivo di occupati : il reddito minimo e’ 4000 euro, il massimo 50.000 euro

• Si tratta di un carattere quantitativo a scala di rapporti.• Può essere trasformato in una mutabile ordinale raggruppando in

classi le modalità numeriche ed associando a ciascuna di esse un attributo.

• Le classi devono essere esaustive e non sovrapposte.

Classi di reddito Attributo[da 4.000 a 10.000) Basso

[da 10.000 a 20.000) Medio-basso

[da 20.000 a 25.000) Medio

[da 25.000, a35-000) Medio-alto

[da 35.000 a 50.000] Alto

[ Estremo incluso

( Estremo escluso

Page 40: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Trasformazione di un carattere: da qualitativo a quantitativo esempio

•Supponiamo di aver rilevato la mutabile ordinale “titolo di studio” in uncollettivo di occupati, distinguendo nessun titolo, licenza elementare,media inferiore, diploma, laurea triennale, laurea magistrale.

• La mutabile ordinale può essere trasformata in carattere quantitativofacendo corrispondere a ciascuna modalità il numero di anni scolasticinecessari per conseguire il titolo corrispondente.

Modalità attributo Modalità numericaNessun titolo 0

Licenza elementare 5Licenza media

inferiore8

Diploma 13Laurea triennale 16

Laurea magistrale 18

Page 41: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

La struttura dei dati

Carattere Qualitativo (mutabile statistica)

Carattere Quantitativo (variabile statistica)

Collettivo statistico

Unità statistica

Osservazione di uno o più caratteri

Page 42: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Tabelle di datiTabella di dati: insieme di informazioni organizzate secondo diverse righe e diverse colonneTabella “unità x caratteri” (o tabella “unità xvariabili”o matrice dei dati)ciascuna riga è associata ad una u.s.ciascuna colonna è associata ad un carattereuna cella è la realizzazione del carattere (in

colonna) su una u.s. (in riga)

Page 43: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Matrice dei dati: esempioA B C D E F G H I J K M N P Q

UNITA' genere LaureaNO Tesi VotoL Durata LavOggi Settore Qualifica Contratto OreLav LavAdeguato UnivOggi Solo Redditou1 F STC 4 101 3 NO, non cerco 0 0 0 0 0 3 0 0u2 M STC 4 111 3 SI 11 22 3 10 1 1 NO 0u3 F SCPO 7 110 3 SI 40 12 3 40 1 3 SI 5u4 F STC 3 108 3 NO, in cerca 0 0 0 0 0 3 0 0u5 M SCPO 12 99 3 NO, non cerco 0 0 0 0 0 1 0 0u6 F COOP 6 110 3 SI 17 22 5 18 1 3 0 1u7 M COOP 13 96 3 SI 30 12 4 40 1 3 SI 2u8 M STC 4 107 3 SI 15 7 1 12 1 1 SI 1u9 F SCPO 7 104 3 NO, non cerco 0 0 0 0 0 2 0 0u10 F STC 3 110 3 NO, non cerco 0 0 0 0 0 3 0 0u11 M SCPO 16 105 3 SI 14 2 7 16 1 1 SI 3u12 F SCPO 4 108 3 NO, non cerco 0 0 0 0 0 1 0 0u13 F SCPO 11 108 3 NO, non cerco 0 0 0 0 0 2 0 0u14 F SCPO 4 102 4 NO, non cerco 0 0 0 0 0 1 0 0u15 F STC 4 103 3 NO, non cerco 0 0 0 0 0 1 0 0u16 F SCPO 9 108 4 SI 45 7 6 20 1 1 SI 1u17 F SCPO 7 103 3 NO, in cerca 0 0 0 0 0 3 0 0u18 F SCPO 11 111 3 NO, in cerca 0 0 0 0 0 1 0 0u19 M SCPO 11 105 3 NO, in cerca 0 0 0 0 0 3 0 0u20 F STC 2 103 3 NO, non cerco 0 0 0 0 0 1 0 0u21 F SCPO 9 109 4 NO, non cerco 0 0 0 0 0 1 0 0u22 M STC 1 111 5 SI 18 23 8 36 1 1 SI 5u23 M STC 3 104 3 NO, non cerco 0 0 0 0 0 1 0 0u24 F SCPO 2 111 4 NO, non cerco 0 0 0 0 0 3 0 0u25 M SCPO 5 109 3 NO, non cerco 0 0 0 0 0 1 0 0u26 F STC 3 107 5 SI 15 1 6 x 2 1 NO 2

Page 44: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

La manipolazione dei dati può riguardare non soltanto i caratteri osservati, ma anche le unità statistiche che possono essere aggregate secondo criteri utili alle finalità dell’indagineSi è rilevato su alcuni individui laureati alcuni caratteri, si può passare dalle unità statistiche laureati

alle unità statistiche corsi di laurea

Trasformazione delle unità statistiche

FSSC Mingo 2019-2020

Page 45: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

La tabella dei microdati

Unità statistica di rilevazione Corso di laurea

Conclusione del percorso di

studioVoto di laurea

Intervistato 1 Economia In corso 100

Intervistato 2 Economia Fuori corso 106

Intervistato 3 Comunicazione In corso 110

Intervistato 4 Comunicazione Fuori corso 104

Intervistato 5 Comunicazione Fuori corso 101

Intervistato 6 Ingegneria In corso 90

Intervistato 7 Ingegneria In corso 110

Page 46: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Si vuole focalizzare l’analisi non tanto sui singolilaureati quanto sui corsi di laurea, per faremergere eventuali analogie e differenze inmerito ai voti e alla possibilità di licenziarelaureati in corsoI dati statistici che si andranno ad analizzarenon saranno quelli riguardanti i singoliintervistati, ma quelli ottenuti attraversoopportune elaborazioni dei microdatiQueste elaborazioni danno luogo ai macrodati

Trasformazione delle unità statistiche

Page 47: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Dai microdati ai macrodati

Page 48: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

I laureati sono aggregati in gruppi in base alla medesima modalità del carattere “corso di laurea” tanti gruppi quante sono le modalità del carattere

“corso di laurea” unità di analisiPer gli altri caratteri si sceglie una appropriata funzione di aggregazione delle modalità che tenga conto della tipologia del carattere per la mutabile dicotomica “conclusione del

percorso di studio” si contano, per ogni unità di analisi, i laureati in corso e quelli fuori corso

per la variabile a scala di rapporti “voto di laurea” si calcola il voto medio alla laurea per ciascuna unità di analisi

Dai microdati ai macrodati: procedura

Page 49: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Unità statistiche di rilevazione: unità elementari su cui vengono rilevati i caratteri danno luogo ai microdati: insieme di dati

riguardanti le unità elementariUnità statistiche di analisi: unità primarie di interesse per l’analisi, a cui vengono riferiti i caratteri oggetto di studio può coincidere con quella di rilevazione può riferirsi ad aggregazioni di tali unità (la

famiglia, la scuola, l’azienda, il corso), in tal caso danno luogo ai macrodati.

Microdati e macrodati

Page 50: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Matrice unità/caratteri o tabelle di datiTabella ai dati: insieme di informazioni organizzate secondo diverse righe e diverse colonneTabella “unità x caratteri” (o tabella “unità xvariabili” o matrice dei dati)ciascuna riga è associata ad una u.s.ciascuna colonna è associata ad un carattereuna cella è la realizzazione del carattere (in

colonna) su una u.s. (in riga)

Matrice dei dati microdati o macrodati

Page 51: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

A B C D E F G H I J K M N P QUNITA' genere LaureaNO Tesi VotoL Durata LavOggi Settore Qualifica Contratto OreLav LavAdeguato UnivOggi Solo Redditou1 F STC 4 101 3 NO, non cerco 0 0 0 0 0 3 0 0u2 M STC 4 111 3 SI 11 22 3 10 1 1 NO 0u3 F SCPO 7 110 3 SI 40 12 3 40 1 3 SI 5u4 F STC 3 108 3 NO, in cerca 0 0 0 0 0 3 0 0u5 M SCPO 12 99 3 NO, non cerco 0 0 0 0 0 1 0 0u6 F COOP 6 110 3 SI 17 22 5 18 1 3 0 1u7 M COOP 13 96 3 SI 30 12 4 40 1 3 SI 2u8 M STC 4 107 3 SI 15 7 1 12 1 1 SI 1u9 F SCPO 7 104 3 NO, non cerco 0 0 0 0 0 2 0 0u10 F STC 3 110 3 NO, non cerco 0 0 0 0 0 3 0 0u11 M SCPO 16 105 3 SI 14 2 7 16 1 1 SI 3u12 F SCPO 4 108 3 NO, non cerco 0 0 0 0 0 1 0 0u13 F SCPO 11 108 3 NO, non cerco 0 0 0 0 0 2 0 0u14 F SCPO 4 102 4 NO, non cerco 0 0 0 0 0 1 0 0u15 F STC 4 103 3 NO, non cerco 0 0 0 0 0 1 0 0u16 F SCPO 9 108 4 SI 45 7 6 20 1 1 SI 1u17 F SCPO 7 103 3 NO, in cerca 0 0 0 0 0 3 0 0u18 F SCPO 11 111 3 NO, in cerca 0 0 0 0 0 1 0 0u19 M SCPO 11 105 3 NO, in cerca 0 0 0 0 0 3 0 0u20 F STC 2 103 3 NO, non cerco 0 0 0 0 0 1 0 0u21 F SCPO 9 109 4 NO, non cerco 0 0 0 0 0 1 0 0u22 M STC 1 111 5 SI 18 23 8 36 1 1 SI 5u23 M STC 3 104 3 NO, non cerco 0 0 0 0 0 1 0 0u24 F SCPO 2 111 4 NO, non cerco 0 0 0 0 0 3 0 0u25 M SCPO 5 109 3 NO, non cerco 0 0 0 0 0 1 0 0u26 F STC 3 107 5 SI 15 1 6 x 2 1 NO 2

La matrice unità/caratteri: esempioDa un’indagine condotta ad un anno dalla laurea sui laureati nell’a.a. 2016/2017 ad un corso di laurea triennale della nostra facoltà, si sono ottenuti i seguenti microdati:

Page 52: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Distribuzione unitaria

Tabella “unità x variabili” è una distribuzione unitaria multiplaunitaria perché è rappresentata ciascuna

u.s.multipla perché sono osservati più

caratteri su una medesima u.s.

Una sola colonna della tabella distribuzione unitaria semplice

Page 53: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Esempio: Distribuzione …

A B C D E FUNITA' sesso LaureaNO Tesi VotoL Duratau1 F STC 4 101 3u2 M STC 4 111 3u3 F SCPO 7 110 3u4 F STC 3 108 3u5 M SCPO 12 99 3u6 F COOP 6 110 3u7 M COOP 13 96 3u8 M STC 4 107 3u9 F SCPO 7 104 3u10 F STC 3 110 3u11 M SCPO 16 105 3u12 F SCPO 4 108 3u13 F SCPO 11 108 3u14 F SCPO 4 102 4u15 F STC 4 103 3u16 F SCPO 9 108 4u17 F SCPO 7 103 3u18 F SCPO 11 111 3u19 M SCPO 11 105 3u20 F STC 2 103 3u21 F SCPO 9 109 4u22 M STC 1 111 5u23 M STC 3 104 3u24 F SCPO 2 111 4u25 M SCPO 5 109 3u26 F STC 3 107 5

Unitaria Multipla Unitaria SempliceA B

UNITA' sessou1 Fu2 Mu3 Fu4 Fu5 Mu6 Fu7 Mu8 Mu9 Fu10 Fu11 Mu12 Fu13 Fu14 Fu15 Fu16 Fu17 Fu18 Fu19 Mu20 Fu21 Fu22 Mu23 Mu24 Fu25 Mu26 F

Page 54: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

La distribuzione Statistica di …Frequenze AssoluteNecessità di sintesiLista delle modalità che il carattere può assumereConteggio del numero di u.s. del collettivo considerato che presentano la singola modalità (freq. Assoluta)

CARATTERE FREQUENZE ASSOLUTE

Modalità uno

Numero di unità statistiche del collettivo considerato che

presentano la modalità uno del carattere

Modalità due

Numero di unità statistiche del collettivo considerato che

presentano la modalità due del carattere

… …

Modalità kappa

Numero di unità statistiche del collettivo considerato che

presentano la modalità kappa del carattere

Page 55: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Dalla distribuzione unitaria a quella di frequenza esempio

Cognome sesso età Livello soddisfazione

Tipo albergo(categoria)

Giorni permanenza

Bianchi F 28 basso 2 4

Alimov F 52 medio 3 6

More M 19 alto 4 2

Wieser F 23 alto 3 10

Lincoln M 60 medio 5 8

a.a. 2019-2020

Page 56: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Distribuzione di frequenza assoluta• Elencazione del numero delle volte che una modalità di un

carattere viene osservata nel collettivo.• Corrisponde alla suddivisione delle unità statistiche in

sottogruppi.

Sesso frequenza

F 3

M 2

totale 5

Livello soddisfazione

frequenza

basso 1

medio 2

alto 2

Totale 5

Osservazioni:•Evidenzia le caratteristiche del fenomeno•Implica perdita di informazione

a.a. 2019-2020

Page 57: Fonti e strumenti statistici per la comunicazione 1 e 2.pdf · Lezione introduttiva: Introduzione all’analisi dei dati (lezione 24 settembre) Parte I : I dati: introduzione alla

Frequenze assolute: la notazione

X : Carattere osservatox1 , x2 ,…, xi ,…, xK : K modalità

assunte del carattere Xxi modalità genericaxK ultima modalità Se X quantitativo

x1< x2<…< xi<…< xKn : numero di u.s. che

compongono il collettivon1 , n2 ,…, ni ,…, nK : freq. Assol.

associate alle K modalitàn1+ n2+… + ni+…+ nK=n

Car. X FREQUENZE ASSOLUTE

x1 n1

x2 n2

… …

xi ni

… …

xK nK

Totale n