Sociologia generale e Statistica sociale (14) - UniBg · 2019. 11. 28. · Sociologia generale e...

45
Sociologia generale e Statistica sociale (14) Corso di Lingue, Letterature e Culture Straniere Anno accademico 2019-2020 Prof. Michele Marzulli [email protected]

Transcript of Sociologia generale e Statistica sociale (14) - UniBg · 2019. 11. 28. · Sociologia generale e...

  • Sociologia generale e Statistica sociale (14)

    Corso di Lingue, Letterature e Culture Straniere

    Anno accademico 2019-2020

    Prof. Michele Marzulli

    [email protected]

    mailto:[email protected]

  • Leggere: le fonti statistiche

    • Statistiche ufficiali

    1. I dati amministrativi (esaustivi, coprono la popolazione, scarso valore informativo).

    2. Censimenti (anche informazione).

    3. Survey (indagini campionarie, alto contenuto informativo)

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale2

  • Leggere: le fonti statistiche

    • I dati prodotti dai processi amministrativi – Pubblici registri, prodotti da enti pubblici o privati (camere

    di commercio, ACI…).

    – Soprattutto: l’anagrafe comunale:• Saldo positivo della popolazione (nascite e immigrazioni)

    • Saldo negativo (morti e emigrazioni)

    • La famiglia anagrafica: vincoli (matrimonio, affinità, affetto…) con dimora abituale nello stesso comune.

    • Convivenza: caserme e navi mercantili, conventi, ospedali e case di cura, carceri o case dello studente.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale3

  • Anagrafe comunale

    • Le persone sono registrate su base demografica:

    – età, sesso, stato civile, composizione famigliare.

    • Studi su natalità e mortalità, nuzialità, migrazione, fecondità…

    • Analisi dei bisogni della popolazione per programmare il sistema dei servizi sociali.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale4

  • Leggere: le fonti statistiche

    • Altre fonti:• Censimenti come «popolazione e abitazioni»

    (conteggio popolazione residente, primo 1861 -ultimo 2011), agricoltura, industria e servizi…

    • Questi dati sono la base per il policy makingnazionale e locale.

    • Censimento sul non-profit (2000).• Le indagini Multiscopo (indagine campionaria,

    situazione sociale del paese. https://www.istat.it/it/archivio/91926

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale5

    https://www.istat.it/it/archivio/91926

  • Leggere: le fonti statistiche

    • ISTAT https://www.istat.it/ ; http://demo.istat.it/

    • https://www.istat.it/it/archivio/224669 (Rapporto Bes2018: il benessere equo e sostenibile in Italia).

    • https://www.istat.it/it/archivio/14562 (HFA)

    • EUROSTAT https://ec.europa.eu/eurostat

    • Disabilità: http://dati.disabilitaincifre.it/dawinciMD.jsp

    • OCSE https://data.oecd.org/

    • http://www.ismu.org/ricerca/dati-sulle-migrazioni/

    • https://www.google.com/publicdata/directory

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale6

    https://www.istat.it/http://demo.istat.it/https://www.istat.it/it/archivio/224669https://www.istat.it/it/archivio/14562https://ec.europa.eu/eurostathttp://dati.disabilitaincifre.it/dawinciMD.jsphttps://data.oecd.org/http://www.ismu.org/ricerca/dati-sulle-migrazioni/https://www.google.com/publicdata/directory

  • L’inchiesta campionaria

    • L’interrogazione nell’approccio quantitativo ostandard conduce alla costruzione di variabilida inserire in una matrice di dati.

    • L’obiettivo è quello di generalizzare i datiraccolti (costruiti), attraverso l’analisi dellerelazioni tra variabili.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale7

  • L’inchiesta campionaria

    • Caratteristiche

    1. L’unità di analisi è l’individuo.

    2. I casi da intervistare sono selezionati tramitetecniche di campionamento statistico.

    3. Invarianza dello stimolo: stesse domande,formulate nello stesso modo.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale8

  • La survey e il sondaggio

    • L’impostazione teorica di una survey è il trattocaratteristico che la differenzia da sondaggi di opinionee poll (per es. online).

    • Il sondaggio si limita a esplorare un fenomeno(sondare), cercando di quantificare per es. come siposiziona la popolazione. In genere si scelgonoargomenti dirimenti o si usano in previsione di elezioni.– Ciò che manca è l’analisi, cioè la relazione tra variabili

    (per es. il nesso causale).

    – Per garantirne validità: norma specifica (L. 28/2000,http://www.sondaggipoliticoelettorali.it/).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale9

    http://www.sondaggipoliticoelettorali.it/

  • Il questionario

    • Lo strumento prediletto dell’indaginecampionaria.

    • Un elenco di domande predefinite dal ricercatore.

    • Rivolto, in genere, a una parte della popolazione(campione).

    • I rispondenti devono scegliere fra una serie dialternative predisposte dal ricercatore.

    • In questo modo, il questionario è uno strumentoche garantisce la neutralità della rilevazione.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale10

  • La frequenza

    • Statistica descrittiva monovariata

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale11

  • I dati grezzi

    • Il risultato della rilevazione del fenomeno X sulla popolazione U (numerosità N) è un insieme di N osservazioni.

    • Ciascuna osservazione coincide con una (e una sola) delle k modalità xi previste dalla scala utilizzata.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale12

  • I dati grezzi (Mecatti, 25 e ss)

    • Es.: il comportamento sessuale degli studenti universitari (60 intervistati, ultimi 12 mesi)

    • X: fenomeno quantitativo e discreto (si rileva contando);

    • le sue modalità xi sono i numeri interi 0, 1,...

    • la scala delle modalità è quantitativa rapporto(assoluta), cioè: 0, 1, 2,…

    • U: gruppi studenti M/F

    • N: 60

    • X: numero partner negli ultimi 12 mesi

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale13

  • I dati grezzi

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale14

    • Queste sono le 60 risposte date dagli studenti intervistati: presentato in questa forma il fenomeno (X) non è comprensibile.

  • Distribuzione di frequenza

    • Si dovrà quindi tradurre il dato grezzo in una informazione intellegibile.

    • Cioè una tabella (o un grafico) che presenta la distribuzione di frequenza (e le variabili statistiche).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale15

  • Distribuzione di frequenza

    • Il dato grezzo diceva che il fenomeno X aveva 9 (k=9) modalità xi differenti: da 0 a 8 (n° dei partner).

    • Possiamo allora contare quante volte le k modalità (x1,… x9) si presentano nel campione.

    – Scopriamo per es. che la k modalità di xi con proprietà 0 (nessun partner) ha una frequenza (fi):

    f1 = 11 cioè 11 studenti/esse non hanno avuto partner.

    – Inoltre, 10 studenti/esse hanno avuto 1 partner:

    cioè f2 = 10.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale16

  • a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale17

    Nella colonna dx c’è la frequenza assoluta di xi: quante volte (11) si presenta la modalità (x1=0).Modalità xi

    Distrib

    uzio

    ne

    di

    freq

    ue

    nza

    di X

    su U

    .

  • Distribuzione

    • La somma delle frequenze assolute di xi è uguale a N (60).

    • La tab. nel suo insieme, cioè le k coppieformate da modalità (xi)-frequenza (0,…8) è definita variabile statistica (v.s.).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale18

  • Distribuzione di frequenza

    • Il numero di volte in cui una modalità xi è stata rilevata in U si chiama frequenza (assoluta). La somma delle frequenze assolute riproduce la numerosità N di U.

    • La freq. ass. viene indicata con fi (i-esima frequenza).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale19

  • Variabili statistiche

    • Le modalità xi a seconda della natura del fenomeno Xe della tipologia di scala utilizzata, possono essere attributi, categorie, numeri, intervalli.

    • Le frequenze fi sono sempre numeri interi.

    • Una v. s. è un insieme di k coppie {xi , fi}

    • v. s. = { (xi , fi), }

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale20

  • Variabili statistiche

    • Questo significa innanzitutto che ora, dopo questo processo (tradotto in tavola di frequenza) con X indichiamo sia il fenomenostatistico di interesse (prima della rilevazione) sia la v.s. (dopo la rilevazione).

    • Cfr. Lez. 13.stat.: come ci costruiscono le VAR.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale21

  • Esercizio Metodologia del servizio sociale 30 + L

    Sociologia generale 28

    Metodologia della ricerca sociale 25

    Microeconomia 30 + L

    Diritto penale 26

    Psicologia dello sviluppo 26

    Diritto pubblico 27

    Diritto privato 26

    Storia contemporanea 28

    Principi, fondamenti e metodi del servizio sociale 29

    Psicologia generale 24

    Politiche sociali e tecniche del servizio sociale 24

    Istituzioni di politica economica 25

    Igiene 27

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale22

  • Esercizio: tab. freq. ass.

    • xi = x1, … xk• k= 7

    • x1=24, x2=25, x3=26, x4=27, x5=28, x6=29, x7=31

    • Distribuzione f.a.:

    24=2; 25=2; 26=3; 27=2; 28=2; 29=1; 31=2.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale23

  • Esercizio: tab. freq. ass.

    xi fi24 2

    25 2

    26 3

    27 2

    28 2

    29 1

    31 2

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale24

  • Altri tipi di frequenza

    • Le frequenze assolute sono solo un tipo di frequenze che si possono costruire a partire dai dati grezzi.

    • Ci sono innanzitutto anche le frequenze relative e percentuali.

    – NB: per costruire le freq. % (ciò che siamo abituati a chiamare appunto «percentuali») è indispensabile avere prima costruito le freq. assolute. Anche quando si affrontano esercizi.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale25

  • Frequenze relative e percentuali

    • Se confronto due popolazioni di numerosità differente (per es. N1=40 e N2=28) posso confrontare le frequenze assolute?

    • Il valore (assoluto) «2» assunto nella popolazione 1 ha lo stesso significato che nella popolazione 2?

    – Cioè i 2 studenti che hanno avuto 4 partner nella U1 e i 2 che hanno avuto 4 partner nella U2?

    – No. Perché 2/40 è diverso da 2/28.

    • Allora devo costruire le frequenze relative.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale26

  • Confronto delle distribuzioni di frequenza di X su più popolazioni con numerosità diversa.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale27

    Distrib

    uzio

    ne d

    i X

    Distrib

    uzio

    ne d

    i X

    Popolazione U1 Popolazione U2

    Numerosità della popolazione

  • Frequenze relative

    • Per effettuare un confronto devo depurare il dato dall’influenza di N, cioè dalla numerosità della popolazione.

    • Più grande è N, maggiore sarà la frequenza (fi), perché la somma di tutte le fi è proprio N.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale28

  • Frequenze relative

    • Come si fa a depurare il dato rilevato dall’influenza di N, cioè dalla numerosità della popolazione?

    • La frequenza relativa associata alla modalità xi è il rapporto tra la freq. ass. e la numerosità di U (cioè N).

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale29

  • Frequenze relative

    • Cioè: 𝑝𝑖 = 𝑓 ሶ𝑖

    𝑁

    – Nel nostro caso: freq. rel. = 2/40= 0,050

    • Una grandezza relativa è un rapporto che ha al denominatore (40) la grandezza che «disturba» il confronto della quantità (2) che sta al numeratore.

    • Le f.r. in quanto grandezze adimensionali sono sempre confrontabili.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale30

  • Frequenze relative

    • Confronto / confrontabili?

    • I 2 studenti che hanno avuto 4 partner:

    – nella popolazione U1 = 2/40=0,050

    – Nella popolazione U2= 2/28=0,071

    • Il fenomeno X ha quindi un comportamento diverso nelle due popolazioni.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale31

  • Frequenze relative

    • Le f.r. (pi) sono rapporti particolari, che hanno al denominatore il totale del numeratore. Sono una parte del tutto, dell’intero.

    • Quindi sono sempre comprese fra 0… 1.

    0 ≤ pi ≤ 1

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale32

  • Frequenza relativa

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale33

    • La somma delle f.r. è sempre 1.

  • Frequenze relative

    • U1: la popolazione degli studenti/esse di Sociologia.

    • xi: le modalità di disposta (n° partner).

    • fi: frequenza della modalità di risposta xi

    • La colonna pi è la distribuzione di frequenza relativa del fenomeno X su U1

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale34

    ogia

  • Frequenze percentuali (%)

    • Moltiplicando per 100 le frequenze relative si ottengono le frequenze percentuali (%).

    pi ∙ 100

    • Le % sono consigliabili soprattutto in termini di chiarezza comunicativa.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale35

  • Freq. relative e percentuali

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale36

  • Freq. relative e percentuali

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale37

    • La parte inferiore della tabella ci aiuta a comprendere che le due popolazioni non si comportano nello stesso modo.• La U1 è più attiva della U2? Certamente il 2,5%

    della U1 ha avuto 8 partner e contro lo 0,0% della U2.

  • Frequenza cumulata

    • È buona norma ordinare in senso crescente le modalità osservate:– Cioè prendere in considerazione i valori minimo e

    massimo.

    • Ci aiuta a capire per es. quante sono le unità statistiche (tre le N) che manifestano una modalità grande fino a… xi.– Per es. quante persone in Italia hanno almeno t.studio =

    licenza superiore.

    • Basta sommare (cumulare) le frequenze associate alle diverse modalità.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale38

  • Frequenza cumulata

    • Frequenze cumulate assolute: Fi (f maiuscolo)

    • Frequenze cumulate relative o percentuali: Фi (phicon i)

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale39

  • Frequenza cumulata

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale40

    • Фi ci aiuta a dire che il 78% della popolazione ha avuto da 0 a 4 partner. Oppure che il 47,5% ne ha al max 1.

  • Frequenza cumulata

    xi fi pi % Фi0 9 0,225 22,5 22,5

    1 10 0.250 25,0 47,5

    2 7 0,175 17,5 65,0

    3 4 0,100 10,0 75,0

    4 2 0,050 5,0 80,0

    5 4 0,100 10,0 90,0

    6 1 0,025 2,5 92,5

    7 2 0,050 5,0 97,5

    8 1 0,025 2,5 100,0

    40 1,000 100,0

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale41

  • Frequenze cumulate (ass. e rel.)

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale42

  • Densità di frequenza

    • Fenomeni quantitativi continui (numeri e si misurano).

    • Il fenomeno X ha xi modalità che possono essere considerate intervalli.

    • Cioè all’intervallo tra x1 e x2 possono appartenere diverse unità statistiche. Quante?

    • La distribuzione di frequenza all’interno degli intervalli è ignota.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale43

  • Densità di frequenza

    • Se la distribuzione è ignota possiamo fare però due ipotesi per ripartire le unità statistiche tra gli intervalli (cioè densità).

    1. Il valore centrale

    2. La distribuzione uniforme

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale44

  • Densità di frequenza

    • Valore centrale: in medio stat virtus

    – Si associa a tutte le frequenze il valore centrale dell’intervallo: tra 45 e 55? 50.

    • Distribuzione uniforme: ogni possibilità è alla pari.

    – Tutte le unità sono distribuite in modo uniforme ed equidistante.

    a.a. 2019/2020Michele Marzulli - Sociologia e Statistica

    sociale45