Confronta la tua opinione con quella dei colleghi: crea il tuo Poll
CHI LO DICE? - liceomeda.it alla... · QUESTIONARI INTERVISTE (ANCHE TELEFONICHE) EXIT POLL ... USO...
Transcript of CHI LO DICE? - liceomeda.it alla... · QUESTIONARI INTERVISTE (ANCHE TELEFONICHE) EXIT POLL ... USO...
Non lasciamoci ingannare …..CHI LO DICE?
I dati possono anche provenire da una fonte autorevole, ma la conclusione …
Come è stata posta la domanda?…
Come è stato selezionato il campione?…
COME SONO STATI OTTENUTI QUESTI DATI?
Quanto numeroso è il campione?…
MA HA PROPRIO SENSO?
Un po’ di sano buonsenso …
Il caro buon vecchio Trilussa ….
LA STATISTICA
Sai ched‘ è la statistica? È ‘na cosache serve pe’ fà un conto in generalede la gente che nasce, che sta male,che more, che va in carcere e che sposa.
Ma pe’ me la statistica curiosaè dove c'entra la percentuale,pe’ via che lì la media è sempre egualepuro co' la persona bisognosa.
Me spiego: da li conti che se fannosecondo le statistiche d'adessorisulta che te tocca un pollo all'anno:
e, se nun entra nelle spese tue,t'entra ne la statistica lo stessoperchè c'è un antro che ne magna due.
La scienza è fatta di dati come una casa di pietre.Ma un ammasso di dati non è scienza più di quanto
un mucchio di pietre sia una casa.(Jules Henri Poincaré)
Il termine “statistica” venne introdotto nel diciassettesimo secolo col significato di “scienza dello stato”, volta a raccogliere e ordinare informazioni utili all’amministrazione pubblica: entità e composizione della popolazione, movimenti migratori, mutamenti anagrafici, tavole di natalità e mortalità, dati sui commerci, sui raccolti, sulla distribuzione della ricchezza, sull’istruzione e la sanità.
Cos’è la statistica?
� La STATISTICA si occupa di raccogliere ed elaborare informazioni su un fenomeno che si vuole studiare.
� La raccolta e l’elaborazione dei dati costituiscono l’INDAGINE STATISTICAvera e propria.
Indagini statisticheFasi di un’indagine statistica
1. Individuazione dell’obiettivo da raggiungere, definendo con accuratezza i termini del problema a cui bisogna dare risposta, cioè quali variabili statistiche bisogna osservare.
2. Individuazione dei metodi, dei mezzi e dei tempida utilizzare nella raccolta dati. Per quanto riguarda i metodi è fondamentale decidere se l’osservazione viene fatta su tutta la popolazione oppure su un campione.
Indagini statistiche3. Programmazione dell’indagine ed effettiva
rilevazione dei dati. Una raccolta dei dati ben organizzata, risparmia fatica nelle operazioni successive e permette la corretta impostazione del lavoro di analisi.
4. Sistemazione dei dati raccolti in forma di facile lettura (tabelle e grafici). I dati allo stato grezzo sono riferiti alla singola unità statistica
5. Determinazione di valori che descrivono sinteticamente il fenomeno: media, moda, mediana …...
Indagini statistiche
6. Calcolo delle misure di dispersione che indicano quanto le misure di tendenza (per esempio la media) si discostano dai dati raccolti.
7. Determinazione di rapporti statistici o numeri indici: rapporti tra numeri che a volte sono piùsignificativi dai valori assoluti. (es. rapporto tra m2 edificati in una regione e il numero di abitanti della regione)
Indagini statisticheLa statistica descrittiva si occupa di individuare
metodi e tecniche per sintetizzare l’informazione contenuta nei dati.
Gli strumenti di sintesi sono essenzialmente di tre tipi:
• tabelle (vedremo con EXCEL quali sono le possibilità)
• rappresentazioni grafiche (vedi EXCEL)• indici sintetici
Nelle indagini statistiche a campione occorre effettuare delle generalizzazioni di cui si occupa la statistica inferenziale.
Indagini statistiche
IMPORTANTE
Quando sintetizziamo l’informazione contenuta nei dati, ne perdiamo una parte. Gli strumenti di sintesi devono essere scelti in modo tale da:
• preservare , per quanto possibile, l’informazione rilevante per il problema analizzato
• eliminare l’informazione non necessaria
COME RACCOGLIERE I DATI� SCHEDE� QUESTIONARI � INTERVISTE (ANCHE TELEFONICHE)� EXIT POLL
Tipo della rilevazioneTotale : viene effettuata su tutte le unità statistiche della popolazione (censimento) costi elevati e tempi elevati risultati affidabili
Parziale (o campionaria): viene effettuata su una parte (o campione) della popolazione costi contenuti rapidità risultati approssimati
Occasionale: fatta "quando serve“ sondaggi d'opinione
Periodica: fatta regolarmente "ogni tanto tempo“ censimento (10 anni)
EsempioConsideriamo l’indagine condotta su 30 famiglie per stabilire il numero
dei figli
La POPOLAZIONE statistica è l’insieme degli elementi oggetto dell’indagine, cioè le 30 famiglie.
Il CARATTERE dell’indagine statistica è l’aspetto che si vuole studiare, cioè il numero dei figli.
I DATI o le MODALITA’ di un carattere sono le informazioni acquisite all’interno della popolazione, nel nostro caso sono i numeri 0,1,2,3,4.
n.figli 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 300 x x1 x x x x x x x x x x2 x x x x x x x x x3 x x x x x x4 x x x
Un po’ di definizioni ……
La frequenza assoluta ni di un generico dato statistico xi è il numero delle volte in cui il dato si presenta nell’indagine. Ad es. il dato 3 (figli) ha frequenza assoluta 6.
La frequenza totale (N) è la somma delle frequenze assolute, nel nostro caso 30.
La frequenza relativa fi è il rapporto tra la frequenza assoluta e la frequenza totale
cioèN
nf
i
i =
…….
Moltiplicando la frequenza relativa per 100 si ottiene la frequenza percentuale, pi
Dopo aver ordinato i dati quantitativi in ordine crescente si chiama frequenza cumulata Fi di un dato xi la somma della frequenza del dato stesso con le frequenze di tutti i dati che lo precedono
Natura dei caratteri� I caratteri qualitativi vengono indicati mediante
espressioni verbali. Sono caratteri qualitativi lo stato civile (celibe o nubile, coniugato/a, ecc.), il sesso (maschio o femmina), il colore degli occhi (grigi, azzurri, verdi, castani, neri..)
� I caratteri quantitativi sono esprimibili numericamente e si dividono in:
� caratteri discreti, come il numero degli alunni di una classe, o di reti segnate in una partita di calcio, possono assumere solo determinati valori, quasi sempre numeri interi.
� caratteri continui, quali i pesi, le stature e più in generale le grandezze che possono essere misurate, possono assumere qualsiasi valore reale in un dato intervallo (anche se usualmente si impiegano numeri decimali finiti).
Matrice dei dati
Matrice dei dati relativa ad una rilevazione statistica sugli studenti iscritti al corso diLaurea in Economia Aziendale
23marroni17876112
03Neri17478111
11neri18378110
22marroni1807209
12azzurri1848318
01marroni1737407
12neri1787516
13azzurri1808105
01marroni1827504
02neri1807013
21marroni180721 (m)2
11azzurri170650 (f)1
n. fratelli
Anno di corso
Colore occhi
Altezza (cm)
Peso(kg)SessoUnità
COME RAPPRESENTARE I DATI
� SERIAZIONE STATISTICA: Tabella contenente frequenze di intensità di un carattere QUANTITATIVO
� SERIE STATISTICA: Tabella contenente frequenze di modalità di un carattere QUALITATIVO
� SERIE STORICHE: Tabella contenente intensità di un carattere QUANTITATIVO rilevato per modalità TEMPORALI ( p.es. le vendite di automobili negli ultimo 10 anni)
Il modo più semplice ed immediato per rappresentare i dati ècostituito da tabelle.
Esiste una classificazione
2.000laurea
9.000diploma
5.000lic. Media
1.000lic. elementare
N. PERSONE
TITOLO DI STUDIO
507
1006
1505
3.0004
2.0003
5002
3001
n. APPARTAMENTIn. STANZE
Serie statistica
Seriazione statistica
104.200-4.600
403.800-4.200
1343.400-3.800
2543.000-3.400
1202.600-3.000
322.200-2.600
101.800-2.200
N°neonatiPeso (in grammi)
10.0002003
23.0002002
22.0002001
17.0002000
18.0001999
20.0001998
15.0001997
10.0001996
VENDITE AUTOANNO
Seriazione statistica con dati divisi in classi
Si suddividono i dati in classi quando il carattere analizzato ècontinuo
Serie temporale
100%
10%
10 %
20 %
20 %
40 %
Frequenza percentuale
100%
90%
80%
60%
40%
Frequenza cumulata
Carattere Frequenza assoluta
Frequenza relativa
0 20 0,4
5 10 0,2
10 10 0,2
15 5 0,1
20 5 0,1
TOTALE 50 1
f relativa = f assoluta / Totale
Come esempio si riportano i risultati su un’indagine condotta su un gruppo di 50 persone relativa al numero di sigarette fumate ogni giorno:
Talvolta può essere utile calcolare anche la frequenza cumulata (percentuale o relativa)
USO DEI GRAFICI
I dati raccolti in tabelle possono essere rappresentati attraverso grafici che offrono il
vantaggio di una descrizione del fenomeno in forma visiva.
Possono essere utilizzati i seguenti tipi di grafic i:� Diagrammi cartesiani� Istogrammi e ortogrammi� Diagrammi a nastro� Diagrammi circolari� Diagrammi polari� Cartogrammi� Ideogrammi
Diagrammi cartesianisono usati soprattutto per le serie
temporali
0
5
10
15
20
25
0 2 4 6 8 10 12 14 16
IstogrammiSi usano per rappresentare seriazioni continue con i dati raggruppati in classi.In generale, le aree dei rettangoli sono proporzionali alle frequenze.Se le classi hanno tutte la stessa ampiezza, le altezze dei rettangoli sono proporzionali alle frequenze.
Istogramma delle altezze
0
1
2
3
4
5
6
7
8
9
<160 161-165 166-170 171-175 176-180 181-185 186-190 191-195 >195
classi
frequenze assolute
OrtogrammiSono simili agli istogrammi ma usati per serie statistiche (cioè anche per dati qualitativi). Possono anche caratterizzarsi per pipiùù rettangolirettangoliaffiancati
Domanda 2.5 Qual è il modo migliore per ricevere c omunicazioni e informazioni dalla scuola
0
50
100
150
200
250
PROGRAMMATORI GEOMETRI IGEA NON SPECIFICATO TOTALE
cellulare internet posta
diario modulo lib.giust.
telefono
Diagrammi a nastro
5 0 0 0
2 5 0 0 0
1 5 0 0 0
1 0 0 0 0
1 8 0 0 0
5 0 0 0 0
2 0 0 0 0
2 0 0 0 0
0 1 0 0 0 0 2 0 0 0 0 3 0 0 0 0 4 0 0 0 0 5 0 0 0 0 6 0 0 0 0
A
B
C
D
E
F
G
H
Diagrammi circolari o diagrammi a torta3%
1 5%
9%
6%
1 1%3 2%
1 2%
1 2%
A B C D E F G H
Le ampiezze degli angoli al centro dei settori colorati sono direttamenteproporzionali alle frequenze percentuali. Ad esempio, per la zona arancio si ha:X:360°=32:100 cioè x=125,2°
Diagrammi circolari
T o r ta t r id im e n s io n a le
3%1 5%
9%
6%
1 1%3 2%
1 2%
1 2%
A B C D E F G H
Diagrammi polarisono usati per particolari serie storiche con carattere di ciclicità
assenze
01020304050lunedì
martedì
mercoledìgiovedì
venerdì
assenze
Cartogrammi Sono utilizzati per rappresentare serie territoriali
7,3
11
20,1
Ideogrammi Sono rappresentazioni mediante figure stilizzate che rappresentano il fenomeno studiato
anni
Auto vendute