Presentazione a cura della prof.ssa ANNUNZIATA DI BIASE
Dicembre 2014
Slide 2
Statistica descrittiva Statistica descrittiva e inferenziale
Distribuzioni di frequenza Rappresentazioni grafiche Indici di
sintesi e di dispersione
Slide 3
I termine statistica ha una radice italiana e cio deriva dalla
parola STATO. Questa definizione apparve per la prima volta nel
1589 ad opera di Ghislin, che la indic come descrizione delle
qualit che caratterizzano gli elementi che compongono uno Stato.
Nella sua prima eccezione, quindi, la statistica principalmente lo
studio di informazioni di interesse nazionale. Solo in un secondo
momento, questa disciplina cominci ad allargare i propri confini e
ad assumere il significato pi generale di analisi quantitativa dei
fenomeni collettivi che hanno attitudine a variare.
Slide 4
La statistica lo studio dei fenomeni collettivi (ossia di quei
fenomeni che riguardano una pluralit di soggetti), che hanno
attitudine a variare. Essa si occupa di raccogliere ed analizzare
dati, relativi ad un gruppo di persone (studenti di una scuola,
elettori di una regione, abitanti di un quartiere,) o oggetti
(automobili, dischi, libri,) per trarre conclusioni e fare
previsioni.
Slide 5
Nello studio della statistica si distingue generalmente tra la
statistica descrittiva e la statistica inferenziale. La statistica
descrittiva: E un indagine che si occupa della raccolta,
dellelaborazione dei dati e della descrizione dei fenomeni
collettivi o di massa. Essa si occupa di descrivere la massa dei
dati sperimentali con pochi numeri o grafici significativi. Quindi,
per cos dire si occupa di fotografare una data situazione e di
sintetizzarne le caratteristiche salienti. La statistica
inferenziale: Studia le modalit con cui possibile estendere
allintero universo statistico le conclusioni di un indagine svolta
su di un campione e permette di valutare il grado di attendibilit
di tali conclusioni. Essa utilizza i dati statistici, anche
opportunamente sintetizzati dalla statistica descrittiva, per fare
previsioni di tipo probabilistico su situazioni future o comunque
incerte.
Slide 6
Slide 7
LINDAGINE STATISTICA E LE SUE FASI 1.IMPOSTAZIONE DELLINDAGINE
STATISTICA 2.RILEVAZIONE DEI DATI 3.SPOGLIO E TRASCRIZIONE DEI DATI
DEI DATI 4. ELABORAZIONE DATI Per INDAGINE STATISTICA si intende
uninsieme di attivit finalizzate ad approfondire la conoscenza di
un fenomeno. Le sue FASI sono:
Slide 8
1) IMPOSTAZIONE DELLINDAGINE STATISTICA In questa prima fase
occorre precisare: LOSCOPO DELLA RICERCA LO SCOPO DELLA RICERCA GLI
OBIETTIVI CHE SI VOGLIONO GLI OBIETTIVI CHE SI VOGLIONO RAGGIUNGERE
RAGGIUNGERE LE UNIT STATISTICHE OGGETTO DI INDAGINI LE UNIT
STATISTICHE OGGETTO DI INDAGINI
Slide 9
Una distribuzione statistica serve ordinare e classificare i
soggetti secondo un certo criterio. Le distribuzioni statistiche
derivano dalloperazione di classificazione delle unit considerate
secondo le modalit di uno o pi caratteri. Se si riferisce ad un
solo carattere la distribuzione statistica si definisce SEMPLICE.
Se si riferisce a 2, 3,.N caratteri allora la distribuzione
statistica si definisce DOPPIA, TRIPLA,MULTIPLA. Se il carattere
considerato qualitativo la distribuzione statistica si chiama anche
SERIE STATISTICA. Se il carattere quantitativo allora si parla di
SERIAZIONE STATISTICA. DISTRIBUZIONE STATISTICHE DISTRIBUZIONE
STATISTICHE
Slide 10
2) RILEVAZIONE DEI DATI CARATTERI Per rilevare dati statistici,
fondamentale sapere esattamente COSA si vuole misurare e COME. In
questa fase occorre individuare in modo preciso la caratteristica
(CARATTERE) della popolazione che vogliamo sottoporre a studio.
TECNICA DI RACCOLTA DEI DATI Tecnicamente, la raccolta dei dati pu
essere fatta in modi diversi: misurazioni, questionario ecc..,
tuttavia la raccolta pi seguita quella dell INTERVISTA DIRETTA o
INDIRETTA. Lintervista diretta prevede domande poste direttamente
dallintervistatore. Lintervista indiretta prevede il riempimento di
un questionario a risposte aperte o chiuse che lintervistato deve
riempire in tutte le sue parti come il censimento. In Italia il
censimento si effettua ogni dieci anni (anni in cui lultima cifra
1, come lultimo che stato rilevato nel 2011, i precedenti
2001,1991,,1861 (anno dellunit dItalia) il prossimo sar nel
2021).
Slide 11
Questionario sullimpiego del tempo libero Esempio di intervista
indiretta: Dati generali 1 Cittadinanza................ 2 Sesso M F
3 Et................ 4 Peso................ 5
Altezza................. Dati specifici 6 Pratichi uno sport SI NO
8 Ascolti la musica SI NO 9 Suoni qualche strumento SI NO 11 Guardi
la televisione SI NO 12 Frequenti discoteche SI NO 13 Vai al cinema
SI NO 14 Ti dedichi alla lettura SI NO 15 Coltivi qualche hobby Si
NO 16 Pratichi volontariato SI NO INDAGINE STATISTICA
Slide 12
ORGANI PREPOSTI ALLA RACCOLTA DEI DATI La raccolta dei dati pu
essere fatta da CHIUNQUE abbia interesse a fare una ricerca
statistica. In Italia lorgano pi importante che si occupa della
raccolta dei dati e della loro successiva elaborazione LISTITUTO
CENTRALE DI STATISTICA (sigla ISTAT)
Slide 13
NATURA DEI CARATTERI I caratteri (dati raccolti) possono essere
di natura QUANTITATIVA oppure QUALITATIVA. I caratteri o dati
qualitativi (o mutabili) sono rappresentati da aggettivi
(nazionalit, religione, ecc). I caratteri o dati quantitativi (o
variabili) sono espressi da numeri (altezza, peso, ecc.). MODALITA
DI UN CARATTERE Le modalit sono i diversi aspetti che un carattere
pu assumere. Esempio: M ed F sono le 2 modalit del carattere sesso.
In una rilevazione dei dati i caratteri stanno ad indicare l
insieme dei fenomeni oggetto di studio riguardanti le
caratteristiche che differenziano tra loro le unit
statistiche.
Slide 14
NATURA DI UNA MODALITA Carattere qualitativo Carattere
quantitativo La modalit pu essere Nominale o sconnessa Ordinale La
modalit pu essere Discreta Continua Le modalit NON si possono
ordinare secondo una scala di misurazione. Es. credo religioso,
malattie, Le modalit si possono ordinare secondo una scala di
misurazione. Es. giudizi, titolo di studio,... Le modalit sono
numeri INTERI. Es. numero fratelli, Le modalit sono numeri REALI.
Es. altezze, pesi,
Slide 15
Slide 16
Esempi caratteri qualitativi Esempio 1 modalit nominale o
sconnesse: Sesso: M, F Corso di Laurea: Med. Ing. Sc.Pol. Giur.
Stat. Mat. Provincia: Cz, Mi, Na, Pa, RM Religione. Cat., Mus.,.
Ebreo, Ind, Taoista Esempio 2 modalit ordinate: Giudizio: Suff.
Buono, Ottimo Posizione graduatoria: I II III IV V Classe Soc.:
Bassa, Media, Alta Titolo Studio: Nessuno, Elem., Med.inf.,
Med.sup., Laurea
Slide 17
Esempi caratteri quantitativi Esempio 1 modalit discrete: a. N
componenti famiglia: 1 2 3 4 5 6 7 8 b. N posti letto ospedale: 125
128 136 547 874 1258 2581 c. Residenti comune: 854 1258 5890 6587
15897 178.985 3.58.211 458.547 2.427.258 Esempio 2 modalit
continue: a. Precipitazioni in pollici a Torino nel mese di aprile
(20 giorni): 2.93.73.24.03.92.12.92.91.1
0.43.03.33.21.02.25.43.53.6 4.0 b. Altezza maschi Italiani: 175,3
168,4 187,1 158,4 167,5 170.2 174,6 175.6
Slide 18
SCHEMA RIASSUNTIVO La statistica lo studio quantitativo di un
fenomeno collettivo: si studia individuando il collettivo
statistico o popolazione statistica che linsieme delle unit
statistiche: i singoli casi rispetto ai quali il fenomeno si
manifesta le caratteristiche, dette caratteri, delle unit
statistiche che ci sembrano rilevanti per la descrizione del
fenomeno stesso Il modo in cui ogni carattere si manifesta nelle
unit statistiche viene descritto attraverso delle modalit Le
modalit possono essere di tipo qualitativo: si esprimono tramite
aggettivi e sostantivi; possono essere quantitativo: si esprimono
tramite numeri; possono essere ordinate se si pu stabilire un
ordine discrete se vengono descritte da numeri interi continue se
vengono descritte da numeri reali sconnesse: se non possono essere
ordinate
Slide 19
METODI DI RILEVAZIONE DEI DATI La rilevazione dei dati pu
essere effettuata su tutta la popolazione oggetto di studio, cio su
tutto lUNIVERSO, oppure su una porzione di esso, cio su un
CAMPIONE. Gli elementi della popolazione studiata prendono il nome
di UNITA STATISTICHE.
Slide 20
3) SPOGLIO E TRASCRIZIONE DEI DATI 3) SPOGLIO E TRASCRIZIONE
DEI DATI Per lo spoglio dei dati occorre utilizzare unoperazione
semplice, ma fondamentale che il CONTEGGIO. Infatti dopo la
rilevazione dei dati occorre contare quante volte una modalit di un
carattere si ripetuta cio con che frequenza si ripetuta. Dopo aver
contato i dati, vengono scritti in tabelle (rappresentazione
numerica) che possono essere semplici o composte. Una TABELLA
SEMPLICE formata da DUE COLONNE e consente la classificazione dei
dati rispetto ad un SOLO CARATTERE. Una TABELLA COMPOSTA formata da
PI COLONNE, e consente la classificazione dei dati rispetto a PI
CARATTERI
Slide 21
1) TABELLA SEMPLICE Orario (h) Temperatura (C) 02 62 1211 188
244 ESEMPIO: Riportiamo in una TABELLA SEMPLICE i DATI riguardanti
le TEMPERATURE registrate durante una giornata autunnale ad
intervalli di sei ore: 1) h=0; T=2C; 2) h=6;T=2C; 3) h=12;T=11C; 4)
h=18;T=8C; 5) h=24;T=4C dati tabella semplice
Slide 22
2) TABELLA COMPOSTA ESEMPIO: Riportiamo in una TABELLA COMPOSTA
i DATI riguardanti le ALTEZZE (h) ed i PESI (P) di una famiglia di
quattro persone: 1) Padre; h = 175 cm; p = 80 kg; 2) Madre: h = 170
cm; p = 64 kg; 3) Figlio h = 180 cm; p = 74 kg; 4) Figlia h = 173
cm; p = 60 kg dati tabella composta Componente nucleo altezza h =
cm peso P = kg Padre17580 Madre17064 Figlio18074 Figlia17360
Slide 23
4) ELABORAZIONE DEI DATI 4) ELABORAZIONE DEI DATI In questa
fase i dati vengono sottoposti ad una elaborazione matematica il
cui scopo quello di esprimere i risultati dellindagine in modo
sintetico, mediante: 2. rappresentazione grafica dei dati 3. Indici
di centralit 1. rappresentazione numerica dei dati e relative
frequenze
Slide 24
RAPPRESENTAZIONE DEI DATI STATISTICI Rappresentazione numerica
dei dati: Rappresentazione grafica dei dati: La rappresentazione
dei dati pu essere NUMERICA e GRAFICA TABELLE SEMPLICI 1) TABELLE
SEMPLICI 2) TABELLE COMPOSTE DIAGRAMMI CARTESIANI 1) DIAGRAMMI
CARTESIANI 2) ISTOGRAMMI 3) IDEOGRAMMI 4) DIAGRAMMI A TORTA
Slide 25
FREQUENZE ASSOLUTE La FREQUENZA ASSOLUTA indica quante volte la
MODALIT di un CARATTERE si ripete. Colore capelli (carattere) N
persone (frequenza assoluta) Neri 10 Castani 6 Rossi 1 Biondi 5
totale 22 Frequenze assolute carattere modalit
Slide 26
FREQUENZE RELATIVE La frequenza relativa di una certa modalit
data dal rapporto tra la frequenza assoluta di tale modalit ed il
numero totale dei casi. Spesso si esprime la frequenza relativa in
forma percentuale. Le FREQUENZE ASSOLUTE, di due distribuzioni di
dati, anche della stessa specie, non sono confrontabili in quanto
si riferiscono, in generale, ad un diverso numero di casi
complessivi. Questo inconveniente viene superato introducendo il
concetto di FREQUENZA RELATIVA Frequenza relativa = frequenza
assoluta / totale casi
Slide 27
Colore capelli (carattere) N persone (frequenza assoluta)
Frequenza Relativa (f.a./totale) Neri100,46 Castani60,28 Rossi10,02
Biondi5 24 totale221 Frequenze relative Esempio:
Slide 28
FREQUENZE RELATIVE PERCENTUALI La frequenza relativa
percentuale di una certa modalit data dalla frequenza relativa
moltiplicata per 100. Frequenza relativa percentuale = frequenza
relativa per 100
Consideriamo un carattere le cui modalit siano ordinate. Si
chiama frequenza cumulata (assoluta o relativa) della modalit x la
somma delle frequenze (assolute o relative) della modalit x e di
tutte quelle modalit che precedono la x. Si chiama frequenza
retrocumulata (assoluta o relativa) della modalit x la somma delle
frequenze (assolute o relative) della modalit x e di tutte quelle
modalit che seguono la x. FREQUENZA CUMULATA E RETROCUMULATA
Slide 31
Colore capelli (carattere) N persone (frequenza assoluta)
Frequenza. Cum assoluta Frequenza Retrocumulata assoluta
Rossi11+0=11+5+6+10+22= 44 Biondi55+1=65+6+10+22=43
Castani66+5+1=126+10+22=38 Neri1010+6+5+1=2210+22=32
totale2222+10+6+5+1= 44 22+0=22 Esempio:
Slide 32
SCHEMA RIASSUNTIVO Lo spoglio dei questionari o delle schede di
rilevazione porta alla costruzione della tabella o matrice dei dati
grezzi: tabella in cui a ogni unit statistica compete una riga
nella quale sono specificate le modalit che la descrivono in
riferimento ai caratteri studiati; da essa si ottengono le tabelle
di frequenza la frequenza di una modalit pu essere assoluta: numero
delle modalit da esso descritte relativa: rapporto tra la frequenza
assoluta e la numerosit del collettivo considerato pu anche essere
espressa in forma percentuale. Essa serve a confrontare due
collettivi distinti e a valutare il peso di una modalit rispetto
alla totalit del collettivo per ogni modalit contengono la
frequenza corrispondente cumulata: somma delle frequenze di tutte
le modalit minori o uguali alla modalit considerata retrocumulata:
somma delle frequenze di tutte le modalit maggiori o uguali alla
modalit considerata
Slide 33
In una tabella di frequenza a ogni modalit di un carattere
associato un numero che rappresenta la frequenza di quella modalit.
Non difficile riconoscere che ci troviamo di fronte a una funzione.
Si chiama distribuzione di frequenza la funzione che associa a ogni
modalit ad un dato carattere la sua frequenza. Il dominio di una
distribuzione di frequenza linsieme delle modalit di un carattere.
DISTRIBUZIONE DI FREQUENZA
Slide 34
CLASSI DI FREQUENZE Si definisce ampiezza di una classe la
differenza tra lestremo superiore e lestremo inferiore della
stessa. Le classi possono essere: 1.di pari ampiezza (equi- ampie)
2.di pari frequenza (equi- frequenti ). Se in una DISTRIBUZIONE i
dati sono molto NUMEROSI, allora i valori dei caratteri possono
essere raggruppati in classi; nel caso di caratteri quantitativi le
classi sono sovente intervalli di valori, i cui valori estremi
siano compresi in uno e un solo intervallo. La suddivisione in
classi consente di determinare le frequenze assolute e relative
delle classi in luogo delle singole modalit.
Slide 35
Le regole fondamentali per la suddivisione in classi dei valori
del carattere rilevati sono le seguenti: 1.Le classi devono essere
esaustive: ogni valore deve appartenere ad almeno una classe; 2. le
classi devono essere a due a due disgiunte, quindi ogni valore deve
appartenere ad una sola classe (in modo da evitare che esso sia
considerato due volte e quindi siano contate due volte le unit
statistiche che hanno come determinazione del carattere quel valore
); 3.le classi devono essere ordinate in modo che i valori della
prima precedono tutti quelli della seconda classe e quelli della
seconda precedono quelli della terza classe e cosi via. REGOLE PER
LA COSTRUZIONE DELLE CLASSI
Slide 36
I raggruppamenti delle classi possono essere operati in modo
diverso, ma devono essere ordinate in ordine crescente. Di ogni
classe si calcola: lampiezza, la densit di frequenza (se le
ampiezze delle classi sono diverse) e il valore centrale. Ampiezza
= differenza tra lestremo superiore e lestremo inferiore. Densit di
frequenza = rapporto tra la frequenza relativa e lampiezza. Valore
centrale = media aritmetica tra lestremo inferiore e lestremo
superiore.
Slide 37
TRASCRIZIONE DEI DATI PER CLASSI La rappresentazione di una
DISTRIBUZIONE DI DATI PER CLASSI, si presenta VANTAGGIOSA quando i
dati sono molto NUMEROSI. Rappresentazione numerica
Rappresentazione per classi di peso CLASSI DI PESO (termini) N
STUDENTI (frequenze) 50 60 Kg4 60 70 Kg7 70 80 Kg3 totale14 L
informazione, diviene meno precisa nel caso di una distribuzione
per classi, tuttavia la visione della distribuzione diventa pi
semplice e rapida PESO (Kg) (termini) N STUDENTI (frequenze) 52 1
54 1 55 2 611 631 682 693 711 731 751 TOTALE14 ESEMPIOESEMPIO
Slide 38
RAPPRESENTAZIONI GRAFICHE dei dati statistici I GRAFICI possono
essere di diverso tipo : Le INFORMAZIONI che derivano da una
raccolta dati sono pi evidenti se sono visualizzate attraverso
GRAFICI Rappresentazioni grafiche dei dati: DIAGRAMMI CARTESIANI 1)
DIAGRAMMI CARTESIANI 2) ISTOGRAMMI 3) IDEOGRAMMI 4) DIAGRAMMI A
TORTA
Slide 39
Le rappresentazioni grafiche hanno lobiettivo di illustrare,
mediante: -figure, -linee o segmenti, -superfici o aree, -solidi,
-simboli convenzionali -ecc. una distribuzione di frequenze o delle
modalit di uno o pi caratteri.
Slide 40
Per massimizzare lefficacia di un grafico lattenzione deve
essere concentrata sui dati. Pertanto le componenti di supporto:
Devono essere presenti solo se necessarie: titoli degli assi,
legende e etichette in alcuni casi possono essere essenziali per la
comprensione del grafico, ma in altri possono essere del tutto
inutili. Devono essere lievi: preferibile usare linee pi leggere
per gli assi e per la griglia e linee pi marcate per i dati. Gli
effetti decorativi non devono allontanare lattenzione del lettore
dai dati.
Slide 41
Il grafico a destra pi facile da leggere. Il ricorso a poche
componenti di supporto permette di concentrare lattenzione sui
dati. Nel grafico tutte le componenti hanno il massimo impatto. Il
risultato un grafico confuso, difficile da leggere anche se sono
presenti solo 3 valori.
Slide 42
1.Diagrammi cartesiani 2.Diagrammi cartesiani a segmenti 3.
Istogrammi 3. Poligono di frequenza
Slide 43
DIAGRAMMA CARTESIANO Esempio: Riportiamo su di un DIAGRAMMA
CARTESIANO le TEMPERATURE registrare ogni sei ore, durante una
giornata autunnale : 1) h=0; T=2c2) h=6;T=2C 3) h=12;T=11C 4)
h=18;T=6C 5) h=24;T=4C dati Grafico T (C) Un DIAGRAMMA CARTESIANO
formato da due RETTE (assi) perpendicolari tra loro, lasse
ORIZZONTALE si chiama ASCISSA (asse X), lasse VERTICALE si chiama
ORDINATA (asse Y). Su di essi vengono riportati i dati statistici,
viene usato per rappresentare le SERIE STORICHE. 0 6 12 18 24 h
(ore) 12 10 8 6 4 2 DIAGRAMMA CARTESIANO Y X (0;2)(0;2) (6;2)(6;2)
(12;11) (18;6) (24;4) Basta riportare sull asse X il Tempo e sull
asse Y le Temperature
Slide 44
Esempio: Riportiamo in un ISTOGRAMMA le marche di cellulari pi
in uso fra i giovani : NOKIA (300), SIEMENS (240), SAMSUG (120),
PANASONIC (80), MOTOROLA (50) LISTOGRAMMA un grafico a colonne: le
colonne (rettangoli) hanno basi uguali e possono essere disegnate
una vicino allaltra. Laltezza proporzionale alla frequenza di
ciascun dato. Vien usato nei caratteri quantitativi CONTINUI. 320_
280_ 240_ 200_ 160_ 120_ 180_ 140_ Noki Siem Sams Pana Moto 300 240
120 80 50 ISTOGRAMMA
Slide 45
Gli istogrammi si impiegano per rappresentare graficamente
distribuzioni di frequenza di caratteri quantitativi le cui modalit
sono costituite da classi di valori. A tal fine occorre distinguere
due casi, ovvero: 1.Le classi di valori hanno uguale ampiezza. In
questo caso avremo tanti rettangoli contigui, ciascuno avente base
uguale allampiezza della classe e altezza uguale o proporzionale
alla frequenza (assoluta o relativa) assunta nellinsieme delle unit
della classe.
Slide 46
2. Le classi di valori hanno diversa ampiezza. In questaltro
caso avremo una serie di rettangoli aventi basi diverse uguali
allampiezza delle classi e altezze da calcolarsi, in modo che le
frequenze siano proporzionali alle aree dei rispettivi rettangoli.
In ordinata, pertanto, avremo le cosiddette densit di frequenza
date dal rapporto tra la frequenza (assoluta o relativa) di
ciascuna classe e la relativa ampiezza.
Slide 47
Esempio: La classe (0 ; 2) indica un intervallo chiuso con
lestremo inferiore uguale a zero e lestremo superiore uguale a 2.
Tutte le altre classi indicano degli intervalli aperti allestremo
inferiore e chiusi allestremo superiore.
Slide 48
Slide 49
Il poligono di frequenza una spezzata che unisce i punti aventi
per ascissa i punti centrali delle classi e per ordinata la
relativa frequenza. In un istogramma, il poligono delle frequenze
unisce i punti medi dei lati superiori dei rettangoli; la spezzata
deve essere chiusa e deve toccare lasse delle ascisse allesterno
delle classi estreme, in modo che larea allinterno del poligono di
frequenza equivalga a quella dellistogramma. Ogni vertice del
poligono delle frequenze corrisponde al valore centrale di una
classe. Il termine poligono usato impropriamente perch indica una
spezzata aperta (e non chiusa). Se le classi hanno la stessa
ampiezza, (di solito si considerano come vertici della spezzata
anche i punti corrispondenti ai valori centrali delle classi
immediatamente precedenti e immediatamente successive a quelle per
le quali la frequenza diversa da zero. Queste classi hanno
frequenza zero. Si pu verificare che in tal modo la somma delle
aree dei rettangoli dellistogramma uguale allarea delimitata
dallasse orizzontale e dal poligono delle frequenze. La somma delle
aree dei rettangoli di un istogramma uguale allarea sottostante il
poligono delle frequenze.
Slide 50
Slide 51
Sono impiegati per rappresentare graficamente caratteri
quantitativi DISCRETI, non divisi in classi, e possono configurarsi
a segmenti verticali. Esempio. Numero dei componenti per famiglia,
numero delle stanze delle abitazioni, numero di unit locali delle
aziende e cos via. Essi si costruiscono come gli usuali diagrammi
cartesiani aventi due assi perpendicolari: lasse delle ascisse (x)
e lasse delle ordinate (y), aventi origine comune in zero. Ogni
coppia ordinata di valori (x i,y i ) determiner un punto nel piano
e linsieme di tutte le coppie (x i = modalit quantitativa i-esima,
y i = frequenza della modalit i-esima) determiner linsieme dei
punti nel piano che costituiscono la rappresentazione grafica della
distribuzione considerata. Per rendere maggiormente visibili tali
punti, si tracciano dei segmenti verticali congiungenti lascissa (x
i ) con il punto del piano corrispondente allordinata (y i ).
Slide 52
E da notare che in questo caso scorretto costruire il poligono
o spezzata di frequenza congiungendo tra loro i punti poich il
carattere considerato discreto e quindi, per sua natura, non
possiede i valori intermedi a quelli indicati dalle modalit
quantitative. Una spezzata di frequenza che unisse tra loro le
modalit, infatti, attribuirebbe anche valori intermedi alle modalit
stesse.
Slide 53
1.Grafici a barre: ortogrammi o a nastri 2.Diagrammi circolari
3.Ideogrammi 4.Cartogrammi, mappe tematiche
Slide 54
I grafici a barre sono impiegati per rappresentare graficamente
caratteri con modalit qualitative, serie sconnesse o rettilinee e
possono essere di due tipi: 1.A colonne se sono costituiti da una
successione di colonne, segmenti verticali o rettangoli (a base
uguale) equidistanti, in numero pari alle modalit del carattere, e
hanno altezza uguale o proporzionale alla frequenza (assoluta o
relativa). Sullasse delle ascisse (orizzontale) si riportano le
modalit, sullasse delle ordinate (verticale) si riportano le
frequenze. 2.A nastri, se sono costituiti da tanti nastri (segmenti
orizzontali, rettangoli) sovrapposti ed equidistanti, in numero
pari alle modalit del carattere, e hanno lunghezza uguale o
proporzionale alla frequenza (assoluta o relativa). Sullasse delle
ascisse (orizzontale) si riportano le frequenze, sullasse delle
ordinate (verticale) si riportano le modalit.
Slide 55
Se la rappresentazione grafica riguarda una serie sconnessa,
lordine in cui saranno poste le modalit arbitrario; se si tratta
invece di una serie rettilinea (es. titolo di studio), le modalit
saranno poste nellordine naturale che esse presentano nella serie.
Ortogramma a colonne Ortogramma a nastri
Slide 56
Maschi(in migliaia) Femmine(in migliaia) Agricoltura Industria
Altre attivit In cerca di Occupazione 1.7865.901 6.520 808 9731.826
3.745 1.104 Esempio di ortogramma: popolazione per condizione,
settore di attivit economica degli occupati e sesso in Italia nel
1981.
Slide 57
Gli ortogrammi si utilizzano anche per rappresentare
contemporaneamente dati di segno opposto come entrate e uscite,
importazioni ed esportazioni. Un esempio di ortogramma per la
rappresentazione contemporanea di dati positivi e negativi quello
riportato sotto.
Slide 58
Carattere qualitativo nominale a barre verticali: ORTOGRAMMA
N.B. E possibile costruire il diagramma a barre riportando in
ordinata le frequenze assolute OPPURE le frequenze relative, la
forma della rappresentazione risulta invariata.
Slide 59
principali cause di morte nell'uomo nei Paesi industrializzati
(fonte: WHO)
Slide 60
Nel grafico precedente, la scala delle ascisse indica i tassi
di mortalit per 100.000 persone e per anno (cio il numero di morti
ogni 100.000 persone in 1 anno per ogni causa considerata). In
particolare, le barre verdi forniscono i valori osservati nel 1900,
quelle gialle i valori del 1984. Ora, confrontando le differenze
fra le barre verdi e le gialle per tutte le cause riportate nel
grafico, saltano agli occhi gli enormi progressi ottenuti per le
malattie infettive tubercolosi, influenza, polmonite ecc.) alcune
delle quali risultano oggi pressoch scomparse nei Paesi
industrializzati a cui il grafico si riferisce. La facilit con cui
abbiamo acquisito informazioni dal grafico, una conseguenza della
loro visualizzazione in forma di grafico a barre: questa
rappresentazione consente di cogliere le caratteristiche salienti
della rilevazione statistica e di effettuare raffronti con notevole
immediatezza rispetto ai soli dati numerici. Per contro, a questa
maggior immediatezza di sintesi pu far riscontro una diminuzione
del senso critico nel valutare i dati.
Slide 61
In tal caso si traccia una CIRCONFERENZA e si procede alla sua
divisione in parti proporzionali alle intensit delle componenti del
fenomeno statistico. Esempio Un collezionista si ritrova con 5.750
francobolli di cui: 1.250 sono della Citt del Vaticano, 1.100 della
Repubblica di S Marino e 3.400 Italiani. Rappresentare il fenomeno
statistico mediante un diagramma a torta. DIAGRAMMI CIRCOLARI O
AEROGRAMMA LAREOGRAMMA un tipo di rappresentazione grafica alla
quale si ricorre quando si vogliono rappresentare le parti che
compongono un fenomeno statistico, usato nei caratteri qualitativi
SCONNESSI. 59% 22% 19% percentuali ampiezza settori circolari
AEROGRAMMA o diagramma a torta
Slide 62
I diagrammi circolari (o aereogrammi) per la loro forma
circolare, sono comunemente noti come diagrammi a torta. Sono
particolarmente adatti alle serie sconnesse o rettilinee. Sono
efficaci per mettere in evidenza limportanza relativa delle singole
modalit rispetto al totale.
Slide 63
IDEOAGRAMMA LIDEOGRAMMA un tipo di rappresentazione grafica nel
quale il fenomeno statistico viene rappresentato mediante limpiego
di FIGURE che richiamano idealmente il contenuto del fenomeno e
dove la sua frequenza proporzionale alle DIMENSIONI oppure al
NUMERO delle figure impiegate. Esempio Rappresentare mediante un
ideogramma le popolazioni di due cittadine formate da 6.500 e 4.000
abitanti. Quando il fenomeno da rappresentare non si pu
rappresentare con una figura intera allora si ricorre ad una
FRAZIONE di essa. Unit di riferimento = 1.000 abitanti 6.550
abitanti 4.000 abitanti
Slide 64
I cartogrammi sono grafici utili per rappresentare serie
territoriali o geografiche. Per costruire un cartogramma occorre
disporre di una carta geografica o topografica in cui siano
chiaramente delimitate le diverse zone, regioni, circoscrizioni
(geografiche, politiche, amministrative) rispetto alle quali viene
analizzata lintensit o la frequenza di uno o pi caratteri (es.
nati, morti, reddito pro capite, secondo le Regioni, Province,
Comuni).
Slide 65
I cartodiagrammi non sono altro che dei cartogrammi in cui,
anzich delle serie territoriali semplici, vengono rappresentate
delle serie territoriali di due o pi caratteri. Esempio: I nati
vivi e i morti per 1.000 abitanti nelle 20 Regioni italiane nel
1986.
Slide 66
SCHEMA RIASSUNTIVO Caratteri qualitativi sconnessi Serie
storiche Caratteri quantitativi discreti Caratteri quantitativi
continui Diagramma a torta Diagramma a colonne: istogramma
Diagramma a nastri o a barre Diagramma a segmento Caratteri
qualitativi ordinati Serie geografiche Diagramma a colonne
Diagramma a nastri Diagramma ad aste o segmenti Diagramma a
colonne:istogrammi Diagramma cartesiano Diagramma a colonne:
ortogrammi Cartogramma
Slide 67
La scelta della rappresentazione grafica Questi 2 grafici
rappresentano la stessa distribuzione. Qual pi chiaro? Quale
settore del diagramma circolare maggiore?
Slide 68
La scelta della rappresentazione grafica Per la maggior parte
delle persone pi facile confrontare segmenti piuttosto che angoli.
Nel diagramma circolare i settori numero 1 e 4 sembrano identici,
mentre nel diagramma a barre evidente la differenza. E opportuno
rappresentare la stessa distribuzione con pi grafici per
individuare quello che meglio rappresenta il messaggio che si vuole
veicolare.
Slide 69
I grafici finora analizzati ci danno informazioni qualitative;
possiamo quantificarle ricorrendo ai seguenti indici. di calcolo
MEDIE ( semplici e ponderate) ( tengono conto di TUTTI i valori
della distribuzione) di sintesi valori della distribuzione) di
posizione MEDIANA (si calcolano tenendo (si calcolano tenendo MODA
conto solo di ALCUNI valori) conto solo di ALCUNI valori) INDICI
CAMPO DI VARIAZIONE O RANGE di dispersione VARIANZA SCARTO
QUADRATICO MEDIO COEFFICIENTE DI VARIAZIONE
Slide 70
MEDIA ARITMETICA SEMPLICE Consideriamo una distribuzione di
DATI DIVERSI UNO DALLALTRO: La MEDIA ARITMETICA SEMPLICE uguale
alla somma dei dati divisa per n, cio: Le medie sono adatte a
rappresentare distribuzioni di caratteri quantitativi
Slide 71
COMPITOVOTO N 17 N 28 N 36 TOTALE21 Un alunno nei tre compiti
di matematica ha riportato i voti presenti in tabella. Calcolare la
MEDIA ARITMETICA dei voti. Dove: 21 = somma dei voti 3 = numero dei
voti 7 = MEDIA ARITMETICA dei voti MEDIA ARITMETICA SEMPLICE
Esempio di calcolo
Slide 72
MEDIA ARITMETICA PONDERATA Se i dati si presentano con una
certa FREQUENZA o PESO allora il calcolo della media deve essere
effettuato sommando ogni termine tante volte quante indica la sua
frequenza. Supponiamo che: Il termine a 1 si presenta con frequenza
p 1 Il termine a 2 si presenta con frequenza p 2 Il termine a n si
presenta con frequenza p n Il calcolo della MEDIA PONDERATA si
effettua con la relazione:
Slide 73
MEDIA ARITMETICA PONDERATA Esempio di calcolo 20 Studenti di
una classe, hanno ottenuti in matematica i voti riportati in
tabella. Calcolare la MEDIA PONDERATA dei voti. Dove: 122 = somma
dei voti 20 = numero di studenti 6,1 = MEDIA PONDERATA dei voti
Voto in Matematica Numero studenti 42 53 68 75 82 totale20
Slide 74
MEDIA PONDERATA NEL CASO DI UNA DISTIBUZIONE DI DATI PER CLASSI
In questo caso ad ogni classe, viene sostituito il TERMINE
CENTRALE, calcolato mediante la semisomma dei termini estremi della
classe (X1-X2). I termini centrali cosi ottenuti costituiscono i
termini a 1 ; a 2 ; a 3 ; ecc. della distribuzione. classefrequenza
X 1 -X 2 p1p1 X 2 -X 3 p2p2 X 3 -X 4 p3p3 ecc. Termine centrale
frequenze a1a1 p1p1 a2a2 p2p2 a3a3 p3p3 ecc. SEMISOMME Infine la
media ponderata si calcola con la relazione
Slide 75
MEDIA PONDERATA DI UNA DISTIBUZIONE DI DATI PER CLASSI Esempio
di calcolo Si fa riferimento ai dati della tabella 1 Classi di et
(anni) n persone (Frequenze) 0 - 2035 20 - 404 40 - 601 totale40
termini central i n persone (Frequenz e) a 1 = 10 P 1 = 35 a 2 =
30P 2 = 4 a 3 = 50P 3 = 1 totale40 CALCOLO valori centrali Calcolo
della media ponderata Et media = 13 anni
Slide 76
Si definisce MODA di una distribuzione di dati il termine
corrispondente alla MASSIMA FREQUENZA assoluta o relativa. MODA
ESEMPIO : Determinare la MODA della seguente distribuzione di voti:
VOTOFREQUENZA 54 68 74 82 91 Il termine che corrisponde alla
massima frequenza (8) il 6, pertanto: MODA = 6 La moda
particolarmente adatta a rappresentare distribuzioni di caratteri
qualitativi
Slide 77
Le distribuzioni di frequenza possono essere: zeromodali:
nessuna modalit ha una frequenza pi elevata degli altricio fanno
tutti frequenza uguale ad 1. Esempio A = {1, 2, 3, 4, 5, 6}
unimodali : c una sola modalit con una frequenza pi elevata degli
altri. Esempio: A = {1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 5, 5, 5, 6, 6,
7, 8} bimodali : ci sono due modalit con una frequenza pi elevata
degli altri. Esempio: A = {1, 2, 2, 3, 3, 3, 3, 5, 6, 6, 6, 6, 7,
7, 8, 8 } trimodali, ecc : ci sono tre,, modalit con una frequenza
pi elevata degli altri. Esempio: A = {1, 2, 3, 3, 3, 3, 5, 6, 6, 6,
6, 7, 7, 7, 7, 8, 8}. plurimodali: tutte le modalit della
distribuzione hanno la stessa frequenza diversa da uno.
Slide 78
Nel caso di caratteri continui e per distribuzioni fornite per
classi equi-ampie il calcolo della moda avviene mediante
lindividuazione della classe modale, cio quella caratterizzata
dalla massima frequenza. Se le classi non sono equi - ampie bene
dividere la frequenza assoluta di ogni classe per lampiezza
dellintervallo ottenendo la cosiddetta densit di frequenza. La
classe modale quella con la densit di frequenza pi alta. Per la
determinazione della classe modale opportuno ricorrere
all'istogramma, individuando l'intervallo di altezza massima,
ovvero il punto di massimo della curva. La classe con la maggiore
densit media (che corrisponde all'altezza dell'istogramma) quella
modale.istogramma CLASSE MODALE
Slide 79
MEDIANA Si definisce MEDIANA il termine che occupa il POSTO
CENTRALE di una distribuzione di dati ordinati in modo crescenti.
La mediana adatta a rappresentare distribuzioni di caratteri
quantitativi. ESEMPIO : Determinare la MEDIANA della seguente
distribuzione di voti: VOTOFREQUENZA 54 68 74 82 91 5 5 5 5 6 6 6 6
6 6 6 6 7 7 7 7 8 8 9 Il TERMINE CENTRALE il 6, infatti quello che
lascia alla sua destra e alla sua sinistra un eguale numero di
termini, pertanto si ha: MEDIANA = 6 Si ordinano i dati in maniera
crescente
Slide 80
80 Per caratteri quantitativi discreti: Si dispongono i valori
in una serie ordinata in modo crescente o decrescente e si conta il
numero totale n di dati: se n dispari, la mediana corrisponde al
valore numerico del dato che occupa la posizione (n+1)/2; se n
pari, la mediana calcolata come la media aritmetica dei valori che
occupano le posizioni (n/2) e (n/2)+1. Per caratteri quantitativi
continui: Il raggruppamento in classi delle modalit consente al pi
di determinare la classe mediana nella quale ricade lunit
statistica che bipartisce la distribuzione ordinata delle
modalit.
Slide 81
Quando i dati sono distribuiti uniformemente su entrambi i lati
del picco la distribuzione simmetrica. Quando i dati non sono
distribuiti uniformemente su entrambi i lati del picco la
distribuzione asimmetrica. In una distribuzione unimodale valgono
le seguenti relazioni: media=mediana=moda ( simmetria) moda