Variabili statistiche - Lezione1
Click here to load reader
-
Upload
sergio-pinna -
Category
Technology
-
view
5.428 -
download
5
description
Transcript of Variabili statistiche - Lezione1
1
Corso di Statistica
STATISTICA: ramo del sapere essenzialmente teorico che impiega strumenti logici e matematici per la raccolta, il raggruppamento e l’interpretazione dei dati
Si occupa di fenomeni ripetibili del mondo reale che si manifestano con determinazioni non costanti (presenza di variabilità)
2
Si distingue tra:
1. Ripetibilita’ attuale: tutte le manifestazioni di interesse del fenomeno si sono già realizzate (es. fenomeni demografici)
2. Ripetibilità virtuale: non tutte le manifestazioni si sono realizzate (es. unitàprodotte da un dato processo produttivo)
RIPETIBILITA’ATTUALE
CAMPIONEUNIVERSO
RILEVAZIONE TOTALE
RILEVAZIONE PARZIALE
RIPETIBILITA’VIRTUALE
INSIEME UNITA’ STATISTICHE RILEVATE
3
REALTA’
FENOMENI NON COSTANTI (attitudine a variare)
RILEVAZIONE
1. Individuazione di uno o più CARATTERI sui quali acquisire le informazioni
2. Individuazione delle UNITA’ STATISTICHE portatori del carattere in studio
3. Procedimento di misurazione del carattere che porta alla individuazione delle MODALITA’ con cui il carattere si presenta
ESEMPIO DI RILEVAZIONE(data set completo Excel)
ID CORSO LAUREA SESSO MEDIA VOTI CREDITI RENDIMENTO1 SAM M 22 6 discreto2 SAM F 24 71 buono3 SAM M 21 19 discreto4 SAM F 26 27 buono5 SAM F 27 9 ottimo6 SAM M 26 10 buono7 SAM F 25 18 buono8 SAM M 24 27 buono9 SAM F 27 10 ottimo
10 SAM F 24 17 buono11 SAM M 26 18 buono12 SAM M 30 18 ottimo13 SAM F 29 84 ottimo14 SPO M 27 27 ottimo15 SPO F 23 9 discreto16 SPO F 27 30 ottimo17 SPO M 28 33 ottimo18 SPO M 29 30 ottimo19 SPO F 28 48 ottimo20 ORU F 26 66 buono
Unità statistiche
Caratteri o variabili statistiche
Modalità
4
Variabili Statistiche
La SCALA DELLE MODALITÀ DI RILEVAZIONE
Fenomeni QUALITATIVI si identificano in via naturale tramite attributiattributi
Fenomeni QUANTITATIVIsi identificano in via naturale tramite numerinumeri
CLASSIFICAZIONE DEI FENOMENI STATISTICI
5
Fenomeni QUALITATIVI
••Scale nominaliScale nominali (o sconnesse o (o sconnesse o categorialicategoriali): le ): le modalitmodalitàà non sono suscettibili di alcun tipo di non sono suscettibili di alcun tipo di ordinamentoordinamento
••Scale ordinaliScale ordinali (o rettilinee): le modalit(o rettilinee): le modalitààpresentano in via naturale un ordine presentano in via naturale un ordine
Fenomeni QUANTITATIVI
•Discreti: caratteri numerabili, modalitàottenibile tramite un’operazione di conteggio (classe dei numeri naturali)
•Continui: caratteri misurabili, modalitàottenuta tramite un’operazione di misurazione (classe dei numeri reali)
6
•Scale di intervalli: Si può valutare la differenza tra due intensità, ma non è sensato stabilire rapporti; non sono sensibili a cambiamenti di origine
•Scale di rapporti: Sono articolate in modalità ordinate la prima delle quali è in via naturale lo zero; consentono di valutare il rapporto esistente tra due modalità
Fenomeni QUANTITATIVI
SCALA DELLE MODALITÀ QUALITATIVE QUANTITATIVE
RELAZIONI Nominale Ordinale Intervallare Rapporto Uguaglianza ji xx = Disuguaglianza ji xx ≠ Ordinamento ji xx f Differenza ji xx − Rapporto / ji xx
7
ESEMPIO (assegnazione etichette excel)
ID CORSO LAUREA SESSO MEDIA VOTI CREDITI RENDIMENTO1 SAM M 22 6 discreto2 SAM F 24 71 buono3 SAM M 21 19 discreto4 SAM F 26 27 buono5 SAM F 27 9 ottimo6 SAM M 26 10 buono7 SAM F 25 18 buono8 SAM M 24 27 buono9 SAM F 27 10 ottimo
10 SAM F 24 17 buono11 SAM M 26 18 buono12 SAM M 30 18 ottimo13 SAM F 29 84 ottimo14 SPO M 27 27 ottimo15 SPO F 23 9 discreto16 SPO F 27 30 ottimo17 SPO M 28 33 ottimo18 SPO M 29 30 ottimo19 SPO F 28 48 ottimo20 ORU F 26 66 buono
Qualitativa nominale Qualitativa ordinale
Quantitativa continua (è una media!) Quantitativa discreta (deriva
da un conteggio)
Distribuzioni di Frequenza
8
Sintesi tabellare dei caratteri statistici:
Si hanno n dati relativi ad un indagine condotta su n individui ad ogni modalità xi del carattere X si associa il numero di volte ni in cui tale modalità si manifesta
n= numero delle unità statistiche rilevateX=carattere oggetto di studiok=num totale dei diversi valori assunti dalla variabile X (modalità)xi=modalità i-esima del carattere X i=1,….,kni=frequenze assolute
FREQUENZE RELATIVE
FREQUENZE PERCENTUALI FREQUENZE
CUMULATE
1
i
i jj
N n=
=∑MODALITA’
FREQUENZE ASSOLUTE
1 1
1
k
i i i
N nN nN N n−
= = − =
Analogamente alle Ni possono essere costruite anche le Fi e le Pi
1001n
n1+ n2+ n3=nf3*100n3/n=f3n3x3
n1+ n2f2*100n2/n=f2n2x2
n1f1*100n1/n=f1n1x1
Nipifinixi
9
corso ni fi piSAM 137 0,19 19%SPO 251 0,34 34%ORU 186 0,25 25%IES 159 0,22 22%
733 1 100%
ESEMPI (funzioni excel CONTA.SE e TABELLE PIVOT)
sesso ni fi piM 350 0,48 48%F 383 0,52 52%
733 1 100%
MEDIA VOTI ni pi Ni Fi18 11 1,50% 11 2%19 11 2% 22 3%20 18 2% 40 5%21 29 4% 69 9%22 47 6% 116 16%23 75 10% 191 26%24 105 14% 296 40%25 84 11% 380 52%26 105 14% 485 66%27 85 12% 570 78%28 94 13% 664 91%29 49 7% 713 97%30 20 3% 733 100%
Importo totale 733 100%
crediti ni fI pi Ni Fi Pi0-|20 207 0,28 28% 207 0,28 28%
20-|40 183 0,25 25% 390 0,53 53%40-|60 84 0,11 11% 474 0,65 65%60-|80 83 0,11 11% 557 0,76 76%
80-|100 64 0,09 9% 621 0,85 85%100-|120 42 0,06 6% 663 0,90 90%120-|140 29 0,04 4% 692 0,94 94%140-|160 24 0,03 3% 716 0,98 98%160-|180 17 0,02 2% 733 1,00 100%
733 1,00 100%
rendim ni fi pi Ni Fi Pisufficiente 40 0,05 5% 40 0,05 5%discreto 150 0,21 21% 190 0,26 26%buono 293 0,40 40% 483 0,66 66%ottimo 248 0,34 34% 731 1,00 100%
731 1 100%
Se si ha un numero elevato di modalità xi, si possono raggruppare le modalità in classi
Si noti che le frequenze cumulate non vengono calcolare per i fenomeni qualitativi sconnessi
Rappresentazioni Grafiche
10
Stato civile
11
Numero di figli
Peso in Kg
ai=di=wi+1-wi
Ampiezza della classe
di = li= ni/ai
Densità di frequenza (frequenza ridotta o specifica)
12
Caratteri qualitativi sconnessi e rettilinei
• Rappresentazione tramite rettangoli
• Grafici a torta o a settori circolari
• Grafici a pila
Carattere quantitativi discreti
• Rappresentazione tramite segmenti o bastoncini
Caratteri quantitativi continui
• Istogramma (o canne d’organo)
• Poligoni di frequenza
Caratteri qualitativi sconnessi e rettilinei
Per i caratteri rettilinei le barre e le pile vanno messe nell’ordine naturale delle modalità
Grafico a barre orizzontali
0 50 100 150 200 250 300
SAM
SPO
ORU
IES
Grafico a torta
SAM
SPO
ORU
IES
grafico a barre verticali
330340
350360
370380
390
M F
Settori circolari
M48%
F52%
Grafico a pile
0%
20%
40%
60%
80%
100%
pi
ottimo
buono
discreto
suff iciente
13
Caratteri quantitativi non raggruppati in classi
Diagramma a bastoncini
0,0%
2,0%
4,0%
6,0%
8,0%
10,0%
12,0%
14,0%
16,0%
16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33
media voti
Caratteri quantitativi raggruppati in classi
Istogramma
0
2
4
6
8
10
12
0-|20
20-|4
040-
|60
60-|8
080-
|100
100-|1
20120
-|140
140-|1
60160
-|180
de
nsi
tà d
i fr
eq
ue
nza
poligono di frequenza
0
50
100
150
200
250
0-|0
0-|2
0
20-|40
40-|60
60-|80
80-|10
0
100-
|120
120-
|140
140-
|160
160-
|180