Variabili statistiche - Lezione1

13

Click here to load reader

description

Corso di Statistica Lezione: 1 di 15 Argomento: Variabili statistiche

Transcript of Variabili statistiche - Lezione1

Page 1: Variabili statistiche - Lezione1

1

Corso di Statistica

STATISTICA: ramo del sapere essenzialmente teorico che impiega strumenti logici e matematici per la raccolta, il raggruppamento e l’interpretazione dei dati

Si occupa di fenomeni ripetibili del mondo reale che si manifestano con determinazioni non costanti (presenza di variabilità)

Page 2: Variabili statistiche - Lezione1

2

Si distingue tra:

1. Ripetibilita’ attuale: tutte le manifestazioni di interesse del fenomeno si sono già realizzate (es. fenomeni demografici)

2. Ripetibilità virtuale: non tutte le manifestazioni si sono realizzate (es. unitàprodotte da un dato processo produttivo)

RIPETIBILITA’ATTUALE

CAMPIONEUNIVERSO

RILEVAZIONE TOTALE

RILEVAZIONE PARZIALE

RIPETIBILITA’VIRTUALE

INSIEME UNITA’ STATISTICHE RILEVATE

Page 3: Variabili statistiche - Lezione1

3

REALTA’

FENOMENI NON COSTANTI (attitudine a variare)

RILEVAZIONE

1. Individuazione di uno o più CARATTERI sui quali acquisire le informazioni

2. Individuazione delle UNITA’ STATISTICHE portatori del carattere in studio

3. Procedimento di misurazione del carattere che porta alla individuazione delle MODALITA’ con cui il carattere si presenta

ESEMPIO DI RILEVAZIONE(data set completo Excel)

ID CORSO LAUREA SESSO MEDIA VOTI CREDITI RENDIMENTO1 SAM M 22 6 discreto2 SAM F 24 71 buono3 SAM M 21 19 discreto4 SAM F 26 27 buono5 SAM F 27 9 ottimo6 SAM M 26 10 buono7 SAM F 25 18 buono8 SAM M 24 27 buono9 SAM F 27 10 ottimo

10 SAM F 24 17 buono11 SAM M 26 18 buono12 SAM M 30 18 ottimo13 SAM F 29 84 ottimo14 SPO M 27 27 ottimo15 SPO F 23 9 discreto16 SPO F 27 30 ottimo17 SPO M 28 33 ottimo18 SPO M 29 30 ottimo19 SPO F 28 48 ottimo20 ORU F 26 66 buono

Unità statistiche

Caratteri o variabili statistiche

Modalità

Page 4: Variabili statistiche - Lezione1

4

Variabili Statistiche

La SCALA DELLE MODALITÀ DI RILEVAZIONE

Fenomeni QUALITATIVI si identificano in via naturale tramite attributiattributi

Fenomeni QUANTITATIVIsi identificano in via naturale tramite numerinumeri

CLASSIFICAZIONE DEI FENOMENI STATISTICI

Page 5: Variabili statistiche - Lezione1

5

Fenomeni QUALITATIVI

••Scale nominaliScale nominali (o sconnesse o (o sconnesse o categorialicategoriali): le ): le modalitmodalitàà non sono suscettibili di alcun tipo di non sono suscettibili di alcun tipo di ordinamentoordinamento

••Scale ordinaliScale ordinali (o rettilinee): le modalit(o rettilinee): le modalitààpresentano in via naturale un ordine presentano in via naturale un ordine

Fenomeni QUANTITATIVI

•Discreti: caratteri numerabili, modalitàottenibile tramite un’operazione di conteggio (classe dei numeri naturali)

•Continui: caratteri misurabili, modalitàottenuta tramite un’operazione di misurazione (classe dei numeri reali)

Page 6: Variabili statistiche - Lezione1

6

•Scale di intervalli: Si può valutare la differenza tra due intensità, ma non è sensato stabilire rapporti; non sono sensibili a cambiamenti di origine

•Scale di rapporti: Sono articolate in modalità ordinate la prima delle quali è in via naturale lo zero; consentono di valutare il rapporto esistente tra due modalità

Fenomeni QUANTITATIVI

SCALA DELLE MODALITÀ QUALITATIVE QUANTITATIVE

RELAZIONI Nominale Ordinale Intervallare Rapporto Uguaglianza ji xx = Disuguaglianza ji xx ≠ Ordinamento ji xx f Differenza ji xx − Rapporto / ji xx

Page 7: Variabili statistiche - Lezione1

7

ESEMPIO (assegnazione etichette excel)

ID CORSO LAUREA SESSO MEDIA VOTI CREDITI RENDIMENTO1 SAM M 22 6 discreto2 SAM F 24 71 buono3 SAM M 21 19 discreto4 SAM F 26 27 buono5 SAM F 27 9 ottimo6 SAM M 26 10 buono7 SAM F 25 18 buono8 SAM M 24 27 buono9 SAM F 27 10 ottimo

10 SAM F 24 17 buono11 SAM M 26 18 buono12 SAM M 30 18 ottimo13 SAM F 29 84 ottimo14 SPO M 27 27 ottimo15 SPO F 23 9 discreto16 SPO F 27 30 ottimo17 SPO M 28 33 ottimo18 SPO M 29 30 ottimo19 SPO F 28 48 ottimo20 ORU F 26 66 buono

Qualitativa nominale Qualitativa ordinale

Quantitativa continua (è una media!) Quantitativa discreta (deriva

da un conteggio)

Distribuzioni di Frequenza

Page 8: Variabili statistiche - Lezione1

8

Sintesi tabellare dei caratteri statistici:

Si hanno n dati relativi ad un indagine condotta su n individui ad ogni modalità xi del carattere X si associa il numero di volte ni in cui tale modalità si manifesta

n= numero delle unità statistiche rilevateX=carattere oggetto di studiok=num totale dei diversi valori assunti dalla variabile X (modalità)xi=modalità i-esima del carattere X i=1,….,kni=frequenze assolute

FREQUENZE RELATIVE

FREQUENZE PERCENTUALI FREQUENZE

CUMULATE

1

i

i jj

N n=

=∑MODALITA’

FREQUENZE ASSOLUTE

1 1

1

k

i i i

N nN nN N n−

= = − =

Analogamente alle Ni possono essere costruite anche le Fi e le Pi

1001n

n1+ n2+ n3=nf3*100n3/n=f3n3x3

n1+ n2f2*100n2/n=f2n2x2

n1f1*100n1/n=f1n1x1

Nipifinixi

Page 9: Variabili statistiche - Lezione1

9

corso ni fi piSAM 137 0,19 19%SPO 251 0,34 34%ORU 186 0,25 25%IES 159 0,22 22%

733 1 100%

ESEMPI (funzioni excel CONTA.SE e TABELLE PIVOT)

sesso ni fi piM 350 0,48 48%F 383 0,52 52%

733 1 100%

MEDIA VOTI ni pi Ni Fi18 11 1,50% 11 2%19 11 2% 22 3%20 18 2% 40 5%21 29 4% 69 9%22 47 6% 116 16%23 75 10% 191 26%24 105 14% 296 40%25 84 11% 380 52%26 105 14% 485 66%27 85 12% 570 78%28 94 13% 664 91%29 49 7% 713 97%30 20 3% 733 100%

Importo totale 733 100%

crediti ni fI pi Ni Fi Pi0-|20 207 0,28 28% 207 0,28 28%

20-|40 183 0,25 25% 390 0,53 53%40-|60 84 0,11 11% 474 0,65 65%60-|80 83 0,11 11% 557 0,76 76%

80-|100 64 0,09 9% 621 0,85 85%100-|120 42 0,06 6% 663 0,90 90%120-|140 29 0,04 4% 692 0,94 94%140-|160 24 0,03 3% 716 0,98 98%160-|180 17 0,02 2% 733 1,00 100%

733 1,00 100%

rendim ni fi pi Ni Fi Pisufficiente 40 0,05 5% 40 0,05 5%discreto 150 0,21 21% 190 0,26 26%buono 293 0,40 40% 483 0,66 66%ottimo 248 0,34 34% 731 1,00 100%

731 1 100%

Se si ha un numero elevato di modalità xi, si possono raggruppare le modalità in classi

Si noti che le frequenze cumulate non vengono calcolare per i fenomeni qualitativi sconnessi

Rappresentazioni Grafiche

Page 10: Variabili statistiche - Lezione1

10

Stato civile

Page 11: Variabili statistiche - Lezione1

11

Numero di figli

Peso in Kg

ai=di=wi+1-wi

Ampiezza della classe

di = li= ni/ai

Densità di frequenza (frequenza ridotta o specifica)

Page 12: Variabili statistiche - Lezione1

12

Caratteri qualitativi sconnessi e rettilinei

• Rappresentazione tramite rettangoli

• Grafici a torta o a settori circolari

• Grafici a pila

Carattere quantitativi discreti

• Rappresentazione tramite segmenti o bastoncini

Caratteri quantitativi continui

• Istogramma (o canne d’organo)

• Poligoni di frequenza

Caratteri qualitativi sconnessi e rettilinei

Per i caratteri rettilinei le barre e le pile vanno messe nell’ordine naturale delle modalità

Grafico a barre orizzontali

0 50 100 150 200 250 300

SAM

SPO

ORU

IES

Grafico a torta

SAM

SPO

ORU

IES

grafico a barre verticali

330340

350360

370380

390

M F

Settori circolari

M48%

F52%

Grafico a pile

0%

20%

40%

60%

80%

100%

pi

ottimo

buono

discreto

suff iciente

Page 13: Variabili statistiche - Lezione1

13

Caratteri quantitativi non raggruppati in classi

Diagramma a bastoncini

0,0%

2,0%

4,0%

6,0%

8,0%

10,0%

12,0%

14,0%

16,0%

16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33

media voti

Caratteri quantitativi raggruppati in classi

Istogramma

0

2

4

6

8

10

12

0-|20

20-|4

040-

|60

60-|8

080-

|100

100-|1

20120

-|140

140-|1

60160

-|180

de

nsi

tà d

i fr

eq

ue

nza

poligono di frequenza

0

50

100

150

200

250

0-|0

0-|2

0

20-|40

40-|60

60-|80

80-|10

0

100-

|120

120-

|140

140-

|160

160-

|180