Di variabili, spoglio dei dati, tabelle e gra ciusers.unimi.it/vraimondi/pdf/Statistica_Lecture...

33
Di variabili, spoglio dei dati, tabelle e grafici Elementi di Economia e Statistica, Facolt` a di Agraria Federico Andreis Universit` a degli Studi di Milano [email protected] March 11, 2013

Transcript of Di variabili, spoglio dei dati, tabelle e gra ciusers.unimi.it/vraimondi/pdf/Statistica_Lecture...

Di variabili, spoglio dei dati, tabelle e graficiElementi di Economia e Statistica, Facolta di Agraria

Federico Andreis

Universita degli Studi di [email protected]

March 11, 2013

Argomenti della lezione

La natura delle variabili

Lo spoglio dei dati

Tabelle univariate

Rappresentazioni grafiche univariate

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 2 / 16

Un po’ di simbologia...

• U → popolazione di riferimento

• X,Y, ...→ variabile (o carattere, fenomeno...) di interesse

• x, y, ...→ modalita della variabile di interesse

• N → numerosita della popolazione.

Man mano aggiorneremo la lista quando sara necessario!

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 3 / 16

Un po’ di simbologia...

• U → popolazione di riferimento

• X,Y, ...→ variabile (o carattere, fenomeno...) di interesse

• x, y, ...→ modalita della variabile di interesse

• N → numerosita della popolazione.

Man mano aggiorneremo la lista quando sara necessario!

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 3 / 16

La natura delle variabili

Qualche distinzione importante...

Variabili Qualitative

Sconnesse

• sesso

• colori

• marche di televisori

• gruppo sanguigno

• ...

Connesse

• scale di gradimento

• votazioni qualitative

• ratings finanziari

• ...

Variabili Quantitative

Discrete

• auto per famiglia

• incidenti sul lavoro

• gatti per quartiere

• eruzioni vulcaniche

• ...

Continue

• temperatura

• energia prodotta

• tempo d’attesa

• ...

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 4 / 16

La natura delle variabili

Qualche distinzione importante...

Variabili Qualitative

Sconnesse

• sesso

• colori

• marche di televisori

• gruppo sanguigno

• ...

Connesse

• scale di gradimento

• votazioni qualitative

• ratings finanziari

• ...

Variabili Quantitative

Discrete

• auto per famiglia

• incidenti sul lavoro

• gatti per quartiere

• eruzioni vulcaniche

• ...

Continue

• temperatura

• energia prodotta

• tempo d’attesa

• ...

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 4 / 16

La natura delle variabili

Qualche distinzione importante...

Variabili Qualitative

Sconnesse

• sesso

• colori

• marche di televisori

• gruppo sanguigno

• ...

Connesse

• scale di gradimento

• votazioni qualitative

• ratings finanziari

• ...

Variabili Quantitative

Discrete

• auto per famiglia

• incidenti sul lavoro

• gatti per quartiere

• eruzioni vulcaniche

• ...

Continue

• temperatura

• energia prodotta

• tempo d’attesa

• ...

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 4 / 16

La natura delle variabili

Qualche distinzione importante...

Variabili Qualitative

Sconnesse

• sesso

• colori

• marche di televisori

• gruppo sanguigno

• ...

Connesse

• scale di gradimento

• votazioni qualitative

• ratings finanziari

• ...

Variabili Quantitative

Discrete

• auto per famiglia

• incidenti sul lavoro

• gatti per quartiere

• eruzioni vulcaniche

• ...

Continue

• temperatura

• energia prodotta

• tempo d’attesa

• ...

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 4 / 16

Lo spoglio dei dati

Un semplice esempio di indagine statistica...

Immaginiamo di aver condotto uno studio sul numero di paia di scarpepossedute dagli studenti di questo corso.

Avremo che:

• U → studenti del primo anno di Agraria che seguono Elementi diEconomia e Statistica

• X → numero di paia di scarpe possedute (variabile discreta, nonconsideriamo l’averne persa una!)

• x→ {0, 1, 2, ...} modalita della variabile X (potenzialmenteinfinite? chissa...)

• N → quanti siete? per semplicita assumeremo N = 50

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 5 / 16

Lo spoglio dei dati

Un semplice esempio di indagine statistica...

Immaginiamo di aver condotto uno studio sul numero di paia di scarpepossedute dagli studenti di questo corso.

Avremo che:

• U → studenti del primo anno di Agraria che seguono Elementi diEconomia e Statistica

• X → numero di paia di scarpe possedute (variabile discreta, nonconsideriamo l’averne persa una!)

• x→ {0, 1, 2, ...} modalita della variabile X (potenzialmenteinfinite? chissa...)

• N → quanti siete? per semplicita assumeremo N = 50

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 5 / 16

Lo spoglio dei dati

Abbiamo raccolto i dati.. e ora?

La nostra piccola indagine (supponiamo censuaria) ha prodotto leseguenti informazioni:

{8, 3, 4, 3, 5, 1, 3, 4, 4, 5, 6, 2, 5, 7, 3, 8, 4,5, 3, 4, 3, 6, 4, 3, 6, 2, 4, 3, 1, 1, 1, 2, 4, 8,

5, 8, 2, 4, 1, 2, 7, 1, 9, 3, 20, 6, 2, 2, 1, 2}(1)

Ad occhio non dice molto (se non, forse, che qualcuno/a ne ha troppe equalcun altro troppe poche!).

Possiamo esprimere questa massa di dati in modo piu compatto, adesempio distinguendo le differenti modalita e contando quante volteesse si presentano:

{(1; 7), (2; 8), (3; 9), (4; 9), (5; 5), (6; 4), (7; 2), (8; 4), (9; 1), (20; 1)}

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 6 / 16

Lo spoglio dei dati

Abbiamo raccolto i dati.. e ora?

La nostra piccola indagine (supponiamo censuaria) ha prodotto leseguenti informazioni:

{8, 3, 4, 3, 5, 1, 3, 4, 4, 5, 6, 2, 5, 7, 3, 8, 4,5, 3, 4, 3, 6, 4, 3, 6, 2, 4, 3, 1, 1, 1, 2, 4, 8,

5, 8, 2, 4, 1, 2, 7, 1, 9, 3, 20, 6, 2, 2, 1, 2}(1)

Ad occhio non dice molto (se non, forse, che qualcuno/a ne ha troppe equalcun altro troppe poche!).

Possiamo esprimere questa massa di dati in modo piu compatto, adesempio distinguendo le differenti modalita e contando quante volteesse si presentano:

{(1; 7), (2; 8), (3; 9), (4; 9), (5; 5), (6; 4), (7; 2), (8; 4), (9; 1), (20; 1)}

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 6 / 16

Lo spoglio dei dati

Ancora sulla notazione...

Introduciamo alcune altre convenzioni che ci torneranno utili:

• i = 1, 2, ..., k → indice relativo alla modalita i−esima, k e ilnumero di modalita distinte

• xi → modalita i-esima del fenomeno

• ni → frequenza assoluta associata alla modalita i−esima

• fi = ni/N → frequenza relativa associata alla modalita i−esima

•∑J

j=1 aj = a1 + ...+ aJ → sommatoria per j che va da 1 a J .

Nota di disambiguazione: sul testo di riferimento le nostre ni sichiamano fi, mentre le fi si chiamano pi.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 7 / 16

Tabelle univariate

Aiuto, una tabella!Abbiamo compattato l’informazione ottenuta tramite la nostra piccolaindagine ed introdotto alcuni nuovi termini, vediamo ora come riunireil tutto in uno strumento noto come tabella univariata:

Xi ni fi = ni/N

x1 = 1 7 7/50=0.14x2 = 2 8 8/50=0.16x3 = 3 9 9/50=0.18x4 = 4 9 9/50=0.18x5 = 5 5 5/50=0.10x6 = 6 4 4/50=0.08x7 = 7 2 2/50=0.04x8 = 8 4 4/50=0.08x9 = 9 1 1/50=0.02x10 = 20 1 1/50=0.02∑10

i=1 ni = 50∑10

i=1 fi = 1

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 8 / 16

Tabelle univariate

Aiuto, una tabella!Abbiamo compattato l’informazione ottenuta tramite la nostra piccolaindagine ed introdotto alcuni nuovi termini, vediamo ora come riunireil tutto in uno strumento noto come tabella univariata:

Xi ni fi = ni/N

x1 = 1 7 7/50=0.14x2 = 2 8 8/50=0.16x3 = 3 9 9/50=0.18x4 = 4 9 9/50=0.18x5 = 5 5 5/50=0.10x6 = 6 4 4/50=0.08x7 = 7 2 2/50=0.04x8 = 8 4 4/50=0.08x9 = 9 1 1/50=0.02x10 = 20 1 1/50=0.02∑10

i=1 ni = 50∑10

i=1 fi = 1

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 8 / 16

Tabelle univariate

Un semplice esempio di indagine... continued!

Immaginiamo ora di avere rilevato non solo il numero di paia di scarpe,ma anche le altezze (variabile continua!) degli studenti. Ci troveremodunque con una serie di informazioni analoga alla precedente:

{174.6, 176.9, 181.8, 176.0, 161.4, 178.4, 154.3, 170.3, 163.9, 167.0, 185.7, 169.8, 148.0,169.1, 166.7, 170.9, 176.4, 168.2, 184.0, 176.1, 182.2, 167.3, 178.2, 164.8, 168.1, 171.4,

172.1, 173.8, 166.9, 156.9, 169.4, 157.4, 178.3, 164.4, 168.9, 186.8, 175.5, 160.0, 171.6,

159.3, 164.3, 180.5, 175.7, 176.9, 171.3, 173.3, 151.8, 171.3, 169.9, 170.3}.(2)

Ancora meno chiara di prima... e anche se decidessimo di applicare lostesso metodo otterremmo una tabella gigantesca (quasi tutte lemodalita sono differenti!). Come fare?

Semplice! si raggruppano in classi di valori le modalita!

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 9 / 16

Tabelle univariate

Un semplice esempio di indagine... continued!

Immaginiamo ora di avere rilevato non solo il numero di paia di scarpe,ma anche le altezze (variabile continua!) degli studenti. Ci troveremodunque con una serie di informazioni analoga alla precedente:

{174.6, 176.9, 181.8, 176.0, 161.4, 178.4, 154.3, 170.3, 163.9, 167.0, 185.7, 169.8, 148.0,169.1, 166.7, 170.9, 176.4, 168.2, 184.0, 176.1, 182.2, 167.3, 178.2, 164.8, 168.1, 171.4,

172.1, 173.8, 166.9, 156.9, 169.4, 157.4, 178.3, 164.4, 168.9, 186.8, 175.5, 160.0, 171.6,

159.3, 164.3, 180.5, 175.7, 176.9, 171.3, 173.3, 151.8, 171.3, 169.9, 170.3}.(2)

Ancora meno chiara di prima... e anche se decidessimo di applicare lostesso metodo otterremmo una tabella gigantesca (quasi tutte lemodalita sono differenti!). Come fare?

Semplice! si raggruppano in classi di valori le modalita!

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 9 / 16

Tabelle univariate

Un semplice esempio di indagine... continued!

Immaginiamo ora di avere rilevato non solo il numero di paia di scarpe,ma anche le altezze (variabile continua!) degli studenti. Ci troveremodunque con una serie di informazioni analoga alla precedente:

{174.6, 176.9, 181.8, 176.0, 161.4, 178.4, 154.3, 170.3, 163.9, 167.0, 185.7, 169.8, 148.0,169.1, 166.7, 170.9, 176.4, 168.2, 184.0, 176.1, 182.2, 167.3, 178.2, 164.8, 168.1, 171.4,

172.1, 173.8, 166.9, 156.9, 169.4, 157.4, 178.3, 164.4, 168.9, 186.8, 175.5, 160.0, 171.6,

159.3, 164.3, 180.5, 175.7, 176.9, 171.3, 173.3, 151.8, 171.3, 169.9, 170.3}.(2)

Ancora meno chiara di prima... e anche se decidessimo di applicare lostesso metodo otterremmo una tabella gigantesca (quasi tutte lemodalita sono differenti!). Come fare?

Semplice! si raggruppano in classi di valori le modalita!

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 9 / 16

Tabelle univariate

Notazione notazione notazione...

Indicheremo con la notazione xl,i − |xL,i una classe di modalita chiusaa destra, dove

• xl,i → estremo inferiore della classe i−esima

• xL,i → estremo superiore della classe i−esima

• ai = xL,i − xl,i → ampiezza della classe i−esima

• di = ni/ai → densita della classe i−esima

• d′i = fi/ai → densita relativa della classe i−esima

e con chiusa a destra intendiamo che il valore xL,i e incluso in essa.Analogamente si definisce una classe chiusa a sinistra |−, chiusa | − |,aperta −).

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 10 / 16

Tabelle univariate

Tabella con classi di modalita

Possiamo ora scrivere in modo piu compatto la serie di informazionirilevate sugli studenti in una tabella:

Xi ni fi ai di d′i145− |156 3 0.06 11 0.272 0.005156− |164 5 0.10 8 0.625 0.013164− |171 18 0.36 7 2.571 0.051171− |179 18 0.36 8 2.250 0.045179− |190 6 0.12 11 0.545 0.011

50 1

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 11 / 16

Rappresentazioni grafiche univariate

Grafici, come e quali?

La rappresentazione grafica delle informazioni e uno strumento potenteed utile, principalmente perche:

• permette di riassumere in modo standardizzato edimmediatamente comprensibile l’informazione

• le tabelle saranno pure utili, ma tendenzialmente gli esseri umanipoco van d’accordo coi numeri...

• il colpo d’occhio e di grande utilita anche per quei marziani che coinumeri lavorano.

Nota: ad ogni tipologia di variabile si accompagnano rappresentazionigrafiche piu opportune, vediamo alcuni esempi.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 12 / 16

Rappresentazioni grafiche univariate

Variabile qualitativa connessaQuale era l’interesse degli studenti di questo corso verso la Statisticaprima di iniziare?

Vi ni fiNullo 8 0.16Basso 12 0.24

Indifferenza 17 0.34Abbastanza 10 0.20Moltissimo! 3 0.06

50 1

Istogramma a barre separate.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 13 / 16

Rappresentazioni grafiche univariate

Variabile qualitativa connessaQuale era l’interesse degli studenti di questo corso verso la Statisticaprima di iniziare?

Vi ni fiNullo 8 0.16Basso 12 0.24

Indifferenza 17 0.34Abbastanza 10 0.20Moltissimo! 3 0.06

50 1

Istogramma a barre separate.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 13 / 16

Rappresentazioni grafiche univariate

Variabile qualitativa connessaQuale era l’interesse degli studenti di questo corso verso la Statisticaprima di iniziare?

Vi ni fiNullo 8 0.16Basso 12 0.24

Indifferenza 17 0.34Abbastanza 10 0.20Moltissimo! 3 0.06

50 1

Istogramma a barre separate.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 13 / 16

Rappresentazioni grafiche univariate

Variabile qualitativa sconnessa

Di che colore hanno gli occhi gli studenti di questo corso?

Ci ni fi πi = 360 · fiMarroni 25 0.50 180.0

Verdi 8 0.16 57.6Grigi 2 0.04 14.4Blu 11 0.22 79.2

Altro 4 0.08 28.8

50 1 360

Diagramma a torta.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 14 / 16

Rappresentazioni grafiche univariate

Variabile qualitativa sconnessa

Di che colore hanno gli occhi gli studenti di questo corso?

Ci ni fi πi = 360 · fiMarroni 25 0.50 180.0

Verdi 8 0.16 57.6Grigi 2 0.04 14.4Blu 11 0.22 79.2

Altro 4 0.08 28.8

50 1 360

Diagramma a torta.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 14 / 16

Rappresentazioni grafiche univariate

Variabile qualitativa sconnessa

Di che colore hanno gli occhi gli studenti di questo corso?

Ci ni fi πi = 360 · fiMarroni 25 0.50 180.0

Verdi 8 0.16 57.6Grigi 2 0.04 14.4Blu 11 0.22 79.2

Altro 4 0.08 28.8

50 1 360

Diagramma a torta.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 14 / 16

Rappresentazioni grafiche univariate

Variabile quantitativa discreta

Quanto sbadigliano gli studenti durante l’ora di Statistica?

Si ni fi0 12 0.241 17 0.342 10 0.203 4 0.084 4 0.087 2 0.0415 1 0.02

50 1

Diagramma a bastoncini.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 15 / 16

Rappresentazioni grafiche univariate

Variabile quantitativa discreta

Quanto sbadigliano gli studenti durante l’ora di Statistica?

Si ni fi0 12 0.241 17 0.342 10 0.203 4 0.084 4 0.087 2 0.0415 1 0.02

50 1

Diagramma a bastoncini.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 15 / 16

Rappresentazioni grafiche univariate

Variabile quantitativa discreta

Quanto sbadigliano gli studenti durante l’ora di Statistica?

Si ni fi0 12 0.241 17 0.342 10 0.203 4 0.084 4 0.087 2 0.0415 1 0.02

50 1

Diagramma a bastoncini.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 15 / 16

Rappresentazioni grafiche univariate

Variabile quantitativa continua

Riprendiamo i dati di prima sulle altezze...

Xi fi ai d′i145− |156 0.06 11 0.005156− |164 0.10 8 0.013164− |171 0.36 7 0.051171− |179 0.36 8 0.045179− |190 0.12 11 0.011

1

Istogramma a barre contigue.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 16 / 16

Rappresentazioni grafiche univariate

Variabile quantitativa continua

Riprendiamo i dati di prima sulle altezze...

Xi fi ai d′i145− |156 0.06 11 0.005156− |164 0.10 8 0.013164− |171 0.36 7 0.051171− |179 0.36 8 0.045179− |190 0.12 11 0.011

1

Istogramma a barre contigue.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 16 / 16

Rappresentazioni grafiche univariate

Variabile quantitativa continua

Riprendiamo i dati di prima sulle altezze...

Xi fi ai d′i145− |156 0.06 11 0.005156− |164 0.10 8 0.013164− |171 0.36 7 0.051171− |179 0.36 8 0.045179− |190 0.12 11 0.011

1

Istogramma a barre contigue.

F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 16 / 16