Di variabili, spoglio dei dati, tabelle e gra ciusers.unimi.it/vraimondi/pdf/Statistica_Lecture...
Transcript of Di variabili, spoglio dei dati, tabelle e gra ciusers.unimi.it/vraimondi/pdf/Statistica_Lecture...
Di variabili, spoglio dei dati, tabelle e graficiElementi di Economia e Statistica, Facolta di Agraria
Federico Andreis
Universita degli Studi di [email protected]
March 11, 2013
Argomenti della lezione
La natura delle variabili
Lo spoglio dei dati
Tabelle univariate
Rappresentazioni grafiche univariate
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 2 / 16
Un po’ di simbologia...
• U → popolazione di riferimento
• X,Y, ...→ variabile (o carattere, fenomeno...) di interesse
• x, y, ...→ modalita della variabile di interesse
• N → numerosita della popolazione.
Man mano aggiorneremo la lista quando sara necessario!
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 3 / 16
Un po’ di simbologia...
• U → popolazione di riferimento
• X,Y, ...→ variabile (o carattere, fenomeno...) di interesse
• x, y, ...→ modalita della variabile di interesse
• N → numerosita della popolazione.
Man mano aggiorneremo la lista quando sara necessario!
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 3 / 16
La natura delle variabili
Qualche distinzione importante...
Variabili Qualitative
Sconnesse
• sesso
• colori
• marche di televisori
• gruppo sanguigno
• ...
Connesse
• scale di gradimento
• votazioni qualitative
• ratings finanziari
• ...
Variabili Quantitative
Discrete
• auto per famiglia
• incidenti sul lavoro
• gatti per quartiere
• eruzioni vulcaniche
• ...
Continue
• temperatura
• energia prodotta
• tempo d’attesa
• ...
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 4 / 16
La natura delle variabili
Qualche distinzione importante...
Variabili Qualitative
Sconnesse
• sesso
• colori
• marche di televisori
• gruppo sanguigno
• ...
Connesse
• scale di gradimento
• votazioni qualitative
• ratings finanziari
• ...
Variabili Quantitative
Discrete
• auto per famiglia
• incidenti sul lavoro
• gatti per quartiere
• eruzioni vulcaniche
• ...
Continue
• temperatura
• energia prodotta
• tempo d’attesa
• ...
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 4 / 16
La natura delle variabili
Qualche distinzione importante...
Variabili Qualitative
Sconnesse
• sesso
• colori
• marche di televisori
• gruppo sanguigno
• ...
Connesse
• scale di gradimento
• votazioni qualitative
• ratings finanziari
• ...
Variabili Quantitative
Discrete
• auto per famiglia
• incidenti sul lavoro
• gatti per quartiere
• eruzioni vulcaniche
• ...
Continue
• temperatura
• energia prodotta
• tempo d’attesa
• ...
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 4 / 16
La natura delle variabili
Qualche distinzione importante...
Variabili Qualitative
Sconnesse
• sesso
• colori
• marche di televisori
• gruppo sanguigno
• ...
Connesse
• scale di gradimento
• votazioni qualitative
• ratings finanziari
• ...
Variabili Quantitative
Discrete
• auto per famiglia
• incidenti sul lavoro
• gatti per quartiere
• eruzioni vulcaniche
• ...
Continue
• temperatura
• energia prodotta
• tempo d’attesa
• ...
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 4 / 16
Lo spoglio dei dati
Un semplice esempio di indagine statistica...
Immaginiamo di aver condotto uno studio sul numero di paia di scarpepossedute dagli studenti di questo corso.
Avremo che:
• U → studenti del primo anno di Agraria che seguono Elementi diEconomia e Statistica
• X → numero di paia di scarpe possedute (variabile discreta, nonconsideriamo l’averne persa una!)
• x→ {0, 1, 2, ...} modalita della variabile X (potenzialmenteinfinite? chissa...)
• N → quanti siete? per semplicita assumeremo N = 50
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 5 / 16
Lo spoglio dei dati
Un semplice esempio di indagine statistica...
Immaginiamo di aver condotto uno studio sul numero di paia di scarpepossedute dagli studenti di questo corso.
Avremo che:
• U → studenti del primo anno di Agraria che seguono Elementi diEconomia e Statistica
• X → numero di paia di scarpe possedute (variabile discreta, nonconsideriamo l’averne persa una!)
• x→ {0, 1, 2, ...} modalita della variabile X (potenzialmenteinfinite? chissa...)
• N → quanti siete? per semplicita assumeremo N = 50
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 5 / 16
Lo spoglio dei dati
Abbiamo raccolto i dati.. e ora?
La nostra piccola indagine (supponiamo censuaria) ha prodotto leseguenti informazioni:
{8, 3, 4, 3, 5, 1, 3, 4, 4, 5, 6, 2, 5, 7, 3, 8, 4,5, 3, 4, 3, 6, 4, 3, 6, 2, 4, 3, 1, 1, 1, 2, 4, 8,
5, 8, 2, 4, 1, 2, 7, 1, 9, 3, 20, 6, 2, 2, 1, 2}(1)
Ad occhio non dice molto (se non, forse, che qualcuno/a ne ha troppe equalcun altro troppe poche!).
Possiamo esprimere questa massa di dati in modo piu compatto, adesempio distinguendo le differenti modalita e contando quante volteesse si presentano:
{(1; 7), (2; 8), (3; 9), (4; 9), (5; 5), (6; 4), (7; 2), (8; 4), (9; 1), (20; 1)}
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 6 / 16
Lo spoglio dei dati
Abbiamo raccolto i dati.. e ora?
La nostra piccola indagine (supponiamo censuaria) ha prodotto leseguenti informazioni:
{8, 3, 4, 3, 5, 1, 3, 4, 4, 5, 6, 2, 5, 7, 3, 8, 4,5, 3, 4, 3, 6, 4, 3, 6, 2, 4, 3, 1, 1, 1, 2, 4, 8,
5, 8, 2, 4, 1, 2, 7, 1, 9, 3, 20, 6, 2, 2, 1, 2}(1)
Ad occhio non dice molto (se non, forse, che qualcuno/a ne ha troppe equalcun altro troppe poche!).
Possiamo esprimere questa massa di dati in modo piu compatto, adesempio distinguendo le differenti modalita e contando quante volteesse si presentano:
{(1; 7), (2; 8), (3; 9), (4; 9), (5; 5), (6; 4), (7; 2), (8; 4), (9; 1), (20; 1)}
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 6 / 16
Lo spoglio dei dati
Ancora sulla notazione...
Introduciamo alcune altre convenzioni che ci torneranno utili:
• i = 1, 2, ..., k → indice relativo alla modalita i−esima, k e ilnumero di modalita distinte
• xi → modalita i-esima del fenomeno
• ni → frequenza assoluta associata alla modalita i−esima
• fi = ni/N → frequenza relativa associata alla modalita i−esima
•∑J
j=1 aj = a1 + ...+ aJ → sommatoria per j che va da 1 a J .
Nota di disambiguazione: sul testo di riferimento le nostre ni sichiamano fi, mentre le fi si chiamano pi.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 7 / 16
Tabelle univariate
Aiuto, una tabella!Abbiamo compattato l’informazione ottenuta tramite la nostra piccolaindagine ed introdotto alcuni nuovi termini, vediamo ora come riunireil tutto in uno strumento noto come tabella univariata:
Xi ni fi = ni/N
x1 = 1 7 7/50=0.14x2 = 2 8 8/50=0.16x3 = 3 9 9/50=0.18x4 = 4 9 9/50=0.18x5 = 5 5 5/50=0.10x6 = 6 4 4/50=0.08x7 = 7 2 2/50=0.04x8 = 8 4 4/50=0.08x9 = 9 1 1/50=0.02x10 = 20 1 1/50=0.02∑10
i=1 ni = 50∑10
i=1 fi = 1
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 8 / 16
Tabelle univariate
Aiuto, una tabella!Abbiamo compattato l’informazione ottenuta tramite la nostra piccolaindagine ed introdotto alcuni nuovi termini, vediamo ora come riunireil tutto in uno strumento noto come tabella univariata:
Xi ni fi = ni/N
x1 = 1 7 7/50=0.14x2 = 2 8 8/50=0.16x3 = 3 9 9/50=0.18x4 = 4 9 9/50=0.18x5 = 5 5 5/50=0.10x6 = 6 4 4/50=0.08x7 = 7 2 2/50=0.04x8 = 8 4 4/50=0.08x9 = 9 1 1/50=0.02x10 = 20 1 1/50=0.02∑10
i=1 ni = 50∑10
i=1 fi = 1
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 8 / 16
Tabelle univariate
Un semplice esempio di indagine... continued!
Immaginiamo ora di avere rilevato non solo il numero di paia di scarpe,ma anche le altezze (variabile continua!) degli studenti. Ci troveremodunque con una serie di informazioni analoga alla precedente:
{174.6, 176.9, 181.8, 176.0, 161.4, 178.4, 154.3, 170.3, 163.9, 167.0, 185.7, 169.8, 148.0,169.1, 166.7, 170.9, 176.4, 168.2, 184.0, 176.1, 182.2, 167.3, 178.2, 164.8, 168.1, 171.4,
172.1, 173.8, 166.9, 156.9, 169.4, 157.4, 178.3, 164.4, 168.9, 186.8, 175.5, 160.0, 171.6,
159.3, 164.3, 180.5, 175.7, 176.9, 171.3, 173.3, 151.8, 171.3, 169.9, 170.3}.(2)
Ancora meno chiara di prima... e anche se decidessimo di applicare lostesso metodo otterremmo una tabella gigantesca (quasi tutte lemodalita sono differenti!). Come fare?
Semplice! si raggruppano in classi di valori le modalita!
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 9 / 16
Tabelle univariate
Un semplice esempio di indagine... continued!
Immaginiamo ora di avere rilevato non solo il numero di paia di scarpe,ma anche le altezze (variabile continua!) degli studenti. Ci troveremodunque con una serie di informazioni analoga alla precedente:
{174.6, 176.9, 181.8, 176.0, 161.4, 178.4, 154.3, 170.3, 163.9, 167.0, 185.7, 169.8, 148.0,169.1, 166.7, 170.9, 176.4, 168.2, 184.0, 176.1, 182.2, 167.3, 178.2, 164.8, 168.1, 171.4,
172.1, 173.8, 166.9, 156.9, 169.4, 157.4, 178.3, 164.4, 168.9, 186.8, 175.5, 160.0, 171.6,
159.3, 164.3, 180.5, 175.7, 176.9, 171.3, 173.3, 151.8, 171.3, 169.9, 170.3}.(2)
Ancora meno chiara di prima... e anche se decidessimo di applicare lostesso metodo otterremmo una tabella gigantesca (quasi tutte lemodalita sono differenti!). Come fare?
Semplice! si raggruppano in classi di valori le modalita!
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 9 / 16
Tabelle univariate
Un semplice esempio di indagine... continued!
Immaginiamo ora di avere rilevato non solo il numero di paia di scarpe,ma anche le altezze (variabile continua!) degli studenti. Ci troveremodunque con una serie di informazioni analoga alla precedente:
{174.6, 176.9, 181.8, 176.0, 161.4, 178.4, 154.3, 170.3, 163.9, 167.0, 185.7, 169.8, 148.0,169.1, 166.7, 170.9, 176.4, 168.2, 184.0, 176.1, 182.2, 167.3, 178.2, 164.8, 168.1, 171.4,
172.1, 173.8, 166.9, 156.9, 169.4, 157.4, 178.3, 164.4, 168.9, 186.8, 175.5, 160.0, 171.6,
159.3, 164.3, 180.5, 175.7, 176.9, 171.3, 173.3, 151.8, 171.3, 169.9, 170.3}.(2)
Ancora meno chiara di prima... e anche se decidessimo di applicare lostesso metodo otterremmo una tabella gigantesca (quasi tutte lemodalita sono differenti!). Come fare?
Semplice! si raggruppano in classi di valori le modalita!
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 9 / 16
Tabelle univariate
Notazione notazione notazione...
Indicheremo con la notazione xl,i − |xL,i una classe di modalita chiusaa destra, dove
• xl,i → estremo inferiore della classe i−esima
• xL,i → estremo superiore della classe i−esima
• ai = xL,i − xl,i → ampiezza della classe i−esima
• di = ni/ai → densita della classe i−esima
• d′i = fi/ai → densita relativa della classe i−esima
e con chiusa a destra intendiamo che il valore xL,i e incluso in essa.Analogamente si definisce una classe chiusa a sinistra |−, chiusa | − |,aperta −).
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 10 / 16
Tabelle univariate
Tabella con classi di modalita
Possiamo ora scrivere in modo piu compatto la serie di informazionirilevate sugli studenti in una tabella:
Xi ni fi ai di d′i145− |156 3 0.06 11 0.272 0.005156− |164 5 0.10 8 0.625 0.013164− |171 18 0.36 7 2.571 0.051171− |179 18 0.36 8 2.250 0.045179− |190 6 0.12 11 0.545 0.011
50 1
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 11 / 16
Rappresentazioni grafiche univariate
Grafici, come e quali?
La rappresentazione grafica delle informazioni e uno strumento potenteed utile, principalmente perche:
• permette di riassumere in modo standardizzato edimmediatamente comprensibile l’informazione
• le tabelle saranno pure utili, ma tendenzialmente gli esseri umanipoco van d’accordo coi numeri...
• il colpo d’occhio e di grande utilita anche per quei marziani che coinumeri lavorano.
Nota: ad ogni tipologia di variabile si accompagnano rappresentazionigrafiche piu opportune, vediamo alcuni esempi.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 12 / 16
Rappresentazioni grafiche univariate
Variabile qualitativa connessaQuale era l’interesse degli studenti di questo corso verso la Statisticaprima di iniziare?
Vi ni fiNullo 8 0.16Basso 12 0.24
Indifferenza 17 0.34Abbastanza 10 0.20Moltissimo! 3 0.06
50 1
Istogramma a barre separate.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 13 / 16
Rappresentazioni grafiche univariate
Variabile qualitativa connessaQuale era l’interesse degli studenti di questo corso verso la Statisticaprima di iniziare?
Vi ni fiNullo 8 0.16Basso 12 0.24
Indifferenza 17 0.34Abbastanza 10 0.20Moltissimo! 3 0.06
50 1
Istogramma a barre separate.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 13 / 16
Rappresentazioni grafiche univariate
Variabile qualitativa connessaQuale era l’interesse degli studenti di questo corso verso la Statisticaprima di iniziare?
Vi ni fiNullo 8 0.16Basso 12 0.24
Indifferenza 17 0.34Abbastanza 10 0.20Moltissimo! 3 0.06
50 1
Istogramma a barre separate.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 13 / 16
Rappresentazioni grafiche univariate
Variabile qualitativa sconnessa
Di che colore hanno gli occhi gli studenti di questo corso?
Ci ni fi πi = 360 · fiMarroni 25 0.50 180.0
Verdi 8 0.16 57.6Grigi 2 0.04 14.4Blu 11 0.22 79.2
Altro 4 0.08 28.8
50 1 360
Diagramma a torta.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 14 / 16
Rappresentazioni grafiche univariate
Variabile qualitativa sconnessa
Di che colore hanno gli occhi gli studenti di questo corso?
Ci ni fi πi = 360 · fiMarroni 25 0.50 180.0
Verdi 8 0.16 57.6Grigi 2 0.04 14.4Blu 11 0.22 79.2
Altro 4 0.08 28.8
50 1 360
Diagramma a torta.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 14 / 16
Rappresentazioni grafiche univariate
Variabile qualitativa sconnessa
Di che colore hanno gli occhi gli studenti di questo corso?
Ci ni fi πi = 360 · fiMarroni 25 0.50 180.0
Verdi 8 0.16 57.6Grigi 2 0.04 14.4Blu 11 0.22 79.2
Altro 4 0.08 28.8
50 1 360
Diagramma a torta.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 14 / 16
Rappresentazioni grafiche univariate
Variabile quantitativa discreta
Quanto sbadigliano gli studenti durante l’ora di Statistica?
Si ni fi0 12 0.241 17 0.342 10 0.203 4 0.084 4 0.087 2 0.0415 1 0.02
50 1
Diagramma a bastoncini.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 15 / 16
Rappresentazioni grafiche univariate
Variabile quantitativa discreta
Quanto sbadigliano gli studenti durante l’ora di Statistica?
Si ni fi0 12 0.241 17 0.342 10 0.203 4 0.084 4 0.087 2 0.0415 1 0.02
50 1
Diagramma a bastoncini.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 15 / 16
Rappresentazioni grafiche univariate
Variabile quantitativa discreta
Quanto sbadigliano gli studenti durante l’ora di Statistica?
Si ni fi0 12 0.241 17 0.342 10 0.203 4 0.084 4 0.087 2 0.0415 1 0.02
50 1
Diagramma a bastoncini.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 15 / 16
Rappresentazioni grafiche univariate
Variabile quantitativa continua
Riprendiamo i dati di prima sulle altezze...
Xi fi ai d′i145− |156 0.06 11 0.005156− |164 0.10 8 0.013164− |171 0.36 7 0.051171− |179 0.36 8 0.045179− |190 0.12 11 0.011
1
Istogramma a barre contigue.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 16 / 16
Rappresentazioni grafiche univariate
Variabile quantitativa continua
Riprendiamo i dati di prima sulle altezze...
Xi fi ai d′i145− |156 0.06 11 0.005156− |164 0.10 8 0.013164− |171 0.36 7 0.051171− |179 0.36 8 0.045179− |190 0.12 11 0.011
1
Istogramma a barre contigue.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 16 / 16
Rappresentazioni grafiche univariate
Variabile quantitativa continua
Riprendiamo i dati di prima sulle altezze...
Xi fi ai d′i145− |156 0.06 11 0.005156− |164 0.10 8 0.013164− |171 0.36 7 0.051171− |179 0.36 8 0.045179− |190 0.12 11 0.011
1
Istogramma a barre contigue.
F. Andreis (DEMM - UniMi) Statistica Descrittiva - 1 March 2013 16 / 16