Introduzione a STATA 10.1

139
 INTRODUZIONE A STATA VERSIONE 10.1 Giulia Cavrini Dipartimento di Scienze Statistiche “Paolo Fortunati”  Università di Bologna 

Transcript of Introduzione a STATA 10.1

Page 1: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 1/139

 

INTRODUZIONE A STATAVERSIONE 10.1

Giulia CavriniDipartimento di Scienze Statistiche “Paolo Fortunati”  

Università di Bologna 

Page 2: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 2/139

 

INDICE Introduzione Il menu Help La barra dei menu e la barra delle icone

Creare un file LOG  Definizione del file di dati Leggere file ASCII Inserire le etichette Codificare un variabile

Creare nuove variabili Operatori relazionali Statistiche descrittive: distribuzioni di frequenza semplici Statistiche descrittive: misure di sintesi e di variabilità Grafici: A barre, Istogrammi, Box-plot

Page 3: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 3/139

 

Che cos’è STATA? 

STATA è un Sistema di Analisi Statistica (Statistical Analysis System)creato per ricercatori. È nato in ambito accademico.Il sito ufficiale del programma è:

http://www.stata.com/ 

È un ambiente che consente di manipolare e analizzare i datiusando metodi statistici e grafici.È un pacchetto integrato – non una collezione di moduli separati.

Con STATA è possibile fare: • Data Management• Analisi descrittive• Grafici• Modelli lineari e non• ANOVA, ecc.

www.ats.ucla.edu/stat/stata

Page 4: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 4/139

 

Installare STATA

Per default STATA viene installato in c:\Stata10. I files “ufficiali” di tipo ado vengono inseriti in c:\Stata10\ado. I files “non ufficiali” in c:\ado.

Le principali directory create sono:

sysdir

STATA: C:\Program Files\Stata10\ UPDATES: C:\Program Files\Stata10\ado\updates\ 

BASE: C:\Program Files\Stata10\ado\base\ SITE: C:\Program Files\Stata10\ado\site\ PLUS: C:\ado\plus\ PERSONAL: C:\ado\personal\ 

Page 5: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 5/139

 

 Alcune cose da conoscere prima di iniziare a lavorare

con STATA:

STATA è case-sensitive: sex e Sex  

sono due nomi di variabili diverse. . è il prompt di STATA

exit è il comando che consente di

uscire da STATA. In alternativa si puòusare il menu File Exit.

Page 6: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 6/139

 

Nella finestra Stata Command viene inseritoun singolo comando ed eseguito con [Enter]

Dopo aver cliccato due volte sull’icona di STATAcompare la seguente immagine:

Nella finestra Reviewvengono registrati i

Comandi

Nella finestra Variablessono visualizzate le

variabili

Nella finestra Stata Resultsviene visualizzato l’output 

prodotto

Page 7: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 7/139

La finestra Results

Se non si vogliono interruzioni dell’output con more, occorre digitare:

. set more off

Se si vuole settare questo in maniera permanente, digitare:. set more off, permanently 

Per attivare more di nuovo, digitare:. set more on, [permanently]

La dimensione del buffer iniziale della finestra Results mostra solo pochepagine di output (32 kb); se lo si vuole incrementare a 200 kb, peresempio, digitare:. set scrollbufsize 200000

Occorre però riaprire STATA per rendere effettivo questo cambiamento.

 

Page 8: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 8/139

Salvare il contenuto della finestra Review 

È possibile salvare in un file di sintassi (*.do) ilcontenuto della finestra Review.

Per salvare i comandi occorre cliccare con iltasto destro del mouse sulla finestra Review:compare un menu all’interno del quale ècontenuta anche l’opzione:

Save All… 

I comandi contenuti nella finestra Reviewpossono essere richiamati con Pag e con

Pag. 

Page 9: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 9/139

La finestra editor Do-file L’editor Do.file è un editor di testo standard ed è usato per scrivere file di

testo (generalmente files .do).

Un file Do è una serie di comandi che devono essere eseguiti in sequenza.

Si apre cliccando sull’icona 

L’editor Do-file ha la caratteristica speciale che può essere eseguito tutto o

solo una parte dei comandi cliccando sull’icona Do o digitando Ctrl-D

L’icona Run è usata raramente e consente di eseguire i comandi senza

visualizzare i risultati. È possibile avere più finestre Editor Do-file attive. 

 

Page 10: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 10/139

Il menu Help - 1

STATA ha incorporato un help molto facile da usare.

Il menu Help fornisce opzioni relative ai Contenuti e

ai Comandi. L’Help online è visualizzato nella finestra Viewer.

Se si conosce il nome del comando, per visualizzarne ilcontenuto si può utilizzare sia il Viewer sia la riga di

Stata Command:

help  tabulate dalla linea di comando Viewerwhelp  tabulate dalla finestra Stata Command

 

Page 11: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 11/139

Il menu Help - 2

Se non si conosce il comando esatto, è possibile, usandoSearch oppure Findit, visualizzare tutti i possibili comandirelativi all’argomento indicato.

search  nonparametric dalla linea di comando Viewer

findit   poisson goodness dalla finestra Stata Command

Inoltre è possibile ricercare in Internet, nel sito web di Stata,informazioni utili, links, macro già scritte e pubblicazioni.

Cerchiamo, ad esempio, una funzione particolare:

Help Search…  pie

 

Page 12: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 12/139

Si apre questa prima finestra, in cui occorreindicare la parola chiave della ricerca:

Il risultato dellaricerca è questo:

 

Page 13: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 13/139

Se è già noto il comando, allora occorreusare la finestra Stata Command dell’Help: 

Il risultato dellaricerca è questo:

Le parole sottolineatesono dei link.

 

Page 14: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 14/139

La barra dei menu e la barra delle icone:

Open (use)

Log Begin. Usata perconfigurare un file log.

New Viewer.  Apre la finestra viewer di STATA.Il principale uso di questa finestra è visualizzare ifiles di help

New Do-File Editor. Apre la finestra Do-file di

STATA.

Data Editor. Apre lafinestra di Editor dei dati.

Data Browser. Apre lafinestra di Editor dei dati in

modalità browse.

Save. Salva ilfoglio di lavorocorrente

Bring Graph Windows to Front.

Print results

Break.Interrompe ilprocessore.

 

Page 15: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 15/139

Tipi di file Stata 

dta files: dati Stata.L’estensione per un dataset di Stata è .dta.

do files: files di comando.File che contengono righe di comandi che possono essereeseguiti in sequenza. Sono in formato ASCII.

ado files: programmi/macro. hlp files: Stata help.

gph files: grafici.

 

Page 16: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 16/139

Creare un file log - 1 

 All’inizio della sessione di lavoro o quando lo si ritiene più opportuno, èpossibile creare un file log in cui vengono salvati i comandi e l’output adessi corrispondenti.

Per creare un file log si può digitare il comando:.log using "C:\Documents and

Settings\elisabetta.petracci2\Desktop\prova.smcl" 

oppure si può utilizzare il menu: File Log Begin

 oppure si può utilizzare la barra delle icone:

Filename è un nome qualsiasi che può essere assegnato al file log.

Stata aggiunge il suffisso .smcl. In questo caso, però, il file può essereletto e stampato solo con Stata.

Il file log può essere anche salvato in un formato testo, con l’estensione .log. In questo caso può essere visualizzato con un qualunque editor ditesto.

 

Page 17: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 17/139

Creare un file log - 2 

Si può sospendere il salvataggio dell’output digitando:

. log off

e si può riprendere il salvataggio dell’output digitando:. log on 

Per chiudere il file log, oltre al menu, si può usare il comando:. log close

 

Page 18: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 18/139

Il file log 

Il file log può essere stampato tramite la barra dei menu o con ilsemplice comando:

 . print filename 

I passi da eseguire sono, quindi, i seguenti:1.  Lanciare Stata

2.  Definire il file log

3.  Aprire il file di dati

4.  Eseguire le procedure statistiche ritenute necessarie5.  Chiudere il file log

6.  Stampare i risultati

 

Page 19: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 19/139

Il file log comandi 

 Analogamente, si possono salvare tutti i comandi futuri di Stata

eseguiti nella sessione di lavoro corrente in un file log di sintassidigitando il comando:

. cmdlog using filename, [replace|append] 

 

Page 20: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 20/139

Definizione del file di dati - 1

I. Inserimento dei dati attraverso la finestra dei comandi. 

(1) Si possono inserire i dati tramite il comando input.

(2) I nomi delle variabili possono essere lunghe al massimo 8caratteri e devono essere separate da spazi

(3) Ad esempio:

. input id age sex reddito  

(4) A questo punto si possono introdurre i dati relativi allaprima osservazione e, successivamente, tutte le altre. Seun dato è mancante può essere sostituito con un punto.

(5) Al termine dell’inserimento dei dati, occorre digitare il

comando end . 

Page 21: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 21/139

Definizione del file di dati - Esempio

. input id age sex reddito 

id age sex reddito

1.01 22 1 40000

2.02 34 2 50000

3.03 43 1 55444

4.04 43 1 25000

5.end 

Dopo l’inserimento, i dati possono essere visualizzati con ilcomando:

. list  

Page 22: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 22/139

Definizione del file di dati - 2

II. Inserimento dei dati attraverso il foglio elettronico.. edit

III. Nomi di variabili

I nomi delle variabili possono variare da 1 a 32caratteri, ma Stata abbrevia a 8 caratteri lavisualizzazione nell’output. I nomi devono iniziare conuna lettera.

 

Page 23: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 23/139

Definizione del file di dati - 3

IV. Variabili numeriche

Molto spesso non è necessario specificare il tipo di

formato numerico, ma se si hanno problemi di memoria

è meglio sapere che i numeri possono essere definiti

secondo cinque tipologie diverse:

byte, int, long, float (default) o double.

 

Page 24: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 24/139

Definizione del file di dati - 4

IV. Variabili numericheNella tabella seguente sono riportati i valori minimo emassimo riservati al diverso tipo di definizione

numerica e il numero di byte riservati: 

Il comando compress può ridurre la dimensione deldataset in maniera consistente. 

 

Page 25: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 25/139

Leggere file ASCII

insheet : si può accedere ad un file ASCII con il comando:. insheet using filename, clear  Oppure tramite il menu File Import ASCII data

created by a spreadsheet: 

Foglio di calcoloelettronico

 

Page 26: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 26/139

Il nostro file ASCII

"TESSERA","AS_ETA","AS_SESSO","MEDICO","GRUP_MED","SUM_DDD","ALTRIF"1,61,0,101,0,173.335,02,63,0,72,1,26.667,13,75,0,82,0,213.336,04,70,0,25,0,213.336,05,72,0,83,0,106.668,16,55,0,131,0,26.667,07,40,0,56,0,53.334,18,71,0,56,0,133.335,19,80,1,56,0,26.667,110,30,1,34,1,53.334,010,30,1,120,0,53.334,011,64,1,120,0,80.001,0

12,68,1,165,0,266.669,113,45,1,182,0,240.002,014,56,0,160,0,40,015,68,1,182,0,106.668,116,61,1,40,0,133.335,017,43,0,40,0,26.667,118,92,0,40,0,26.667,0

19,69,1,20,0,80.001,0

 

Page 27: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 27/139

File Import ASCII data createdby a spreadsheet

Selezionare il file *.csvcliccando su Browse.

Scegliere il delimitatore.

Cliccare su OK.

 

Page 28: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 28/139

 Apriamo il file c10aa01_pr.csv:

Con il comando list  otteniamo questatabella:

 

Page 29: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 29/139

L’altro tipo di dati ASCII è quello in formato fisso. In questo caso occorre aprire il menu:File Import ASCII data in fixed format

TESSERA 1 4 F4.0

AS_ETA 5 7 F3.0

AS_SESSO 8 8 F1.0 MEDICO 9 11 F3.0

GRUP_MED 12 19 F8.0

SUM_DDD 20 27 F8.2

ALTRIF 28 35 F8.0 

 

Page 30: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 30/139

Esempio con dati in formato fisso. 

1 610101 0 173.34 0 2 630 72 1 26.67 1 3 750 82 0 213.34 0 4 700 25 0 213.34 0 5 720 83 0 106.67 1

6 550131 0 26.67 0 7 400 56 0 53.33 1 8 710 56 0 133.34 1 9 801 56 0 26.67 1 10 301 34 1 53.33 0 10 301120 0 53.33 0 11 641120 0 80.00 0 12 681165 0 266.67 1

13 451182 0 240.00 0 14 560160 0 40.00 0 15 681182 0 106.67 1 16 611 40 0 133.34 0 17 430 40 0 26.67 1 18 920 40 0 26.67 0 19 691 20 0 80.00 0

 

Page 31: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 31/139

Il menu File Import ASCII data in fixedformat corrisponde al comando:

. infix specifications using filename.

 

Page 32: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 32/139

ETICHETTE: per il Dataseti) Data set labels: può essere veramente utile avere unadescrizione del data set.Dal menu:

Data Labels Label dataset 

Questo corrisponde al comando.label data “…………” 

Con il comandode (describe):

 

Page 33: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 33/139

ETICHETTE: per le variabiliii) Variable labels: può essere utile avere una etichetta per levariabili, soprattutto quando il nome è abbreviato.

Dal menu:Data Labels Label variable 

Questo corrisponde al comando. label variable varname “…”

Con il comando de (describe): 

Page 34: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 34/139

ETICHETTE: per i valoriiii) Value labels: si possono assegnare etichette ai valori assuntida una variabile categorica.

Dal menu:Data Labels Label values Define ormodify value labels 

Cliccare su Define

Cliccare su OK  

Page 35: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 35/139

Una volta terminato l’inserimentodelle etichette, cliccare su Close.

Ma l’operazione non è ancora completata. Occorre cliccare su: 

Data Labels Label values Assign value labels tovariable

Si rende così disponibile l’opzione Add, tramite la quale possiamoinserire l’altra etichetta: 1 Si 

Scegliere l’etichetta e indicare lavariabile.

  

Page 36: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 36/139

 A questo punto è sufficientevisualizzare la list  della o dellevariabili a cui sono state assegnateetichette di valore:

Definire con la stessa etichetta No_Si le duevariabili grup_med e altrif .

Possiamo visualizzare ladescrizione del file con il comandode . 

. list gruppo_m altri_f

 

Page 37: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 37/139

Formati numerici

w : Dimensione totale che include separatore decimale e numero di decimali

d : Numero di decimali

 

Page 38: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 38/139

 Apriamo il file c10aa01.dta

Se la dimensione del file è elevata e abbiamodifficoltà ad aprirlo o a fare le elaborazioni, possiamoaumentare la memoria, con il comando:

. set memory (dim)m 

Prima di dare questo comando è opportuno verificarequal è la quantità di memoria attualmente in uso con:. memory

 

Page 39: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 39/139

Sintassi dei comandi

La sintassi generale dei comandi STATApuò essere scritta nel seguente modo:

[ prefix :] command  [varlist][if expression] [in range]

[weight] [, options]

 

Page 40: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 40/139

Qualifiers e Opzioni

I qualifiers sono generali per molticomandi.

Le opzioni sono specifiche per uncomando. La virgola precede la lista

delle opzioni disponibili. Dimenticare lavirgola rappresenta una causafrequente di messaggi di errore.

 

Page 41: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 41/139

 A questo punto osserviamo il nostro dataset con ilcomando describe oppure con il menu:

Data Describe data Describe variable in memory

Inserire le variabilidi cui si vuole

visualizzare ladescrizione

 

Page 42: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 42/139

Data Describe data Describe variable in memory

Il comando Describe data - 1

 

Page 43: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 43/139

Data Describe data Describe variables in file

Il comando Describe data - 2

Inserire/Cercare ilnome del file di cui sivuole visualizzare ladescrizione

Si può visualizzare ladescrizione solo dialcune variabili, cheandranno inserite inquesto riquadro:

 

Page 44: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 44/139

Gli operatori relazionali sono 6:

== è uguale a!= non è uguale (~= è analogo)> maggiore

< minore>= maggiore o uguale<= minore o uguale

Operatori relazionali - 1

 

Page 45: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 45/139

Un doppio segno uguale, “==”, denota il test logico “Il valorealla sinistra è uguale al valore a destra?” .

Il singolo segno “=”, al contrario, significa qualcosa di diverso: “Poni il valore che è a sinistra uguale al valore che è adestra” .

Il singolo segno di = non è un operatore relazionale e

quindi non può essere usato con if.

Gli operatori relazionali possono essere usati per selezionareosservazioni basate su valori assunti dalle variabili numeriche.Solo due operatori, == e != sono usati con variabili stringa.

Operatori relazionali - 2

 

Page 46: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 46/139

 Due o più operatori relazionali possono essere combinatientro una singola espressione if utilizzando un operatore

logico.

Gli operatori logici di STATA sono i seguenti:

& and| or! not (~ è equivalente)

Operatori logici

 

Page 47: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 47/139

 Gli operatori matematici di STATA sono i seguenti:

+ addizione- sottrazione* moltiplicazione / divisione^ potenza

Il segno + viene usato anche per concatenare le stringhe.

Operatori matematici

 

Page 48: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 48/139

Per elencare i dati occorre digitare il comando:. list

che può essere abbreviato con . l

Per elencare una o più variabili:. list varname(s) (es.: list medico)

Per elencare le variabili da varnamei a varname j:. list varnamei-varnamej

Per elencare tutte le variabili che iniziano con as:. list as*  

Il comando List data - 1

 

Page 49: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 49/139

in restringe l’elenco a un intervallo di osservazioni. 

I numeri positivi consentono di far partire l’elenco  dall’inizio del

dataset. I numeri negativi dalla fine del dataset.

Per elencare la terza osservazione:. list in 3

Per elencare la quinta osservazione partendo dalla fine:. list in –5

Per elencare l’ultima osservazione: . list in –1 oppure . list in l (è la lettera l) 

Il comando List data - 2

 

Page 50: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 50/139

Per elencare la lista dalla quint’ultima osservazione alla fine: . list medico in -5/l

Per elencare le osservazioni da 1 a 3:. list in 1/3

Per elencare le osservazioni da 5 a 17:. list in 5/17

Per elencare le osservazioni da 3 alla terz’ultima: . list in 3/-3

Per elencare le osservazioni ponendo condizioni:. list if exp  (es.: list if as_sesso==1)

Il comando List data - 3

 

Page 51: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 51/139

if  exp  restringe l’elenco alle osservazioni che soddisfanola condizione posta.

if può essere combinato con in (o in con if: l’ordine non èimportante

Per elencare le osservazioni ponendo condizioni:. list if exp 

. list if as_sesso==1

. list if as_sesso==1 in 1/20

Il comando List data - 4

 

Page 52: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 52/139

Il comando list può essere ottenuto anche con il menu:

Data Describe data List data

 

Page 53: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 53/139

Label List Per visualizzare le definizioni di etichette di valori:

. label list

 

Page 54: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 54/139

Esempi di Comandi

. list

. l

. list _all

. list as_eta as_sesso

. list as_eta as_sessoin 1/20

. list as_eta as_sesso in 1/20

. list as_eta as_sesso if as_sesso==1

. list as_eta as_sesso if as_sesso==1 in 1/30

. bysort altrif: list as_eta

. sort altrif

. list as_eta

 

Page 55: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 55/139

Con i comandi generate e replace si possono creare nuovevariabili e assegnare a queste variabili valori per ogni record.

Il comando base è:generate type newvar = mathematical expression

Con questi comandi è possibile creare variabili uguali a unacostante o combinare variabili tra loro, utilizzando espressioni

matematiche, funzioni matematiche, funzioni di matrici, e cosìvia.

Oppure si può usare il menu.

Creare una nuova variabile - 1

 

Page 56: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 56/139

Per creare una nuova variabile come espressione algebricadi altre variabili si usa il comando:

. generate newvar = exp  

newvar  è il nome di una nuova variabile: non può essere ilnome di una variabile che esiste già. 

exp è una qualunque espressione valida. Una espressione è

una combinazione di variabili esistenti, operatori e funzioni. 

Questo comando può essere abbreviato con g, ge, gen:

. g newvar = exp  

Creare una nuova variabile - 2

 

Page 57: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 57/139

Per cambiare il contenuto di una variabile esistente si usa ilcomando:

. replace oldvar = exp 

Pertanto, si usa il comando generate per creare una variabilenuova e il comando replace per cambiare il contenuto dellevariabili esistenti.Stata richiede questo procedimento più complesso al fine dinon modificare accidentalmente i dati.

Questo comando non può essere abbreviato.Generalmente Stata richiede il comando non abbreviatoquando esiste la possibilità di alterare i dati esistenti.

Creare una nuova variabile - 3

 

Page 58: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 58/139

Stata ha la possibilità di creare due variabili particolari,chiamate _n e _N.

 _n è la notazione che consente di assegnare ad ogni record ilnumero corrente dell’osservazione.

 _N è la notazione per assegnare ad ogni record il numerototale di osservazioni.

. generate id=_n

. generate nt=_N

 _n e  _N - 1

 

Page 59: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 59/139

 _n e  _N - 2

 

Page 60: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 60/139

Ricodificare una variabile - 1

Accorpare categorie Creare categorie partendo da una variabile continua

Correggere codici errati o cambiare i codiciQuando si ricodifica è buona norma creare sempre una variabilenuova così da mantenere la variabile originale e correggereeventuali errori di ricodifica.

Si può utilizzare il menu

Data Create or change variable Create new variable: 

 

Page 61: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 61/139

4. Cliccare su if/in

1. Inserire il nomedella nuova variabile

3. Indicare il tipo di variabileche si vuole creare

2. Digitare il 1° valore daricodificare

Ricodificare una variabile - 2

 

Page 62: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 62/139

Cliccare su Create perselezionare i casi da ricodificare

Ricodificare una variabile - 3

Costruire la selezione, cliccandosuccessivamente su OK.

 

Page 63: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 63/139

Ricodificare una variabile - 4

La finestra Stata Results mostra che la variabile è stata creata:

Però noi abbiamo ricodificato una sola classe. Dobbiamo oracreare anche le altre classi di età. Dal momento che la variabilecls_eta esiste già, non possiamo più utilizzare il menu precedente.Dobbiamo allora procedere in questo modo:

Data Create or change variable Change contents of variable:

 

Page 64: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 64/139

Digitare cls_eta come variabile da modificare

Ricodificare una variabile - 5

Scegliere nuovamente if/in perSelezionare i casi da ricodificare.

Digitare 2 come nuovo codice

 

Page 65: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 65/139

Ricodificare una variabile - 6

La finestra Stata Results mostra che la variabile è statamodificata:

Si procede in questo modo finché non si sono fatte tutte lericodifiche.

Il passo successivo sarà quello di verificare che non si sianogenerati errori di ricodifica e, infine, occorrerà mettere le etichetteai valori assunti dalla nuova variabile cls_eta.

 

Page 66: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 66/139

Il comando Recode - 1

Per creare classi si può utilizzare anche un procedimento diverso.Partiamo sempre dal menu:

Data Create or change variable Create new variable 

Copiamo la variabile as_eta inuna nuova variabile agegroup .

 

Page 67: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 67/139

Il comando Recode - 2

 A questo punto apriamo il menu:

Data Create or change variable Other variabletransformation commands Recode categorical variable

Nuova variabile

Ricodifiche

Regole

 

Il comando Recode - 3

Page 68: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 68/139

Il comando 3

Regole per laricodifica dellevariabili

 

Page 69: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 69/139

Nella finestra Stata Results avremo:

Il comando Recode - 4

 

Page 70: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 70/139

Cancellare variabili e osservazioni - 1

Per cancellare variabili o osservazioni si possono utilizzare trecomandi:. drop

. clear

. keep

Qual è la differenza tra i tre comandi? 

Il comando drop _all cancella il dataset dalla memoria.

Il comando clear cancella sia il dataset sia tutte le definizioni divalue label, matrici, equazioni, programmi, risultati di stime, grafici,ecc. In effetti, clear corrisponde a fare il reset di Stata.

Il comando keep tiene in memoria solo le informazioni indicate dalcomando stesso.

 

Page 71: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 71/139

Cancellare variabili e osservazioni - 2

La sintassi è analoga a quanto visto con il comando list.Per cancellare una o più variabili:

. drop varname(s)

. drop varnamei-varnamej

. drop as*  

. drop in 1

. drop in 1/3  

Il comando keep lavora con la sintassi analoga a drop,ma tiene in memoria le variabili elencate o leosservazioni che rispettano le condizioni poste.

 

Page 72: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 72/139

Il comando count 

Il comando count usa le espressioni logiche ed è particolarmente utilein fase di esplorazione dei dati. Per esempio:

. count if as_eta<=65 & as_sesso==11265

conta il numero di osservazioni che soddisfano entrambe leespressioni logiche as_eta<=65 e as_sesso==1.

 

d f b l l

Page 73: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 73/139

Ricodificare una variabile con ilcomando egen e la funzione cut - 1

Un altro modo molto veloce per creare classi è quello di utilizzare il comandoegen e la funzione cut in esso contenuta. Ad esempio, volendo creare delle classi di età:

. egen agegrp1=cut(as_eta), at(15, 45, 65, 85, 103)

. tab agegrp1

agegrp1 | Freq. Percent Cum.------------+-----------------------------------

15 | 352 7.17 7.1745 | 1,825 37.20 44.3765 | 2,596 52.91 97.2985 | 133 2.71 100.00

------------+-----------------------------------Total | 4,906 100.00 

extensions to generate

 

Ri difi i bil il

Page 74: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 74/139

Ricodificare una variabile con ilcomando egen e la funzione cut - 2

. egen agegrp2 =cut(as_eta), at(15, 45, 65, 85, 103),label. tab agegrp2 

agegrp2 | Freq. Percent Cum.------------+-----------------------------------

15- | 352 7.17 7.1745- | 1,825 37.20 44.3765- | 2,596 52.91 97.29

85- | 133 2.71 100.00------------+-----------------------------------Total | 4,906 100.00

 

Ri difi i bil il

Page 75: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 75/139

Ricodificare una variabile con ilcomando egen e la funzione cut - 3

. egen agegrp3 =cut(as_eta), at(15, 45, 65, 85, 103)icodes. tab agegrp3 

agegrp3 | Freq. Percent Cum.------------+-----------------------------------

0 | 352 7.17 7.171 | 1,825 37.20 44.372 | 2,596 52.91 97.29

3 | 133 2.71 100.00------------+-----------------------------------Total | 4,906 100.00

 

Ri difi i bil il

Page 76: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 76/139

Ricodificare una variabile con ilcomando egen e la funzione cut - 4

. egen agegrp4=cut(as_eta), at(15, 45, 65, 85)

. tab agegrp4

agegrp4 | Freq. Percent Cum.

------------+-----------------------------------15 | 352 7.37 7.3745 | 1,825 38.24 45.6165 | 2,596 54.39 100.00

------------+-----------------------------------

Total | 4,773 100.00

 

Ri difi i bil il

Page 77: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 77/139

Ricodificare una variabile con ilcomando egen e la funzione cut - 5

icodes richiede che i codici 0, 1, 2, etc. siano usatial posto dell’estremo inferiore di ogniintervallo.

È importante ricordarsi che le osservazioni che nonsono incluse nell’intervallo specificato con l’opzione at() risulteranno essere valori mancanti nella nuovavariabile categorica creata.

label richiede che i valori interi della variabile diraggruppamento siano etichettati conl’estremo inferiore degli intervalli.

 

Utili d ll i bili t il

Page 78: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 78/139

Utilizzo delle variabili create con ilcomando egen e la funzione cut - 6

Esempi:

. bysort agegrp1: sum as_eta

. bysort agegrp2: sum as_eta

. bysort agegrp3: sum as_eta

. bysort agegrp4: sum as_eta

 

Ri difi i bil il

Page 79: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 79/139

Ricodificare una variabile con ilcomando egen e la funzione cut - 5

 

Il comando encode 1

Page 80: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 80/139

Il comando encode - 1encode encode string variables

into numeric variables

 

Il comando encode 2

Page 81: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 81/139

Il comando encode - 2

. encode age_str, generate(age_num)

. label list age_num

age_num:

1 a

2 b

3 c

4 d  

Il comando decode 1

Page 82: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 82/139

Il comando decode - 1

 

Il comando decode 2

Page 83: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 83/139

Il comando decode - 2

. decode age_num, generate(str_age)

decode encode numeric variablesinto string variables 

 

Page 84: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 84/139

STATISTICHE DESCRITTIVE

 

Page 85: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 85/139

Statistiche descrittive

La maggior parte dei comandi di STATA ha una sintassicomune:

[prefix varname:] command [varlist] [if exp ] [in range][, options] 

La parte indicata entro parentesi quadrata è opzionale.

 

Page 86: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 86/139

Statistiche descrittive: summarize 

Nel caso del comando summarize, la sintassi è:

[by varname:] summarize [varlist] [if exp ][in range][,[ detail | meanonly] format

separator(#)]

detail: produce statistiche aggiuntive

 meanonly: che è mostrata solo quando detail non èspecificato, sopprime la visualizzazione dei risultati

e il calcolo della varianzaformat: richiede che le statistiche riassuntive sianovisualizzate in un certo formato, piuttosto che quellodato di default 

separator(#): specifica quando inserire le linee diseparazione nell’output. Il default è 5. 

 

Statistiche descrittive: summarize

Page 87: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 87/139

Statistiche descrittive: summarize Statistics Summarizes, tables, and tests Summary and descriptive statistics Summarystatistics

 

Compare la seguente finestra:

Page 88: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 88/139

p g

che consente di ottenere il seguente output:

 

Se poi si vuole verificare se l’età media è più alta neimaschi o nelle femmine allora occorre cliccare su

Page 89: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 89/139

maschi o nelle femmine, allora occorre cliccare suby/if/in:

Se si vuole fare lo splitdell’output: 

 

Page 90: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 90/139

Statistiche descrittive: codebook - 1

Questo comando è utile per verificare se una variabile contiene dei valorimancanti. La sintassi è:

codebook [varlist] [, all header notes mvtabulate(#) problems detail]

Il comando codebook analizza i nomi delle variabili, le etichette e idati e produce in output una descrizione del dataset.

all è equivalente a specificare le opzioni header e notes: fornisce unreport completo, con l’eccezione delle informazioni fornite da mv.

mv fornisce informazioni sui valori mancanti.

 

Page 91: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 91/139

Statistiche descrittive: codebook - 2

Header: stampa il nome del dataset e la data dell’ultimo salvataggio. 

Notes: stampa le eventuali note aggiunte alle variabili.

Problems: riporta i potenziali problemi presenti nel dataset. Si puòtrattare di

- variabili etichettate con etichette di valori non definite- variabili con etichette di valori incomplete

- variabili che assumono valori costanti- variabili che assumono solo valori missing- variabili definite stringa che contengono dei “blank”  

 

Page 92: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 92/139

Statistiche descrittive: codebook - 3

tabulate(#) specifica il numero di valori unici della variabile da usare perdeterminare se la variabile è categorica o continua. I valori mancanti nonsono inclusi nel conteggio. Il default è 9. Quando ci sono più di 9 valoriunici, la variabile è classificata come continua; quando ci sono meno di 9

valori unici, la variabile è classificata come categorica.. codebook med_sex , t(2)

. codebook, mv 

Per le variabili che codebook ritiene continue, viene calcolata la media, ladeviazione standard e i percentili 10°, 20°, 50°, 75° e 90°. Per le variabiliritenute categoriche, viene mostrata la distribuzione di frequenza.Quindi se il numero di modalità è 9 o minore di 9, codebook mostra unadistribuzione di frequenza; altrimenti, vengono calcolate le statistichedescrittive.

 

Page 93: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 93/139

Il comando display - 1

Il comando display può essere usato come una calcolatrice. In realtàha caratteristiche molto più complesse.

. display sqrt(100)/2

Il risultato può anche essere visualizzato a colori:

. display as text “La radice quadrata di 25 è” sqrt(25) 

Le parole chiave as text e as result determinano i colori delrisultato: se lo sfondo è nero, as text mostra il testo in verde e asresult mostra il risultato dell’operazione in giallo.

 

Page 94: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 94/139

Dopo alcuni comandi di STATA alcuni dei risultati sonomemorizzati così che questi possono essere richiamati.Per esempio, dopo il comando summarize, STATA mantiene

temporaneamente in memoria la media come una macrochiamata r(mean). Ma non solo. Possiamo visualizzare lamemoria con il comando return list.

. sum  as_eta

. return list

. display r(mean) 

. sum  as_eta, meanonly

. display r(mean) 

Il comando display - 2

 

Page 95: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 95/139

Si può usare questo risultato per creare una nuova variabileageDEV , definita come deviazione dalla media:

. sum as_eta

. gen etaSTD =(as_eta-r( mean))/r(sd )

. summ as_eta etaSTD 

. egen std_age = std(as_eta), mean(0) std(1)

. summ etaSTD std_age 

Il comando display - 3

 

Page 96: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 96/139

 Anche dopo il comando tabulate possiamo visualizzarecon return list ciò che è mantenuto in memoria eche può essere richiamato.

. tabulate as_sesso altrif 

. return list

Il comando display - 4

 

Page 97: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 97/139

DISTRIBUZIONI DIFREQUENZA:

TABELLE SEMPLICI E DOPPIE

 

Page 98: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 98/139

Il comando tabulate - 1 

Il comando tabulate produce tabelle di frequenza semplici sesi usa la sintassi seguente:

tabulate varname [weight] [if exp ][in range] [, options] 

Il comando tab1 produce tutte le tabelle semplici dellevariabili indicate.

tab1 varlist [weight] [if exp ][in range] [, options]

 

Page 99: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 99/139

Il comando tabulate - 2 

Si inserisce la variabilecategorica e si scelgonole opzioni ritenute piùopportune:

Statistics Summarizes, tables, & tests Tables One-way tables

 

Page 100: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 100/139

Il comando tabulate - 3 

Il comando tabulate seguito da due variabili crea una tabelladoppia:

tabulate varname1

 varname2 

[weight] [if exp ][in range] [, options] 

La prima variabile indicata costituisce la variabile di riga, e laseconda la variabile di colonna.Inoltre, tab2 produce tutte le tabelle doppie tra le variabiliinserite:

tab2 varlist [weight] [if exp ] [in range][, options]

 

Page 101: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 101/139

Il comando tabulate - 4 

tabulate ha numerose opzioni. Alcune di queste sono le seguenti:

all equivale a inserire contemporaneamente le opzioni chi2 lrchi2  gamma  taub  V. Non tutte queste opzioni sono ugualmente

appropriate per una data tabella. gamma e taub assumono cheentrambe le variabili abbiano categorie ordinate, mentre chi2,lrchi2 e V no.

cell mostra le percentuali totali per ogni cella.row mostra le percentuali di riga.

column mostra le percentuali di colonna.chi2 visualizza il risultato del test   2  di Pearson.expected visualizza le frequenze attese sotto l’assunzione di indipendenza,

in ogni cella della tabella doppia.

 

Page 102: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 102/139

Il comando tabulate - 5

Statistics Summarizes, tables, & tests Tables Two-way table with measures of association

Dobbiamo inserire la variabileriga e la variabile colonnaindicando i test statistici chesi vogliono calcolare e icontenuti delle celle.

 

Page 103: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 103/139

Il comando tabulate - 6 

 

Page 104: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 104/139

Il comando tabulate - 7 

 

Page 105: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 105/139

Il comando tabulate - 8 

Occasionalmente potremmo avere la necessità di analizzare una tabellapubblicata, senza possibilità di accedere ai dati individuali originali. Un comandospeciale, tabi (“immediate” tabulation), ci può aiutare in questo.

tabi # 11 # 12  […]\# 21 # 22  […] [, replacetabulate_options] 

Le frequenze di ogni riga sono separate da “\ ” .Come esempio, riproduciamo la tabella precedente:

. tabi 41 72 \ 341 321, column chi2

Il comando tabi non richiede dati in memoria. Ma aggiungendo l’opzione replace, comunque, è possibile sostituire i dati inseriti nel comando tabinell’ editor dei dati, sostituendo eventualmente quelli presenti. Le opzioni

statistiche sono le stesse del comando tabulate. 

Page 106: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 106/139

Il comando tabulate - 9 

Per ottenere tabelle di contingenza multiple, un primo approccio puòessere quello di usare il comando tabulate preceduto dal prefisso by.

. by fum , sort: tabulate farmansd  sesso , col chi2 

 

Page 107: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 107/139

Il comando table - 1 

Un modo migliore di produrre tabelle a più vie, se non si ha la necessità divisualizzare le percentuali e di fare test statistici, è attraverso il comando table.Tale comando può essere usato anche per produrre tabelle semplici.

. table rowvar [colvar [supercolvar ]] [if exp ][in range] [weight] [,contents(clist) options]

dove gli elementi di clist possono essere:freq frequenza max varname  massimomean varname  media di una variabile min varname  minimosd varname  deviazione standard p1 varname  1° percentilemedian varname  mediana …… sum varname  somma p99 varname 99° percentilecount varname n° oss. non missing iqr varname range interquartile

 

Page 108: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 108/139

Il comando table - 2 

Esempi:

. table as_sesso 

. table as_sesso altrif 

. table altrif , c(mean as_eta) 

. table cardiol, c(mean med_eta) 

 

Page 109: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 109/139

Con questo comando si

possono ottenere diverse tipidi tabelle.

Il comando table - 3 

Statistics Summarizes, tables, & tests Tables Table of summary statistics (table)

Possiamo inserire solo lavariabile di riga indicandoFrequency nel riquadroStatistics

 

Page 110: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 110/139

Oppure possiamo inserire solo la variabile di riga indicando,oltre a Frequency nel riquadro Statistics, anche Mean (dialtre variabili)

Il comando table - 4 

 

O ancora possiamo inserire sia la variabile di riga che la

Page 111: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 111/139

p gvariabile di colonna indicando solo Frequency nel riquadroStatistics. 

E, infine, possiamo inserire sia la variabile di riga che la variabiledi colonna indicando, oltre a Frequency, altre statistichecalcolate su altre variabili:

Purtroppo questo comandovisualizza la tabella doppiatra due variabili con le solefrequenze assolute. Se siamointeressati alle percentuali ea misure di associazionedobbiamo utilizzare uncomando diverso. 

 

Page 112: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 112/139

Il comando table - 5 

Carico il data-set “Euroqol” . table farmansd sesso, by (fum) row col

 

Page 113: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 113/139

Il comando table - 6 

. table farmansd sesso, contents(mean value)

. table farmansd sesso, contents(mean scala)

 

Page 114: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 114/139

Il comando tabstat - 1

Il comando tabstat visualizza, in una sola tabella, statisticheriassuntive per una lista di variabili numeriche. È possibile anchecondizionare per un’altra variabile, tramite l’opzione by().

Senza l’opzione by(), tabstat è un’utile alternativa al comando

summarize.

tabstat mostra una maggiore flessibilità sia in termini di statistichepresentate sia in termini di formato della tabella.

La sintassi è la seguente:

tabstat varlist [weight] [if exp ] [in range][, statistics(statname[…]) by(varname)columns(variables|statistics) nototal…] 

 

Distribuzioni di frequenza:

Page 115: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 115/139

Il comando tabstat - 2

L’opzione  statistics(statname[…]) specifica le statistiche chedevono essere visualizzate; il default è equivalente a specificarestatistics(mean). Si possono specificare più statistiche separandolecon uno spazio: es. statistics(mean sd).

Le statistiche disponibili sono:mean semean (standard errore della media)count rangen iqrsum q (equivale a specificare p25 p50 p75)

max p25 (25° percentile)min p50 (50° percentile)sd p75 (75° percentile)variance cv (coefficiente di variazione: var/mean2)

 

Distribuzioni di frequenza:Il comando tabstat 4

Page 116: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 116/139

Il comando tabstat – 4Esempi

. tabstat as_eta

. tabstat as_eta, s(me sd)

. tabstat as_eta sum_ddd , s(me sd) c(v)

. tabstat as_eta sum_ddd , s(me sd) c(s)

. tabstat as_eta sum_ddd , s(me sd) c(s)

 by(altrif)

. tabstat as_eta sum_ddd, s(me sd) c(v)

 by(altrif) long. bysort altrif: tabstat as_eta sum_ddd,

statistics( mean sd ) by(altrif)

columns(variables) longstub

 

Distribuzioni di frequenza:l d b

Page 117: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 117/139

Statistics Summarizes, tables, & tests Tables Table of summary statistics (tabstat)

Inseriamo la variabile sum_ddd come variabile di interesse e cardiol  in Repeat command for groups defined by: 

Il comando tabstat - 5

 

Page 118: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 118/139

GRAFICI con STATA

 

Page 119: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 119/139

INDICE

Grafici con STATA: Istogramma Grafico a barre Box plots

 

Page 120: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 120/139

Grafici: Istogramma - 1

Carichiamo il file euroqol.dta.

L’istogramma può essere creato con il comando:

. histogram varlist

Utili opzioni dell’istogramma sono:

bin(#) disegna un istogramma con # bins (barre). Possiamo specificarebin(#) oppure start(#) e width(#), ma non entrambi.

gap(#) mostra uno spazio pari a # tra le barre riducendo la dimensione delle

barre.discrete specifica se i dati sono discreti, richiedendo così una barra per ognivalore di x .

norm sovrappone una curva normale all’istogramma, basandosi sulla mediacampionaria e sulla deviazione standard.

addlabels aggiunge le etichette alle barre dell’istogramma.

 

Page 121: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 121/139

Grafici: Istogramma - 2

Per creare un istogramma, dobbiamo cliccare su

Graphics Histogram

 

Page 122: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 122/139

Grafici: Istogramma - 3

Esempi:

. histogram eta, frequency title(“Figura 1”) 

. histogram eta, start(18) frequency bfcolor(yellow) blcolor(blue)

(bin=28, start=18, width=2.6785714)

. histogram eta, start(18) bfcolor(yellow) blcolor(blue)

title(Figura 1, size(tiny) color(red) position(2)justification(center))

(bin=28, start=18, width=2.6785714)

 

Page 123: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 123/139

   0

   2   0

   4   0

   6   0

   8   0

18 23 28 33 38 43 48 53 58 63 68 73 78 83 88 93eta'

Grafici: Istogramma - 4

. histogram eta, start(18) width(5) frequency bfcolor(yellow) blcolor(blue) xlabel(18 (5) 93)

(bin=15, start=18, width=5)

 

Page 124: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 124/139

   0

   1   0

   2   0

   3   0

   4   0

   5   0

18 23 2833384348535863687378838893 18 2328 33 38 4348 53 586368 73 788388 93

maschio femmina

eta'Graphs by sesso

Grafici: Istogramma - 5

. histogram eta, by (sesso) frequency start(18) width(5) bfcolor(yellow) blcolor(blue)xlabel(18(5)93) 

frequency riscala le

altezze delle barre in modoche l’altezza di ogni barrasia uguale al numero delleosservazioni presenti nellacategoria, e pertanto la

somma delle altezze èuguale al numero totale diosservazioni non mancantidella variabile.

 

Page 125: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 125/139

Grafici: Istogramma - 6

. histogram eta, by (sesso) density start(18) width(5) bfcolor(yellow) blcolor(blue)xlabel(18(5)93) 

density riscala le altezze

delle barre in modo che lasomma delle loro aree siauguale a 1.

   0

 .   0   1

 .   0   2

 .   0   3

18 23 2833384348535863687378838893 18 232833384348535863687378838893

maschio femmina

eta'Graphs by s esso

 

G fi i G fi b 1

Page 126: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 126/139

Il grafico a barre consente di confrontare statistiche sintetiche come la media,la mediana, la somma o le numerosità. Per ottenere le barre verticali, si puòusare il comando:

. graph bar (stat) varlist, over(varlist)

Per ottenere le barre orizzontali, si può usare il comando:

. graph hbar (stat) varlist, over(varlist)

Il grafico a barre può visualizzare una qualunque delle statistiche (stat):

mean media: è la statistica di default min minimosd deviazione standard median medianasum somma p1  1° percentile ………. count numero di osservazioni non missing p99  99° percentile max massimo iqr  range interquartile

Grafici: Grafico a barre - 1

 

G fi i G fi b 2

Page 127: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 127/139

. graph bar (mean) value, over(titstud, label(labsize(vsmall))) bar(1, bfcolor(yellow) blcolor(blue)) blabel(bar)

blabel è l’opzione che

consente di inserire lamedia (ovvero la statisticadi sintesi richiesta) sopraogni barra.

Grafici: Grafico a barre - 2

.548464

.753586

.817756

.882435 .890413

   0

 .   2

 .   4

 .   6

 .   8

   1

 

nessuno l i cenza elementare scuola media inferiore scuola media superiore laurea

 

G fi i G fi b 3

Page 128: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 128/139

. graph bar (mean) value, over(titstud, label(labsize(vsmall))) bar(1, bfcolor(yellow) blcolor(blue)) blabel(bar) by(sesso)

Grafici: Grafico a barre - 3

.694571

.80325

.851056

.917333 .928909

.499762

.7104

.769176

.850947 .855125

   0

 .   2

 .   4

 .   6

 .   8

   1

nessuno licenza elementarescuola media inferiorescuola media superiorelaurea nessuno licenza elementarescuola media inferiorescuola m edia superiorelaurea

maschio femmina

 

Graphs by sesso

 

G fi i G fi b 4

Page 129: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 129/139

. graph bar (mean) value scalavas, over(titstud, label(labsize(vsmall))) by(sesso ) bar(1, bfcolor(yellow) blcolor(blue)) bar(2, bfcolor(red)) blabel(bar, size(vsmall))

Grafici: Grafico a barre - 4

.694571

.603333

.80325

.71427

.851056

.81282

.917333

.849298

.928909

.859

.499762.509412

.7104

.669406

.769176.750625

.850947

.816641

.855125

.8144

   0

 .   2

 .   4

 .   6

 .   8

   1

nessuno licenza elementarescuola media inferiorescuola media superiorelaurea nessuno licenza elementarescuola media inferiorescuola media superiorelaurea

maschio femmina

mean of value mean of scalavas

Graphs by sesso

 

G fi i G fi b 5

Page 130: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 130/139

.graph hbar (mean) value scalavas, over(titstud, label(labsize(vsmall))) by(sesso ) bar(1, bfcolor(yellow) blcolor(blue)) bar(2, bfcolor(red)) blabel(bar, size(vsmall))

Grafici: Grafico a barre - 5

.859

.928909

.849298

.917333

.81282

.851056

.71427

.80325

.603333

.694571

.8144

.855125

.816641

.850947

.750625

.769176

.669406

.7104

.509412

.499762

0 .2 .4 .6 .8 1 0 .2 .4 .6 .8 1

laurea

scuola media superiore

scuola media inferiore

licenza elementare

nessuno

laurea

scuola media superiore

scuola media inferiore

licenza elementare

nessuno

maschio femmina

mean of value mean of scalavas

Graphs by sesso

 

G fi i G fi b 6

Page 131: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 131/139

Grafici: Grafico a barre - 6

Per creare un grafico a barre occorre cliccare su

Graphics Bar Graph

 

G fi i G fi b 7

Page 132: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 132/139

Grafici: Grafico a barre - 7

 

G fi i G fi b 8

Page 133: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 133/139

Grafici: Grafico a barre - 8

 

G fi i G afico a ba e 9

Page 134: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 134/139

Grafici: Grafico a barre - 9

 

Grafici: Grafico a barre 10

Page 135: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 135/139

Grafici: Grafico a barre - 10

 

Grafici: Grafico a barre 11

Page 136: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 136/139

Grafici: Grafico a barre - 11

.694571

.80325

.851056

.917333 .928909

.499762

.7104

.769176

.850947 .855125

   0

 .   2

 .   4

 .   6

 .   8

   1

nessuno licenza elementarescuola media inferiorescuola media superiorelaurea nessuno licenza elementarescuola media inferiorescuola media superiorelaurea

maschio femmina

 

Graphs by sesso

 

Grafici: Box Plot 1

Page 137: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 137/139

Il grafico box plot fornisce informazioni relative alla simmetria, alla variabilitàdistributiva e alla presenza di outliers. Per ottenere un singolo box plot si usa ilcomando:

. graph box y 

Se variabili differenti presentano la stessa scala o scale simili, si possonovisualizzare contemporaneamente le loro distribuzioni per un confronto,usando il comando:

. graph box varlist

Una delle applicazioni più comuni dei box plot riguarda il confronto delladistribuzione di una variabile rispetto alle categorie di una seconda variabile.

Grafici: Box Plot - 1

 

Grafici: Box Plot 2

Page 138: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 138/139

Grafici: Box Plot - 2

. graph box scala, medtype(line) over(titstud,label(labsize(vsmall))) box(1, bfcolor(blue))

   0

   2   0

   4   0

   6   0

   8   0

   1   0   0

 

nessuno l i cenza elementare scuola media inferiore scuola media superiore laurea

 

Grafici: Box Plot 3

Page 139: Introduzione a STATA 10.1

5/12/2018 Introduzione a STATA 10.1 - slidepdf.com

http://slidepdf.com/reader/full/introduzione-a-stata-101 139/139

Grafici: Box Plot - 3

. graph hbox scala, medtype(line) over(titstud,label(labsize(vsmall))) box(1, bfcolor(blue))

laurea

scuola media superiore

scuola media inferiore

licenza elementare

nessuno