Introduzione a STATA 10.1
-
Upload
wen-zhuang -
Category
Documents
-
view
150 -
download
3
Transcript of Introduzione a STATA 10.1
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 1/139
INTRODUZIONE A STATAVERSIONE 10.1
Giulia CavriniDipartimento di Scienze Statistiche “Paolo Fortunati”
Università di Bologna
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 2/139
INDICE Introduzione Il menu Help La barra dei menu e la barra delle icone
Creare un file LOG Definizione del file di dati Leggere file ASCII Inserire le etichette Codificare un variabile
Creare nuove variabili Operatori relazionali Statistiche descrittive: distribuzioni di frequenza semplici Statistiche descrittive: misure di sintesi e di variabilità Grafici: A barre, Istogrammi, Box-plot
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 3/139
Che cos’è STATA?
STATA è un Sistema di Analisi Statistica (Statistical Analysis System)creato per ricercatori. È nato in ambito accademico.Il sito ufficiale del programma è:
http://www.stata.com/
È un ambiente che consente di manipolare e analizzare i datiusando metodi statistici e grafici.È un pacchetto integrato – non una collezione di moduli separati.
Con STATA è possibile fare: • Data Management• Analisi descrittive• Grafici• Modelli lineari e non• ANOVA, ecc.
www.ats.ucla.edu/stat/stata
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 4/139
Installare STATA
Per default STATA viene installato in c:\Stata10. I files “ufficiali” di tipo ado vengono inseriti in c:\Stata10\ado. I files “non ufficiali” in c:\ado.
Le principali directory create sono:
sysdir
STATA: C:\Program Files\Stata10\ UPDATES: C:\Program Files\Stata10\ado\updates\
BASE: C:\Program Files\Stata10\ado\base\ SITE: C:\Program Files\Stata10\ado\site\ PLUS: C:\ado\plus\ PERSONAL: C:\ado\personal\
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 5/139
Alcune cose da conoscere prima di iniziare a lavorare
con STATA:
STATA è case-sensitive: sex e Sex
sono due nomi di variabili diverse. . è il prompt di STATA
exit è il comando che consente di
uscire da STATA. In alternativa si puòusare il menu File Exit.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 6/139
Nella finestra Stata Command viene inseritoun singolo comando ed eseguito con [Enter]
Dopo aver cliccato due volte sull’icona di STATAcompare la seguente immagine:
Nella finestra Reviewvengono registrati i
Comandi
Nella finestra Variablessono visualizzate le
variabili
Nella finestra Stata Resultsviene visualizzato l’output
prodotto
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 7/139
La finestra Results
Se non si vogliono interruzioni dell’output con more, occorre digitare:
. set more off
Se si vuole settare questo in maniera permanente, digitare:. set more off, permanently
Per attivare more di nuovo, digitare:. set more on, [permanently]
La dimensione del buffer iniziale della finestra Results mostra solo pochepagine di output (32 kb); se lo si vuole incrementare a 200 kb, peresempio, digitare:. set scrollbufsize 200000
Occorre però riaprire STATA per rendere effettivo questo cambiamento.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 8/139
Salvare il contenuto della finestra Review
È possibile salvare in un file di sintassi (*.do) ilcontenuto della finestra Review.
Per salvare i comandi occorre cliccare con iltasto destro del mouse sulla finestra Review:compare un menu all’interno del quale ècontenuta anche l’opzione:
Save All…
I comandi contenuti nella finestra Reviewpossono essere richiamati con Pag e con
Pag.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 9/139
La finestra editor Do-file L’editor Do.file è un editor di testo standard ed è usato per scrivere file di
testo (generalmente files .do).
Un file Do è una serie di comandi che devono essere eseguiti in sequenza.
Si apre cliccando sull’icona
L’editor Do-file ha la caratteristica speciale che può essere eseguito tutto o
solo una parte dei comandi cliccando sull’icona Do o digitando Ctrl-D
L’icona Run è usata raramente e consente di eseguire i comandi senza
visualizzare i risultati. È possibile avere più finestre Editor Do-file attive.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 10/139
Il menu Help - 1
STATA ha incorporato un help molto facile da usare.
Il menu Help fornisce opzioni relative ai Contenuti e
ai Comandi. L’Help online è visualizzato nella finestra Viewer.
Se si conosce il nome del comando, per visualizzarne ilcontenuto si può utilizzare sia il Viewer sia la riga di
Stata Command:
help tabulate dalla linea di comando Viewerwhelp tabulate dalla finestra Stata Command
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 11/139
Il menu Help - 2
Se non si conosce il comando esatto, è possibile, usandoSearch oppure Findit, visualizzare tutti i possibili comandirelativi all’argomento indicato.
search nonparametric dalla linea di comando Viewer
findit poisson goodness dalla finestra Stata Command
Inoltre è possibile ricercare in Internet, nel sito web di Stata,informazioni utili, links, macro già scritte e pubblicazioni.
Cerchiamo, ad esempio, una funzione particolare:
Help Search… pie
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 12/139
Si apre questa prima finestra, in cui occorreindicare la parola chiave della ricerca:
Il risultato dellaricerca è questo:
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 13/139
Se è già noto il comando, allora occorreusare la finestra Stata Command dell’Help:
Il risultato dellaricerca è questo:
Le parole sottolineatesono dei link.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 14/139
La barra dei menu e la barra delle icone:
Open (use)
Log Begin. Usata perconfigurare un file log.
New Viewer. Apre la finestra viewer di STATA.Il principale uso di questa finestra è visualizzare ifiles di help
New Do-File Editor. Apre la finestra Do-file di
STATA.
Data Editor. Apre lafinestra di Editor dei dati.
Data Browser. Apre lafinestra di Editor dei dati in
modalità browse.
Save. Salva ilfoglio di lavorocorrente
Bring Graph Windows to Front.
Print results
Break.Interrompe ilprocessore.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 15/139
Tipi di file Stata
dta files: dati Stata.L’estensione per un dataset di Stata è .dta.
do files: files di comando.File che contengono righe di comandi che possono essereeseguiti in sequenza. Sono in formato ASCII.
ado files: programmi/macro. hlp files: Stata help.
gph files: grafici.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 16/139
Creare un file log - 1
All’inizio della sessione di lavoro o quando lo si ritiene più opportuno, èpossibile creare un file log in cui vengono salvati i comandi e l’output adessi corrispondenti.
Per creare un file log si può digitare il comando:.log using "C:\Documents and
Settings\elisabetta.petracci2\Desktop\prova.smcl"
oppure si può utilizzare il menu: File Log Begin
oppure si può utilizzare la barra delle icone:
Filename è un nome qualsiasi che può essere assegnato al file log.
Stata aggiunge il suffisso .smcl. In questo caso, però, il file può essereletto e stampato solo con Stata.
Il file log può essere anche salvato in un formato testo, con l’estensione .log. In questo caso può essere visualizzato con un qualunque editor ditesto.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 17/139
Creare un file log - 2
Si può sospendere il salvataggio dell’output digitando:
. log off
e si può riprendere il salvataggio dell’output digitando:. log on
Per chiudere il file log, oltre al menu, si può usare il comando:. log close
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 18/139
Il file log
Il file log può essere stampato tramite la barra dei menu o con ilsemplice comando:
. print filename
I passi da eseguire sono, quindi, i seguenti:1. Lanciare Stata
2. Definire il file log
3. Aprire il file di dati
4. Eseguire le procedure statistiche ritenute necessarie5. Chiudere il file log
6. Stampare i risultati
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 19/139
Il file log comandi
Analogamente, si possono salvare tutti i comandi futuri di Stata
eseguiti nella sessione di lavoro corrente in un file log di sintassidigitando il comando:
. cmdlog using filename, [replace|append]
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 20/139
Definizione del file di dati - 1
I. Inserimento dei dati attraverso la finestra dei comandi.
(1) Si possono inserire i dati tramite il comando input.
(2) I nomi delle variabili possono essere lunghe al massimo 8caratteri e devono essere separate da spazi
(3) Ad esempio:
. input id age sex reddito
(4) A questo punto si possono introdurre i dati relativi allaprima osservazione e, successivamente, tutte le altre. Seun dato è mancante può essere sostituito con un punto.
(5) Al termine dell’inserimento dei dati, occorre digitare il
comando end .
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 21/139
Definizione del file di dati - Esempio
. input id age sex reddito
id age sex reddito
1.01 22 1 40000
2.02 34 2 50000
3.03 43 1 55444
4.04 43 1 25000
5.end
Dopo l’inserimento, i dati possono essere visualizzati con ilcomando:
. list
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 22/139
Definizione del file di dati - 2
II. Inserimento dei dati attraverso il foglio elettronico.. edit
III. Nomi di variabili
I nomi delle variabili possono variare da 1 a 32caratteri, ma Stata abbrevia a 8 caratteri lavisualizzazione nell’output. I nomi devono iniziare conuna lettera.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 23/139
Definizione del file di dati - 3
IV. Variabili numeriche
Molto spesso non è necessario specificare il tipo di
formato numerico, ma se si hanno problemi di memoria
è meglio sapere che i numeri possono essere definiti
secondo cinque tipologie diverse:
byte, int, long, float (default) o double.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 24/139
Definizione del file di dati - 4
IV. Variabili numericheNella tabella seguente sono riportati i valori minimo emassimo riservati al diverso tipo di definizione
numerica e il numero di byte riservati:
Il comando compress può ridurre la dimensione deldataset in maniera consistente.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 25/139
Leggere file ASCII
insheet : si può accedere ad un file ASCII con il comando:. insheet using filename, clear Oppure tramite il menu File Import ASCII data
created by a spreadsheet:
Foglio di calcoloelettronico
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 26/139
Il nostro file ASCII
"TESSERA","AS_ETA","AS_SESSO","MEDICO","GRUP_MED","SUM_DDD","ALTRIF"1,61,0,101,0,173.335,02,63,0,72,1,26.667,13,75,0,82,0,213.336,04,70,0,25,0,213.336,05,72,0,83,0,106.668,16,55,0,131,0,26.667,07,40,0,56,0,53.334,18,71,0,56,0,133.335,19,80,1,56,0,26.667,110,30,1,34,1,53.334,010,30,1,120,0,53.334,011,64,1,120,0,80.001,0
12,68,1,165,0,266.669,113,45,1,182,0,240.002,014,56,0,160,0,40,015,68,1,182,0,106.668,116,61,1,40,0,133.335,017,43,0,40,0,26.667,118,92,0,40,0,26.667,0
19,69,1,20,0,80.001,0
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 27/139
File Import ASCII data createdby a spreadsheet
Selezionare il file *.csvcliccando su Browse.
Scegliere il delimitatore.
Cliccare su OK.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 28/139
Apriamo il file c10aa01_pr.csv:
Con il comando list otteniamo questatabella:
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 29/139
L’altro tipo di dati ASCII è quello in formato fisso. In questo caso occorre aprire il menu:File Import ASCII data in fixed format
TESSERA 1 4 F4.0
AS_ETA 5 7 F3.0
AS_SESSO 8 8 F1.0 MEDICO 9 11 F3.0
GRUP_MED 12 19 F8.0
SUM_DDD 20 27 F8.2
ALTRIF 28 35 F8.0
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 30/139
Esempio con dati in formato fisso.
1 610101 0 173.34 0 2 630 72 1 26.67 1 3 750 82 0 213.34 0 4 700 25 0 213.34 0 5 720 83 0 106.67 1
6 550131 0 26.67 0 7 400 56 0 53.33 1 8 710 56 0 133.34 1 9 801 56 0 26.67 1 10 301 34 1 53.33 0 10 301120 0 53.33 0 11 641120 0 80.00 0 12 681165 0 266.67 1
13 451182 0 240.00 0 14 560160 0 40.00 0 15 681182 0 106.67 1 16 611 40 0 133.34 0 17 430 40 0 26.67 1 18 920 40 0 26.67 0 19 691 20 0 80.00 0
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 31/139
Il menu File Import ASCII data in fixedformat corrisponde al comando:
. infix specifications using filename.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 32/139
ETICHETTE: per il Dataseti) Data set labels: può essere veramente utile avere unadescrizione del data set.Dal menu:
Data Labels Label dataset
Questo corrisponde al comando.label data “…………”
Con il comandode (describe):
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 33/139
ETICHETTE: per le variabiliii) Variable labels: può essere utile avere una etichetta per levariabili, soprattutto quando il nome è abbreviato.
Dal menu:Data Labels Label variable
Questo corrisponde al comando. label variable varname “…”
Con il comando de (describe):
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 34/139
ETICHETTE: per i valoriiii) Value labels: si possono assegnare etichette ai valori assuntida una variabile categorica.
Dal menu:Data Labels Label values Define ormodify value labels
Cliccare su Define
Cliccare su OK
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 35/139
Una volta terminato l’inserimentodelle etichette, cliccare su Close.
Ma l’operazione non è ancora completata. Occorre cliccare su:
Data Labels Label values Assign value labels tovariable
Si rende così disponibile l’opzione Add, tramite la quale possiamoinserire l’altra etichetta: 1 Si
Scegliere l’etichetta e indicare lavariabile.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 36/139
A questo punto è sufficientevisualizzare la list della o dellevariabili a cui sono state assegnateetichette di valore:
Definire con la stessa etichetta No_Si le duevariabili grup_med e altrif .
Possiamo visualizzare ladescrizione del file con il comandode .
. list gruppo_m altri_f
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 37/139
Formati numerici
w : Dimensione totale che include separatore decimale e numero di decimali
d : Numero di decimali
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 38/139
Apriamo il file c10aa01.dta
Se la dimensione del file è elevata e abbiamodifficoltà ad aprirlo o a fare le elaborazioni, possiamoaumentare la memoria, con il comando:
. set memory (dim)m
Prima di dare questo comando è opportuno verificarequal è la quantità di memoria attualmente in uso con:. memory
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 39/139
Sintassi dei comandi
La sintassi generale dei comandi STATApuò essere scritta nel seguente modo:
[ prefix :] command [varlist][if expression] [in range]
[weight] [, options]
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 40/139
Qualifiers e Opzioni
I qualifiers sono generali per molticomandi.
Le opzioni sono specifiche per uncomando. La virgola precede la lista
delle opzioni disponibili. Dimenticare lavirgola rappresenta una causafrequente di messaggi di errore.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 41/139
A questo punto osserviamo il nostro dataset con ilcomando describe oppure con il menu:
Data Describe data Describe variable in memory
Inserire le variabilidi cui si vuole
visualizzare ladescrizione
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 42/139
Data Describe data Describe variable in memory
Il comando Describe data - 1
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 43/139
Data Describe data Describe variables in file
Il comando Describe data - 2
Inserire/Cercare ilnome del file di cui sivuole visualizzare ladescrizione
Si può visualizzare ladescrizione solo dialcune variabili, cheandranno inserite inquesto riquadro:
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 44/139
Gli operatori relazionali sono 6:
== è uguale a!= non è uguale (~= è analogo)> maggiore
< minore>= maggiore o uguale<= minore o uguale
Operatori relazionali - 1
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 45/139
Un doppio segno uguale, “==”, denota il test logico “Il valorealla sinistra è uguale al valore a destra?” .
Il singolo segno “=”, al contrario, significa qualcosa di diverso: “Poni il valore che è a sinistra uguale al valore che è adestra” .
Il singolo segno di = non è un operatore relazionale e
quindi non può essere usato con if.
Gli operatori relazionali possono essere usati per selezionareosservazioni basate su valori assunti dalle variabili numeriche.Solo due operatori, == e != sono usati con variabili stringa.
Operatori relazionali - 2
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 46/139
Due o più operatori relazionali possono essere combinatientro una singola espressione if utilizzando un operatore
logico.
Gli operatori logici di STATA sono i seguenti:
& and| or! not (~ è equivalente)
Operatori logici
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 47/139
Gli operatori matematici di STATA sono i seguenti:
+ addizione- sottrazione* moltiplicazione / divisione^ potenza
Il segno + viene usato anche per concatenare le stringhe.
Operatori matematici
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 48/139
Per elencare i dati occorre digitare il comando:. list
che può essere abbreviato con . l
Per elencare una o più variabili:. list varname(s) (es.: list medico)
Per elencare le variabili da varnamei a varname j:. list varnamei-varnamej
Per elencare tutte le variabili che iniziano con as:. list as*
Il comando List data - 1
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 49/139
in restringe l’elenco a un intervallo di osservazioni.
I numeri positivi consentono di far partire l’elenco dall’inizio del
dataset. I numeri negativi dalla fine del dataset.
Per elencare la terza osservazione:. list in 3
Per elencare la quinta osservazione partendo dalla fine:. list in –5
Per elencare l’ultima osservazione: . list in –1 oppure . list in l (è la lettera l)
Il comando List data - 2
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 50/139
Per elencare la lista dalla quint’ultima osservazione alla fine: . list medico in -5/l
Per elencare le osservazioni da 1 a 3:. list in 1/3
Per elencare le osservazioni da 5 a 17:. list in 5/17
Per elencare le osservazioni da 3 alla terz’ultima: . list in 3/-3
Per elencare le osservazioni ponendo condizioni:. list if exp (es.: list if as_sesso==1)
Il comando List data - 3
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 51/139
if exp restringe l’elenco alle osservazioni che soddisfanola condizione posta.
if può essere combinato con in (o in con if: l’ordine non èimportante
Per elencare le osservazioni ponendo condizioni:. list if exp
. list if as_sesso==1
. list if as_sesso==1 in 1/20
Il comando List data - 4
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 52/139
Il comando list può essere ottenuto anche con il menu:
Data Describe data List data
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 53/139
Label List Per visualizzare le definizioni di etichette di valori:
. label list
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 54/139
Esempi di Comandi
. list
. l
. list _all
. list as_eta as_sesso
. list as_eta as_sessoin 1/20
. list as_eta as_sesso in 1/20
. list as_eta as_sesso if as_sesso==1
. list as_eta as_sesso if as_sesso==1 in 1/30
. bysort altrif: list as_eta
. sort altrif
. list as_eta
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 55/139
Con i comandi generate e replace si possono creare nuovevariabili e assegnare a queste variabili valori per ogni record.
Il comando base è:generate type newvar = mathematical expression
Con questi comandi è possibile creare variabili uguali a unacostante o combinare variabili tra loro, utilizzando espressioni
matematiche, funzioni matematiche, funzioni di matrici, e cosìvia.
Oppure si può usare il menu.
Creare una nuova variabile - 1
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 56/139
Per creare una nuova variabile come espressione algebricadi altre variabili si usa il comando:
. generate newvar = exp
newvar è il nome di una nuova variabile: non può essere ilnome di una variabile che esiste già.
exp è una qualunque espressione valida. Una espressione è
una combinazione di variabili esistenti, operatori e funzioni.
Questo comando può essere abbreviato con g, ge, gen:
. g newvar = exp
Creare una nuova variabile - 2
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 57/139
Per cambiare il contenuto di una variabile esistente si usa ilcomando:
. replace oldvar = exp
Pertanto, si usa il comando generate per creare una variabilenuova e il comando replace per cambiare il contenuto dellevariabili esistenti.Stata richiede questo procedimento più complesso al fine dinon modificare accidentalmente i dati.
Questo comando non può essere abbreviato.Generalmente Stata richiede il comando non abbreviatoquando esiste la possibilità di alterare i dati esistenti.
Creare una nuova variabile - 3
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 58/139
Stata ha la possibilità di creare due variabili particolari,chiamate _n e _N.
_n è la notazione che consente di assegnare ad ogni record ilnumero corrente dell’osservazione.
_N è la notazione per assegnare ad ogni record il numerototale di osservazioni.
. generate id=_n
. generate nt=_N
_n e _N - 1
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 59/139
_n e _N - 2
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 60/139
Ricodificare una variabile - 1
Accorpare categorie Creare categorie partendo da una variabile continua
Correggere codici errati o cambiare i codiciQuando si ricodifica è buona norma creare sempre una variabilenuova così da mantenere la variabile originale e correggereeventuali errori di ricodifica.
Si può utilizzare il menu
Data Create or change variable Create new variable:
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 61/139
4. Cliccare su if/in
1. Inserire il nomedella nuova variabile
3. Indicare il tipo di variabileche si vuole creare
2. Digitare il 1° valore daricodificare
Ricodificare una variabile - 2
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 62/139
Cliccare su Create perselezionare i casi da ricodificare
Ricodificare una variabile - 3
Costruire la selezione, cliccandosuccessivamente su OK.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 63/139
Ricodificare una variabile - 4
La finestra Stata Results mostra che la variabile è stata creata:
Però noi abbiamo ricodificato una sola classe. Dobbiamo oracreare anche le altre classi di età. Dal momento che la variabilecls_eta esiste già, non possiamo più utilizzare il menu precedente.Dobbiamo allora procedere in questo modo:
Data Create or change variable Change contents of variable:
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 64/139
Digitare cls_eta come variabile da modificare
Ricodificare una variabile - 5
Scegliere nuovamente if/in perSelezionare i casi da ricodificare.
Digitare 2 come nuovo codice
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 65/139
Ricodificare una variabile - 6
La finestra Stata Results mostra che la variabile è statamodificata:
Si procede in questo modo finché non si sono fatte tutte lericodifiche.
Il passo successivo sarà quello di verificare che non si sianogenerati errori di ricodifica e, infine, occorrerà mettere le etichetteai valori assunti dalla nuova variabile cls_eta.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 66/139
Il comando Recode - 1
Per creare classi si può utilizzare anche un procedimento diverso.Partiamo sempre dal menu:
Data Create or change variable Create new variable
Copiamo la variabile as_eta inuna nuova variabile agegroup .
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 67/139
Il comando Recode - 2
A questo punto apriamo il menu:
Data Create or change variable Other variabletransformation commands Recode categorical variable
Nuova variabile
Ricodifiche
Regole
Il comando Recode - 3
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 68/139
Il comando 3
Regole per laricodifica dellevariabili
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 69/139
Nella finestra Stata Results avremo:
Il comando Recode - 4
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 70/139
Cancellare variabili e osservazioni - 1
Per cancellare variabili o osservazioni si possono utilizzare trecomandi:. drop
. clear
. keep
Qual è la differenza tra i tre comandi?
Il comando drop _all cancella il dataset dalla memoria.
Il comando clear cancella sia il dataset sia tutte le definizioni divalue label, matrici, equazioni, programmi, risultati di stime, grafici,ecc. In effetti, clear corrisponde a fare il reset di Stata.
Il comando keep tiene in memoria solo le informazioni indicate dalcomando stesso.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 71/139
Cancellare variabili e osservazioni - 2
La sintassi è analoga a quanto visto con il comando list.Per cancellare una o più variabili:
. drop varname(s)
. drop varnamei-varnamej
. drop as*
. drop in 1
. drop in 1/3
Il comando keep lavora con la sintassi analoga a drop,ma tiene in memoria le variabili elencate o leosservazioni che rispettano le condizioni poste.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 72/139
Il comando count
Il comando count usa le espressioni logiche ed è particolarmente utilein fase di esplorazione dei dati. Per esempio:
. count if as_eta<=65 & as_sesso==11265
conta il numero di osservazioni che soddisfano entrambe leespressioni logiche as_eta<=65 e as_sesso==1.
d f b l l
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 73/139
Ricodificare una variabile con ilcomando egen e la funzione cut - 1
Un altro modo molto veloce per creare classi è quello di utilizzare il comandoegen e la funzione cut in esso contenuta. Ad esempio, volendo creare delle classi di età:
. egen agegrp1=cut(as_eta), at(15, 45, 65, 85, 103)
. tab agegrp1
agegrp1 | Freq. Percent Cum.------------+-----------------------------------
15 | 352 7.17 7.1745 | 1,825 37.20 44.3765 | 2,596 52.91 97.2985 | 133 2.71 100.00
------------+-----------------------------------Total | 4,906 100.00
extensions to generate
Ri difi i bil il
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 74/139
Ricodificare una variabile con ilcomando egen e la funzione cut - 2
. egen agegrp2 =cut(as_eta), at(15, 45, 65, 85, 103),label. tab agegrp2
agegrp2 | Freq. Percent Cum.------------+-----------------------------------
15- | 352 7.17 7.1745- | 1,825 37.20 44.3765- | 2,596 52.91 97.29
85- | 133 2.71 100.00------------+-----------------------------------Total | 4,906 100.00
Ri difi i bil il
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 75/139
Ricodificare una variabile con ilcomando egen e la funzione cut - 3
. egen agegrp3 =cut(as_eta), at(15, 45, 65, 85, 103)icodes. tab agegrp3
agegrp3 | Freq. Percent Cum.------------+-----------------------------------
0 | 352 7.17 7.171 | 1,825 37.20 44.372 | 2,596 52.91 97.29
3 | 133 2.71 100.00------------+-----------------------------------Total | 4,906 100.00
Ri difi i bil il
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 76/139
Ricodificare una variabile con ilcomando egen e la funzione cut - 4
. egen agegrp4=cut(as_eta), at(15, 45, 65, 85)
. tab agegrp4
agegrp4 | Freq. Percent Cum.
------------+-----------------------------------15 | 352 7.37 7.3745 | 1,825 38.24 45.6165 | 2,596 54.39 100.00
------------+-----------------------------------
Total | 4,773 100.00
Ri difi i bil il
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 77/139
Ricodificare una variabile con ilcomando egen e la funzione cut - 5
icodes richiede che i codici 0, 1, 2, etc. siano usatial posto dell’estremo inferiore di ogniintervallo.
È importante ricordarsi che le osservazioni che nonsono incluse nell’intervallo specificato con l’opzione at() risulteranno essere valori mancanti nella nuovavariabile categorica creata.
label richiede che i valori interi della variabile diraggruppamento siano etichettati conl’estremo inferiore degli intervalli.
Utili d ll i bili t il
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 78/139
Utilizzo delle variabili create con ilcomando egen e la funzione cut - 6
Esempi:
. bysort agegrp1: sum as_eta
. bysort agegrp2: sum as_eta
. bysort agegrp3: sum as_eta
. bysort agegrp4: sum as_eta
Ri difi i bil il
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 79/139
Ricodificare una variabile con ilcomando egen e la funzione cut - 5
Il comando encode 1
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 80/139
Il comando encode - 1encode encode string variables
into numeric variables
Il comando encode 2
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 81/139
Il comando encode - 2
. encode age_str, generate(age_num)
. label list age_num
age_num:
1 a
2 b
3 c
4 d
Il comando decode 1
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 82/139
Il comando decode - 1
Il comando decode 2
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 83/139
Il comando decode - 2
. decode age_num, generate(str_age)
decode encode numeric variablesinto string variables
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 84/139
STATISTICHE DESCRITTIVE
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 85/139
Statistiche descrittive
La maggior parte dei comandi di STATA ha una sintassicomune:
[prefix varname:] command [varlist] [if exp ] [in range][, options]
La parte indicata entro parentesi quadrata è opzionale.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 86/139
Statistiche descrittive: summarize
Nel caso del comando summarize, la sintassi è:
[by varname:] summarize [varlist] [if exp ][in range][,[ detail | meanonly] format
separator(#)]
detail: produce statistiche aggiuntive
meanonly: che è mostrata solo quando detail non èspecificato, sopprime la visualizzazione dei risultati
e il calcolo della varianzaformat: richiede che le statistiche riassuntive sianovisualizzate in un certo formato, piuttosto che quellodato di default
separator(#): specifica quando inserire le linee diseparazione nell’output. Il default è 5.
Statistiche descrittive: summarize
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 87/139
Statistiche descrittive: summarize Statistics Summarizes, tables, and tests Summary and descriptive statistics Summarystatistics
Compare la seguente finestra:
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 88/139
p g
che consente di ottenere il seguente output:
Se poi si vuole verificare se l’età media è più alta neimaschi o nelle femmine allora occorre cliccare su
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 89/139
maschi o nelle femmine, allora occorre cliccare suby/if/in:
Se si vuole fare lo splitdell’output:
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 90/139
Statistiche descrittive: codebook - 1
Questo comando è utile per verificare se una variabile contiene dei valorimancanti. La sintassi è:
codebook [varlist] [, all header notes mvtabulate(#) problems detail]
Il comando codebook analizza i nomi delle variabili, le etichette e idati e produce in output una descrizione del dataset.
all è equivalente a specificare le opzioni header e notes: fornisce unreport completo, con l’eccezione delle informazioni fornite da mv.
mv fornisce informazioni sui valori mancanti.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 91/139
Statistiche descrittive: codebook - 2
Header: stampa il nome del dataset e la data dell’ultimo salvataggio.
Notes: stampa le eventuali note aggiunte alle variabili.
Problems: riporta i potenziali problemi presenti nel dataset. Si puòtrattare di
- variabili etichettate con etichette di valori non definite- variabili con etichette di valori incomplete
- variabili che assumono valori costanti- variabili che assumono solo valori missing- variabili definite stringa che contengono dei “blank”
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 92/139
Statistiche descrittive: codebook - 3
tabulate(#) specifica il numero di valori unici della variabile da usare perdeterminare se la variabile è categorica o continua. I valori mancanti nonsono inclusi nel conteggio. Il default è 9. Quando ci sono più di 9 valoriunici, la variabile è classificata come continua; quando ci sono meno di 9
valori unici, la variabile è classificata come categorica.. codebook med_sex , t(2)
. codebook, mv
Per le variabili che codebook ritiene continue, viene calcolata la media, ladeviazione standard e i percentili 10°, 20°, 50°, 75° e 90°. Per le variabiliritenute categoriche, viene mostrata la distribuzione di frequenza.Quindi se il numero di modalità è 9 o minore di 9, codebook mostra unadistribuzione di frequenza; altrimenti, vengono calcolate le statistichedescrittive.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 93/139
Il comando display - 1
Il comando display può essere usato come una calcolatrice. In realtàha caratteristiche molto più complesse.
. display sqrt(100)/2
Il risultato può anche essere visualizzato a colori:
. display as text “La radice quadrata di 25 è” sqrt(25)
Le parole chiave as text e as result determinano i colori delrisultato: se lo sfondo è nero, as text mostra il testo in verde e asresult mostra il risultato dell’operazione in giallo.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 94/139
Dopo alcuni comandi di STATA alcuni dei risultati sonomemorizzati così che questi possono essere richiamati.Per esempio, dopo il comando summarize, STATA mantiene
temporaneamente in memoria la media come una macrochiamata r(mean). Ma non solo. Possiamo visualizzare lamemoria con il comando return list.
. sum as_eta
. return list
. display r(mean)
. sum as_eta, meanonly
. display r(mean)
Il comando display - 2
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 95/139
Si può usare questo risultato per creare una nuova variabileageDEV , definita come deviazione dalla media:
. sum as_eta
. gen etaSTD =(as_eta-r( mean))/r(sd )
. summ as_eta etaSTD
. egen std_age = std(as_eta), mean(0) std(1)
. summ etaSTD std_age
Il comando display - 3
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 96/139
Anche dopo il comando tabulate possiamo visualizzarecon return list ciò che è mantenuto in memoria eche può essere richiamato.
. tabulate as_sesso altrif
. return list
Il comando display - 4
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 97/139
DISTRIBUZIONI DIFREQUENZA:
TABELLE SEMPLICI E DOPPIE
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 98/139
Il comando tabulate - 1
Il comando tabulate produce tabelle di frequenza semplici sesi usa la sintassi seguente:
tabulate varname [weight] [if exp ][in range] [, options]
Il comando tab1 produce tutte le tabelle semplici dellevariabili indicate.
tab1 varlist [weight] [if exp ][in range] [, options]
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 99/139
Il comando tabulate - 2
Si inserisce la variabilecategorica e si scelgonole opzioni ritenute piùopportune:
Statistics Summarizes, tables, & tests Tables One-way tables
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 100/139
Il comando tabulate - 3
Il comando tabulate seguito da due variabili crea una tabelladoppia:
tabulate varname1
varname2
[weight] [if exp ][in range] [, options]
La prima variabile indicata costituisce la variabile di riga, e laseconda la variabile di colonna.Inoltre, tab2 produce tutte le tabelle doppie tra le variabiliinserite:
tab2 varlist [weight] [if exp ] [in range][, options]
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 101/139
Il comando tabulate - 4
tabulate ha numerose opzioni. Alcune di queste sono le seguenti:
all equivale a inserire contemporaneamente le opzioni chi2 lrchi2 gamma taub V. Non tutte queste opzioni sono ugualmente
appropriate per una data tabella. gamma e taub assumono cheentrambe le variabili abbiano categorie ordinate, mentre chi2,lrchi2 e V no.
cell mostra le percentuali totali per ogni cella.row mostra le percentuali di riga.
column mostra le percentuali di colonna.chi2 visualizza il risultato del test 2 di Pearson.expected visualizza le frequenze attese sotto l’assunzione di indipendenza,
in ogni cella della tabella doppia.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 102/139
Il comando tabulate - 5
Statistics Summarizes, tables, & tests Tables Two-way table with measures of association
Dobbiamo inserire la variabileriga e la variabile colonnaindicando i test statistici chesi vogliono calcolare e icontenuti delle celle.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 103/139
Il comando tabulate - 6
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 104/139
Il comando tabulate - 7
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 105/139
Il comando tabulate - 8
Occasionalmente potremmo avere la necessità di analizzare una tabellapubblicata, senza possibilità di accedere ai dati individuali originali. Un comandospeciale, tabi (“immediate” tabulation), ci può aiutare in questo.
tabi # 11 # 12 […]\# 21 # 22 […] [, replacetabulate_options]
Le frequenze di ogni riga sono separate da “\ ” .Come esempio, riproduciamo la tabella precedente:
. tabi 41 72 \ 341 321, column chi2
Il comando tabi non richiede dati in memoria. Ma aggiungendo l’opzione replace, comunque, è possibile sostituire i dati inseriti nel comando tabinell’ editor dei dati, sostituendo eventualmente quelli presenti. Le opzioni
statistiche sono le stesse del comando tabulate.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 106/139
Il comando tabulate - 9
Per ottenere tabelle di contingenza multiple, un primo approccio puòessere quello di usare il comando tabulate preceduto dal prefisso by.
. by fum , sort: tabulate farmansd sesso , col chi2
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 107/139
Il comando table - 1
Un modo migliore di produrre tabelle a più vie, se non si ha la necessità divisualizzare le percentuali e di fare test statistici, è attraverso il comando table.Tale comando può essere usato anche per produrre tabelle semplici.
. table rowvar [colvar [supercolvar ]] [if exp ][in range] [weight] [,contents(clist) options]
dove gli elementi di clist possono essere:freq frequenza max varname massimomean varname media di una variabile min varname minimosd varname deviazione standard p1 varname 1° percentilemedian varname mediana …… sum varname somma p99 varname 99° percentilecount varname n° oss. non missing iqr varname range interquartile
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 108/139
Il comando table - 2
Esempi:
. table as_sesso
. table as_sesso altrif
. table altrif , c(mean as_eta)
. table cardiol, c(mean med_eta)
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 109/139
Con questo comando si
possono ottenere diverse tipidi tabelle.
Il comando table - 3
Statistics Summarizes, tables, & tests Tables Table of summary statistics (table)
Possiamo inserire solo lavariabile di riga indicandoFrequency nel riquadroStatistics
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 110/139
Oppure possiamo inserire solo la variabile di riga indicando,oltre a Frequency nel riquadro Statistics, anche Mean (dialtre variabili)
Il comando table - 4
O ancora possiamo inserire sia la variabile di riga che la
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 111/139
p gvariabile di colonna indicando solo Frequency nel riquadroStatistics.
E, infine, possiamo inserire sia la variabile di riga che la variabiledi colonna indicando, oltre a Frequency, altre statistichecalcolate su altre variabili:
Purtroppo questo comandovisualizza la tabella doppiatra due variabili con le solefrequenze assolute. Se siamointeressati alle percentuali ea misure di associazionedobbiamo utilizzare uncomando diverso.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 112/139
Il comando table - 5
Carico il data-set “Euroqol” . table farmansd sesso, by (fum) row col
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 113/139
Il comando table - 6
. table farmansd sesso, contents(mean value)
. table farmansd sesso, contents(mean scala)
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 114/139
Il comando tabstat - 1
Il comando tabstat visualizza, in una sola tabella, statisticheriassuntive per una lista di variabili numeriche. È possibile anchecondizionare per un’altra variabile, tramite l’opzione by().
Senza l’opzione by(), tabstat è un’utile alternativa al comando
summarize.
tabstat mostra una maggiore flessibilità sia in termini di statistichepresentate sia in termini di formato della tabella.
La sintassi è la seguente:
tabstat varlist [weight] [if exp ] [in range][, statistics(statname[…]) by(varname)columns(variables|statistics) nototal…]
Distribuzioni di frequenza:
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 115/139
Il comando tabstat - 2
L’opzione statistics(statname[…]) specifica le statistiche chedevono essere visualizzate; il default è equivalente a specificarestatistics(mean). Si possono specificare più statistiche separandolecon uno spazio: es. statistics(mean sd).
Le statistiche disponibili sono:mean semean (standard errore della media)count rangen iqrsum q (equivale a specificare p25 p50 p75)
max p25 (25° percentile)min p50 (50° percentile)sd p75 (75° percentile)variance cv (coefficiente di variazione: var/mean2)
Distribuzioni di frequenza:Il comando tabstat 4
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 116/139
Il comando tabstat – 4Esempi
. tabstat as_eta
. tabstat as_eta, s(me sd)
. tabstat as_eta sum_ddd , s(me sd) c(v)
. tabstat as_eta sum_ddd , s(me sd) c(s)
. tabstat as_eta sum_ddd , s(me sd) c(s)
by(altrif)
. tabstat as_eta sum_ddd, s(me sd) c(v)
by(altrif) long. bysort altrif: tabstat as_eta sum_ddd,
statistics( mean sd ) by(altrif)
columns(variables) longstub
Distribuzioni di frequenza:l d b
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 117/139
Statistics Summarizes, tables, & tests Tables Table of summary statistics (tabstat)
Inseriamo la variabile sum_ddd come variabile di interesse e cardiol in Repeat command for groups defined by:
Il comando tabstat - 5
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 118/139
GRAFICI con STATA
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 119/139
INDICE
Grafici con STATA: Istogramma Grafico a barre Box plots
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 120/139
Grafici: Istogramma - 1
Carichiamo il file euroqol.dta.
L’istogramma può essere creato con il comando:
. histogram varlist
Utili opzioni dell’istogramma sono:
bin(#) disegna un istogramma con # bins (barre). Possiamo specificarebin(#) oppure start(#) e width(#), ma non entrambi.
gap(#) mostra uno spazio pari a # tra le barre riducendo la dimensione delle
barre.discrete specifica se i dati sono discreti, richiedendo così una barra per ognivalore di x .
norm sovrappone una curva normale all’istogramma, basandosi sulla mediacampionaria e sulla deviazione standard.
addlabels aggiunge le etichette alle barre dell’istogramma.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 121/139
Grafici: Istogramma - 2
Per creare un istogramma, dobbiamo cliccare su
Graphics Histogram
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 122/139
Grafici: Istogramma - 3
Esempi:
. histogram eta, frequency title(“Figura 1”)
. histogram eta, start(18) frequency bfcolor(yellow) blcolor(blue)
(bin=28, start=18, width=2.6785714)
. histogram eta, start(18) bfcolor(yellow) blcolor(blue)
title(Figura 1, size(tiny) color(red) position(2)justification(center))
(bin=28, start=18, width=2.6785714)
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 123/139
0
2 0
4 0
6 0
8 0
18 23 28 33 38 43 48 53 58 63 68 73 78 83 88 93eta'
Grafici: Istogramma - 4
. histogram eta, start(18) width(5) frequency bfcolor(yellow) blcolor(blue) xlabel(18 (5) 93)
(bin=15, start=18, width=5)
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 124/139
0
1 0
2 0
3 0
4 0
5 0
18 23 2833384348535863687378838893 18 2328 33 38 4348 53 586368 73 788388 93
maschio femmina
eta'Graphs by sesso
Grafici: Istogramma - 5
. histogram eta, by (sesso) frequency start(18) width(5) bfcolor(yellow) blcolor(blue)xlabel(18(5)93)
frequency riscala le
altezze delle barre in modoche l’altezza di ogni barrasia uguale al numero delleosservazioni presenti nellacategoria, e pertanto la
somma delle altezze èuguale al numero totale diosservazioni non mancantidella variabile.
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 125/139
Grafici: Istogramma - 6
. histogram eta, by (sesso) density start(18) width(5) bfcolor(yellow) blcolor(blue)xlabel(18(5)93)
density riscala le altezze
delle barre in modo che lasomma delle loro aree siauguale a 1.
0
. 0 1
. 0 2
. 0 3
18 23 2833384348535863687378838893 18 232833384348535863687378838893
maschio femmina
eta'Graphs by s esso
G fi i G fi b 1
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 126/139
Il grafico a barre consente di confrontare statistiche sintetiche come la media,la mediana, la somma o le numerosità. Per ottenere le barre verticali, si puòusare il comando:
. graph bar (stat) varlist, over(varlist)
Per ottenere le barre orizzontali, si può usare il comando:
. graph hbar (stat) varlist, over(varlist)
Il grafico a barre può visualizzare una qualunque delle statistiche (stat):
mean media: è la statistica di default min minimosd deviazione standard median medianasum somma p1 1° percentile ………. count numero di osservazioni non missing p99 99° percentile max massimo iqr range interquartile
Grafici: Grafico a barre - 1
G fi i G fi b 2
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 127/139
. graph bar (mean) value, over(titstud, label(labsize(vsmall))) bar(1, bfcolor(yellow) blcolor(blue)) blabel(bar)
blabel è l’opzione che
consente di inserire lamedia (ovvero la statisticadi sintesi richiesta) sopraogni barra.
Grafici: Grafico a barre - 2
.548464
.753586
.817756
.882435 .890413
0
. 2
. 4
. 6
. 8
1
nessuno l i cenza elementare scuola media inferiore scuola media superiore laurea
G fi i G fi b 3
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 128/139
. graph bar (mean) value, over(titstud, label(labsize(vsmall))) bar(1, bfcolor(yellow) blcolor(blue)) blabel(bar) by(sesso)
Grafici: Grafico a barre - 3
.694571
.80325
.851056
.917333 .928909
.499762
.7104
.769176
.850947 .855125
0
. 2
. 4
. 6
. 8
1
nessuno licenza elementarescuola media inferiorescuola media superiorelaurea nessuno licenza elementarescuola media inferiorescuola m edia superiorelaurea
maschio femmina
Graphs by sesso
G fi i G fi b 4
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 129/139
. graph bar (mean) value scalavas, over(titstud, label(labsize(vsmall))) by(sesso ) bar(1, bfcolor(yellow) blcolor(blue)) bar(2, bfcolor(red)) blabel(bar, size(vsmall))
Grafici: Grafico a barre - 4
.694571
.603333
.80325
.71427
.851056
.81282
.917333
.849298
.928909
.859
.499762.509412
.7104
.669406
.769176.750625
.850947
.816641
.855125
.8144
0
. 2
. 4
. 6
. 8
1
nessuno licenza elementarescuola media inferiorescuola media superiorelaurea nessuno licenza elementarescuola media inferiorescuola media superiorelaurea
maschio femmina
mean of value mean of scalavas
Graphs by sesso
G fi i G fi b 5
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 130/139
.graph hbar (mean) value scalavas, over(titstud, label(labsize(vsmall))) by(sesso ) bar(1, bfcolor(yellow) blcolor(blue)) bar(2, bfcolor(red)) blabel(bar, size(vsmall))
Grafici: Grafico a barre - 5
.859
.928909
.849298
.917333
.81282
.851056
.71427
.80325
.603333
.694571
.8144
.855125
.816641
.850947
.750625
.769176
.669406
.7104
.509412
.499762
0 .2 .4 .6 .8 1 0 .2 .4 .6 .8 1
laurea
scuola media superiore
scuola media inferiore
licenza elementare
nessuno
laurea
scuola media superiore
scuola media inferiore
licenza elementare
nessuno
maschio femmina
mean of value mean of scalavas
Graphs by sesso
G fi i G fi b 6
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 131/139
Grafici: Grafico a barre - 6
Per creare un grafico a barre occorre cliccare su
Graphics Bar Graph
G fi i G fi b 7
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 132/139
Grafici: Grafico a barre - 7
G fi i G fi b 8
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 133/139
Grafici: Grafico a barre - 8
G fi i G afico a ba e 9
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 134/139
Grafici: Grafico a barre - 9
Grafici: Grafico a barre 10
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 135/139
Grafici: Grafico a barre - 10
Grafici: Grafico a barre 11
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 136/139
Grafici: Grafico a barre - 11
.694571
.80325
.851056
.917333 .928909
.499762
.7104
.769176
.850947 .855125
0
. 2
. 4
. 6
. 8
1
nessuno licenza elementarescuola media inferiorescuola media superiorelaurea nessuno licenza elementarescuola media inferiorescuola media superiorelaurea
maschio femmina
Graphs by sesso
Grafici: Box Plot 1
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 137/139
Il grafico box plot fornisce informazioni relative alla simmetria, alla variabilitàdistributiva e alla presenza di outliers. Per ottenere un singolo box plot si usa ilcomando:
. graph box y
Se variabili differenti presentano la stessa scala o scale simili, si possonovisualizzare contemporaneamente le loro distribuzioni per un confronto,usando il comando:
. graph box varlist
Una delle applicazioni più comuni dei box plot riguarda il confronto delladistribuzione di una variabile rispetto alle categorie di una seconda variabile.
Grafici: Box Plot - 1
Grafici: Box Plot 2
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 138/139
Grafici: Box Plot - 2
. graph box scala, medtype(line) over(titstud,label(labsize(vsmall))) box(1, bfcolor(blue))
0
2 0
4 0
6 0
8 0
1 0 0
nessuno l i cenza elementare scuola media inferiore scuola media superiore laurea
Grafici: Box Plot 3
5/12/2018 Introduzione a STATA 10.1 - slidepdf.com
http://slidepdf.com/reader/full/introduzione-a-stata-101 139/139
Grafici: Box Plot - 3
. graph hbox scala, medtype(line) over(titstud,label(labsize(vsmall))) box(1, bfcolor(blue))
laurea
scuola media superiore
scuola media inferiore
licenza elementare
nessuno