Questionario e Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management...
-
Upload
osvaldo-abbate -
Category
Documents
-
view
214 -
download
1
Transcript of Questionario e Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management...
Questionario Questionario ee
Analisi UnivariataAnalisi Univariata
Metodi Quantitativi per Economia, Finanza e Management
Esercitazione n°2
Questionario
Per redigere un questionario è necessario tener presenti i seguenti punti:
ogni questionario somministrato deve avere un codice identificativo univoco
solo domande chiuse (cioè con un insieme di modalità definite)
sono ammesse le domande a risposta multipla raccogliere informazioni di carattere quantitativo
(necessario per costruire modelli statistici consistenti) tipologia dei dati
• strutturali (che descrivono l’intervistato, ad esempio l’età)• di indagine
Dal questionario al Data Set
Costruire la variabile n_questionario che associa un codice univoco ad ogni intervistato.
Identificare ogni variabile con un nome facilmente riconducibile alla domanda corrispondente (ad esempio la domanda n°1 corrisponde alla variabile D_1).
Nel caso di domande a risposte multiple andranno create un numero di variabili dicotomiche (0/1) pari al numero di modalità definite nella risposta.
Data Entry: controllo correttezza dei dati inseriti e analisi delle distribuzioni delle variabili (con valenza di controllo e valenza interpretativa).
Domande a risposte multiple 17. Per quale motivo utilizza il telefono cellulare? (possibile fornire massimo 3 risposte)
1) Lavoro
2) Studio
3) Comunicare con famigliari
4) Comunicare con il partner
5) Piacere/tempo libero
6) Altro
D_17_1
D_17_2D_17_3
D_17_4
D_17_5
D_17_6
n_questionario … D_17_1 D_17_2 D_17_3 D_17_4 D_17_5 D_17_6
45 …. 1 0 1 1 0 0
… … … … … … … …
Esempio di questionario
Obiettivo di analisi: studiare il comportamento di consumo del campione rilevato (dai 14 ai 32 anni) in relazione all’utilizzo del servizio “tariffa telefonica”.
I dati raccolti sono relativi ad un indagine di mercato realizzata nei mesi Aprile-Maggio 2007
I questionari sono stati somministrati in forma cartacea presso alcune scuole superiori/università o per via telematica (e-mail)
Le interviste raccolte e analizzate sono in totale 243
Questionario
Analisi UnivariataAnalisi Univariata
PROC FREQ - Descrizione
La PROC FREQ permette di calcolare le distribuzioni di frequenza univariate per variabili qualitative e quantitative discrete
PROC FREQ – Sintassi generale 1/2
proc freq data= dataset option(s);
tables variabile /option(s);
run;
Distribuzione di frequenza univariata
OPTIONS:• noprint non mostra i risultati nella finestra di output• /missing considera anche i missing nel calcolo delle frequenze
PROC FREQ – Sintassi generale 2/2
Distribuzione di frequenza univariata con variabile di classificazione
proc freq data= dataset option(s);by variabile_1;
tables variabile_2 /option(s);run;
PROC FREQ: Esempio 1
proc freq data=corso.telefonia;
table operatore;
run;
Variabile qualitativa: operatore telefonico
Output PROC FREQ
Frequenza assoluta: consiste nell’associare a ciascuna categoria, o modalità, il numero di volte in cui compare nei dati
Frequenza relativa: rapporto tra la frequenza assoluta ed il numero complessivo delle osservazioni effettuate
Frequenze
cumulate
100.002366.3615Wind
93.6422165.25154Vodafone
28.396723.3155Tim
5.08125.08123
CumulativePercent
CumulativeFrequency
PercentFrequencyoperatore
PROC FREQ: Esempio 2
proc freq data=corso.telefonia;
table fisso_g;
run;
Variabile quantitativa discreta:
numero medio giorni utilizzo alla settimana telefono fisso
Output PROC FREQ
fisso_g
fisso_g Frequency Percent CumulativeFrequency
CumulativePercent
0 27 11.44 27 11.44
0.5 9 3.81 36 15.25
1 10 4.24 46 19.49
2 19 8.05 65 27.54
3 21 8.90 86 36.44
4 14 5.93 100 42.37
5 19 8.05 119 50.42
6 9 3.81 128 54.24
7 108 45.76 236 100.00
PROC FREQ: Esempio 3
proc freq data=corso.telefonia;
table motivo_utilizzo_2 / missing;
run;
Variabile qualitativa:
secondo motivo utilizzo mezzi di comunicazione
OPZIONE missing: considera anche i missing nel calcolo delle frequenze
Output PROC FREQ
100.002368.4720Studio
91.5321654.24128Piacere/Tempo libero
37.29889.3222Partner
27.976616.9540Famigliari
11.02260.852Altro
10.172410.1724
CumulativePercent
CumulativeFrequency
PercentFrequencymotivo_utilizzo_2
MISSING
PROC FREQ: Esempio 4
proc sort data=corso.telefonia;
by sesso;
run;
proc freq data=corso.telefonia;
by sesso;
tables operatore;
run;
Distribuzione di frequenza univariata con variabile di classificazione
PROC SORT: ordinare le osservazioni in base alla variabile di by
Output PROC FREQsesso=F
operatore Frequency Percent CumulativeFrequency
CumulativePercent
3 7 7.00 7 7.00
Tim 27 27.00 34 34.00
Vodafone 63 63.00 97 97.00
Wind 3 3.00 100 100.00
sesso=M
operatore Frequency Percent CumulativeFrequency
CumulativePercent
3 5 3.68 5 3.68
Tim 28 20.59 33 24.26
Vodafone 91 66.91 124 91.18
Wind 12 8.82 136 100.00
PROC UNIVARIATE - Descrizione
La PROC UNIVARIATE permette di calcolare
• distribuzioni di frequenza univariate per variabili quantitative continue
• misure di sintesi di posizione, variabilità, forma per variabili quantitative continue
proc univariate data= dataset option(s);
var variabile;
run;
Distribuzione di frequenza univariata
PROC UNIVARIATE – Sintassi 1/2
OPTIONS:• noprint non mostra i risultati nella finestra di output
PROC UNIVARIATE – Sintassi 2/2
Distribuzione di frequenza univariata con variabile di classificazione
proc univariate data= dataset option(s);class variabile_1 (option(s));var variabile_2;
run;
OPTIONS:• noprint non mostra i risultati nella finestra di output• (missing) considera anche la categoria “missing” (contenente tutti i
valori mancanti) della variabile di classificazione
PROC UNIVARIATE – Esempio 1
Misure di sintesi della variabile quantitativa discreta numero medio sms inviati al giorno
proc univariate data=corso.telefonia;
var num_sms_e;
run;
Output PROC UNIVARIATE (1/2)
Basic Statistical Measures
Location Variability
Mean 24.31356 Std Deviation 28.46175
Median 10.00000 Variance 810.07147
Mode 10.00000 Range 100.00000
Interquartile Range 25.00000
• Media aritmetica: somma dei valori diviso il numero di valori
• Mediana: in una lista ordinata, la mediana è il valore “centrale” (50% sopra, 50% sotto)
• Moda: valore che occorre più frequentemente
Output PROC UNIVARIATE (2/2)
Quantiles (Definition 5)
Quantile Estimate
100% Max 100
99% 100
95% 100
90% 70
75% Q3 30
50% Median 10
25% Q1 5
10% 2
5% 2
1% 1
0% Min 0
• Il primo quartile, Q1, è il valore per il quale 25% delle osservazioni sono minori e 75% sono maggiori di esso
• Q2 coincide con la mediana (50% sono minori, 50% sono maggiori)
• Solo 25% delle osservazioni sono maggiori del terzo quartile
I Quartili dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori
PROC UNIVARIATE – Esempio 2
Misure di sintesi della variabile quantitativa continua numero medio ore utilizzo al giorno telefono cellulare
proc univariate data=corso.telefonia;
var cell_h;
run;
PROC UNIVARIATE – Esempio 3
Misure di sintesi della variabile numero medio ore utilizzo al giorno telefono cellulare suddivisa per sesso
proc univariate data=corso.telefonia;
class sesso;
var cell_h;
run;
PROC UNIVARIATE – Esempio 4
Misure di sintesi della variabile numero medio ore utilizzo al giorno telefono cellulare suddivisa per hobby con opzione “missing”
proc univariate data=corso.telefonia;
class hobby_3(missing);
var cell_h;
run;
SAS INSIGHT: Box Plot (1/2)
SAS INSIGHT: Box Plot (2/2)