28/10/2015
1
Metodi statistici per le ricerche di mercato
Prof.ssa Isabella MingoA.A. 2015-2016
Facoltà di Scienze Politiche, Sociologia, Comunicazione
Corso di laurea Magistrale in «Organizzazione e marketing per la comunicazione d'impresa»
Indici di associazione per caratteri ordinati • Se la tabella si riferisce a caratteri ordinati è possibile costruire
indici che oltre a misurare l’intensità dell’associazione nemisurano il verso.
• Tra due caratteri ordinati possono sussistere due tipi direlazioni:– Relazione diretta (concordanza): a modalità di ordine
elevato di un carattere corrispondono più frequentementemodalità di ordine elevato dell’altro carattere.
– Relazione inversa (discordanza): a modalità elevate di uncarattere corrispondono modalità di ordine basso dell’altrocarattere e viceversa.
28/10/2015
2
Indici di concordanza e discordanza
• Possono assumere :– valori positivi , nel caso di concordanza tra i caratteri– valori negativi , nel caso di discordanza
• I più noti:– Indice Gamma di Goodman e Kruskal– Indice b di Kendall– Indice d di Sommer– Indice rho di Spearman
Tali indici variano fra -1 e 1zero indica assenza di associazione +1 indica che l’ordinamento dei due caratteri è sempre concorde-1 indica che l’ordinamento è sempre discorde.valori prossimi a 1 in valore assoluto indicano forte relazione
Indice rho di Spearman
• E’ un indice di cograduazione tra graduatorie, particolarmente indicato quando i caratteri ordinati presentano un numero elevato di modalità.
• Per calcolare l’indice è necessario ordinare gli individui in senso decrescente per ognuno dei due caratteri e attribuire il rango.
• L’indice si definisce come:
dove d indica la differenza tra i ranghi cioè i posti nelle due graduatorie ordinate.
• L’indice assume valori tra -1 e + 1- Il valore 0 implica indipendenza tra x e y– L’opposta graduatoria ( = -1) implica discordanza tra x e y .– E’ uguale ad 1 quando le unità presentano lo stesso rango in
entrambe le graduatorie cioè nel caso di perfetta cograduazione.
28/10/2015
3
Cograduazione: esempio
Misure simmetriche
-,779-,779
-,931
20
Tau-b di KendallGammaCorrelazione diSpearman
Ordinale perordinale
N. di casi validi
Valore
Piemonte 5 12 -7 49Valled'Aosta 1 18 -17 289
Liguria 12 9 3 9Lombardia 4 16 -12 144TrentinoAlto Adige 3 20 -17 289
FriuliVeneziaGiulia
9 15 -6 36
Veneto 6 19 -13 169EmiliaRomagna 2 17 -15 225
Marche 7 14 -7 49Toscana 8 13 -5 25Umbria 10 11 -1 1Lazio 11 8 3 9Campania 18 3 15 225Abruzzo 14 10 4 16Molise 13 7 6 36Puglia 19 5 14 196Basilicata 16 6 10 100Calabria 17 1 16 256Sicilia 20 2 18 324Sardegna 15 4 11 121
2568
12
345
6
78
91011121314151617181920
Livelloterritorale
grad.attiv.femm.
grad.Tassodisocc. d d2 = 1 – [6*2568)/20*(400-1)] =-0,931
Esercizio
I. Mingo 2015-2016
Calcolare il coefficiente di graduazione tra le valutazionidei clienti riguardo all’ assistenza post vendita e allaconsulenza alla vendita rilevate per ripartizionegeografica
calcoli
28/10/2015
4
Indici di concordanza e discordanza : uso del software
I. Mingo 2015-2016
Rmer 2015-2016
Indici di concordanza e discordanza: uso del software
Anche per la correlazione di Spearman esistono dei test statistici per verificare se la correlazione calcolataè stata casualmente estratta da una popolazione con correlazione nulla. Di questi test ci occuperemo nella parte sulla statistica inferenziale.
28/10/2015
5
Un grafico per studiare la relazione tra caratteriquantitativi: lo Scatter-Plot o Grafico diDispersione Rappresenta la distribuzione unitaria doppia di 2 caratteri
quantitativi
Sull’asse delle ascisse (X) e su quello delle ordinate (Y)sono riportati rispettivamente i valori numerici dellemodalità assunti dalle due variabili rilevate su ogni u.s.
L’insieme di punti così ottenuto si chiama nuvola di puntie consente di studiare la dispersione delle u.s. e la lorosomiglianza
La forma della nuvola può suggerire l’esistenza e la formadella relazione tra i due caratteri
Rmer 2015-2016
Esempio
Distribuzione Unitaria Doppia
Unità Statistica
VenditeSpesa per
pubblicità su radio e TV
1 973 02 1119 03 875 254 625 255 910 306 971 307 931 358 1177 359 882 40
10 982 4011 1628 4512 1577 4513 1044 5014 914 5015 1329 5516 1330 5517 1405 6018 1436 6019 1521 6520 1741 6521 1866 7022 1717 70
Scatter Plot
0
500
1000
1500
2000
0 10 20 30 40 50 60 70 80
Spesa per pubblicità radio e TV
Vend
ite
U.S
Rmer 2015-2016
28/10/2015
6
Interdipendenza tra due caratteri quantitativi
• Si considera la distribuzione unitaria di 2 caratteri quantitativi X e Y
• Si analizza l’associazione dei due caratteri attraverso l’analisi dello scatter plot o mediante indici simmetrici che valutano la presenza di Concordanza: u.s. con valori piccoli (grandi) di un
carattere presentano più frequentemente valori piccoli (grandi) dell’altro carattere
Discordanza: u.s. con valori piccoli (grandi) di un carattere possiedono più frequentemente valori grandi (piccoli) dell’altro carattere
.. .si puo analizzare l’interdipendenza graficamente
1. Concordanza: nuvola allungata verso alto a destra
2. Discordanza: nuvola allungata verso alto a sinistra
3. Assenza di interdipendenza lineare: punti sparsi
Relazione diretta (concordanza)
05
10152025303540
0 2 4 6 8 10 12 14
Variabile X
Var
iabi
le Y
Relazione inversa (discordanza)
-20
-15
-10
-5
0
5
10
0 2 4 6 8 10 12 14
Variabile X
Varia
bile
Y
28/10/2015
7
Interdipendenza tra due caratteri quantitativi
• Per misurare il legame che esiste tra due caratteri quantitativi si utilizza la covarianza, definita come la media dei prodotti degli scostamenti delle variabili X e Y dalle rispettive medie:
n
MyMxn
iyixi
xy
1
)()(
Questo valore sarà :•Nullo nel caso di indipendenza statistica•Positivo in caso di concordanza perché al crescere della X anche la Y crescerà di conseguenza le differenze avranno lo stesso segno.•Negativo in caso di discordanza, perché all’aumentare della X corrisponderà una diminuzione della Y e viceversa.•se dividiamo la covarianza per il prodotto delle deviazioni standard delle 2 variabili, otteniamo un valore standardizzato, che oscilla fra –1 e +1: il coefficiente di correlazione r di Pearson
IL Coefficiente di correlazione lineare di Bravais e Pearson
• è una misura della relazione lineare esistente tra due variabili ovvero una misura della l’interdipendenza che esiste tra le due distribuzioni.
r misura una relazione simmetrica di tipo lineare cha varia tra -1 e +1 . Convenzionalmente:
28/10/2015
8
Rappresentare graficamente la relazione tra vendite e spese per pubblicità. Che cosa si può dedurre?Calcolare il coefficiente di correlazione tra i due caratteri .
I. Mingo 2015-2016
Esercizio
Step per calcolare il coefficiente di correlazione
FSSC
1. Calcolare la media aritmetica di ciascun carattere2. Calcolare per ciascuna modalità di ciascun carattere gli
scarti dalla rispettiva media3. Ottenere la covarianza
• Moltiplicare per ciascuna modalità gli scarti dei due caratteri ottenuti al punto 2.
• Sommare i prodotti così ottenuti.• Dividere questa somma dei prodotti per il numero di unità
statistiche.4. Ottenere gli scarti quadratici medi
• Elevare al quadrato gli scarti dalla media di ciascuna modalità• Sommare per ogni carattere i quadrati così ottenuti• Dividere ciascuna di queste somme per il numero di unità
statistiche per ottenere le varianze.• Estrarre le radici quadrate per ottenere gli scarti quadratici
medi-
5. Ottenere r1. Dividere la covarianza (ottenuta al punto 3) per il prodotto degli
scarti quadratici medi dei due caratteri (ottenuti al punto 4).
28/10/2015
9
Correlazione e relazione lineare
I. Mingo 2015-2016
Correlazione e relazione lineare
r=0,976r=0,002
Le caratteristiche dei punti-unità espresse dalledue variabili (le due dimensioni del pianocartesiano) possono essere riassunte da unasola la retta.
Non è possibile individuare una rettache riassuma le due variabili poichéesse sono indipendenti.
I. Mingo 2015-2016
28/10/2015
10
Correlazione: esempi
Correlazioni
-,897 ,976 -,337
-682,661 2617,602 -45,033
-35,930 137,769 -2,37020 20 20
Correlazione di PearsonSomma dei quadrati edei prodotti incrociatiCovarianzaN
tasso didisocc.
Tasso diattività delle
donne
Tasso didisoccupazion
e giovanile
Minorennidenunciati
per 100minorenni
in età 14-17anni
Tasso di disoccupazione
3020100
Tass
o di
atti
vità
del
le d
onne
50
40
30
20
Tasso di disoccupazione
3020100
Tass
o di
dis
occu
pazio
ne g
iova
nile
70
60
50
40
30
20
10
0
Tasso di disoccupazione
3020100
Min
oren
ni d
enun
ciat
i per
100
min
oren
ni
6
5
4
3
2
1
Uso del software : la correlazione
I. Mingo 2015-2016
28/10/2015
11
Analisi della dipendenza lineare tra due variabili quantitative
I. Mingo 2015-2016
• L’analisi della dipendenza è asimmetrica: date due variabiliquantitative, X e Y, si è interessati a studiare se e in che misura lavariabile Y (variabile dipendente ) sia influenzata dalla X (variabileindipendente).
• Scelta la variabile indipendente X e quella dipendente Y, la rappresentazione grafica della distribuzione unitaria doppia di tali variabili attraverso il grafico di dispersione, consente di individuare la eventuale relazione lineare tra X ed Y.
• Si è visto che è’ possibile tracciare una retta, detta interpolante, tra i punti dello scatterplot tale che si avvicini a tutti i punti riproducendo, con una certa approssimazione, la nuvola.
I. Mingo 2015-2016
La funzione di una retta è la seguente:Y=a+bX
dove:• a è l’intercetta della retta sull’asse delle ordinate Y, cioè è il punto in
cui la retta interseca l’asse Y e quindi è il valore di Y che corrisponde ad un valore di X=0;
• b è il coefficiente angolare della retta , cioè il valore che indica la sua inclinazione. Se b>0 la retta è ascendente, ossia inclinata dal basso a sinistra verso l’alto a destra; se b<0 la retta è discendente, ossia inclinata dal basso a destra verso l’alto a sinistra.
Nello studio empirico della relazione di dipendenza lineare tra X ed Y l’obiettivo è quello di individuare per ciascun punto Pi un nuovo punto che sia il più vicino possibile al punto Pi pur giacendo sulla retta che passa nella nuvola di punti.
La funzione della retta
28/10/2015
12
I. Mingo 2014-2015
La differenza tra il valore yi osservato e quello teorico è definito residuo
La funzione della retta interpolante
La migliore retta individuabile è quella che rende minimi tali residui
La relazione lineare tra X e Y e la retta di regressione
I. Mingo 2014-2015
Come individuare questa retta?Secondo il metodo dei minimi quadrati la migliore retta è quella che
rende minima la somma dei quadrati dei residui: questa retta vienechiamata retta di regressione.
28/10/2015
13
Come si calcola la retta di regressione: che cosa sono i parametri a e b?
I. Mingo 2014-2015
Il coefficiente di regressione e il coefficiente di correlazione
•
I. Mingo 2015-2016
28/10/2015
14
Come si interpreta Il coefficiente di regressione
•
I. Mingo 2015-2016
푦푖 = −2,46 + 1,19푥푖
EsercizioRiprendendo la tabella 5 dell’esercizio precedente calcolare il coefficiente di regressione tra le vendite (variabile dipendente) e le spese in pubblicità (variabile indipendente), e l’intercetta della retta di regressione. Scrivere l’equazione della retta di regressione.
b=20,03/16,81=1,19
푎 = 푀(푌) − 푏푀(푋) a=10,83-(1,19*11,17)=-2,4623
Top Related