“Metodi per la Ricerca Sociale e Organizzativa”

70
1 “Metodi per la Ricerca Sociale e Organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università degli Studi di Milano-Bicocca 2009 Simone Sarti

description

“Metodi per la Ricerca Sociale e Organizzativa”. Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università degli Studi di Milano-Bicocca 2009 Simone Sarti. LOGICA TRIVARIATA. Logica trivariata. - PowerPoint PPT Presentation

Transcript of “Metodi per la Ricerca Sociale e Organizzativa”

Page 1: “Metodi per la Ricerca Sociale e Organizzativa”

1

“Metodi per la Ricerca Sociale e Organizzativa”

Corso di Laurea in Scienze dell’OrganizzazioneFacoltà di Sociologia

Università degli Studi di Milano-Bicocca

2009Simone Sarti

Page 2: “Metodi per la Ricerca Sociale e Organizzativa”

2

LOGICA TRIVARIATA

Page 3: “Metodi per la Ricerca Sociale e Organizzativa”

3

Logica trivariata

Quando ad una relazione bivariata aggiungiamo una terza variabile operiamo un’analisi trivariata.

Page 4: “Metodi per la Ricerca Sociale e Organizzativa”

4

Perché considerare una terza variabile?

Quando consideriamo un’ipotesi causale tra due fenomeni ed empiricamente corroboriamo l’esistenza di una relazione, non possiamo tuttavia escludere che i due fenomeni non siano dovuti ad un terzo che non abbiamo preso in considerazione.

Page 5: “Metodi per la Ricerca Sociale e Organizzativa”

5

La causa di un fenomeno in senso generico può essere definita come la somma totale delle condizioni , la totalità delle contingenze alla cui realizzazione segue invariabilmente il conseguente. (Campelli 1999)

Tuttavia, “Nulla può meglio mostrare l’assenza di qualsiasi fondamento scientifico per la distinzione fra la causa d’un fenomeno e le sue condizioni della maniera capricciosa in cui scegliamo fra le condizioni quella che preferiamo chiamare causa “ (J.S.Mill)

Page 6: “Metodi per la Ricerca Sociale e Organizzativa”

6

1.Il numero di pompieri impegnati nello spegnere un incendio è correlato con la stima finale dei danni provocati dall’incendio stesso.

2.I bambini nelle cui case vi sono più finestre mostrano migliori rendimenti scolastici.

Cause ed effetti ?

Page 7: “Metodi per la Ricerca Sociale e Organizzativa”

7

1. Considerando le dimensioni dell’incendio, la relazione tra numero di vigili del fuoco e stima dei danni sparisce.

2.Considerando la ricchezza patrimoniale dei genitori, la relazione tra numero di finestre e rendimento scolastico sparisce.

Presenza di un effetto SPURIO, cioè di una terza variabile, antecedente alle due, che

è la “vera” causa della relazione!

Page 8: “Metodi per la Ricerca Sociale e Organizzativa”

8

Posizione delle variabili

Una volta ipotizzata una relazione tra due variabili X “indipendente” e Y “dipendente”, l’altra o le altre variabili considerate possono assumere quattro posizioni:

variabili antecedenti, variabili intervenienti,variabili susseguenti,variabili concomitanti.

Page 9: “Metodi per la Ricerca Sociale e Organizzativa”

9

Variabili antecedenti

Quelle variabili che nell’ordine causale precedono sia X che Y.

X Y

A

Page 10: “Metodi per la Ricerca Sociale e Organizzativa”

10

Variabili intervenienti

Quelle variabili che nell’ordine causale precedono Y ma seguono X.

X Y

I

Page 11: “Metodi per la Ricerca Sociale e Organizzativa”

11

Variabili susseguenti

Quelle variabili che nell’ordine causale seguono sia Y che X.

X Y

S

Page 12: “Metodi per la Ricerca Sociale e Organizzativa”

12

Variabili concomitantiQuelle variabili che nell’ordine causale

precedono Y ma sono correlate (senza direzione causale) ad X.

X Y

C

Page 13: “Metodi per la Ricerca Sociale e Organizzativa”

13

LOGICA degli effetti

EFFETTO SPURIO:

l’inserimento di una variabile di controllo Z, annulla la relazione tra X e Y.

X Y

Z

X Y

Page 14: “Metodi per la Ricerca Sociale e Organizzativa”

14

LOGICA degli effetti

EFFETTO SOPPRESSO:

l’inserimento di una variabile di controllo Z, rende palese la relazione tra X e Y.

X Y

Z

X Y

Page 15: “Metodi per la Ricerca Sociale e Organizzativa”

15

SCOMPOSIZIONE degli effetti

Variabili categoriali e

differenze di probabilità

Page 16: “Metodi per la Ricerca Sociale e Organizzativa”

16

ESEMPIO 1. tra variabili dicotomiche.

Incrocio tra titolo di studio e fiducia nel sistema giudiziario …

X Y

X Titolo di studio (L – H)

Y Fiducia nel sistema giudiziario (S – N)

Esempio 1

Page 17: “Metodi per la Ricerca Sociale e Organizzativa”

17

… controllato per la variabile antecedente Z

X Y

Z

Z Coorte di nascita (G – A)

Esempio 1

Page 18: “Metodi per la Ricerca Sociale e Organizzativa”

18

Effetto bivariato XY= Effetto causale netto + Effetto spurio

dyx = dyx.z + d(yx)z

Esempio 1

X Y

Z

X Y

dyx.z

dyx

d(yx)z

Page 19: “Metodi per la Ricerca Sociale e Organizzativa”

19

Fonte: EB 60.1 Italia (30 e più anni)

Tavola di contingenza educ * fidu

231 299 530

43.6% 56.4% 100.0%

90 65 155

58.1% 41.9% 100.0%

321 364 685

46.9% 53.1% 100.0%

Conteggio

% entro educ

Conteggio

% entro educ

Conteggio

% entro educ

1 Medio-bassa

2 Alta

educ

Totale

1 Si 2 No

fidu

Totale

Esempio 1

Page 20: “Metodi per la Ricerca Sociale e Organizzativa”

20

dyx Effetto bivariato: educaz. e fiducia giustizia

In un incrocio dicotomico l’effetto bivariato è misurabile attraverso una semplice differenza di probabilità.

dyx equivale alla differenza di probabilità sull’avere fiducia nella giustizia dato l’avere un titolo di studio alto piuttosto che basso.

Esempio 1

Page 21: “Metodi per la Ricerca Sociale e Organizzativa”

21

dyx Effetto bivariato: educaz. e fiducia giustizia

Pr (Y=1 | X=2) – Pr (Y=1 | X=1)

Equivale alla probabilità che la variabile Y assuma valore y, dato che la variabile X assume valore x: Pr (Y=y | X=x)

La categoria di riferimento è la “SI” (Y=1).

dyx = 0,581 - 0,436 = 0,145

Esempio 1

Page 22: “Metodi per la Ricerca Sociale e Organizzativa”

22

dyx = 0,581 - 0,436 = 0,145

La relazione tra possesso della laurea (piuttosto che un titolo di studio inferiore) e fiducia nella giustizia (“si” piuttosto che “no”) è positiva.

Esempio 1

Page 23: “Metodi per la Ricerca Sociale e Organizzativa”

23

Tavola di contingenza educ * fidua

119 161 280

42.5% 57.5% 100.0%

64 44 108

59.3% 40.7% 100.0%

183 205 388

47.2% 52.8% 100.0%

Conteggio

% entro educ

Conteggio

% entro educ

Conteggio

% entro educ

1 Medio-bassa

2 Alta

educ

Totale

1 Si 2 No

fidu

Totale

eta = 1 Giovania.

GIOVANI Z=1

Tavola di contingenza educ * fidua

112 138 250

44.8% 55.2% 100.0%

26 21 47

55.3% 44.7% 100.0%

138 159 297

46.5% 53.5% 100.0%

Conteggio

% entro educ

Conteggio

% entro educ

Conteggio

% entro educ

1 Medio-bassa

2 Alta

educ

Totale

1 Si 2 No

fidu

Totale

eta = 2 Anziania.

ANZIANI Z=2

Esempio 1

Page 24: “Metodi per la Ricerca Sociale e Organizzativa”

24

Effetti condizionati di Z

Considerando Z, troviamo diversi effetti di X su Y.

dyx|z=1 = 0,593 -0,425 = 0,168

dyx|z=2 = 0,553 -0,448 = 0,105

Esempio 1

Page 25: “Metodi per la Ricerca Sociale e Organizzativa”

25

Effetto condizionato complessivo di Z

Considerando che le numerosità in Z tra giovani ed anziani sono diverse, occorre ponderare gli effetti condizionati.

Giovani= 388/685 = 0,567 quota di giovani (qg)

Anziani= 297/685 = 0,433 quota di anziani (1 - qg)

dyx.z = (0,168*0,567) + (0,105*0,433) = 0,141

Esempio 1

Page 26: “Metodi per la Ricerca Sociale e Organizzativa”

26

Effetto bivariato = Effetto causale + Effetto spurio

dyx = dyx.z + d(yx)z

d(yx)z =dyx – dyx.z = 0,145 – (0,141) = 0,004

d(yx)z Effetto spurio

Esempio 1

Page 27: “Metodi per la Ricerca Sociale e Organizzativa”

27

L’effetto della variabile Z è sostanzialmente nullo, ossia la relazione tra titolo di studio e fiducia nella giustizia permane immutata anche a parità di fascia d’età. Non c’è effetto SPURIO.

X Y

Z

+

~ 0 ~ 0

Esempio 1

Page 28: “Metodi per la Ricerca Sociale e Organizzativa”

28

ESEMPIO 2. tra variabili dicotomiche.

Incrocio tra genere e fiducia nei sindacati …

X Y

X Genere (M - F)

Y Fiducia nei sindacati (S - N)

Esempio 2

Page 29: “Metodi per la Ricerca Sociale e Organizzativa”

29

… controllato per la variabile interveniente I condizione occupazionale

(occupato/non occupato)

X Y

I

Z Condizione occupazionale (O - D)

Esempio 2

Page 30: “Metodi per la Ricerca Sociale e Organizzativa”

30

Effetto bivariato XY = Effetto diretto + Effetto indiretto

dyx = c + a*b

X Y

I

a b

c

Esempio 2

Page 31: “Metodi per la Ricerca Sociale e Organizzativa”

31

SI NO

M 31,7 68,3

F 23,3 76,7

N=1000

Esempio 2

Page 32: “Metodi per la Ricerca Sociale e Organizzativa”

32

dyx Effetto bivariato: genere e fiducia nei sindacati

In un incrocio dicotomico l’effetto bivariato è misurabile attraverso una semplice differenza di probabilità.

dyx equivale alla differenza di probabilità sull’avere fiducia nei sindacati dato l’essere femmina piuttosto che maschio.

Esempio 2

Page 33: “Metodi per la Ricerca Sociale e Organizzativa”

33

dyx Effetto bivariato: genere e fiducia nei sindacati

Pr (Y=1 | X=2) – Pr (Y=1 | X=1)

Equivale alla probabilità che la variabile Y assuma valore y, dato che la variabile X assume valore x: Pr (Y=y | X=x)

La categoria di riferimento è la “SI” (Y=1).

dyx = 0,233 - 0,317 = -0,084

Esempio 2

Page 34: “Metodi per la Ricerca Sociale e Organizzativa”

34

dyx = 0,233 - 0,317 = -0,084

La relazione tra genere (essere femmina piuttosto che maschio) e fiducia nei sindacati (“si” piuttosto che “no”) è negativa.

Esempio 2

Page 35: “Metodi per la Ricerca Sociale e Organizzativa”

35

NON OCCUPATI I=2

OCCUPATI I=1

SI NO

M 33,9 66,1

F 30,8 69,2

SI NO

M 12,5 87,5

F 9,5 90,5

Ni=1=750

Ni=2=250

Esempio 2

Page 36: “Metodi per la Ricerca Sociale e Organizzativa”

36

Effetti condizionati di I

Considerando I, troviamo diversi effetti di X su Y.

dyx|i=1 = 0,308 - 0,339 = -0,031

dyx|i=2 = 0,095 -0,125 = -0,030

Esempio 2

Page 37: “Metodi per la Ricerca Sociale e Organizzativa”

37

Effetto diretto c a parità di I

Considerando che le numerosità in I nella condizione occupazionale sono diverse, occorre ponderare gli effetti condizionati.

Occupati= 750/1000 = 0,750 quota occupati (qo)

Non occupati= 250/1000 = 0,250 quota non occupati (1-qo)

dyx.i = (-0,031*0,750) + (-0,030*0,250) = -0,031

Esempio 2

Page 38: “Metodi per la Ricerca Sociale e Organizzativa”

Effetto bivariato XY = Effetto diretto + Effetto indiretto

dyx = c + a*b

Effetto indiretto = -0,084 - (-0,031) = -0,053

-0,084 = -0,031 + Effetto indiretto

Esempio 2

X Y

I

a b

c

Page 39: “Metodi per la Ricerca Sociale e Organizzativa”

39

L’effetto indiretto della variabile I (occupazione) è circa due terzi (-0,053 di -0,084) dell’effetto complessivo tra genere e fiducia nei sindacati. Ciò significa che la tendenza a mostrare sfiducia nei sindacati da parte delle femmine è dovuta in buona parte alla condizione occupazionale.

X Y

I

c = -0,031

X Y-0,084

a*b = -0,053

Esempio 2

Page 40: “Metodi per la Ricerca Sociale e Organizzativa”

40

SCOMPOSIZIONE degli effetti

Le correlazioni

Page 41: “Metodi per la Ricerca Sociale e Organizzativa”

41

Ipotizziamo che la variabile Z influenzi la relazione tra Y e X.

Come misurare l’effetto di X su Y al netto di Z ?

X Y

Z

X YZYXr .

YXr

Page 42: “Metodi per la Ricerca Sociale e Organizzativa”

42

XY

YXYX SS

Sr

Correlazioni tra le variabili:

X Y

ZX Z Y

X 1.453

.322

Z .453

1.596

Y .322

.596

1

Matrice di correlazione, r.. osservati

ZYXr .

XZ

XZXZ SS

Sr

YZ

YZYZ SS

Sr

Page 43: “Metodi per la Ricerca Sociale e Organizzativa”

43

22.11 YZXZ

YZXZYXZYX

RR

rrrr

E’ possibile calcolare il coefficiente di correlazione parziale tra X e Y “tenendo

costante” Z:

Page 44: “Metodi per la Ricerca Sociale e Organizzativa”

44

Coefficiente di correlazione parziale tra X e Y “tenendo costante” Z:

Correlazione lorda Correlazione di Z su X e Y

Residui di Z-X e Z-Y

22.11 YZXZ

YZXZYXZYX

RR

rrrr

Più la Z spiega X eY, più grande è il denominatore

Misura quanto Z spiega di X eY

Page 45: “Metodi per la Ricerca Sociale e Organizzativa”

45

X Y

Z

X Z Y

X 1.453

.322

Z .453

1.596

Y .322

.596

1

Matrice di correlazione, r.. osservati

E’ possibile calcolare il coefficiente di correlazione parziale tra X e Y “tenendo

costante” Z:

ZYXr .

073,011 22.

YZXZ

YZXZYXZYX

RR

rrrr

073,0. ZYXr322,0YXr

Page 46: “Metodi per la Ricerca Sociale e Organizzativa”

46

X Y

Z

ZYXr .

073,0. ZYXr322,0YXr

La correlazione tra X e Y tenendo sotto controllo Z diventa praticamente nulla.

Page 47: “Metodi per la Ricerca Sociale e Organizzativa”

47

Correlations

1 -.247** .168**

. .000 .000

1414 1414 1414

-.247** 1 .211**

.000 . .000

1414 1414 1414

.168** .211** 1

.000 .000 .

1414 1414 1414

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

Pearson Correlation

Sig. (2-tailed)

N

eta

ascoli Anni di scolarità

reddito Redditomensile (euro)

etaascoli Annidi scolarità

reddito Redditomensile(euro)

Correlation is significant at the 0.01 level (2-tailed).**.

Correlazioni fra tre variabili

Calcolare la correlazione parziale tra anni di scolarità e reddito

Page 48: “Metodi per la Ricerca Sociale e Organizzativa”

48

SCOMPOSIZIONE degli effetti

Regressione e correlazione

Page 49: “Metodi per la Ricerca Sociale e Organizzativa”

49

Y

X1

Ipotizziamo un’antecedenza (lineare) causale:

X2

22110 XbXbbY

11 YXbb

22 YXbb

Page 50: “Metodi per la Ricerca Sociale e Organizzativa”

50

La regressione trivariataLa covariazione tra le variabili indipendenti X e la dipendente Y può essere ricostruita attraverso una figura complessa chiamata iperpiano.

La regressione stima i valori dei parametri a e b che minimizzano i valori osservati e quelli predetti che costituiscono l’iperpiano.

Più tecnicamente la regressione minimizza la somma degli errori di predizione al quadrato.

Page 51: “Metodi per la Ricerca Sociale e Organizzativa”

51

La regressione trivariataIl valore α esprime il valore predetto di Y, quando tutti i regressori Xk sono uguali a 0.

I valori bk rappresentano la variazione (gli effetti) apportati dalle rispettive variabili Xk al netto degli effetti delle altre variabili incluse nel modello.

O anche:

“a parità di ogni altra condizione considerata”.

Page 52: “Metodi per la Ricerca Sociale e Organizzativa”

52

Assunti per la regressione trivariata a partire dai coefficienti campionari

1.Relazione lineare tra variabili dipendenti ed indipendenti.

2. Gli errori sono: -distribuiti normalmente, -il valore atteso è zero, -hanno varianze costanti (omoschedasticità),-sono tra loro indipendenti,

Page 53: “Metodi per la Ricerca Sociale e Organizzativa”

53

Pesi di correlazione e causazione

Esistono legami bidirezionali, che si sostanziano in “coefficienti di correlazione” e legami unidirezionali (o causali) che si sostanziano in coefficienti di regressione.

Page 54: “Metodi per la Ricerca Sociale e Organizzativa”

54

Esempio di modello causale (regressione)

X1

X2

Y

X1 X2 Y

X1 1.453

.322

X2.453

1.596

Y .322

.596

1

Matrice di correlazione, r.. osservati

0.453

21 566.0065.0ˆ XXY eY

Stime effettuate con il metodo dei minimi quadrati

Coefficienti standardizzati

*1b

*2b

Page 55: “Metodi per la Ricerca Sociale e Organizzativa”

55

Coefficiente di determinazione multiplo

2121

*2

*1

2YXYXXXY rbrbR

Il coefficiente di determinazione multiplo della variabile Y, è dato dall’insieme degli effetti beta delle variabili X che agiscono direttamente su essa, pesate per la correlazione osservata tra le X e la Y.

In sostanza R2 è la somma degli effetti netti tra le X e la Y.

Page 56: “Metodi per la Ricerca Sociale e Organizzativa”

56

Esempio di modello causale (regressione)

X1 X2 Y

X1 1.453

.322

X2.453

1.596

Y .322

.596

1

Matrice di correlazione

2121

*2

*1

2. YXYXXXY rbrbR

801.01 2

. 21

XXYe RpY

21 566.0065.0ˆ XXY

596.0566.0322.0065.02. 21

XXYR

358.02. 21

XXYR

Page 57: “Metodi per la Ricerca Sociale e Organizzativa”

57

Analisi dei coefficienti di regressione std

Essendo std i beta possono essere confrontati direttamente. I due effetti sono positivi, ma l’effetto di X2 è molto più intenso.

Precisamente l’aumento di una unità di X2 corrisponde all’aumento di 0.566 deviazioni standard di Y.

Una unità di X produce solo lo 0,065 di aumento in Y.

21 566.0065.0ˆ XXY

X1

X2

Y0.453

065,0*1 b

566,0*2 b

Page 58: “Metodi per la Ricerca Sociale e Organizzativa”

58

X1

X2

Y

X1 X2 Y

X1 1.453

.322

X2.453

1.596

Y .322

.596

1

Matrice di correlazione r..

0.453

358.02121

*2

*1

2. YXYXXXY rbrbR

801.01 2. 21

XXYe RpY

21 566.0065.0ˆ XXY

065,0*1 b

566,0*2 b

Page 59: “Metodi per la Ricerca Sociale e Organizzativa”

59

Analisi dei residui

801.01 2. 21

XXYe RpY

Ciò significa che le variabili antecedenti del modello (X1 e X2 nel-l’esempio) contribuiscono a spiegare circa un terzo della varianza di Y.

358.02121

*2

*1

2. YXYXXXY rrR

Il peso causale del fattore residuale è 0,801.

La correlazione con “altre” cause pesa 0,801.

Page 60: “Metodi per la Ricerca Sociale e Organizzativa”

60

REGRESSIONE TRIVARIATA

UN’APPLICAZIONE

Page 61: “Metodi per la Ricerca Sociale e Organizzativa”

61

Y

X1

Ipotizziamo un’antecedenza (lineare) causale:

X2

22110 XbXbbY

11 YXbb Anni scolarità padre

Anni scolarità madre

Anni scolarità figlio

22 YXbb

Page 62: “Metodi per la Ricerca Sociale e Organizzativa”

62

Regressione trivariata

X1

X2

Y

Matrice di correlazione, r.. osservati

0.716

b1

b2

eY

Stime effettuate con il metodo dei minimi quadrati

Correlazioni

1 .716** .499**

.000 .000

1082 1082 1082

.716** 1 .461**

.000 .000

1082 1082 1082

.499** .461** 1

.000 .000

1082 1082 1082

Correlazione di Pearson

Sig. (2-code)

N

Correlazione di Pearson

Sig. (2-code)

N

Correlazione di Pearson

Sig. (2-code)

N

AS_pa

AS_ma

ascoli

AS_pa AS_ma ascoli

La correlazione è significativa al livello 0,01 (2-code).**.

21 251,0353,0567,7ˆ XXY

Page 63: “Metodi per la Ricerca Sociale e Organizzativa”

63

21 251,0353,0567,7ˆ XXY

Coefficientia

7.567 .213 35.503 .000

.353 .038 .347 9.320 .000

.251 .044 .212 5.707 .000

(Costante)

AS_pa

AS_ma

Modello1

B Errore std.

Coefficienti nonstandardizzati

Beta

Coefficientistandardizzati

t Sig.

Variabile dipendente: ascolia.

21 212,0347,0ˆzzZ XXY

Page 64: “Metodi per la Ricerca Sociale e Organizzativa”

64

Varianza spiegata dal modello

270.02121

*2

*1

2. YXYXXXY rbrbR

533.01 2. 21

XXYe RpY

Il peso causale del fattore residuale è 0,801.

La correlazione con cause terze pesa 0,801.

Page 65: “Metodi per la Ricerca Sociale e Organizzativa”

65

Riepilogo del modello

.521a .271 .270 3.464Modello1

R R-quadratoR-quadrato

correttoErrore std.della stima

Stimatori: (Costante), AS_ma, AS_paa.

Page 66: “Metodi per la Ricerca Sociale e Organizzativa”

66

L’effetto di interazione

Page 67: “Metodi per la Ricerca Sociale e Organizzativa”

67

L’effetto di interazione

Quando l’effetto causale esercitato dalla variabile indipendente X sulla variabile indipendente Y si manifesta in modi diversi a seconda del valore assunto dalla variabile di controllo Z.

X Y

Z

Page 68: “Metodi per la Ricerca Sociale e Organizzativa”

68

0 1

1 3

0 1

0 00 0

1 3

Z=0 Z=1

X=0

X=0 X=0

X=1

X=1 X=1

Y=0 Y=1

Y=0 Y=1 Y=0 Y=1

Page 69: “Metodi per la Ricerca Sociale e Organizzativa”

69

X

Y

X

Y

X

Y

Z=0 Z=1

Effetto di interazione di Z (dicotomica) su X e Y (cardinali)

β>0

βz=0>0 βz=1<0

Page 70: “Metodi per la Ricerca Sociale e Organizzativa”

70

Esempi di effetti di interazione (titolo*età)