-1cm Corso di Psicometria Progredito - 5. La correlazione lineare · 2016. 1. 22. · -1cm Corso di...

32
Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013 - 2014

Transcript of -1cm Corso di Psicometria Progredito - 5. La correlazione lineare · 2016. 1. 22. · -1cm Corso di...

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Corso di Psicometria Progredito5. La correlazione lineare

    Gianmarco AltoèDipartimento di Pedagogia, Psicologia e Filosofia

    Università di Cagliari, Anno Accademico 2013 - 2014

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Sommario

    1 Tipi di relazione tra 2 variabili quantitative

    2 Covarianza e correlazione

    3 Un esempio completo

    4 Un esercizio

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Covariazione e causazione

    Abbiamo una covariazione quando semplicementeosserviamo che due variabili X e Y presentano variazioniconcomitanti: al variare di una varia l’altra.

    Si ha invece causazione quando ipotizziamo che unavariazione di X produca una variazione di Y .

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Esempio di covariazione

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Covariazione

    Attenzione ai termini:

    covariazione: è il termine generale che indica il fenomeno(sinonimo di associazione). Si riferisce quindi sia allarelazione tra variabili quantitative che categoriali.

    covarianza: misura assoluta della covariazione tra duevariabili quantitative. (non ha un minimo e un massimo,dipende dall’unità di misura delle variabili).

    correlazione: misura standardizzata della covariazione tradue variabili quantitative. (varia tra -1 e 1, è indipendentedall’unità di misura delle variabili).

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Esempio di causazione

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Tipi di relazioni causali

    Esistono vari tipi di relazioni causali:

    relazione diretta

    relazione reciproca

    relazione spuria

    relazione indiretta (mediazione)

    relazione condizionata (moderazione o interazione)

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Relazione diretta

    Si tratta della relazione causale di primo ed immediatointeresse da parte del ricercatore.

    Due variabili X e Y sono legate da una relazione causalediretta quando un mutamento nella variabile causa (X)produce un mutamento nella variabile effetto (Y ).

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Relazione reciproca

    Quando viene meno la distinzione fra variabile causa eeffetto, quando le variabili si influenzano reciprocamente,quando in sostanza viene meno l’asimmetria del rapporto traX e Y si parla di relazione causale reciproca.

    Altri termini usati per indicare una relazione reciproca sono:retroazione, simultaneità e mutua relazione.

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Relazione spuria

    Il caso della relazione spuria è il caso classico di presenza dicovariazione pur in assenza di causazione.

    Nella ricerca, le relazioni spurie non sono sempre semplici darilevare!!

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Relazione indiretta o mediazione

    Abbiamo una relazione causale indiretta fra X e Y quando illoro legame causale è mediato da una terza variabile Z (Zfunge da ponte tra X e Y ).

    Si parla di relazione indiretta totale quando tutto l’effetto diX su Y è mediato da Z, mentre si parla di relazione indirettaparziale quando X agisce su Y sia direttamente cheattraverso Z.

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Relazione condizionata o moderazione

    Si parla di relazione condizionata quando la relazione tra duevariabili X e Y

    cambia (è moderata) da una terza variabile Z. E’ il classicocaso di interazione: l’effetto di X su Y dipende dai livelli di Z.

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Leggere BENE le avvertenze ... prima dell’uso!

    Soprattutto nei fenomeni studiati in psicologia, le relazionitra variabili sono molto complesse. Trarre conclusioni daanalisi bivariate, per altro utilissime a livello esplorativo, puòportare a errori di valutazione considerevoli. Quando èpossibile è certamente preferibile utilizzare approccimultivariati.

    Nel provare la causalità di una relazione è determinantel’ipotesi teorica del ricercatore. Un modello statistico dasolo, non può mai provare la causalità di una relazione!

    Al limite, un modello statistico può suggerire l’assenza di unarelazione causale . . . ma mai provarne l’esistenza!

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    La covarianza

    Date due variabili quantitative X e Y si definisce covarianzatra X e Y la seguente quantità:

    σXY =

    ∑ni (Xi −X)(Yi − Y )

    n

    mentre la stima della covarianza della popolazione sulla basedei dati campionari è:

    sXY =

    ∑ni (Xi −X)(Yi − Y )

    n − 1

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    La covarianzaLa covarianza consente di valutare se tra due variabili quantitative X eY esiste un legame lineare e di valutare se tale legame è positivo onegativo o nullo:

    covarianza > 0:prevalenza di unità statistiche per le quali scartipositivi dei valori di X sono associati a scarti positivi dei valori di Ye scarti negativi dei valori di X sono associati a scarti negativi neivalori di Y. Covariazione positiva, all’aumentare di una variabile èassociato un aumento dell’altra.

    covarianza < 0: prevalenza di unità statistiche per le quali scartipositivi dei valori di X sono associati a scarti negativi dei valori di Ye scarti negativi dei valori di X sono associati a scarti positivi neivalori di Y. Covariazione negativa, all’aumentare di una variabile èassociata una diminuzione dell’altra.

    covarianza = 0: non esiste associazione tra scarti sulla X e scartisulla Y. Covariazione nulla, non esiste associazione lineare.

    ... vediamolo graficamente :-) !

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Grafico a dispersione nel caso di covarianza positiva

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Grafico a dispersione nel caso di covarianza negativa

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Grafico a dispersione nel caso di covarianza nulla

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    La correlazione

    La covarianza è un indice che dipende dalla unità di misuradelle variabili considerate.

    E’ utile però poter disporre di un indice relativo dicovariazione che sia indipendente dall’unità di misura dellevariabili e che sia quindi maggiormente interpretabile.

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    La correlazione

    Dalla teoria sappiamo che:

    −σXσY ≤ σXY ≤ σXσY

    Possiamo quindi costruire un indice relativo, dettocoefficiente di correlazione di Bravais-Pearson,semplicemente dividendo tutti i membri della disequazioneper il reciproco del prodotto delle deviazioni standard.

    ρ =σXYσXσY

    Tale indice naturalmente varierà tra -1 e 1.

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Il coefficiente di correlazione lineare diBravais-Pearson

    Il coefficiente di correlazione lineare di Bravais Pearson misura iltipo e l’intensità della relazione lineare tra due variabili X e Y .

    Esso si indica con:

    con la lettera greca ρ se viene calcolato su tutta lapopolazione oggetto dell’indagine;

    con la lettera r se viene calcolato su un campionerappresentativo della popolazione.

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Il coefficiente di correlazione lineare varia tra -1 e 1

    Il segno di r (+ o -) da informazioni sul tipo di relazione:

    il segno positivo indica che le due variabili aumentano odiminuiscono assieme (relazione lineare positiva)

    il segno negativo indica che all’aumentare di una variabilel’altra diminuisce e viceversa (relazione lineare negativa)

    Il valore assoluto di r, che varia tra 0 e 1, da informazioni sullaforza della relazione lineare:

    è massimo (assume valore 1) quando esiste una perfettarelazione lineare tra le due variabili.

    tende a ridursi al diminuire dell’intensità della relazionelineare e assume il valore 0 quando essa è nulla.

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Alcuni esempi

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Alcuni valori di riferimento nelle scienze sociali

    r = ±.1⇒ effetto piccolor = ±.3⇒ effetto medior = ±.5⇒ effetto grande

    Statistical power analysis for behavioral science (2nd ed).Cohen, J. (1988)

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    I libri di casaUn insegnante di lingua e letteratura italiana delle scuole superiori ha svoltouna piccola indagine sui suoi 9 studenti per esplorare la relazione tra il numerodi libri presenti in casa e il profitto finale ottenuto in italiano. I dati sonopresentati nella seguente tabella:

    Codice studente Profitto Y Libri in casa X1 10 462 6 203 7 184 4 225 9 306 3 157 4 408 9 229 5 28

    1 Rappresentare graficamente i dati e commentarli.2 Calcolare il coefficiente di correlazione tra Profitto in Italiano e Numero

    di Libri in casa e fornirne una breve interpretazione.3 Verificare per α = .05 la significatività della correlazione osservata.4 Commentare i risultati ottenuti.

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    1. Rappresentazione grafica dei dati

    15 20 25 30 35 40 45

    02

    46

    810

    (X) Numero di libri in casa

    (Y) P

    rofit

    to in

    ital

    iano

    Osservando il diagramma a dispersione tra le variabili osservatesembra emergere una relazione diretta e moderatamente linearetra il numero di libri posseduti in casa e il profitto in italiano.

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    2.1 Il calcolo del coefficiente di correlazione

    Il coefficiente di correlazione r è dato dalla seguente formula:

    r =sXYsXsY

    dove:

    sXY =

    ∑ni (Xi −X)(Yi − Y )

    n − 1

    Al numeratore quindi abbiamo la covarianza campionaria sXYe al denominatore il prodotto delle deviazioni standardcampionarie sXsY

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    2.2 Il calcolo del coefficiente di correlzione

    Calcoliamo, per prima cosa, medie e deviazioni standardcampionarie delle 2 variabili, Numero di libri (X) e Profitto(Y):

    X = 26.78 sX = 10.39

    Y = 6.33 sY = 2.55

    Calcoliamo la covarianza campionaria:

    sXY =(46− 26.78)(10− 6.33) + · · ·+ (28− 26.78)(5− 6.33)

    9− 1 = 10.08

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    2.3 Il calcolo del coefficiente di correlazione

    Sostituendo opportunamente i valori calcolati otteniamo ilcoefficiente di correlazione r :

    r =10.08

    10.39× 2.55 = .38

    La correlazione calcolata, rispetto ai valori di riferimentoproposti da Cohen (1988), può essere considerata di mediadimensione.

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    3-4. Confronto tra valore osservato e valore critico econclusioni

    Consultando le tavole statistiche si osserva che i valori criticidel coefficiente di correlazione per 7 (n − 2) gradi di libertà eun livello critico del 5% sono ±.67

    Essendo il valore osservato rOSS = .38 compreso tra i valoricritici ±.67, l’ipotesi nulla, che prevede l’assenza dicorrelazione tra profitto e numero di libri, non può essererifiutata

    Da un punto di vista descrittivo emerge una correlazione dieffetto medio e positiva tra il numero di libri posseduti e ilprofitto in italiano. Tendenzialmente quindi all’aumentare delnumero di libri presenti in casa sembra essere associato unaumento del profitto in italiano. Tale correlazione tuttavianon risulta statisticamente significativa per un livello criticodel 5%

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Empatia e bullismoNella seguente tabella sono riportati i punteggi ottenuti a duetest, uno sull’empatia (X) e uno sul bullismo (Y ), da 8 ragazzimaschi di età compresa tra i 12 e i 14 anni. In entrambi i test unpunteggio elevato indica un livello elevato del costrutto misurato.

    Codice soggetto Empatia X Bullismo Y1 8 22 7 53 10 44 2 75 3 66 5 57 6 48 8 3

    1 Rappresentare graficamente i dati e commentarli.2 Calcolare il coefficiente di correlazione tra Empatia e Bullismo e fornirne

    una breve interpretazione.3 Verificare per α = .05 la significatività della correlazione osservata.4 Commentare i risultati ottenuti.

  • Tipi di relazione tra 2 variabili quantitative Covarianza e correlazione Un esempio completo Un esercizio

    Riferimenti bibliografici

    Corbetta, P. (1992). Metodi di analisi multivariata per le scienzesociali. Bologna: Il Mulino.

    Tipi di relazione tra 2 variabili quantitativeCovarianza e correlazioneUn esempio completoUn esercizio