Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in...

43
Tecniche descrittive • Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio • Il fine è la descrizione semplificata del fenomeno attraverso il modello di riferimento

Transcript of Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in...

Page 1: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Tecniche descrittive

• Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio

• Il fine è la descrizione semplificata del fenomeno attraverso il modello di riferimento

Page 2: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Tecniche descrittive

• Metodo: il modello è creato ad hoc sui dati sperimentali

• Diversi livelli di complessità del modello a seconda del fenomeno in studio

• Esempi: distribuzioni di probabilità, analisi fattoriale, analisi discriminante, cluster analysis

Page 3: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Tecniche descrittive

Applicazioni:

• Indagini esplorative sui dati sperimentali per la successiva formulazione di idee

• Verifica della validità interna e esterna di test psicometrici

Page 4: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi Discriminante

Fine: suddividere il campione in gruppi

Metodo1. Fase di addestramento 2. Fase di analisi

Page 5: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi DiscriminanteAnalisi Discriminante

Assunti:

• I fattori predittivi devono avere distribuzione gaussiana

• I fattori devono essere scarsamente correlati fra loro

• Le correlazioni devono essere costanti all’interno dei gruppi

• Le medie e deviazioni standard dei fattori non devono essere correlate fra loro

Page 6: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi DiscriminanteAnalisi Discriminante

La fase di addestramento utilizza un campione di soggetti, di cui si conosce l’appartenenza a uno dei gruppi considerati, per calcolare i parametri necessari alla classificazione di un nuovo soggetto

Page 7: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi DiscriminanteAnalisi Discriminante

I valori prodotti dalla funzione discriminante hanno media = zero, varianza = 1 e garantiscano la massima differenza possibile fra le medie di gruppo

Page 8: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi DiscriminanteAnalisi Discriminante

La fase di analisi applica i parametri calcolati per la classificazione di nuovi soggetti in una delle classi possibili

La classificazione si basa sul calcolo di una funzione in grado di fornire un valore soglia opportunamente determinato che discrimini i gruppi

Page 9: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi DiscriminanteAnalisi DiscriminanteFunzione ottenuta come combinazione lineare

dei parametri misurati, cioè come somma dei parametri moltiplicati per opportuni coefficienti

dik= b0k+bjkxi1+…bpkxip

dik è il valore della k funzione discriminante relativa al soggetto i

bjk è il valore del coefficiente j per la funzione k

p è il numero dei fattori predittivixij è il valore dovuto al fattore j per il

soggetto i

Page 10: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi DiscriminanteAnalisi Discriminante

Parametri determinati in modo che:1. i valori prodotti dalla funzione

discriminante abbiano media zero, varianza unitaria

2. garantiscano la massima differenza possibile fra le medie di gruppo

Page 11: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi DiscriminanteAnalisi Discriminante

Per ogni soggetto viene calcolata la probabilità di appartenere a ciascun gruppo e si procede all’assegnazione del soggetto al gruppo per cui è maggiore la probabilità di appartenenza

Page 12: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi DiscriminanteAnalisi Discriminante

2 gruppi: la soglia che divide i due gruppi è situata nel punto di mezzo delle due medie di gruppo

Più di 2 gruppi: le funzioni utilizzate sono tante quante il numero dei gruppi meno uno (non è possibile usare una sola soglia ma occorre calcolare la probabilità di appartenenza del soggetto al gruppo)

Page 13: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi DiscriminanteAnalisi Discriminante

• Al termine della fase di apprendimento è possibile riassegnare i soggetti ai gruppi di appartenenza utilizzando le funzioni discriminanti calcolate

• Questa operazione permette di valutare l’efficienza del sistema di classificazione

Page 14: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi DiscriminanteAnalisi Discriminante

Successo dipende:

• dall’efficienza con cui abbiamo creato le funzioni di classificazione

• dalle ipotesi che abbiamo formulato

• dai parametri che abbiamo conseguentemente considerato

Page 15: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi DiscriminanteAnalisi Discriminante

Utilizzo:

• Sistema di classificazione in grado di classificare ogni nuovo soggetto senza conoscere realmente a quale gruppo appartiene

• Individuare quali fattori incidono maggiormente nella discriminazione fra più gruppi

Page 16: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Cluster Analysis

Scopo: individuare la miglior suddivisione in gruppi del campione in esame

Cluster: addensamento attorno a un valore centrale in uno spazio a n dimensioni

Page 17: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Cluster Analysis

Assunti: • Variabili che determinano la

suddivisione possono essere a distribuzione gaussiana o categoriche

• Individua i gruppi in modo che siano massimamente omogenei al loro interno e eterogenei fra loro

Page 18: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Cluster Analysis

La funzione dell’analisi dei cluster è quella di classificare i casi in un certo numero di gruppi senza che venga richiesta una preliminare identificazione dei gruppi.

Questi gruppi possono essere utilizzati in ulteriori analisi statistiche per la verifica di ipotesi riguardanti nuove variabili non utilizzate nella classificazione

Page 19: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Cluster Analysis

Analisi Cluster gerarchica: generano suddivisioni gerarchicamente ordinate (n-1 possibili cluster)

Analisi Cluster non gerarchica: generano un’unica suddivisione (numero prefissato di gruppi); riservati a dati quantitativi, basati sulle distanze euclidee dai centroidi.

Page 20: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Cluster Analysis

Analisi Cluster gerarchica1. Identificazione delle variabili2. Selezione del tipo di distanza3. Selezione di una tecnica di

raggruppamento4. Identificazione del numero dei

gruppi5. Valutazione e interpretazione

della soluzione

Page 21: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Cluster Analysis

• Si parte da un algoritmo che inizialmente prevede tanti gruppi quanti sono i casi e in seguito unisce i gruppi tra loro a due a due fino ad ottenere un unico cluster.

• Le misure delle distanze sono generate dalla matrice di prossimità

• A seconda del tipo di scala si sceglie il metodo per il calcolo delle distanze più appropriato

Page 22: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Cluster Analysis

• Quanti gruppi scegliere rimane un problema!– dai coefficienti di agglomerazione, si sceglie

il livello precedente al livello con coefficiente più alto

– Dal dendrogramma che delinea le relazioni, si sceglie la soluzione che prevede una certa similarità degli elementi del cluster e che sia parsimoniosa

Page 23: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Cluster Analysis

• Valutazione e interpretazione dei risultati– Statistica descrittiva

• Relativa alle variabili di partenza• Relativa ai cluster e ai punteggi prodotti

dai cluster

– Statistica inferenziale

Page 24: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Cluster Analysis

Analisi Cluster non gerarchica (k-medie)

1. Identificazione delle variabili*2. Identificazione del numero dei

gruppi3. Identificazione dei semi della

ripartizione4. Valutazione e interpretazione

della soluzione

*quantitative gaussiane

Page 25: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Cluster AnalysisLa distanza fra i gruppi viene calcolata sulle medie dei gruppi

che devono essere il più diverse possibiliSi individua il centroide ovvero il punto che ha come coordinate

le variabili considerateSi assegnano gli oggetti ai gruppi in modo da minimizzare le

distanzeSi ridefiniscono (iterative method) i centroidi in modo da

rendere minima la varianza interna e massima la varianza tra i cluster

Il processo termina fino a quando non c’è più un decremento significativo della funzione da minimizzare@

Metodo per creare la distanza (k-medie):Distanza euclidea: la somma dei quadrati delle differenze di

tutte le variabili utilizzate (trasformate in variabili z)

Page 26: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Cluster Analysis

• Il numero dei gruppi è stabilito dal ricercatore in base alle considerazioni teoriche sul fenomeno in studio

• Le distanze sono calcolate tra i casi

Page 27: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

MISURA dellaMISURA dellaCORRELAZIONECORRELAZIONE

Page 28: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Correlazione fra più variabili di uno stesso

campione

• Analisi della correlazione • Analisi della regressione• Analisi della covarianza• Analisi della correlazione parziale

Page 29: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi della Correlazione

Scopo: analizzare la relazione fra variabili quantitative (a distribuzione gaussiana o non gaussiana)

Fornisce sia il senso della relazione che la significatività

Page 30: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi della Correlazione

Correlazioni parametriche: • r di Pearson

Correlazioni non parametriche:• Tau di Kendall• Rho di Spearman

Page 31: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi della Correlazione

r di Pearson• Misura dell’associazione lineare fa due

variabili. I valori del coefficiente vanno da -1 a 1. Il segno del coefficiente indica una relazione positiva o negativa. Il suo valore assoluto indica la forza della relazione.

• Dipende dalla numerosità campionaria quindi va associato alla significatività

Page 32: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi della Correlazione• Tau di Kendall• Rho di Spearman

Entrambi misura dell’associazione non parametrica basata su dati o ordinali o a ranghi.

• I valori di entrambi i coefficienti vanno da -1 a 1. Il segno del coefficiente indica una relazione positiva o negativa. Il suo valore assoluto indica la forza della relazione.

• Dipendono dalla numerosità campionaria quindi va associato alla significatività

Esempio

Page 33: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Analisi della Correlazione

Utilizzi

• Misura dell’associazione fra variabili

• Verifica dell’attendibilità e della validità di questionari

Page 34: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Relazione fra risultati prodotti da diverse

ricerche• Misura dell’effect-size• Meta analisi• Review

Page 35: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Effect size o forza dell’effetto

• Grado con cui il fenomeno è presente nella popolazione

• Intensità della relazione fra fattore e variabile dipendente

• Confronto fra variabilità dovuta ai fattori e la variabilità totale

• Variabilità misurata come varianza spiegata• Diversi indici a seconda dei dati e dei test

utilizzati

Page 36: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Meta Analisi

Scopo: permette di confrontare i risultati di diverse ricerche riguardanti uno stesso argomento nonostante siano basate su numerosità campionaria diverse e diversi test statistici utilizzati

Finalità: comprendere il funzionamento del fenomeno da studi diversi a volte discordanti

Page 37: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Meta AnalisiPer evitare di fare confronti inutili occorre specificare ovvero delimitare l’ambito di analisi in modo da semplificare il problema e quindi l’interpretazione dei risultati

Limitare le variabili in studio e eventualmente applicare più di una metanalisi

ES. Studio dell’effetto dell’ansia sulle prestazioni cognitive: quali indici di ansia considerare?

Page 38: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Meta Analisi

Procedimento:

1. Raccolta e codifica degli studi

2. Calcolo degli indici di confronto

3. Sintesi: calcolo dell’effetto medio

4. Interpretazione dei risultati

Page 39: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Meta Analisi: 1. Raccolta e codifica

• Gli studi raccolti devono essere adeguati e di ampia numerosità per evitare l’errore dovuto alle pubblicazioni (pubblication bias) e all’errore di campionamento

• Definire l’ipotesi di riferimento che specifica le variabili da utilizzare (fattori o predittori, covariate o moderatori)

• Pesare gli studi in base alla correttezza metodologica (es attraverso intention to treat analysis)

Page 40: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Valutazione delle differenze fra le medie rapportate alla deviazione standard casualeTale valutazione, nel caso di due gruppi indipendenti, può essere calcolata dalla formula

effect sizex x

s

1 2

2

Meta Analisi: 2. Calcolo degli indici di

confronto

Page 41: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Nel caso conosciamo solo la numerosità dei gruppi e il valore del parametro t possiamo ottenere lo stesso indice dalla formula

effect size tn n

n n

1 2

1 2

Meta Analisi: 2. Calcolo degli indici di

confronto

Page 42: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Effetto medio: media degli effetti nelle diverse ricerche effettuate

Permette di ottenere una valutazione complessiva dei risultati

Meta Analisi: 3. Calcolo dell’effetto medio

Page 43: Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.

Permette di trasformare le descrizioni delle ricerche effettuate su un particolare argomento in una valutazione obiettiva dei risultati ottenuti

Tuttavia necessitano di una interpretazione dettagliata e motivata dell’analisi

Inoltre considera solo le ricerche pubblicate

Meta Analisi: 4. Interpretazione