LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E...
Transcript of LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E...
![Page 1: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/1.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Università degli Studi di BergamoDipartimento di Scienze Umane e SocialiCorso di Laurea in Scienze Psicologiche
Università degli Studi di BergamoDipartimento di Scienze Umane e SocialiCorso di Laurea in Scienze Psicologiche
LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA
Prof. Paolo Cazzaniga
Dott.ssa Roberta Adorni
Dott. Agostino Brugnera
Dott. Nicola Palena
Dott.ssa Cristina Zarbo
![Page 2: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/2.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Importare un file datiMenù →Open →Browse →Selezionare il file
dati_originale_999.sav
Oppure richiamare il file creato nella lezione precedente
.omv
![Page 3: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/3.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Calcolare una variabile
Data → Compute• Diamo un nome alla nuova
variabile• Inseriamo la formula per il
calcolo della variabile (somma)
• Elenchiamo le variabili su cui applicare la formula
ESEMPIO 1: Vogliamo calcolare il punteggio somma dei punteggi ai singoli item del questionario sulla Soddisfazione di Vita
![Page 4: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/4.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile
ESEMPIO 2: Vogliamo calcolare il punteggio somma dei punteggi ai singoli item del questionario sull’Ottimismo
In questo caso è necessario ricodificare alcuni item del questionario (item 1, 3, 5), perché• Item 1, 3, 5: un punteggio alto esprime basso ottimismo• Item 2, 4, 6: un punteggio alto esprime alto ottimismoPer calcolare il punteggio somma in modo che rifletta un crescente ottimismo dobbiamo «invertire» il punteggio degli item 1, 3, 5, ricorrendo alla formula
OTTxric = 6 – OTTx
![Page 5: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/5.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile
Data → Transform• Diamo un nome alla nuova variabile• Definiamo la variabile su cui applicare la trasformazione (source variable)• Definiamo il tipo di trasformazione selezionando create new tranform →
edit, poiché la formula che vogliamo usare non compare fra quelle di default
![Page 6: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/6.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabileNella finestra che si apre• Diamo un nome alla formula• Scriviamo la formula da applicare (usando la dicitura «$source» possiamo
usare la formula anche per altre variabili)
![Page 7: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/7.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile
Ripetiamo la stessa operazione per gli altri item da ricodificare (OTTI3, OTTI5), richiamando la formula appena creata
![Page 8: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/8.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Calcolare una variabileA questo punto possiamo calcolare il punteggio somma del questionario Ottimismo
![Page 9: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/9.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Filtrare i datiData → Filters
![Page 10: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/10.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Esercizio 1. Filtro: solo maschi
![Page 11: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/11.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Aggiungere/Disattivare un Filtro
Se clicchiamo sul +
possiamo aggiungere un secondo
filtro
Possiamo disattivare il primo tramite questo pulsante in modo tale che rimanga salvato se servisse per analisi future
![Page 12: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/12.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Esercizio 2. Filtro: maschi, >= 50 anni
![Page 13: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/13.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Esercizio 3.
• Filtro: solo femmine che vivono da sole
• Filtro: solo maschi, coniugati, <50 anni
Esercizio 4.
![Page 14: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/14.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile
ESEMPIO 3: Supponiamo di dover riclassificare la variabile ETA’, in modo da suddividere il campione in 3 o 4 fasce d’età.
• Individuiamo le fasce d’età sulla base dei terzili o dei quartili.
• Nella sezione delle statistiche descrittive (Analyses – Exploration– Descriptives) individuiamo i terziliper suddividere l’età in 3 classi, o i quartili per suddividere l’età in 4 classi
![Page 15: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/15.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile scala in una variabile di più basso livello → ETA
![Page 16: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/16.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Utilizziamo la funzione IF
Per dividere in 4 diversi gruppi la V ETA, secondo i quartili del campione
Attraverso il tasto compute
![Page 17: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/17.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile scala in una variabile di più basso livello → ETA
![Page 18: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/18.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Trasformare una variabile
![Page 19: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/19.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Statistiche descrittive
Analyses → Exploration →DescriptivesSi apre il menu delle analisi
![Page 20: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/20.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici per DescrittiveAnalyses → Exploration, poi clicchiamo su «Plots»
![Page 21: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/21.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici per DescrittivePer creare grafici di qualità migliore è possibile copiare la tabella di interesse in Excel e generare il grafico
![Page 22: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/22.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici in Excel1. Riportare i dati
estrapolati dalle descrittive in Jamoviattraverso le Frequencytables (ad esempio per la variabile ST CIV)
2. Selezionare tutte le celle di interesse
3. Cliccare in alto su «inserisci» in modo tale che appaiano le strutture dei grafici che possono essere costruiti
![Page 23: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/23.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici in Excel: diagramma a barre
Selezionare il grafico desiderato, ad esempio il diagramma a barre.
Il grafico verrà inserito in modo automatico
![Page 24: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/24.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici in Excel: torta
Selezionare il grafico desiderato. In questo caso, il grafico a torta.
![Page 25: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/25.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Operazioni possibili: aggiungere etichette
Cliccare con il tasto destro direttamente sul grafico e cliccare su «aggiungi etichette dati»
![Page 26: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/26.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Operazioni possibili: aggiungere e modificare etichette
In questo modo ha aggiunto i valori corrispondenti ad ogni livello della variabile ST CIV direttamente nel grafico.
Nel caso si volessero le percentuali al posto dei valori, basta cliccare ancora con il tasto destro sul grafico e richiederlo attraverso il tasto «formato etichette dati»
![Page 27: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/27.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Grafici in ExcelINOLTRE
Si può modificare il titolo del grafico inserendo il nome della variabile di
interesse. In questo caso «STATO CIVILE»
![Page 28: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/28.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Descrittive: funzione «split by»
NB: solo con variabili misurate su scala nominale!
![Page 29: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/29.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Descrittive: funzione «split by»
Se richiedo i grafici con la funzione split by, Jamovi creerà i grafici dividendo i dati per i livelli della variabile nominale selezionata.
In questo caso dividendo per i due livelli della variabile SEX: maschi e femmine.
![Page 30: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/30.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Descrittive: grafici con la funzione «split by»
![Page 31: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/31.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Ripasso: Statistiche descrittive• Il calcolo delle statistiche descrittive di una variabile
consiste nel misurare quei parametri, come la media e la deviazione standard, che sintetizzano come sono distribuiti nel campione i valori che essa può assumere
• E’ utile per verificare se i valori si distribuiscono secondo un andamento normale oppure se alcuni di essi sbilanciano la distribuzione
• Le statistiche descrittive sono una valutazione preliminare importante per controllare la “normalità”della distribuzione, necessaria per procedere in molte delle elaborazioni statistiche successive
![Page 32: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/32.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Curva normale e distribuzione dei dati
• Se rappresentiamo un dato raccolto da un grafico poligonale di frequenza e la curva risultante non simula la curva di distribuzione normale (con tutte le sue caratteristiche), questi dati non sono normalmente distribuiti
• Nello specifico, cosa andiamo a valutare?
![Page 33: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/33.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Indici per testare la normalità:Asimmetria e Curtosi
Asimmetria: misura l'asimmetria dei dati• Positiva o destra: coda destra più lunga• Negativa o sinistra: coda sinistra più lunga
![Page 34: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/34.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Indici per testare la normalità:Asimmetria e Curtosi
Curtosi: misura il picco di distribuzione dei dati.La curtosi della distribuzione normale è 0.
![Page 35: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/35.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione
Skewness (asimmetria): indice che informa circa il grado di simmetria o asimmetria di una distribuzione• SK = 0 distribuzione simmetrica• SK < 0 asimmetria negativa (mediana>media)• SK > 0 asimmetria positiva (mediana<media)Kurtosis (curtosi): indice che permette di verificare se i dati seguono una distribuzione di tipo «Normale»• KU = 0 distribuzione Normale• KU < 0 distribuzione platicurtica (rispetto alla distribuzione normale ha
frequenza di densità minore per valori molto distanti dalla media)• KU > 0 distribuzione leptocurtica (rispetto alla distribuzione normale ha
frequenza di densità maggiore per valori molto distanti dalla media)
![Page 36: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/36.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione
Le distribuzioni delle variabili deviano fortemente dalla distribuzione normale se:
• Criterio stringente → valori di asimmetria e curtosi maggiori di |1| (Barbaranelli, 2007)
• Criterio più tollerante → valori di asimmetria maggiori di |2| e di curtosi maggiori di |7| (West, Finch, & Curran, 1995)
In questi casi è possibile trasformare i dati per «normalizzarli»
![Page 37: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/37.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
• Asimmetria positiva molto elevata (> 2) = trasformazione nel reciproco (X*=1/X)
• Asimmetria positiva sostanziale (tra 1 e 2) = trasformazione logaritmo (X*=Log10(X)) o trasformazione Radice Quadrata (X*=SQRT(X))
• Asimmetria negativa molto elevata (> -2) = trasformazione nel reciproco (X*=1/(K-X))
• Asimmetria negativa sostanziale (tra -1 e -2) = trasformazione logaritmo (X*=Log10(K-X)) o trasformazione Radice Quadrata (X*=SQRT(K-X))
K è uguale al valore più alto della variabile X, + 1
Strategie per la trasformazione dei dati
![Page 38: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/38.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
ESEMPIO 1: consideriamo la variabile «SODVITtot». La distribuzione dei dati è approssimabile a una distribuzione normale?
Seleziono questa variabile in Jamovi e richiamo le statistiche descrittive rilevanti
![Page 39: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/39.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
![Page 40: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/40.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
ESEMPIO 2: consideriamo la variabile «OTTItot». La distribuzione dei dati è approssimabile a una distribuzione normale?
Seleziono questa variabile in Jamovi e richiamo le statistiche descrittive rilevanti
![Page 41: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/41.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
![Page 42: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/42.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
ESEMPIO• Importiamo il file dati_2lezione_DNN• Calcoliamo la variabile «SODVIT – somma»Come si distribuisce questa variabile?• Richiamiamo le statistiche descrittive
![Page 43: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/43.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
![Page 44: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/44.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -JamoviCurtosi= -1.28 → Asimmetria negativa sostanziale (tra -1 e -2)• trasformazione logaritmo (X*=Log10(K-X)), oppure• trasformazione Radice Quadrata (X*=SQRT(K-X))
N.B. K = Xmax + 1nel nostro caso 35+1=36
![Page 45: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/45.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Misure di forma della distribuzione -Jamovi
![Page 46: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/46.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
E’ necessario:
• Standardizzare i punteggi relativi alla variabile da analizzare
• Effettuare una distribuzione delle frequenze della nuova variabile standardizzata
• Individuare i punteggi che corrispondono a un valore “z” maggiore di 3 in valore assoluto e considerarli come possibili valori anormali
Provare a fare le analisi sia senza questi possibili outliers che con i possibili outliers. Se i risultati non cambiano più di tanto si possono comunque tenere anche i punteggi definibili come outliers.
Individuare gli outliers
![Page 47: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/47.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Individuare gli outliersTorniamo al filedati_originale_999
Esempio 1: consideriamo la variabile SODVITtot.
Per individuare gli outliers dobbiamo trasformare i punteggi in z, ovvero
Calcolare una nuova variabile ricorrendo alla procedura «compute variable» e scegliendo la funzione «Z»
![Page 48: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/48.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Individuare gli outliersOra calcoliamo le statistiche descrittive della nuova variabile e vediamo se ci sono valori z > |3|
In questo caso non ci sono outliers da escludere dalle analisi
![Page 49: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/49.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Individuare gli outliersEsempio 2: consideriamo la variabile OTTItot.
Per individuare gli outliers dobbiamo trasformare i punteggi in z, ovvero
Calcolare una nuova variabile ricorrendo alla procedura «compute variable» e scegliendo la funzione «Z»
![Page 50: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/50.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Individuare gli outliersOra calcoliamo le statistiche descrittive della nuova variabile e vediamo se ci sono valori z > |3|
In questo caso ci sono valori di z < -3, quindi ci sono outliers da escludere dalle analisi
![Page 51: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/51.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Individuare gli outliersL’ultimo passaggio consiste nel filtrare i dati in modo da escludere gli outliers
Attivando o disattivando il filtro, potremo confrontare le statistiche con o senza outliers
![Page 52: LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA · LABORATORIO DI FONDAMENTI DI INFORMATICA E STATISTICA Prof. Paolo Cazzaniga Dott.ssa Roberta Adorni ... possibile copiare](https://reader034.fdocumenti.com/reader034/viewer/2022042811/5fa7220973f533798518ec55/html5/thumbnails/52.jpg)
UNIVERSITÀ DEGLI STUDI DI BERGAMO
Ringraziamenti
Si ringrazia il Prof. Andrea Greco per il materiale fornito