Sistemi posizionali, numeri binari, complemento a due Rappresentazioni numeriche.
Misurazione Le osservazioni si esprimono in forma di misurazioni Misurazioni categoriche –Maschio/...
-
Upload
liborio-mascia -
Category
Documents
-
view
212 -
download
0
Transcript of Misurazione Le osservazioni si esprimono in forma di misurazioni Misurazioni categoriche –Maschio/...
Misurazione
• Le osservazioni si esprimono in forma di misurazioni
• Misurazioni categoriche– Maschio/ femmina
– Provincia di residenza
• Misurazioni numeriche– Età
– Altezza
• Diversi tipi di misurazione richiedono diverse tecniche di analisi statistica
Scale nominali
• Una scala nominale consiste in un insieme di categorie ciascuna delle quali è associata ad un nome– Rosso– Blu– Verde– Giallo
• Le scale nominali non consentono di quantificare le differenze fra due individui appartenenti a categorie diverse
Scale ordinali
• Una scala ordinale consiste in un insieme ordinato di categorie– licenza elementare
– licenza media
– licenza di scuola superiore
– laurea
• Le scale ordinali non consentono la quantificazione della differenza fra due categorie
Scale ad intervalli
• Una scala ad intervalli consiste in un insieme ordinato di categorie dove ogni categoria corrisponde ad un intervallo e dove tutti gli intervalli sono della stessa grandezza– 0-10 anni– 11-20 anni– 21-30 anni
• Una scala ad intervalli consente di misurare la differenza fra due individui appartenenti a categorie diverse
Variabili discrete
• Una variabile discreta rappresenta un insieme di categorie distinte e indivisibili– Maschi – Femmine
Variabili continue
• Una variabile continua può assumere un numero infinito di diversi valori– 9,1– 9,12– 9,145
ecc.
Rappresentare le variabili
Codice studente Sesso Anno di nascita Anno di immatricolazione Esami completati123456789
1011121314151617181920
Scala nominale
Scala nominaleScala
ordinale
Scala ordinale
Variabile discreta
Distribuzione di frequenza
• Una distribuzione di frequenza è una tabella che mostra il numero di individui / osservazioni appartenenti a ciascuna categoria appartenente ad una scala di misura
Voti di esame
N=10
Proporzioni/percentuali
N=10
Nfp
)100(% p
Scala OrdinalePermette si ordinare tra loro i valori, stabilendo che una categoria è > o < rispetto ad un’altra, oltre che la possibilità di stabilire rapporto di uguaglianza tra variabili
STATISTICHE POSSIBILI:• Moda - Mediana• Quartili• NdE
Distribuzioni di frequenza
• Primo passaggio: dato che sono variabili di tipo ordinale, ORDINARE la tabella secondo una relazione d’ordine crescente o decrescente
• Secondo passaggio: Calcolare la frequenza assoluta, la frequenza cumulata e la percentuale cumulata
Distribuzione di frequenza
Esempio:
Ord. Crescente
Ord. Decrescente
Statistiche della distribuzione Centrale: Mediana (Mdn)
MEDIANA: Valore che sta in posizione centrale.
CASO 1: numero complessivo di valori dispari
FORMULA:
Mdn=(N+1)/2
CASO 2: numero di valori complessivo pari.
Statistiche della distribuzione Centrale: Mediana (Mdn)
FORMULA:
Mdn = (N+1)/2 e N/2
• Mediana come indice con POSIZIONE centrale.• Ruolo della Frequenza cumulata• Nel caso di numerosità pari abbiamo 2 valori di
mediana perché non esistono valori intermedi.
Statistiche della distribuzione Centrale: Mediana (Mdn)
Numerosità dispari Numerosità pari
Indici di Posizione: QUARTILI
• I quartili dividono in quattro uguali la distribuzione (ossia in quattro blocchi che contengono ognuno il 25% dei casi)
• I valori assunti dai quartili vengono indicati con Q1, Q2, Q3
FORMULA:
Quartile = (N+1) * p/4p = 1, 2, 3 per Q1, Q2, Q3
Indici di Posizione: QUARTILI
• I quartili sono dei valori assunti dalla varibile in una posizione precisa.
• La mediana (nel caso in cui la numerosità sia dispari) coincide con il secondo quartile
Indici di Posizione: QUARTILI
FORMULA:
Quantile = (N+1) * p/qp: posizione
q: numero di suddivisioni
Indici di Posizione: QUANTILI
SCALA INTERVALLO / A RAPPORTO
• Possibili rapporti di uguaglianza (livello nominale).• Possibili rapporti di ordine (livello ordinale).• Esiste un’unità di misura (intervallo) che permette di
stabilire la distanza fra 2 categorie.• Per definire le statistiche bisogna definire se le variabili
sono di tipo discreto o continuo.
STATISTICHE:• Moda - Mediana – Media• Quartili – Quantili • NdE –– Range – Varianza – Deviazione standard
Difficoltà nel riassumere i dati a causa di un numero di categorie elevato (nel caso di valori discreti NdE>18) o perché la variabile è di tipo continuo.
Distribuzione di frequenza
Raccogliere i valori in Intervalli di Classe
Intervalli di Classe
• Esempio classico: l’età• L’importanza di definire un valore “spartiacque”:
le categorie devono possedere un limite superiore e un limite inferiore
• Si abbrevia l’analisi statistica dei dati, si facilita la rappresentazione grafica e la costruzione delle tabelle di frequenza
1. Individuare il valore Max e il valore Min.
2. Definire il Range di distribuzione dei dati.RANGE = MAX – MIN
3. Dividere il Range per il numero di intervalli che si vuole ottenere.
4. Arrotondare l’ampiezza ottenuta ad un numero intero.
5. Si definisce un primo intervallo che contenga il valore minimo facendo in modo che i limiti grezzi siano dei multipli dell’ampiezza dell’intervallo.
6. Si procede ad attribuire i valori ai singoli intervalli.
Come costruire gli Intervalli di Classe
Esempio: 80 Valori raccolti
1. MAX = 97; MIN = 53
2. RANGE = 97 – 53 = 44
3. AMPIEZZA INTERVALLO: 10 CLASSI AMPIEZZA = 4,4
4. AMPIEZZA = 5 (Arrotondata in eccesso)
5. VALORE MINIMO = 50 (Multiplo dell’ampiezza intervallo; comodo per i calcoli). PRIMA CLASSE 50 –54; ULTIMA 95 – 99
6. LIMITI ESATTI: A META’ TRA LA FINE DI UNA CLASSE E L’INIZIO DELLA SUCCESSIVA (Esempio 54,5)
Come costruire gli Intervalli di Classe
Come costruire gli Intervalli di Classe
GRAFICI
• Istogramma
• Poligoni di frequenza
• Ogiva
• Diagrammi a barre
ISTOGRAMMA
Diagramma a rettangoli accostati ad indicare la natura intervallare dei dati. L’area di ciascun poligono rappresenta PROPORZIONALMENTE la frequenza di un intervallo di classe.
Poligono di frequenza
Il poligono di frequenza (o “spezzata di frequenze”) è simile all’istogramma ma sono utilizzati i valori centrali uniti da una linea.
Curva di frequenza
Quando l’ampiezza di ciascuna classe è molto piccola ed il numero totale delle classi è molto elevato la spezzata di frequenze tende ad una curva continua che si chiama “curva di frequenza”.
OGIVA
L’ogiva o Grafico delle Frequenze cumulate è una curva in cui vengono utilizzati i valori centrali dei poligoni di frequenza cumulata.
Rappresentazione grafica di un carattere discreto :
I diagrammi a barre
Quando una variabile è di tipo intervallare discreta e non è la sua distribuzione di frequenza non è raccolta secondo classi di intervalli (basso NdE), allora i dati vengono rappresentati con un grafico che si chiama”diagramma a barre”.
Diagramma della frequenza cumulata: diagramma a gradini.
Permette di confrontare i dati tra loro.
Rappresentazione grafica di un carattere discreto :
I diagrammi a barre