Appunti Di Statistica Ottimo

38
 

Transcript of Appunti Di Statistica Ottimo

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 1/37

 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 2/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 2 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 3/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 3 

CONTENUTI 

LA STATISTICA 

  La Statistica 

  Le fasi di un’indagine statistica 

o  Definizione del fenomeno 

o  Individuazione della popolazione 

o  Le variabili statistiche 

o  Le scale di misurazione 

o  Rilevamento dei dati 

  Elaborazione e rappresentazione dei dati 

o  Costruzione delle tabelle delle frequenze 

o  Rappresentazione grafica 

  Gli indicatori statistici: indici di posizione 

o  Moda 

o  media aritmetica 

o  Mediana 

o  Quantili 

  Gli indicatori statistici: indici di dispersione 

o  Campo di variazione 

o  Scarto semplice medio 

o  Varianza 

o  Deviazione standard 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 4/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 4 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 5/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 5 

LA STATISTICA 

La  statistica è una  scienza nata per analizzare e descrivere  i  fenomeni d’importanza  sociale che 

riguardano uno Stato. 

Oggi viene applicata in tutti quei campi dove intervengono fenomeni collettivi del tutto casuali, la 

cui  mancanza  di  ripetitività  ne  rende  impossibile  lo  studio  attraverso  la  sperimentazione 

scientifica. 

Sono fenomeni

 collettivi

 quei

 fatti,

 avvenimenti

 o situazioni

 che

 abbracciano

 un

 numero

 

sufficientemente grande di fenomeni individuali fra loro  uguali o simili. 

Ad esempio,  il  fatto che Antonio è alto cm 145 è un  fenomeno  individuale mentre  l’altezza dei 

ragazzi della stessa età di Antonio di tutte le scuole di un paese è un fenomeno collettivo. 

Il fatto che io vengo a scuola in auto è fenomeno individuale. Il mezzo utilizzato da tutti i docenti e 

alunni della mia scuola è un fenomeno collettivo. 

L’aumento della popolazione di uno  stato,  la comparsa di una certa malattia  in un determinato 

ambiente,  la  diminuzione  dei  posti  di  lavoro  in  un  particolare  settore,  sono  quindi  fenomeni 

collettivi, e  la  conoscenza delle caratteristiche o dell’andamento di un  fenomeno  collettivo può 

avvenire solo attraverso la statistica: 

La statistica è la scienza che studia i fenomeni collettivi di vario genere. Essa raccoglie, analizza e 

interpreta  (utilizzando metodi  e  strumenti matematici)  le  informazioni  riguardanti  il particolare 

fenomeno considerato, ne misura e studia certe caratteristiche e permette di fare previsioni sul 

futuro o sull’andamento del fenomeno stesso. 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 6/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 6 

E’ da

 precisare

 che,

 nel

 suo

 complesso,

 la

 statistica

 non

 dà

 risultati

 certi,

 ma

 arriva

 solo

 a fare

 delle

 

previsioni su determinati  fenomeni, previsioni che  –  teoricamente  – sono certe ma anche quasi 

sicuramente certe:  occorre quindi fare le valutazioni con la dovuta attenzione. 

La statistica dà quindi delle previsioni permettendo di programmare soluzioni o  interventi adatti. 

(es. l’aumento di una malattia). 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 7/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 7  

FASI DI UN’INDAGINE STATISTICA 

Un’indagine statistica, seppur ben definita nel fenomeno preso in considerazione, può essere resa 

non appropriata o può essere  totalmente vanificata da una raccolta dei dati non corretta o una 

loro presentazione inadeguata. 

Per evitare ciò, è bene seguire uno schema preciso che, in linea di massima, è basato sullo sviluppo 

di quattro FASI essenziali che sono: 

  definire in maniera esatta e completa il fenomeno su cui si vuole indagare; 

  individuare la

 popolazione

 interessata

 al

 fenomeno

 su

 cui

 si

 indaga;

 

  rilevare e raccogliere in maniera appropriata i dati; 

  elaborare e interpretare i dati raccolti e rappresentarli graficamente. 

Queste  fasi  devono  essere  affrontate  nella  sequenza  indicata:  raccogliere  dati  prima  di  aver 

chiaramente espresso  le finalità dell’indagine può facilmente condurre a analisi e  interpretazione 

dei dati

 non

 adeguati

 e quindi

 a risultati

 poco

 attendibili.

 

DEFINIZIONE DEL FENOMENO 

Il  primo  passo  è  la  definizione  del  fenomeno  su  cui  vogliamo  indagare  precisando  anche,  con 

accuratezza, i particolari

 aspetti

 che

 si

 vogliono

 analizzare.

 

E’  la fase  iniziale e più  importante ai fini di un più preciso proseguimento dell’indagine stessa,  in 

quanto  bisogna  predisporre,  logicamente  e  praticamente,  il  tipo  di  indagine  più  adatta  al 

conseguimento dei nostri obiettivi. 

Se per esempio vogliamo prendere in esame il fenomeno “distribuzione demografica in una città” 

sarà opportuno precisare se vogliamo un esame che riguardi: 

  la caratteristica numerica complessiva (numero di abitanti) 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 8/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 8 

  la caratteristica numerica per sesso (numero maschi e numero femmine) 

  la caratteristica numerica secondo il reddito 

  la caratteristica numerica secondo l’attività lavorativa 

  ecc. 

INDIVIDUAZIONE DELLA POPOLAZIONE 

Definito  il  fenomeno, va  indicata chiaramente  la collettività a cui  il  fenomeno si riferisce e sulla 

quale verrà quindi svolta l’indagine. 

Tale  collettività  in  termini  statistici  si  chiama  popolazione  statistica  o,  semplicemente, 

popolazione; ogni singolo elemento della popolazione si chiama unità statistica. 

Si  definisce  popolazione  qualsiasi  insieme  di  elementi,  reale  o  virtuale,  che  forma  oggetto  di 

studio. 

Costituiscono una popolazione, ad esempio: 

  gli alunni di una classe; 

  gli impiegati di un’azienda; 

  tutti i residenti nel comune di Torino il 31/12/2007; 

  le malattie tipiche di una certa regione. 

E’ di fondamentale importanza (nonché indicatore di serietà della ricerca) definire esattamente la 

popolazione di riferimento dell’indagine. 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 9/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 9 

LE VARIABILI STATISTICHE 

Se  consideriamo una popolazione  statistica, es.  gli  impiegati di un’azienda, ogni unità  statistica 

(ogni impiegato)

 differisce

 da

 un’altra

 unità

 per

 una

 o più

 caratteristiche:

 il sesso,

 l’attività

 svolta,

 il 

mezzo di trasporto per recarsi in azienda, lo stato civile, il numero di figli, ecc. 

Queste  caratteristiche  prendono  il  nome  di  variabili  statistiche  ed  è  rispetto  ad  una  o  più  di 

queste variabili che si effettua l’indagine statistica. 

Le variabili statistiche possono essere: 

variabili quantitative, se espresse da un numero 

variabili 

qualitative, 

se 

non 

possono 

essere 

espresse 

da 

un 

numero 

(stato 

civile, 

il 

sesso, 

mezzo 

di 

trasporto, attività svolta,..) 

Sono pertanto variabili quantitative: 

  l’età 

  il numero figli 

  lo stipendio

 percepito

 

mentre le variabili qualitative possono essere : 

  lo stato civile 

  il sesso 

  il mezzo di trasporto 

  l’attività svolta 

Possiamo quindi dire che: 

L’indagine statistica è lo studio di un fenomeno collettivo. Tale studio consiste nell’analizzare come 

una popolazione statistica si distribuisce rispetto ad una certa variabile statistica. 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 10/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 10 

RILEVAMENTO DEI DATI 

Il  fenomeno,  la popolazione e  la/le variabili  statistiche su cui vogliamo  indagare ci suggeriranno 

come meglio

 procedere

 nella

 fase

 di

 rilevamento

 dati.

 

Il rilevamento dati può essere diretto o completo se viene eseguito direttamente su tutte le unità 

statistiche  che  formano  la  popolazione  interessata  al  fenomeno.  Ciò  è  possibile  quando  la 

popolazione  è  formata da un numero non  eccessivo di unità  e ogni unità  statistica può quindi 

essere  contattata  e  intervistata.  Fanno  eccezione  i  censimenti  e  le  indagini  su  nascite, morti, 

matrimoni (attraverso gli archivi statali). 

Spesso però

 l’intera

 popolazione

 è talmente

 vasta

 da

 non

 permettere

 il rilevamento

 diretto

 per

 

vari motivi (costi, tempi, disponibilità di tutte le unità statistiche). Si deve pertanto scegliere al suo 

interno una parte ridotta di unità statistiche, ovvero un opportuno campione rappresentativo, su 

cui si eseguirà l’indagine. In questo caso si parla di rilevamento indiretto o per campione, perchè 

viene eseguito solo su una parte più o meno estesa della popolazione. 

La  scelta  del  campione  rappresentativo  è  un momento molto  importante  e  delicato,  che  deve 

tenere conto di alcuni fattori: 

  il numero di campioni deve essere tale da rendere attendibili i risultati; 

  la scelta dei campioni non deve rendere selettiva l’indagine stessa; 

  i  risultati  ottenuti  sul  campione  non  devono  provocare  errori  di  valutazione  quando 

vengono estesi a tutta la popolazione. 

Per  il numero dei campioni  in genere si decide per una percentuale veramente rappresentativa, 

che non

 sia

 né

 ristretta

 né

 inutilmente

 vasta.

 

Per la scelta del campione si ricorre in genere a: 

rilevamento casuale: si effettua estraendo a caso i campioni dall’intera popolazione; se non esiste 

alcun vincolo di convenienza (economica, sociale, ecc.) che potrebbe imporre la scelta ragionata di 

uno o dell’altro campione, i campioni vengono decisi dal caso. 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 11/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 11 

rilevamento stratificato: si effettua suddividendo la popolazione in più strati, o classi, e scegliendo 

a  caso,  in  ognuno  di  essi,  singoli  campioni  che  complessivamente  formano  i  campioni 

dell’indagine.  In  ogni  strato  il  numero  dei  campioni  da  scegliere  sarà  proporzionale  al  numero 

totale degli elementi della classe stessa. 

Se  per  esempio  si  vuole  indagare  sul  fenomeno  “reddito  degli  abitanti  di  una  regione”,  è 

opportuno  fare  il  campionamento  stratificato  in quanto  il  reddito  varia  secondo  alcuni  strati o 

classi della popolazione, strati che in questo caso sono le diverse attività lavorative. 

Per una corretta e completa  raccolta dati dobbiamo definire non  solo  il metodo di  rilevamento 

(diretto o per campionamento) e le variabili statistiche (quantitative e qualitative) già descritte in 

precedenza, ma anche altri criteri di classificazione quali le cosiddette scale di misurazione. 

LE SCALE DI MISURAZIONE 

Le 

variabili 

possono 

essere 

classificate 

anche 

in 

base 

alla 

scala 

di 

misurazione 

o, 

in 

altre 

parole, 

alle 

operazioni che si possono fare con le loro modalità. 

Esistono  quattro  scale:  la  scala  nominale,  la  scala  ordinale,  la  scala  per  intervallo,  la  scala  per 

rapporto. 

Scala nominale 

Le modalità non hanno un ordinamento (è il caso delle variabili qualitative) 

Esempi: 

  giudizio su un film: bello / brutto; 

  si / no; 

  colore degli occhi; 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 12/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 12 

Scala ordinale 

Le modalità sono attributi non numerici ma logicamente ordinabili 

Esempi: 

  titolo di

 studio;

 

  livello di soddisfazione per un prodotto (per niente, poco, abbastanza, ecc..); 

Scala  per  intervallo 

Sono le variabili quantitative che consentono confronti solo per differenza ma non per rapporto. 

Per esempio,

 se

 misuriamo

 un

 giorno

 la

 temperatura

 minima

 e massima

 a Torino

 e a New

 York

 potremmo

 

ottenere i seguenti valori: 

Se vogliamo confrontare le temperature di Torino e di New York, ha senso dire che l’escursione termica è 

la stessa nelle due città, ma non ha senso dire che la minima a New York è la metà della minima a Torino. 

Scala  per  rapporto 

Sono variabili

 numeriche

 per

 le

 quali

 è intrinseca

 la

 definizione

 dello

 zero.

 

Esempi sono il peso, l’altezza, la lunghezza, la concentrazione. 

In questo caso le modalità possono essere confrontate per rapporto. 

Per esempio, si può affermare che la concentrazione di cloro in un campione di acqua è doppia 

rispetto a quella di un altro campione. 

Temp. 

massime 

Temp. 

minime 

Torino  25  16 

New York  17  8 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 13/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 13 

GLI STRUMENTI 

Scelto il metodo per il rilevamento dati, diretto o per campionamento, si passa alla raccolta delle 

informazioni che può avvenire tramite: 

  interviste:  si  pongono  a  ciascuna  unità  statistica  delle  precise  domande  in  merito  al 

fenomeno e si registrano le relative risposte; 

  questionari: si distribuisce a ciascuna unità statistica un questionario che successivamente 

viene ritirato con le risposte; 

  consultazione di archivi o pubblicazioni specializzate. 

Sarà pertanto necessario preparare  gli opportuni  strumenti per  registrare  facilmente  i dati  che 

dovremo raccogliere. 

I moduli per  l’intervista dovranno consentirci di segnare velocemente  le risposte che otteniamo: 

un modulo già organizzato “a crocette” ci farà risparmiare tempo sia durante l’intervista, sia dopo, 

quando dovremo elaborare i dati raccolti. Di contro, un modulo che ci obbliga a scrivere ciò che ci 

risponde la persona intervistata farà solamente spazientire la persona stessa. 

Nella  creazione  e  definizione  di  un  questionario  si  deve  invece  porre  attenzione  a  come  la 

domanda  viene  formulata,  affinché  chi  lo  compila  possa  poter  rispondere  senza  possibilità  di 

equivoci. 

E’ superfluo precisare che i questionari, essendo compilati senza la presenza e assistenza di chi sta 

conducendo l’indagine statistica, sono generalmente basati su risposte predefinite da crocettare. 

Nelle pagine seguenti viene riportato, come esempio,  il questionario che  la casa automobilistica 

SEAT invia ai suoi clienti per indagare sulla qualità del servizio di assistenza. 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 14/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 14 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 15/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 15 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 16/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 16 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 17/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 17  

ELABORAZIONE E RAPPRESENTAZIONE DATI 

Questa fase, nel suo complesso, abbraccia diversi momenti: 

  si va dal riscontro delle informazioni al loro spoglio per ricavare i veri dati statistici; 

  si passa alla loro trascrizione in apposite tabelle; 

  dall’esame di queste tabelle si arriva all’elaborazione vera e propria dei dati; 

  si conclude con la rappresentazione dei risultati dell’indagine mediante opportuni grafici. 

Si dice

 dato

 statistico

 una

 qualsiasi

 informazione

 di

 cui

 si

 conosce

 il numero

 di

 volte

 con

 cui

 si

 

ripete in un’indagine. 

A seconda dei dati statistici raccolti e dell’elaborazione che  intendiamo effettuare  – elaborazione 

che dipende  anche dagli obiettivi della nostra  indagine  statistica  – possiamo  creare  vari  tipi di 

tabelle: 

  tabella semplice o tabella di frequenza assoluta 

  tabella delle frequenze relative 

  tabella multipla e tabella a doppia entrata 

  tabella per classi. 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 18/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 18 

LE TABELLE 

Tabella semplice (tabella di frequenza assoluta) 

Supponiamo di aver  indagato  sul  fenomeno “altezza dei  ragazzi della 

classe III di una scuola media” e di avere raccolto informazioni relative 

a 20 campioni scelti, come da tabella qui a sinistra: 

Eseguiamo  successivamente  lo  spoglio delle  informazioni  realizzando 

una  tabella  dove  nella  prima  colonna  scriveremo  tutte  le  altezze 

registrate  e  nella  seconda  colonna,  sulla  stessa  riga,  il  numero  dei 

ragazzi che presentano quell’altezza. 

La  tabella che otteniamo è  riportata qui 

a destra: 

Abbiamo ottenuto una tabella semplice di dati statistici,  in grado di  fornirci già  in’immagine del 

fenomeno. 

I dati riportati nella seconda colonna (numero dei ragazzi) rappresentano la frequenza assoluta di 

ciascun dato (altezza), ovvero il numero di volte con cui il dato si presenta nell’indagine. 

Nome  Altezza 

Maria  145 

Giulio  148 

Mario  149 

Ernesto  151 

Giorgio 

140 

Elena  148 

Vittorio  149 

Marco  151 

Eleonora  145 

Fabio  140 

Ettore  149 

Massimo  151 

Cristian  145 

Rossana  149 

Elisabetta  138 

Roberto  145 

Walter  140 

Nicoletta  152 

Sara  145 

Nicola  148 

Altezza  Numero 

ragazzi 

138  1 

140  3 

145  5 

148  3 

149  4 

151  3 

152  1 

TOTALE  20 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 19/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 19 

Tabella delle frequenze 

Nel paragrafo precedente abbiamo realizzato una tabella con indicato il numero di volte con cui un 

dato si

 presenta

 nell’indagine,

 ovvero

 abbiamo

 indicato

 per

 ciascun

 dato

 la

 sua

 frequenza

 

assoluta. 

Può essere a volte opportuno indicare per ciascun dato il rapporto tra la sua frequenza assoluta e 

il totale dei casi esaminati. In tal caso si parla di frequenza relativa di un dato, che viene espressa 

in percentuale. 

Per ottenere la frequenza relativa di un dato si applica la seguente formula: 

frequenza relativa = (frequenza assoluta / totale casi) * 100 

Applicando tale formula alla nostra tabella delle altezze di 20 ragazzi otteniamo quanto segue: 

Altezza  Numero 

ragazzi 

138 

140  3 

145  5 

148  3 

149  4 

151  3 

152  1 

TOTALE  20 

Altezza  Frequenza 

assoluta 

Frequenza 

relativa 

138 

5% 

140  3  15% 

145  5  25% 

148  3  15% 

149  4  20% 

151  3  15% 

152  1  5% 

TOTALE  20  100% 

(1 / 20)*100

 = 5 

(3 / 20)*100 = 15 

(5 / 20)*100 = 25 

(3 / 20)*100 = 15 

(4 / 20)*100 = 20 

(3 / 20)*100 = 15 

(1 / 20)*100 = 5 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 20/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 20 

Tabella multipla  e tabella a doppia entrata 

Negli  esempi  fin  qui  riportati  non  abbiamo  preso  in  considerazione  il  fatto  che  gli  alunni  del 

campione selezionato

 sono

 sia

 maschi

 che

 femmine

 e che

 il fenomeno

 altezza

 può

 essere

 

influenzato dalla variabile statistica del sesso. 

E’ opportuno prevedere ciò  in  fase di definizione dell’indagine, per  raccogliere  i dati  in maniera 

opportuna e realizzare, pertanto una tabella multipla come la seguente: 

Anche  in questo  caso posiamo, oltre  alle  frequenze  assolute,  calcolare  e  riportare  in  tabella  le 

frequenze relative: 

Questa tabella è detta tabella multipla a doppia entrata: 

  multipla perché il fenomeno “altezza” è stato suddiviso in due entrate (ragazzi e ragazze); 

  a doppia  entrata perché per ogni  entrata  abbiamo una  suddivisione  in due  colonne, quella 

delle frequenze assolute e quella delle frequenze relative. 

Altezza  Numero 

ragazzi 

Numero 

ragazze 

138  0  1 

140  3  0 

145  2  3 

148  2  1 

149  3  1 

151  3  0 

152  0  1 

TOTALE  13  7 

Altezza  Numero ragazzi 

totale  % 

Numero ragazze 

totale  % 

138  0  0,0  1  14,3 

140  3  23,1  0  0,0 

145  2  15,4  3  42,9 

148  2  15,4  1  14,3 

149  3  23,1  1  14,3 

151  3  23,1  0  0,0 

152 

0,0 

14,3 

TOTALE  13  100,0  7  100,0 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 21/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 21 

Tabella per classi 

Supponiamo di eseguire un’indagine  sul  fenomeno  “altezza dei  ragazzi delle  classi quinte di un 

liceo” e di

 raccogliere

 i seguenti

 valori:

 

1,50  1,60  1,65  1,70  1,66  1,57  1,71  1,67  1,67  1,75 

1,61  1,76  1,58  1,77  1,62  1,79  1,70  1,55  1,78  1,74 

1,72  1,57  1,62  1,68  1,85  1,65  1,85  1,73  1,58  1,73 

1,65  1,78  1,66  1,61  1,71  1,54  1,70  1,54  1,68  1,74 

1,80  1,69  1,81  1,59  1,68  1,81  1,61  1,65  1,60  1,80 

1,72  1,64  1,73  1,68  1,82  1,63  1,69  1,69  1,82  1,85 

Come si può prevedere,  l’elaborazione di questi dati potrebbe non essere semplice  in quanto  le 

informazioni sono

 numeri

 completamente

 diversi

 tra

 loro.

 Calcolare

 la

 frequenza

 o la

 percentuale

 

di frequenza risulterebbe non solo laborioso, ma sopratutto poco significativo. 

In casi del genere si procede compattando  i risultati  in gruppi e realizzando tabelle suddivise per 

classi. Vediamo come procedere. 

Innanzitutto dobbiamo riscrivere i dati in ordine crescente: 

1,50  1,54  1,54  1,55  1,57  1,57  1,58  1,58  1,59  1,60 

1,60  1,61  1,61  1,61  1,62  1,62  1,63  1,64  1,65  1,65 

1,65 

1,65 

1,66 

1,66 

1,67 

1,67 

1,68 

1,68 

1,68 

1,68 1,69  1,69  1,69  1,70  1,70  1,70  1,71  1,71  1,72  1,72 

1,73  1,73  1,73  1,74  1,74  1,75  1,76  1,77  1,78  1,78 

1,79  1,80  1,80  1,81  1,81  1,82  1,85  1,82  1,85  1,85 

Consideriamo  l’intervallo numerico  tra  il dato più piccolo e quello più grande, cioè 1,50 ÷ 1,85; 

esso rappresenta il campo di variazione della variabile statistica considerata. 

Consideriamo gli estremi del campo di variazione e eseguiamo  la  loro differenza che vale 0,35 m 

(1,85   –  1,50  =  0,35).  Questa  differenza  è  detta  ampiezza  del  campo  di  variazione,  cioè  è 

l’ampiezza del

 raggruppamento

 di

 tutti

 i dati.

 

Suddividiamo l’ampiezza in opportuni intervalli uguali, ad esempio otto, ottenendo che l’ampiezza 

di ciascun intervallo vale 0,04 m (0,35 / 8 = 0,04) 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 22/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 22 

Possiamo a questo punto definire le otto classi di altezza che sono: 

1a classe : 1,50 ÷ 1,54  (da 1,50 a 1,50 + 0,04) 

2a classe : 1,55 ÷ 1,59  (da 1,55  a 1,55 + 0,04) 

3a classe : 1,60 ÷ 1,64  (da 1,60 a 1,60 + 0,04) 

4a classe : 1,65 ÷ 1,69  (da 1,65  a 1,65 + 0,04) 

5a classe : 1,70 ÷ 1,74  (da 1,70 a 1,70 + 0,04) 

6a classe : 1,75 ÷ 1,79  (da 1,75  a 1,75 + 0,04) 

7a classe : 1,80 ÷ 1,84  (da 1,80 a 1,80 + 0,04) 

8

classe 

1,85 

÷ 

1,89 

(da 

1,85 

1,85 

0,04) 

In queste otto classi sistemiamo la nostra popolazione: basterà considerare gli alunni appartenenti 

ad  ogni  classe  per  avere  la  frequenza  della  classe,  ovvero  la  distribuzione  di  frequenza  del 

raggruppamento dati. 

Classi di 

altezza 

Frequenza 

assoluta 

Frequenza 

relativa 

1,50 ÷ 1,54  3  5 

1,55 ÷ 1,59  6  10 

1,60 ÷ 1,64  9  15 

1,65 ÷ 1,69  15  25 

1,70 ÷ 1,74  12  20 

1,75 ÷ 1,79  6  10 

1,80 ÷ 1,84  6  10 

1,85 ÷ 1,89  3  5 

TOTALE  60  100 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 23/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 23 

LE RAPPRESENTAZIONI GRAFICHE 

I dati raccolti nelle tabelle possono essere rappresentati graficamente. 

I grafici più utilizzati sono gli istogrammi, i grafici a barre, i grafici a torta e i grafici a linea. 

La scelta del grafico dipende dal tipo di tabelle che abbiamo creato. 

Esistono vari programmi software che, partendo dalla serie dei dati raccolti  in tabella, realizzano 

automaticamente  il  grafico  desiderato. Generalmente  sono  i  programmi  per  l’elaborazione  dei 

cosiddetti fogli elettronici. 

I più

 popolari

 sono

 Microsoft

 Excel

 (contenuto

 nel

 pacchetto

 Microsoft

 Office,

 a pagamento)

 e 

OpenOffice Calc (software di tipo “open source”, totalmente gratuito). 

Tabella semplice (tabella di frequenza assoluta) 

In  questo  caso  il  grafico  più  opportuno  è  l’istogramma,  serie  di  barre  verticali  la  cui  altezza  è 

proporzionale al valore della frequenza. 

Altezza  Numero 

ragazzi 

138  1 

140  3 

145  5 

148  3 

149  4 

151  3 

152  1 

TOTALE  20 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 24/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 24 

Tabella delle frequenze relative 

In questo caso il grafico più opportuno è la torta che dà un immediato messaggio visivo di come i 

dati statistici

 sono

 distribuiti

 l’uno

 rispetto

 agli

 altri.

 

Tabella multipla 

Anche per le tabelle multiple l’istogramma rappresenta il grafico più adatto. 

Si  possono  realizzare  due  tipi  di  istogrammi,  a 

barre affiancate e a barre sovrapposte. 

Altezza  Frequenza 

assoluta 

Frequenza 

relativa 

138  1  5% 

140  3  15% 

145  5  25% 

148  3  15% 

149  4  20% 

151  3  15% 

152  1  5% 

TOTALE  20  100% 

Altezza  Numero 

ragazzi 

Numero 

ragazze 

138  0  1 

140  3  0 

145 

148  2  1 

149  3  1 

151  3  0 

152  0  1 

TOTALE  13  7 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 25/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 25 

Tabella multipla  e tabella a doppia entrata 

Non esiste un unico grafico che possa rappresentare tutti i dati di una tabella multipla e a doppia 

entrata. 

In  tal caso  si  ricorre a più di un grafico,  come ad esempio un  istogramma per  rappresentare  le 

frequenze assolute dei ragazzi e delle ragazze e due grafici a torta per la distribuzione relativa dei 

ragazzi (un grafico) e delle ragazze (secondo grafico). 

Tabella per classi 

Una  tabella  per  classi  differisce  da  una  tabella  semplice  solo  per  il  fatto  che  l’evento  è 

rappresentato non da un valore singolo ma da un intervallo di valori. 

Una tabella per classi può pertanto essere ben rappresentata 

da istogrammi. 

Altezza  Numero ragazzi 

totale  % 

Numero ragazze 

totale  % 

138  0  0,0  1  14,3 

140  3  23,1  0  0,0 

145  2  15,4  3  42,9 

148  2  15,4  1  14,3 

149  3  23,1  1  14,3 

151 

23,1 

0,0 

152  0  0,0  1  14,3 

TOTALE  13  100,0  7  100,0 

Classi di 

altezza 

Frequenza 

assoluta 

Frequenza 

relativa 

1,50 ÷ 1,54  3  5 

1,55 ÷ 1,59  6  10 

1,60 ÷ 1,64

 9 

15 

1,65 ÷ 1,69  15  25 

1,70 ÷ 1,74  12  20 

1,75 ÷ 1,79  6  10 

1,80 ÷ 1,84  6  10 

1,85 ÷ 1,89  3  5 

TOTALE  60  100 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 26/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 26 

Grafici a linea 

Può  capitare che  i dati  in nostro possesso  siano dati che  rappresentano  l’evoluzione nel  tempo 

dell’evento osservato,

 come

 l’andamento

 giornaliero

 delle

 quotazioni

 in

 borsa

 di

 un

 titolo

 

azionario o le temperature rilevate nello stesso posto ad intervalli regolari. 

In  questo  caso  i  grafici  a  linea  costituiscono  la  rappresentazione  ideale  in  quanto  danno 

immediatamente un messaggio  “visivo”  sull’andamento del  fenomeno, oltre  a  rappresentarne  i 

valori. 

Nell’esempio qui riportato sono  indicate  le temperature minime e massime rilevate a Torino nel 

periodo 1/10/2006  – 1/09/2007 (per semplicità sono state riportate le temperature del primo del 

mese). 

Data  Temp. 

minima 

1/09/2007  15,8  27,4 

1/08/2007  15,7  28,3 

1/07/2007  19,8  29,2 

1/06/2007  12,4  19,8 

1/05/2007  14,3  21,8 

1/04/2007  7,3  11,0 

1/03/2007 

4,3 

13,9 

1/02/2007  ‐1,7  11,8 

1/01/2007  0,2  8,6 

1/12/2006  3,1  13,2 

1/11/2006  7,1  20,4 

1/10/2006  17,1  22,4 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 27/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 27  

GLI INDICATORI STATISTICI : INDICI DI POSIZIONE 

Gli  indici, o  indicatori statistici, sono  i risultati di funzioni matematiche che vengono utilizzati per 

effettuare una sintesi dei dati. 

Gli indici più frequentemente utilizzati sono: 

  gli indici di posizione: danno un’idea approssimata dell’ordine di grandezza dei valori esistenti. 

I più utilizzati sono la moda, la media, la mediana e i quantili. 

  gli  indici di dispersione: vengono utilizzati per descrivere sinteticamente come  i valori di una 

distribuzione sono

 distanti

 da

 un

 valore

 centrale

 (identificato

 solitamente

 con

 la

 media

 o con

 la

 

mediana) 

MODA 

Si chiama MODA di un’indagine statistica il dato o la classe di dati che ha maggiore frequenza. 

In questo caso la frequenza maggiore è 5 e corrisponde al numero di 

ragazzi alti 145 cm. 

Pertanto, la moda è 145. 

In una distribuzione può esserci un solo valore avente la maggiore frequenza, oppure due valori o 

più: in tal caso si parla di distribuzione unimodale, bimodale, trimodale, e così via. 

Altezza  Numero 

ragazzi 

138  1 

140  3 

145  5 

148  3 

149  4 

151  3 

152  1 

TOTALE  20 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 28/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 28 

MEDIA ARITMETICA 

In un  insieme di dati statistici numerici  la MEDIA ARITMETICA viene utilizzata per riassumere un 

insieme di

 dati

 con

 un

 solo

 valore.

 

Per calcolare la media di una distribuzione semplice si devono sommare tutti i dati e dividere tale 

somma per il numero dei dati. 

In presenza di una tabella di frequenza si calcola la media aritmetica ponderata ( o pesata). 

I  singoli  valori prima di  essere  sommati  vengono moltiplicati  con  il peso  (ponderazione)  a  loro 

assegnato, ovvero al numero di volte (frequenza) in cui i valori compaiono. 

La somma ottenuta deve poi essere divisa non con il numero di valori ma con la somma dei pesi. 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 29/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 29 

E’ possibile calcolare  la media aritmetica ponderata anche nel caso di distribuzioni per classi, ma 

bisogna prima sostituire le classi con il loro valore medio, come nell’esempio che segue: 

A questo punto si può calcolare la media aritmetica ponderata. 

MEDIANA 

Si dice MEDIANA di un insieme di dati statistici numerici, disposti  in ordine crescente,  il dato che 

occupa il posto centrale. 

Per determinare la mediana si procede in modi differenti secondo che abbiamo una distribuzione 

semplice, una distribuzione ponderata o una per classi. 

Caso 1 –  Distribuzione semplice Scrivendo

 i dati

 in

 ordine

 crescente,

 se

 i dati

 sono

 in

 numero

 dispari

 la

 mediana

 è il termine

 che

 

occupa  il posto centrale; se  i dati sono  in numero pari,  la mediana è  rappresentata dalla media 

aritmetica tra i due valori centrali. 

Per calcolare  in maniera semplice qual è / quali sono  i termini centrali, basta dividere per due  il 

numero totale dei dati. 

Esempio: se abbiamo una serie di 49 dati, poiché 49 / 2 = 24 con il resto di 1, il termine di mezzo è 

il 25esimo (che avrà 24 dati a destra e 24 dati a sinistra). 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 30/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 30 

Se abbiamo una serie di 150 dati, poiché 150 / 2 = 75,  i due termini centrali sono  il 75esimo e  il 

76esimo. La mediana è data dalla media aritmetica di questi due valori, ottenibile sommandoli tra 

loro e dividendo il risultato per 2. 

Caso 2 –  Distribuzione  ponderata Si

 calcolano

 anzitutto

 le

 frequenze

 cumulate.

 A

 questo

 scopo

 si

 scrivono

 ordinatamente

 la

 prima

 

frequenza, la somma delle prime due, la somma delle prime tre, e così via 

Operando  come  nel  caso  di  una  distribuzione  semplice,  si 

calcola che la mediana è il 30esimo termine. 

Nella colonna delle frequenze cumulate si ricava che il 30esimo 

termine vale 21: pertanto la mediana è 21. 

Valore  Frequenza  Frequenza 

cumulata 

20  12  12 

21  19  31 

22  18  49 

23  7  56 

26 

58 

30  1  59 

TOTALE  59 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 31/37

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 32/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 32 

QUANTILI 

Si può reinterpretare  la mediana come  la più piccola modalità che divide  la serie dei dati  in due 

parti uguali,

 lasciando

 il 50%

 delle

 unità

 statistiche

 alla

 sua

 sinistra

 e il 50%

 alla

 sua

 destra.

 

Se invece divido la serie delle unità statistiche in più di due parti uguali, allora si parla di quantili. 

I quantili sono modalità del carattere che suddividono  la distribuzione dei dati  in q distribuzioni 

parziali ciascuna contenente 1/q della numerosità totale. 

In questo senso la mediana diventa il quantile di ordine q=1/2. 

Se  q=4,  allora  si  parla  di  quartili.  I  quartili  ripartiscono  la  distribuzione  in  quattro  parti 

caratterizzate dalla stessa numerosità, pari al 25% della numerosità totale. 

Il primo quartile è  il valore o  l’insieme dei valori per cui  la frequenza cumulata vale 0,25  (pari al 

25% ), il secondo quartile coincide con la mediana, il terzo quartile è il valore o l’insieme dei valori 

per cui la frequenza cumulata vale 0,75 (pari al 75% ). 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 33/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 33 

GLI INDICATORI STATISTICI : INDICI DI DISPERSIONE 

Consideriamo i seguenti dati: 

Tre studenti, nel primo quadrimestre, hanno riportato  le seguenti successioni di voti nelle prove 

scritte di matematica: 

Se  calcoliamo  le medie  aritmetiche  e  le mediane  dei  voti  di  ogni  studente,  vediamo  che  esse 

coincidono: 

Nonostante ciò, è evidente che le tre successioni di voti sono diverse tra loro. 

Per evidenziare queste differenze si deve introdurre il concetto di variabilità: 

La variabilità è l’attitudine che la grandezza in oggetto ha di assumere valori più o meno diversi tra 

loro. 

Se  i  dati  sono  vicini  al  loro  valore medio,  allora  la  variabilità  è  bassa.  Se  i  dati  si  discostano 

fortemente dal loro valore medio allora la variabilità è alta. 

La variabilità dei dati  viene misurata  attraverso nuovi  indici, detti  indici di variabilità o  indici di 

dispersione,  che  sono  il  campo di variazione,  lo  scarto  semplice medio,  lo  scarto quadratico,  la 

varianza e lo scarto quadratico medio. 

Studente  Voti 

Anna  5  6  6  7 

Giovanni 

Giuseppe  3  4  8  9 

Studente  Media  Mediana 

Anna  6  6 

Giovanni 

Giuseppe  6  6 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 34/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 34 

Campo di variazione 

E’  l’indice di variabilità più semplice. E’ dato dalla differenza tra il dato massimo e  il dato minimo 

ed equivale

 all’ampiezza

 dell’intervallo

 che

 contiene

 tutti

 i dati.

 

Con riferimento all’esempio precedente abbiamo: 

il campo di variabilità dei voti di Anna è :  7  – 5 = 2 

il campo di variabilità dei voti di Giovanni è : 8  – 4 = 4 

il campo di variabilità dei voti di Giuseppe è : 9  – 3 = 6 

Pertanto si può dedurre che i voti di Anna sono pressoché costanti, mentre quelli di Giuseppe sono 

molto diversi tra loro. 

Il campo di variazione non è però un buon  indice di variabilità: se consideriamo, ad esempio, un 

quarto studente, Mario, i cui voti sono 4, 4, 8, 8, è evidente che il campo di variazione è lo stesso 

di  quello  di  Giovanni, ma  la  variabilità  (ovvero  l’attitudine  che  la  grandezza  in  oggetto  ha  di 

assumere valori diversi tra loro) è diversa. 

Pertanto, il campo di variazione non è sufficiente e si deve ricorrere a nuovi indici di variabilità più 

sensibili. 

Scarto semplice medio 

Per calcolare lo scarto semplice medio si procede nel seguente modo. 

Si calcola  innanzitutto  lo scarto semplice,  rappresentato dalla differenza del singolo valore dalla 

media  (Xi  – M).  Gli  scarti  semplici possono essere  sia positivi  che negativi, e  la  loro  somma  è 

uguale a zero. 

Infatti, se consideriamo per esempio i voti di Giuseppe (3, 4, 8, 9, la cui media vale 6) e calcoliamo 

la somma degli scarti semplici abbiamo: 

(3  – 6) + (4  – 6) + (8  – 6) + (9  – 6) = (‐ 3) + (‐ 2) + (+ 2) + (+ 3) = 0 

Si ricorre pertanto allo scarto semplice medio ottenuto calcolando  la media aritmetica dei valori 

assoluti degli scarti semplici, ovvero la media degli scarti semplici presi con il segno positivo: 

( |3  – 6| + |4  – 6| + |8  – 6| + |9  – 6| ) / 4 = ( (+ 3) + (+ 2) + (+ 2) + (+ 3) ) / 4 = 10 / 4 = 2,5 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 35/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 35 

Varianza 

Lo scarto semplice medio, sebbene dia indicazioni su come i valori della distribuzione differiscono 

tra loro, risulta insufficiente quando i campi di variazione sono minimi. 

Si ricorre

 pertanto

 alla

 varianza,

 indicatore

 di

 dispersione

 che

 vale

 zero

 solo

 nei

 casi

 in

 cui

 tutti

 i 

valori sono uguali tra di  loro (e pertanto uguali alla  loro media) e che cresce con  il crescere delle 

differenze reciproche dei valori. 

La varianza viene calcolata nel seguente modo: si calcolano gli scarti quadratici che sono i quadrati 

degli scarti semplici, e se ne calcola la media aritmetica. 

Considerando anche stavolta i voti di Giuseppe abbiamo: 

( (3  – 6)2 + (4  – 6)

2 + (8  – 6)

2 + (9  – 6)

2 ) / 4 = 

( (‐ 3)2 + (‐ 2)

2 + (+ 2)

2 + (+ 3)

2 ) / 4 = 

( 9 + 4 + 4 + 9 ) / 4 = 26 / 4 = 6,5 

Se calcoliamo anche la varianza dei voti di Anna e di Giovanni avremo: 

Deviazione standard 

La 

varianza 

esprime 

meglio 

la 

distribuzione 

dei 

valori 

ma 

l’elevamento 

al 

quadrato 

rappresenta 

un’anomalia che può essere  recuperata solo con un’operazione  inversa,  l’estrazione della radice 

quadrata. 

Il valore che otteniamo è la deviazione standard, indicata con la lettera  σ  (sigma), ed è l’indice di 

variabilità più utilizzato per misurare la dispersione dei dati intorno al valore atteso. 

Nella tabella che segue sono indicati i vari indici di variabilità calcolati sui voti di Anna, Giovanni e 

Giuseppe: 

Studente  Campo di 

variazione 

Scarto 

semplice 

medio 

Varianza  Scarto 

quadratico 

medio 

Anna  2  0,5  0,5  0,70 

Giovanni  4  1,5  2,5  1,58 

Giuseppe  6  2,5  6,5  2,54 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 36/37

Renato  Agati  –   Appunti  di  Statistica  Pagina 36 

GLI INDICATORI STATISTICI : QUANDO, COME, PERCHE’ 

Quando è preferibile utilizzare la MODA? 

• La moda è calcolabile sia con variabili qualitative, sia con quelle quantitative, ciò che conta 

è la frequenza dei dati. 

• La moda diventa importante quando tra tutti i dati ne spicca uno con frequenza massima 

• Se tra i dati parecchi hanno la stessa frequenza o frequenze simili, e non ne spicca uno in 

particolare, la moda non dà grandi soddisfazioni 

• Se i dati hanno tutti frequenza 1 (cioè tutti diversi tra loro) la moda non esiste. 

Quando è preferibile utilizzare la MEDIA? 

• La media è calcolabile solo se i dati sono numerici. 

• La  media  è  più  utile  (più  significativa)  quando  la  distribuzione  dei  dati  è  abbastanza 

uniforme 

• La media permette di confrontare due sequenze di dati anche se il numero di dati raccolti 

nelle due sequenze è diverso 

Quando è preferibile utilizzare la MEDIANA? 

• La mediana  è  calcolabile  solo  se  i  dati  sono  riferiti  a  variabili  quantitative  o  qualitative 

ordinate. 

• La mediana,

 a differenza

 della

 media,

 non

 è influenzata

 dal

 fatto

 che

 i dati

 non

 siano

 

uniformi, ma dipende solo dalla loro distribuzione. 

8/3/2019 Appunti Di Statistica Ottimo

http://slidepdf.com/reader/full/appunti-di-statistica-ottimo 37/37

Renato Agati 

http://www.renatoagati.com