Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... ·...

13
Modello per la redazione dell'esercitazione di laboratorio Facoltà di Medicina Veterinaria, Università di Padova Corso di Laurea in Sicurezza igienico-sanitaria degli alimenti Metodologie statistiche per l’analisi del rischio Esercitazione di laboratorio Statistica descrittiva 1

Transcript of Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... ·...

Page 1: Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... · Web viewMinitab suddivide in maniera automatica la scala X. Per suddividerla in

Modello per la redazione dell'esercitazione di laboratorio

Facoltà di Medicina Veterinaria, Università di Padova

Corso di Laurea inSicurezza igienico-sanitaria degli alimenti

Metodologie statistiche per l’analisi del rischio

Esercitazione di laboratorioStatistica descrittiva 1

Data:Gruppo:Datasheet:

Dr. ing. Manuel [email protected]

Page 2: Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... · Web viewMinitab suddivide in maniera automatica la scala X. Per suddividerla in

Esercitazione di laboratorio - Statistica descrittiva 1

INDICE

1. Descrizione dell'esperimento.........................................................................................................32. Analisi statistiche........................................................................................................................... 4

2.1 Rappresentazione grafica mediante dotplot..................................................................42.2 Istogramma di frequenza e di frequenza cumulata.......................................................52.3 Indici statistici di posizione e di variabilità.....................................................................72.4 Boxplot...........................................................................................................................72.5 Probability plot...............................................................................................................8

3. Considerazioni conclusive............................................................................................................10

2

Page 3: Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... · Web viewMinitab suddivide in maniera automatica la scala X. Per suddividerla in

Esercitazione di laboratorio - Statistica descrittiva 1

1. Descrizione dell'esperimento

Una pipetta graduata viene utilizzata per prelevare 1 ml di acqua distillata. Il contenuto di liquido prelevato viene successivamente pesato. L'esperimento viene replicato 50 volte. Scopo dell'esperimento è valutare la variabilità nell'erogazione del liquido.I dati ricavati dalla sperimentazione sono riportati nella Tabella 1.

Esperim_N Peso1 0.9482 1.0123 1.0854 1.0635 1.016 17 0.9948 0.9869 0.99510 0.99911 0.96912 0.96513 0.94514 0.97715 0.95716 0.94617 0.9618 0.95519 1.0120 0.96521 0.97522 0.97223 0.95724 0.96125 0.97526 0.98827 0.98928 0.97429 0.9830 0.9831 1.00132 0.97733 1.02134 1.05135 0.96536 0.96337 0.97138 0.98339 0.96240 0.98441 0.97842 0.96843 0.9644 1.02745 0.959

3

Page 4: Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... · Web viewMinitab suddivide in maniera automatica la scala X. Per suddividerla in

Esercitazione di laboratorio - Statistica descrittiva 1

46 0.98547 0.98548 0.96749 0.9650 0.992

Tabella 1: Dati sperimentali

2. Analisi statistiche

Le analisi statistiche condotte sui dati sperimentali sono:

Rappresentazione grafica mediante dotplot Istogramma di frequenza e di frequenza cumulata Calcolo di indici statistici di posizione (mediana, quartili, media) e di variabilità Boxplot modificato Probability plot Sommario grafico delle analisi statistiche condotte

2.1 Rappresentazione grafica mediante dotplot

Per creare il dotplot, cliccare su graph ---> Dotplot.Nella finestra di dialogo selezionare One Y - Simple

La Figura 1 riporta il Dotplot del peso dell'acqua erogata dalla pipetta.E' possibile osservare che la maggior parte dei dati tende ad "addensarsi" attorno ad un valore centrale (che però è minore di 1 ml).Il valore massimo di peso è pari a 1.085 mlIl valore minimo di peso è pari a 0.945 mlI dati cadono quindi in un range di 0.14 ml.

Figura 1: Dotplot del peso dell'acqua erogata dalla pipetta

4

Page 5: Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... · Web viewMinitab suddivide in maniera automatica la scala X. Per suddividerla in

Esercitazione di laboratorio - Statistica descrittiva 1

Ricordarsi di utilizzare il comando brush (Editor ---> Brush), per conoscere valori di dati presenti in un grafico

2.2 Istogramma di frequenza e di frequenza cumulata

L'istogramma di frequenza può essere generato da riga di comando.Prima occorre abilitare i comandi (Editor ---> Enable commands).Quindi digitare Histogram 'nome della variabile', seguito da invio:

MTB > Histogram 'Peso [ml]'

Per creare un grafico di frequenza cumulata, utilizzare la sintassi che segue:

MTB > Histogram 'Peso [ml]';SUBC> cumulative;SUBC> area.

In questo caso è necessario far seguire tutti i comandi (tranne l'ultimo) dal punto e virgola. L'ultimo comando finisce con il punto.

Per approfondire la descrizione della distribuzione dei dati, partendo dal valore minimo di 0.945, l'intervallo di osservazione dei dati (di ampiezza 0.14 ml) viene diviso in 15 intervalli di uguale ampiezza. L'istogramma di frequenza per la variabile Peso è riportato in Figura 2. Dalla figura è possibile notare che la frequenza maggiore (10) si ha per intervallo di peso compreso tra 0.955 e 0.965 ml.

Figura 2: Istogramma di frequenza per la variabile Peso.

5

Page 6: Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... · Web viewMinitab suddivide in maniera automatica la scala X. Per suddividerla in

Esercitazione di laboratorio - Statistica descrittiva 1

Posizionando il mouse sopra le barre è possibile ottenere informazioni sui dati (frequenza e intervallo)

Sommando via via le frequenze in maniera cumulata rispetto agli intervalli, si ottiene la cosiddetta frequenza cumulata, che dice quante osservazioni cadono fino ad una certa soglia. Questo grafico è riportato in Figura 3.

Figura 3: Istogramma di frequenza cumulata per la variabile Peso.

Dal grafico è possibile osservare che il peso è inferiore a 1 ml per circa l'80% delle osservazioni.

Per default minitab nella scala Y riporta la frequenza cumulata. Per avere in Y la percentuale, occorre cliccare col tasto destro sulla scala Y, selezionare Edit Y scale e nella finestra di dialogo, alla voce Type, selezionare Percent

Minitab suddivide in maniera automatica la scala X. Per suddividerla in un numero diverso di intervalli occorre cliccare col tasto destro sulla scala X, selezionare Edit X scale, alla voce Binning, selezionare number of intervals e digitare il numero di intervalli desiderato.

2.3 Indici statistici di posizione e di variabilità

6

Page 7: Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... · Web viewMinitab suddivide in maniera automatica la scala X. Per suddividerla in

Esercitazione di laboratorio - Statistica descrittiva 1

Indici di posizione e variabilità sono calcolati da minitab anche mediante istruzione da riga di comando. I risultati dell'analisi sono visualizzati nella session windowPrima occorre abilitare i comandi (Editor ---> Enable commands).Quindi digitare Describe 'nome della variabile', seguito da invio:

MTB > Describe 'Peso [ml]'

Gli indici statistici di posizione e di variabilità sono riassunti nella Tabella 2

Minimo 0.94500Massimo 1.08500Mediana 0.97700

Q1 0.96275Q3 0.99425

IQR 0.03150Media 0.98302

Deviazione standard 0.02868Tabella 2: Indici statistici di posizione e di variabilità (dati espressi in ml).

2.4 Boxplot

Per generare il Boxplot occorre cliccare su Graph ---> Boxplot e nella finestra di dialogo, selezionare One Y e Simple. Nella successiva finestra di dialogo selezionare la variabile e cliccare quindi su OK.

Il Boxplot modificato fornisce la rappresentazione grafica dei 5 numeri di sintesi: Min*, Q1, Mediana, Q3 e Max*. I valori che oltrepassano le soglie Max* sono indicati con un asterisco. Essi possono essere cosiderati come dati anomali (outlier) nel campione di dati. Per costruzione, all'interno del box è contenuto il 50 % dei dati osservati. Il Boxplot dei dati relativi al peso dell'acqua erogata dalla pipetta è riportato in Figura 4. Nel boxplot sono evidenziati 3 outlier. La forma del box indica che la maggior parte delle pipette contiene una quantità di liquido inferiore rispetto al valore nominale di 1 [ml].

7

Page 8: Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... · Web viewMinitab suddivide in maniera automatica la scala X. Per suddividerla in

Esercitazione di laboratorio - Statistica descrittiva 1

Figura 4: Boxplot del peso dell'acqua erogata dalla pipetta.

2.5 Probability plot

Un probability plot è un grafico a due dimensioni in cui le osservazioni sono riportate sull'asse verticale e a ciascuna di esse viene fatto corrispondere sull'asse orizzontale il relativo quantile di una distribuzione di probabilità (normale, log-normale, ecc.).

Per creare una probability plot cliccare su Graph ---> Probability plot e quindi nella finestra di dialogo selezionare la variabile e quindi la distribuzione cui confrontare i dati.

Le probability plot della variabile peso per la distribuzione log-normale e normale sono mostrate rispettivamente in Figura 5a e 5b.

(a) (b)Figura 5: Normal probability plot per distribuzione Log-normale (a) e normale (b).

Per valutare se i dati osservati si distribuiscono approssimativamente secondo la legge di distribuzione di probabilità scelta occorre valutare i risultati del test di Anderson-Darling (AD nel

8

Page 9: Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... · Web viewMinitab suddivide in maniera automatica la scala X. Per suddividerla in

Esercitazione di laboratorio - Statistica descrittiva 1

grafico) e il relativo p-value. In generale è possibile affermare che valori bassi della statistica Anderson-Darling e p-value non significativo indicano che la distribuzione ipotizzata si adatta bene ai dati. In questo caso i p-value significativi (< 0.005) indicano che nessuna delle due distribuzioni si adatta ai dati sperimentali.

2.6 Sommario grafico delle analisi statistiche condotte

Per creare sommario grafico (Graphical Summary) cliccare su Stat ---> Basic Statistics ---> Graphical Summary. Nella finestra di dialogo che si apre selezionare la variabile su cui condurre le analisi e cliccare quindi su OK.

In Figura 6 è riportato un sommario grafico delle analisi statistiche condotte.

Figura 6: Sommario grafico delle analisi condotte sulla variabile Peso.

Il sommario grafico include quattro grafici: l'istogramma dei dati con la distribuzione normale, il boxplot, l'intervallo di confidenza al 95% per , l'intervallo di confidenza al 95% per la mediana.

Il sommario grafico mostra inoltre Test di Anderson-Darling per la distribuzione normale, Statistica descrittiva, Intervalli di confidenza per media, mediana e deviazione standard.

9

Page 10: Guida introduttiva all'uso di Minitabstatic.gest.unipd.it/~livio/File vari/sia/Esercitazione... · Web viewMinitab suddivide in maniera automatica la scala X. Per suddividerla in

Esercitazione di laboratorio - Statistica descrittiva 1

Osservando i dati è possibile notare come l'intervallo di confidenza per la media non contiene il valore 1 ml. Questo dato rileva che lo strumento utilizzato non è tarato e/o è stato commesso un errore sistematico in fase di prelievo.

3. Considerazioni conclusive

L'analisi dei dati ha evidenziato che la maggior parte delle pipette contiene una quantità di liquido inferiore rispetto al valore nominale di 1 [ml]. L'intervallo di confidenza per la media non contiene il valore 1 [ml].Questo fatto potrebbe essere indicatore o di un errore sistematico da parte dell'operatore nel prelevare il liquido (si è fermato a prelevare sempre poco prima di raggiungere il livello di 1 ml), oppure l'operatore ha eseguito correttamente i prelievi ma è presente un'imprecisione nella gradazione della pipetta utilizzata. Forse una numerosità campionaria maggiore e affidare il prelievo a diversi tecnici di laboratorio potrebbe chiarire meglio il motivo di questo andamento dei dati.

10