· Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi...

29

Click here to load reader

Transcript of   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi...

Page 1:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

ESERCITAZIONE N.1

“ANALISI GRAFICHE”

Richiami Teorici

L’analisi grafica si divide in due gruppi distinti tra di loro in base al tipo di variabili che

andiamo ad analizzare.

Le variabili che prende in considerazione il tipo di studio (o la rilevazione campionaria) in

questione possono essere distinte in:

1- variabili quantitative

2- variabili categoriche o qualitative

1- variabili quantitative: esse studiano la distribuzione di un fenomeno che si esprime

tramite modalità misurabili con grandezze facenti parti di una scala continua; in particolare,

aiutano a comprendere l’evoluzione temporale del fenomeno, la distribuzione, i problemi e

le cause dei problemi che un processo può avere.

I più importanti grafici che vengono utilizzati per lo studio di un fenomeno che si articola in

variabili quantitative sono:

- ISTOGRAMMI

- RAMI E FOGLIE (STEAM AND LEAF)

- CUMULATA

- BOX-PLOT (SCATOLA E BAFFI)

2- variabili categoriche: aiutano a comprendere le caratteristiche del fenomeno, quando

questo si esprime tramite modalità misurabili tramite conteggio o enumerazione.

I grafici utilizzati per lo studio di variabili di questo tipo sono:

- BARRE

- TORTA

- PARETO

1

Page 2:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

A) Istogrammi

Iniziamo con alcuni esempi riguardanti i grafici delle variabili quantitative, in particolare

gli ISTOGRAMMI.

L’istogramma è un grafico che rappresenta la distribuzione di frequenza di una variabile

continua attraverso dei rettangoli. I valori delle variabili sono suddivisi in classi (intervalli)

che vengono riportati sull’asse delle ascisse e costituiscono la base dei rettangoli le cui

aree sono proporzionali alla frequenza di ciascuna classe.

ESERCIZIO 1

Per disegnare l’istogramma devo calcolare l’ampiezza delle classi che rappresenta la

base dei rettangoli sull’asse delle ascisse (Δi = simbolo dell’ampiezza della classe).

Poi abbiamo bisogno anche di calcolare la frequenza (dato che l’area del rettangolo è

proporzionale alla frequenza) e cioè il numero di elementi compresi in una classe, che

indicherò con ni.

E infine devo trovare la densità hi = fi / Δi (che leggerò sull’asse delle ordinate) e che

indica per ogni classe l’altezza del rettangolo corrispondente. Per calcolare la densità ho

bisogno delle frequenze relative e cioè della percentuale di persone che appartiene alla

classe (fi = ni / Σ ni).

Classi di spesa Δi = xi+1 –xi ni fi = ni / Σ ni hi = fi /Δi

0-20 20 10 0.10 (10/100) 0.005

20-40 20 25 0.25 (25/100) 0.0125

40-60 20 40 0.40 (40/100) 0.0200

60-80 20 20 0.20 (20/100) 0.0100

80-100 20 5 0.05 (5/100) 0.0025

TOTALE 100 1

Notato che l’ampiezza delle classi è, in questo caso, costante, possiamo andare a

costruire il grafico relativo ai dati individuati nella tabella.

2

Page 3:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

densità

0.020

0.015

0.010

0.005

0.000 0 20 40 60 80 100 classe

ESERCIZIO 2

Per risolvere questo esercizio costruiamo una tabella nella quale raggruppiamo tutti i valori

che dobbiamo calcolare per costruire il grafico:

(la procedura di risoluzione è la stessa vista nell’esercizio precedente, cambia solo

l’ampiezza delle classi che in questo caso non è costante)

Nella tabella seguente sono riportati i risultati dei calcoli:

Classe d’età Δi ni fi hi

5-10 5 28 0.14 (28/200) 0.028

10-20 10 52 0.26 (52/200) 0.026

20-30 10 50 0.25 (50/200) 0.025

30-40 10 30 0.15 (30/200) 0.015

40-60 20 34 0.17 (34/200) 0.0085

60-80 20 6 0.03 (6/200) 0.0015

TOTALE 200 1

3

Page 4:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

densità

0.025

0.020

0.015

0.010

0.005

0.000

0 20 40 60 80 classe

B) Grafico a Barre

Nel prossimo esercizio viene messa in evidenzia la differenza tra istogramma e grafico a

barre, utilizzato per lo studio di fenomeni che si manifestano con modalità appartenenti

alla seconda categoria, quella delle variabili categoriche o qualitative.

Il diagramma a barre è concettualmente molto simile ad un normale istogramma; l’unica

differenza sta nel fatto che le singole barre hanno come base una ampiezza

convenzionale, mentre l’altezza rappresenta sempre la frequenza.

ESERCIZIO 3

Per disegnare il grafico a barre devo determinare la frequenza che in questo caso si

calcola prendendo in considerazione quante persone comprano un determinato numero di

cd.

Notiamo che:1 persona compra 15 cd, 2 persone comprano 10 cd, 1 persona compra 9

cd, 3 persone comprano 8 cd, 1 persona compra 7 cd, 2 persone comprano 5 cd.

4

Page 5:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

Possiamo, con questi dati, costruire una tabella riassuntiva che ci consentirà di costruire il

diagramma a barre.

CD acquistati ni

5 2

7 1

8 3

9 1

10 2

15 1

TOTALE 10

3

2

1

5 7 8 9 10 15

ESERCIZIO 4

1) Dobbiamo prendere in considerazione solo una classe quella che va da 50 addetti in

su; la variabile P in miliardi di lire è organizzata in intervalli contigui, si tratta quindi di

una variabile quantitativa, dunque dovremo utilizzare una rappresentazione del

fenomeno tramite istogramma.

Dobbiamo quindi ricostruire la tabella sommando tra di loro le frequenze relative agli

individui che appartengono alla seconda (50-200) e alla terza (200-600) classe.

P in miliardi di lire

5

Page 6:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

n. addetti A 0-1 1-2.5 2.5-20 Totale

200-600 120 290 30 440

Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le

variabili che ci interessano: l’ampiezza della classe, la frequenza, la densità:

classi di P Δi ni fi hi (densità)

0-1 1 120 0,273 (120/440) 0,273 (0,273 / 1)

1-2.5 1.5 290 0.439 (290/440) 0.439 (0.439 / 1.5)

2.5-20 17.5 30 0.068 (30/440) 0.034 (0.068 / 17.5)

Totale 440

densità

0.45

0.35

0.25

0.15

0.05

0.00

1 2.5 5 10 15 20 P

2) In questo caso bisogna considerare solo la frequenza totale della tabella iniziale e non

la divisione in classe (in base al numero degli addetti). Questo tipo di dati, coi quali

voglio solamente valutare la distribuzione dei casi tra le differenti classi (suddivise in

6

Page 7:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

base alla produzione in miliardi di lire) possono essere raffigurati tramite un grafico a

barre. Sull’asse delle ascisse si posizionano le varie classi di produzione e su quello

delle ordinate la frequenza totale.

Produzione (mld) Frequenze

0-1 720

1-2,5 350

2,5-20 30

Totale 1100

Freq. Assol.

720

350

30

0-1 0-2.5 2.5-20 Classi (produzione in mld di lire)

C) Grafico Ramo-Foglia (Steam and Leaf)

Passiamo ora ad un altro tipo di grafico utilizzato per variabili quantitative, il grafico a

rami e foglie.

Ciascun numero rappresentante il nostro fenomeno deve essere composto da almeno 2

cifre; per ottenere il grafico suddivido il numero in 2 parti:

RAMO: cifra iniziale

FOGLIA: cifre rimanenti

Il criterio di suddivisione è arbitrario, dipende dal tipo di dettaglio che vogliamo ottenere.

7

Page 8:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

Definiti i rami, essi vengono elencati nel margine sinistro della tabella; accanto ad essi,

separati da una linea, scriverò tutte le foglie corrispondenti ai valori osservati, separate tra

di loro con la virgola; ordinando i rami e le foglie in ordine crescente, si potrà individuare

facilmente la distribuzione dei dati; il problema maggiore è che non si terrà più conto

dell’ordine temporale con cui i dati sono stati osservati.

Il vantaggio di questo tipo di grafico è quello di riuscire a vedere la forma della

distribuzione e di avere un’informazione più analitica dei singoli dati (informazione che

veniva invece persa nell’istogramma e nei grafici a barre, che erano utili solo per capire

quale fosse la distribuzione e la variabilità di un fenomeno).

ESERCIZIO 5

Il dato minimo è 37 (Valle d’Aosta) e quello massimo è 426 (Campania); se prendiamo

come ramo la cifra delle centinaia il grafico ramo-foglia risultante sarà:

0 37, 67, 98, 74, 61, 69,

1 69, 51, 78, 53, 50, 18, 37, 99

2 43, 11

3 77, 03, 05

4 26

Il ramo 0 raggruppa tutte le densità inferiori a 100, il ramo 21 quelle comprese

nell’intervallo [100, 200), e così via…

Le foglie appartenenti allo stesso ramo sono separate da virgole; sul ramo 3 ci sono 3

foglie il che significa che 3 regioni hanno densità compresa nell’intervallo [300, 400); in

termini più precisi la frequenza assoluta della classe [300, 400) è 3.

Per avere una corretta rappresentazione grafica della distribuzione è opportuno riordinare

in ordine crescente la foglie all’interno dello stesso ramo, la versione definitiva del grafico

diventa quindi:

0 37, 61, 67, 69, 74, 98

1 18, 37, 50, 51, 53, 69, 78, 99

2 11, 43

8

Page 9:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

3 03, 05, 77

4 26

D) Grafico delle Cumulate

Il grafico della cumulata rappresenta la distribuzione di un fenomeno. La frequenza di ogni

classe è uguale alla sommatoria della frequenza delle classi precedenti: per la frequenza

della seconda classe, ad esempio, si parte dalla frequenza presente nella prima classe e

si aggiunge a questa la frequenza della seconda classe; così via fino ad arrivare all’ultima

classe che sarà data dalla frequenza cumulata delle classi precedenti.

In questo modo si riesce a vedere con che velocità le frequenze sono cumulate nelle

diverse classi.

Se la distribuzione è normale la cumulata sarà caratterizzata da un grafico che ha una

brusca accelerazione al centro e ha un andamento più piatto ai lati.

ESERCIZIO 6

La distribuzione semplice del fenomeno era rappresentato dal diagramma a BARRE in

questo modo:

3

2

1

5 7 8 9 10 15

per calcolare la distribuzione della cumulata dobbiamo sommare le diverse classi, quindi

comporrò una tabella di questo tipo:

9

Page 10:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

n.° di CD

acquistati

Frequenza

Semplice

Frequenza

Cumulata

5 2 2

7 1 3 (2+1)

8 3 6 (3+3)

9 1 7 (6+1)

10 2 9 (7+2)

15 1 10 (9+1)

10

987

654

321

0 5 7 8 9 10 15

E) Grafico Box – Plot (Scatola e Baffi)

Passiamo all’analisi di un altro grafico, appartenente sempre alla categoria di grafici usati

per rappresentare variabili quantitative, il BOX-PLOT (chiamato anche diagramma a

scatola e baffi).

Questo grafico si usa quando si hanno molti dati da rappresentare e consiste nel costruire

una scatola i cui estremi inferiore e superiore sono rappresentati rispettivamente dal 1° e

3° quartile (chiamati anche 25° e 75° percentile) dei dati. La linea che attraversa l’interno

del rettangolo è la mediana (o 2° quartile). I due segmenti esterni rappresentano i baffi e si

10

Page 11:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

estendono fino ai valori limiti inferiore e superiore. L’estensione di questi baffi è pari a

1.5(Q3 – Q1), dove (Q3 – Q1) è la differenza interquantile o IQR.

I valori che non cadono all’interno di questi limiti sono considerati anomali (outliers).

Quando si va ad analizzare un grafico di questo tipo, non viene considerata la

distribuzione all’interno della scatola, perché si suppone che in essa vi sia una fortissima

distribuzione e non si troveranno mai punti anomali.

Per verificare la presenza di dati anomali si analizzerà la parte esterna al grafico: se vi

sono dei punti in questa parte questi vengono identificati tramite un asterisco e sono

definiti punti anomali; vengono poi analizzati i baffi: se anche in questa parte vengono

trovati dei punti li si chiamerà punti anomali potenziali.

Il box-plot è il grafico più completo perché è possibile capire:

- la forma della distribuzione (attraverso la posizione della mediana)

- il livello medio

- la variabilità del fenomeno (a seconda della dimensione della scatola)

- la presenza di dati anomali

ESERCIZIO 7

Per costruire il Box-Plot, bisogna determinare il valore del 1° e 3° quartine, quelle classi,

cioè, che lasciano alla propria sinistra rispettivamente il 25 e il 75 % dei casi rilevati.

Per individuare i due quartini i dati devono essere ordinati in maniera crescente e suddivisi

in parti (il 1° quartile è la mediana della prima metà dei dati, il 3° quartile è la mediana

della seconda metà dei dati).

La mediana può essere interpretata come quel valore che separa il campione in due parti:

una prima metà costituita da valori inferiori alla mediana e una seconda metà costituita da

valori superiori (lascia alla propria sinistra il 50 % dei casi).

Incominciamo ad ordinare i dati in ordine crescente (vedi tabella seguente):

Provincia Furti d’auto Provincia Furti d’autoBl 28.90 Re 139.47Bz 43.85 Pc 144.20Pn 52.68 Tv 161.30Ud 63.79 Pd 168.63Tn 64.45 Vr 169.14Ro 68.23 Vi 176.76

11

Page 12:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

Go 74.19 Fo 187.01Fe 94.65 Ra 187.10Ts 120.10 Mo 215.67Ve 128.67 Rn 289.80Pr 133,25 Bo 435.62

Cominciamo col calcolare la mediana :se n è dispari , la mediana corrisponde al valore dell’osservazione [(n – 1) / 2] + 1;

se n è pari, la mediana si assume come valore centrale o medio delle due osservazioni:

(n/2) e [(n/2) + 1].

Nel nostro caso la n (cioè le province) sono 22, quindi pari; pertanto la mediana sarà data

dal valore centrale dell’osservazione 11° (n/2) e dell’osservazione 12° (n/2 + 1);

l’11° osservazione è pari a 133,25 e la 12° è pari a 139, quindi il valore medio sarà:

(133.25 + 139.47) / 2 = 136.36

Possiamo ora calcolare Q 1 e Q3:

il primo e terzo quartile di una distribuzione sono quei valori che ripartiscono il campione in

due gruppi, lasciando a sinistra il 25% delle osservazioni e a destra il 75% delle

osservazioni. Sono quindi indici di posizione.

In relazione a quanto detto per la mediana, i quartini si calcoleranno in questo modo:

Q1 = (n +1) / 4 [oppure valore centrale tra l'osservazione n/4 e n/4 +1]

Q1 = 3(n + 1) / 4 [oppure valore centrale tra l’osservazione 3n/4 e 3n/4 + 1]

Q1 = (22 + 1) /4 = 5.75 dovrò quindi considerare l’osservazione n.°6 in ordine crescente

e cioè la provincia di Ro con 68.23Q3 = 3(22 + 1) / 4 = 16.5 dovrò quindi considerare l’osservazione n.° 17 in ordine crescente

e cioè la provincia di Vi con 176.76

Si possono ora calcolare le estremità dei baffi:

per stabilire l’estremità dei baffi devo calcolare la distanza interquantilica (IQR):

IQR = Q3 -Q1

IQR =176.76 – 68.23 = 108.53Quindi:

l’estremità inferiore sarà 68.23 – (1.5*108.53) = - 94.565l’estremità superiore sarà 176.67 + (1.5*108.53) = 339.555

12

Page 13:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

il valore negativo indica che nessun dato oltrepassa la barriera inferiore (in questo caso,

visto la natura della rilevazione, viene comunque considerato come valore limite più basso

lo zero), mentre invece il valore superiore fissa un limite oltre il quale eventuali punti sono

considerati anomali.

E’ ora possibile costruire il grafico:

* Bo

0 100 200 300 400

Dal Box-Plot emerge qualche elemento di asimmetria: la posizione della mediana non è

centrale, ma più spostata verso destra e il baffo inferiore è più corto di quello superiore.

Inoltre il dato di Bologna è anomalo rispetto alle altre province.

ESERCIZIO 8

riprendiamo il grafico dell’esercizio 1:

densità

0.025

0.020

0.015

0.010

0.005

0.000

0 20 40 60 80 classe

13

Page 14:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

Dato che le modalità sono raggruppate in classi il valore modale della distribuzione sarà

la classe a cui compete la densità più elevata e quindi la classe 5-10. Se non avessi avuto

il raggruppamento in classi il valore modale sarebbe corrisposto al carattere cui compete

la frequenza più elevata.

Per il calcolo della media e della varianza consideriamo una nuova distribuzione nella

quale associamo ad ogni unità il valore centrale della classe di appartenenza

Per calcolare la media della distribuzione, essendo le modalità raggruppate per classi

dovrò applicare la seguente formula: 1/ N i (xi * ni) , dove: N =200 (freq. Cumulata di

tutte le classi), xi è il valore centrale di ciascuna classe,

ni = frequenza associata a ciascuna classe.

La media sarà:

μ = 1/N Σ (xi * ni)

1/200 * (7.5*28 + 15*52 + 25*30 + 35*30 + 50*34 + 70*6) = 27.05La varianza si calcola con la appropriata formula:

σ2 = [1 /N Σ (xi –μ)2 ni]

dove : xi : valore centrale di ogni classe

μ: media

ni: frequenza di ogni classe

1/200 * [ (7.5 – 27.05)2 28 + (15 – 27.05)2 28 +…..+ (70 – 27.05)2 6] =246.67

dato che la distribuzione è per classi, il calcolo dei quartili, necessario per costruire il box-

plot, è dato dalle seguenti formule:

classe d’età Δi = xi –xi-1 ni

5-10 5 28

10-20 10 52

20-30 10 50

30-40 10 30

40-60 20 34

60-80 20 6

Valore

centrale della

classe

frequenza

7.5 28

15 52

25 50

35 30

50 34

70 6

14

Page 15:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

Q1 (primo quartile)= xi + (N/4 – Σni) * (ni / xi –xi-1)

Q2 (mediana)= xi + (N/2 – Σni) * (ni / xi –xi-1)

Q3 (terzo quartile) = xi +(3N/4 – Σni) * (ni / xi –xi-1)

Per ottenere queste formule bisogna partire dalla premessa che nell’ipotesi di

raggruppamento in classi, la mediana è quel valore che ripartisce l’area dell’istogramma in

due porzioni uguali. Dal grafico è possibile notare che la classe che contiene la mediana è

la terza classe 20-30, infatti le prime due classi rappresentano il 40% dell’area

dell’istogramma [per trovare questa percentuale basta calcolare l’area dei primi due

rettangoli: (5*0.0028 + 10*0.026 = 0.40)]. Mentre invece la terza classe compre il 65%

dell’area del grafico (5*0.0028 + 10*0.026 + 10*0.0025 = 0.65) quindi la mediana si troverà

per forza in questa classe. (vedi tabella sotto)

La superficie dell’istogramma (A) in corrispondenza dell’intervallo nel quale si trova la

mediana può essere ottenuta come differenza tra la metà dell’area totale dell’istogramma

e la somma delle aree dei rettangoli che precedono quello considerato, ovvero:

A = N/2 - Σni

Ma l’area può essere espressa anche come prodotto tra la lunghezza Me–xi e l’altezza

(densità di frequenza) del rettangolo preso in considerazione, pertanto:

(Me-xi) * (xI -xI-1/nI) = A = N/2 - Σni

da cui si ottiene:

Me (o Q2) = xi + (N/2 - Σni) * (ni / xi –xi-1) [con xi –xi-1 ampiezza classe]

Allo stesso modo calcolerò il primo e terzo quartile, solo dovrò sostituire a N/2 (metà area)

N/4 (25% dell’area) e ¾ N (75% dell’area).

La tabella per determinare la frequenza relativa cumulata delle classi è la seguente:

Dalla tabella possiamo dedurre che il primo quartile si trova in corrispondenza della classe

classe ni Ni

(freq. cumulate.) = Σni

Fi

(ni /200)

5-10 28 28 0.14

10-20 52 80 0.4

20-30 50 130 0.65

30-40 30 160 0.8

40-60 34 194 0.97

60-80 6 200 1

15

Page 16:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

10-20, il terzo si trova in corrispondenza della classe 30-40, e la mediana in

corrispondenza della classe 20-30; quindi avrò:

Q1 = 10 + (200/4 - 28)* 10/52 = 14.23Q2 = 20 + (200/2 -80) * 10/50 = 24Q3 = 30 + (3/4*200 – 130) * 10/30 = 36.67Determinazione dei baffi :estremo inferiore: 14.23 – 1.5(36.67-14.23) = -19.43estremo superiore: 36.67 + 1.5(36.67 - 14.23) = 70.33A questo punto possiamo costruire il box-plot

* * *

14.23 24 36.67 70.33

Passiamo ora all’analisi di un altro tipo di esercizio riguardante le variabili categoriche.Abbiamo già analizzato il diagramma a BARRE e la sua funzione.

F) Grafico a Torta

Analizziamo il diagramma a TORTA, raffigurato da un cerchio suddiviso in quote

rappresentanti determinate caratteristiche; questo grafico è utile quando riesco a

raggruppare le modalità delle variabili in un limitato numero di categorie.

G) Diagramma di Pareto

Il grafico più importante all’interno delle variabili categoriche è il DIAGRAMMA DI

PARETO. Per costruire il diagramma di Pareto, si parte da un diagramma a barre

riordinato ponendo le modalità categoriche in ordine decrescente (in base alla frequenza

16

Page 17:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

associata ad ogni modalità). Il diagramma di Pareto permette di analizzare ed individuare

quei dati su cui concentrare la nostra attenzione e individuare quindi i problemi più

importanti e le priorità di intervento. È utilizzato soprattutto in fase esplorativa per

circoscrivere meglio il problema. Questo grafico è utile quando riesco a lavorare su un

numero limitato di variabili categorie; in particolare è stata proposta la regola empirica dell’

80-20: Pareto è utilizzabile quando circa l’80% delle frequenze si è concentrata nella prime

categorie.

Sopra il grafico a barre si disegna la linea della cumulata (è utile quando si vuole stabilire

all’istante la % cumulativa di più colonne). La linea dei valori cumulati parte dallo 0 (angolo

in basso a sinistra del diagramma) il primo segmento che si traccia congiunge questo

punto con lo spigolo in alto a destra della prima colonna; successivamente si somma

all’altezza raggiunta il valore ella seconda colonna e si ottiene il nuovo livello; si ripete il

procedimento per la terza colonna e così via per le rimanenti colonne. Se le cose sono

state fate nel modo giusto, l’ultimo tratto della linea cumulata terminerà nel punto più alto

della scala % corrispondente al 100% (la scala % la costruisco parallelamente all’asse y

dal lato opposto del diagramma).

Il diagramma di Pareto può essere usato anche per la stratificazione che consiste

nell’individuare la categoria con la frequenza maggiore e analizzare all’interno di questa

stessa categoria altre caratteristiche costruendo quindi, sulla base di queste nuove

caratteristiche, un altro diagramma di Pareto.

Un esempio pratico chiarirà meglio i concetti sopra esposti.

17

Page 18:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

ESERCIZIO 9

punto a)

lavatrici

1000

900

800 700

600

500

400

300

200

100

0 verniciatura chiusura scarico manopola esplosione difetti

punto b)esploriamo la colonna con il maggior numero di difetti (procedimento di stratificazione)

lavatrici

500

400

300

200

100

0 lamiera manopola temp. colore sportello colore comandi difetti

18

Page 19:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

se volessimo costruire la cumulata di questo grafico dobbiamo calcolare il valore

percentuale di ogni difetto (rapporto tra il numero di difetti di un tipo e il totale generale

dei difetti):

difetti n. lavatrici % dei difetti

Chiusura 160 16% (160/1000)

Verniciatura 692 69.2% (692/1000)

Impostazione manopola 37 3.7% (37/1000)

Scarico acqua 110 11% (110/1000)

Esplosione durante

accensione

1 0.1% (1/1000)

Totale 1000 100%

99.9%100%

96.2%

85.2%

69.2%

600

100

19

Page 20:   · Web view2003-05-03 · 290 30 440 Ripercorriamo lo stesso procedimento visto negli esercizi precedenti e calcoliamo le variabili che ci interessano: l’ampiezza della classe,

H) Grafici relativi ai Processi

Oltre a queste tipologie di grafici ne abbiamo una terza relativa ai processi:

- il diagramma di causa-effetto (ishikawa)

- la flow-chart

Diagramma Causa-Effetto

Il diagramma CAUSA-EFFETTO mostra la relazione tra una caratteristica e i suoi fattori o

le sue cause. È la rappresentazione grafica di tutte le possibili cause relative ad un

fenomeno. Parte dalla definizione precisa dell’effetto che vogliamo studiare e attraverso

un’analisi approfondita permette di fare esaminare le vere cause che influenzano l’effetto

in esame. L’identificazione dell’effetto che vogliamo studiare è alla base di una efficace

analisi causa-effetto: quanto più questo sarà definito tanto più l’analisi delle cause potrà

essere mirata ed efficace.

Flow-Chart

La FLOW-CHART costringe ad analizzare tutte le operazioni necessarie per effettuare una

procedura; attraverso l’analisi di ogni singolo processo è possibile ricercare i punti in cui è

situata la fonte del problema.

Il indica un processo

Il indica una domanda, un’interazione che prevede obbligatoriamente una

risposta positiva o negativa.

20