Controllo statistico di qualità - old · Le linee di zona sono: 7.51; 2*7.51; 3*7.5x x x± ± ± 1...
Transcript of Controllo statistico di qualità - old · Le linee di zona sono: 7.51; 2*7.51; 3*7.5x x x± ± ± 1...
Controllo statistico di qualità
Introduzione
• Un’azienda vorrebbe che tutti i pezzi prodotti siano uguali: vuole cioè che la produzione sia affidabile.
• L’affidabilità della produzione è affidata a due • L’affidabilità della produzione è affidata a due momenti distinti: la progettazione della produzione (off line) e il controllo che la produzione sia almeno conforme ai parametri specificati (on line).
Il controllo statistico della qualità consiste in una collezione di strumenti che sono essenziali nelle attività finalizzate al miglioramento della qualità di prodotti e servizi attraverso l’analisi della loro variabilità.
Es: un rivenditore compra delle cassette di frutta da un produttore e si aspetta che siano
imballate e sistemate opportunamente in modo da facilitare l’esposizione della merce o
la sistemazione in magazzino.
Tra il 1920 e il 1945, si sviluppano le tecniche di controllo statistico della qualità dell’
output grazie a Gorge D. Edwards e a Walter A. Shewhart. Si introdussero tecniche di
controllo sull’intero processo produttivo, non limitandosi più, quindi, a verificare la
difettosità dei prodotti solo alla fine del processo dato che i controlli a tappeto su tut-
ti i prodotti stavano iniziando a rivelarsi troppo costosi. Per effettuare questa nuova ti i prodotti stavano iniziando a rivelarsi troppo costosi. Per effettuare questa nuova
tipologia di controlli, si fece sempre più ricorso ai criteri statistici. Esaminando pochi
prodotti finiti si riusciva a stabilire, mentre si produceva, se il processo presentava
delle irregolarità o meno.
I controlli basati su criteri statistici ebbero la massima applicazione durante la seconda
guerra mondiale, quando per l’industria bellica diventò necessario utilizzare in modo
massiccio manodopera femminile non specializzata e soggetta, quindi, ad un margine
di errore maggiore.
I 7 strumenti del controllo statistico di qualità
ESEMPIO: Una azienda farmaceutica decide di effettuare un controllo sul processo di iniezione di un farmaco, per le cure tumorali, all’interno di appositi flaconi. L’azienda assume come tolle-rabili un quantitativo minimo di medicinale nei flaconi pari a 82 ml e uno massimo di 118 ml e in fase di progetto stabilisce un quantitativo obbiettivo (target) di 95 ml. Gli operatori addetti a tale compito hanno a disposizione le misure del contenuto dei flaconi del prodotto medici-nale riportate nella tabella
I dati
Un primo approccio al problema può essere la costruzione di un istogramma.
DOMANDA: quale informazione si perde effettuando un istogramma?
5
10
15
20
25
30Istogramma dei dati
80 85 90 95 100 105 110 115 1200
5
Dall’istogramma si può subito notare come i dati seguano approssimativamente unadistribuzione normale, con una piuttosto accentuata variabilità dei dati. Rispetto al targetaziendale il processo è abbastanza centrato, ma la variabilità risulta eccessiva per cui po-trebbe essere necessaria una azione correttiva sulla variabilità del processo
0.50
0.75
0.90
0.95
0.98
0.99
0.997
Pro
babili
ty
Normal Probability Plot
Normal plot dei dati dell’esempio precedente
80 85 90 95 100 105 110 115
0.003
0.01
0.02
0.05
0.10
0.25
0.50
Data
Pro
babili
ty
Un istogramma consente di valutare la precisione del processo produttivo tramite l’analisi di dispersione della distribuzione dei dati, anche in relazione ai limiti di tolleranza.
Dalla sovrapposizione dell’istogramma con la retta del valore obbiettivo si puòverificare il posizionamento del valore centrale dei dati rispetto al target assegnato
ESEMPIO
La carta dei 3-sigmaSe dovesse essere disponibile una valutazione teorica (storica o di progetto) dellavarianza della popolazione e della media, usando il teorema del limite centrale è possibile sostituire il parametro k con 3, per la varianza e per media si può usare quella della popolazione.
Wn
σσ =
Esempio: parametro di flusso monitorato in una azienda con media e varianza nota
n=5
Costruire la carta di controllo della media in Matlab
1. I dati sono in numero 12*10: ci sono 12 gruppi (i giorni) e ogni gruppo ha numerositàcampionaria pari a 10. Quindi
120, 12 sottogruppi, ciascuno di taglia 10, 1,...,12.i
N k n i= = = =
2. Organizzare i dati in una matrice e calcolare la media per ogni sottogruppo.
>> x
x =
94 97 92 94 106 108 95 98 111 85 109 110108 118 92 100 109 92 105 111 96 110 108 97105 97 101 102 93 99 97 109 95 96 103 8885 96 93 93 94 92 108 99 95 91 88 9693 103 95 99 101 80 98 101 106 95 103 83
111 100 90 98 110 85 111 109 104 97 115 93
Costruire la carta di controllo della media in Matlab
111 100 90 98 110 85 111 109 104 97 115 93109 92 108 89 103 95 91 99 95 93 105 97102 99 86 96 110 92 94 99 87 114 100 10299 115 84 89 110 85 93 101 84 89 113 9193 104 84 86 109 99 100 100 94 91 113 109
>> m=mean(x); Le medie vengonofatte sulle colonne.
Queste medie vengono plottate sulla carta di controllo. Quindi sulle ascisse si riportano i giorni (in sequenza).
96
98
100
102
104
106costruzione della carta di controllo
La linea centrale è rappresentata dallamedia delle medie
1
1 k
i
i
x mk =
= ∑
Costruire la carta di controllo della media in Matlab
0 2 4 6 8 10 1292
94
96 1ik =
98,6
98
100
102
104
106costruzione della carta di controllo
Per calcolare i limiti inferioree superiore:a) Valutare l’escursione diogni sottogruppo
, ,max( ) min( )j i j i jii
R x x= −
Costruire la carta di controllo della media in Matlab
1 2 3 4 5 6 7 8 9 10 11 1292
94
96
>> fori=1:12r(i)=max(x(:,i))-min(x(:,i));end
>> r
r =
26 26 24 16 17 28 20 13 27 29 27 27
Oppure usare range(x)
b) Calcolare la media delle escursioni:1
1 k
i
i
R Rk =
= ∑
c) Calcolare i limiti usando la seguente tabella:
>> rmed=mean(r)
rmed =
23.3333
105.7891.41
Costruire la carta di controllo della media in Matlab
Plot delle linee superiori ed inferiori.
94
96
98
100
102
104
106
108
110costruzione della carta di controllo
1 2 3 4 5 6 7 8 9 10 11 1290
92
Sovrapponiamo le regole di zona. A questo scopo calcoliamo la varianza media su tutti isottogruppi:
>> s=std(x);Il calcolo delle deviazioni standard viene fatto sulle colonne.
>> smean=mean(s); 7.51
Le linee di zona sono: 7.51; 2*7.51; 3*7.51x x x± ± ±
90
95
100
105
110
115
120
125costruzione della carta di controllo
C’è un modo per
costruire il grafico
direttamente
in MATLAB?
Per le regole di zona non
c’è una function in
MATLAB.
1 2 3 4 5 6 7 8 9 10 11 1275
80
85
90
in MATLAB?
XBARPLOT X-bar chart for monitoring the mean.XBARPLOT(DATA,CONF,SPECS,SIGMAEST) produces an xbar chart of the grouped responses in DATA. The rows of DATA contain replicate observations taken at a given time. The rowsshould be in time order.
CONF (optional) is the confidence level of the upper and lower plotted confidence limits. CONF is 0.9973 by default. This means that 99.73% of the plotted points should fall between the control limits if the process is in control.
SPECS (optional) is a two element vector for the lower and upper specification limits of the response.
SIGMAEST (optional) specifies how XBARPLOT should estimate sigma. Possible values are 'std' (the default) to use the average within-subgroup standard deviation, 'range' to use the
average subgroup range, and 'variance' to use the square root of the pooled variance.
OUTLIERS = XBARPLOT(DATA,CONF,
106 UCL
Xbar Chart
?XBARPLOT(DATA,CONF,SPECS,SIGMAEST) returns a vector of indices to the rows where the mean of DATA is out of control.
>> xbarplot(x,0.9973,spec,’range’)
0 2 4 6 8 10 1290
92
94
96
98
100
102
104
LCL
CL
Samples
Measure
ments
SIGMAEST = ?
Mentre per la media si ha
linea centrale LC =
linea superiore LSC = 3
linea inferiore LIC = 3
x
xn
xn
σ
σ
+
−
E per la varianza?
SIGMAEST = ‘std’
1
1 dove è la dev. campionaria di ogni sottogruppo
k
i i
i
s sk
σ=
⇐ ∑
( )2
1
1 dettagli nel seguito!
1
n
i ji j
j
ossia s x x maggiorin =
= − ⇒−∑
Problema:Problema:
SIGMAEST = 'variance'
SIGMAEST = ‘range' SIGMAEST = ‘range'
?
CONF (optional) is the confidence level of the upper and lower plotted confidence limits. CONF is 0.9973 by default. This means that 99.73% of the plotted points should fall between the control limits if the process is in control.
Questo valore è legato al coefficiente 3!
>> norminv(0.9987,0,1)
ans =
3.0115
>> (1-0.9973)/2+0.9973
ans =
0.9987
Carta di tolleranza
100
105
110
115
120carta di tolleranza
>> hold on
0 2 4 6 8 10 1280
85
90
95
>> hold on>> …>> c2=2*ones(1,10);>> plot(c2,x(:,2),'g*-')>> …
Lettura della carta di tolleranza
Attenzione a derive nella rappresentazione!
Confronto tra le due carte
95
100
105
110
115
120Xbar Chart
UCL
CL
Measure
ments
0 2 4 6 8 10 1280
85
90LCL
Samples
Con i medesimi dati, si può calcolare anche la carta per l’escursione.
La lettura della carta della media va accompagnata con la lettura della cosiddetta carta dell’escursione. La carta dell’escursione non è disponibile in MATLAB.
Nell’esempio la linea superiore è 41.48 e quella inferiore è 5.4367.
20
25
30
35
40
45carta escursione
1 2 3 4 5 6 7 8 9 10 11 120
5
10
15
Sulla costruzione dei limiti di controllo…
[ ][ ] 2
2
32 2
RVar R
Var W dσ
σ σ= ⇒ =
2
ˆSe R
dσ σ⇐ =
Una tabella maggiormente completa http://www.unibas.it/utenti/dinardo/tavcc.pdf
2
3
4
corrisponde ad
corrisponde a C
corrisponde a B
A A
D
D
Come si leggono le variazioni sulle carte di controllo
Uno spostamento della media del processo produttivo, provoca l’ap-parire di una anomalia sulla carta di controllo della media: anche quando tale variazione sarà minimai punti della carta di controllo reagiranno in maniera apprezzabile
Una variazione nella dispersione del processo produttivo provocherà ano-malie avvertibili sia sulla carta di controllo della media che su quella dellaescursione , che tenderanno a distanziarsi tra di loro.
Carte MR (moving range)
Sostituisce la R chart
Curva caratteristica operativa
Diremo che il processo è in controllo statistico se per ogni Diremo che il processo è in controllo statistico se per ogni
, indice dei sottogruppi, ( , ).t
t x LimInf LimSup∈
Regione di accettazione
Test di Ipotesi ®
= funzione dei dati
? 0E' possibile accettare l'ipotesi nulla H
A 2 code
0 0
1 0
:
:
H
H
µ µ
µ µ
=⇒
≠
REGIONE DIACCETTAZIONE
REGIONE CRITICA
REGIONE CRITICA
REGIONE DIACCETTAZIONE
REGIONE CRITICA
A 1 coda
Test di ipotesi ®( )0 0si rigetta H - a posteriori - quando H è vera - a prioriPα =
livello di significatività del testα ←ERRORE DI I TIPO
( )0 01 si accetta H - a posteriori - quando H è vera - a prioriPα− =
Le regione di accettazione e …
0µ µ= 0
0µ
Si rigetta l’ipotesi nulla…
Statistica osservata0µ
Non si rigetta l’ipotesi nulla…
Statistica osservata
0µ
Test di ipotesi ®
livello di significatività del testα ←REGIONE DIACCETTAZIONE
? ?
( ) regione di accettazione 1P STATISTICA α∈ = −
0.10,0.05,0.01α =
Test di ipotesi ®( )1 1si rigetta H - a posteriori - quando H è vera - a prioriPβ =
1 potenza del testβ− ←
( )1 11 si accetta H - a posteriori - quando H è vera - a prioriPβ− =
ERRORE DI II TIPO
( )0 01 si rigetta H - a posteriori - quando H è falsa - a prioriPβ− =
DEVE ESSERE ALTA
L’errore di II tipo
1µ µ=0µ µ=
Statistica osservata
0µ 1µ
La potenza del test
0µ µ=1µ µ=
0µ 1µStatistica osservata
Curva caratteristica operativa
Diremo che il processo è in controllo statistico se per ogni Diremo che il processo è in controllo statistico se per ogni
, indice dei sottogruppi, ( , ).t
t x LimInf LimSup∈
Regione di accettazione
0 0
1 0
(rigettare | )
(rigettare | )
P H
P H
α µ µ
β µ µ
= =
= ≠
0
0
( ( , ) | )
( ( , ) | )
t
t
P x LCL UCL
P x LCL UCL
µ µ
µ µ
= ∉ =
= ∈ ≠
FALSO ALLARMEMANCATO ALLARME
Non avendo ipotesi alternative certe, immaginiamo che 1 0 kµ µ µ σ= = +
Se la popolazione è gaussiana, allora
0( ( , ) | )tP x LCL UCL kβ µ µ σ= ∈ = +
( ) ( )0 0
/ /
UCL k LCL k
n n
µ σ µ σ
σ σ
− + − + = Φ − Φ
Il plot dei valori assunti da questo parametro per un opportuno valore Il plot dei valori assunti da questo parametro per un opportuno valore di k, si chiama curva caratteristica operativa.
0 0Se e , alloraUCL L LCL Ln n
σ σµ µ= + = −
( ) ( )L k n L k nβ = Φ − − Φ − −
e quindi perdiamo la dipendenza sia dalla deviazione standard che dalla media(che magari sono incognite!).
Per usare le curve operative è necessario avere qualche informazione in più sulla naturadel processo (ad esempio che la popolazione è gaussiana).
Torniamo al nostro esempio dei flaconi. Siccome i limiti che abbiamo usato sono di tipo
0 Ln
σµ ± 2dove 3, 10 e / allora si haL n R dσ= = ≈
( ) ( )3 10 3 10k kβ = Φ − − Φ − −
>> k=[0.1:0.2:3];>> z=normcdf(3-k.*sqrt(10))-normcdf(-3-k.*sqrt(10));>> plot(k,z)
0.7
0.8
0.9
1Curva operativa
0 0.5 1 1.5 2 2.5 30
0.1
0.2
0.3
0.4
0.5
0.6
Per k=1, vale circa 0.3 la proba-bilità di un mancato allarme.
Per valori di k inferiori, aumentala probabilità di un mancatoallarme.
Spesso sui testi si incontrano famiglie di curve operative. Questo perché si cerca di capireal variare della taglia del sottogruppo come varia la probabilità di un mancato allarme.
( ) ( )3 3k n k nβ = Φ − − Φ − −
Ogni plot corrispondead un valore di n.
0.7
0.8
0.9
1Curve operative al variare di n
n=8
n=5
n=12
0 0.5 1 1.5 2 2.5 30
0.1
0.2
0.3
0.4
0.5
0.6
Nella progettazione delle carte di controllo è necessario specificare sia la dimensione delcampione che la frequenza di campionamento.
• Più grande è il campione più è sensibile il rilevamento di una variazione all’interno delprocesso.
• La pratica corrente tende a diminuire la dimensione del campione e ad aumentare la frequenza di campionamento.
Altro uso della curva operativa
( ) ( )Si fissa , e si cerca quel valore di tale che
ossia, ricordando le proprietà della gaussiana...
z z zβ β ββ βΦ − Φ − =
( )2 1zβ βΦ − =1 1
2zβ
β− + ⇒ = Φ
3
è possibile ricavare
z k n
n
β⇒ = −
⇒
Per k=1 0.3β = >> ((3-norminv((0.3+1)/2,0,1)))^2 6n =
Strategia di scelta dei sottogruppi
…ma sono costosi!
La pratica industriale corrente preferisce la prima strategia – aumentando la La pratica industriale corrente preferisce la prima strategia – aumentando la frequenza
Approcci per la costruzione dei sottogruppi
Approccio SNAPSHOT Approccio RANDOMQuanti k?
ARL (average long run)
Sia la variabile aleatoria che indica il numero di sottogruppi da
estrarre prima di avere un punto fuori i limiti della carta di controllo.
ha legge...
T
T
1...geometrica, ( ) (1 ) , 1,2,...kP T k p p k
−= = − =
[ ]1
ARL, tempo medio per avere un fuori controlloE T =[ ] ARL, tempo medio per avere un fuori controlloE Tp
=
Quanto vale p? Nella carta 3-sigma, la probabilità che il processo sia in controllo statistico è data dalla legge dei 3-sigma, ossia
>> normcdf(3,0,1)-normcdf(-3,0,1)ans =
0.9973
Quindi la probabilità che il processo vada fuori controllo è
>> 1-0.9973
ans =
0.0027[ ] 370E T =
Negli ultimi anni, l’uso di questo parametro è stato oggetto di critiche:
a) Deviazione standard
[ ] =370 la deviazione standard è molto ampiaq
D Tp
=
b) La distribuzione geometrica è molto asimmetrica
2.6
2.8x 10
-3 Pdf geometrica con p=0.0027
0 50 100 150 200 250 300 350 4000.8
1
1.2
1.4
1.6
1.8
2
2.2
2.4
2.6
Se è la probabilità di avere un falso segnale di fuori controllo e se indichiamo
con la v.a. che indica il numero di campioni da estrarre prima di avere falsi
allarmi, essa ha legge...
rT r
α
( ) ( )
...di Pascal
1 1
1
k rr
r
kP T k
rα α
−− = = −
− Il ricorso al range per la stima della deviazione standard fornisce una stima sufficientemen-te precisa, solo per piccole numerosità campionarie inferiori a 5.
Se la dimensione campionaria è abbastanza grande (>10,12) l’uso del range R è poco Se la dimensione campionaria è abbastanza grande (>10,12) l’uso del range R è poco efficiente per la stima della varianza.
S chart…e…e…e…e qui abbiamo un altro problema!!qui abbiamo un altro problema!!qui abbiamo un altro problema!!qui abbiamo un altro problema!!
[ ]2 2Vale che e invece .
Quindi non può essere valutato con .
E S E S
S
σ σ
σ
= ≠
( ) [ ]2
4 4Se , dove è un parametro che dipende da
X N E S c c nµ σ σ≈ ⇒ =
4
1 !2 12
e ! 1 211 2 2 2 2 2
1 !2
n
n n n nc
nnπ
−
= = − − −− −
⋯
Intanto cambiano i limiti di controllo della carta della media
3n
σµ ±
X4
S
cσ ≈
1
1dove
k
i
i
S Sk =
= ∑
SIGMAEST (optional) specifies how XBARPLOT should estimate sigma. Possible values are 'std' (the default) to use the average within-subgroup standard deviation, 'range' to use the
average subgroup range, and 'variance' to use the square root of the pooled variance.
6
8
10
12
14
UCL
CL
S Chart
Sta
ndard
Devia
tion
>> schart(x) [ ]...e al posto di si usa E S S
Invece i limiti di controllo della carta della deviazione standard
[ ] [ ]3E S D S∓ [ ] 2 2
4 4
4
1 1S
D S c cc
σ= − ≈ −
1 2 3 4 5 6 7 8 9 102
4
6
LCL
Sample Number
6
8
10
12
14
UCL
CL
S Chart
Sta
ndard
Devia
tion
>> schart(x)
1 2 3 4 5 6 7 8 9 102
4
6
LCL
Sample Number
Riepilogando >> xbarplot(x,0.9973,spec,‘range')
96
98
100
102
104
106 UCL
CL
Xbar Chart
Mea
sure
me
nts
0 2 4 6 8 10 1290
92
94
LCL
Samples
Questa è la carta per la media con i limiti di controllo che dipendono dal range
2
per stimare (la variabilità del processo)R
dσ σ←
96
98
100
102
104
106 UCL
CL
Xbar Chart
Measure
ments
>> xbarplot(x',0.9973,spec,'std')
0 2 4 6 8 10 1290
92
94
96
LCL
Samples
Questa è la carta per la media con i limiti di controllo che dipendono dalla deviazionestandard.
4
per stimare la variabilità del processoS
cσ ≈
96
98
100
102
104
106 UCL
CL
Xbar Chart
Measure
ments
>> xbarplot(x',0.9973,spec,'variance’)')
Questa è la carta per la media con i limiti di con-trollo che dipendono dalla pooled varianceche sostituisce diretta-mente la deviazione standard.
0 2 4 6 8 10 1290
92
94
LCL
Samples
ESERCIZIO
Una azienda che produce semiconduttori vuole monitorare il processo di produzione,controllando la larghezza di flusso delle resistenze.
Sono stati raccolti 25 sottogruppi di misurazione, ciascuno di dimensione 5, uno ogniora (file dati2.m).
Costruire le carte di controllo. Cosa e’ possibile dire circa le probabilità di falso allarme e di mancato allarme? Quanto vale il parametro ALR?
Commentare opportunamente i risultati ottenuti
Siccome i sottogruppi sono di taglia n=5, per l’escursione possiamo usare la R-chart.
xbarplot(wafers,0.9973,spec,'range')
1.5
1.55
1.6
1.65
1.7
1.75
UCL
CL
Xbar Chart
UCL
CL
Measure
ments
UCL
CL
UCL
CL
UCL
CL
UCL
CL
UCL
CL
USL
L’output è
0 5 10 15 20 251.3
1.35
1.4
1.45
1.5
LCLLCL
Samples
Measure
ments
LCLLCLLCLLCLLCL
LSL
I valori dei limiti sono UCL = 1.6932 e LCL = 1.3180.
Possiamo anche costruire le regole di zona, scegliendo come stimatore per la deviazionestandard R-bar/d_2. In questo caso le linee A, sono quelle corrispondenti ai limiti di con-trollo.
>> normcdf(2,0,1)-normcdf(-2,0,1)
ans =
0.9545
Siccome
>> xbarplot(wafers,0.9545,spec,range’)
1.7
1.75
UCL
Xbar Chart
0 5 10 15 20 251.3
1.35
1.4
1.45
1.5
1.55
1.6
1.65
LCL
CL
Samples
Measure
ments
UCL
LCL
CL
>> normcdf(1,0,1)-normcdf(-1,0,1)
ans =
0.6827
>> xbarplot(wafers,0.6827,spec,’range’)
Siccome
1.7
1.75
UCL
Xbar Chart
Vengono segnalati i sotto-gruppi che escono dai limi-ti
A
0 5 10 15 20 251.3
1.35
1.4
1.45
1.5
1.55
1.6
1.65
LCL
CL
Samples
Measure
ments
UCL
LCL
CL
7
1315
1924 UCL
LCL
CL
A
B
CC
B
A
Per costruire la R-chart, calcoliamo il range della matrice wafers.
>> range(wafers')
Poi calcoliamo la media di questo vettore, che restituisce la linea centrale.
>> mean(range(wafers'))
Calcoliamo i limiti B e C dalla tabella:
Ossia B=2.114C=0
>> k=[1:1:25];>> rbar=0.3252*ones(1,25);>> upperbar=2.114*ones(1,25);>> lowerbar=zeros(1,25);>> plot(k,range(wafers'),'b*-',k,rbar,'r-',k,lowerbar,'r-',k,upperbar,'r-')>> title('R chart')
La stima della variabilitàdel processo di produzione risulta 0.3252/2.326=0.1398
0.5
1
1.5
2
2.5R chart
0 5 10 15 20 250
0( ( , ) | ) 0.0027tP x LCL UCLα µ µ= ∉ = =
Per la probabilità di mancato allarme possiamo costruire la curva operativa caratteristica
( ) ( )3 5 3 5k kβ = Φ − − Φ − −
>> k=[-3.:0.1::3];>> z=normcdf(3-k.*sqrt(5))-normcdf(-3-k.*sqrt(15);>> plot(k,z)
0.4
0.5
0.6
0.7
0.8
0.9
1curva operativa
Ora poniamociun altro tipo di problema
-3 -2 -1 0 1 2 30
0.1
0.2
0.3
un altro tipo di problema
Supponiamo che i limiti dispecifica stabiliti in fasedi progettazione siano1.5+/-0.5.
La carta di controllo può essere utilizzata per descrivere la capacità del processo di produrre wafers all’interno dei parametri specificati.
In che modo?
Basta calcolare ( 1.00) ( 2.00) ipotizzando che...P X P X< + >
>> inf=(1-1.5056)/0.1398;>> sup=(2-1.5056)/0.1398;>> normcdf(inf,0,1)+1-normcdf(sup,0,1)
ans =
(1.5056,0.1398) che sono le stime trovate con la carta di controllo
per e .
X N
µ σ
≈
ans =
3.5200e-004
Ossia circa lo 0.035 per cento (350 parti per millione) di wafers prodotti cadranno al difuori delle specifiche, stante la produzione osservata e monitorata dalla carta di con-trollo.
Più in generale indichiamo con
( ) ( ) 1ˆ ˆ
ULe L U
T xT xp P X T P X T
σ σ
−− = < + > = Φ + − Φ
Il valore minimo lo si ha quando la media coincide con il centro dell'intervallo di
tolleranza .2
e
U Le
p
T Tm
+=
3.56
3.58
3.6
3.62
3.64x 10
-4Capacità produttiva del processo al variare della media campionaria
Il valore effettivo di non
conformi deve essere tale
che dove è il
livello di difettosità
e T Tp p p<
1.49 1.495 1.5 1.505 1.51 1.5153.48
3.5
3.52
3.54
3.56
e questo valore minimo vale min 2ˆ2
L UT T
pσ
− = Φ
livello di difettosità
tollerabile
Altro modo per misurare l’indice di capacità del processo è il cosidetto PCR (processcapability ratio) :
6
U Lp
T TC
σ
−=
Si noti che 6 è la definizione di base della capacità del processo.σ
INDICE DI CAPACITA’ DEL PROCESSO
In genere la deviazione standard non si conosce e quindi va stimata dai dati
Andamento indice PCR
Se il processo non è centrato, avere PCR>1 nongarantisce che il processo produca la quasi tota-lità dei prodotti entro i limiti di specifica (è capa-ce di farlo, ma non è detto che lo faccia)
Ci vuole un indice che tenga conto della centratura.
T Tµ µ− − min ,
3 3
U Lpk
T TC
µ µ
σ σ
− − =
Relazioni tra i due indici
Un impiegato esce di casa tutti i giorni alle 8.00 e deve entrare al lavoro alle 8.30. Per raggiungere l’ufficio in auto ha due possibilità: attraversare la città, o seguire un percorso di campagna, più lungo ma meno trafficato. Per decidere quale sia il percorso più con-veniente, misura il tempo di percorrenza più volte su entrambi i percorsi e trova che attraversando la città impiega mediamente 25 minuti, mentre per il percorso in cam-pagna occorrono in media 28 minuti. Quale percorso gli conviene seguire?
Vecchia risposta: l’uomo dovrebbe scegliere il percorso cittadino, che in media è più veloce
Risposta Sei Sigma: la media non è un indicatore significativo per questo studio. Infatti l’impiegato è penalizzato quando arriva in ritardo, ma non ha alcun benefi-arriva in ritardo, ma non ha alcun benefi-cio quando arriva in anticipo. L’uomo de-finirebbe come difettosi i percorsi che richiedono più di 30 minuti di viaggio. Quindi si deve analizzare l’intera distri-buzione dei dati nei due casi, riportata in figura. Come si vede, il percorso cittadino presenta una forte variabilità dei dati, perché è molto influenzato (oltre che poco prevedibilmente) dal traffico; il percorso di campagna invece richiede un tempo praticamente costante. Visto l’alto numero di difetti nel caso del percorso cittadino, è evidente che quello di campagna è decisamente preferibile dal punto di vista dell’impiegato.
Il six-sigma program della Motorola – anni ‘80
Obbiettivi: 12USL LSL σ− >
{ }min , 4.5USL LSLµ µ σ− − >
2
e
1.5
p
pk
C
C
>
>
E se la popolazione non è gaussiana?
6 7.522
π=
2
Il denominatore diventa 6
nel caso gaussiano.
σ
Quantili
( ) ( )
e nel caso gaussiano
0.00135 3 ,0.99865 3P Z P Z= ≤ − = ≤
Intervalli di confidenza per il parametro PCR
2 2
1 /2, 1 /2, 1
6 1 6 1
n n
p
USL LSL USL LSLC
S n S n
α αχ χ− − −− −≤ ≤
− −
In Matlab
>> spec=[1.45 1.70];>> [p,Cp,Cpk]=capable(mean(wafers),spec)
p = 0.0746Cp = 1.0809Cpk = 0.4809
Cp > 1, quindi il processo è capace (ossia rientra nei limiti specificati)Cpk<1, il processo non è centrato rispetto
Cosa descrive p?
>> p=1-diff(normcdf(spec,mean(mean(wafers)),std(mean(wafers))))
>> diff(spec)/(6*std(mean(wafers)))*sqrt(chi2inv(0.975,25-1)/24)ans=1.3842
>> diff(spec)/(6*std(mean(wafers)))*sqrt(chi2inv(0.025,25-1)/24)ans = 0.7770
Attenzione
alla stima di
S
Cosa succede se le dimensioni dei sottocampioni non sono uguali?
strategia di campionamento
dati mancanti
•
•
Quando i sottogruppi hanno numerosità diverse, vengono usate la
carta della media e la S-chart, con limiti che dipendono dalla taglia.
k
( 1)k k
i i i in x n S−∑ ∑1 1
1 1
( 1)
Per le linee centrali si ha: e
( 1)
i i i i
i i
k k
i i
i i
n x n S
x S
n n
= =
= =
−
= =
−
∑ ∑
∑ ∑
Per i limiti 3-sigma si ha che B e C dipendono da , così come Din S
Classificazione carte di controllo
• Carte di controllo per variabili
Se la caratteristica del prodotto è rappresenta-bile su una scala continua di valori essa è detta variabile. Si usano misure di centralità e variabile. Si usano misure di centralità e variabilità.
• Carte di controllo per attributi
L’unità prodotta viene valutata conforme in base al numero dei difetti o in presenza di certi attributi.
Carta p
• Si basa sulla percentuale di pezzi non conformi nel sottogruppo monitorato.
• La numerosità campionaria dei sottogruppi può essere non costante.può essere non costante.
• La numerosità campionaria deve essere elevata. Perché?
• La v.a. binomiale (e di Bernoulli) gioca un ruolo fondamentale.
ˆLa percentuale di pezzi non conformi è data da , dove ha legge...D
p Dn
=
...binomiale di parametri e p.n
I limiti di controllo sono:
(1 )3 (se 5, (1- ) 5 D è approx. gaussiana)
p pp np n p
n
−± > >
Se non è nota, si può sostituire con una stima p p
1
1 num.pezzi non conformi dove
ki
i i
i
Dp p p
k n n=
= = =∑
Esempio: Un concentrato di succo d'arancia è congelato e imballato in lattine di car-tone da 180ml. Queste lattine sono costruite usando una macchina che avvolge il cartone e poi lo appoggia su un pannello inferiore in metallo. Ispezionando una lat-tina, possiamo stabilire se, quando è piena, si può avere una perdita del succo dalla cucitura laterale o dal pannello inferiore. Tale non conformità può comportare un sigillo improprio sulla guarnizione laterale oppure sul pannello inferiore. Vogliamo costruire una carta di controllo per migliorare la percentuale di lattine non conformi prodotte dalla macchina. A questo scopo vengono selezionati 30 campioni di n = 50 lattine ciascuno, ogni mezz’ora su 3 periodi della giornata in cui la macchina è sempre in funzione.
>> d
d =
Columns 1 through 17
12 15 8 10 4 7 16 9 14 10 5 6 17 12 22 8 10
Columns 18 through 30
5 13 11 20 18 24 15 9 12 7 13 9 6
I valori da plottare sulla carta sono le percentuali di non conformità
>> p=d/50
p =
Columns 1 through 10
0.2400 0.3000 0.1600 0.2000 0.0800 0.1400 0.3200 0.1800 0.2800 0.2000
Columns 11 through 20
0.1000 0.1200 0.3400 0.2400 0.4400 0.1600 0.2000 0.1000 0.2600 0.22000.1000 0.1200 0.3400 0.2400 0.4400 0.1600 0.2000 0.1000 0.2600 0.2200
Columns 21 through 30
0.4000 0.3600 0.4800 0.3000 0.1800 0.2400 0.1400 0.2600 0.1800 0.1200
I limiti sono
>> mean(p)+3*sqrt(mean(p)*(1-mean(p))/50)
ans = 0.4102
>> mean(p)-3*sqrt(mean(p)*(1-mean(p))/50)
ans = 0.0524
>> cent=mean(p)*ones(1,30);>> upp=(mean(p)+3*sqrt(mean(p)*(1-mean(p))/50))*ones(1,30);>> low=(mean(p)-3*sqrt(mean(p)*(1-mean(p))/50))*ones(1,30);>> plot(k,p,'b*-',k,low,'r-',k,upp,'r-',k,cent,'g-')
0.3
0.35
0.4
0.45
0.5P chart
Nuovo operatore
Nuova partita di cartone
0 5 10 15 20 25 300.05
0.1
0.15
0.2
0.25
0.3
Il campione 15 e 23 sono fuori controllo statistico: questi vanno monitorati.
cartone
Ricalcoliamo la carta eliminando questi campioni.
>> d1(1:14)=d(1:14)>> d1(15:21)=d(16:22)>> d1(22:28)=d(24:30)
E ripetiamo tutta la procedura
0.35
0.4P chart Sottogruppo 20
(no. 21 nel vecchiocampione)
0 5 10 15 20 25 300
0.05
0.1
0.15
0.2
0.25
0.3
Questa è la carta senza aver eliminato il sottogruppo 15 e 23.
0.25
0.3
0.35
0.4
0.45
0.5P chart
0 5 10 15 20 25 300
0.05
0.1
0.15
0.2
Se non si ritiene significativa la causa che ha portato al fuori controllo statistico nelsottogruppo 21, allora per future ispezioni si mantengono questi come limiti della carta di controllo.
Supponiamo che siano stati campionati altri 23 sottogruppi: per monitorare il processo usiamoi limiti di controllo che sono stati calcolati prima.
0.15
0.2
0.25
0.3
0.35
0.4P chart >> cent2=
mean(p1)*ones(1,24);>> low2=low1(1)*ones(1,24);>> upp2=upp1(1)*ones(1,24);>> plot(k2,p2,'b*-',k2,low2,'r-',k2,upp2,'r-',k2,cent2,'g-')
30 35 40 45 50 550
0.05
0.1
Il processo è in controllostatistico.
Ma…
…se mettiamo tutti i dati assieme…
0.15
0.2
0.25
0.3
0.35
0.4
0.45
0.5P chart
Cambiamentodella macchinaper imballaggio?
0 10 20 30 40 50 600
0.05
0.1
0.15
Possiamo dire con maggiore precisione se le percentuali di non conformità sono effetti-vamente diverse?
0 1 2
1 1 2
:
:
H p p
H p p
=
> 1 2 1 1 2 2
1 2
1 2
La statistica test risulta:
Z= dove 1 1
(1 )
p p n p n pp
n np p
n n
− +=
+ − +
0.05La regione critica è : 1.645Z z> =
1
2
0.2150 (senza sottogruppi 15 e 23)
0.1108
p
p
←
←1 2?, ?n n= =
28 28
1
1 1
54 54
2
31 31
1 1 301
28 28 50 1400
1 1 133
24 24 50 1200
ii
i i
ii
i i
Dp p
Dp p
= =
= =
= = =
= = =
∑ ∑
∑ ∑...e facendo i conti si ha 0.1669 e 7.10p Z= =
Pertanto si rigetta l'ipotesi nulla...
Visto che c’è stato un miglioramento nella produzione, si ricalcolano anche i limiti di controllo
0.4
0.5
0.6New P-chart
0 10 20 30 40 50 60-0.1
0
0.1
0.2
0.3
Il limite inferiore è negativo: -0.0224!! Quindi bisogna prendere il limite inferiore pari a 0.
0.2
0.3
0.4
0.5
New P-chart
* Se p è piccolo, n va scelto grande!! Ad esempio per
p=0.01, abbiamo n=500!!
( )
( )2
* Siccome lo shift da
1 vale =3
31
p
p p
n
n p p
δ−
⇒
= −
5 10 15 20 25 30 35 40 45 500
0.1( )3
1n p pδ
= −
( )1 9(1 )* 3 0
p p pp n
n p
− −− > ⇒ >
0.04, 0.01 56p nδ = = ⇒ =
0.05 171p n= ⇒ =
Carta npSi lavora non con la percentuale dei pezzi non conformi, ma con il numero di pezzi nonconformi.
ˆLa percentuale di pezzi non conformi è data da , dove ha legge...D
p Dn
=
...binomiale di parametri e p.n
Si lavora con ( , (1- ))D N np np p≈Si lavora con ( , (1- ))D N np np p≈
I limiti della carta di controllo sono dunque: 3 (1 )np np p± −
viene sostituito con p p
Tornando all’esempio di prima…
5
10
15
20
25Np chart
0 5 10 15 20 25 300
1
Se le taglie dei sottogruppi sono diverse, una tecnica molto diffusa consiste nel
1sostituire a la media campionaria delle taglie
k
i
i
n n nk =
⊗
= ∑
1
1
( ( , ) | )
= ( ( , ) | )
i
i
P p LCL UCL p p
P D nLCL nUCL p p
β = ∈ =
∈ =
Usando la cdf binomiale
1 ( (2.62, 20.51) | )iP D p pβ = ∈ =
0.9
1Curva caratteristica per P-chart
>> p=[0.01:0.02:1];>> app=binocdf(20.5120,50,p)-
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8>> app=binocdf(20.5120,50,p)-binocdf(2.6214,50,p);>> plot(p,app)
Con gli stessi ragionamentisi possono calcolare glialtri parametri che abbiamoincontrato nelle precedentilezioni.
Carta c
• Misura il numero di difetti in un lotto controllato.
• Il campionamento deve essere costante.
• E’ utile quando vi è da controllare un • E’ utile quando vi è da controllare un materiale con un flusso di produzione continuo (rullo di tessuto o un cavo elettrico).
• La non conformità è da esprimersi per unità da definire (difetti al m^2, etc.)
• Il lotto è inscindibile.
La v.a. che conta il numero di difetti per unità di misura è ....
...una v.a. di Poisson
I limiti della carta di controllo sono 3 dove è la costante di Poisson.c c c±
In mancanza di un valore teorico per si utilizza la media campionaria.c
Esercizio: Si riporta il numero di non-conformità osservato in 26 campioni prodotti in una successione di 100 circuiti stampati (100 circuiti stampati = 1 lotto).
>> c=[21,24,16,12,15,5,28,20,31, 40C chart
>> c=[21,24,16,12,15,5,28,20,31,25,20,24,16, 19,10,17,13,22,18,39,30,24,16,19,17,15];>> central=mean(c) = 19.67;>> upp=central+3*sqrt(central)=32.97;>> low=central-3*sqrt(central)=6.36;
0 5 10 15 20 25 305
10
15
20
25
30
35
40
Esercizio: eliminare il campione 20 e6 e rifare la carta di controllo.
Nell’esempio precedente, è stato preso in considerazione un solo lotto. Tuttavia questotipo di scelta non è statisticamente significativa. Sarebbe meglio ispezionare più lotti,perché c’è maggiore possibilità di incontrare non conformità.
Ad esempio potremmo essere interessati ad ispezionare 2 lotti e mezzo, ossia 250 cir-cuiti.
Carta U
Si calcola il numero di non conformità totale e lo si rapporta al numero di lotti esaminati.
xu
n=
Siccome rappresenta il num.
di pezzi non conformi totali,
è una v.a. di Poisson, di cui /
rappresenta la media cam-
pionaria.
x
x n3
uu u
n= ∓
1 rotolo=50 m^2 di tessuto – La tabella riporta il num di difetti.
Num. Num. m^2 Num.dif. Num. Di
rotoli ispez.
1 500 14 10.0=500/50
2 400 12 8.0=400/50
3 650 20 13.0
4 500 11 10.0
5 475 7 9.5
153
107.5u =
3107.5
uu ±
6 500 10 10.0
7 600 21 12.0
8 525 16 10.5
9 600 19 12.0
10 625 23 12.5
Totale 153 107.50
Limiti carte Shewhart
Caratteristica principale delle carte di Shewhart è che nel metodo di calcolo del valore della statistica da inserire nella carta di controllo, esse fanno uso unicamente dell’informazione sul processo contenute nel solo ultimo istante di osservazione, ignorando tutti quelli precedenti.istante di osservazione, ignorando tutti quelli precedenti.
Ciò rende la carta di Shewart relativamente insensibile alle piccole variazioni del livello del processo (di ampiezza in genere non superiore a 1.5 volte la deviazione standard)
Carte CUMSUM (cumulative sum) = somme cumulateCarte EWMA (Exponential Weighted Moving Average) = medie mobili pesate espo-nenzialmente.
Queste due carte funzionano bene nei confronti di piccoli salti di livello mentre non rea-giscono così velocemente come la carta di Shewarth per salti di livello elevato. Può quindirisultare utile combinare l’uso della carta di Shewart con questi due tipi di carta.
Esempio: i dati che andiamo ad esaminare sono stati costruiti al seguente modo. I primi 20 sono stati selezionati da una popola-zione gaussiana di media 10 e
12
13
14Shewart chart
zione gaussiana di media 10 e deviazione standard 1. I rimanenti 10 sono stati selezionati da una popolazione gaussiana di media 11 e di deviazione standard 1. Questi ultimi si possono pensare come selezionati da un processo che è andato fuori controllo statistico. 5 10 15 20 25 30
6
7
8
9
10
11
La carta della media non segnala subito la variazione!
( ) ( )0 0 1
1
Nella carta CUMSUM si effettua il grafico di
i
i j i i
j
S x x Sµ µ −=
= − = − +∑
>> s(1)=x(1)-10;>> for i=2:30s(i)=s(i-1)+(x(i)-10)end
4
6
8
10carta cumsum
0 5 10 15 20 25 30-4
-2
0
2
4
Quali sono i limitidi controllo?
Exponential chart
• Serve a monitorare un processo che media i dati in modo che a questa media viene dato sempre meno peso, mano mano che il tempo passapassa
• Viene valutata su tutto il processo e non sui sottogruppi razionali
• Più sensibile ai drift nel tempo• Robusta nel caso non normale
1(1 )i i i
z x zλ λ −= + −
Per =1, si riottiene la carta -bar.Xλ
(0,1) Peso alle medie dei sottogruppi tra 0 e 1.λ ∈ ⇒
0Il valore iniziale è .µ
Se non si conosce , al suo posto si può usare .xµ0Se non si conosce , al suo posto si può usare .xµ
( )
1
11
0
0
Sostituendo ricorsivamente i valori in (1 )
si ottiene 1 (1 )
i i i i
ij i
i i j
j
z z x z
z x z
λ λ
λ λ λ
−
−−
−=
= + −
= − + −∑
Applichiamoli all’esempioPrecedente.
>>ewmaplot(x’)
10.5
11
11.5
CL
Exponentially Weighted Moving Average (EWMA) Chart
EW
MA
0 5 10 15 20 25 309
9.5
10
Sample Number
EW
MA
9.5
10
10.5
11
11.5
12
CL
Exponentially Weighted Moving Average (EWMA) Chart
EW
MA
0 5 10 15 20 25 308.5
9
Sample Number
Ci restano da esaminare solo i diagrammi di correlazione!
][][][ ti,indipenden sono e Se : YEXEXYEYXTeorema =
Cosa si può dire sul viceversa?
)])([(Y)cov(X,
quantità la , e di definisce Si :Def
YX YXE
YX
µµ −−=
covarianza
YXXYEYX µµ−= ][),cov(
.non vale viceversaIl
.0),( ti,indipenden sono e Se : =YXCovYXTeorema
2
31
31
31)(
101XY
xp
X=⇒
−
Se la covarianza tra due variabili aleatorie è positiva, negativa o nulla, anche la correlazione sarà positiva, negativa o nulla.
YX
XY
YVarXVar
YX
YX
σσ
σρ ==
)()(
),cov(
:quantità la è e aleatorie variabilile tra La necorrelazio
eDefinizion
),cov(2)()()(: YXYVarXVarYXVarTeorema ±+=±
correlazione sarà positiva, negativa o nulla.
1 1-
:proprietà seguente della gode e aleatorie variabilile tra La
≤≤ ρ
YXnecorrelazio
Teorema
1)(1 Se : =±=⇒±= baXYPTeorema ρ
La covarianza è una misura della relazione lineare tra due variabili aleatorie.
(A) Covarianza positiva (C) Covarianza nulla
(B) Covarianza negativa (D) Covarianza nulla
e.incorrelat sono
tiindipenden e aleatorie variabiliue YXD
Teorema Il viceversa non vale a menoche X e Y non siano congiun-tamente normali.
( ) ( )( ) ( )
(-1,1). e 0,0 parametricon ,),(,),(for
2
)1(2
1exp
12
1),(
:è bivariata normale una di àprobabilit di densità funzione La
22
2
2
2
2
22
∈>>∈∈
−+
−−−
−
−−
−=
ρσσµµ
σ
µ
σσ
µµρ
σ
µ
ρρσπσ
YXYX
Y
Y
YX
YX
X
X
YX
XY
RRyx
yyxxyxf
:Esempio
Gaussiana (congiunta) bidimensionale
[ ] =µ XE[ ][ ]
[ ][ ] )1,1(
2
Y
2
X
−∈
=
=
=
=
ρ
σ
σ
µ
µ
YVar
XVar
YE
XE
Y
X
Contour plots0,0,0,1,1 ===== ρµµσσ YXYX
9.0,0,0,1,1 ===== ρµµσσ YXYX 0,0,0,1,1 ===== ρµµσσ YXYX
Consideriamo 10 coppie di dati che mettono in relazione la percentuale di riuscita di un certo esperimento in laboratorio con la temperatura alla quale l’esperimento è condotto.
>> x=[100, 110, 120, 130, 140, 150, 160, 170, 180, 190];>> y=[45, 52, 54, 63, 62, 68, 75, 76, 92, 88];
>> r=corrcoef(x,y)
r =
1.0000 0.97721.0000 0.97720.9772 1.0000
>>polytool(x,y)
Scatter diagram –
Diagramma di dispersione
Retta in verde…
È la retta di regressione dei minimi quadrati…Per conoscere i coefficienti
>> beta
beta =
0.4964 -4.4727
>> betaci
betaci =
0.4085 -17.46550.5843 8.5201
>> residuals
residuals =
-0.16361.8727
-1.09092.9455
-3.0182-3.0182-1.98180.0545
-3.90917.1273
-1.8364
0.50
0.75
0.90
0.95
Pro
babili
ty
Normal Probability Plot>> [H,P,KSSTAT,CV] = KSTEST(residuals/standard)
H = 0
P = 0.8054
Adeguatezza del Modello – ANALISI DEI RESIDUI
-4 -2 0 2 4 6
0.05
0.10
0.25
0.50
Data
Pro
babili
ty
KSSTAT = 0.1933
CV = 0.4093
>>