DATA MINING PER IL MARKETING Andrea Cerioli [email protected] Sito web del corso Il caso dello...

16
DATA MINING PER IL MARKETING Andrea Cerioli [email protected] Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v. sito del corso

Transcript of DATA MINING PER IL MARKETING Andrea Cerioli [email protected] Sito web del corso Il caso dello...

Page 1: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

DATA MINING PER IL MARKETING

Andrea [email protected]

Sito web del corso

Il caso dello Space Shuttle Challenger

Dati e documentazione: v. sito del corso

Page 2: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

Il disastro dello Space Shuttle Challenger avvenne la mattina del 28 gennaio 1986, quando lo Space Shuttle Challenger fu distrutto dopo 73 secondi di volo

Commissione di inchiesta indipendente nominata dal Presidente USA (commissione Rogers), formata da scienziati ed esperti: v. file Space_Shuttle_Intro.pdf

Page 3: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

Background• Lo Space Shuttle Challenger

• Articoli sui media relativi alla storia delle missioni

Page 4: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

Il disastro del Challenger• La navicella spaziale Space Shuttle

Challenger esplose il 28 gennaio 1986 dopo 73 secondi dal suo decollo dal Kennedy Space Center di Cape Canaveral in Florida.

• Nell’esplosione morirono tutti e sette i membri dell’equipaggio.

Page 5: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

La Commissione Rogers• Le immagini dell’esplosione mostrarono che

l’incidente avvenne a causa di un cedimento di uno dei due grandi razzi a propellente solido: Solid Rocket Motor o Solid Rocket Booster (SRB)

http://en.wikipedia.org/wiki/Space_Shuttle_Solid_Rocket_Booster

• Vennero esaminate diverse tonnellate di rottami recuperati nell’Atlantico nei mesi successivi al disastro.

• I rottami suggerirono che il cedimento fu causato dal guasto di una coppia di o-ring nel SRB destro (gli o-ring sono dei giunti in gomma non così diversi dalle guarnizioni delle moke per il caffé ma di dimensioni molto più grandi).

Page 6: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

La Commissione Rogers - 2• Nel Challenger c’erano 6 coppie di o-ring

ognuna formata da un o-ring primario ed uno secondario.

Page 7: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

La Commissione Rogers - 3• La funzione degli o-ring è quella di sigillare

le giunture, “attivati” dal calore al momento della partenza.

• Il danneggiamento (per erosione dovuta a eccesso di calore) o lo spostamento (per cause meccaniche) degli o-ring di una certa coppia può provocare la fuoriuscita di gas di combustione dal SRB: “blow-by”.

• Questo è proprio ciò che avvenne nel disastro del 1986: la fuoriuscita di gas di combustione da un SRB fece cedere il serbatoio esterno contenente idrogeno ed ossigeno liquido e quindi la navicella «esplose».

Page 8: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

Faceva troppo freddo?• L’ipotesi più plausibile (avanzata nella

Commissione da R. Feynman) è che il danneggiamento degli o-ring sia stato dovuto alla temperatura eccezionalmente bassa al momento del lancio: 31 gradi Fahrenheit, ovvero circa -0.5 gradi Celsius.

• Con una tale temperatura, gli o-ring perdono flessibilità e quindi si rompono più facilmente.

• In realtà, il dubbio che la temperatura potesse avere un effetto sul cedimento degli o-ring era presente anche prima del lancio, per ragioni sia fisiche che empiriche.

• La sera prima del lancio i tecnici dell’azienda produttrice dei SRB, della NASA e del Kennedy Space Center ebbero una drammatica riunione, sulla base delle previsioni meteo e dell’evidenza empirica disponibile sul cedimento degli o-ring.

Page 9: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

I dati disponibili• I dati fanno riferimento a 23 dei 24 lanci precedenti a

quello del Challenger• In sette di questi lanci vi furono danni agli o-ring

primariNumber of O-rings experiencing

thermal distress

Launch temperature

(degrees F)

Leak-check

pressure (psi)

0 66 501 70 500 69 500 68 500 67 500 72 500 73 1000 70 1001 57 2001 63 2001 70 2000 78 2000 67 2002 53 2000 67 2000 75 2000 70 2000 81 2000 76 2000 79 2002 75 2000 76 2001 58 200

Page 10: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

Una prima evidenza empirica• Analisi dei dati di temperatura per due gruppi separati

di lanci: con e senza danni (Failure)

Page 11: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

Scatterplot

• Si può intuire un effetto della temperatura (sx) mentre la pressione (dx) non sembra rilevante

Page 12: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

Regressione

• La variabile dipendente non soddisfa le ipotesi del modello di regressione: perché?

• La metodologia più appropriata sarebbe la regressione logistica v. parte successiva del corso

• Un modello di regressione può comunque essere utile per rispondere in via esplorativa al quesito iniziale

• Y = Number of O-rings experiencing thermal distress

• X1 = Launch temperature • X2 = Pressure

Page 13: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

Regressione – output 1

• Commento ai risultati del modello• Conferma che l’ effetto della pressione non è

rilevante

Page 14: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

Regressione – output 2 (solo X1)

• Commento ai risultati del modello• La stima del coeff. della temperatura è (approx)

invariata: perché• Dalle diagnostiche (qui non riportate) risulta che il

lancio 21 è anomalo (v. scatter plot): nuovo modello senza il lancio 21

Page 15: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

Regressione – output 3 (senza lancio 21)

• Quale conclusione dall’analisi?

Page 16: DATA MINING PER IL MARKETING Andrea Cerioli andrea.cerioli@unipr.it Sito web del corso Il caso dello Space Shuttle Challenger Dati e documentazione: v.

Perché la decisione fu di non sospendere il lancio?

• Un primo errore cruciale fu quello di considerare solo i 7 lanci con o-ring danneggiati: selection bias

• Un secondo errore fu quello di trascurare che 31°F era << alla più piccola temperatura nel campione di lanci (53°F): problema di estrapolazione

La relazione è a U: non c’è più evidenza dell’effetto