Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica...

45
Gruppo Identiteam 1 “Eurisko e oltre…” La nostra rivisitazione degli stili di vita

Transcript of Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica...

Page 1: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Gruppo Identiteam

23 marzo 2007

1

“Eurisko e oltre…” La nostra rivisitazione degli stili di vita

Page 2: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Metodologia analitica applicata per la definizione dei nuovi Profili

1. Gli Obiettivi del lavoro

L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di

vita proposti nel quadro Eurisko, finalizzata alla realizzazione di un quadro alternativo il più

possibile rispecchiante, nei suoi profili costitutivi, l’attuale società italiana.

2. Organizzazione del progetto

2.1 I punti guida

Abbiamo individuato una metodologia di lavoro specifica basata su alcuni punti, rivelatisi

fondamentali per garantire la fluidità delle fasi di progetto e la corrispondenza tra i

desiderata e il risultato ottenuto, li riportiamo di seguito:

L’avere come mission quella di creare un prodotto alternativo al quadro Eurisko,

ricalcando in parte la logica di segmentazione da loro utilizzata, innovando alcuni

aspetti da noi individuati come mancanti (rapporto con l’ICT e l’innovazione,

rapporto con il consumo nella grande distribuzione, tratti della personalità).

L’utilizzo di metodologie statistiche per l’elaborazione dei dati, in modo da ottenere

risultati basati su prove oggettive e non su considerazioni personali, imponendoci

anche nel caso di ricerca di profili da noi già ipotizzati, quali l’imprenditore di PMI, di

non “truccare i dati” a nostro favore ma di basarci sulle correlazioni espresse tra le

variabili.

La decisione di condividere tutto il materiale a nostra disposizione grazie alla

realizzazione del Blog “Eurisko e Oltre”, funzionale 1) a garantire una visione

d’insieme dell’evoluzione del progetto a tutti i componenti del gruppo, 2) a

permettere a ciascuno di contribuire attivamente alla buona riuscita del progetto.

2

Page 3: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

La suddivisione del progetto in due fasi principali (analisi dei dati, creazione del

quadro) tramite una procedura over the wall, permettendo una suddivisione e

specializzazione dei compiti all’interno del gruppo.

3. La prima fase del progetto

Ai punti guida va raccordata la pianificazione temporale delle fasi del progetto.

In questo paragrafo si illustrerà l’organizzazione della prima fase del lavoro corrispondente

all’analisi dei dati e alla creazione dei profili.

Questa infatti ci ha impegnato molto dal punto di vista organizzativo (strutturare le

domande, pianificare i questionari, analizzare i dati), mentre la seconda fase, ha

presentato delle criticità più di carattere creativo-decisionale (trovare un tema efficace per

il quadro, deciderne i contenuti multimediali, produrli).

Il processo produttivo sottostante alla prima fase è schematizzato nella tabella sottostante

dove a destra troviamo il nome del processo e a sinistra una breve descrizione del suo

contenuto.

Processi Contenuto

Definizione degli obiettivi Prendendo come bentchmark il quadro

Eurisko abbiamo ipotizzato dei possibili

nuovi profili da ricercare, osservando quali

fossero le caratteristiche degli stili di vita

per noi più interessanti.

Definizione del campione Abbiamo optato per una soluzione di

campionamento stratificato con frazione di

campionamento proporzionale per ogni

strato, soluzione preferibile al

campionamento semplice, considerata

l’eterogeneità del fenomeno da studiare

nella popolazione di riferimento

dell’indagine.

Stesura del questionario Abbiamo costruito il questionario in

3

Page 4: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

relazione agli obiettivi prefissati,

strutturando le domande in funzione di una

successiva analisi quantitativa.

Raccolta informazioni Abbiamo suddiviso i questionari in base alla

logica di campionamento.

Prima di effettuare le interviste, abbiamo

costruito e testato un file Excel nel quale

ogni membro del gruppo ha riportato i dati

raccolti. I singoli file Excel sono stati in

seguito riuniti per creare il dataset finale.

Analisi dei dati e creazione dei profili In base alle ipotesi di gestione e anali dei

dati fatte precedentemente, vista la

numerosità delle variabili (ben 44) e del

campione (133 individui) abbiamo optato

per l’utilizzo di Excell in fase di analisi e dei

più potenti ma più complessi software

Mathlab e R in fase di verifica dei risultati.

All’analisi statistica è seguito il profilo dei

cluster trovati.

Nei paragrafi che seguono saranno sviluppate con maggiore precisione alcune tematiche

inerenti i processi presentati nella tabella, in particolare analizzeremo la logica di

campionamento, l’elaborazione del questionario, la logica di analisi dei dati, la verifica dei

risultati ottenuti.

3.1 La logica di campionamento

4

Page 5: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Di fronte al problema del campionamento, fase del progetto di grande criticità per la sua

forte incidenza sui risultati finali, abbiamo optato per una soluzione di campionamento

stratificato, soluzione preferibile al campionamento semplice, considerata l’eterogeneità

del fenomeno da studiare nella popolazione di riferimento dell’indagine:

si è optato per adottare una frazione di campionamento per ogni strato di tipo

proporzionale, soluzione che prevede l’estrazione di un numero di elementi proporzionale

al peso dello strato della popolazione. La popolazione oggetto di analisi è stata circoscritta

alla popolazione italiana di età superiore ai 15 anni; sulla base dei dati Istat sono state

ricavate le consistenze numeriche della popolazione italiana (dati 2006) in relazione alle

seguenti fasce d’età:

15-18; 19-27; 28-37; 38-50; 51-65; più di 65.

Sono stati quindi definiti i pesi dei diversi strati sulla popolazione totale, e i medesimi pesi

sono poi stati mantenuti nella definizione del campione al fine di ottenere un

campionamento il più possibile rappresentativo della popolazione italiana.

Formalmente:

siano

il numero degli strati

la numerosità dello strato h

la numerosità della popolazione

la numerosità del campione

è l’h-esimo peso dell’h-esimo strato sulla popolazione di riferimento

è l’h-esimo peso del campione associato all’h-esimo strato del campione definito

affinchè risulti:

Ogni persona ha quindi avuto il compito di intervistare 16 persone così distribuite per

fasce di età:

5

Page 6: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Età 15-18 19-27 28-37 38-50 51-65; più di 65

N. persone 1 2 3 4 3 3

Al fine di ottenere un campione più rappresentativo possibile della popolazione italiana,

oggetto d’indagine nel presente progetto, il campionamento è stato effettuato in più

province del Centro Nord sfruttando anche la preziosa collaborazione di amici dislocati in

diverse province e l’estrazione delle unità intervistate è stata effettuata prevalentemente

presso le Poste delle diverse province o presso le stazioni, al fine di garantire la massima

casualità possibile con i mezzi a nostra disposizione necessaria per cogliere

sufficientemente la variabilità del fenomeno.

Le analisi successivamente svolte hanno poi confermato la bontà del campionamento

eseguito, presentando alta variabilità in relazione a tutte le variabili, e nello stesso tempo

significative relazioni tra le stesse, che hanno permesso di ottenere buoni risultati, come

verrà illustrato, nella fase di datamining, permettendo di giungere alla configurazione di

gruppi molto eterogenei tra loro, ma con una soddisfacente omogeneità interna,

confermando quindi la scelta rappresentata dal campionamento stratificato quale criterio

idoneo al fenomeno oggetto di analisi.

3.2 Il questionario

Un momento fondamentale della prima fase del progetto è stato la stesura del

questionario.

6

Page 7: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

L’obiettivo prefissatoci era quello di avere uno strumento efficace, ben strutturato,

semplice per gli intervistati, ma che potesse in seguito essere convertito dal punto di vista

quantitativo per essere riportato in un file Excell, diventando così una potente fonte di

informazioni.

Prima della stesura, abbiamo quindi individuato alcune caratteristiche indispensabili.

Da subito, confrontando le nostre esperienze, si è optato per la forma autocompilativa,

l’intervistato avrebbe compilato da solo le domande, ritenendo questa una modalità più

veloce, efficace e meno invasiva della privacy.

Questa scelta ha comportato l’obbligo di realizzare un documento facile da compilare, con

un linguaggio “wording” amichevole e a tutti comprensibile, con domande dirette, fatte in

seconda persona (es. : Come passi il tuo tempo libero?).

Nella strutturazione abbiamo applicato la logica ad imbuto, “funnel approach”, partendo da

domande di carattere generico per arrivare nello specifico, creando una sequenza logica

di macrosezioni quali: anagrafica; abitazione; titolo di studio e occupazione; cultura, tempo

libero e informazione; distribuzione del reddito; personalità.

Per semplificare la compilazione e per convertire in seguito il tutto in dati numerici,

abbiamo fatto un breve studio sulle scale da utilizzare nel questionario.

Si è optato per scale qualitative e non quantitative, ritenendo il confronto con le scale

numeriche abbastanza impegnativo per gli intervistati e non vincolante per i risultati del

nostro lavoro.

L’unica scala quantitativa inserita obbligatoriamente è quella relativa all’età che è stata

strutturata analizzando le fasce d’età dei profili Eurisko.

Si è voluta privilegiare la velocità di compilazione inserendo solamente risposte multiple e

non domande aperte, l’opzione “altro…” è stata inserita solamente in una domanda, ma in

generale tralasciata, perché difficilmente analizzabile statisticamente.

Facendo un approfondimento sulle scale, si è deciso di sfruttare nell’analisi della

personalità la tecnica del differenziale semantico a cinque punte1, in previsione di trovare

delle attitudini caratteriali simili in base ai profili. Osservando la struttura creata è possibile

vedere come alla destra si collochi un carattere che può essere identificato come

espansivo, mentre a sinistra un carattere più timido e idealista.

1 La tecnica è stata sviluppata da Charles Osgood(1952) e si caratterizza per l’uso di aggettivi bipolari. Solitamente il differenziale semantico può essere strutturato su cinque o sette soluzioni dove al centro traviamo sempre la possibilità di dare un giudizio indifferente.

7

Page 8: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Nella sezione riservata a “Cultura, tempo libero e informazione”, si è optato per mantenere

una scala a tema singolo, molto simile alla Likert2, dove l’aspetto qualitativo (mai, poco,

abbastanza, molto) potesse essere facilmente convertito in un approccio quantitativo (le

risposte sono state in seguito caricate in Excell con i numeri: 0,4,8,12).

Non abbiamo voluto inserire domande riguardanti il reddito, perché ritenute scarsamente

identificative dello stile di vita, e problematiche dal punto di vista della privacy, queste sono

state, invece sostituite da domande relative ai consumi, fuori e dentro l’abitazione, che

meglio ci hanno permesso di capire le abitudini dei soggetti intervistati.

Dopo la stesura di una prima bozza, abbiamo fatto alcune prove di rump-up, osservando

le reazioni e le difficoltà degli intervistati.

Il tempo di compilazione medio stimato nelle prove è stato pari a 8 min, ritenuto accettabile

da parte del gruppo.

In parallelo alle prove del questionario è stata realizzata una prova della fattibilità

dell’analisi dal punto di vista statistico, riportando nel software statistico Mathlab i dati di

quattro individui da noi creati e rendendoli a due a due forzatamente simili, creando così

due “segmenti artificiali” (cluster).

Il risultato ottenuto con Mathlab è visibile nella figura 1, dove è palese come le unità 1 e 4

vengano raggruppate assieme e siano distinte dalle unità 2 e 3.

Questa prova ci ha dato una prima conferma sulla fattibilità dell’analisi e sulla possibilità di

ottenere da domande apparentemente qualitative dei risultati di tipo quantitativo.

2 La tecnica fu ideata nel 1932 dallo psicologo americano Rensis Likert con lo scopo di elaborare un nuovo strumento, più semplice rispetto ad altri, per la misurazione di opinioni e atteggiamenti. Sotto la categoria della “scala di Likert”vanno collocate una varietàdi scale, conosciute in letteratura come scale additiveo meglio “sommate drating scales”. Le scale di Likert sono le più semplici ed intuitive presentate in letteratura: date una serie di affermazioni, si chiede all’intervistato se e in che misura sia d’accordo.

8

Page 9: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Figura 1: Dendrogramma o albero delle aggregazioni

La figura è il risultato di un algoritmo gerarchico aggregativo, che partendo dalle singole unità statistiche le aggrega in

gruppi omogenei in base alla “rassomiglianza” tra i giudizi espressi dai soggetti nel questionario.

La misura quantitativa per definire la similarità tra due giudizi è data dalla distanza euclidea tra due punti (visibile

nell’asse delle ordinate), le unità vengono quindi aggregate in base a determinati calcoli operati sulle distanze relative a

ogni unità ed espresse da più variabili. L’algoritmo oltre ad operare un calcolo delle distanze tra unità opera

contemporaneamente un calcolo delle distanze tra gruppi, il cui scopo è quello di creare dei cluster di massima

omogeneità interna e massima distanza, quindi eterogeneità esterna.

3.3 Logica di analisi e segmentazione

3.3.1 Scelta della procedura

Durante la stesura finale del questionario il gruppo di lavoro aveva ipotizzato alcune

procedure di analisi fondate sull’utilizzo dell’algoritmo di clustering con il software Mathlab,

il cui risultato sarebbe stato un grafico ad albero (dendrogramma, vedi sopra) tramite il

quale identificare la presenza di gruppi.

Dopo aver ottenuto la matrice di dati finale, data dall’unione dei singoli file Excel di ogni

membro del gruppo, ci siamo però resi conto che la complessità del dataset (44 varibili

*130 soggetti) unita alla criticità del fattore tempo, avrebbero condizionato l’evoluzione

dell’intero lavoro dando poco tempo alla fase successiva di creazione del quadro e della

presentazione.

Si è quindi optato per un’analisi basata sempre sul metodo gerarchico, ma realizzata con i

filtri avanzati Excel secondo la logica degli alberi di classificazione, dove quindi potessimo

9

Page 10: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

gestire meglio i risultati e essere noi a decidere la sequenza di variabili3 da fare entrare per

prime nella ricerca dei cluster.

Usando nella fase iniziale Mathlab infatti, i tempi di profilazione sarebbero stati molto

lunghi, in quanto avremmo dovuto affrontare alcuni problemi inerenti le relazioni tra

variabili e unità statistiche a queste connesse.

Abbiamo quindi voluto utilizzare l’algoritmo di Mathlab solo in fase di conferma, per

compiere una verifica della consistenza dei gruppi da noi individuati.

In aggiunta a questo abbiamo sfruttato un ulteriore metodologia di analisi denominata

Multidimensional Scaling congiunta all’ Analisi in Componenti Principali, sfruttando il

software R con la finalità di a) ottenere una rappresentazione sintetica delle unità

statistiche, in relazione ad alcune variabili selezionate che permettesse di visualizzare ad

un livello bidimensionale i gruppi ottenuti mostrando come le differenti variabili influenzino

la formazione dei gruppi identificati.

b) confermare ulteriormente i gruppi ottenuti attraverso le precedenti analisi.

3.3.2 Procedura di classificazione gerarchica

Come già evidenziato, per operare la segmentazione dei dati è stato scelto un metodo

gerarchico basato sulla logica degli alberi di classificazione, procedura che è stata

realizzata, mediante l’applicativo Excel, applicando filtri avanzati alle singoli variabili che

hanno permesso di realizzare query specifiche funzionali a identificare i gruppi nel

dettaglio ( nel file Excel allegato sono riportati a titolo esemplificativi alcuni output delle

query che hanno permesso l’identificazione di alcuni dei gruppi).

La logica sottostante agli alberi di classificazione consiste nell’operare successive

scremature del campione totale in base ai valori via via assunti dalle singole variabili con

una logica che potremmo definire if-then oppure divide and conquer.

Portiamo un esempio della logica sottostante:

Gli individui con un padre possessore di Azioni sono più inclini all’acquisto di queste?,

risposta si, oppure no; se si che tipologia di titoli acquistano.

In questo caso abbiamo operato con un albero binario, la cui variabile risposta alla

domanda “Comprano Azioni ?” poteva dare solamente due risultati (SI, NO), nel nostro

progetto invece abbiamo operato con degli alberi generali, dato che la variabile risposta ad

3 Per variabili intendiamo le singole domande alle quali è stato attribuito un punteggio.ES: guarda la TV è una variabile alla quale sono associati dei valori che vanno da 0 a 12.Per unità statistiche si intendono i singoli individui intervistati.

10

Page 11: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

ogni domanda poteva dare più di un risultato (es: se sposato, allora con quanti figli?

1,2,3..).

E’ importante evidenziare quanto in queste operazioni conti l’ordine della sequenza delle

variabili prese in considerazione, infatti diversi ordinamenti danno gruppi con diverse

caratteristiche; inoltre precisiamo che questa procedura di segmentazione viene arrestata

non appena si riscontra una forte omogeneità tra i valori delle variabili che compongono il

segmento analizzato.

Questa ultima considerazione garantisce il criterio di massima omogeneità interna al

cluster.

3.3.3 Le variabili di classificazione

Sfruttando la procedura di classificazione gerarchica, in sede di analisi, si è deciso l’ordine

di entrata delle variabili.

Questo è stato pensato osservando i risultati ottenuti da Eurisko, tentando di capire quali

potessero essere state le loro scelte in merito.

Abbiamo quindi optato per una serie di variabili ritenute fondamentali, quali per esempio:

l’occupazione, la fascia d’età, il titolo di studio, l’utilizzo dei mezzi di informazione.

In base a queste, effettuando varie prove siamo giunti alla determinazione dei gruppi finali

e delle caratteristiche relative a ogni gruppo.

Si è così potuto procedere alla fase profilazione.

Per esplicitare maggiormente l’ordine e la sequenza di variabili scelte per la

classificazione, riportiamo i risultati ottenuti nella tabella sottostante.

Ordine di entrata delle variabili di segmentazione Profilo ottenutoOccupazione > età > Titolo di studio > Mezzi di Informazione

Rampanti

Occupazione > età > Titolo di Studio CasalingheFrequenza Discoteca > sport e cura del corpo TonyOccupazione > Età > Livello Associazionismo Nonno DuracellOccupazione > Età > Livello Associazionismo > Titolo di Studio

Nonno Stanco

Occupazione > Titolo di Studio Self Made ManEtà > Occupazione > Titolo d Studio Work in ProgressEtà > Occupazione > Titolo di studio I Giovani LavoratoriOccupazione > Sesso > Figli (Sì/No) Wonder WomanEtà X-Box Generation

11

Page 12: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

3.4 I Profili ottenuti

XBox Generation – I Giovanissimi

IDENTIKIT:

Sono adolescenti tra i 15 e 18 anni sia maschi che femmine, vivono esclusivamente con i genitori in appartamento o abitazione indipendente situata in città, cittadina o paese.Il loro tempo libero è dedicato allo sport, di cui sono attivi praticanti, e alle relazioni con gli amici in locali di ritrovo, quali pub e pizzerie, al contrario non amano le discoteche, delle quali non sono grandi frequentatori.Non si sentono molto creativi e amano i consumi culturali passivi, come ascoltare musica e leggere libri, a scapito di attività come la visita a musei o mostre o l’andare a teatro.La scarsa propensione per le attività creative è compensata dall’utilizzo di mezzi tecnologici, dall’apertura all’innovazione e dal grande utilizzo della rete.Dal punto di vista dei media: sono voraci consumatori di TV, mezzo di comunicazione per eccellenza anche più di Internet, non leggono la carta stampata e non sono informati sulla politica.Per loro il centro commerciale è un luogo divertente (risposta data all’unanimità).Dal punto di vista della personalità si sentono socievoli e impulsivi, anche se è difficile delineare una personalità univoca.

I Giovani – Work in Progress

IDENTIKIT:

I giovanissimi studentiSono single, studenti universitari tra i 19 e i 27 anni.Vivono per un 90% con i genitori, il resto in appartamento con amici.Praticano moderatamente sport e tengono abbastanza alla cura del corpo.Spendono molto in pub e pizzerie, mediamente tra i 100 e 300 euro. Non praticano il volontariato, eccetto alcuni casi, e non frequentano associazioni.Sono interessati alla cultura, ma non frequentano molto mostre e musei; sono però accomunati dalla lettura di libri e da una buona tendenza a viaggiare.Li contraddistingue una forte passione per la musica, che è vista come un elemento fondamentale, e se parliamo di musica dal vivo, questa è fruita più nei concerti che nelle discoteche.Si tengono informati attraverso la lettura di quotidiani e tramite la TV. Presentano un buon interesse verso la vita politica.Usano moltissimo Internet e sono nel complesso “tecnologici”.Percepiscono il centro commerciale come un luogo conveniente e divertente.Non sono accomunati da un unico e specifico profilo personale: sono molto eterogenei da questo punto di vista.

12

Page 13: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Sottogruppo: Giovani lavoratoriSono giovani tra i 19 e 27 anni che hanno deciso di non proseguire il ciclo degli studi per dedicarsi all’attività lavorativa.Vivono tutti in famiglia con i genitori (scompare la convivenza con gli amici che caratterizza i colleghi studenti).Sono sia operai che impiegati, non presentano evidenti consumi di carattere culturale. Non frequentano associazioni e non praticano il volontariato.Sono buoni frequentatori di cinema e di luoghi di ritrovo quali pub e pizzerie, anche se meno dei loro coetanei studenti, forse per mancanza di tempo.I loro consumi fuori casa non sono altissimi: mediamente pari a 300 euro. Prediligono uscire nei week-end e frequentano sporadicamente anche le discoteche.Leggono molto i quotidiani, anche se vi è una tendenza maggiore negli operai rispetto agli impiegati. Entrambi presentano un interesse politico medio.Si definiscono abbastanza tecnologici ma non innovatori.Nel caso dei giovani operai, questi sono più creativi dei loro colleghi impiegati, forse perché si dedicano ad attività saltuarie dopo il lavoro.Frequentano i centri commerciali dei quali percepiscono principalmente l’aspetto di convenienza.

I Rampanti – professionisti superattivi

IDENTIKIT:

Sono principalmente uomini, liberi professionisti o Manager di alto livello culturale, di età compresa tra i 28 e 45 anni.Sono sia single che sposati e in quest’ultimo caso vivono assieme al coniuge in famiglie con non più di due figli.La maggior parte di loro è laureata anche se vi è una limitata presenza di diplomati.Il loro profilo è caratterizzato dall’iperattività: i Rampanti sembrano essere dotati del dono dell’ubiquità, riuscendo a coniugare al massimo impegni lavorativi, cura del corpo, viaggi di lavoro e volontariato.I Rampanti sono abbastanza sportivi, ma molto attenti alla cura del corpo, amano socializzare in luoghi quali pub, ristoranti ma soprattutto associazioni culturali.Amano dedicarsi assiduamente ad attività quali visite a musei e cinema, ascoltano molta musica e leggono libri principalmente per svago, ma anche per essere costantemente aggiornati in ambito professionale.I consumi sono condizionati dall’attività lavorativa e appaiono evidenti nelle loro risposte, poiché viaggiano moltissimo e dimostrano di essere grandi utilizzatori e conoscitori della tecnologia e della rete Internet.Dimostrano un elevato interesse per la politica e per essere sempre aggiornati prediligono Internet e quotidiani rispetto a TV, settimanali e mensili.Per i Rampanti il centro commerciale è un luogo stressante e conveniente, ma viene anche considerato un buon punto di incontro.Osservando la loro personalità, si può dire che essi siano uno dei pochi profili a presentare una coscienza piena della propria persona, si definiscono infatti estroversi, impulsivi, molto socievoli, sicuri, dallo spirito innovatore e più concreti che sognatori.

13

Page 14: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Tony Manero – Ballo e mi tengo in forma

IDENTIKIT:

Tony Manero potrebbe definirsi un “profilo trasversale rispetto all’età”, infatti vi appartengono sia donne che uomini di età compresa tra i 15 e i 55 anni di stato civile vario, quindi troviamo sia single che sposati\conviventi, che sposati con figli.Chi appartiene a questo profilo vive principalmente in appartamento, ha un titolo di studio che può variare dalla licenza media alla laurea, ha un occupazione varia a seconda dell’età, infatti troviamo: studenti, liberi professionisti, impiegati, operai, insegnanti, artigiani.Tutti i Tony Manero sono però uniti dall’amore per la Disco (o più in generale per il ballo), per lo sport e la cura del corpo, per i quali impiegano la maggior parte del loro tempo e danaro.I loro consumi sono infatti ridottissimi entro le mura domestiche (fino a 100 euro), ma per se stessi spendono molto, anche oltre i 500 euro.Oltre ad andare a ballare adorano frequentare pub e luoghi di ritrovo, vanno molto al cinema e viaggiano spesso, non frequentano ambienti quali musei o teatri ritenuti da loro forse poco eccitanti.Quasi per tutti loro il centro commerciale è un luogo divertente o un punto di incontro, in assoluto non risulta essere scelto per la convenienza.Al contrario di quello che si potrebbe immaginare leggono abbastanza, soprattutto prediligono settimanali e quotidiani.Si tengono informati attraverso la TV e internet con il quale hanno un’ottima familiarità, dichiarano di essere fortemente tecnologici.Riguardo alla personalità si definiscono estroversi, impulsivi, socievoli e oratori. Storia del profilo:Il profilo di Tony Manero, merita un commento in più rispetto agli altri, non perché abbia maggiore rilevanza, ma per il suo particolare e per noi strano e inaspettato profilo che quindi abbiamo voluto evidenziare.Esso è scaturito dall’osservazione nei dati di una forte correlazione tra l’essere amante della discoteca e l’avere una profonda dedizione per lo sport e la cura del corpo, proprio come nel personaggio interpretato da Jhon Travolta in “La febbre del sabato sera”. Ci ha lasciati stupiti la stranezza e per la sistematicità della correlazione che si è manifestata in tutte le fasce d’età, come una sorta di minigruppo.

14

Page 15: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Wonderwoman – Le impegnate

IDENTIKIT:

Sono donne sposate di età compresa tra i 28 e i 50 anni, che risiedono principalmente assieme al coniuge e ai figli, sia in abitazioni indipendenti, che in appartamento.Il loro profilo è caratterizzato da una buona istruzione, sono per la maggior parte laureate, e da consumi principalmente di tipo culturale quali musei, libri e viaggi.La famiglia e il lavoro occupano buona parte della loro giornata, a scapito di attività quali la palestra e la cura del corpo, che praticano di rado.Rispetto allo sport prediligono attività più rilassanti quali passeggiate all’aria aperta, visite ai musei, serate a teatro e al cinema.Sono buone ascoltatrici di musica e spiccano nel consumo di libri dei quali sono attente lettrici.Sono molto interessate all’informazione e alla politica e sfruttano omogeneamente tutti i mezzi di comunicazione, con predilezione di quotidiani e settimanali rispetto ai mensili.Sono abbastanza tecnologiche e propense all’innovazione e si definiscono persone caratterialmente sicure.Spendono molto sia in ambito domestico (€ > 300) che fuori casa (€ > 500), anche se la maggior parte di loro percepisce il centro commerciale come un luogo stressante.

Le regine della casa – le casalinghe

IDENTIKIT:

Sono donne di età compresa tra i 38 e i 60 anni, sposate o vedove.Vivono principalmente con il coniuge, con o senza i figli presenti nel nucleo familiare (che solitamente è composto da non più di tre figli); superata la soglia dei 50 anni, nei casi di vedovanza rintracciabili, vivono da sole.Le casalinghe risiedono principalmente in case indipendenti, dove trascorrono prevalentemente il proprio tempo e alle quali dedicano buona parte delle spese economiche: a questo proposito si può osservare come i consumi in casa superino abbondantemente i 300€, mentre quelli fuori casa siano compresi tra i 100 e i 300€, esigui considerata l’età.Il profilo delle casalinghe è caratterizzato da una scarsa attività sociale, un basso livello culturale (quasi la totalità delle intervistate ha la licenza elementare) e da un totale inutilizzo delle tecnologie informatiche.Non amano dedicarsi all’attività sportiva, ma sono molto dedite alla cura del proprio corpo.Coerentemente con quanto affermato in precedenza, non frequentano locali di ritrovo quali pub o pizzerie e partecipano quasi timidamente ad attività di associazionismo e volontariato; nel tempo libero prediligono attività quali la lettura di libri e riviste settimanali,

15

Page 16: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

di cui sono assidue acquirenti, molto più rispetto a quelle mensili.Non frequentano luoghi di carattere culturale (mostre o musei) e non amano la visione dei programmi televisivi, ascoltano prevalentemente programmi radiofonici, probabilmente durante le attività dedite alla casa, e si ritengono genericamente amanti della musica.Inoltre le casalinghe reputano il centro commerciale un luogo conveniente, a riprova del fatto che prestano molta attenzione alla spesa.Amano definirsi oratrici, forse attribuendo al termine l’accezione di “chiacchierone”; per alcuni aspetti la loro personalità si può definire contraddittoria poiché, nonostante non abbiano familiarità con il mondo della tecnologia, si definiscono tutte “molto innovatrici”.

Nonno Duracell – il pensionato attivo

IDENTIKIT:

Sono i pensionati dai 60 anni in su, sia maschi che femmine, sposati o vedovi.Considerando il loro nucleo familiare la media di figli è pari a 2,5, anche se spesso questi non vivono più nella stessa abitazione. I Nonni Duracell si distinguono per la loro vitalità e per la partecipazione costante ad associazioni e circoli culturali e spesso ad attività di volontariato.Questo profilo è caratterizzato da un alto livello di scolarizzazione corrispondente ad un diploma di maturità o laurea.I Nonni Duracell non praticano molto sport, ma si tengono in forma andando spesso a passeggiare all’aria aperta. Il loro dinamismo si esprime anche nel viaggiare molto e nell’essere interessati a consumi culturali quali la lettura di libri, che spicca notevolmente, e le visite a musei e mostre.Seguono molto il mezzo televisivo che però abbinano alla lettura di quotidiani; non usano internet e ascoltano poco la radio.Spendono molto per la casa (circa 300euro), ma la spesa più rilevante è per i consumi fuori casa, mediamente intorno ai 400 euro.Il centro commerciale è da loro vissuto come un luogo conveniente, ma una minima parte, soprattutto quella residente nei paesi, non lo frequenta.Si definiscono: estroversi, molto sicuri, impavidi, concreti e tradizionalisti.

Sottogruppo: I nonni stanchiNella categoria generale dei pensionati è da rilevare però anche la presenza di un’altra tipologia di profilo, in netta contrapposizione ai “pensionati attivi”: i “nonni stanchi”. E’ questo un profilo esclusivamente maschile, caratterizzato da una dinamicità nettamente minore rispetto al Nonno Duracell.Chi appartiene a questo profilo è solitamente sposato con in media due figli, ha un titolo di studio medio-basso, quale licenza elementare o media, e si caratterizza per un approccio piuttosto passivo alla vita: frequenta poco le associazioni e non pratica il volontariato, non ama leggere libri, acquista raramente i quotidiani e non ha una precisa idea su cosa rappresenti per lui un centro commerciale.Un elemento interessante da rilevare è come, contrariamente a quanto emerso dal resto del questionario, essi, nel definire la loro personalità, si definiscano con gli stessi aggettivi dei Duracell: estroversi, sicuri, impavidi, concreti ma anche e sopratutto materialisti.

L’Imprenditore – Self made man

16

Page 17: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

IDENTIKIT:

Sono imprenditori di PMI, di età compresa tra i 40 e 65 anni. Risiedono tutti in abitazioni indipendenti site in piccoli e medi centri, con non più di 10mila abitanti.Sono per lo più sposati, ma anche single.Il loro livello d’istruzione corrisponde al diploma di maturità.Dal punto di vista dei consumi seguono molto quelli dei Rampanti, ma con toni più modesti. In particolare, a differenza dei Rampanti, i Self Made Man spendono poco per la casa (da 100 a 300 euro), mentre hanno molte spese esterne, che superano abbondantemente i 500 euro.Tutti ritengono che i centri commerciali non possano essere luoghi d’incontro, ma alcuni li definiscono convenienti altri stressanti o ancora, non li frequentano.All’opposto dei Rampanti partecipano pochissimo alle associazioni e non pensano al volontariato.Sono abbastanza sportivi e tengono alla cura del corpo, viaggiano saltuariamente e non sono attratti da consumi di carattere culturale, anche se li praticano occasionalmente.Hanno un modesto interesse per la vita politica e si tengono informati principalmente tramite la TV e i quotidiani.Nonostante abbiano un discreto feeling con Internet e siano imprenditori, non si definiscono innovatori, anzi, si identificano quasi all’unanimità come tradizionalisti e concreti.Si sentono inoltre sicuri ed estroversi.

3.5 Verifica dei risultati con software statistici

17

Page 18: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

I gruppi individuati nella fase dell’analisi descritta sono stati oggetto analisi confermative,

come già anticipato, con due differenti metodologie statistiche: l’applicazione di un

algoritmo gerarchico aggregativo mediante il software Mathlab, e l’applicazione congiunta

del Multidimensional Scaling con L’analisi in Componenti principali mediante il software R.

Tali analisi sono state condotte al fine di garantire più oggettività e rigore possibile a

questa fase di analisi, cruciale per la definizione del nuovo quadro, cercando di

minimizzare l’impatto di congetture stereotipate dei profili della società attuale nell’analisi,

che avrebbero potuto inficiare il risultato del progetto impedendo di esplicitare profili

latenti.

3.5.1 I profili scelti per la verifica

L’analisi confermativa è stata sviluppata su quattro dei gruppi identificati: X-Box

Generation, Rampanti, Nonni Duracell e Regine della Casa.

Caratteristiche salienti dei Gruppi selezionati

X – Box Generation

Adolescenti tra i 15 e i 18 anni

Sport e Amici nel tempo libero

Poche attività creative, consumi culturali passivi ( bassa frequentazione musei)

Alto Tasso di utilizzo tecnologia (videogames)

Alto utilizzo Tv, lettura di quotidiani molto ridotta

Scarso Interesse politico

Livello di spesa a casa pressoché nullo

Difficile identificazione caratteriale, poca omogeneità all’interno del profilo in

relazione alle variabili applicate nel differenziale semantico

Rampanti

Manager tra i 28 e i 45 anni

18

Page 19: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Generalmente laureati

Alta dinamicità: alto livello di Sport, Cura del corpo, Associazionismo, Musei ,

Lavoro ad alto contenuto professionale

Alto livello di spesa sia a casa che fuori

Alto Interesse politico

Alto utilizzo dei quotidiani come mezzo di informazione

Estroversi, Innovatori, Sicuri di sé, Socievoli

Regine della casa

Casalinghe sposate tra i 38 e i 60 anni

Medio basso livello di istruzione

Trascorrono la maggior parte del tempo in attività legate alla casa

Alta spesa in casa

Basso interesse politico

Basso livello di lettura dei quotidiani, preferiscono mensili e settimanali

Si percepiscono innovatrici ma non utilizzano ICT

Bassa frequentazione di loghi di carattere culturale quali musei

Nonni Duracell

Pensionati attivi dai 65 anni in su

Rilevante partecipazione ad associazioni e circoli

Alto livello di Istruzione

Alto livello di consumi culturali (libri, Musei, Mostre)

Quotidiani e Tv quali principali mezzi di informazione

Alto livello di spesa sia a casa che fuori ( tendenza a spendere più fuori casa)

Estroversi, Sicuri, Impavidi, Concreti e Tradizionalisti

Essendo l’analisi confermativa focalizzata sui quattro gruppi descritti è stato considerato

un sottoinsieme del campione, ottenuto a seguito di query in funzione della variabili

utilizzate per identificare i gruppi, al fine di rendere più chiaro il risultato ottenuto senza

19

Page 20: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

inficiare la validità statistica della procedura adottata; questo spiega il minor numero di

unità che verranno rappresentati nei prossimi grafici.

Le variabili scelte per questa analisi sono le seguenti:

- Livello di spesa a casa

- Livello di partecipazione alle associazioni

- Occupazione

- Livello di interesse politico

- Lettura quotidiani

- Frequentazione Musei

La scelta è caduta su tali variabili multidimensionali poiché a) risultano meglio esplicative

delle differenze intergruppo relative ai clusters condiderati e b) presentano modesti livelli di

correlazione in relazione a tali gruppi, caratteristica importante per ottenere buoni output

da tale analisi.

3.5.2 Analisi confermativa mediante algoritmo gerarchico aggregativo

Attraverso il software statistico MathLab è stata eseguita analisi confermativa mediante un

algoritmo gerarchico aggregativo, il quale, partendo dalle unità statistiche ( le persone

20

Page 21: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

intervistate) le aggrega in gruppi omogenei in base alla “rassomiglianza tra i giudizi

espressi nel questionario dando come ouput per l’identificazione dei gruppi un

dendrogramma come quello illustrato al paragrafo 3.2.

La misura quantitativa per definire la similarità tra due giudizi è data dalla distanza

euclidea tra due punti (visibile nell’asse delle ordinate), le unità vengono quindi aggregate

in base a determinati calcoli operati sulle distanze relative a ogni unità ed espresse da più

variabili. L’algoritmo oltre ad operare un calcolo delle distanze tra unità opera

contemporaneamente un calcolo delle distanze tra gruppi, il cui scopo è quello di creare

dei cluster di massima omogeneità interna e massima distanza, quindi eterogeneità

esterna.

Si è proceduto predisponendo un dataset con il sottocampione di unità statistiche

risultante, come detto, da query realizzate in funzione della variabili utilizzate

precedentemente per la definizione dei gruppi in questione, al fine di circoscrivere l’analisi

alle unità rientranti nei profili oggetto di analisi, riducendo così variabilità senza perdere

capacità esplicativa per l’analisi confermativa dei quattro gruppi prefissati.

La numerazione delle unità statistiche nel dataset in questione non è stata casuale: a

diversi intervalli numerici sono infatti associate unità appartenenti ai diversi profili,

soluzione resasi necessaria per individuare poi i gruppi sul dendrogramma nella presente

analisi, nel Biplot nella successiva analisi con MDS e ACP.

Intervalli numerici 1-14 15-21 22-29 30-36

di unità

Profili Rampanti X-Box Gen. Regine della casa Nonni

Duracell

Attraverso l’algoritmo illustrato è stato ottenuto come output il seguente dendrogramma:

21

Page 22: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Dall’analisi del dendrogramma ottenuto è possibile identificare in modo abbastanza chiaro

i profili ricavati in precedenza con la procedura di classificazione gerarchica che si

intendevano verificare:

si possono infatti identificare quattro alberi piuttosto definiti (partendo da sinistra gli

intervalli 16 - 21, 1-24, 2 -15 e 30 -34) che definiscono clusters omogenei al loro interno

ed eterogenei tra di loro, i quali, se si osservano i numeri delle unità statistiche al loro

interno, corrispondono ai gruppi oggetto di verifica.

Si è dunque verificato che i gruppi ottenuti dall’analisi mediante procedura di

classificazione gerarchica (Excel) dai quali sono stati realizzati i profili Rampanti, X-Box

Generation, Le Regine della casa e Nonni Duracell sono sufficientemente omogenei al

loro interno ed eterogenei tra loro confermando la bontà della segmentazione realizzata.

.

3.5.3 Analisi confermativa con Multidimensional Scaling e Analisi in Componenti Principali

22

X-BOXGeneration Nonni DuracellRampantiRegine della

casa

Page 23: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

L’analisi confermativa è stata poi sviluppata mediante l’applicazione congiunta di

Multidimensional Scaling e Analisi in Componenti Principali realizzata mediante il software

statistico R.

Il Multidimensional Scaling è una tecnica esplorativa multivariata avente come obiettivo la

rappresentazione in un piano bidimensionale delle distanze osservate tra più unità

statistiche a partire da matrici multivariate comprensive di p variabili, come quelle

rappresentate nei dataset da noi costruiti sulla base dei questionari.

Tale tecnica statistica è stata usata congiuntamente all’Analisi in Componenti Principali,

dal momento che il Multidimensional Scaling classico, nel caso in cui si parta da una

matrice di distanze euclidee costruita a partire da una matrice di dati quantitativi, come nel

caso in questione, corrisponde, in termini di output di coordinate bidimensionali ottimali,

all’Analisi in Componenti Principali (ACP), il cui principale contributo aggiuntivo si

sostanzia nella caratterizzazione del significato delle variabili non osservabili che

determinano la mappa creata dal MDS.

Le finalità dell’applicazione congiunta di tali tecniche statistiche sono due:

1- Ottenere una rappresentazione sintetica delle unità statistiche, in relazione ad

alcune variabili selezionate, ritenute meglio esplicative della variabilità osservata,

che permetta di visualizzare ad un livello bidimensionale i gruppi ottenuti dalle

analisi precedentemente descritte, in modo più intuitivo rispetto ai dendrogrammi,

mostrando come le differenti variabili influenzino la formazione dei gruppi

identificati.

2- Confermare i gruppi ottenuti attraverso le precedenti analisi

MDS

23

Page 24: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Gli steps attraverso i quali è stata sviluppata l’analisi confermativa mediante MDS sono

stati in sintesi seguenti:

-Definizione della matrice multidimensionale A contenente i valori assunti dalle variabili

selezionate per ogni unita statistica;

- Standardizzazione della matrice A;

-Calcolo della matrice delle distanze euclidee dei dati standardizzati;

-Applicazione del MDS classico alla matrice delle distanze euclidee costruita sui dati di

partenza standardizzati.

Si sono ottenute dunque le coordinate di rappresentazione bidimensionale ottimale che

formalmente corrispondono alle prime due colonne della matrice 4 restituita

attraverso appositi comandi dal software R.

La rappresentazione bidimensionale delle coordinate ottenute è risultata la seguente:

4 dove

-k è il rango della matrice B

- = diag { } è la matrice diagonale degli autovalori di B

- = ( ) è la matrice le cui colonne sono gli autovettori, a norma unitaria, associati agli autovalori della

matrice B

- B è una matrice ottenuta da trasformazioni della matrice delle distanze D secondo un apposito procedimento del

MDS.

24

Page 25: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Mappa MDS

Si nota immediatamente come non si riesca a caratterizzare il significato delle variabili

sottostanti tale rappresentazione, per questa ragione viene applicata congiuntamente

l’analisi in componenti principali.

Le componenti principali, ottenute mediante un apposito algoritmo, risultano le

combinazioni lineari delle variabili osservate che meglio riassumono le p variabili a

disposizione, ossia che meglio colgono la variabilità osservata.

Il legame tra MDS e Componenti principali è rappresentato dal fatto che nel caso in cui si

esegua l'MDS classico a partire da una matrice di dati , le (prime due) componenti

principali corrispondono alle variabili che definiscono le coordinate della rappresentazione

del MDS (a meno del segno).

25

Page 26: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Tramite il software R si sono ottenute le componenti principali, come illustrato di seguito:

Si è ottenuta quindi una rappresentazione grafica bidimensionale delle coordinate

individuate nelle prime due componenti principali sostanzialmente analoga a quella

ottenuta con l’MDS dove però è ancora difficile cogliere il significato sottostante:

26

Page 27: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Mappa ACP

E’ stata eseguita successivamente un’analisi relativa alla varianza spiegata dalle differenti

componenti principali, fondamentale per fare valutazioni sulla bontà della

rappresentazione; vengono di seguito riportati gli output di R:

Importance of components: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5Standard deviation 1.6348219 1.0636945 0.9939309 0.71692375 0.64258159Proportion of Variance0.4454405 0.1885743 0.1646498 0.08566328 0.06881852Cumulative Proportion 0.4454405 0.6340148 0.7986646 0.88432783 0.95314635 Comp.6Standard deviation 0.53020929Proportion of Variance 0.04685365Cumulative Proportion 1.00000000

27

Page 28: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Dagli output proposti emerge come le prime due componenti principali spieghino il 63,4%

della varianza complessiva, un livello quindi soddisfacente.

Sono state successivamente analizzate le correlazioni tra variabili e componenti principali

visualizzando i Loadings 5 per caratterizzare il significato degli assi rappresentati dalle

componenti principali:

Loadings: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6occupazione 0.285 -0.373 0.731 0.336 -0.120 0.343Musei -0.453 -0.406 -0.114 0.480 -0.436 -0.444Associaz -0.318 0.448 0.609 -0.356 -0.322 -0.310Quot -0.480 -0.201 0.266 0.798 -0.143interesse.politico -0.455 -0.418 -0.521 -0.233 0.534a.casa -0.419 0.529 0.508 0.533

5 la matrice dei loadings è la matrice degli autovettori (a norma unitaria) della matrice di correlazione della matrice dei dati osservati iniziale

28

Page 29: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6SS loadings 1.000 1.000 1.000 1.000 1.000 1.000Proportion Var 0.167 0.167 0.167 0.167 0.167 0.167Cumulative Var 0.167 0.333 0.500 0.667 0.833 1.000

Dall’analisi dei loadings emerge come la prima componente principale sia influenzata dalle

variabili Lettura quotidiani (-0.480), Interesse Politico (0.455) e Musei (-0.453) mentre la

seconda dalle variabili Associazione (0.448) e Occupazione e Spesa a Casa (0.529).

Per ottenere infine una rappresentazione sintetica dell’analisi fin qui svolta con MDS e

ACP si è proceduto realizzando un Biplot

Un Biplot è una rappresentazione grafica risultato dell’analisi in componenti principali che

permette di sovrapporre nello stesso grafico:

a) un diagramma di dispersione (scatterplot) relativo alle unità statistiche, costruito sulle

prime due componenti principali (Mappa ACP);

b) un diagramma di dispersione relativo alle variabili costruito a partire dalle correlazioni tra

le variabili osservate e le componenti principali (Loadings).

Il Biplot permette, dunque, di dare una rappresentazione nel medesimo grafico

bidimensionale 1) delle distanze tra le unità statistiche e quindi del loro posizionamento e

b) delle relazioni tra le variabili e le prime due componenti principali, ossia permette di

raggiungere l’obiettivo prefisso per questa fase dell’analisi.

Le unità statistiche vengono rappresentate dalle rispettive labels mentre le variabili da

vettori variabili:

Biplot

29

Page 30: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

Interpretazione Biplot

Analizzando il Biplot emerge come tutte le variabili ricevano adeguata rappresentazione,

dal momento che la lunghezza dei vettori variabili è proporzionale alla variabilità spiegata,

e tutte le variabili presentano un vettore variabile sufficientemente lungo.

Da tale grafico risultano chiare le relazioni tra le variabili e gli assi, e come tali variabili

determinino il posizionamento delle diverse unità statistiche e quindi le distanze tra gli

individui.

E’ possibile dunque esplicitare l’individuazione di gruppi in funzione della eterogeneità o

omogeneità in termini di valorizzazione assunta delle diverse unità in relazione alle

diverse variabili.

Anche in questo caso è possibile individuare in modo piuttosto chiaro e distinto i gruppi

oggetto analisi confermativa verificando ulteriormente la bontà della segmentazione

realizzata nella prima fase di analisi.

30

Nonni Duracell

Rampanti

X-BOX Generation

Le Regine della casa

Page 31: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

I gruppi individuati corrispondono all’incirca agli stessi esplicitati dal dendrogramma, ma in

questo caso è possibile visualizzarli ad un livello bidimensionale, mostrando come le

differenti variabili influenzino la formazione dei clusters.

Si è dunque raggiunto anche il secondo obiettivo rappresentato dal perseguimento di un

risultato confermativo, attraverso anche questo metodo, della omogeneità intragruppo ed

eterogeneità intergruppo dei gruppi ai quali sono stati associati i nomi di Rampanti, Regine

della Casa, Nonni Duracell e X-Box Generation.

L’analisi qui illustrata relativamente a quattro dei dieci gruppi totali potrebbe essere

applicata anche agli altri gruppi, ma con risultati meno chiari e intuitivi rispetto al caso

proposto, selezionato poiché meglio si presta a chiarire il contributo dell’applicazione di

tale metodologia ad un’analisi confermativa.

3.5.4 Esemplificazione dei grafici seguendo una unità statistica

Per chiarire ulteriormente il significato di quanto ottenuto, ed i risultati dati

dall’applicazione di algoritmi gerarchici aggregativi ed analisi MDS e ACP, viene di seguito

focalizzata l’attenzione su una specifica unità statistica che viene seguita nelle due analisi.

Si consideri l’unità statistica numero 14, appartenente, sulla base dell’associazione

descritta in precedenza tra intervalli numerici e profili, al gruppo dei Rampanti :

-nel dendrogramma si và a collocare nel secondo albero da destra, quello riconducibile al

cluster caratterizzato con il nome di Rampanti, nel quale sono aggregate prevalentemente

proprio le unità da 1 a 14 , indice della omogeneità intraguppo ed eterogeneità intergruppo

a livello multidimensionale relativa a tali unità, conferma della consistenza del cluster.

- nel Biplot tale unità è collocata nel quadrante in basso a sinistra del grafico, posizione

che, interpretata mediante i vettori variabili, identifica un professionista/manager che

presenta alto livello di lettura di quotidiani, alto interesse politico, alta frequentazione di

musei, spese in casa medio alte e una medio- alta partecipazione all’associazionismo.

Emerge anche in questo caso come nell’area della mappa prossima alla collocazione

dell’unità 14, determinata, come visto, dalla valorizzazione dei vettori variabili, siano

posizionate unità prevalentemente dall’1 al 14 permettendo di individuare il cluster

denominato con il nome di Rampanti, individuato precedentemente anche nel

31

Page 32: Introduzione - identiteam.files.wordpress.com  · Web view23 marzo 2007. Metodologia analitica applicata per la definizione dei nuovi Profili. Gli Obiettivi del lavoro. L’obiettivo

dendrogramma, confermando la omogeneità intraguppo ed eterogeneità intergruppo a

livello multidimensionale relativa a tali unità.

Lo stesso ragionamento è possibile svilupparlo anche per le altre unità che vanno ad

identificare gli altri gruppi nella mappa di rappresentazione dando quindi, come detto,

evidenza visiva all’influenza delle diverse variabili nella determinazione dei clusters e

conferma ulteriore della soddisfacente identificazione dei gruppi effettuata nelle fasi

precedenti dell’analisi, garanzia di una buona caratterizzazione dei profili.

32