Introduzione - EURISKO E OLTRE · Web viewAbbiamo quindi voluto utilizzare l’algoritmo di Mathlab...

52
Gruppo Identiteam 1

Transcript of Introduzione - EURISKO E OLTRE · Web viewAbbiamo quindi voluto utilizzare l’algoritmo di Mathlab...

Introduzione

Gruppo Identiteam

2

/

1

GL

=

X

Bet Elias

Chiuso AnnamariaCoccia Fabio

De Bortoli Valentina

De Noni Marco

Libralesso Elena

Lissandrin Moira

Marinello Giulia

23 marzo 2007

INTRODUZIONE: Gli Obiettivi del lavoro

Il lavoro da noi sviluppato parte dall’analisi dei 14 stili di vita proposti da Eurisko, ricavati ciascuno dall’elaborazione di 47 caratteristiche della persona identificanti un modo specifico di vivere, pensare, lavorare e consumare.

Già ad una prima lettura dei profili sono emerse alcune incongruenze con il contesto socio-economico attuale che hanno permesso di fare delle ipotesi su eventuali profili outliers; noi stessi, ad esempio, non riuscivamo a collocarci all’interno di una precisa categoria.

A tal fine abbiamo deciso di confrontarci con l’ambiente esterno, somministrando un questionario ad un campione rappresentativo per ricavare da esso, attraverso analisi statistiche dei profili diversi, forse più aderenti alla società odierna.

L’obiettivo finale del progetto, quindi, è rappresentato dalla riflessione e rivisitazione dei profili proposti nel quadro Eurisko, al fine di realizzare un quadro alternativo, che sia il più possibile lo specchio degli stili di vita dell’attuale società italiana.

1. Organizzazione del progetto

1.1 I punti guida

Abbiamo, sin dall’inizio, individuato una metodologia di lavoro specifica basata su alcuni punti, rivelatisi fondamentali per garantire la fluidità delle fasi di progetto e la corrispondenza tra i desiderata e il risultato ottenuto, li riportiamo di seguito:

· L’avere come mission quella di creare un prodotto alternativo al quadro Eurisko, ricalcando, in parte, la logica di segmentazione da loro utilizzata; innovando alcuni aspetti da noi individuati come mancanti (rapporto con l’ICT e l’innovazione, rapporto con il consumo nella grande distribuzione, tratti della personalità).

· L’utilizzo di metodologie statistiche per l’elaborazione dei dati, in modo da ottenere risultati basati su prove oggettive e non su considerazioni personali, imponendoci anche nel caso di ricerca di profili da noi già ipotizzati, quali l’imprenditore di PMI, di non “truccare i dati” a nostro favore ma, di basarci sulle correlazioni espresse tra le variabili da noi scelte per segmentare il campione.

· La decisione di condividere tutto il materiale a nostra disposizione grazie alla realizzazione del Blog “Eurisko e Oltre”, funzionale sia a garantire una visione d’insieme dell’evoluzione del progetto a tutti i componenti del gruppo, che a permettere a ciascuno di contribuire attivamente alla buona riuscita dello stesso.

· L’aver suddiviso il progetto in due fasi principali (analisi dei dati, creazione del quadro) tramite una procedura over the wall, permettendo una suddivisione e specializzazione dei compiti all’interno del gruppo.

2. Metodologia di comunicazione tra i membri del gruppo e di gestione del materiale

Ai fini del coordinamento informativo intragruppo è stato creato un blog (http:\\identiteam.wordpress.com) su piattaforma Wordpress.

Vista la numerosità del gruppo e la necessità di comunicare anche con referenti esterni quali la docente, assegnataria del progetto e la società di marketing e comunicazione Klone, il blog ha permesso la massima interazione e scambio di informazione.

Nell’attuale mondo del Web 2.0 abbiamo potuto abbracciare completamente il potenziale di questo strumento beneficiando non solo di uno scambio in tempo reale di informazioni ed opinioni sull’avanzamento del progetto ma anche di risparmi di tempo e di costi, in quanto oltrepassando le barriere fisiche, ci ha permesso di svolgere una attività di brainstorming attorno ad un tavolo virtuale.

Il blog è il fiore all'occhiello del Web 2.0 è senza dubbio vero e proprio luogo di incontro, discussione e condivisione di argomenti e contenuti, disponibili come testo, immagini, audio e video.

Per ogni articolo, problema, tematica, ecc. che ogni membro poteva scrivere è stato reso possibile l’inserimento di commenti, segnalati in ordine cronologico nella homepage in modo che nessun utente potesse perdere qualche comunicazione. Ogni post inoltre, venendo inoltrato in automatico nella casella e-mail del gruppo e a sua volta tramite avviso sms, ha potuto informare gli interessati anche di variazioni all’ultimo minuto su riunioni o altri avvisi importanti.

La possibilità di bloccare l’accesso ad utenti non autorizzati ha reso possibile inoltre risolvere uno dei principali problemi che emergono nell’interazione in spazi Web: la privacy.

Abilitando le persone strettamente necessarie ognuno di noi ha potuto nella massima liberta, avvalersi della possibilità di inserire nuovi parti, revisioni, idee, ecc. relativamente alla propria rivalutazione agli stili di vita.

Era stata progettata inizialmente anche la creazione di un sito ma visti i tempi ristretti, ed andando a prediligere l’aspetto statistico per arrivare a risultati quanto più rappresentativi possibile, oltre che all’aspetto grafico per la presentazione multimediale, l’idea è stata abbandonata. Ciò ha influito sulla possibilità di traferimento di certi tipi di files (.avi, .xls, .mp3, .mpeg, ..) oltre che a limiti di dimensione poiché un blog è pur sempre uno strumento limitato. Questo limite in parte è stato risolto tramite la creazione di una casella di posta generale che oltre a quanto sopra descritto ha potuto porre il gruppo in una condizione di uniformità nel presentarsi ai soggetti esterni.

Gli incontri settimanali vis a vis hanno completato il tutto permettendoci di estrapolare le migliori idee che dal blog quotidianamente emergevano.

Figura 1 -Il blog

3. La prima fase del progetto: analisi quantitativa e caratterizzazione dei profili

In questo paragrafo si illustrerà l’organizzazione della prima fase del lavoro corrispondente all’analisi dei dati e alla creazione dei profili.

Questa infatti ci ha impegnato molto dal punto di vista organizzativo (strutturare le domande, pianificare i questionari, analizzare i dati), mentre la seconda fase, ha presentato delle criticità più di carattere creativo-decisionale (trovare un tema efficace per il quadro, deciderne i contenuti multimediali, produrli).

Il processo produttivo sottostante alla prima fase è schematizzato nella tabella sottostante dove a destra troviamo il nome del processo e a sinistra una breve descrizione del suo contenuto.

Processi

Contenuto

Definizione degli obiettivi

Prendendo come benchmark il quadro Eurisko abbiamo ipotizzato dei possibili nuovi profili da ricercare, osservando quali fossero le caratteristiche degli stili di vita per noi più interessanti.

Definizione del campione

Abbiamo optato per una soluzione di campionamento stratificato con frazione di campionamento proporzionale per ogni strato, soluzione preferibile al campionamento semplice, considerata l’eterogeneità del fenomeno da studiare nella popolazione di riferimento dell’indagine.

Stesura del questionario

Abbiamo costruito il questionario in relazione agli obiettivi prefissati, strutturando le domande in funzione di una successiva analisi quantitativa.

Raccolta informazioni

Abbiamo suddiviso i questionari in base alla logica di campionamento.

Prima di effettuare le interviste, abbiamo costruito e testato un file Excel nel quale ogni membro del gruppo ha riportato i dati raccolti. I singoli file Excel sono stati in seguito riuniti per creare il dataset finale.

Analisi dei dati e creazione dei profili

In base alle ipotesi di gestione e anali dei dati fatte precedentemente, vista la numerosità delle variabili (ben 44) e del campione (133 individui) abbiamo optato per l’utilizzo di Excel in fase di analisi e dei più potenti ma più complessi software Mathlab e R in fase di verifica dei risultati.

All’analisi statistica è seguito il profilo dei cluster trovati.

Nei paragrafi che seguono saranno sviluppate con maggiore precisione alcune tematiche inerenti i processi presentati nella tabella, in particolare analizzeremo la logica di campionamento, l’elaborazione del questionario, la logica di analisi dei dati, la verifica dei risultati ottenuti.

3.1 La logica di campionamento

Di fronte al problema del campionamento, fase del progetto di grande criticità per la sua forte incidenza sui risultati finali, abbiamo optato per una soluzione di campionamento stratificato, soluzione preferibile al campionamento semplice, considerata l’eterogeneità del fenomeno da studiare nella popolazione di riferimento dell’indagine:

si è optato per adottare una frazione di campionamento per ogni strato di tipo proporzionale, soluzione che prevede l’estrazione di un numero di elementi proporzionale al peso dello strato della popolazione. La popolazione oggetto di analisi è stata circoscritta alla popolazione italiana di età superiore ai 15 anni; sulla base dei dati Istat sono state ricavate le consistenze numeriche della popolazione italiana (dati 2006) in relazione alle seguenti fasce d’età:

15-18; 19-27; 28-37; 38-50; 51-65; più di 65.

Sono stati quindi definiti i pesi dei diversi strati sulla popolazione totale, e i medesimi pesi sono poi stati mantenuti nella definizione del campione al fine di ottenere un campionamento il più possibile rappresentativo della popolazione italiana.

Formalmente:

siano

=

H

il numero degli strati

=

h

N

la numerosità dello strato h

=

N

la numerosità della popolazione

=

n

la numerosità del campione

N

N

W

h

h

=

è l’h-esimo peso dell’h-esimo strato sulla popolazione di riferimento

n

n

f

h

h

=

è l’h-esimo peso del campione associato all’h-esimo strato del campione definito affinchè risulti:

h

h

h

h

W

N

N

n

n

f

=

=

=

Ogni persona ha quindi avuto il compito di intervistare 16 persone così distribuite per fasce di età:

Età

15-18

19-27

28-37

38-50

51-65; più di 65

N. persone 1

2

3

4

3

3

Al fine di ottenere un campione più rappresentativo possibile della popolazione italiana, oggetto d’indagine nel presente progetto, il campionamento è stato effettuato in più province del Centro Nord sfruttando anche la preziosa collaborazione di amici dislocati in diverse province e l’estrazione delle unità intervistate è stata effettuata prevalentemente presso le Poste delle diverse province o presso le stazioni, al fine di garantire la massima casualità possibile con i mezzi a nostra disposizione necessaria per cogliere sufficientemente la variabilità del fenomeno.

Le analisi successivamente svolte hanno poi confermato la bontà del campionamento eseguito, presentando alta variabilità in relazione a tutte le variabili, e nello stesso tempo significative relazioni tra le stesse, che hanno permesso di ottenere buoni risultati, come verrà illustrato, nella fase di datamining, permettendo di giungere alla configurazione di gruppi molto eterogenei tra loro, ma con una soddisfacente omogeneità interna, confermando quindi la scelta rappresentata dal campionamento stratificato quale criterio idoneo al fenomeno oggetto di analisi.

3.2 Il questionario

Un momento fondamentale della prima fase del progetto è stato la stesura del questionario.

L’obiettivo prefissatoci era quello di avere uno strumento efficace, ben strutturato, semplice per gli intervistati, ma che potesse in seguito essere convertito dal punto di vista quantitativo per essere riportato in un file Excel, diventando così una potente fonte di informazioni.

Prima della stesura, abbiamo quindi individuato alcune caratteristiche indispensabili.

Da subito, confrontando le nostre esperienze, si è optato per la forma autocompilativa, l’intervistato avrebbe compilato da solo le domande, ritenendo questa una modalità più veloce, efficace e meno invasiva della privacy.

Questa scelta ha comportato l’obbligo di realizzare un documento facile da compilare, con un linguaggio “wording” amichevole e a tutti comprensibile, con domande dirette, fatte in seconda persona (es. : Come passi il tuo tempo libero?).

Nella strutturazione abbiamo applicato la logica ad imbuto, “funnel approach”, partendo da domande di carattere generico per arrivare nello specifico, creando una sequenza logica di macrosezioni quali: anagrafica; abitazione; titolo di studio e occupazione; cultura, tempo libero e informazione; distribuzione del reddito; personalità.

Per semplificare la compilazione e per convertire in seguito il tutto in dati numerici, abbiamo fatto un breve studio sulle scale da utilizzare nel questionario.

Si è optato per scale qualitative e non quantitative, ritenendo il confronto con le scale numeriche abbastanza impegnativo per gli intervistati e non vincolante per i risultati del nostro lavoro.

L’unica scala quantitativa inserita obbligatoriamente è quella relativa all’età che è stata strutturata analizzando le fasce d’età dei profili Eurisko.

Si è voluta privilegiare la velocità di compilazione inserendo solamente risposte multiple e non domande aperte, l’opzione “altro…” è stata inserita solamente in una domanda, ma in generale tralasciata, perché difficilmente analizzabile statisticamente.

Facendo un approfondimento sulle scale, si è deciso di sfruttare nell’analisi della personalità la tecnica del differenziale semantico a cinque punte, in previsione di trovare delle attitudini caratteriali simili in base ai profili. Osservando la struttura creata è possibile vedere come alla destra si collochi un carattere che può essere identificato come espansivo, mentre a sinistra un carattere più timido e idealista.

Nella sezione riservata a “Cultura, tempo libero e informazione”, si è optato per mantenere una scala a tema singolo, molto simile alla Likert, dove l’aspetto qualitativo (mai, poco, abbastanza, molto) potesse essere facilmente convertito in un approccio quantitativo (le risposte sono state in seguito caricate in Excel con i numeri: 0,4,8,12).

Non abbiamo voluto inserire domande riguardanti il reddito, perché ritenute scarsamente identificative dello stile di vita, e problematiche dal punto di vista della privacy, queste sono state, invece sostituite da domande relative ai consumi, fuori e dentro l’abitazione, che meglio ci hanno permesso di capire le abitudini dei soggetti intervistati.

Dopo la stesura di una prima bozza, abbiamo fatto alcune prove di rump-up, osservando le reazioni e le difficoltà degli intervistati.

Il tempo di compilazione medio stimato nelle prove è stato pari a 8 min, ritenuto accettabile da parte del gruppo.

In parallelo alle prove del questionario è stata realizzata una prova della fattibilità dell’analisi dal punto di vista statistico, riportando nel software statistico Mathlab i dati di quattro individui da noi creati e rendendoli a due a due forzatamente simili, creando così due “segmenti artificiali” (cluster).

Il risultato ottenuto con Mathlab è visibile nella figura 2, dove è palese come le unità 1 e 4 vengano raggruppate assieme e siano distinte dalle unità 2 e 3.

Questa prova ci ha dato una prima conferma sulla fattibilità dell’analisi e sulla possibilità di ottenere da domande apparentemente qualitative dei risultati di tipo quantitativo.

Figura 2: Dendrogramma o albero delle aggregazioni

L

La figura è il risultato di un algoritmo gerarchico aggregativo, che partendo dalle singole unità statistiche le aggrega in gruppi omogenei in base alla “rassomiglianza” tra i giudizi espressi dai soggetti nel questionario.La misura quantitativa per definire la similarità tra due giudizi è data dalla distanza euclidea tra due punti (visibile nell’asse delle ordinate), le unità vengono quindi aggregate in base a determinati calcoli operati sulle distanze relative a ogni unità ed espresse da più variabili. L’algoritmo oltre ad operare un calcolo delle distanze tra unità opera contemporaneamente un calcolo delle distanze tra gruppi, il cui scopo è quello di creare dei cluster di massima omogeneità interna e massima distanza, quindi eterogeneità esterna.

3.3 Logica di analisi e segmentazione

3.3.1 Scelta della procedura

Durante la stesura finale del questionario il gruppo di lavoro aveva ipotizzato alcune procedure di analisi fondate sull’utilizzo Di un algoritmo di clustering elaborato dal software Mathlab, il cui risultato sarebbe stato un grafico ad albero (dendrogramma, vedi sopra) tramite il quale identificare la presenza di gruppi.

Dopo aver ottenuto la matrice di dati finale, data dall’unione dei singoli file Excel di ogni membro del gruppo, ci siamo però resi conto che la complessità del dataset (44 varibili *130 soggetti) unita alla criticità del fattore tempo, avrebbero condizionato l’evoluzione dell’intero lavoro dando poco tempo alla fase successiva di creazione del quadro e della presentazione.

Si è quindi optato per un’analisi basata sempre sul metodo gerarchico, ma realizzata con i filtri avanzati Excel secondo la logica degli alberi di classificazione, dove quindi potessimo gestire meglio i risultati e essere noi a decidere la sequenza di variabili da fare entrare per prime nella ricerca dei cluster.

Usando nella fase iniziale Mathlab infatti, i tempi di profilazione sarebbero stati molto lunghi, in quanto avremmo dovuto affrontare alcuni problemi inerenti le relazioni tra variabili e unità statistiche a queste connesse.

Abbiamo quindi voluto utilizzare l’algoritmo di Mathlab solo in fase di conferma, per compiere una verifica della consistenza dei gruppi da noi individuati.

In aggiunta a questo abbiamo sfruttato un ulteriore metodologia di analisi denominata Multidimensional Scaling congiunta all’ Analisi in Componenti Principali, sfruttando il software R con la finalità di:

a) ottenere una rappresentazione sintetica delle unità statistiche, in relazione ad alcune variabili selezionate che permettesse di visualizzare ad un livello bidimensionale i gruppi ottenuti mostrando come le differenti variabili influenzino la formazione dei gruppi identificati.

b) confermare ulteriormente i gruppi ottenuti attraverso le precedenti analisi.

3.3.2 Procedura di classificazione gerarchica

Come già evidenziato, per operare la segmentazione dei dati è stato scelto un metodo gerarchico basato sulla logica degli alberi di classificazione, procedura che è stata realizzata, mediante l’applicativo Excel, applicando filtri avanzati alle singoli variabili che hanno permesso di realizzare query specifiche funzionali a identificare i gruppi nel dettaglio ( nel file Excel allegato sono riportati a titolo esemplificativi alcuni output delle query che hanno permesso l’identificazione di alcuni dei gruppi).

La logica sottostante agli alberi di classificazione consiste nell’operare successive scremature del campione totale in base ai valori via via assunti dalle singole variabili con una logica che potremmo definire if-then oppure divide and conquer.

Portiamo un esempio della logica sottostante:

Gli individui con un padre possessore di Azioni sono più inclini all’acquisto di queste?, risposta si, oppure no; se si che tipologia di titoli acquistano.

In questo caso abbiamo operato con un albero binario, la cui variabile risposta alla domanda “Comprano Azioni ?” poteva dare solamente due risultati (SI, NO), nel nostro progetto invece abbiamo operato con degli alberi generali, dato che la variabile risposta ad ogni domanda poteva dare più di un risultato (es: se sposato, allora con quanti figli? 1,2,3..).

E’ importante evidenziare quanto in queste operazioni, conti l’ordine della sequenza delle variabili prese in considerazione. Infatti diversi ordinamenti danno gruppi con diverse caratteristiche; inoltre precisiamo che questa procedura di segmentazione viene arrestata non appena si riscontra una forte omogeneità tra i valori delle variabili che compongono il segmento analizzato.

Questa ultima considerazione garantisce il criterio di massima omogeneità interna al cluster.

3.3.3 Le variabili di classificazione

Sfruttando la procedura di classificazione gerarchica, in sede di analisi, si è deciso l’ordine di entrata delle variabili.

Questo è stato pensato osservando i risultati ottenuti da Eurisko, tentando di capire quali potessero essere state le loro scelte in merito.

Abbiamo quindi optato per una serie di variabili ritenute fondamentali, quali per esempio: l’occupazione, la fascia d’età, il titolo di studio, l’utilizzo dei mezzi di informazione.

In base a queste, effettuando varie prove siamo giunti alla determinazione dei gruppi finali e delle caratteristiche relative a ogni gruppo.

Si è così potuto procedere alla fase profilazione.

Per esplicitare maggiormente l’ordine e la sequenza di variabili scelte per la classificazione, riportiamo i risultati ottenuti nella tabella sottostante.

Ordine di entrata delle variabili di segmentazione

Profilo ottenuto

Occupazione > età > Titolo di studio > Mezzi di Informazione

Rampanti

Occupazione > età > Titolo di Studio

Casalinghe

Frequenza Discoteca > sport e cura del corpo

Tony

Occupazione > Età > Livello Associazionismo

Nonno Duracell

Occupazione > Età > Livello Associazionismo > Titolo di Studio

Nonno Stanco

Occupazione > Titolo di Studio

Self Made Man

Età > Occupazione > Titolo d Studio

Work in Progress

Età > Occupazione > Titolo di studio

I Giovani Lavoratori

Occupazione > Sesso > Figli (Sì/No)

Wonder Woman

Età

X-Box Generation

4. I Profili ottenuti

XBox Generation – I Giovanissimi

IDENTIKIT:

Sono adolescenti tra i 15 e 18 anni sia maschi che femmine, vivono esclusivamente con i genitori in appartamento o abitazione indipendente situata in città, cittadina o paese.

Il loro tempo libero è dedicato allo sport, di cui sono attivi praticanti, e alle relazioni con gli amici in locali di ritrovo, quali pub e pizzerie, al contrario non amano le discoteche, delle quali non sono grandi frequentatori.

Non si sentono molto creativi e amano i consumi culturali passivi, come ascoltare musica e leggere libri, a scapito di attività come la visita a musei o mostre o l’andare a teatro.

La scarsa propensione per le attività creative è compensata dall’utilizzo di mezzi tecnologici, dall’apertura all’innovazione e dal grande utilizzo della rete.

Dal punto di vista dei media: sono voraci consumatori di TV, mezzo di comunicazione per eccellenza anche più di Internet, non leggono la carta stampata e non sono informati sulla politica.

Per loro il centro commerciale è un luogo divertente (risposta data all’unanimità).

Dal punto di vista della personalità si sentono socievoli e impulsivi, anche se è difficile delineare una personalità univoca.

I Giovani – Work in Progress

IDENTIKIT:

I giovanissimi studenti

Sono single, studenti universitari tra i 19 e i 27 anni.

Vivono per un 90% con i genitori, il resto in appartamento con amici.

Praticano moderatamente sport e tengono abbastanza alla cura del corpo.

Spendono molto in pub e pizzerie, mediamente tra i 100 e 300 euro. Non praticano il volontariato, eccetto alcuni casi, e non frequentano associazioni.

Sono interessati alla cultura, ma non frequentano molto mostre e musei; sono però accomunati dalla lettura di libri e da una buona tendenza a viaggiare.

Li contraddistingue una forte passione per la musica, che è vista come un elemento fondamentale, e se parliamo di musica dal vivo, questa è fruita più nei concerti che nelle discoteche.

Si tengono informati attraverso la lettura di quotidiani e tramite la TV. Presentano un buon interesse verso la vita politica.

Usano moltissimo Internet e sono nel complesso “tecnologici”.

Percepiscono il centro commerciale come un luogo conveniente e divertente.

Non sono accomunati da un unico e specifico profilo personale: sono molto eterogenei da questo punto di vista.

Sottogruppo: Giovani lavoratori

Sono giovani tra i 19 e 27 anni che hanno deciso di non proseguire il ciclo degli studi per dedicarsi all’attività lavorativa.

Vivono tutti in famiglia con i genitori (scompare la convivenza con gli amici che caratterizza i colleghi studenti).

Sono sia operai che impiegati, non presentano evidenti consumi di carattere culturale. Non frequentano associazioni e non praticano il volontariato.

Sono buoni frequentatori di cinema e di luoghi di ritrovo quali pub e pizzerie, anche se meno dei loro coetanei studenti, forse per mancanza di tempo.

I loro consumi fuori casa non sono altissimi: mediamente pari a 300 euro. Prediligono uscire nei week-end e frequentano sporadicamente anche le discoteche.

Leggono molto i quotidiani, anche se vi è una tendenza maggiore negli operai rispetto agli impiegati. Entrambi presentano un interesse politico medio.

Si definiscono abbastanza tecnologici ma non innovatori.

Nel caso dei giovani operai, questi sono più creativi dei loro colleghi impiegati, forse perché si dedicano ad attività saltuarie dopo il lavoro.

Frequentano i centri commerciali dei quali percepiscono principalmente l’aspetto di convenienza.

I Rampanti – professionisti superattivi

IDENTIKIT:

Sono principalmente uomini, liberi professionisti o Manager di alto livello culturale, di età compresa tra i 28 e 45 anni.

Sono sia single che sposati e in quest’ultimo caso vivono assieme al coniuge in famiglie con non più di due figli.

La maggior parte di loro è laureata anche se vi è una limitata presenza di diplomati.

Il loro profilo è caratterizzato dall’iperattività: i Rampanti sembrano essere dotati del dono dell’ubiquità, riuscendo a coniugare al massimo impegni lavorativi, cura del corpo, viaggi di lavoro e volontariato.

I Rampanti sono abbastanza sportivi, ma molto attenti alla cura del corpo, amano socializzare in luoghi quali pub, ristoranti ma soprattutto associazioni culturali.

Amano dedicarsi assiduamente ad attività quali visite a musei e cinema, ascoltano molta musica e leggono libri principalmente per svago, ma anche per essere costantemente aggiornati in ambito professionale.

I consumi sono condizionati dall’attività lavorativa e appaiono evidenti nelle loro risposte, poiché viaggiano moltissimo e dimostrano di essere grandi utilizzatori e conoscitori della tecnologia e della rete Internet.

Dimostrano un elevato interesse per la politica e per essere sempre aggiornati prediligono Internet e quotidiani rispetto a TV, settimanali e mensili.

Per i Rampanti il centro commerciale è un luogo stressante e conveniente, ma viene anche considerato un buon punto di incontro.

Osservando la loro personalità, si può dire che essi siano uno dei pochi profili a presentare una coscienza piena della propria persona, si definiscono infatti estroversi, impulsivi, molto socievoli, sicuri, dallo spirito innovatore e più concreti che sognatori.

Tony Manero – Ballo e mi tengo in forma

IDENTIKIT:

Tony Manero potrebbe definirsi un “profilo trasversale rispetto all’età”, infatti vi appartengono sia donne che uomini di età compresa tra i 15 e i 55 anni di stato civile vario, quindi troviamo sia single che sposati\conviventi, che sposati con figli.

Chi appartiene a questo profilo vive principalmente in appartamento, ha un titolo di studio che può variare dalla licenza media alla laurea, ha un occupazione varia a seconda dell’età, infatti troviamo: studenti, liberi professionisti, impiegati, operai, insegnanti, artigiani.

Tutti i Tony Manero sono però uniti dall’amore per la Disco (o più in generale per il ballo), per lo sport e la cura del corpo, per i quali impiegano la maggior parte del loro tempo e danaro.

I loro consumi sono infatti ridottissimi entro le mura domestiche (fino a 100 euro), ma per se stessi spendono molto, anche oltre i 500 euro.

Oltre ad andare a ballare adorano frequentare pub e luoghi di ritrovo, vanno molto al cinema e viaggiano spesso, non frequentano ambienti quali musei o teatri ritenuti da loro forse poco eccitanti.

Quasi per tutti loro il centro commerciale è un luogo divertente o un punto di incontro, in assoluto non risulta essere scelto per la convenienza.

Al contrario di quello che si potrebbe immaginare leggono abbastanza, soprattutto prediligono settimanali e quotidiani.

Si tengono informati attraverso la TV e internet con il quale hanno un’ottima familiarità, dichiarano di essere fortemente tecnologici.

Riguardo alla personalità si definiscono estroversi, impulsivi, socievoli e oratori.

Storia del profilo:

Il profilo di Tony Manero, merita un commento in più rispetto agli altri, non perché abbia maggiore rilevanza, ma per il suo particolare e per noi strano e inaspettato profilo che quindi abbiamo voluto evidenziare.

Esso è scaturito dall’osservazione nei dati di una forte correlazione tra l’essere amante della discoteca e l’avere una profonda dedizione per lo sport e la cura del corpo, proprio come nel personaggio interpretato da Jhon Travolta in “La febbre del sabato sera”.

Ci ha lasciati stupiti la stranezza e per la sistematicità della correlazione che si è manifestata in tutte le fasce d’età, come una sorta di minigruppo.

Wonderwoman – Le impegnate

IDENTIKIT:

Sono donne sposate di età compresa tra i 28 e i 50 anni, che risiedono principalmente assieme al coniuge e ai figli, sia in abitazioni indipendenti, che in appartamento.

Il loro profilo è caratterizzato da una buona istruzione, sono per la maggior parte laureate, e da consumi principalmente di tipo culturale quali musei, libri e viaggi.

La famiglia e il lavoro occupano buona parte della loro giornata, a scapito di attività quali la palestra e la cura del corpo, che praticano di rado.

Rispetto allo sport prediligono attività più rilassanti quali passeggiate all’aria aperta, visite ai musei, serate a teatro e al cinema.

Sono buone ascoltatrici di musica e spiccano nel consumo di libri dei quali sono attente lettrici.

Sono molto interessate all’informazione e alla politica e sfruttano omogeneamente tutti i mezzi di comunicazione, con predilezione di quotidiani e settimanali rispetto ai mensili.

Sono abbastanza tecnologiche e propense all’innovazione e si definiscono persone caratterialmente sicure.

Spendono molto sia in ambito domestico (€ > 300) che fuori casa (€ > 500), anche se la maggior parte di loro percepisce il centro commerciale come un luogo stressante.

Le regine della casa – le casalinghe

IDENTIKIT:

Sono donne di età compresa tra i 38 e i 60 anni, sposate o vedove.

Vivono principalmente con il coniuge, con o senza i figli presenti nel nucleo familiare (che solitamente è composto da non più di tre figli); superata la soglia dei 50 anni, nei casi di vedovanza rintracciabili, vivono da sole.

Le casalinghe risiedono principalmente in case indipendenti, dove trascorrono prevalentemente il proprio tempo e alle quali dedicano buona parte delle spese economiche: a questo proposito si può osservare come i consumi in casa superino abbondantemente i 300€, mentre quelli fuori casa siano compresi tra i 100 e i 300€, esigui considerata l’età.

Il profilo delle casalinghe è caratterizzato da una scarsa attività sociale, un basso livello culturale (quasi la totalità delle intervistate ha la licenza elementare) e da un totale inutilizzo delle tecnologie informatiche.

Non amano dedicarsi all’attività sportiva, ma sono molto dedite alla cura del proprio corpo.

Coerentemente con quanto affermato in precedenza, non frequentano locali di ritrovo quali pub o pizzerie e partecipano quasi timidamente ad attività di associazionismo e volontariato; nel tempo libero prediligono attività quali la lettura di libri e riviste settimanali, di cui sono assidue acquirenti, molto più rispetto a quelle mensili.

Non frequentano luoghi di carattere culturale (mostre o musei) e non amano la visione dei programmi televisivi, ascoltano prevalentemente programmi radiofonici, probabilmente durante le attività dedite alla casa, e si ritengono genericamente amanti della musica.

Inoltre le casalinghe reputano il centro commerciale un luogo conveniente, a riprova del fatto che prestano molta attenzione alla spesa.

Amano definirsi oratrici, forse attribuendo al termine l’accezione di “chiacchierone”; per alcuni aspetti la loro personalità si può definire contraddittoria poiché, nonostante non abbiano familiarità con il mondo della tecnologia, si definiscono tutte “molto innovatrici”.

Nonno Duracell – il pensionato attivo

IDENTIKIT:

Sono i pensionati dai 60 anni in su, sia maschi che femmine, sposati o vedovi.

Considerando il loro nucleo familiare la media di figli è pari a 2,5, anche se spesso questi non vivono più nella stessa abitazione.

I Nonni Duracell si distinguono per la loro vitalità e per la partecipazione costante ad associazioni e circoli culturali e spesso ad attività di volontariato.

Questo profilo è caratterizzato da un alto livello di scolarizzazione corrispondente ad un diploma di maturità o laurea.

I Nonni Duracell non praticano molto sport, ma si tengono in forma andando spesso a passeggiare all’aria aperta. Il loro dinamismo si esprime anche nel viaggiare molto e nell’essere interessati a consumi culturali quali la lettura di libri, che spicca notevolmente, e le visite a musei e mostre.

Seguono molto il mezzo televisivo che però abbinano alla lettura di quotidiani; non usano internet e ascoltano poco la radio.

Spendono molto per la casa (circa 300euro), ma la spesa più rilevante è per i consumi fuori casa, mediamente intorno ai 400 euro.

Il centro commerciale è da loro vissuto come un luogo conveniente, ma una minima parte, soprattutto quella residente nei paesi, non lo frequenta.

Si definiscono: estroversi, molto sicuri, impavidi, concreti e tradizionalisti.

Sottogruppo: I nonni stanchi

Nella categoria generale dei pensionati è da rilevare però anche la presenza di un’altra tipologia di profilo, in netta contrapposizione ai “pensionati attivi”: i “nonni stanchi”.

E’ questo un profilo esclusivamente maschile, caratterizzato da una dinamicità nettamente minore rispetto al Nonno Duracell.

Chi appartiene a questo profilo è solitamente sposato con in media due figli, ha un titolo di studio medio-basso, quale licenza elementare o media, e si caratterizza per un approccio piuttosto passivo alla vita: frequenta poco le associazioni e non pratica il volontariato, non ama leggere libri, acquista raramente i quotidiani e non ha una precisa idea su cosa rappresenti per lui un centro commerciale.

Un elemento interessante da rilevare è come, contrariamente a quanto emerso dal resto del questionario, essi, nel definire la loro personalità, si definiscano con gli stessi aggettivi dei Duracell: estroversi, sicuri, impavidi, concreti ma anche e sopratutto materialisti.

L’Imprenditore – Self made man

IDENTIKIT:

Sono imprenditori di PMI, di età compresa tra i 40 e 65 anni. Risiedono tutti in abitazioni indipendenti site in piccoli e medi centri, con non più di 10mila abitanti.

Sono per lo più sposati, ma anche single.

Il loro livello d’istruzione corrisponde al diploma di maturità.

Dal punto di vista dei consumi seguono molto quelli dei Rampanti, ma con toni più modesti. In particolare, a differenza dei Rampanti, i Self Made Man spendono poco per la casa (da 100 a 300 euro), mentre hanno molte spese esterne, che superano abbondantemente i 500 euro.

Tutti ritengono che i centri commerciali non possano essere luoghi d’incontro, ma alcuni li definiscono convenienti altri stressanti o ancora, non li frequentano.

All’opposto dei Rampanti partecipano pochissimo alle associazioni e non pensano al volontariato.

Sono abbastanza sportivi e tengono alla cura del corpo, viaggiano saltuariamente e non sono attratti da consumi di carattere culturale, anche se li praticano occasionalmente.

Hanno un modesto interesse per la vita politica e si tengono informati principalmente tramite la TV e i quotidiani.

Nonostante abbiano un discreto feeling con Internet e siano imprenditori, non si definiscono innovatori, anzi, si identificano quasi all’unanimità come tradizionalisti e concreti.

Si sentono inoltre sicuri ed estroversi.

5. Verifica dei risultati con software statistici

I gruppi individuati nella fase dell’analisi descritta sono stati oggetto analisi confermative, come già anticipato, con due differenti metodologie statistiche: l’applicazione di un algoritmo gerarchico aggregativo mediante il software Mathlab, e l’applicazione congiunta del Multidimensional Scaling con L’analisi in Componenti principali mediante il software R.

Tali analisi sono state condotte al fine di garantire più oggettività e rigore possibile a questa fase di analisi, cruciale per la definizione del nuovo quadro, cercando di minimizzare l’impatto di congetture stereotipate dei profili della società attuale nell’analisi, che avrebbero potuto inficiare il risultato del progetto impedendo di esplicitare profili latenti.

5.1 I profili scelti per la verifica

L’analisi confermativa è stata sviluppata su quattro dei gruppi identificati: X-Box Generation, Rampanti, Nonni Duracell e Regine della Casa.

Caratteristiche salienti dei Gruppi selezionati

X – Box Generation

· Adolescenti tra i 15 e i 18 anni

· Sport e Amici nel tempo libero

· Poche attività creative, consumi culturali passivi ( bassa frequentazione musei)

· Alto Tasso di utilizzo tecnologia (videogames)

· Alto utilizzo Tv, lettura di quotidiani molto ridotta

· Scarso Interesse politico

· Livello di spesa a casa pressoché nullo

· Difficile identificazione caratteriale, poca omogeneità all’interno del profilo in relazione alle variabili applicate nel differenziale semantico

Rampanti

· Manager tra i 28 e i 45 anni

· Generalmente laureati

· Alta dinamicità: alto livello di Sport, Cura del corpo, Associazionismo, Musei , Lavoro ad alto contenuto professionale

· Alto livello di spesa sia a casa che fuori

· Alto Interesse politico

· Alto utilizzo dei quotidiani come mezzo di informazione

· Estroversi, Innovatori, Sicuri di sé, Socievoli

Regine della casa

· Casalinghe sposate tra i 38 e i 60 anni

· Medio basso livello di istruzione

· Trascorrono la maggior parte del tempo in attività legate alla casa

· Alta spesa in casa

· Basso interesse politico

· Basso livello di lettura dei quotidiani, preferiscono mensili e settimanali

· Si percepiscono innovatrici ma non utilizzano ICT

· Bassa frequentazione di loghi di carattere culturale quali musei

Nonni Duracell

· Pensionati attivi dai 65 anni in su

· Rilevante partecipazione ad associazioni e circoli

· Alto livello di Istruzione

· Alto livello di consumi culturali (libri, Musei, Mostre)

· Quotidiani e Tv quali principali mezzi di informazione

· Alto livello di spesa sia a casa che fuori ( tendenza a spendere più fuori casa)

· Estroversi, Sicuri, Impavidi, Concreti e Tradizionalisti

Essendo l’analisi confermativa focalizzata sui quattro gruppi descritti è stato considerato un sottoinsieme del campione, ottenuto a seguito di query in funzione della variabili utilizzate per identificare i gruppi, al fine di rendere più chiaro il risultato ottenuto senza inficiare la validità statistica della procedura adottata; questo spiega il minor numero di unità che verranno rappresentati nei prossimi grafici.

Le variabili scelte per questa analisi sono le seguenti:

· Livello di spesa a casa

· Livello di partecipazione alle associazioni

· Occupazione

· Livello di interesse politico

· Lettura quotidiani

· Frequentazione Musei

La scelta è caduta su tali variabili multidimensionali poiché a) risultano meglio esplicative delle differenze intergruppo relative ai clusters considerati e b) presentano modesti livelli di correlazione in relazione a tali gruppi, caratteristica importante per ottenere buoni output da tale analisi.

5.2 Analisi confermativa mediante algoritmo gerarchico aggregativo

Attraverso il software statistico MathLab è stata eseguita analisi confermativa mediante un algoritmo gerarchico aggregativo, il quale, partendo dalle unità statistiche ( le persone intervistate) le aggrega in gruppi omogenei in base alla “rassomiglianza tra i giudizi espressi nel questionario dando come ouput per l’identificazione dei gruppi un dendrogramma come quello illustrato al paragrafo 3.2.

La misura quantitativa per definire la similarità tra due giudizi è data dalla distanza euclidea tra due punti (visibile nell’asse delle ordinate), le unità vengono quindi aggregate in base a determinati calcoli operati sulle distanze relative a ogni unità ed espresse da più variabili. L’algoritmo oltre ad operare un calcolo delle distanze tra unità opera contemporaneamente un calcolo delle distanze tra gruppi, il cui scopo è quello di creare dei cluster di massima omogeneità interna e massima distanza, quindi eterogeneità esterna.

Si è proceduto predisponendo un dataset con il sottocampione di unità statistiche risultante, come detto, da query realizzate in funzione della variabili utilizzate precedentemente per la definizione dei gruppi in questione, al fine di circoscrivere l’analisi alle unità rientranti nei profili oggetto di analisi, riducendo così variabilità senza perdere capacità esplicativa per l’analisi confermativa dei quattro gruppi prefissati.

La numerazione delle unità statistiche nel dataset in questione non è stata casuale: a diversi intervalli numerici sono infatti associate unità appartenenti ai diversi profili, soluzione resasi necessaria per individuare poi i gruppi sul dendrogramma nella presente analisi, nel Biplot nella successiva analisi con MDS e ACP.

Intervalli numerici di unità

1-14

15-21

22-29

30-36

Profili

Rampanti

X-Box Gen

Regine della casa

Nonni Duracell

Attraverso l’algoritmo illustrato è stato ottenuto come output il seguente dendrogramma:

j

l

G

k

g

g

g

,...,

,

2

1

Dall’analisi del dendrogramma ottenuto è possibile identificare in modo abbastanza chiaro i profili ricavati in precedenza con la procedura di classificazione gerarchica che si intendevano verificare:

si possono infatti identificare quattro alberi piuttosto definiti (partendo da sinistra gli intervalli 16 - 21, 1-24, 2 -15 e 30 -34) che definiscono clusters omogenei al loro interno ed eterogenei tra di loro, i quali, se si osservano i numeri delle unità statistiche al loro interno, corrispondono ai gruppi oggetto di verifica.

Si è dunque verificato che i gruppi ottenuti dall’analisi mediante procedura di classificazione gerarchica (Excel) dai quali sono stati realizzati i profili Rampanti, X-Box Generation, Le Regine della casa e Nonni Duracell sono sufficientemente omogenei al loro interno ed eterogenei tra loro confermando la bontà della segmentazione realizzata.

5.3 Analisi confermativa con Multidimensional Scaling e Analisi in Componenti Principali

L’analisi confermativa è stata poi sviluppata mediante l’applicazione congiunta di Multidimensional Scaling e Analisi in Componenti Principali realizzata mediante il software statistico R.

Il Multidimensional Scaling è una tecnica esplorativa multivariata avente come obiettivo la rappresentazione in un piano bidimensionale delle distanze osservate tra più unità statistiche a partire da matrici multivariate comprensive di p variabili, come quelle rappresentate nei dataset da noi costruiti sulla base dei questionari.

Tale tecnica statistica è stata usata congiuntamente all’Analisi in Componenti Principali, dal momento che il Multidimensional Scaling classico, nel caso in cui si parta da una matrice di distanze euclidee costruita a partire da una matrice di dati quantitativi, come nel caso in questione, corrisponde, in termini di output di coordinate bidimensionali ottimali, all’Analisi in Componenti Principali (ACP), il cui principale contributo aggiuntivo si sostanzia nella caratterizzazione del significato delle variabili non osservabili che determinano la mappa creata dal MDS.

Le finalità dell’applicazione congiunta di tali tecniche statistiche sono due:

1- Ottenere una rappresentazione sintetica delle unità statistiche, in relazione ad alcune variabili selezionate, ritenute meglio esplicative della variabilità osservata, che permetta di visualizzare ad un livello bidimensionale i gruppi ottenuti dalle analisi precedentemente descritte, in modo più intuitivo rispetto ai dendrogrammi, mostrando come le differenti variabili influenzino la formazione dei gruppi identificati.

2- Confermare i gruppi ottenuti attraverso le precedenti analisi

MDS

Gli steps attraverso i quali è stata sviluppata l’analisi confermativa mediante MDS sono stati in sintesi seguenti:

-Definizione della matrice multidimensionale A contenente i valori assunti dalle variabili selezionate per ogni unita statistica;

- Standardizzazione della matrice A;

-Calcolo della matrice delle distanze euclidee dei dati standardizzati;

-Applicazione del MDS classico alla matrice delle distanze euclidee costruita sui dati di partenza standardizzati.

Si sono ottenute dunque le coordinate di rappresentazione bidimensionale ottimale che formalmente corrispondono alle prime due colonne della matrice

k

n

´

X

restituita attraverso appositi comandi dal software R.

La rappresentazione bidimensionale delle coordinate ottenute è risultata la seguente:

Mappa MDS

Si nota immediatamente come non si riesca a caratterizzare il significato delle variabili sottostanti tale rappresentazione, per questa ragione viene applicata congiuntamente l’analisi in componenti principali.

Le componenti principali, ottenute mediante un apposito algoritmo, risultano le combinazioni lineari delle variabili osservate che meglio riassumono le p variabili a disposizione, ossia che meglio colgono la variabilità osservata.

Il legame tra MDS e Componenti principali è rappresentato dal fatto che nel caso in cui si esegua l'MDS classico a partire da una matrice di dati , le (prime due) componenti principali corrispondono alle variabili che definiscono le coordinate della rappresentazione del MDS (a meno del segno).

Tramite il software R si sono ottenute le componenti principali, come illustrato di seguito:

Si è ottenuta quindi una rappresentazione grafica bidimensionale delle coordinate individuate nelle prime due componenti principali sostanzialmente analoga a quella ottenuta con l’MDS dove però è ancora difficile cogliere il significato sottostante:

Mappa ACP

E’ stata eseguita successivamente un’analisi relativa alla varianza spiegata dalle differenti componenti principali, fondamentale per fare valutazioni sulla bontà della rappresentazione; vengono di seguito riportati gli output di R:

Importance of components:

Comp.1 Comp.2 Comp.3 Comp.4 Comp.5

Standard deviation 1.6348219 1.0636945 0.9939309 0.71692375 0.64258159

Proportion of Variance0.4454405 0.1885743 0.1646498 0.08566328 0.06881852

Cumulative Proportion 0.4454405 0.6340148 0.7986646 0.88432783 0.95314635

Comp.6

Standard deviation 0.53020929

Proportion of Variance 0.04685365

Cumulative Proportion 1.00000000

Dagli output proposti emerge come le prime due componenti principali spieghino il 63,4% della varianza complessiva, un livello quindi soddisfacente.

Sono state successivamente analizzate le correlazioni tra variabili e componenti principali visualizzando i Loadings per caratterizzare il significato degli assi rappresentati dalle componenti principali:

Loadings:

Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6

occupazione 0.285 -0.373 0.731 0.336 -0.120 0.343

Musei -0.453 -0.406 -0.114 0.480 -0.436 -0.444

Associaz -0.318 0.448 0.609 -0.356 -0.322 -0.310

Quot -0.480 -0.201 0.266 0.798 -0.143

interesse.politico -0.455 -0.418 -0.521 -0.233 0.534

a.casa -0.419 0.529 0.508 0.533

Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6

SS loadings 1.000 1.000 1.000 1.000 1.000 1.000

Proportion Var 0.167 0.167 0.167 0.167 0.167 0.167

Cumulative Var 0.167 0.333 0.500 0.667 0.833 1.000

Dall’analisi dei loadings emerge come la prima componente principale sia influenzata dalle variabili Lettura quotidiani (-0.480), Interesse Politico (0.455) e Musei (-0.453) mentre la seconda dalle variabili Associazione (0.448) e Occupazione e Spesa a Casa (0.529).

Per ottenere infine una rappresentazione sintetica dell’analisi fin qui svolta con MDS e ACP si è proceduto realizzando un Biplot

Un Biplot è una rappresentazione grafica risultato dell’analisi in componenti principali che permette di sovrapporre nello stesso grafico:

a) un diagramma di dispersione (scatterplot) relativo alle unità statistiche, costruito sulle prime due componenti principali (Mappa ACP);

b) un diagramma di dispersione relativo alle variabili costruito a partire dalle correlazioni tra le variabili osservate e le componenti principali (Loadings).

Il Biplot permette, dunque, di dare una rappresentazione nel medesimo grafico bidimensionale 1) delle distanze tra le unità statistiche e quindi del loro posizionamento e b) delle relazioni tra le variabili e le prime due componenti principali, ossia permette di raggiungere l’obiettivo prefisso per questa fase dell’analisi.

Le unità statistiche vengono rappresentate dalle rispettive labels mentre le variabili da vettori variabili:

Biplot

Interpretazione del Biplot

Analizzando il Biplot emerge come tutte le variabili ricevano adeguata rappresentazione, dal momento che la lunghezza dei vettori variabili è proporzionale alla variabilità spiegata, e tutte le variabili presentano un vettore variabile sufficientemente lungo.

Da tale grafico risultano chiare le relazioni tra le variabili e gli assi, e come tali variabili determinino il posizionamento delle diverse unità statistiche e quindi le distanze tra gli individui.

E’ possibile dunque esplicitare l’individuazione di gruppi in funzione della eterogeneità o omogeneità in termini di valorizzazione assunta delle diverse unità in relazione alle diverse variabili.

Anche in questo caso è possibile individuare in modo piuttosto chiaro e distinto i gruppi oggetto analisi confermativa verificando ulteriormente la bontà della segmentazione realizzata nella prima fase di analisi.

I gruppi individuati corrispondono all’incirca agli stessi esplicitati dal dendrogramma, ma in questo caso è possibile visualizzarli ad un livello bidimensionale, mostrando come le differenti variabili influenzino la formazione dei clusters.

Si è dunque raggiunto anche il secondo obiettivo rappresentato dal perseguimento di un risultato confermativo, attraverso anche questo metodo, della omogeneità intragruppo ed eterogeneità intergruppo dei gruppi ai quali sono stati associati i nomi di Rampanti, Regine della Casa, Nonni Duracell e X-Box Generation.

L’analisi qui illustrata relativamente a quattro dei dieci gruppi totali potrebbe essere applicata anche agli altri gruppi, ma con risultati meno chiari e intuitivi rispetto al caso proposto, selezionato poiché meglio si presta a chiarire il contributo dell’applicazione di tale metodologia ad un’analisi confermativa.

5.4 Esemplificazione dei grafici seguendo una unità statistica

Per chiarire ulteriormente il significato di quanto ottenuto, ed i risultati dati dall’applicazione di algoritmi gerarchici aggregativi ed analisi MDS e ACP, viene di seguito focalizzata l’attenzione su una specifica unità statistica che viene seguita nelle due analisi.

Si consideri l’unità statistica numero 14, appartenente, sulla base dell’associazione descritta in precedenza tra intervalli numerici e profili, al gruppo dei Rampanti :

-nel dendrogramma si và a collocare nel secondo albero da destra, quello riconducibile al cluster caratterizzato con il nome di Rampanti, nel quale sono aggregate prevalentemente proprio le unità da 1 a 14 , indice della omogeneità intraguppo ed eterogeneità intergruppo a livello multidimensionale relativa a tali unità, conferma della consistenza del cluster.

- nel Biplot tale unità è collocata nel quadrante in basso a sinistra del grafico, posizione che, interpretata mediante i vettori variabili, identifica un professionista/manager che presenta alto livello di lettura di quotidiani, alto interesse politico, alta frequentazione di musei, spese in casa medio alte e una medio- alta partecipazione all’associazionismo. Emerge anche in questo caso come nell’area della mappa prossima alla collocazione dell’unità 14, determinata, come visto, dalla valorizzazione dei vettori variabili, siano posizionate unità prevalentemente dall’1 al 14 permettendo di individuare il cluster denominato con il nome di Rampanti, individuato precedentemente anche nel dendrogramma, confermando la omogeneità intraguppo ed eterogeneità intergruppo a livello multidimensionale relativa a tali unità.

Lo stesso ragionamento è possibile svilupparlo anche per le altre unità che vanno ad identificare gli altri gruppi nella mappa di rappresentazione dando quindi, come detto, evidenza visiva all’influenza delle diverse variabili nella determinazione dei clusters e conferma ulteriore della soddisfacente identificazione dei gruppi effettuata nelle fasi precedenti dell’analisi, garanzia di una buona caratterizzazione dei profili.

6. Produzione e Packaging: il quadro la sua logica la sua grafica

Una volta definiti i nuovi Stili di Vita, siamo passati alla parte più creativa, quella relativa alla contestualizzazione dei profili in un “nuovo quadro”.

Volevamo associare a ciascun nuovo stile individuato un simbolo che lo rappresentasse nei suoi tratti salienti.

Le idee sono state molte: dalle macchine agli sport, dagli animali all’idea finale dei personaggi tv/spot.

Le icone della tv erano quelle che ci permettevano di rappresentare veramente quella che è la società odierna nelle sue sfaccettature.

Processi

Contenuto

Scelta delle icone rappresentative

Identificazione dei tratti salienti delle varie categorie e ricerca di un personaggio o spot rappresentativo per ciascun profilo.

Carte d’identità

Rielaborazione della reale carta d’identità, al fine di far emergere le principali caratteristiche delle categorie.

Ricerca e montaggio audio e video

Ricerca a mezzo Internet di spezzoni di video relativi ai personaggi scelti e di brani musicali adatti al contesto. Mixaggio audio-video: filmati, brani musicali, messaggi vocali autoprodotti.

Creazione presentazione

Creazione di un file power-point, riassuntivo del percorso seguito ed esplicativo del nuovo quadro.

6.1 I personaggi scelti come icone rappresentative

Il primo passaggio è stato quello di individuare, per ciascuna categoria, un personaggio della televisione o del cinema, uno spot televisivo o uno spezzone di film, che potesse essere rappresentativo della categoria stessa e che potesse comunicare in modo efficace ed immediato le sue caratteristiche principali.

Per alcuni profili l’associazione al personaggio televisivo è stata immediata, tanto da determinare il nome della categoria stessa. E’ nato così lo stile di vita “Tony Manero”, per la sua passione per il ballo e la cura del corpo; le “Wonderwoman”, per la loro capacità di gestire contemporaneamente numerose attività (casa, lavoro…) senza togliere del tempo ai propri interessi; i soprannominati “nonni duracell”, che rappresentano la categoria degli anziani pieni di energia e di voglia di vivere.

Meno immediata, ma comunque coerente è stata la scelta delle icone per gli altri stili di vita. In questo caso si è cercato di andare oltre alla semplice associazione stile di vita-personaggio famoso e di pensare a cosa, a livello di presentazione multimediale, avrebbe potuto far percepire meglio al pubblico i tratti principali del profilo che volevamo rappresentare. Alle casalinghe sono state associate alcune scene del film “Mrs. Doubtfire”, che ritraevano il protagonista nelle quotidiane attività domestiche; per la categoria dei rampanti è stata scelta la scena iniziale del film “Mission Impossible”, che ritrae il protagonista in una difficile scalata; agli imprenditori è stato associato il personaggio di “Paperon de Paperoni”, a sottolineare il loro forte legame con il denaro, frutto di grandi sacrifici.

Per quanto riguarda le categorie dei giovani e giovanissimi, infine, ad essi sono stati associati rispettivamente lo spot dell’heineken, che ritrae un giovane ad una festa e alcune scene del telefilm “The Simpson”, che enfatizzano il legame degli adolescenti con la tecnologia ed in particolare i videogames.

Nella scelta della cornice all’interno della quale inserire le icone rappresentative degli stili di vita e quindi nella definizione del “quadro d’insieme”, l’immagine più adatta è sembrata la TV, elemento trasversale a tutte le categorie e che meglio poteva identificare la società odierna.

6.2 Le Carte d’Identità e i Video

Il passaggio successivo è stato quello di ricercare il mezzo più idoneo a comunicare i tratti distintivi di ciascuna categoria, in modo sintetico ma nello stesso tempo esaustivo.

A questo scopo la nostra scelta si è concentrata sulla creazione di carte d’identità “ad-hoc” per ciascun profilo. Tali carte dovevano riportare le caratteristiche salienti di ciascun gruppo, in modo da veicolarne le peculiarità nel modo più efficace ed immediato possibile.

Riportiamo qui sotto un esempio:

Figura 3 - Carta d'Identità della categoria "Rampanti"

Allo strumento delle carte d’identità è stata associata una presentazione video creata appositamente per ciascun profilo.

Lo scopo di tale filmato era quello di immergere, fin da subito, il pubblico all’interno della categoria in esame, in modo che potesse successivamente comprendere meglio le caratteristiche riportate nella carta.

Ai filmati, oltre ad essere state associate delle musiche coerenti con il profilo o il personaggio-icona del gruppo, sono stati mixati dei piccoli “messaggi vocali”, autoprodotti, ciascuno dei quali doveva, come in un piccolo spot, pubblicizzare al meglio la categoria.

8. Conclusioni

Il risultato del nostro lavoro: nuova proposta del quadro Eurisko.

Rampanti

Le Regine della casa

X-BOX Generation

Nonni Duracell

X-BOX

Generation

Nonni Duracell

Rampanti

Regine della casa

“Eurisko e oltre…”

La nostra rivisitazione degli stili di vita

� FONTE: � HYPERLINK "http://www.microsoft.com/italy/pmi/marketing/internetmarketing/web20" �http://www.microsoft.com/italy/pmi/marketing/internetmarketing/web20�

� La tecnica è stata sviluppata da Charles Osgood (1952) e si caratterizza per l’uso di aggettivi bipolari. Solitamente il differenziale semantico può essere strutturato su cinque o sette soluzioni dove al centro traviamo sempre la possibilità di dare un giudizio indifferente.

� La tecnica fu ideata nel 1932 dallo psicologo americano Rensis Likert con lo scopo di elaborare un nuovo strumento, più semplice rispetto ad altri, per la misurazione di opinioni e atteggiamenti. Sotto la categoria della “scala di Likert”vanno collocate una varietà di scale, conosciute in letteratura come scale additive o meglio “sommate drating scales”. Le scale di Likert sono le più semplici ed intuitive presentate in letteratura: date una serie di affermazioni, si chiede all’intervistato se e in che misura sia d’accordo.

� Per variabili intendiamo le singole domande alle quali è stato attribuito un punteggio.

ES: guarda la TV è una variabile alla quale sono associati dei valori che vanno da 0 a 12.

Per unità statistiche si intendono i singoli individui intervistati.�

� � EMBED Equation.3 ��� dove

-k è il rango della matrice B

-� EMBED Equation.3 ���= diag {� EMBED Equation.3 ���} è la matrice diagonale degli autovalori di B

-� EMBED Equation.3 ���= (� EMBED Equation.3 ��� ) è la matrice le cui colonne sono gli autovettori, a norma unitaria, associati agli autovalori della matrice B

- B è una matrice ottenuta da trasformazioni della matrice delle distanze D secondo un apposito procedimento del MDS.

� la matrice dei loadings è la matrice degli autovettori (a norma unitaria) della matrice di correlazione della matrice dei dati osservati iniziale

PAGE

36

_1236189032.unknown
_1236189226.unknown
_1236189574.unknown
_1236189655.unknown
_1236189198.unknown
_1231881874.unknown
_1236188873.unknown
_1236188919.unknown
_1231881999.unknown
_1232135181.unknown
_1231881898.unknown
_1231881760.unknown
_1231881811.unknown
_1231881684.unknown