identiteam metodologia analisi · l’obiettivo del progetto è rappresentato dalla riflessione e...

32
1 Gruppo Identiteam 23 marzo 2007 Eurisko e oltre…” La nostra rivisitazione degli stili di vita

Upload: truongmien

Post on 15-Feb-2019

217 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

1

Gruppo Identiteam

23 marzo 2007

“Eurisko e oltre…” La nostra rivisitazione degli stili di vita

Page 2: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

2

Metodologia analitica applicata per la definizione dei nuovi Profili 1. Gli Obiettivi del lavoro L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di

vita proposti nel quadro Eurisko, finalizzata alla realizzazione di un quadro alternativo il più

possibile rispecchiante, nei suoi profili costitutivi, l’attuale società italiana.

2. Organizzazione del progetto

2.1 I punti guida Abbiamo individuato una metodologia di lavoro specifica basata su alcuni punti, rivelatisi

fondamentali per garantire la fluidità delle fasi di progetto e la corrispondenza tra i

desiderata e il risultato ottenuto, li riportiamo di seguito:

• L’avere come mission quella di creare un prodotto alternativo al quadro Eurisko,

ricalcando in parte la logica di segmentazione da loro utilizzata, innovando alcuni

aspetti da noi individuati come mancanti (rapporto con l’ICT e l’innovazione,

rapporto con il consumo nella grande distribuzione, tratti della personalità).

• L’utilizzo di metodologie statistiche per l’elaborazione dei dati, in modo da ottenere

risultati basati su prove oggettive e non su considerazioni personali, imponendoci

anche nel caso di ricerca di profili da noi già ipotizzati, quali l’imprenditore di PMI, di

non “truccare i dati” a nostro favore ma di basarci sulle correlazioni espresse tra le

variabili.

• La decisione di condividere tutto il materiale a nostra disposizione grazie alla

realizzazione del Blog “Eurisko e Oltre”, funzionale 1) a garantire una visione

d’insieme dell’evoluzione del progetto a tutti i componenti del gruppo, 2) a

permettere a ciascuno di contribuire attivamente alla buona riuscita del progetto.

Page 3: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

3

• La suddivisione del progetto in due fasi principali (analisi dei dati, creazione del

quadro) tramite una procedura over the wall, permettendo una suddivisione e

specializzazione dei compiti all’interno del gruppo.

3. La prima fase del progetto Ai punti guida va raccordata la pianificazione temporale delle fasi del progetto.

In questo paragrafo si illustrerà l’organizzazione della prima fase del lavoro corrispondente

all’analisi dei dati e alla creazione dei profili.

Questa infatti ci ha impegnato molto dal punto di vista organizzativo (strutturare le

domande, pianificare i questionari, analizzare i dati), mentre la seconda fase, ha

presentato delle criticità più di carattere creativo-decisionale (trovare un tema efficace per

il quadro, deciderne i contenuti multimediali, produrli).

Il processo produttivo sottostante alla prima fase è schematizzato nella tabella sottostante

dove a destra troviamo il nome del processo e a sinistra una breve descrizione del suo

contenuto.

Processi Contenuto

Definizione degli obiettivi Prendendo come bentchmark il quadro

Eurisko abbiamo ipotizzato dei possibili

nuovi profili da ricercare, osservando quali

fossero le caratteristiche degli stili di vita

per noi più interessanti.

Definizione del campione Abbiamo optato per una soluzione di

campionamento stratificato con frazione di

campionamento proporzionale per ogni

strato, soluzione preferibile al

campionamento semplice, considerata

l’eterogeneità del fenomeno da studiare

nella popolazione di riferimento

dell’indagine.

Page 4: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

4

Stesura del questionario Abbiamo costruito il questionario in

relazione agli obiettivi prefissati,

strutturando le domande in funzione di una

successiva analisi quantitativa.

Raccolta informazioni Abbiamo suddiviso i questionari in base alla

logica di campionamento.

Prima di effettuare le interviste, abbiamo

costruito e testato un file Excel nel quale

ogni membro del gruppo ha riportato i dati

raccolti. I singoli file Excel sono stati in

seguito riuniti per creare il dataset finale.

Analisi dei dati e creazione dei profili In base alle ipotesi di gestione e anali dei

dati fatte precedentemente, vista la

numerosità delle variabili (ben 44) e del

campione (133 individui) abbiamo optato

per l’utilizzo di Excell in fase di analisi e dei

più potenti ma più complessi software

Mathlab e R in fase di verifica dei risultati.

All’analisi statistica è seguito il profilo dei

cluster trovati.

Nei paragrafi che seguono saranno sviluppate con maggiore precisione alcune tematiche

inerenti i processi presentati nella tabella, in particolare analizzeremo la logica di

campionamento, l’elaborazione del questionario, la logica di analisi dei dati, la verifica dei

risultati ottenuti.

Page 5: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

5

3.1 La logica di campionamento Di fronte al problema del campionamento, fase del progetto di grande criticità per la sua

forte incidenza sui risultati finali, abbiamo optato per una soluzione di campionamento

stratificato, soluzione preferibile al campionamento semplice, considerata l’eterogeneità

del fenomeno da studiare nella popolazione di riferimento dell’indagine:

si è optato per adottare una frazione di campionamento per ogni strato di tipo

proporzionale, soluzione che prevede l’estrazione di un numero di elementi proporzionale

al peso dello strato della popolazione. La popolazione oggetto di analisi è stata circoscritta

alla popolazione italiana di età superiore ai 15 anni; sulla base dei dati Istat sono state

ricavate le consistenze numeriche della popolazione italiana (dati 2006) in relazione alle

seguenti fasce d’età:

15-18; 19-27; 28-37; 38-50; 51-65; più di 65.

Sono stati quindi definiti i pesi dei diversi strati sulla popolazione totale, e i medesimi pesi

sono poi stati mantenuti nella definizione del campione al fine di ottenere un

campionamento il più possibile rappresentativo della popolazione italiana.

Formalmente:

siano

=H il numero degli strati

=hN la numerosità dello strato h

=N la numerosità della popolazione

=n la numerosità del campione

NN

W hh = è l’h-esimo peso dell’h-esimo strato sulla popolazione di riferimento

nn

f hh = è l’h-esimo peso del campione associato all’h-esimo strato del campione definito

affinchè risulti:

hhh

h WNN

nn

f ===

Page 6: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

6

Ogni persona ha quindi avuto il compito di intervistare 16 persone così distribuite per

fasce di età:

Età 15-18 19-27 28-37 38-50 51-65; più di 65

N. persone 1 2 3 4 3 3

Al fine di ottenere un campione più rappresentativo possibile della popolazione italiana,

oggetto d’indagine nel presente progetto, il campionamento è stato effettuato in più

province del Centro Nord sfruttando anche la preziosa collaborazione di amici dislocati in

diverse province e l’estrazione delle unità intervistate è stata effettuata prevalentemente

presso le Poste delle diverse province o presso le stazioni, al fine di garantire la massima

casualità possibile con i mezzi a nostra disposizione necessaria per cogliere

sufficientemente la variabilità del fenomeno.

Le analisi successivamente svolte hanno poi confermato la bontà del campionamento

eseguito, presentando alta variabilità in relazione a tutte le variabili, e nello stesso tempo

significative relazioni tra le stesse, che hanno permesso di ottenere buoni risultati, come

verrà illustrato, nella fase di datamining, permettendo di giungere alla configurazione di

gruppi molto eterogenei tra loro, ma con una soddisfacente omogeneità interna,

confermando quindi la scelta rappresentata dal campionamento stratificato quale criterio

idoneo al fenomeno oggetto di analisi.

Page 7: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

7

3.2 Il questionario Un momento fondamentale della prima fase del progetto è stato la stesura del

questionario.

L’obiettivo prefissatoci era quello di avere uno strumento efficace, ben strutturato,

semplice per gli intervistati, ma che potesse in seguito essere convertito dal punto di vista

quantitativo per essere riportato in un file Excell, diventando così una potente fonte di

informazioni.

Prima della stesura, abbiamo quindi individuato alcune caratteristiche indispensabili.

Da subito, confrontando le nostre esperienze, si è optato per la forma autocompilativa,

l’intervistato avrebbe compilato da solo le domande, ritenendo questa una modalità più

veloce, efficace e meno invasiva della privacy.

Questa scelta ha comportato l’obbligo di realizzare un documento facile da compilare, con

un linguaggio “wording” amichevole e a tutti comprensibile, con domande dirette, fatte in

seconda persona (es. : Come passi il tuo tempo libero?).

Nella strutturazione abbiamo applicato la logica ad imbuto, “funnel approach”, partendo da

domande di carattere generico per arrivare nello specifico, creando una sequenza logica

di macrosezioni quali: anagrafica; abitazione; titolo di studio e occupazione; cultura, tempo

libero e informazione; distribuzione del reddito; personalità.

Per semplificare la compilazione e per convertire in seguito il tutto in dati numerici,

abbiamo fatto un breve studio sulle scale da utilizzare nel questionario.

Si è optato per scale qualitative e non quantitative, ritenendo il confronto con le scale

numeriche abbastanza impegnativo per gli intervistati e non vincolante per i risultati del

nostro lavoro.

L’unica scala quantitativa inserita obbligatoriamente è quella relativa all’età che è stata

strutturata analizzando le fasce d’età dei profili Eurisko.

Si è voluta privilegiare la velocità di compilazione inserendo solamente risposte multiple e

non domande aperte, l’opzione “altro…” è stata inserita solamente in una domanda, ma in

generale tralasciata, perché difficilmente analizzabile statisticamente.

Facendo un approfondimento sulle scale, si è deciso di sfruttare nell’analisi della

personalità la tecnica del differenziale semantico a cinque punte1, in previsione di trovare

delle attitudini caratteriali simili in base ai profili. Osservando la struttura creata è possibile 1 La tecnica è stata sviluppata da Charles Osgood(1952) e si caratterizza per l’uso di aggettivi bipolari. Solitamente il differenziale semantico può essere strutturato su cinque o sette soluzioni dove al centro traviamo sempre la possibilità di dare un giudizio indifferente.

Page 8: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

8

vedere come alla destra si collochi un carattere che può essere identificato come

espansivo, mentre a sinistra un carattere più timido e idealista.

Nella sezione riservata a “Cultura, tempo libero e informazione”, si è optato per mantenere

una scala a tema singolo, molto simile alla Likert2, dove l’aspetto qualitativo (mai, poco,

abbastanza, molto) potesse essere facilmente convertito in un approccio quantitativo (le

risposte sono state in seguito caricate in Excell con i numeri: 0,4,8,12).

Non abbiamo voluto inserire domande riguardanti il reddito, perché ritenute scarsamente

identificative dello stile di vita, e problematiche dal punto di vista della privacy, queste sono

state, invece sostituite da domande relative ai consumi, fuori e dentro l’abitazione, che

meglio ci hanno permesso di capire le abitudini dei soggetti intervistati.

Dopo la stesura di una prima bozza, abbiamo fatto alcune prove di rump-up, osservando

le reazioni e le difficoltà degli intervistati.

Il tempo di compilazione medio stimato nelle prove è stato pari a 8 min, ritenuto accettabile

da parte del gruppo.

In parallelo alle prove del questionario è stata realizzata una prova della fattibilità

dell’analisi dal punto di vista statistico, riportando nel software statistico Mathlab i dati di

quattro individui da noi creati e rendendoli a due a due forzatamente simili, creando così

due “segmenti artificiali” (cluster).

Il risultato ottenuto con Mathlab è visibile nella figura 1, dove è palese come le unità 1 e 4

vengano raggruppate assieme e siano distinte dalle unità 2 e 3.

Questa prova ci ha dato una prima conferma sulla fattibilità dell’analisi e sulla possibilità di

ottenere da domande apparentemente qualitative dei risultati di tipo quantitativo.

Figura 1:

Dendrogramma o albero delle aggregazioni

2 La tecnica fu ideata nel 1932 dallo psicologo americano Rensis Likert con lo scopo di elaborare un nuovo strumento, più semplice rispetto ad altri, per la misurazione di opinioni e atteggiamenti. Sotto la categoria della “scala di Likert”vanno collocate una varietàdi scale, conosciute in letteratura come scale additiveo meglio “sommate drating scales”. Le scale di Likert sono le più semplici ed intuitive presentate in letteratura: date una serie di affermazioni, si chiede all’intervistato se e in che misura sia d’accordo.

Page 9: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

9

La figura è il risultato di un algoritmo gerarchico aggregativo, che partendo dalle singole unità statistiche le aggrega in

gruppi omogenei in base alla “rassomiglianza” tra i giudizi espressi dai soggetti nel questionario.

La misura quantitativa per definire la similarità tra due giudizi è data dalla distanza euclidea tra due punti (visibile

nell’asse delle ordinate), le unità vengono quindi aggregate in base a determinati calcoli operati sulle distanze relative a

ogni unità ed espresse da più variabili. L’algoritmo oltre ad operare un calcolo delle distanze tra unità opera

contemporaneamente un calcolo delle distanze tra gruppi, il cui scopo è quello di creare dei cluster di massima

omogeneità interna e massima distanza, quindi eterogeneità esterna.

3.3 Logica di analisi e segmentazione

3.3.1 Scelta della procedura Durante la stesura finale del questionario il gruppo di lavoro aveva ipotizzato alcune

procedure di analisi fondate sull’utilizzo dell’algoritmo di clustering con il software Mathlab,

il cui risultato sarebbe stato un grafico ad albero (dendrogramma, vedi sopra) tramite il

quale identificare la presenza di gruppi.

Dopo aver ottenuto la matrice di dati finale, data dall’unione dei singoli file Excel di ogni

membro del gruppo, ci siamo però resi conto che la complessità del dataset (44 varibili

*130 soggetti) unita alla criticità del fattore tempo, avrebbero condizionato l’evoluzione

dell’intero lavoro dando poco tempo alla fase successiva di creazione del quadro e della

presentazione.

Si è quindi optato per un’analisi basata sempre sul metodo gerarchico, ma realizzata con i

filtri avanzati Excel secondo la logica degli alberi di classificazione, dove quindi potessimo

Page 10: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

10

gestire meglio i risultati e essere noi a decidere la sequenza di variabili3 da fare entrare

per prime nella ricerca dei cluster.

Usando nella fase iniziale Mathlab infatti, i tempi di profilazione sarebbero stati molto

lunghi, in quanto avremmo dovuto affrontare alcuni problemi inerenti le relazioni tra

variabili e unità statistiche a queste connesse.

Abbiamo quindi voluto utilizzare l’algoritmo di Mathlab solo in fase di conferma, per

compiere una verifica della consistenza dei gruppi da noi individuati.

In aggiunta a questo abbiamo sfruttato un ulteriore metodologia di analisi denominata

Multidimensional Scaling congiunta all’ Analisi in Componenti Principali, sfruttando il

software R con la finalità di a) ottenere una rappresentazione sintetica delle unità

statistiche, in relazione ad alcune variabili selezionate che permettesse di visualizzare ad

un livello bidimensionale i gruppi ottenuti mostrando come le differenti variabili influenzino

la formazione dei gruppi identificati.

b) confermare ulteriormente i gruppi ottenuti attraverso le precedenti analisi.

3.3.2 Procedura di classificazione gerarchica Come già evidenziato, per operare la segmentazione dei dati è stato scelto un metodo

gerarchico basato sulla logica degli alberi di classificazione, procedura che è stata

realizzata, mediante l’applicativo Excel, applicando filtri avanzati alle singoli variabili che

hanno permesso di realizzare query specifiche funzionali a identificare i gruppi nel

dettaglio ( nel file Excel allegato sono riportati a titolo esemplificativi alcuni output delle

query che hanno permesso l’identificazione di alcuni dei gruppi).

La logica sottostante agli alberi di classificazione consiste nell’operare successive

scremature del campione totale in base ai valori via via assunti dalle singole variabili con

una logica che potremmo definire if-then oppure divide and conquer.

Portiamo un esempio della logica sottostante:

Gli individui con un padre possessore di Azioni sono più inclini all’acquisto di queste?,

risposta si, oppure no; se si che tipologia di titoli acquistano.

In questo caso abbiamo operato con un albero binario, la cui variabile risposta alla

domanda “Comprano Azioni ?” poteva dare solamente due risultati (SI, NO), nel nostro 3 Per variabili intendiamo le singole domande alle quali è stato attribuito un punteggio. ES: guarda la TV è una variabile alla quale sono associati dei valori che vanno da 0 a 12. Per unità statistiche si intendono i singoli individui intervistati.

Page 11: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

11

progetto invece abbiamo operato con degli alberi generali, dato che la variabile risposta ad

ogni domanda poteva dare più di un risultato (es: se sposato, allora con quanti figli?

1,2,3..).

E’ importante evidenziare quanto in queste operazioni conti l’ordine della sequenza delle

variabili prese in considerazione, infatti diversi ordinamenti danno gruppi con diverse

caratteristiche; inoltre precisiamo che questa procedura di segmentazione viene arrestata

non appena si riscontra una forte omogeneità tra i valori delle variabili che compongono il

segmento analizzato.

Questa ultima considerazione garantisce il criterio di massima omogeneità interna al

cluster.

3.3.3 Le variabili di classificazione Sfruttando la procedura di classificazione gerarchica, in sede di analisi, si è deciso l’ordine

di entrata delle variabili.

Questo è stato pensato osservando i risultati ottenuti da Eurisko, tentando di capire quali

potessero essere state le loro scelte in merito.

Abbiamo quindi optato per una serie di variabili ritenute fondamentali, quali per esempio:

l’occupazione, la fascia d’età, il titolo di studio, l’utilizzo dei mezzi di informazione.

In base a queste, effettuando varie prove siamo giunti alla determinazione dei gruppi finali

e delle caratteristiche relative a ogni gruppo.

Si è così potuto procedere alla fase profilazione.

Per esplicitare maggiormente l’ordine e la sequenza di variabili scelte per la classificazione,

riportiamo i risultati ottenuti nella tabella sottostante.

Ordine di entrata delle variabili di segmentazione Profilo ottenuto Occupazione > età > Titolo di studio > Mezzi di Informazione

Rampanti

Occupazione > età > Titolo di Studio Casalinghe Frequenza Discoteca > sport e cura del corpo Tony Occupazione > Età > Livello Associazionismo Nonno Duracell Occupazione > Età > Livello Associazionismo > Titolo di Studio

Nonno Stanco

Occupazione > Titolo di Studio Self Made Man Età > Occupazione > Titolo d Studio Work in Progress Età > Occupazione > Titolo di studio I Giovani Lavoratori Occupazione > Sesso > Figli (Sì/No) Wonder Woman Età X-Box Generation

Page 12: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

12

3.4 I Profili ottenuti

XBox Generation – I Giovanissimi

IDENTIKIT: Sono adolescenti tra i 15 e 18 anni sia maschi che femmine, vivono esclusivamente con i genitori in appartamento o abitazione indipendente situata in città, cittadina o paese. Il loro tempo libero è dedicato allo sport, di cui sono attivi praticanti, e alle relazioni con gli amici in locali di ritrovo, quali pub e pizzerie, al contrario non amano le discoteche, delle quali non sono grandi frequentatori. Non si sentono molto creativi e amano i consumi culturali passivi, come ascoltare musica e leggere libri, a scapito di attività come la visita a musei o mostre o l’andare a teatro. La scarsa propensione per le attività creative è compensata dall’utilizzo di mezzi tecnologici, dall’apertura all’innovazione e dal grande utilizzo della rete. Dal punto di vista dei media: sono voraci consumatori di TV, mezzo di comunicazione per eccellenza anche più di Internet, non leggono la carta stampata e non sono informati sulla politica. Per loro il centro commerciale è un luogo divertente (risposta data all’unanimità). Dal punto di vista della personalità si sentono socievoli e impulsivi, anche se è difficile delineare una personalità univoca.

I Giovani – Work in Progress

IDENTIKIT: I giovanissimi studenti Sono single, studenti universitari tra i 19 e i 27 anni. Vivono per un 90% con i genitori, il resto in appartamento con amici. Praticano moderatamente sport e tengono abbastanza alla cura del corpo. Spendono molto in pub e pizzerie, mediamente tra i 100 e 300 euro. Non praticano il volontariato, eccetto alcuni casi, e non frequentano associazioni. Sono interessati alla cultura, ma non frequentano molto mostre e musei; sono però accomunati dalla lettura di libri e da una buona tendenza a viaggiare. Li contraddistingue una forte passione per la musica, che è vista come un elemento fondamentale, e se parliamo di musica dal vivo, questa è fruita più nei concerti che nelle discoteche. Si tengono informati attraverso la lettura di quotidiani e tramite la TV. Presentano un buon interesse verso la vita politica. Usano moltissimo Internet e sono nel complesso “tecnologici”. Percepiscono il centro commerciale come un luogo conveniente e divertente. Non sono accomunati da un unico e specifico profilo personale: sono molto eterogenei da questo punto di vista.

Page 13: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

13

Sottogruppo: Giovani lavoratori Sono giovani tra i 19 e 27 anni che hanno deciso di non proseguire il ciclo degli studi per dedicarsi all’attività lavorativa. Vivono tutti in famiglia con i genitori (scompare la convivenza con gli amici che caratterizza i colleghi studenti). Sono sia operai che impiegati, non presentano evidenti consumi di carattere culturale. Non frequentano associazioni e non praticano il volontariato. Sono buoni frequentatori di cinema e di luoghi di ritrovo quali pub e pizzerie, anche se meno dei loro coetanei studenti, forse per mancanza di tempo. I loro consumi fuori casa non sono altissimi: mediamente pari a 300 euro. Prediligono uscire nei week-end e frequentano sporadicamente anche le discoteche. Leggono molto i quotidiani, anche se vi è una tendenza maggiore negli operai rispetto agli impiegati. Entrambi presentano un interesse politico medio. Si definiscono abbastanza tecnologici ma non innovatori. Nel caso dei giovani operai, questi sono più creativi dei loro colleghi impiegati, forse perché si dedicano ad attività saltuarie dopo il lavoro. Frequentano i centri commerciali dei quali percepiscono principalmente l’aspetto di convenienza.

I Rampanti – professionisti superattivi

IDENTIKIT: Sono principalmente uomini, liberi professionisti o Manager di alto livello culturale, di età compresa tra i 28 e 45 anni. Sono sia single che sposati e in quest’ultimo caso vivono assieme al coniuge in famiglie con non più di due figli. La maggior parte di loro è laureata anche se vi è una limitata presenza di diplomati. Il loro profilo è caratterizzato dall’iperattività: i Rampanti sembrano essere dotati del dono dell’ubiquità, riuscendo a coniugare al massimo impegni lavorativi, cura del corpo, viaggi di lavoro e volontariato. I Rampanti sono abbastanza sportivi, ma molto attenti alla cura del corpo, amano socializzare in luoghi quali pub, ristoranti ma soprattutto associazioni culturali. Amano dedicarsi assiduamente ad attività quali visite a musei e cinema, ascoltano molta musica e leggono libri principalmente per svago, ma anche per essere costantemente aggiornati in ambito professionale. I consumi sono condizionati dall’attività lavorativa e appaiono evidenti nelle loro risposte, poiché viaggiano moltissimo e dimostrano di essere grandi utilizzatori e conoscitori della tecnologia e della rete Internet. Dimostrano un elevato interesse per la politica e per essere sempre aggiornati prediligono Internet e quotidiani rispetto a TV, settimanali e mensili. Per i Rampanti il centro commerciale è un luogo stressante e conveniente, ma viene anche considerato un buon punto di incontro. Osservando la loro personalità, si può dire che essi siano uno dei pochi profili a presentare una coscienza piena della propria persona, si definiscono infatti estroversi, impulsivi, molto socievoli, sicuri, dallo spirito innovatore e più concreti che sognatori.

Page 14: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

14

Tony Manero – Ballo e mi tengo in forma

IDENTIKIT: Tony Manero potrebbe definirsi un “profilo trasversale rispetto all’età”, infatti vi appartengono sia donne che uomini di età compresa tra i 15 e i 55 anni di stato civile vario, quindi troviamo sia single che sposati\conviventi, che sposati con figli. Chi appartiene a questo profilo vive principalmente in appartamento, ha un titolo di studio che può variare dalla licenza media alla laurea, ha un occupazione varia a seconda dell’età, infatti troviamo: studenti, liberi professionisti, impiegati, operai, insegnanti, artigiani. Tutti i Tony Manero sono però uniti dall’amore per la Disco (o più in generale per il ballo), per lo sport e la cura del corpo, per i quali impiegano la maggior parte del loro tempo e danaro. I loro consumi sono infatti ridottissimi entro le mura domestiche (fino a 100 euro), ma per se stessi spendono molto, anche oltre i 500 euro. Oltre ad andare a ballare adorano frequentare pub e luoghi di ritrovo, vanno molto al cinema e viaggiano spesso, non frequentano ambienti quali musei o teatri ritenuti da loro forse poco eccitanti. Quasi per tutti loro il centro commerciale è un luogo divertente o un punto di incontro, in assoluto non risulta essere scelto per la convenienza. Al contrario di quello che si potrebbe immaginare leggono abbastanza, soprattutto prediligono settimanali e quotidiani. Si tengono informati attraverso la TV e internet con il quale hanno un’ottima familiarità, dichiarano di essere fortemente tecnologici. Riguardo alla personalità si definiscono estroversi, impulsivi, socievoli e oratori. Storia del profilo: Il profilo di Tony Manero, merita un commento in più rispetto agli altri, non perché abbia maggiore rilevanza, ma per il suo particolare e per noi strano e inaspettato profilo che quindi abbiamo voluto evidenziare. Esso è scaturito dall’osservazione nei dati di una forte correlazione tra l’essere amante della discoteca e l’avere una profonda dedizione per lo sport e la cura del corpo, proprio come nel personaggio interpretato da Jhon Travolta in “La febbre del sabato sera”. Ci ha lasciati stupiti la stranezza e per la sistematicità della correlazione che si è manifestata in tutte le fasce d’età, come una sorta di minigruppo.

Page 15: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

15

Wonderwoman – Le impegnate

IDENTIKIT: Sono donne sposate di età compresa tra i 28 e i 50 anni, che risiedono principalmente assieme al coniuge e ai figli, sia in abitazioni indipendenti, che in appartamento. Il loro profilo è caratterizzato da una buona istruzione, sono per la maggior parte laureate, e da consumi principalmente di tipo culturale quali musei, libri e viaggi. La famiglia e il lavoro occupano buona parte della loro giornata, a scapito di attività quali la palestra e la cura del corpo, che praticano di rado. Rispetto allo sport prediligono attività più rilassanti quali passeggiate all’aria aperta, visite ai musei, serate a teatro e al cinema. Sono buone ascoltatrici di musica e spiccano nel consumo di libri dei quali sono attente lettrici. Sono molto interessate all’informazione e alla politica e sfruttano omogeneamente tutti i mezzi di comunicazione, con predilezione di quotidiani e settimanali rispetto ai mensili. Sono abbastanza tecnologiche e propense all’innovazione e si definiscono persone caratterialmente sicure. Spendono molto sia in ambito domestico (€ > 300) che fuori casa (€ > 500), anche se la maggior parte di loro percepisce il centro commerciale come un luogo stressante.

Le regine della casa – le casalinghe

IDENTIKIT: Sono donne di età compresa tra i 38 e i 60 anni, sposate o vedove. Vivono principalmente con il coniuge, con o senza i figli presenti nel nucleo familiare (che solitamente è composto da non più di tre figli); superata la soglia dei 50 anni, nei casi di vedovanza rintracciabili, vivono da sole. Le casalinghe risiedono principalmente in case indipendenti, dove trascorrono prevalentemente il proprio tempo e alle quali dedicano buona parte delle spese economiche: a questo proposito si può osservare come i consumi in casa superino abbondantemente i 300€, mentre quelli fuori casa siano compresi tra i 100 e i 300€, esigui considerata l’età. Il profilo delle casalinghe è caratterizzato da una scarsa attività sociale, un basso livello culturale (quasi la totalità delle intervistate ha la licenza elementare) e da un totale inutilizzo delle tecnologie informatiche. Non amano dedicarsi all’attività sportiva, ma sono molto dedite alla cura del proprio corpo. Coerentemente con quanto affermato in precedenza, non frequentano locali di ritrovo quali pub o pizzerie e partecipano quasi timidamente ad attività di associazionismo e volontariato; nel tempo libero prediligono attività quali la lettura di libri e riviste settimanali, di cui sono assidue acquirenti, molto più rispetto a quelle mensili.

Page 16: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

16

Non frequentano luoghi di carattere culturale (mostre o musei) e non amano la visione dei programmi televisivi, ascoltano prevalentemente programmi radiofonici, probabilmente durante le attività dedite alla casa, e si ritengono genericamente amanti della musica. Inoltre le casalinghe reputano il centro commerciale un luogo conveniente, a riprova del fatto che prestano molta attenzione alla spesa. Amano definirsi oratrici, forse attribuendo al termine l’accezione di “chiacchierone”; per alcuni aspetti la loro personalità si può definire contraddittoria poiché, nonostante non abbiano familiarità con il mondo della tecnologia, si definiscono tutte “molto innovatrici”.

Nonno Duracell – il pensionato attivo

IDENTIKIT: Sono i pensionati dai 60 anni in su, sia maschi che femmine, sposati o vedovi. Considerando il loro nucleo familiare la media di figli è pari a 2,5, anche se spesso questi non vivono più nella stessa abitazione. I Nonni Duracell si distinguono per la loro vitalità e per la partecipazione costante ad associazioni e circoli culturali e spesso ad attività di volontariato. Questo profilo è caratterizzato da un alto livello di scolarizzazione corrispondente ad un diploma di maturità o laurea. I Nonni Duracell non praticano molto sport, ma si tengono in forma andando spesso a passeggiare all’aria aperta. Il loro dinamismo si esprime anche nel viaggiare molto e nell’essere interessati a consumi culturali quali la lettura di libri, che spicca notevolmente, e le visite a musei e mostre. Seguono molto il mezzo televisivo che però abbinano alla lettura di quotidiani; non usano internet e ascoltano poco la radio. Spendono molto per la casa (circa 300euro), ma la spesa più rilevante è per i consumi fuori casa, mediamente intorno ai 400 euro. Il centro commerciale è da loro vissuto come un luogo conveniente, ma una minima parte, soprattutto quella residente nei paesi, non lo frequenta. Si definiscono: estroversi, molto sicuri, impavidi, concreti e tradizionalisti. Sottogruppo: I nonni stanchi Nella categoria generale dei pensionati è da rilevare però anche la presenza di un’altra tipologia di profilo, in netta contrapposizione ai “pensionati attivi”: i “nonni stanchi”. E’ questo un profilo esclusivamente maschile, caratterizzato da una dinamicità nettamente minore rispetto al Nonno Duracell. Chi appartiene a questo profilo è solitamente sposato con in media due figli, ha un titolo di studio medio-basso, quale licenza elementare o media, e si caratterizza per un approccio piuttosto passivo alla vita: frequenta poco le associazioni e non pratica il volontariato, non ama leggere libri, acquista raramente i quotidiani e non ha una precisa idea su cosa rappresenti per lui un centro commerciale. Un elemento interessante da rilevare è come, contrariamente a quanto emerso dal resto del questionario, essi, nel definire la loro personalità, si definiscano con gli stessi aggettivi dei Duracell: estroversi, sicuri, impavidi, concreti ma anche e sopratutto materialisti.

Page 17: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

17

L’Imprenditore – Self made man

IDENTIKIT: Sono imprenditori di PMI, di età compresa tra i 40 e 65 anni. Risiedono tutti in abitazioni indipendenti site in piccoli e medi centri, con non più di 10mila abitanti. Sono per lo più sposati, ma anche single. Il loro livello d’istruzione corrisponde al diploma di maturità. Dal punto di vista dei consumi seguono molto quelli dei Rampanti, ma con toni più modesti. In particolare, a differenza dei Rampanti, i Self Made Man spendono poco per la casa (da 100 a 300 euro), mentre hanno molte spese esterne, che superano abbondantemente i 500 euro. Tutti ritengono che i centri commerciali non possano essere luoghi d’incontro, ma alcuni li definiscono convenienti altri stressanti o ancora, non li frequentano. All’opposto dei Rampanti partecipano pochissimo alle associazioni e non pensano al volontariato. Sono abbastanza sportivi e tengono alla cura del corpo, viaggiano saltuariamente e non sono attratti da consumi di carattere culturale, anche se li praticano occasionalmente. Hanno un modesto interesse per la vita politica e si tengono informati principalmente tramite la TV e i quotidiani. Nonostante abbiano un discreto feeling con Internet e siano imprenditori, non si definiscono innovatori, anzi, si identificano quasi all’unanimità come tradizionalisti e concreti. Si sentono inoltre sicuri ed estroversi.

Page 18: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

18

3.5 Verifica dei risultati con software statistici I gruppi individuati nella fase dell’analisi descritta sono stati oggetto analisi confermative,

come già anticipato, con due differenti metodologie statistiche: l’applicazione di un

algoritmo gerarchico aggregativo mediante il software Mathlab, e l’applicazione congiunta

del Multidimensional Scaling con L’analisi in Componenti principali mediante il software R.

Tali analisi sono state condotte al fine di garantire più oggettività e rigore possibile a

questa fase di analisi, cruciale per la definizione del nuovo quadro, cercando di

minimizzare l’impatto di congetture stereotipate dei profili della società attuale nell’analisi,

che avrebbero potuto inficiare il risultato del progetto impedendo di esplicitare profili

latenti.

3.5.1 I profili scelti per la verifica L’analisi confermativa è stata sviluppata su quattro dei gruppi identificati: X-Box

Generation, Rampanti, Nonni Duracell e Regine della Casa.

Caratteristiche salienti dei Gruppi selezionati

X – Box Generation

• Adolescenti tra i 15 e i 18 anni

• Sport e Amici nel tempo libero

• Poche attività creative, consumi culturali passivi ( bassa frequentazione musei)

• Alto Tasso di utilizzo tecnologia (videogames)

• Alto utilizzo Tv, lettura di quotidiani molto ridotta

• Scarso Interesse politico

• Livello di spesa a casa pressoché nullo

• Difficile identificazione caratteriale, poca omogeneità all’interno del profilo in

relazione alle variabili applicate nel differenziale semantico

Page 19: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

19

Rampanti

• Manager tra i 28 e i 45 anni

• Generalmente laureati

• Alta dinamicità: alto livello di Sport, Cura del corpo, Associazionismo, Musei ,

Lavoro ad alto contenuto professionale

• Alto livello di spesa sia a casa che fuori

• Alto Interesse politico

• Alto utilizzo dei quotidiani come mezzo di informazione

• Estroversi, Innovatori, Sicuri di sé, Socievoli

Regine della casa

• Casalinghe sposate tra i 38 e i 60 anni

• Medio basso livello di istruzione

• Trascorrono la maggior parte del tempo in attività legate alla casa

• Alta spesa in casa

• Basso interesse politico

• Basso livello di lettura dei quotidiani, preferiscono mensili e settimanali

• Si percepiscono innovatrici ma non utilizzano ICT

• Bassa frequentazione di loghi di carattere culturale quali musei

Nonni Duracell

• Pensionati attivi dai 65 anni in su

• Rilevante partecipazione ad associazioni e circoli

• Alto livello di Istruzione

• Alto livello di consumi culturali (libri, Musei, Mostre)

• Quotidiani e Tv quali principali mezzi di informazione

• Alto livello di spesa sia a casa che fuori ( tendenza a spendere più fuori casa)

• Estroversi, Sicuri, Impavidi, Concreti e Tradizionalisti

Page 20: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

20

Essendo l’analisi confermativa focalizzata sui quattro gruppi descritti è stato considerato

un sottoinsieme del campione, ottenuto a seguito di query in funzione della variabili

utilizzate per identificare i gruppi, al fine di rendere più chiaro il risultato ottenuto senza

inficiare la validità statistica della procedura adottata; questo spiega il minor numero di

unità che verranno rappresentati nei prossimi grafici.

Le variabili scelte per questa analisi sono le seguenti:

- Livello di spesa a casa

- Livello di partecipazione alle associazioni

- Occupazione

- Livello di interesse politico

- Lettura quotidiani

- Frequentazione Musei

La scelta è caduta su tali variabili multidimensionali poiché a) risultano meglio esplicative

delle differenze intergruppo relative ai clusters condiderati e b) presentano modesti livelli di

correlazione in relazione a tali gruppi, caratteristica importante per ottenere buoni output

da tale analisi.

3.5.2 Analisi confermativa mediante algoritmo gerarchico aggregativo Attraverso il software statistico MathLab è stata eseguita analisi confermativa mediante un

algoritmo gerarchico aggregativo, il quale, partendo dalle unità statistiche ( le persone

intervistate) le aggrega in gruppi omogenei in base alla “rassomiglianza tra i giudizi

espressi nel questionario dando come ouput per l’identificazione dei gruppi un

dendrogramma come quello illustrato al paragrafo 3.2.

Page 21: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

21

La misura quantitativa per definire la similarità tra due giudizi è data dalla distanza

euclidea tra due punti (visibile nell’asse delle ordinate), le unità vengono quindi aggregate

in base a determinati calcoli operati sulle distanze relative a ogni unità ed espresse da più

variabili. L’algoritmo oltre ad operare un calcolo delle distanze tra unità opera

contemporaneamente un calcolo delle distanze tra gruppi, il cui scopo è quello di creare

dei cluster di massima omogeneità interna e massima distanza, quindi eterogeneità

esterna.

Si è proceduto predisponendo un dataset con il sottocampione di unità statistiche

risultante, come detto, da query realizzate in funzione della variabili utilizzate

precedentemente per la definizione dei gruppi in questione, al fine di circoscrivere l’analisi

alle unità rientranti nei profili oggetto di analisi, riducendo così variabilità senza perdere

capacità esplicativa per l’analisi confermativa dei quattro gruppi prefissati.

La numerazione delle unità statistiche nel dataset in questione non è stata casuale: a

diversi intervalli numerici sono infatti associate unità appartenenti ai diversi profili,

soluzione resasi necessaria per individuare poi i gruppi sul dendrogramma nella presente

analisi, nel Biplot nella successiva analisi con MDS e ACP.

Intervalli numerici 1-14 15-21 22-29 30-36

di unità

Profili Rampanti X-Box Gen. Regine della casa Nonni

Duracell

Page 22: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

22

Attraverso l’algoritmo illustrato è stato ottenuto come output il seguente dendrogramma:

Dall’analisi del dendrogramma ottenuto è possibile identificare in modo abbastanza chiaro

i profili ricavati in precedenza con la procedura di classificazione gerarchica che si

intendevano verificare:

si possono infatti identificare quattro alberi piuttosto definiti (partendo da sinistra gli

intervalli 16 - 21, 1-24, 2 -15 e 30 -34) che definiscono clusters omogenei al loro interno

ed eterogenei tra di loro, i quali, se si osservano i numeri delle unità statistiche al loro

interno, corrispondono ai gruppi oggetto di verifica.

Si è dunque verificato che i gruppi ottenuti dall’analisi mediante procedura di

classificazione gerarchica (Excel) dai quali sono stati realizzati i profili Rampanti, X-Box

Generation, Le Regine della casa e Nonni Duracell sono sufficientemente omogenei al

loro interno ed eterogenei tra loro confermando la bontà della segmentazione realizzata.

.

X-BOX Generation Nonni Duracell Rampanti Regine della casa

Page 23: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

23

3.5.3 Analisi confermativa con Multidimensional Scaling e Analisi in Componenti Principali

L’analisi confermativa è stata poi sviluppata mediante l’applicazione congiunta di

Multidimensional Scaling e Analisi in Componenti Principali realizzata mediante il software

statistico R.

Il Multidimensional Scaling è una tecnica esplorativa multivariata avente come obiettivo la

rappresentazione in un piano bidimensionale delle distanze osservate tra più unità

statistiche a partire da matrici multivariate comprensive di p variabili, come quelle

rappresentate nei dataset da noi costruiti sulla base dei questionari.

Tale tecnica statistica è stata usata congiuntamente all’Analisi in Componenti Principali,

dal momento che il Multidimensional Scaling classico, nel caso in cui si parta da una

matrice di distanze euclidee costruita a partire da una matrice di dati quantitativi, come nel

caso in questione, corrisponde, in termini di output di coordinate bidimensionali ottimali,

all’Analisi in Componenti Principali (ACP), il cui principale contributo aggiuntivo si

sostanzia nella caratterizzazione del significato delle variabili non osservabili che

determinano la mappa creata dal MDS.

Le finalità dell’applicazione congiunta di tali tecniche statistiche sono due:

1- Ottenere una rappresentazione sintetica delle unità statistiche, in relazione ad

alcune variabili selezionate, ritenute meglio esplicative della variabilità osservata,

che permetta di visualizzare ad un livello bidimensionale i gruppi ottenuti dalle

analisi precedentemente descritte, in modo più intuitivo rispetto ai dendrogrammi,

mostrando come le differenti variabili influenzino la formazione dei gruppi identificati.

2- Confermare i gruppi ottenuti attraverso le precedenti analisi

Page 24: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

24

MDS

Gli steps attraverso i quali è stata sviluppata l’analisi confermativa mediante MDS sono

stati in sintesi seguenti:

-Definizione della matrice multidimensionale A contenente i valori assunti dalle variabili

selezionate per ogni unita statistica;

- Standardizzazione della matrice A;

-Calcolo della matrice delle distanze euclidee dei dati standardizzati;

-Applicazione del MDS classico alla matrice delle distanze euclidee costruita sui dati di

partenza standardizzati.

Si sono ottenute dunque le coordinate di rappresentazione bidimensionale ottimale che

formalmente corrispondono alle prime due colonne della matrice kn × X 4 restituita

attraverso appositi comandi dal software R.

4 2/1ΓΛ=X dove -k è il rango della matrice B

-Λ = diag { jλ } è la matrice diagonale degli autovalori di B

-Γ = ( kγγγ ,...,, 21 ) è la matrice le cui colonne sono gli autovettori, a norma unitaria, associati agli autovalori della

matrice B

- B è una matrice ottenuta da trasformazioni della matrice delle distanze D secondo un apposito procedimento del MDS.

Page 25: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

25

La rappresentazione bidimensionale delle coordinate ottenute è risultata la seguente:

Mappa MDS

Si nota immediatamente come non si riesca a caratterizzare il significato delle variabili

sottostanti tale rappresentazione, per questa ragione viene applicata congiuntamente

l’analisi in componenti principali.

Le componenti principali, ottenute mediante un apposito algoritmo, risultano le

combinazioni lineari delle variabili osservate che meglio riassumono le p variabili a

disposizione, ossia che meglio colgono la variabilità osservata.

Il legame tra MDS e Componenti principali è rappresentato dal fatto che nel caso in cui si

esegua l'MDS classico a partire da una matrice di dati , le (prime due) componenti

principali corrispondono alle variabili che definiscono le coordinate della rappresentazione

del MDS (a meno del segno).

Page 26: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

26

Tramite il software R si sono ottenute le componenti principali, come illustrato di seguito:

Si è ottenuta quindi una rappresentazione grafica bidimensionale delle coordinate

individuate nelle prime due componenti principali sostanzialmente analoga a quella

ottenuta con l’MDS dove però è ancora difficile cogliere il significato sottostante:

Page 27: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

27

Mappa ACP

E’ stata eseguita successivamente un’analisi relativa alla varianza spiegata dalle differenti

componenti principali, fondamentale per fare valutazioni sulla bontà della

rappresentazione; vengono di seguito riportati gli output di R:

Importance of components: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Standard deviation 1.6348219 1.0636945 0.9939309 0.71692375 0.64258159 Proportion of Variance0.4454405 0.1885743 0.1646498 0.08566328 0.06881852 Cumulative Proportion 0.4454405 0.6340148 0.7986646 0.88432783 0.95314635 Comp.6 Standard deviation 0.53020929 Proportion of Variance 0.04685365 Cumulative Proportion 1.00000000

Page 28: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

28

Dagli output proposti emerge come le prime due componenti principali spieghino il 63,4%

della varianza complessiva, un livello quindi soddisfacente.

Sono state successivamente analizzate le correlazioni tra variabili e componenti principali

visualizzando i Loadings 5 per caratterizzare il significato degli assi rappresentati dalle

componenti principali: Loadings: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 occupazione 0.285 -0.373 0.731 0.336 -0.120 0.343 Musei -0.453 -0.406 -0.114 0.480 -0.436 -0.444 Associaz -0.318 0.448 0.609 -0.356 -0.322 -0.310 Quot -0.480 -0.201 0.266 0.798 -0.143 interesse.politico -0.455 -0.418 -0.521 -0.233 0.534 a.casa -0.419 0.529 0.508 0.533

5 la matrice dei loadings è la matrice degli autovettori (a norma unitaria) della matrice di correlazione della matrice dei dati osservati iniziale

Page 29: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

29

Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 SS loadings 1.000 1.000 1.000 1.000 1.000 1.000 Proportion Var 0.167 0.167 0.167 0.167 0.167 0.167 Cumulative Var 0.167 0.333 0.500 0.667 0.833 1.000 Dall’analisi dei loadings emerge come la prima componente principale sia influenzata dalle

variabili Lettura quotidiani (-0.480), Interesse Politico (0.455) e Musei (-0.453) mentre la

seconda dalle variabili Associazione (0.448) e Occupazione e Spesa a Casa (0.529).

Per ottenere infine una rappresentazione sintetica dell’analisi fin qui svolta con MDS e

ACP si è proceduto realizzando un Biplot

Un Biplot è una rappresentazione grafica risultato dell’analisi in componenti principali che

permette di sovrapporre nello stesso grafico:

a) un diagramma di dispersione (scatterplot) relativo alle unità statistiche, costruito sulle

prime due componenti principali (Mappa ACP);

b) un diagramma di dispersione relativo alle variabili costruito a partire dalle correlazioni tra

le variabili osservate e le componenti principali (Loadings).

Il Biplot permette, dunque, di dare una rappresentazione nel medesimo grafico

bidimensionale 1) delle distanze tra le unità statistiche e quindi del loro posizionamento e

b) delle relazioni tra le variabili e le prime due componenti principali, ossia permette di

raggiungere l’obiettivo prefisso per questa fase dell’analisi.

Le unità statistiche vengono rappresentate dalle rispettive labels mentre le variabili da

vettori variabili:

Page 30: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

30

Biplot

Interpretazione Biplot Analizzando il Biplot emerge come tutte le variabili ricevano adeguata rappresentazione,

dal momento che la lunghezza dei vettori variabili è proporzionale alla variabilità spiegata,

e tutte le variabili presentano un vettore variabile sufficientemente lungo.

Da tale grafico risultano chiare le relazioni tra le variabili e gli assi, e come tali variabili

determinino il posizionamento delle diverse unità statistiche e quindi le distanze tra gli

individui.

Nonni Duracell

Rampanti

X-BOX Generation

Le Regine della casa

Page 31: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

31

E’ possibile dunque esplicitare l’individuazione di gruppi in funzione della eterogeneità o

omogeneità in termini di valorizzazione assunta delle diverse unità in relazione alle

diverse variabili.

Anche in questo caso è possibile individuare in modo piuttosto chiaro e distinto i gruppi

oggetto analisi confermativa verificando ulteriormente la bontà della segmentazione

realizzata nella prima fase di analisi.

I gruppi individuati corrispondono all’incirca agli stessi esplicitati dal dendrogramma, ma in

questo caso è possibile visualizzarli ad un livello bidimensionale, mostrando come le

differenti variabili influenzino la formazione dei clusters.

Si è dunque raggiunto anche il secondo obiettivo rappresentato dal perseguimento di un

risultato confermativo, attraverso anche questo metodo, della omogeneità intragruppo ed

eterogeneità intergruppo dei gruppi ai quali sono stati associati i nomi di Rampanti, Regine

della Casa, Nonni Duracell e X-Box Generation.

L’analisi qui illustrata relativamente a quattro dei dieci gruppi totali potrebbe essere

applicata anche agli altri gruppi, ma con risultati meno chiari e intuitivi rispetto al caso

proposto, selezionato poiché meglio si presta a chiarire il contributo dell’applicazione di

tale metodologia ad un’analisi confermativa.

3.5.4 Esemplificazione dei grafici seguendo una unità statistica Per chiarire ulteriormente il significato di quanto ottenuto, ed i risultati dati

dall’applicazione di algoritmi gerarchici aggregativi ed analisi MDS e ACP, viene di seguito

focalizzata l’attenzione su una specifica unità statistica che viene seguita nelle due analisi.

Si consideri l’unità statistica numero 14, appartenente, sulla base dell’associazione

descritta in precedenza tra intervalli numerici e profili, al gruppo dei Rampanti :

-nel dendrogramma si và a collocare nel secondo albero da destra, quello riconducibile al

cluster caratterizzato con il nome di Rampanti, nel quale sono aggregate prevalentemente

proprio le unità da 1 a 14 , indice della omogeneità intraguppo ed eterogeneità intergruppo

a livello multidimensionale relativa a tali unità, conferma della consistenza del cluster.

- nel Biplot tale unità è collocata nel quadrante in basso a sinistra del grafico, posizione

che, interpretata mediante i vettori variabili, identifica un professionista/manager che

presenta alto livello di lettura di quotidiani, alto interesse politico, alta frequentazione di

Page 32: Identiteam metodologia analisi · L’obiettivo del progetto è rappresentato dalla riflessione e rivisitazione dei profili per stili di vita proposti nel quadro Eurisko, finalizzata

32

musei, spese in casa medio alte e una medio- alta partecipazione all’associazionismo.

Emerge anche in questo caso come nell’area della mappa prossima alla collocazione

dell’unità 14, determinata, come visto, dalla valorizzazione dei vettori variabili, siano

posizionate unità prevalentemente dall’1 al 14 permettendo di individuare il cluster

denominato con il nome di Rampanti, individuato precedentemente anche nel

dendrogramma, confermando la omogeneità intraguppo ed eterogeneità intergruppo a

livello multidimensionale relativa a tali unità.

Lo stesso ragionamento è possibile svilupparlo anche per le altre unità che vanno ad

identificare gli altri gruppi nella mappa di rappresentazione dando quindi, come detto,

evidenza visiva all’influenza delle diverse variabili nella determinazione dei clusters e

conferma ulteriore della soddisfacente identificazione dei gruppi effettuata nelle fasi

precedenti dell’analisi, garanzia di una buona caratterizzazione dei profili.