5. le tecniche di analisi multidimensionale e la ... · nell’ambito delle tecniche statistiche...

65
5. Le tecniche di analisi multidimensionale e la segmentazione del mercato In questo capitolo Per definire gli obiettivi aziendali e approntare le relative strategie, ogni azienda deve poter conoscere le caratteristiche, i bisogni e i probabili comportamenti della clientela potenziale. Poiché caratteristiche e comportamenti risulteranno generalmente contraddistinti da un più o meno elevato grado di eterogeneità, saranno necessarie strategie diverse, specificamente indirizzate alle diverse tipologie di clientela potenziale. Con il termine segmentazione di mercato si intende il processo attraverso il quale le imprese suddividono la domanda in insiemi di clienti potenziali caratterizzati da elevata omogeneità all’interno dei vari segmenti e sufficienti elementi di differenziazione tra i diversi segmenti. Il suo obiettivo è dunque quello di raggruppare insieme individui caratterizzati da funzioni di domanda il più possibile simili, in corrispondenza dei quali l’azienda dovrà poi personalizzare l’offerta di prodotti o servizi, differenziando e specializzando le strategie di marketing. Già negli studi di Chamberlin (1933) si teorizza che, in un mercato caratterizzato dalla presenza di sub mercati che presentano differenti livelli di elasticità al prezzo, la massimizzazione del profitto può essere raggiunta definendo diverse politiche di fissazione del prezzo, stabilendo cioè prezzi più elevati nei segmenti meno elastici. Se si estende questo principio di adeguamento alle specifiche caratteristiche dei sub mercati anche alla definizione del prodotto, al packaging e confezionamento, alla comunicazione e distribuzione, risulta evidente come la segmentazione possa determinare effetti positivi sul risultato economico dell’azienda. Questa teoria presuppone l’assenza di informazione tra i diversi segmenti del mercato e l’impossibilità per operatori terzi di acquistare il prodotto nei sub mercati dove il prezzo è minore e rivenderlo nei sub mercati più profittevoli. Poiché questo non si verifica nella maggior parte dei mercati moderni, è proprio l’utilizzo congiunto della leva prezzo con le altre leve del marketing (prodotto, confezionamento, comunicazione e distribuzione) che consente di effettuare una differenziazione tale da “giustificare” differenze di prezzo. Spingendo al limite questa impostazione, ogni potenziale consumatore dovrebbe essere studiato come un segmento a se stante, in quanto portatore di specifici bisogni ed esigenze, ed essere fatto oggetto di una specifica strategia di marketing. Questo, però, è in pratica impossibile da attuare nella maggior parte delle situazioni, in quanto i costi di tale operazione supererebbero di gran lunga i benefici per l’azienda. Si mettono allora insieme, in un segmento di domanda, potenziali consumatori con caratteristiche simili in modo da realizzare strategie di marketing rivolte a target di potenziali consumatori sufficientemente numerosi da assicurare una adeguata redditività. Alla domanda quanto simili devono essere i potenziali consumatori all’interno di un segmento non è facile rispondere. Come si intuisce facilmente, e come si vedrà meglio nel Paragrafo 5.2, più elevata è l’omogeneità interna richiesta ai vari segmenti, maggiore sarà il loro numero. Ed è altrettanto intuitivo che più i segmenti sono simili più elevata è la probabilità che una volta fatti oggetto di una medesima strategia di marketing le diverse unità che li compongono rispondano allo stesso modo. D’altro canto, la richiesta che possiamo attenderci da parte di chi dovrà mettere a punto le differenti strategie è, invece, quella di contenere il numero di segmenti, in modo da limitare di conseguenza le alternative strategiche e quindi il costo. Dal punto di vista applicativo possiamo individuare due modalità di segmentazione: la segmentazione per omogeneità e la segmentazione per obiettivi. Segmentazione per omogeneità La segmentazione per omogeneità consiste nella individuazione dei diversi segmenti di domanda sulla base di un insieme di variabili osservate, senza presupporre l’esistenza di un modello che studi

Upload: trandiep

Post on 17-Feb-2019

218 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

5. Le tecniche di analisi multidimensionale e la segmentazione del mercato In questo capitolo Per definire gli obiettivi aziendali e approntare le relative strategie, ogni azienda deve poter conoscere le caratteristiche, i bisogni e i probabili comportamenti della clientela potenziale. Poiché caratteristiche e comportamenti risulteranno generalmente contraddistinti da un più o meno elevato grado di eterogeneità, saranno necessarie strategie diverse, specificamente indirizzate alle diverse tipologie di clientela potenziale. Con il termine segmentazione di mercato si intende il processo attraverso il quale le imprese suddividono la domanda in insiemi di clienti potenziali caratterizzati da elevata omogeneità all’interno dei vari segmenti e sufficienti elementi di differenziazione tra i diversi segmenti. Il suo obiettivo è dunque quello di raggruppare insieme individui caratterizzati da funzioni di domanda il più possibile simili, in corrispondenza dei quali l’azienda dovrà poi personalizzare l’offerta di prodotti o servizi, differenziando e specializzando le strategie di marketing. Già negli studi di Chamberlin (1933) si teorizza che, in un mercato caratterizzato dalla presenza di sub mercati che presentano differenti livelli di elasticità al prezzo, la massimizzazione del profitto può essere raggiunta definendo diverse politiche di fissazione del prezzo, stabilendo cioè prezzi più elevati nei segmenti meno elastici. Se si estende questo principio di adeguamento alle specifiche caratteristiche dei sub mercati anche alla definizione del prodotto, al packaging e confezionamento, alla comunicazione e distribuzione, risulta evidente come la segmentazione possa determinare effetti positivi sul risultato economico dell’azienda. Questa teoria presuppone l’assenza di informazione tra i diversi segmenti del mercato e l’impossibilità per operatori terzi di acquistare il prodotto nei sub mercati dove il prezzo è minore e rivenderlo nei sub mercati più profittevoli. Poiché questo non si verifica nella maggior parte dei mercati moderni, è proprio l’utilizzo congiunto della leva prezzo con le altre leve del marketing (prodotto, confezionamento, comunicazione e distribuzione) che consente di effettuare una differenziazione tale da “giustificare” differenze di prezzo. Spingendo al limite questa impostazione, ogni potenziale consumatore dovrebbe essere studiato come un segmento a se stante, in quanto portatore di specifici bisogni ed esigenze, ed essere fatto oggetto di una specifica strategia di marketing. Questo, però, è in pratica impossibile da attuare nella maggior parte delle situazioni, in quanto i costi di tale operazione supererebbero di gran lunga i benefici per l’azienda. Si mettono allora insieme, in un segmento di domanda, potenziali consumatori con caratteristiche simili in modo da realizzare strategie di marketing rivolte a target di potenziali consumatori sufficientemente numerosi da assicurare una adeguata redditività. Alla domanda quanto simili devono essere i potenziali consumatori all’interno di un segmento non è facile rispondere. Come si intuisce facilmente, e come si vedrà meglio nel Paragrafo 5.2, più elevata è l’omogeneità interna richiesta ai vari segmenti, maggiore sarà il loro numero. Ed è altrettanto intuitivo che più i segmenti sono simili più elevata è la probabilità che una volta fatti oggetto di una medesima strategia di marketing le diverse unità che li compongono rispondano allo stesso modo. D’altro canto, la richiesta che possiamo attenderci da parte di chi dovrà mettere a punto le differenti strategie è, invece, quella di contenere il numero di segmenti, in modo da limitare di conseguenza le alternative strategiche e quindi il costo. Dal punto di vista applicativo possiamo individuare due modalità di segmentazione: la segmentazione per omogeneità e la segmentazione per obiettivi. Segmentazione per omogeneità La segmentazione per omogeneità consiste nella individuazione dei diversi segmenti di domanda sulla base di un insieme di variabili osservate, senza presupporre l’esistenza di un modello che studi

Page 2: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

la loro dipendenza. Possiamo distinguere, in questo primo ambito, un approccio classico che prevede il ricorso alle tecniche di analisi dei gruppi, eventualmente precedute dall’analisi fattoriale al fine di sintetizzare in macro elementi di scelta le variabili osservate, da un approccio flessibile che, attraverso l’analisi congiunta, consente anche di valutare il livello di gradimento di profili di offerta innovativi, o comunque non presenti sul mercato. Segmentazione per obiettivi Nella segmentazione per obiettivi si suddivide la popolazione in sottopopolazioni utilizzando una determinata variabile (per esempio, la redditività della clientela o la sensibilità a campagne pubblicitarie) e si individua una serie di altre variabili (per esempio, le caratteristiche sociodemografiche o psicoattitudinali, i benefici attesi) che possono influire in maniera rilevante sulla variabile considerata. Si presuppone dunque l’esistenza di un legame di dipendenza che lega una variabile (dipendente) a una serie di altre variabili (esplicative). Le tecniche utilizzate in questo caso sono la stima di un modello di regressione lineare multipla o di un modello logistico, la cui trattazione è stata oggetto del Capitolo 4. In questo capitolo vengono presentate alcune tra le tecniche di analisi statistica multivariata più utilizzate nelle analisi di segmentazione per omogeneità. Nel Paragrafo 5.2 vengono presentate le tecniche di raggruppamento delle unità statistiche che vanno sotto il nome di analisi dei gruppi. Si tratta di tecniche che consentono, come si desume dalla loro stessa denominazione, di raggruppare gli individui tra loro più simili in relazione a determinate caratteristiche, in modo da formare gruppi o segmenti caratterizzati da elevata omogeneità interna. Se si pensa a una matrice di dati del tipo di quelle descritte nel Capitolo 3, costituite da tante righe quanti sono gli individui analizzati e da tante colonne quante sono le variabili scelte per definire il “profilo” degli individui, l’obiettivo delle tecniche di analisi dei gruppi è quello di ridurre la dimensionalità della matrice nel senso delle righe, attraverso l’individuazione di gruppi di righe (individui) omogenee. Nei Paragrafi 5.3. e 5.4 vengono invece presentate le tecniche di analisi fattoriale e scaling multidimensionale che, invece, si propongono di ridurre la dimensionalità delle informazioni dal lato delle variabili, cioè delle colonne della matrice dei dati. La riduzione del numero delle variabili, preservando però la maggior parte del contenuto informativo della matrice di partenza, è questione altrettanto importante nelle analisi di segmentazione. Si pensi, per esempio, alla possibilità di rappresentare graficamente in un piano (su due dimensioni) e quindi con la possibilità di individuare visivamente le similarità tra le unità di un collettivo, mantenendo gran parte del contenuto informativo di, poniamo, 10 variabili osservate, alcune delle quali magari di tipo qualitativo. Nel Paragrafo 5.5 viene infine presentata l’analisi congiunta, una tecnica che si applica sulle informazioni provenienti dal singolo individuo che ha l’obiettivo di separare il contributo dei diversi attributi di un prodotto o servizio nel processo di scelta del consumatore. Nella trattazione delle varie tecniche, una specifica attenzione è rivolta alla possibilità di utilizzare anche variabili non quantitative, frequentemente chiamate in causa nelle applicazioni di analisi di mercato.

Page 3: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

5.1 Analisi dei gruppi L’analisi dei gruppi è l’insieme delle tecniche statistiche che hanno come obiettivo quello di raggruppare un insieme di unità appartenenti a un collettivo in un certo numero di gruppi, sulla base della loro similarità in relazione a un insieme di variabili. I gruppi ottenuti devono cioè essere caratterizzati da un elevato grado di omogeneità interna delle unità statistiche a essi appartenenti e da una conseguente elevata disomogeneità tra i gruppi stessi. Le ragioni per cui tali tecniche statistiche vengono impiegate nelle analisi empiriche sono molteplici, dalla classificazione all’analisi esplorativa dei dati. Come già accennato, nelle analisi di mercato tali tecniche trovano largo impiego nella segmentazione a posteriori del mercato. I dati di partenza ai quali applicare tali tecniche possono essere sia la matrice dei dati Xnp, sia la matrice delle distanze Dnn, già presentate nel Capitolo 3. In entrambi i casi è di fondamentale importanza la scelta delle p variabili della matrice dei dati di base, dato che il raggruppamento delle n unità viene effettuato sulla base della loro omogeneità, misurata proprio sulle p variabili presenti nella matrice X o utilizzate per calcolare la matrice D. Sui criteri di scelta delle p variabili si rimanda ai prossimi paragrafi. Va tuttavia subito sottolineato che caratteristica comune di gran parte di queste tecniche statistiche è quella di consentire il raggruppamento delle unità omogenee in base a variabili di qualsiasi natura. Nella matrice dei dati possono cioè essere presenti variabili sia quantitative sia qualitative e, tra queste ultime, sia ordinali sia sconnesse. La presenza congiunta di variabili appartenenti alle diverse tipologie appena ricordate, è in effetti il caso più frequente che si riscontra nelle analisi di mercato. Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi gerarchici e metodi non gerarchici. I primi sono caratterizzati da una gerarchia di raggruppamento, nel senso che il raggruppamento finale viene ottenuto per passaggi successivi; si dividono in agglomerativi e divisivi. I metodi non gerarchici, al contrario, effettuano direttamente, attraverso l’uso di procedure iterative, il raggruppamento delle unità nel numero desiderato di gruppi. I metodi gerarchici e non gerarchici possono essere utilizzati alternativamente o congiuntamente. 5.1.1 I metodi gerarchici agglomerativi I metodi gerarchici agglomerativi sono così denominati perché procedono per agglomerazioni successive delle unità statistiche (individui). La procedura parte da n gruppi formati ciascuno da un solo individuo, per poi passare a n-1 gruppi, dei quali n-2 formati ancora da un solo individuo e 1 formato da due individui; passa poi a n-2 gruppi, n-3, n-4, fino ad arrivare a un unico gruppo costituito da tutte le n unità statistiche del collettivo. Ovviamente, l’obiettivo non è quello di arrivare a un unico gruppo costituito da tutte le unità, bensì quello di raggruppare le n unità in un certo numero (limitato) di gruppi. La scelta del numero di gruppi dovrà scaturire da un soddisfacente compromesso tra la necessità di mantenere una sufficiente omogeneità all’interno dei gruppi e quella di tenere basso tale numero, in modo da evitare la proliferazione di differenti strategie di marketing. In dettaglio, i metodi gerarchici agglomerativi prevedono il seguente schema di raggruppamento.

1) Si parte da n gruppi, ognuno dei quali è formato da una unità del collettivo. La distanza tra i gruppi è fornita dalla matrice delle distanze Dnn :

� 0 d12 d13 …. d1n �

� 0 d23 …. d2n � D = � …. …. |

| …. dn-1,n | � 0 �

Page 4: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

2) Si ricerca il minimo valore all’interno della matrice delle distanze (con l’eccezione della

diagonale principale che contiene tutti valori pari a zero). Esso identifica le due unità più simili, cioè quelle che presentano profili riga più omogenei nella matrice dei dati. Qualora ci siano più elementi della matrice con lo stesso valore di minimo se ne sceglie uno casualmente; le altre coppie troveranno aggregazione negli step appena successivi.

3) Si procede alla fusione delle unità corrispondenti a tale valore minimo. Poiché le unità

oggetto di fusione non esistono più come soggetti singoli, vengono eliminate dalla matrice delle distanze D le due righe e le due colonne corrispondenti, ottenendo una nuova matrice delle distanze Dn-2,n-2.

4) Si aggiunge una nuova riga e una nuova colonna che contiene le distanze tra il nuovo gruppo

ottenuto dalla fusione dei due precedenti e tutte le altre unità che continuano a esistere singolarmente, in modo da ottenere una nuova matrice Dn-1,n-1.

5) Si torna a eseguire lo step 2 e seguenti in modo iterativo, riducendo la matrice D di una unità

a ogni iterazione, fino a quando si arriva alla configurazione finale costituita da un solo gruppo formato da tutte le n unità del collettivo preso in esame.

Resta da chiarire il punto 4 del processo, cioè come ricalcolare, a ogni iterazione, la riga e la colonna della matrice che contengono le distanze tra il nuovo gruppo e tutti i preesistenti. A questo riguardo i metodi possibili sono diversi. Siano:

CK: K-esimo gruppo (originariamente, k-esima unità) NK: numero di unità nel K-esimo gruppo (originariamente, NK=1) DKL: misura di distanza tra il gruppo CK e il gruppo CL

Si ipotizzi che DKL sia il minimo valore nella matrice delle distanze e dunque che i gruppi CK e CL vengano fusi in un unico gruppo chiamato CM. Metodo del legame singolo Le distanze tra il nuovo gruppo risultante dalla fusione e tutti i preesistenti, contenute nella nuova riga e nella nuova colonna della matrice D, sono definite come la distanza minore che, prima della fusione, avevano i gruppi oggetto di fusione con tutti gli altri gruppi. Indicato con J un generico gruppo preesistente, si ha cioè: DJM = min(DJK,DJL) Oltre alla semplicità di calcolo, tale metodo ha il vantaggio di essere poco sensibile ai valori anomali, riuscendo a isolarli in gruppi di una sola o di pochissime unità. Il limite principale consiste nel fatto di produrre gruppi tendenzialmente “allungati” (o “a salsiccia”): una volta che si è creato un primo gruppo composto da due unità, proprio per il metodo di ricalcolo delle distanze, è più probabile che altre unità vadano ad aggiungersi a questo primo gruppo, formando un gruppo sempre più numeroso.

Page 5: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Esempio 5.2.1 (riprendere la matrice ottenuta con l’esercizio 3.x)

Metodo del legame completo Le distanze tra il nuovo gruppo risultante dalla fusione e tutti i preesistenti, che definiscono la nuova riga e la nuova colonna della matrice D, sono definite come le distanze maggiori che, prima della fusione, avevano i gruppi oggetto di fusione con tutti gli altri. Per il generico gruppo preesistente J si ha cioè: DJM = max(DJK,DJL) A differenza del precedente, il metodo del legame completo risulta molto influenzato dalla presenza di valori anomali, tanto da suggerire una preventiva analisi ad hoc. Tende inoltre a produrre molti gruppi di dimensioni simili. Esempio 5.2.2 (riprendere la matrice ottenuta con l’esercizio 3.x)

Metodo di McQuitty Le distanze tra il nuovo gruppo risultante dalla fusione e tutti i preesistenti sono definite come la media aritmetica semplice tra le distanze che, prima della fusione, avevano i gruppi oggetto di fusione con tutti gli altri gruppi. Per il generico gruppo preesistente J si ha cioè: DJM = (DJK + DJL) / 2 Per le sue caratteristiche, quanto a vantaggi e svantaggi, questo metodo si colloca in posizione intermedia tra quello del legame singolo e quello del legame completo.

A B C D E A D E BCA 0 0,26 0,68 0,45 0,44 A 0 0,45 0,44 0,26B 0 0,11 0,39 0,68 D 0 0,82 0,39C 0 0,52 0,19 E 0 0,19D 0 0,82 BC 0E 0

A D BCE D ABCEA 0 0,45 0,26 D 0 0,39D 0 0,39 ABCE 0BCE 0

A B C D E A D E BCA 0 0,26 0,68 0,45 0,44 A 0 0,45 0,44 0,68B 0 0,11 0,39 0,68 D 0 0,82 0,52C 0 0,52 0,19 E 0 0,68D 0 0,82 BC 0E 0

D BC AE BC AEDD 0 0,52 0,45 BC 0 0,68BC 0 0,68 AED 0AE 0

Page 6: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Esempio 5.2.3 (riprendere la matrice ottenuta con l’esercizio 3.x)

Metodo del legame medio Le distanze tra il nuovo gruppo risultante dalla fusione e tutti i preesistenti sono definite come media aritmetica tra le distanze che, prima della fusione, avevano i gruppi oggetto di fusione con tutti gli altri gruppi, ponderata con le numerosità dei gruppi oggetto di fusione. Per il generico gruppo preesistente J si ha cioè: DJM = (DJK NK + DJL NL) / NM Anche questo metodo si colloca in posizione intermedia, tra quello del legame singolo e quello del legame completo, per quanto attiene a vantaggi e svantaggi; inoltre tende a unire gruppi con bassa varianza interna e a produrre gruppi con varianza interna simile tra loro. Esempio 5.2.4 (riprendere la matrice ottenuta con l’esercizio 3.x)

Come si evince dall’Esempio 5.2.4, alla prima iterazione il metodo del legame medio coincide esattamente con il metodo di McQuitty in quanto tutti i gruppi preesistenti hanno dimensione unitaria. Altri metodi gerarchici agglomerativi si basano, invece che sulla matrice delle distanze, sulla matrice dei dati X contenente i profili delle unità secondo q variabili quantitative. Metodo del centroide La distanza tra i gruppi è posta pari alla distanza tra i centroidi o baricentri, costituiti dai valori medi delle p variabili considerate, calcolati sulle unità appartenenti ai gruppi. Anche in questo caso vengono fusi i gruppi che presentano distanza minima. Il metodo del centroide risulta più robusto in

A B C D E A D E BCA 0 0,26 0,68 0,45 0,44 A 0 0,45 0,44 0,47B 0 0,11 0,39 0,68 D 0 0,82 0,455C 0 0,52 0,19 E 0 0,435D 0 0,82 BC 0E 0

A D BCE AD BCEA 0 0,45 0,455 AD 0 0,54375D 0 0,6325 BCE 0BCE 0

A B C D E A D E BCA 0 0,26 0,68 0,45 0,44 A 0 0,45 0,44 0,47B 0 0,11 0,39 0,68 D 0 0,82 0,455C 0 0,52 0,19 E 0 0,435D 0 0,82 BC 0E 0

A D BCE AD BCEA 0 0,45 0,46 AD 0 0,515D 0 0,57 BCE 0BCE 0

Page 7: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

relazione ai valori anomali rispetto alla maggior parte dei metodi gerarchici. La necessità che tutte le variabili della matrice X siano quantitative rende il metodo del centroide meno frequentemente applicabile nelle analisi di mercato, che, come si è detto, fanno spesso riferimento a dati misti, composti cioè da variabili sia quantitative sia qualitative. Inoltre, mentre per i primi tre metodi analizzati il livello di distanza a cui avvengono le fusioni successive risulta sempre non decrescente, il metodo del centroide può dar luogo a fusioni successive con livelli di distanza decrescenti. Figura 5.2.1 Esempio di applicazione del metodo del centroide nel caso di due dimensioni (p=2).

Page 8: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Metodo di Ward Il metodo di Ward si basa sulla scomposizione della devianza totale in devianza entro i gruppi e devianza tra i gruppi. A ogni iterazione viene considerata l’unione di tutte le possibili coppie di gruppi e viene fusa la coppia che dà luogo alla minore varianza entro i gruppi. Oltre al limite derivante dalla possibilità di analizzare solo variabili quantitative, il metodo risulta molto oneroso dal punto di vista computazionale e tende a produrre gruppi di dimensioni pressoché analoghe. Altri metodi gerarchici agglomerativi sono basati su stime non parametriche della densità di probabilità. Per una loro esauriente trattazione si veda Fabbris (1990). Il processo di fusione realizzato impiegando uno dei metodi appena descritti può essere rappresentato graficamente attraverso il dendrogramma, un grafico che riporta sull’asse orizzontale, non quantitativo, le unità che partecipano al processo di fusione, e sull’asse verticale il livello di distanza a cui avviene la fusione tra i diversi gruppi che si vengono formando per agglomerazioni successive. Dall’esame del dendrogramma è possibile ricavare utili indicazioni riguardo al numero dei gruppi da considerare. Aggregazioni che nel dendrogramma avvengono molto “in alto”, cioè a un livello di distanza elevato, si riferiscono a gruppi non omogenei al loro interno. Di conseguenza, se le unità che li compongono vengono fatte oggetto di un’unica strategia di marketing studiata per quel gruppo, verosimilmente si otterranno risposte eterogenee, vanificando parte degli obiettivi dell’analisi. È dunque consigliabile fermare il processo di aggregazione a un livello di distanza minore, identificando un più elevato numero di gruppi caratterizzati da una sufficiente omogeneità interna. La conseguenza sarà dover studiare un numero maggiore di strategie differenti, ma con la fondata prospettiva che le unità destinatarie risponderanno in modo analogo alla strategia proposta. Figura 5.2.2 Dendrogrammi relativi agli esempi 5.2.1 e seguenti.

Page 9: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

d

B C E A Dunità

legame singolo

d

B C E A Dunità

legame completo

Page 10: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

5.1.2 I metodi gerarchici divisivi I metodi gerarchici divisivi seguono il percorso esattamente inverso rispetto a quello che caratterizza i metodi agglomerativi. Il punto di partenza, infatti, è un unico gruppo formato da tutte le n unità e si procede per divisioni successive: dapprima in 2 gruppi, poi il più eterogeneo dei due viene a sua volta diviso in due, e cosi via fino ad arrivare a n gruppi formati ciascuno da una unità. Al primo passo esistono 2n-1-1 possibili soluzioni per cui si tratta spesso di metodi molto onerosi dal punto di vista computazionale. Nel seguito vengono descritti i due metodi divisivi più comunemente impiegati. Anche in questo caso si tratta di decidere a quale livello di disaggregazione ci si deve fermare.

d

B C E A Dunità

McQuitty

d

B C E A Dunità

Legame medio

Page 11: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Metodi basati sulla distanza tra centroidi Questi metodi richiedono la disponibilità della matrice dei dati X composta da sole variabili quantitative e si articolano nei seguenti punti:

1) al primo passo, quando si tratta di dividere le n unità in 2 gruppi, tra tutte le 2n-1-1 possibili soluzioni viene scelta quella che minimizza la somma delle devianze interne ai 2 gruppi; si tratta quindi di minimizzare la funzione:

SD = �

hig ,,

(gxih – gxi)2

dove gxih è il valore della variabile xh osservata presso l’unità i-esima appartenente al gruppo g, con g = 1, 2; i = 1, 2, .. , ng; h = 1, 2, .. , p;

2) a ogni passo successivo si individua il gruppo che presenta la massima devianza interna e si scinde in due sottogruppi replicando il passo 1.

Questi metodi sono molto onerosi dal punto di vista computazionale e non sono applicabili in caso di variabili non solo quantitative; inoltre hanno il limite di produrre gruppi tendenzialmente di uguale numerosità. Metodi basati sui punti nodali Rispetto ai metodi basati sulla distanza tra centroidi, quelli basati sui punti nodali risultano molto meno onerosi dal punto di vista computazionale e possono essere utilizzati a partire dalla matrice delle distanze; il loro utilizzo è dunque esteso a matrici dei dati con variabili di qualsiasi tipologia. Il metodo consiste nell’individuare, al primo passo, le due unità più distanti tra loro, che vengono identificate come nodi; tutte le altre unità vengono assegnate ai due nodi sulla base della distanza minima. Successivamente si ripete l’operazione sui due gruppi appena costituiti e così via fino all’ottenimento di n gruppi. Esempio 5.2.5 (riprendere la matrice ottenuta con l’esercizio 3.x)

Page 12: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

5.1.3 I metodi non gerarchici Gli algoritmi di tipo non gerarchico mirano a classificare le n unità statistiche in un numero prefissato di gruppi, senza effettuare agglomerazioni o divisioni successive. Richiedono quindi che il numero dei gruppi sia specificato a priori dal ricercatore, mentre nei metodi gerarchici la scelta ottimale del numero dei gruppi può essere fatta a posteriori sulla base del dendrogramma e di alcuni indicatori. Questi metodi necessitano di una matrice dei dati X costituita da sole variabili quantitative. Si tratta ancora di metodi iterativi, nel senso che, effettuato un raggruppamento provvisorio, a ogni iterazione successiva viene modificato per ottimizzare una funzione obiettivo; il sistema si ferma quando non sono possibili ulteriori miglioramenti. L’algoritmo più utilizzato nell’ambito dei metodi non gerarchici è quello denominato k-means. Il primo passo di tale metodo consiste nello specificare k punti iniziali, o seed, nello spazio p-dimensionale: un punto iniziale per ciascun gruppo da formare. Ognuna delle n unità viene quindi provvisoriamente assegnata a uno di tali gruppi sulla base del seed più vicino. Vengono quindi calcolati i baricentri o centroidi dei gruppi provvisoriamente costituiti, cioè i valori medi delle p variabili nei gruppi, e si procede a riallocare tutte le unità al loro nuovo gruppo di appartenenza sulla base del centroide più vicino. Si procede in modo iterativo a ricalcolare i centroidi e riallocare

A B C D EA 0 0,26 0,68 0,45 0,44B 0 0,11 0,39 0,68C 0 0,52 0,19D 0 0,82E 0

I punti nodali sono A e C;

A D C B EA 0 0,45 C 0 0,11 0,19D 0 B 0 0,68

E 0

Divido A e D I punti nodali sono B ed E

A D E B CB 0 0,11C 0

Divido B e C

Stato iniziale: gruppo 1 composto da A,B,C,D,EIterazione 1 gruppo 1 composto da A,D

gruppo 2 composto da B,C,EIterazione 2 gruppo 1 composto da A

gruppo 2 composto da Dgruppo 3 composto da Egruppo 4 composto da B,C

Iterazione 3 gruppo 1 composto da Agruppo 2 composto da Dgruppo 3 composto da Egruppo 4 composto da Bgruppo 5 composto da C

Page 13: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

le unità fino a che non si raggiunge una configurazione stabile, ossia fino a che tutte le unità vengono riassegnate allo stesso gruppo del passo precedente. L’utilizzo di questi algoritmi richiede una preventiva analisi della matrice dei dati al fine di valutare l’opportunità di eventuali standardizzazioni delle variabili, poiché variabili con varianza maggiore tendono ad avere maggiore importanza nella formazione dei gruppi rispetto a variabili con varianza minore. In pratica, come già visto nel Capitolo 3, la standardizzazione delle variabili si rende necessaria ogni qual volta si ha a che fare con variabili espresse in unità di misura diverse. Si pensi, per esempio, al caso in cui si dispone di 2 variabili come il numero di figli e il reddito annuo espresso in euro; in assenza di standardizzazione, il raggruppamento verrebbe effettuato in modo pressoché esclusivo sulla base della variabile reddito. Ma in alcuni casi si ritiene opportuno standardizzare le variabili di partenza anche quando sono espresse nella stessa unità di misura; è il caso, per esempio, della variabile reddito annuo a prezzi correnti in periodi diversi, o di valutazioni, espresse con un punteggio da uno a dieci per diverse caratteristiche di un prodotto o servizio. Nel primo caso la perdita di potere di acquisto della moneta assegnerebbe una importanza maggiore alla variabile reddito relativa agli anni più recenti, mentre nel secondo avrebbero importanza maggiore quelle caratteristiche per cui è più marcata la tendenza degli intervistati a sbilanciarsi con giudizi molto positivi o molto negativi rispetto alle altre. Figura 5.2.3 Applicazione del metodo k-means nel caso di due dimensioni (p = 2) e due gruppi.

Dati di partenza

0

7

0 10

Page 14: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Si inseriscono i due seed e si assegnano le unità

0

7

0 10

Si calcolano i centroidi dei gruppi provvisori e si riassegnano le unità

0

7

0 10

Si ricalcolano i centroidi e si riassegnano le unità; non essendoci modif iche nel raggruppamento il processo termina

0

7

0 10

Page 15: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

In alternativa al criterio del centroide più vicino, per la riallocazione delle unità tra i gruppi si può ricorrere alla scomposizione della devianza totale in devianza entro i gruppi e devianza tra i gruppi e procedere alla minimizzazione della funzione obiettivo, costituita dalla devianza entro i gruppi. Poiché i metodi non gerarchici prevedono l’identificazione a priori dei k punti iniziali, a cui corrisponde una partizione iniziale, la soluzione finale risulterà in qualche modo dipendente non solo dalla preventiva scelta del numero di gruppi da ottenere, ma anche dalla scelta dei punti iniziali. Quest’ultima potrà fondarsi su informazioni a priori che suggeriscono una particolare scelta ragionata o, più frequentemente, su punti casuali. In ogni caso, è buona norma ripetere l’analisi utilizzando diversi punti iniziali e verificare la stabilità della soluzione finale. Questa si rivelerà piuttosto stabile al variare dei punti iniziali quando i gruppi risultano ben definiti e sufficientemente omogenei al loro interno, ovvero quando anche la scelta di k, cioè del numero dei gruppi da ottenere, era corretta. Al contrario, quando la popolazione di riferimento risulta piuttosto omogenea nelle p variabili considerate e non ammette partizioni ben definite, o quando il numero dei gruppi ben definiti nella popolazione non coincide con il numero di gruppi richiesto, la soluzione finale si rivelerà molto instabile, cioè variabile al variare dei k punti iniziali. 5.1.4 La scelta del metodo di raggruppamento e del numero ottimo di gruppi La scelta del metodo da utilizzare per realizzare una analisi di raggruppamento è operazione non semplice, che richiede una buona dose di esperienza. Ribadito che non esiste, in assoluto, un metodo migliore, una prima valutazione dovrà essere fatta sulla base della tipologia dei dati che si hanno a disposizione o che si intendono raccogliere. Se i dati di cui si dispone riguardano variabili qualitative o variabili miste, in parte quantitative e in parte qualitative, tutta una serie di metodi presentati nei paragrafi precedenti risulteranno, come già detto, inapplicabili. In questo caso la scelta può avvenire soltanto nell’ambito dei metodi del legame singolo, del legame completo, di McQuitty, del legame medio o dei metodi gerarchici divisivi basati sui punti nodali. Tutti i predetti metodi consentono di scegliere il numero di gruppi a posteriori, il che rappresenta un indubbio vantaggio. In particolare, il metodo del legame completo trova larga applicazione e può fornire buoni risultati a patto che venga effettuata un’analisi preliminare per identificare ed eliminare i valori anomali, per esempio attraverso l’utilizzo preliminare del metodo del legame singolo. Quando la matrice dei dati X risulta tutta quantitativa la scelta si allarga a un numero molto maggiore di metodi utilizzabili. In questo caso, un’operazione preliminare necessaria consiste nell’analisi dei profili colonna per valutare la necessità di eventuali operazioni di standardizzazione delle variabili, per correggere il problema delle diverse unità di misura; per valutare l’opportunità di trasformazioni di variabili, per tener conto della struttura delle correlazioni tra le variabili da utilizzare1. In via generale si può affermare che i metodi gerarchici risultano maggiormente sensibili alla presenza di valori anomali e, soprattutto, non consentono di modificare una aggregazione effettuata a un passo precedente: una volta che due unità sono state unite in un gruppo, esse resteranno sempre nello stesso gruppo. I metodi non gerarchici non presentano questo problema, consentendo a due unità che sono state unite in un gruppo a un certo passo di trovarsi successivamente in gruppi diversi se ciò migliora il raggruppamento. I metodi non gerarchici richiedono però la preventiva indicazione del numero dei gruppi e la definizione dei punti iniziali. Una strategia di analisi spesso utilizzata consiste nel ricorrere prima a una analisi gerarchica per individuare il numero ottimale dei gruppi e i punti iniziali (definiti come medie di gruppo per i

1 Quando si utilizzano i metodi non gerarchici o i metodi gerarchici che prevedono la disponibilità della matrice dei dati X, due variabili con elevato grado di correlazione esprimono, verosimilmente, due aspetti dello stesso fenomeno latente. In questo caso inserire entrambe le variabili equivale ad assegnare una importanza doppia a tale fenomeno, solo per il fatto che esso è rappresentato, nella matrice dei dati, con due variabili anziché con una soltanto.

Page 16: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

gruppi ottenuti) da assegnare poi in input a una analisi non gerarchica al fine di definire la soluzione finale. Una strategia alternativa può consistere nell’effettuare una preliminare analisi non gerarchica specificando un elevato numero di gruppi al fine di individuare sia eventuali valori anomali (che la procedura riesce a enucleare, almeno quando si specifica un elevato numero di gruppi, in gruppi di una unità), sia i principali gruppi significativi dalle cui medie ricavare i punti iniziali da inserire in input in una nuova analisi non gerarchica. Una strategia ancora diversa può essere necessaria nel caso di data set composti da un grande numero di osservazioni, il che rende particolarmente onerose le analisi gerarchiche. Se si ritiene che l’obiettivo dello studio richieda comunque analisi gerarchiche, queste possono essere fatte precedere da una analisi non gerarchica con il metodo k-means, che risulta molto più efficiente dal punto di vista delle risorse di calcolo, in modo da identificare un elevato numero di gruppi. L’analisi gerarchica può essere poi applicata per raggruppare gerarchicamente i gruppi così ottenuti. Per quanto attiene alla scelta del numero ottimale di gruppi da ottenere, valgono alcune considerazioni di carattere generale. Come si è più volte rilevato, le applicazioni più frequenti dell’analisi dei gruppi nelle analisi di mercato sono rivolte alla segmentazione a posteriori del mercato. In questi casi si è già accennato all’interesse oggettivo di avere a che fare con un numero di gruppi contenuto in modo da evitare di disperdere le risorse, studiando un numero troppo elevato di strategie diverse. La scelta del numero di gruppi non potrà non tenere conto di questa esigenza, ma dovrà contemperarla con la necessità di individuare gruppi dotati di una sufficiente omogeneità interna, altrimenti possono risultare vanificate le stesse strategie di marketing. Dal punto di vista tecnico, la definizione del numero dei gruppi ottimale può essere effettuata, nei metodi gerarchici, esaminando i valori assunti dagli indici di distanza tra i due gruppi che si fondono a ogni passo successivo. In generale, valori di distanza elevati stanno a indicare che in quella fase della procedura stiamo unendo gruppi che sono piuttosto diversi tra loro. Un criterio di scelta può dunque essere fondato sulle differenze nella serie progressiva dei valori di distanza a cui vengono effettuate le aggregazioni, tenendo conto del fatto che quando si registrano differenze elevate si sta verificando una diminuzione rilevante della omogeneità interna dei gruppi che si vanno a formare. Un criterio di scelta è dunque quello di arrestare il processo di aggregazione immediatamente prima di uno di tali “salti” nella sequenza dei valori di distanza riportati nel dendrogramma. Quando si ha a che fare con variabili quantitative il criterio di scelta del numero di gruppi può essere fondato anche sull’indicatore ottenuto rapportando ai diversi passi di aggregazione la devianza tra i gruppi alla devianza totale. Nel passo in cui tale indicatore subisce la riduzione relativa più consistente si stanno unendo gruppi molto eterogenei tra loro, per cui è opportuno fermare il processo al passo precedente. 5.1.5 L’analisi dei gruppi in SAS Le principali procedure per l’analisi dei gruppi in SAS sono le seguenti. PROC CLUSTER Per l’analisi gerarchica con l’uso dei diversi metodi disponibili PROC TREE Per realizzare il dendrogramma PROC FASTCLUS Per l’analisi non gerarchica con l’uso del metodo k-means

Page 17: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

PROC CLUSTER La procedura può prendere in input alternativamente matrici di distanza o matrici di dati; in questo secondo caso calcola automaticamente le distanze euclidee con la possibilità di richiedere la standardizzazione delle variabili a media zero e varianza unitaria. In tutti i casi in cui si dispone di variabili non quantitative o in cui si voglia utilizzare misure di distanza diverse occorre prima calcolare la matrice delle distanze mediante l’utilizzo della PROC DISTANCE e, successivamente, fornire in input alla PROC CLUSTER la matrice così ottenuta. Vi è anche la possibilità di controllare preventivamente i valori anomali ed escluderli dall’analisi; tale opzione risulta particolarmente utile quando si utilizzano metodi molto sensibili alla presenza di valori anomali, come il metodo del legame completo. Illustriamo ora la sintassi della procedura iniziando dalle opzioni della PROC CLUSTER PROC CLUSTER DATA=nome(TYPE=DISTANCE) METHOD= SIN legame singolo COM legame completo AVE legame medio CEN centroide WAR Ward MCQ McQuitty DEN Stime non parametriche della densità di probabilità STD Standardizza le variabili a media zero e varianza unitaria (solo con matrice dei dati) TRIM=p Omette dall’analisi le osservazioni con bassa densità di probabilità stimata p ammette valori da zero a 100; se p=10 la procedura omette il 10% delle

osservazioni. OUTTREE=nome Produce un sds di output che servirà alla PROC TREE per realizzare il dendrogramma. NONORM Esclude la normalizzazione a media unitaria degli indici di distanza I principali statement che si possono usare sono i seguenti. BY variabile Realizza tante analisi dei gruppi per ciascuna modalità assunta dalla variabile di BY. Richiede che il sds di input sia stato preventivamente ordinato sulla base della

variabile di BY. ID variabile Identifica l’osservazione con il nome contenuto nella variabile di ID sia nell’output

della procedura sia nel sds di OUTTREE; in mancanza, identifica le osservazioni con un numero progressivo con cui sono presenti nella matrice dei dati o nella matrice delle distanze.

VAR variabili Specifica l’elenco delle variabili numeriche da utilizzare per il calcolo della matrice delle distanze; in mancanza utilizza tutte le variabili numeriche del sds di input. PROC TREE La procedura prende in input il sds creato con l’opzione OUTTREE della PROC CLUSTER e realizza il dendrogramma. La procedura può anche essere utilizzata per creare un sds di output contenente le osservazioni di partenza con l’indicazione del gruppo di appartenenza a un determinato passo dell’analisi. La sintassi fondamentale è la seguente. PROC TREE DATA=nome È il sds creato dall’opzione OUTTREE della PROC CLUSTER

OUT=nome Crea un sds con le osservazioni assegnate al gruppo di appartenenza

NCL=n Specifica il numero di gruppi desiderato nel sds di output

Page 18: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Si può usare lo statement ID variabile per dare alle osservazioni il nome della variabile di ID. Esempio 5.2.6 Riprendere la matrice ottenuta nell’esempio 3.x e realizzare una analisi dei gruppi con il metodo del legame medio con il relativo dendrogramma Il programma che consente di ottenere l’analisi dei gruppi è il seguente: * Esempio procedura cluster; data consu; input nome $ v1 v2 v3 v4 v5 ; cards; unitàA 0 . . . . unitàB 0.26 0 . . . unitàC 0.68 0.11 0 . . unitàD 0.45 0.39 0.52 0 . unitàE 0.31 0.68 0.19 0.82 0 ; proc cluster data=consu(type=distance) method=ave outtree=gra nonorm; id nome; proc tree data=gra; id nome; run; L’output della procedura è il seguente: ��������������������������������������� ����

�������������������������������������������������������

����������������������������������������������

���������������������������������������������

������������������������������������������ ����

�����������������������������������������������������������

������������������������� !������ �������"���#$%%�

�������������������&����� ������� �������"���#$&%�

�������������������"������������� �������&��#$�'()�

�������������������%����&�������"�������'��#$')&"

Page 19: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Distanza media tra cluster

0. 0

0. 1

0. 2

0. 3

0. 4

0. 5

0. 6

nome

uni t àA uni t àE uni t àB uni t àC uni t àD

PROC FASTCLUS La procedura FASTCLUS realizza analisi non gerarchiche mediante l’uso del metodo k-means. Prima di utilizzare la procedura FASTCLUS si raccomanda di effettuare analisi sui profili colonna della matrice dei dati al fine di valutare eventuali standardizzazioni delle variabili mediante l’uso della PROC STANDARD. La sintassi fondamentale è la seguente. PROC FASTCLUS DATA=nome Indica il sds di input (la matrice dei dati). MAXCLUSTERS=n Indica il numero di gruppi che si vuole creare. MEAN=nome Crea un sds di output che contiene le media di gruppo e

altre statistiche descrittive. OUT=nome Crea un sds di output con le variabili originali oltre

all’indicazione del gruppo di appartenenza e della distanza dal centroide.

SEED=nome Indica il sds di input che contiene le coordinate dei k punti iniziali; il sds deve contenere le stesse variabili del sds di input e un numero di osservazioni pari al numero di gruppi da ottenere indicato con l’opzione MAXCLUSTERS=.

LEAST=p La procedura minimizza la p-esima radice della media delle p-esime potenze delle differenze assolute tra le coordinate del punto e del baricentro. I principali statement che si possono usare sono i seguenti. BY variabile Realizza tante analisi dei gruppi per ciascuna modalità assunta dalle variabili di BY. Richiede che il sds di input sia stato preventivamente ordinato sulla base della

variabile di BY.

Page 20: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

WEIGHT variabile Richiede che nel calcolo dei baricentri dei gruppi vengano calcolate le medie aritmetiche ponderate delle p variabili utilizzando la variabile di WEIGHT.

VAR variabili Specifica l’elenco delle variabili numeriche da utilizzare per il calcolo della matrice delle distanze; in mancanza, utilizza tutte le variabili numeriche del sds di input. Esempio 5.2.7 Applicazione dell’analisi dei gruppi non gerarchica ai dati della Figura 5.2.3 * Esempio procedura fastclus; data dati; input nome $ v1 v2; cards; A 1 5 B 2 6 C 5 3 D 6 5 E 8 2 F 3 4 G 9.5 2.5 ; data puntiin; input v1 v2; cards; 1 7 4 4 ; proc fastclus data=dati seed=puntiin maxclusters=2 out=risu least=2 outseed=puntifin; proc print data=risu; proc print data=puntifin; run; �������������������������������� ���� �

������ ���������*�����������*#���+������*"���+����*%#����,����*#$###%�������*"�

����������������������� �������-�����

�����������������������������,%��������,"�

���������������...........................................�

�����������������%�����%$#########����/$#########�

�����������������"������$#########�����$#########�

��������������������-���������������������-�����*����$"�")�%�

�����������������������������������������-�����

�������������������������������0��������������,��

�����������������������������������������������

���������������1����-��������������������%������"�

���������������..............................................�

�������������������%���"$%/(����#$)#)(���#$(""2�

�������������������"���%$&''����#$�%%&���#$�(#'�

�������������������&���%$"&')������#������#�

����������1����������������,�����-��3�����4����$�

�������������������������0�������������4������*��%$"&')�

����������������������

Page 21: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

��������������������

������������������������-������������������������

�������������,��-���������������������������������5������������-��������

�������������-���������� �����6�����,�-����������������,��������������������������

����

....................................................................................................�

%��������&����%$####�������%$�%�"�����������"����������'$�'/"�

"�������������%$/#%/�������"$�''(�����������%����������'$�'/"�

������������������� ��������7���������,����0����

���������8����0����� �����������9��7��� ��������������� :;<%�� :=�

���������...................................................................�

���������,%�������&$%�%'#����%$)2��(���#$/)#�#�����&$%/&)(��

���������,"�������%$�2�#�����%$%(2()���#$�')#2%����#$2&2'#(�

���������>8����������"$�')//����%$�)"#"���#$/#�22"����"$&22�/%�

������������������� �������������������%%$(��

������������������������������0�����������������*����$�

�����������������������������������--�-�������$�

������������?1>��@�1���,���������������������������,���������,����0�������������$�

�������������������������������������

�����������������������������,%��������,"�

���������������...........................................�

�����������������%�����"$#########����'$#########�

�����������������"�����/$%"'######����&$%"'######�

���������������������������������� ���� �

������� ���������*�����������*#���+������*"���+����*%#����,����*#$###%�������*"�

��������������������,��-����������������������

�����������������������������,%��������,"�

���������������...........................................�

�����������������%�����%$#########����%$#########�

�����������������"�����"$#%'')��&/����%$&%�(//2"#�

��������������>�����������,%���,"����� ������1 ������

���������������%�������%$#��'$#����%����%$#####�

���������������"���!���"$#��)$#����%����%$#####�

���������������&�������'$#��&$#����"����"$%"2)/�

�����������������������)$#��'$#����"����"$%2))%�

���������������'�������2$#��"$#����"����%$�"'""�

���������������)�������&$#���$#����%����%$�%�"%�

���������������/���A���($'��"$'����"����"$�''2)�

>�����B��1�B����� �����B���:B��B�� ��B��B���1� B��B����B���BA�CB����,%����,"�

�%���%$"&')&����%�����&����%$#####���%$�%�"%����"���'$�'/""��"$###��'$###�

�"���%$"&')&����"����������%$/#%/%���"$�''2)����%���'$�'/""��/$%"'��&$%"'

Page 22: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

5.2 Analisi dei fattori Nelle ricerche di mercato, specialmente in quelle basate su indagini presso i consumatori volte ad acquisirne le opinioni relativamente a diverse caratteristiche di un prodotto o servizio, si rilevano spesso decine di variabili: variabili concernenti argomenti diversi ma tra loro collegati e concettualmente sovrapposti; variabili che talvolta forniscono informazioni in parte già contenute in altre variabili e in parte, invece, costituite da un contributo informativo originale. Com’è facilmente intuibile, l’analisi congiunta di variabili così numerose e con tali caratteristiche risulterà difficile e complessa.

• La matrice di correlazione presenterà valori quasi tutti significativamente diversi da zero e il suo esame richiederà l’analisi di p(p-1)/2 elementi, che diventeranno p(p-1)(p-2)/2 quando si analizzano i coefficienti di correlazione parziale al netto del contributo di una terza variabile, e p(p-1)(p-2) .. (p-k+1)/(k+1) quando si analizzano i coefficienti di correlazione parziali tra due variabili al netto del contributo di k altre variabili.

• Le variabili osservate conterranno ridondanze che confondono o rendono poco significativi i risultati di altre analisi statistiche. Per esempio, inserire due o più variabili osservate come variabili indipendenti in un modello di regressione multipla porterà ad avere problemi di col linearità, con conseguente perdita di significatività delle stime. Inoltre, spesso si pone un problema di mancanza di gradi di libertà, poiché le unità statistiche potrebbero non essere sufficienti a stimare un modello con il numero desiderato di variabili esplicative.

• Se i fenomeni oggetto di studio sono astratti, difficilmente rilevabili direttamente a causa della difficoltà per gli intervistati di quantificare le risposte, si dovranno acquisire informazioni relative a variabili in qualche modo collegate al fenomeno astratto ma più facilmente rilevabili; si presenta quindi la necessità di desumere o estrarre il fenomeno astratto oggetto di studio dall’insieme di variabili rilevate.

In questi casi, molto frequenti nelle analisi empiriche, l’analisi dei fattori può risultare di notevole ausilio. L’analisi dei fattori è una tecnica statistica multivariata che si propone di individuare le dimensioni fondamentali di un fenomeno descritto da un insieme osservato di p variabili quantitative. La tecnica consente di verificare in quale misura ciascuna delle p variabili osservate costituisce una ripetizione del contributo informativo fornito dalle rimanenti p-1 variabili, e quindi di verificare la possibilità di raggiungere la stessa efficacia descrittiva con un numero q<p di variabili non osservate, ma calcolate a partire dalle p variabili osservate, dette fattori. Come vedremo nel seguito, i fattori ottenuti saranno, per costruzione, ortogonali tra loro, cioè incorrelati. Si riduce quindi la complessità del fenomeno oggetto di studio nella misura in cui si riesce a rappresentarlo in un numero ridotto di fattori; inoltre, a differenza delle variabili osservate, ciascun fattore conterrà un contributo informativo non sovrapposto e del tutto indipendente da quello fornito da altri fattori. Va dapprima fatto presente che non sempre la struttura dei dati osservati consente di essere rappresentata con un numero di fattori ridotto e scelto dal ricercatore; l’analisi non può quindi essere ridotta all’utilizzo automatico dei numerosi moduli per l’analisi dei fattori presenti nei più diffusi package statistici, ma necessita sempre di un controllo e una guida da parte del ricercatore, a cui è richiesta la conoscenza dei principali aspetti teorici di base. Va inoltre precisato che l’analisi dei fattori può essere applicata solo in presenza di variabili quantitative, il che costituisce un limite oggettivo di utilizzo nelle applicazioni di analisi di mercato. 5.2.1 Il modello di analisi fattoriale Data la matrice dei dati Xnp, il primo passo dell’analisi è la sua trasformazione in una matrice Znp che contiene le p variabili di partenza standardizzate a media zero e varianza unitaria, il cui generico elemento zij è il valore della variabile standardizzata zj osservato presso l’unità i.

Page 23: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

La standardizzazione delle variabili osservate si rende necessaria in quanto le loro differenti unità di misura si rifletterebbero sulla definizione dei fattori: variabili con varianza maggiore assumerebbero una maggiore importanza e viceversa. Standardizzate le variabili originarie, il modello di analisi dei fattori può essere espresso nella seguente forma: zj = tj1f1 + tj2f2 + .. + tjqfq + ciwj , con j = 1,2,.. , p e q<p dove i deponenti relativi alle unità statistiche sono stati soppressi per semplificare l’esposizione e:

• fk (con k = 1,2, … , q) è il k-esimo fattore comune a tutte le variabili, incorrelato con gli altri fattori e con il termine wj;

• tjk è il coefficiente che lega il fattore comune fk alla generica variabile zj (factor loading); • wj è il fattore specifico della variabile zj; • cj è il coefficiente che lega il fattore specifico alla variabile zj.

Utilizzando la notazione matriciale, il modello di analisi dei fattori può essere espresso nel seguente modo: Z = FT' + WC, dove

• Znp è la matrice delle variabili osservate standardizzate; • Fnq è la matrice le cui colonne contengono i q fattori comuni; ogni colonna di F ha media

zero e varianza unitaria; • Tpq è la matrice dei coefficienti di correlazione tra le p variabili osservate e i q fattori

comuni; • Wnp è la matrice che contiene i p fattori specifici, uno per ciascuna variabile osservata; • Cpp è la matrice diagonale che contiene i coefficienti dei fattori specifici.

I metodi di analisi fattoriale concernono la determinazione dei fattori comuni, mentre i fattori specifici possono essere ricavati per differenza: WC = Z – FT'. La soluzione fattoriale è costituita dunque essenzialmente dalla matrice T delle correlazioni tra le p variabili osservate e i q fattori comuni, detta anche matrice dei pesi fattoriali (factor loadings). Tale matrice indica quali variabili risultano principalmente correlate con i diversi fattori comuni, e individua inoltre l’intensità e la direzione di tali relazioni. Poiché variabili e fattori sono standardizzati e tra loro incorrelati, il quadrato dei factor loadings esprime la quota di varianza di ciascuna variabile spiegata da ciascun fattore. Se si sommano per riga i quadrati dei factor loadings si ottengono le comunalità, ossia la quota di varianza delle singole variabili spiegata in complesso dai fattori comuni. Se invece si sommano per colonna i quadrati dei factor loadings si ottengono gli autovalori, ossia l’ammontare di varianza complessiva della matrice Z estratta da ciascun fattore.

Page 24: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Fig. 5.3.1 Matrice dei pesi fattoriali con p variabili e q fattori comuni ortogonali.

Variabili osservate Fattori comuni f1 … fk … fq

Comunalità

z1 t11 .... t1k … t1q h12 = �k kt 2

1

........

zj tj1 .... tjk … tjq hj2 = �k jkt 2

.......

zp tp1 .... tpk … tpq hp2 = �k pkt 2

Autovalori �k

�1 .... �k … �q

� j jt 21

� j jkt 2 � j jqt 2 �k�k = � j

hj2

L’analisi dei fattori si svolge attraverso le seguenti fasi:

• calcolo della matrice di correlazione tra le variabili della matrice Z, ovvero sulle variabili osservate (si veda il Capitolo 3);

• estrazione di un certo numero di fattori comuni iniziali; il metodo usato più frequentemente è quello delle componenti principali;

• rotazione dei fattori iniziali per ottenere una soluzione finale che consenta una più agevole interpretazione dei fattori comuni;

• interpretazione dei fattori. 5.2.2 La scomposizione in componenti principali L’analisi delle componenti principali è un metodo di trasformazione matematica di un insieme di p variabili osservate in un nuovo insieme di p variabili calcolate, dette appunto componenti principali, con le seguenti caratteristiche:

• le componenti principali sono ortogonali tra loro; • le componenti principali forniscono un contributo informativo decrescente in base all’ordine

di estrazione, nel senso che la prima componente principale fornisce il massimo del contributo informativo dell’insieme delle p variabili osservate, la seconda componente il massimo dell’informazione residua, cioè non contenuta nella prima componente, e cosi via;

• le componenti principali nel complesso forniscono lo stesso contributo informativo delle variabili osservate.

Data la matrice Znp delle variabili osservate standardizzate e data la corrispondente matrice di varianze e covarianze Spp, la prima componente principale è una combinazione lineare delle variabili zj del tipo seguente: y1 = v11z1 + v12z2 + … + v1pzp o, in termini matriciali:

Page 25: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

y1 = Zv1 dove:

• y1n1 è il vettore dei valori della prima componente principale; • Znp è la matrice delle variabili osservate standardizzate; • v1p1 è il vettore dei coefficienti da applicare alle variabili osservate per ottenere la prima

componente principale. Essendo Z nota, si tratta di calcolare v1 in modo che: var(y1) = max sotto il vincolo: v1'v1 = 1. Senza tale vincolo sarebbe infatti possibile aumentare a piacere le dimensioni dei coefficienti del vettore v1 e ottenere un vettore y1 con varianza infinitamente grande. Si tratta dunque di risolvere un problema di massimizzazione vincolata, la cui soluzione si può trovare con il metodo dei moltiplicatori di Lagrange. Il vettore v1 che rende massima la varianza della prima componente è il primo autovettore2 della matrice delle covarianze S. Inoltre la varianza della prima componente è uguale al primo autovalore di S, indicato con λ1. Essendo le p variabili zj standardizzate, la somma delle loro varianze, cioè la variabilità complessiva del set di variabili osservate, è pari a p; il rapporto λ1/p fornisce quindi la quota della varianza complessiva spiegata dalla prima componente. Successivamente può essere estratta una seconda componente principale: y2 = Zv2 In questo caso si tratta di calcolare il vettore v2 in modo che: Var (y2) = max, sotto i vincoli: v2'v2 = 1; cov(y1 y2)= 0. Oltre al medesimo vincolo della prima componente, le seconda dovrà essere anche incorrelata con la prima. Utilizzando anche in questo caso il metodo dei moltiplicatori di Lagrange, si ottiene che v2 è il secondo autovettore di S, mentre il corrispondente autovalore, λ2, è la varianza della seconda componente. λ2/p è pertanto la quota di varianza totale estratta dalla seconda componente. Il procedimento di estrazione delle componenti principali continua finché il numero delle componenti estratte arriva a eguagliare il numero delle variabili osservate (q=p). Analogamente al procedimento seguito per le prime due componenti, i successivi vettori vk che rendono massima la varianza delle successive componenti, sotto i vincoli di ortogonalità con le

2 Per una sintetica esposizione dei concetti di algebra matriciale si veda l’Appendice A.

Page 26: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

precedenti componenti già estratte, sono i successivi autovettori della matrice delle covarianze S, mentre i relativi autovalori, λk, rappresentano le varianze delle componenti principali yk. Al termine del processo di estrazione delle componenti principali avremo una nuova matrice Ynp che rispetta le proprietà richieste, calcolata nel modo seguente: Y = Z V, dove:

• Znp è la matrice delle variabili osservate standardizzate; • Vpp è la matrice degli autovettori della matrice delle covarianze di Z.

Ogni colonna della matrice Y è una componente principale yk, con media zero e varianza λk. Inoltre, essendo per definizione le componenti principali incorrelate tra loro, la matrice delle covarianze calcolate sulla Y, che chiamiamo L, sarà la matrice diagonale: λ1 0 0 …. 0 0 λ2 0 …. 0 L = ……… 0 0 0 λp Richiamiamo le seguenti proprietà degli autovalori. Σk=1,p λk = p La somma di tutti gli autovalori di una matrice è pari a p. λ1 � λ2 � λ3 � … � λp I progressivi autovalori risultano non crescenti rispetto ai precedenti. Ricordiamo che la quota di informazione complessivamente contenuta nella matrice delle variabili osservate estratta dalla k-esima componente è pari a λk/p; concludiamo quindi che:

• le progressive componenti estratte presentano un contenuto informativo sempre decrescente, o almeno non crescente, rispetto al contenuto informativo delle precedenti;

• l’insieme delle componenti estratte, contengono complessivamente il 100% della variabilità

delle variabili presenti nella matrice dei dati osservati. Si può dunque affermare che le prime q componenti principali (con q<p) sono le più importanti quanto a capacità di rappresentare il fenomeno osservato, mentre le ultime p-q componenti sono le meno importanti e pertanto trascurabili. Dal calcolo delle componenti principali il problema ora si sposta sulla decisione concernente il numero q di componenti da considerare essenziali ai fini della descrizione del fenomeno, ovvero, che è la stessa cosa, su quante componenti possono essere trascurate senza perdita rilevante di informazione. La scelta del numero delle componenti principali da mantenere, in modo da rappresentare sinteticamente l’informazione contenuta nella matrice dei dati osservati X, non è di facile soluzione. In linea generale si può dire che le successive componenti principali vanno mantenute fino a che la quota di varianza da esse complessivamente spiegata non risulti “sufficientemente grande”. Tuttavia, non esistono criteri guida universalmente considerati validi per decidere dove porre il limite. Alcuni criteri pratici che possono supportare il ricercatore nella decisione sono i seguenti.

Page 27: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Criterio degli autovalori Si considerano le componenti alle quali è associato un autovalore della matrice di covarianza maggiore o al più uguale a 1, cioè uguale alla media aritmetica di tutti gli autovalori. Criterio della percentuale di varianza spiegata Si mantengono le componenti principali fino a una determinata quota di varianza spiegata. In genere una percentuale del 75% è considerata accettabile anche se spesso si tollerano anche percentuali minori. Criterio della rappresentazione grafica degli autovalori (scree test) Si rappresentano in un sistema cartesiano ortogonale gli autovalori sull’asse verticale e l’ordine di estrazione degli stessi sull’asse orizzontale. Si escludono le componenti i cui valori appartengono alla spezzata che inizia ad avere un andamento quasi parallelo all’asse orizzontale Esempio 5.3.1 La scelta del numero delle componenti principali da considerare Si consideri che da una matrice con 18 variabili osservate vengano ottenuti i seguenti risultati

k Autovalori �k

Quota �k/p

quota cumulata

� jλ j

1 4,00 0,222 0,222 2 3,50 0,194 0,417 3 3,10 0,172 0,589 4 2,00 0,111 0,700 5 1,70 0,094 0,794 6 1,40 0,078 0,872 7 0,90 0,050 0,922 8 0,70 0,039 0,961 9 0,20 0,011 0,972 10 0,10 0,006 0,978 11 0,10 0,006 0,983 12 0,10 0,006 0,989 13 0,05 0,003 0,992 14 0,05 0,003 0,994 15 0,05 0,003 0,997 16 0,03 0,002 0,999 17 0,01 0,001 0,999 18 0,01 0,001 1,000 Totale 18,00 1.000

Grafico degli autovalori

0,00

0,501,00

1,502,00

2,503,00

3,504,00

4,50

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18

criterio degli autovalori

criterio scree test

Page 28: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Il criterio degli autovalori suggerisce di considerare 6 componenti, mentre il criterio scree test consiglia di mantenere le componenti fino alla nona. Se invece ci si accontenta di spiegare almeno il 75 per cento della variabilità complessiva dei dati originari si possono tenere 5 componenti. Una volta ridotte le colonne della matrice Y, procedendo alla standardizzazione delle variabili, dividendo cioè ciascuna componente yk per la radice quadrata della sua varianza λk, si ottengono q fattori che costituiscono una soluzione fattoriale: F = YL-1/2 da cui si può ricavare la matrice delle correlazioni tra le p variabili osservate standardizzate zj e i q fattori fk: T = 1/n Z'F = 1/n Z'YL-1/2 = 1/n Z'ZVL-1/2 = SVL-1/2 dove il generico elemento di Tpq, tjk indica il coefficiente di correlazione tra la variabile j e il fattore k. Il metodo delle componenti principali fornisce dunque una soluzione fattoriale per il modello Z = FT' secondo il quale il contenuto informativo delle p variabili osservate viene descritto solo attraverso un certo numero q di fattori comuni. Se invece si ipotizza che la varianza delle p variabili osservate standardizzate zj non possa essere spiegata soltanto dai fattori comuni a tutte le variabili oggetto di analisi, ma anche da fattori specifici alle singole variabili, occorre procedere in modo diverso. In breve, si tratta di sostituire i valori pari a 1 che si trovano sulla diagonale principale di S con le quote di varianza delle variabili zj spiegate dai p fattori comuni (comunalità). Essendo queste incognite, vanno stimate, per esempio attraverso gli indici di determinazione R2 relativi alle regressioni multiple calcolate assumendo come variabili dipendenti le zj e come variabili esplicative tutte le restanti variabili3. La matrice S così ottenuta avrà solo g autovalori maggiori di zero (g < p), a ciascuno dei quali sarà associato un autovettore che trasforma la matrice delle osservazioni Z in una variabile yk (k=1,2, .. g) in modo del tutto simile a quanto visto per la scomposizione in componenti principali. 5.2.3 La rotazione dei fattori Come si è visto, lo scopo dell’ analisi dei fattori è quello di individuare le (poche) dimensioni fondamentali di un certo fenomeno osservato mediante un elevato numero di variabili quantitative. L’ identificazione dei fattori ottenuti risulterà tanto più agevole quanto più ciascuno di essi sia fortemente correlato a un certo numero di variabili osservate, che descrivono caratteri affini o che, comunque, identificano aspetti diversi di un unico carattere non osservabile direttamente, e debolmente correlato con tutte le altre variabili.

3 Una alternativa a R2 può essere il valore assoluto del coefficiente di correlazione semplice più elevato tra la variabile zj

e tutte le altre.

Page 29: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Spesso però i fattori iniziali estratti con il metodo delle componenti principali, o anche con altri metodi, non presentano tale caratteristica, risultando spesso abbastanza correlati con un elevato numero di variabili osservate. Ciò rende arduo assegnare un chiaro significato ai fattori. Per ottenere una soluzione di più agevole interpretazione, si può ricorrere alla cosiddetta “ rotazione” della soluzione fattoriale iniziale. La rotazione avviene sulla matrice Tpq delle correlazioni tra le p variabili osservate e i q fattori, ovvero sulla matrice dei pesi fattoriali, che deve essere trasformata allo scopo di ottenere fattori, in genere ancora tra loro ortogonali, ma tali da presentare elevate correlazioni con alcune variabili e modeste correlazioni con altre. Dal punto di vista geometrico, i fattori ottenuti nella soluzione iniziale costituiscono un iperspazio a q dimensioni nel quale ciascuna delle p variabili osservate zj corrisponde a un punto. Nello spazio a q dimensioni, le coordinate delle variabili osservate sono date dai rispettivi coefficienti di correlazione con i q fattori. L’ obiettivo della rotazione è quello di individuare un nuovo sistema di assi in cui ciascun punto, raffigurante una delle p variabili osservate, si disponga il più vicino possibile a uno dei nuovi assi. Una esemplificazione grafica della rotazione nel caso di due fattori e cinque variabili osservate è riportata nella Figura 5.3.3, dove le coordinate dei punti zj sull’ asse orizzontale sono le correlazioni tra le variabili zj e il primo fattore, mentre quelle sull’ asse verticale sono le correlazioni con il secondo fattore. Due sono le possibili tipologie di rotazione: la rotazione ortogonale, che mantiene i fattori reciprocamente incorrelati e corrisponde graficamente al mantenimento di un angolo di 90 gradi tra i fattori anche dopo la rotazione; la rotazione obliqua che consente ai fattori di avere un certo grado di correlazione dopo la rotazione e corrisponde graficamente a un angolo tra i nuovi assi che può assumere valori maggiori o minori di 90 gradi. Figura 5.3.2 Confronto tra fattori non ruotati e fattori ruotati.

Page 30: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Rotazione ortogonale

-1,00

-0,80

-0,60

-0,40

-0,20

0,00

0,20

0,40

0,60

0,80

1,00

-1,00 -0,80 -0,60 -0,40 -0,20 0,00 0,20 0,40 0,60 0,80 1,00

V1

V2

V3V4

V5

Page 31: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

I metodi di rotazione ortogonale sono più utilizzati in quanto consentono un più agevole impiego dei fattori in successive elaborazioni e infatti la loro implementazione è più diffusa nei principali package di analisi statistica. Per contro, i metodi di rotazione obliqua consentono un migliore adattamento dei fattori alle variabili osservate e una migliore interpretazione dei fattori. Può essere pertanto preferibile, specialmente quando non si hanno ragioni per ipotizzare la completa indipendenza reciproca tra gli stessi. I principali metodi di rotazione ortogonale sono i seguenti. Varimax. L’ obiettivo è semplificare le colonne della matrice dei pesi fattoriali, massimizzando la varianza di questi ultimi: gli assi vengono ruotati in modo da ottenere pesi fattoriali o più vicini possibile ad 1 (in valore assoluto) o molto vicini a 0, rendendo agevole l’ abbinamento delle variabili a un dato fattore. È il metodo di rotazione più diffuso in quanto consente di ottenere una più netta separazione tra i fattori. Quartimax. L’ obiettivo è quello di semplificare le righe della matrice dei pesi fattoriali, in modo tale che ogni variabile sia altamente correlata a un solo fattore e poco con gli altri. Poiché si opera sulle righe della matrice, molte variabili possono però risultare altamente correlate allo stesso fattore. Il rischio è dunque quello di ottenere un fattore principale notevolmente correlato con la maggior parte delle variabili e gli altri fattori, diciamo residuali, correlati con poche variabili. Nelle analisi empiriche, una volta determinata la soluzione fattoriale, spesso è necessario calcolare i valori dei punteggi fattoriali, cioè i valori della matrice F. Naturalmente, se si è operata una

Rotazione obliqua

-1,00

-0,80

-0,60

-0,40

-0,20

0,00

0,20

0,40

0,60

0,80

1,00

-1,00 -0,80 -0,60 -0,40 -0,20 0,00 0,20 0,40 0,60 0,80 1,00

V1

V2

V3V4

V5

Page 32: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

rotazione, si tratta di calcolare gli elementi della matrice dei punteggi fattoriali dopo la rotazione, che denominiamo F0. Come si è visto, la rotazione opera sulla matrice dei pesi fattoriali T, per cui il risultato della rotazione è dato dalla matrice T ruotata, indicata con T0. La matrice dei fattori ruotati F0 si ottiene a partire dalla espressione seguente: T0 = 1/n Z'F0 = 1/n Z'ZV0L-1/2 = SA0, dove A0 = V0L-1/2 Dalla relazione precedente si ricava: A0 = S-1T0, e quindi la matrice dei punteggi fattoriali: F0 = ZA0 = ZS-1T0. 5.2.4 L’interpretazione dei fattori Ottenuta la soluzione fattoriale, si pone il problema dell’ interpretazione dei risultati. L’ analisi fattoriale ci mette a disposizione un ridotto numero di nuove variabili (fattori) che contengono gran parte del contenuto informativo della matrice dei dati osservati, ma, mentre le variabili osservate hanno tutte un nome e un più o meno preciso significato, per i fattori non è cosi, sono costruzioni astratte. Occorre dunque dare un nome e un significato a queste nuove variabili e ciò può essere fatto sulla base della matrice dei pesi fattoriali, tenendo conto sia del loro valore assoluto che del loro segno. In qualche caso questo compito risulterà agevole; in altri casi, invece, il significato della dimensione comune risulterà sfuggente. È importante che il ricercatore che si cimenta nella interpretazione dei fattori conosca bene l’ origine e le specifiche delle variabili osservate. Per esempio, se la matrice dei dati osservati proviene da un’ indagine diretta tramite questionario, il ricercatore deve conoscere non solo il nome delle variabili della matrice X, ma anche le domande del questionario da cui provengono. 5.2.5 L’analisi dei fattori in SAS Le principali procedure SAS per l’ analisi dei fattori sono le seguenti. PROC PRINCOMP Per l’ analisi delle componenti principali PROC FACTOR Per l’ analisi dei fattori PROC PRINCOMP La sintassi fondamentale della procedura è la seguente. PROC PRINCOMP DATA=nome Il sds di input che contiene la matrice X.

OUT=nome Un sds di output dove memorizza le componenti principali. N=numero Indica il numero delle componenti da estrarre. STD Standardizza i punteggi delle componenti a varianza unitaria.

Page 33: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Gli statement principali sono i seguenti. VAR elenco Elenco delle variabili numeriche contenute nel sds di input da considerare

nell’ analisi. Se è omesso la procedura considera tutte le variabili numeriche. BY elenco Realizza tante analisi delle componenti principali quante sono le modalità della

variabile di BY. PROC FACTOR La sintassi della procedura è la seguente. PROC FACTOR DATA=nome Il sds di input che contiene la matrice X dei dati osservati. OUT=nome Un sds di output dove memorizzare i punteggi fattoriali. MINEIGEN=alfa Specifica il minimo valore degli autovalori per cui il fattore è mantenuto. PROPORTION= specifica la quota di varianza complessiva che deve essere spiegata; oltre tale quota i fattori vengono

soppressi. NFACTORS=n Indica il numero di fattori comuni da estrarre. PRIORS= Specifica il metodo da usare per la stima a priori delle

comunalità. I metodi possibili sono: SMC indice di determinazione della regressione con

tutte le altre variabili; ASMC indice di determinazione aggiustato per i gradi

di libertà; MAX massima correlazione tra quelle con tutte le

altre variabili; ONE pone tutte le comunalità pari a 1; RANDOM in modo casuale tra 0 e 1. ROTATE= Specifica il metodo di rotazione: QUARTIMAX, VARIMAX, EQUAMAX Gli statement principali sono i seguenti. VAR elenco Elenco delle variabili numeriche contenute nel sds di input da considerare

nell’ analisi. Se è omesso la procedura considera tutte le variabili numeriche. BY elenco Realizza tante analisi dei fattori quante sono le modalità della

variabile di BY. PRIORS elenco Fornisce i valori delle comunalità. Esempio 5.3.2 Applicazione procedure princomp e factor Un esercizio commerciale dispone delle seguenti informazioni su un campione di clienti. Reddito in migliaia di euro mensili familiari Consumo in migliaia di euro mensili familiari Opinioni sul reparto carni in punteggio espresso da 0 a 10 Opinioni sul reparto pesce in punteggio espresso da 0 a 10 Opinioni sul reparto taglio in punteggio espresso da 0 a 10 Di seguito viene riportato il programma che esegue l’ analisi dei fattori e il relativo output.

Page 34: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

* Esempio procedure princomp e factor; data clienti; input prog eta reddito consumo consumo_noi qual_carni qual_pesce qual_taglio; cards; 1 36 3.4 3 0,5 9 7 8 2 43 2.0 1.8 0,8 5 5 6 3 47 2.1 1.7 0.9 4 6 5 4 53 1.1 1.0 0.6 10 9 8 5 50 2.5 2 0.7 6 5 6 6 42 1.4 1.2 0.8 5 5 6 7 48 3.0 2.5 0.3 7 9 8 8 39 1.1 1.0 0.6 6 4 5 9 68 1.9 1.7 0.5 6 5 5 10 55 2.0 1.7 0.6 9 6 7 11 49 1.5 1.0 0.4 7 8 7 12 52 1.1 1.0 0.6 6 7 4 13 50 2.5 2 0.7 7 5 6 14 49 3.5 3.0 0.4 10 8 7 ; proc princomp data=clienti; var eta reddito consumo consumo_noi qual_carni qual_pesce qual_taglio; run; proc factor data=clienti nfactors=2 rotate=quartimax; var reddito consumo qual_carni qual_pesce qual_taglio; run; �

�������������������������������C�1��>�C�

�������������������>����,�-���������%��

�������������������8����0����������'�

�������������������� ��������7�����������

���������������������������������B������������B������������B�������

���������"$#/2'/%�"(����%$/'/%�"2'/����)$("2'/%�"(����)$&'/%�"2'/����)$"2'/%�"2)�

� �������#$2%/"("'#%����#$/##"&'�&(����%$2(((/%#2%����%$)�'2�#'/2����%$")))�/&22�

������������������������������������-�����

��������������������������������B�������B�������B�

���������������������������������������������������������

������������������%$####����#$(2/'���#$&�'/���#$""&����#$�/�'�

�������������������#$(2/'����%$####���#$&)/)���#$"#%"���#$�'/"�

����������B���������#$&�'/����#$&)/)���%$####���#$'(("���#$/%"&�

����������B���������#$""&�����#$"#%"���#$'(("���%$####���#$)�2��

����������B����������#$�/�'����#$�'/"���#$/%"&���#$)�2����%$####�

������������������,����������������������������-�����

�����������������,���������44����-���C�����-�������������

������������%��&$#"%/%2##��%$/#)#�"#%�����#$)#�&���#$)#�&�

������������"��%$&%')/'((��#$(")')�%%�����#$")&%���#$2)/'�

������������&��#$&2(%%%2/��#$%")"(%&"�����#$#//2���#$(�'&�

���������������#$")"2"#''��#$"'"%�)(/�����#$#'")���#$((/(�

Page 35: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

������������'��#$#%#)/&'2������������#$##"%���%$####�

�������������������������,�������

���������������C���%�����C���"�����C���&�����C���������C���'�

���������������#$�''#/&����$'"�'"&���#$%")"''���#$#'"�2'����$/#)�)"�

����������������#$�'")'&����$'&#))#���#$#'#"%&���#$%"�(""���#$/#&2&%�

��������B���������#$��)2'/���#$&'%/(�����$)/#2"'���#$�/"�%&����$#'2%&2�

��������B���������#$&2�(&����#$�((('/���#$/%('2/���#$"22)('���#$#")2#/�

��������B���������#$�(##'(���#$")&/�&����$%%/%)%����$2"%)'/���#$#&/2/��

�����������������������������������>��

����������������������4����������-����@�����������������������

��������������� ������������������ ���������@�>���

������������,����������������������������-����@��������*�'������*�%�

�����������������,���������44����-���C�����-�������������

������������%��&$#"%/%2##��%$/#)#�"#%�����#$)#�&���#$)#�&�

������������"��%$&%')/'((��#$(")')�%%�����#$")&%���#$2)/'�

������������&��#$&2(%%%2/��#$%")"(%&"�����#$#//2���#$(�'&�

���������������#$")"2"#''��#$"'"%�)(/�����#$#'")���#$((/(�

������������'��#$#%#)/&'2������������#$##"%���%$####�

�������������"�4�����������������������������������������>�$�

��������������������� �7����4����������

������������������������������%�����������"�

��������������������������#$/(%#)�����#$)#%)��

���������������������������#$/2)2'�����#$)#2)2�

�����������������B����������#$//)/2�����#$�#&'"�

�����������������B����������#$))(%&�����#$'/&�)�

�����������������B�����������#$2'%2/�����#$&#"'"�

�����������������8�����-������������������4�������

��������������������������%�����������"�

�������������������&$#"%/%2#����%$&%')/)#�

�������������� ��������������� �4�����@��������*��$&&/&(��

��������������������������������������������B�

������������������������������B�����������B�����������������

�������#$(2//�)&����#$(2()"(((���#$/))"#)''���#$//))#&"2���#$2%/"#/2&�

�����������������������������������>��

������������������������������-����@�:������+�

������������������������������4����-����������������

���������������������������%��������"�

Page 36: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

�������������������%�����#$//'')�����#$)&%"/�

�������������������"�����#$)&%"/�����#$//'')�

������������������� �7����4�����������������

������������������������������%�����������"�

��������������������������#$"&&/"�����#$()'(2�

���������������������������#$"")#%�����#$()2/(�

�����������������B����������#$2'/%/�����#$%//�#�

�����������������B����������#$22#(/�����#$#""&'�

�����������������B�����������#$2'%)'�����#$&#&%��

�����������������8�����-������������������4�������

��������������������������%�����������"�

�������������������"$&�%2)#&����%$((''&&/�

�������������� ��������������� �4�����@��������*��$&&/&(��

��������������������������������������������B�

������������������������������B�����������B�����������������

�������#$(2//�)&����#$(2()"(((���#$/))"#)''���#$//))#&"2���#$2%/"#/2& �

Come si vede dall’ output, con due fattori comuni si riesce a spiegare quasi l’ 87% della variabilità complessiva delle variabili osservate. Lo schema fattoriale non ruotato non consente una agevole interpretazione dei fattori in quanto entrambi risultano piuttosto correlati con tutte le variabili osservate. La rotazione col metodo Quartimax consente di interpretare il primo fattore come le opinioni sulla qualità dell’ esercizio, essendo positivamente correlato con le valutazioni sulla qualità del reparto carni, pesce e fresco. Il secondo fattore può invece essere considerato rappresentativo del tenore di vita del cliente, essendo correlato sia con il reddito sia con il consumo.

Page 37: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

5.3 Analisi di scaling multidimensionale Immaginiamo di consultare una carta geografica. Partendo dalla mappa e utilizzando un righello graduato si può costruire facilmente una matrice delle distanze tra diverse città o luoghi che vi sono rappresentati. Ma partendo dalla matrice delle distanze è possibile ricostruire la mappa, cioè rappresentare le città o i luoghi in uno spazio bidimensionale? Se le distanze sono definite “ in linea d’ aria” , la risposta è sì, anche se con molta fatica: si tratta di partire da un punto e poi collocare il secondo alla giusta distanza dal primo, il terzo alla giusta distanza dal primo e dal secondo e così via. Si riesce cioè a ricostruire perfettamente la mappa perdendo solo l’ orientamento, cioè la direzione del nord. La stessa operazione si fa molto più complicata, e realizzabile solo con più o meno rilevanti approssimazioni, quando le distanze tra le città non sono in linea d’ aria, ma per esempio: distanze stradali, distanze intese in termini di tempi di percorrenza, distanze di volo che tengono conto delle rotte di avvicinamento e delle aerovie praticabili. Se la matrice delle distanze è invece una matrice calcolata a partire da una matrice dei dati osservati Xnp, per esempio derivanti da una ricerca di mercato mediante rilevazione diretta su un collettivo di individui, il problema di rappresentare le n unità della matrice in uno spazio bidimensionale si complica ulteriormente. In questi casi occorre ricorrere a opportune tecniche statistiche, in particolare alle tecniche di scaling multidimensionale. Quelle che vanno sotto il nome di scaling multidimensionale sono tecniche statistiche che, partendo da una matrice di distanza o di prossimità tra n unità, consentono di ottenere una soluzione metrica, ossia una rappresentazione geometrica delle n unità in un numero limitato di dimensioni. Obiettivo di queste tecniche statistiche è dunque ancora quello di ridurre la dimensionalità dello spazio delle osservazioni: a partire da una matrice di dati Xnp, dove le n unità del collettivo sono rappresentate in uno spazio p-dimensionale, si ricerca una nuova matrice, che chiameremo Yns, con s<p, mediante la quale rappresentare le n unità in uno spazio di ridotte dimensioni. A prima vista potrebbe sembrare un obiettivo simile a quello perseguito con l’ analisi dei fattori o delle componenti principali. In realtà, le tecniche di scaling multidimensionale soddisfano esigenze conoscitive più ampie. Anzitutto, come si è spesso sottolineato, per le esigenze di analisi aziendale e di mercato, le informazioni disponibili da fonti secondarie o raccolte direttamente con indagini campionarie, non sono sempre di tipo quantitativo. Al contrario, accanto ad alcune variabili quantitative, spesso sono presenti variabili di tipo qualitativo, come il livello di soddisfazione o la marca preferita o il tipo di esercizio commerciale o il confezionamento del prodotto. In tutti questi casi, l’ analisi dei fattori risulta inapplicabile, in quanto non è possibile ottenere la matrice dei dati standardizzati Z, né tanto meno la matrice delle covarianze S. È vero che si potrebbe applicare l’ analisi dei fattori sulla sola parte quantitativa della matrice X, ma a costo di perdere tutta l’ informazione aggiuntiva costituita dalle variabili qualitative. Le tecniche di scaling multidimensionale, invece, proprio perché operano sulla matrice delle distanze o prossimità, sono applicabili a qualsiasi tipologia di variabili presenti nella matrice X da cui le matrici di distanza o similarità derivano. Inoltre, in alcuni casi oggetto della rilevazione è direttamente la similarità o distanza, per esempio tra prodotti diversi o marche diverse dello stesso prodotto. In questi casi la matrice X non esiste, ma viene rilevata direttamente la matrice D, talché l’ unica possibilità di rappresentare in uno spazio le n unità del collettivo è offerta dalle tecniche di scaling multidimensionale. Le diverse tipologie di tecniche di scaling multidimensionale possono essere rappresentate nello schema seguente.

Page 38: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Figura 5.4.1 I metodi di scaling multidimensionale

Yns Approccio metrico Xnp Dnn

�nn Yns Approccio non metrico

Punto di partenza dell’ analisi di scaling multidimensionale è sempre la matrice D, una matrice di distanza o similarità in cui i valori possono essere espressi su scala quantitativa o qualitativa ordinale. La matrice D può essere calcolata a partire da una matrice X di dati osservati su un collettivo di n unità statistiche o può essere rilevata direttamente. Punto di arrivo dell’ analisi è una matrice Y, dove le n unità statistiche sono rappresentate in uno spazio metrico di dimensioni ridotte. L’ efficacia di tali metodi è notevole quando si riesce a rappresentare le n unità in uno spazio a 2 o al massimo 3 dimensioni, o quando s risulti comunque di molto minore di p. Le tecniche di scaling multidimensionale si dividono in due grandi gruppi: quelle di tipo metrico e quelle di tipo non metrico. Le prime presuppongono che i valori della matrice delle distanze in input (D) siano di tipo metrico, ossia espressi secondo scale di misura per rapporti o per intervalli. In questo caso, obiettivo dell’ analisi è determinare una configurazione delle n unità nello spazio di proiezione s-dimensionale in modo tale che i valori di distanza siano il più possibile simili in valore alle distanze originarie presenti nella matrice D. Le tecniche di tipo non metrico presuppongono invece che i valori di distanza in input siano espressi in una scala ordinale. In questo caso, obiettivo dell’ analisi è ancora pervenire a una configurazione delle n unità in uno spazio metrico s-dimensionale, ma in modo tale che l’ ordinamento delle distanze che in esso si possono calcolare sia il più possibile simile a quello presente nelle distanze originarie. In generale, possiamo dire che la matrice Y contiene gran parte del contenuto informativo presente nella matrice X, o che riesce a rappresentare sufficientemente le informazioni presenti nella matrice D, quando i corrispondenti elementi nella matrice D e nella matrice �, calcolata sulla matrice Y, sono tra loro simili. Va precisato che, mentre non è possibile utilizzare i metodi di tipo metrico in presenza di una matrice D di partenza con valori su scala ordinale, nulla vieta l’ utilizzo di metodi di tipo non metrico quando si è in presenza di una matrice di partenza con valori di natura quantitativa. Anzi, a volte, si preferisce ricorrere proprio a questo approccio di tipo non metrico, sicuramente meno preciso ma più robusto, non solo quando si è nella impossibilità di usare metodi di tipo metrico, ma anche quando si è in presenza di condizioni particolari, non infrequenti nelle analisi di mercato. È il caso di matrici di distanza che contengono valori quantitativi ma calcolati a partire da matrici di dati osservati di tipo qualitativo o misto, o di dati quantitativi ma rilevati in contesti in cui sono considerati possibili errori di misura, di memoria o di valutazione da parte degli intervistati, o quando si sospetta una carenza di accuratezza dei dati dovuta alla rilevazione di elementi attitudinali e non fattuali. In tutti questi casi si preferisce trasformare in ranghi i valori della matrice di partenza e utilizzare tecniche di analisi di tipo non metrico. In questo modo non si utilizza una parte dell’ informazione disponibile, ma si realizzano analisi più robuste, cioè meno sensibili a errori presenti nei dati4. 4 Per esempio, piccoli errori di memoria da parte di un intervistato, che causano una risposta leggermente inferiore al vero, hanno una ripercussione negli approcci di tipo metrico, ma se non modificano gli ordinamenti nelle risposte date, sono ininfluenti sulla soluzione non metrica.

Page 39: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

5.3.1 I metodi di scaling multidimensionale di tipo metrico Una volta note le coordinate di n punti in uno spazio a p dimensioni, è immediato il calcolo della distanza euclidea tra ogni coppia di unità, utilizzando direttamente la matrice Xnp delle coordinate oppure la matrice Bnn = XX' che contiene le somme dei quadrati e dei prodotti delle coordinate. Il generico elemento della matrice B è dato da:

bij = �=

p

k 1

xik xjk.

Di conseguenza il generico elemento della matrice D si può esprimere nel modo seguente:

dij = [�=

p

k 1

(xik-xjk)2]1/2 = (bii + bjj –2bij)1/2

e dunque: dij

2 = bii + bjj – 2bij. Qui dobbiamo però affrontare il problema inverso: note le distanze, come si ricavano le coordinate della matrice Yns nel nuovo spazio di proiezione. Per fare ciò occorre passare per due fasi successive. Inizialmente si tratta di calcolare la matrice Bnn tale che: dij

2 = bii + bjj – 2bij; [1] successivamente, tale matrice si scompone nella forma B = YY' con il generico elemento dato da:

bij = �=

s

k 1

yik yjk. [2]

Fase 1) – Calcolo della matrice Bnn a partire dalla matrice Dnn Poiché ricavare bij dalla [1] a partire dai valori noti della matrice D, non ammette una soluzione unica, a meno di imporre un vincolo di posizione, si impone un vincolo di centratura. Esso consiste nel far coincidere il baricentro dei punti con l’ origine del nuovo sistema di s dimensioni. Per ogni dimensione dello spazio di proiezione, cioè per k = 1, 2, .. , s. il vincolo da imporre è:

�=

n

i 1

yik = 0.

Con questo vincolo, dalla relazione [2] si può dimostrare che la somma dei termini di ciascuna riga e di ciascuna colonna di B è pari a zero. Se la relazione [1] viene poi sommata, rispettivamente, per tutti i valori i, per tutti i valori j e per tutti i valori i e j, si ottengono le seguenti relazioni:

Page 40: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

�=

n

i 1

dij2 = Σi=1,n bii + nbjj

�=

n

j 1

dij2 = nbii + Σj=1,n bjj

�=

n

ji 1,

dij2 = n (Σi=1,n bii + Σj=1,n bjj).

Considerata anche la [1] si ottiene: bij = -1/2 (dij

2 – di.2 – d.j

2 + d..2),

dove di.

2, d.j2 e d..

2 sono rispettivamente la media per riga, la media per colonna e la media generale delle distanze al quadrato. Fase 2 – Determinare la matrice delle coordinate Y Essendo D una matrice delle distanze euclidee, la matrice Bnn sarà simmetrica e semidefinita positiva. Per ricavare la matrice delle coordinate Y sarà sufficiente determinare autovalori e autovettori di B, alla pari di quanto visto per la scomposizione delle componenti principali. Sarà possibile giungere a una configurazione esatta Y, cioè trovare la matrice Y che soddisfa la relazione: B = YY' La Y avrà dimensioni n righe e v colonne, dove v è il rango della matrice B. Se v è troppo elevato rispetto al nostro s desiderato, sarà sufficiente prendere in esame non la soluzione esatta ma una soluzione approssimata del tipo: B = YY' + E Dove Yns è ottenuta considerando gli s autovettori di B corrispondenti ai primi s autovalori più grandi ed E è una matrice di termini residui. La qualità dell’ approssimazione può essere misurata per mezzo della quota dell’ informazione complessiva contenuta della D che viene mantenuta nella Y: (λ1 + λ2 + .. +λs) / (λ1 + λ2 + … + λv) Come per l’ analisi dei fattori, la scelta di s deve essere tale da consentire l’ interpretazione della soluzione, possibilmente mediante una rappresentazione nel piano (s = 2), mantenendo nel contempo una sufficiente quota della informazione originaria. 5.3.2 I metodi di scaling multidimensionale di tipo non metrico Se i dati presenti nella matrice D sono di tipo qualitativo ordinale, oppure, pur essendo quantitativi, si ritiene opportuno considerarne solo la componente qualitativa ordinale mediante una trasformazione di variabili, la metodologia di scaling multidimensionale applicabile è, come si è già detto, quella di tipo non metrico.

Page 41: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Indicata con Dnn la matrice di distanza in input, i metodi di scaling multidimensionale non metrici hanno l’ obiettivo di determinare le coordinate delle n unità in uno spazio di proiezione di s dimensioni, Yns, in modo che i ranghi dei corrispondenti elementi della matrice D e della matrice �, calcolata sulla Y, coincidano il più possibile. L’ idea sottostante a tali metodi è che, se questi ranghi coincidono, allora la Y è una buona rappresentazione degli n elementi in uno spazio di dimensioni ridotte, poiché mantiene gran parte del contenuto informativo della matrice D di partenza. Utilizzando la formula della distanza euclidea, dalla matrice di coordinate Yns sarà sempre possibile calcolare una matrice di distanze �nn, il cui generico elemento risulterà:

δij = [ �=

s

k 1

(yik – yjk)2]1/2.

Per determinare la configurazione finale si impone il vincolo che l’ ordinamento delle distanze in input dij, sia quanto più possibile simile a quello generato dalle distanze δij, vale a dire: dij < dlm � δij � δlm [3] per ogni coppia di elementi (i, j) e (l, m) con i, j, l, m = 1, 2, .. , n e i � j , l � m. Si richiede cioè che gli elementi di � siano in una relazione di monotonicità debole (o relazione monotona non decrescente) con i corrispondenti elementi di D. Algoritmi di calcolo di tipo iterativo, che partendo da una matrice Y casuale consentono di ottimizzare la soluzione spostando di volta in volta le coordinate per rispettare la [3], sono stati messi a punto da Shepard (1962) e Kruskal (1964). Questi algoritmi si fermano quando, spostando le coordinate degli n punti nello spazio di s dimensioni, non si riesce a migliorare la soluzione. Essi arrivano sempre a una soluzione “ ottima” , nel senso di non migliorabile; si tratta ora di valutare se tale soluzione risulta anche sufficiente in termini di capacità descrittiva. Una prima misura della bontà dell’ adattamento può essere ottenuta analizzando il grado di concordanza tra i due ordinamenti misurato attraverso il coefficiente di correlazione tra ranghi di Spearman. Una ulteriore misura dell’ adattamento può essere ricavata dall’ indice di stress, calcolato come segue:

S = [ ��=<

n

jji 2

(δij – fij)2 / ��=<

n

jji 2

δij2] 1/2,

dove, essendo gli elementi di D in una scala qualitativa ordinale, fij è una trasformazione monotona di dij. Valutare la significatività statistica di S non è possibile, poiché non è nota la sua distribuzione di probabilità. In ogni caso, se esiste una relazione strettamente monotona tra dij e δij, il valore dello stress risulterà pari a zero; valori inferiori o pari a 0,05 vengono considerati indicatori di buon adattamento; valori inferiori a 0,2 vengono comunque considerati indicatori di adattamento discreto, mentre valori superiori a 0,2 indicano un adattamento scadente. In presenza di un adattamento considerato insufficiente, si tratta di riprovare la procedura iterativa aumentando il valore di s, cioè il numero delle dimensioni dello spazio di proiezione. Anche in questo caso, un grafico dove i valori dello stress sono riportati in funzione di s può aiutare a decidere il numero ottimale di dimensioni da considerare.

Page 42: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

5.3.3 L’analisi delle preferenze individuali I metodi di scaling multidimensionale fin qui analizzati riescono, a partire da una matrice delle distanze Dnn, a rappresentare gli n elementi in uno spazio di ridotte dimensioni. Vediamo ora una tipologia di modelli di scaling multidimensionale, più complessa, che oltre a esaminare la similarità tra oggetti analizzati, permette anche di valutare le differenze individuali di percezione delle similarità da parte di diversi soggetti. Pensiamo, per esempio, di rilevare presso un gruppo di consumatori che viaggiano spesso in aereo, le valutazioni di diverse compagnie aeree in relazione a diverse caratteristiche (puntualità dei voli, qualità dei servizi di terra, cortesia del personale di volo) e di voler calcolare, a partire da tali giudizi, le distanze o similarità tra le compagnie. In questo caso non abbiamo più una sola matrice Xnp, dove n sono i soggetti intervistati e p le variabili oggetto di rilevazione, da cui calcolare una sola matrice Dnn e rappresentare, in modo metrico o non metrico, gli n elementi in uno spazio di ridotte dimensioni. Ora disponiamo di k matrici Xnp, o di una matrice X di k�n righe e p colonne, dove:

• k sono i soggetti intervistati; • n sono le compagnie aree oggetto di valutazione; • p sono le caratteristiche sulle quali sono valutate le compagnie (per esempio con un

punteggio da 0 a 10). Con tali informazioni a disposizione abbiamo diverse possibilità di analisi anche utilizzando le tecniche già note. Si potrebbe infatti decidere di:

• calcolare una matrice Xnp che contiene le valutazioni medie dei k individui, ricavare una matrice Dnn e realizzare uno scaling multidimensionale su tale matrice, rappresentando le n compagnie aree in uno spazio di proiezione. Si otterrebbe così la rappresentazione delle n compagnie aeree nel giudizio comune degli intervistati, ma si perderebbe la possibilità di valutare le differenze individuali dei rispondenti;

• realizzare k analisi di scaling multidimensionale diverse sulle k matrici di distanza Dnn, ricavabili dalle k matrici Xnp, ottenendo k rappresentazioni delle n compagnie aeree, una per ciascun soggetto intervistato. Essendo però analisi indipendenti, con diversa posizione degli assi nello spazio di proiezione, l’ analisi non permetterebbe di identificare dimensioni di valutazione comuni ai diversi soggetti, e tanto meno di stabilire relazioni tra dimensioni individuali di valutazione e dimensioni comuni.

Per ovviare a queste limitazioni Carrol e Chang (1970) hanno definito un modello di scaling multidimensionale per valutare le differenze individuali, chiamato INDSCAL, dal nome della procedura di calcolo messa a punto dai due autori, o scaling multidimensionale ponderato. Il modello per l’ analisi delle differenze individuali, inizialmente introdotto per l’ analisi metrica, è stato successivamente esteso anche al caso di analisi non metriche. Il modello consente di ottenere due distinte matrici:

• una matrice Yns, che contiene la rappresentazione delle n unità (compagnie aeree, nell’ esempio) nello spazio di proiezione a s dimensioni che rappresenta lo spazio di percezione comune ai k soggetti intervistati;

• una matrice Wks che contiene i pesi assegnati a ciascuna dimensione dello spazio comune per poter passare da tale spazio a quello individuale di percezione del generico soggetto intervistato.

La rappresentazione degli n oggetti nello spazio individuale del t-esimo soggetto viene ottenuta con la matrice tYns con: tYns = Yns � tWss dove:

Page 43: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

• Yns è la matrice che contiene la rappresentazione nello spazio comune degli oggetti analizzati (compagnie aeree, nell’ esempio);

• tYns è la matrice che contiene la rappresentazione degli oggetti analizzati nello spazio di proiezione a s dimensioni che individua lo spazio di percezione individuale del t-esimo soggetto (con t = 1,2, .. , k);

• tWss è la matrice diagonale che contiene i pesi del t-esimo soggetto, ovvero la t-esima riga della matrice W.

Procedendo in modo analogo al caso di scaling multidimensionale di tipo metrico si ha: tbij = -1/2 ( tdij

2 – tdi.2 – td.j

2 – td..2),

dove: tdij è la distanza tra gli oggetti i e j (nell’ esempio, tra due compagnie aeree) per il t-esimo individuo

tdi.2 = 1/n �

=

n

j 1tdij

2

td.j2 = 1/n �

=

n

i 1tdij

2

td..2 = 1/n2 �

=

n

i 1�

=

n

j 1tdij

2

tB = Y tW2 Y’ dove: tW2 è la matrice diagonale dei pesi, elevati al quadrato, del t-esimo soggetto. La procedura INDSCAL, implementata in tutti i principali package statistici, consente di calcolare i valori tbij e di stimare la matrice Yns delle coordinate degli n oggetti nello spazio di proiezione comune a s dimensioni, e la matrice Wks che contiene i pesi assunti dalle s dimensioni per passare dallo spazio comune a quello individuale del t-esimo soggetto5. Un peso pari a zero significa che una determinata dimensione non ha alcuna rilevanza per uno specifico soggetto. Nell’ esempio, un peso pari a zero significa che mentre per la rappresentazione delle n compagnie aeree nello spazio comune si utilizzano tutte le s dimensioni, per quel soggetto la rappresentazione delle n compagnie aeree avviene in uno spazio semplificato a s-1 dimensioni. Un peso compreso tra 0 e 1 significa che in quella dimensione il passaggio dallo spazio comune allo spazio individuale del soggetto comporta una contrazione dello spazio, ovvero che quella dimensione è meno importante per il soggetto considerato. Un peso pari a 1 significa che la dimensione ha, per il soggetto, la stessa importanza che ha nella percezione comune. Un peso maggiore di 1 significa che in quella dimensione il passaggio dallo spazio comune a quello individuale comporta una espansione dello spazio, cioè che quella dimensione, per il soggetto, è più importante che nella percezione comune. Sebbene il modello INDSCAL sia nato proprio con l’ obiettivo di valutare le differenze individuali (da cui la denominazione), nel campo delle analisi aziendali e di mercato si presta a un uso più generale. Si pensi, in particolare, ai casi in cui si disponga di un terzo ordinamento della matrice dei dati, costituito non dal soggetto intervistato ma dallo spazio o dal tempo. Per esempio, si pensi alla rilevazione delle preferenze dei consumatori su n marche in relazione a p attributi, in k regioni o in k momenti nel tempo. In questi casi dalla applicazione del modello INDSCAL deriva la matrice Yns,

5 Per ottenere le stime delle matrici Yns e Wks, la procedura utilizza il metodo iterativo dei minimi quadrati non lineari proposto da Wold (1966).

Page 44: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

che contiene sempre la rappresentazione delle n marche nello spazio a s dimensioni; ma la matrice Wks conterrà i pesi per passare dallo spazio comune allo spazio relativo alle k regioni o k istanti di tempo. È possibile pertanto valutare differenze nella percezione attribuibili, rispettivamente, alla dimensione geografica nel primo caso (differenze di preferenze tra regioni) o a quella temporale nel secondo caso (evoluzione delle preferenze). 5.3.4 L’analisi di scaling multidimensionale in SAS In SAS l’ analisi di scaling multidimensionale può essere realizzata attraverso la procedura MDS. La procedura consente di applicare metodi di scaling sia di tipo metrico che non metrico. La sintassi fondamentale è la seguente: PROC MDS DATA=nome Specifica il sds di input; deve essere una o più matrici

triangolari inferiori di distanza; il numero di osservazioni deve coincidere o essere un multiplo esatto del numero di variabili specificato nello statement VAR. In questo secondo caso la procedura calcola il modello INDSCAL.

OUT=nome Specifica il sds di output dove viene memorizzata la matrice Y delle coordinate nello spazio di proiezione.

DIM=s Indica il numero di dimensioni dello spazio di proiezione. ID variabile Identifica una variabile che contiene il nome delle unità. INITIAL=nome Specifica un sds che contiene le coordinate iniziali della matrice Y. LEVEL= ABSOLUTE Realizza uno scaling di tipo metrico. LEVEL= ORDINAL Realizza uno scaling di tipo non metrico. SIMILAR Considera i dati del sds di input come matrice di similarità. COEF= IDENTITY Considera distanze euclidee COEF=DIAGONAL Realizza l’ analisi di MDS ponderata secondo il modello

INDSCAL PFINAL Visualizza nell’ output le stime finali.

Esempio 5.4.1 Esempio di procedura MDS Si ipotizzi di avere rilevato su un gruppo di 5 soggetti i giudizi di similarità tra 4 marche automobilistiche (denominate M1, M2, M3 e M4), il programma seguente realizza un’ analisi di scaling multidimensionale con 2 dimensioni sulle differenze individuali. * esempio procedura MDS; data auto; input soggetto marca $ M1 M2 M3 M4; cards; 1 M1 0 . . . 1 M2 4 0 . . 1 M3 2 1 0 . 1 M4 3 6 5 . 2 M1 0 . . . 2 M2 3 0 . . 2 M3 3 2 0 . 2 M4 3 5 4 . 3 M1 0 . . . 3 M2 4 0 . . 3 M3 1 2 0 . 3 M4 3 6 5 .

Page 45: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

4 M1 0 . . . 4 M2 4 0 . . 4 M3 1 0 0 . 4 M4 5 5 4 . 5 M1 0 . . . 5 M2 2 0 . . 5 M3 1 0 0 . 5 M4 2 3 4 . ; proc mds data=auto dim=2 level=ordinal similar out=risu pfinal coef=diagonal; id marca; matrix soggetto; proc print data=risu; run; �

�������������� ��������������������@�����*9>�D$���>$�����

������������������*��1��A�������-����*����1E���,����*>��1����

����������������4*�1�A>��������������*"�������*%�����������*%�

��������������,����*#$#%�A���,����*#$#%���+����*%##�>,��*"�����*#$###%�

�������������������������������������������������,�����-��

�������������������!������������0���������......................�

������1����-�����������������4�������������������������������A��������

������.............................................................................�

���������#����1��-��������#$")'2��������$������$������$�

���������%����������������#$#)#(�����#$"#�(����#$"'�#����#$/'"'�

���������"����A����F����#$#�%'�����#$#%(�������$������$�

���������&����������������#$#&&"����#$##2"/'����#$#"�(����#$')%#�

��������������A����F����#$#&&%����#$###%&'������$������$�

���������'����������������#$#""(�����#$#%#"����#$#"&(����#$&"%��

���������)����A����F����#$#""2����#$####2"�������$������$�

���������/����������������#$#%()����#$##&"#�����#$#%%'����#$")#��

���������2����A����F����#$#%('����#$####'%(������$������$�

���������(����������������#$#%2%����#$##%�"(���#$##/&"(����#$"%#(�

��������%#����A����F����#$#%//����#$###&(�������$����#$#"&(�

��������%%����A����F����#$#%//����'$#/2(��)������$���#$##&#(#�

���������1��������������,�����-�����������4����$�

�������������������������4����-�����

���������������������������%�������"�

�������������������..........................�

��������������������%����#$)"����%$))�

��������������������"����%$%%�����#$2)�

��������������������&�����%$'"�����#$%%�

��������������������������#$"%�����#$/#�

���������������������44�����������������������

��������������������������������%������"�

����������������....................................�

����������������������%����%$"#����#$/��

����������������������"����#$('����%$#'�

����������������������&����%$%�����#$2&�

���������������������������%$"2����#$)%�

����������������������'����%$%'����#$2"�

Page 46: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

�������������� ��������������������@�����*9>�D$���>$�����

������������������*��1��A�������-����*����1E���,����*>��1����

����������������4*�1�A>��������������*"�������*%�����������*%�

������������������������������������������������-�����

����������������������������!�������4����������-���������������

�����������������������������������������������������-������

�����������������������������C�������������������������-��������������

����......................................................................................�

���������%��������)���#$"#������#$##������%$##������%$##�

���������"��������)���#$"#������#$#"������%$##������%$##�

���������&��������)���#$"#������#$#&������#$((������%$##�

������������������)���#$"#������#$#"������%$##������%$##�

���������'��������)���#$"#������#$#%������%$##������%$##�

�������������������&#���%$##������#$#"������%$##������%$##�

����>����B�1��� B������������B�GC�B�����������B����B������%�������"�

�����%����"������$������1���1>�������������#$#%//"���$�

�����"����"������$�����>��1A�����%�����%����#$)"�%)���%$))"('�

�����&����"������$�����>��1A�����"�����"����%$%%�'2���#$2')('�

����������"������$�����>��1A�����&�����&����%$'"&/(���#$%#)2&�

�����'����"������$�����>��1A����������������#$"%�('���#$)((%)�

�����)����"������%�����1�A�>���������������%$"#�&2���#$/�%")�

�����/����"������"�����1�A�>���������������#$(�'�2���%$#'%/#�

�����2����"������&�����1�A�>���������������%$%�""2���#$2&&/2�

�����(����"������������1�A�>���������������%$"/)�����#$)#22��

�����%#����"������'�����1�A�>���������������%$%'#2����#$2"%(&

Page 47: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

5.4 Analisi congiunta Uno degli obiettivi degli studi di mercato è valutare l’ importanza di una serie di attributi di un prodotto o servizio nel processo di scelta del consumatore. In questi casi l’ approccio meno consigliabile è quello di tentarne una rilevazione diretta. Il consumatore avrà infatti difficoltà a separare le “ importanze” specifiche dei diversi attributi. Supponiamo, per esempio, che si voglia valutare l’ importanza degli attributi principali nel prodotto pacchetto turistico di una vacanza mare nel periodo non estivo. Gli attributi rilevanti possono essere il luogo, la durata, il trattamento, la distanza del villaggio dall’ aeroporto e il prezzo. Se tentiamo di rilevare direttamente l’ importanza per il consumatore di ognuno di questi attributi nel suo processo di scelta è probabile che produca il risultato che “ tutto è importante” . L’ analisi congiunta è una tecnica di analisi statistica multivariata che consente di ottenere tali valutazioni di importanza in modo indiretto, partendo da valutazioni globali del consumatore su una serie di combinazioni di livelli diversi degli attributi. Riprendendo l’ esempio, per ogni attributo si tratta cioè di sottoporre al consumatore, condotto in un “ negozio virtuale” , diversi pacchetti turistici alternativi, ognuno caratterizzato da una combinazione di caratteristiche, e di chiedergli di fare la sua scelta o di ordinarli secondo le sue preferenze, o comunque di fare una valutazione. In questo modo, peraltro, è possibile valutare il gradimento di beni e servizi indipendentemente dal fatto che siano già presenti sul mercato, e quindi anche il potenziale gradimento di beni e servizi in fase di sviluppo presso l’ azienda, il che consente di adeguarne le caratteristiche alle richieste del mercato. Le prime applicazioni di analisi congiunta nell’ ambito delle ricerche di mercato sono state proposte da Green e Rao (1971). La teoria economica su cui si basa è quella proposta da Lancaster (1966), secondo cui nel processo di scelta i consumatori si comportano in modo razionale, valutando le caratteristiche del prodotto, tanto che l’ utilità d’ uso di un bene si può ritenere derivi dalle singole caratteristiche che lo compongono. L’ utilità complessiva che un consumatore trae da un prodotto o servizio è dunque possibile scomporla, in modo generalmente additivo, in utilità separate legate alle diverse caratteristiche. I consumatori valutano cioè il valore o l’ utilità di un bene combinando inconsciamente in modo additivo le utilità separate fornite da ogni attributo di quel prodotto o servizio. Il processo avviene inconsciamente, come si è detto, in quanto, di norma, le caratteristiche di un bene vengono giudicate non una alla volta ma congiuntamente nelle diverse modalità o intensità con cui si presentano, nel senso che la scelta tra i possibili prodotti alternativi viene fatta in base ai vantaggi e svantaggi complessivi che il loro acquisto genera. Dalle considerazioni precedenti si evincono i presupposti e i limiti dell’ analisi congiunta: per la sua impostazione razionale, è adatta allo studio dei mercati di beni a forte coinvolgimento psicologico al momento dell’ acquisto, ma molto meno indicata nel caso di prodotti acquistati d’ impulso e a basso prezzo unitario. 5.4.1 Il modello di preferenza L’ analisi congiunta richiede la preventiva definizione di un elenco di attributi, cioè di caratteristiche del prodotto o servizio. Gli attributi possono essere misurabili in modo quantitativo (come il prezzo, le dimensioni, la durata in giorni) o in modo qualitativo, sia ordinale sia nominale (come la marca, il colore, il mezzo di trasporto usato). I possibili valori che l’ attributo può assumere vengono definiti livelli; in corrispondenza di attributi misurabili in modo quantitativo continuo, andranno scelti come livelli alcuni valori significativi. Le possibili combinazioni dei livelli per tutti gli attributi costituiscono gli stimoli. Ogni stimolo è dunque “ un prodotto” virtuale sottoposto a valutazione da parte dell’ intervistato.

Page 48: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Indichiamo con fjt il livello del t-esimo attributo (t = 1,2, .. , k) presente nello stimolo j. I modelli di preferenza possono essere almeno tre: il modello vettore, il modello del punto ideale, il modello parth-worth. Il modello vettore considera la preferenza per lo stimolo j come somma delle utilità derivanti da ciascun attributo, secondo la seguente formula:

pj = �=

k

t 1

wt fjt

dove pj è il grado di preferenza espresso per lo stimolo j, mentre wt rappresenta il peso del t.mo attributo, da stimare opportunamente. Il limite principale del modello vettore sta nella invarianza dei pesi al variare del livello dell’ attributo stesso, il che implica l’ assunzione di linearità della funzione di preferenza. Riprendendo l’ esempio, ciò equivale a ipotizzare che un giorno in più o in meno di permanenza nel viaggio generi la stessa differenza di utilità sia per viaggi di 8 giorni sia per viaggi di 15 giorni. Il modello del punto ideale fa riferimento alla distanza (al quadrato) di ogni stimolo dallo stimolo “ ideale” , misurata come somma ponderata delle differenze tra i livelli di tutti gli attributi e i corrispondenti livelli ideali:

dj2 = �

=

k

t 1

wt (fjt – ot)2

dove ot è il livello ideale del t-esimo attributo. Il modello considera la preferenza per il j-esimo stimolo (pj) negativamente correlata con la distanza al quadrato dj

2: a minori distanze di uno stimolo da quello ideale corrisponderà un più elevato gradimento per lo stimolo stesso. Rispetto al modello vettore, il numero di parametri di stimare è doppio, poiché per ciascuno dei k attributi si deve procedere alla stima di wt e di ot. Il modello parth-worth è simile al modello vettore, poiché esprime la preferenza per lo stimolo j sempre in forma additiva, cioè come somma delle preferenze che derivano dagli specifici livelli dei k attributi. Tuttavia, la preferenza per lo stimolo j in relazione all’ attributo t è definita attraverso una funzione discontinua s:

pj = �=

k

t 1

st (fjt).

Per gli attributi quantitativi la funzione st viene definita per un insieme limitato di livelli (in genere tre o quattro), mentre per gli attributi qualitativi viene definita per tutte le categorie assunte dall’ attributo. Quest’ ultimo modello è il più generale e flessibile tra quelli presentati, dato che permette alla funzione di preferenza di assumere forme diverse a seconda della specificazione di st. Peraltro, adottando opportune specificazioni di st, è possibile passare dal modello parth-worth ai due precedenti6.

6 Definendo st (fjt) con - wt (fjt – ot)

2 o wt fjt il modello parth-worth viene ricondotto, rispettivamente, al modello del punto ideale e al modello vettore.

Page 49: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Alla flessibilità fa però riscontro una maggiore complessità della stima: se si ipotizza la presenza di m livelli significativi per ciascuno dei k attributi, fermandoci al caso di funzioni st di primo grado, il numero dei parametri da stimare sarà (m-1)k. Tutti i modelli considerati prevedono un semplice schema additivo che tiene conto solo degli effetti diretti di ciascun attributo sulla preferenza del consumatore e non anche delle possibili interazioni tra questi, il che equivale a considerare i diversi attributi come tra loro indipendenti nella percezione del consumatore. Quando si è in presenza di attributi caratterizzati da reciproca sostituibilità, è evidente che la metodologia presenta un oggettivo limite. Inoltre, poiché l’ analisi congiunta viene condotta sul singolo soggetto, in genere si può disporre di un limitato numero di osservazioni, ovvero di stimoli sottoposti a valutazione. Di conseguenza, il numero dei parametri da stimare costituisce, spesso, un problema rilevante, che condiziona affidabilità e stabilità delle stime. Per questo spesso si ricorre a un modello misto, ottenuto combinando le caratteristiche dei tre modelli precedenti, con l’ obiettivo di ridurre il più possibile il numero di parametri da stimare, senza perdere troppo in termini di capacità descrittiva del modello stesso. In sostanza, per gli attributi per i quali risulta verosimile l’ applicazione del modello vettore ci si limiterà a un solo parametro da stimare, mentre per gli altri attributi i parametri da stimare potranno risultare due o più. Il modello misto può essere schematizzato nel modo seguente:

pj = �=

k

t 1

ut zjt

dove: K è il numero dei pseudo-attributi considerati, che coincide con il numero di parametri da stimare; zjt è definito in relazione a fjt nel modo seguente:

• se si assume che le preferenze abbiano un andamento monotono in modo pressoché lineare, allora zjt = fjt, sil che corrisponde alla stima del modello vettore;

• se si assume che l’ andamento monotono di tipo lineare sia definito per intervalli di valori di fjt, allora si introdurranno tanti pseudo-attributi quanti sono gli intervalli per i quali va stimato il relativo parametro;

• se si ipotizza che la preferenza assuma un andamento sostanzialmente non lineare, concavo o convesso, per ogni attributo vengono definiti due pseudo-attributi, cioè due variabili z, una costituita da fjt e una da fjt

2. Si possono anche inserire nel modello termini polinomiali di grado più elevato (per esempio fjt

3) al fine di tenere conto di eventuali altre forme di non linearità.

• Per gli attributi qualitativi, per ciascun attributo con m livelli verranno definite m-1 variabili dummy (del tipo 0/1 o SI/NO)7.

7 Per evitare problemi di collinearità, con conseguente impossibilità di effettuare le stime adottando il metodo dei minimi quadrati ordinari, si è soliti evitare di inserire la m-esima variabile dummy in corrispondenza dell’ m-esimo livello dell’ attributo qualitativo. In tal modo si ipotizza che in presenza dell’ m-esimo livello tutte le m-1 variabili dummy inserite valgano zero e dunque, a prescindere dal valore dei parametri stimati, il contributo in termini di utilità complessiva dell’ m-esimo livello sia pari a zero. Il significato dei parametri relativi alle altre variabili dummy inserite va dunque valutato come il contributo, positivo o negativo, all’ utilità complessiva fornito dagli altri livelli della variabile qualitativa in relazione al contributo nullo del m+1-esimo livello.

Page 50: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

5.4.2 Il metodo di acquisizione delle informazioni La raccolta delle valutazioni da parte dell’ intervistato può avvenire seguendo due procedure tra loro molto diverse, quanto ad affidabilità e complessità realizzativa: la procedura trade-off e la procedura full-profile. Con la procedura trade-off le valutazioni concernenti le preferenze vengono raccolte per coppia di attributi, sottoponendo all’ intervistato una tabella dove è richiesto l’ ordinamento di tutte le combinazioni dei relativi livelli. Nella Tabella 5.5.1 è riportato un esempio relativo a due caratteristiche del prodotto pacchetto turistico mare in periodo non estivo. Tabella 5.5.1 Esempio di applicazione procedura trade-off (1=combinazione preferita).

Luogo del viaggio Trattamento Mar Rosso Oceano Indiano Cuba Mezza pensione 9 6 1 Pensione completa 8 4 3 All inclusive 7 2 5 Nell’ esempio, l’ intervistato esprime la massima preferenza per Cuba in trattamento di mezza pensione, mentre con il trattamento di all inclusive la preferenza passa all’ Oceano Indiano. Il Mar Rosso è comunque non gradito, risultando tutte le combinazioni che lo prevedono in fondo alla graduatoria. La procedura trade-off richiede molto tempo per la raccolta dei dati, in quanto all’ intervistato va sottoposto un elevato numero di tabelle. Per esempio, se si prevedono 6 attributi andranno sottoposte 15 tabelle simili alla 5.5.1; in generale, per k attributi andranno sottoposte k(k-1)/2 tabelle di valutazione. La valutazione da parte dell’ intervistato risulta in compenso molto semplice, non comportando informazioni troppo numerose da valutare congiuntamente. Si presta dunque anche a essere inserita in questionari postali o, in generale, in procedure di rilevazione non assistite dal rilevatore. Poiché la valutazione è limitata a coppie di attributi, la procedura descritta comporta tuttavia una notevole perdita di realismo, con conseguente sensibile ridimensionamento dei vantaggi derivanti dall’ applicazione dell’ analisi congiunta rispetto ad altri metodi di segmentazione. L’ analisi congiunta presenta infatti i suoi maggiori punti di forza proprio nella ricostruzione del processo di scelta da parte dell’ intervistato, che viene “ portato” in un negozio virtuale e gli viene richiesto di effettuare il suo acquisto virtuale sulla base delle alternative disponibili. Alternative mostrate in qualche modo (in modo prototipale o attraverso un’ immagine visiva), cercando di riprodurre quanto più fedelmente possibile, compresa la componente emozionale, ciò che potrà avvenire nel negozio reale. Ma è evidente che tutto ciò è impossibile se si utilizza il metodo trade-off. La procedura full-profile consiste invece proprio nel sottoporre all’ intervistato i diversi stimoli, contenenti al loro interno i livelli di tutti gli attributi presi in esame, richiedendo di effettuare la scelta. Le valutazioni richieste possono essere sia di tipo quantitativo, per esempio valutazioni di gradimento per ciascuno stimolo in una scala da 0 a 10 (con 0=gradimento minimo e 10=gradimento massimo); sia valutazioni di gradimento in scala qualitativa ordinale, per esempio dal più gradito (1) al meno gradito (n). Nel primo caso si riesce anche a raccogliere informazioni circa le differenze di utilità tra una preferenza e la successiva; nel secondo caso ciò non è invece possibile, ma si evita un possibile inconveniente della prima alternativa, cioè la possibilità di molti ex equo, tra i quali non sarebbe possibile discriminare.

Page 51: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Il limite della procedura full-profile è il carico notevole di informazioni sulle quali è richiesta una valutazione congiunta all’ intervistato. Individuati attributi e livelli, gli stimoli possibili corrispondono a tutte le combinazioni dei livelli di tutti gli attributi. Il primo problema è stabilire il numero di stimoli da sottoporre all’ intervistato. A questo riguardo valgono le seguenti considerazioni di carattere generale:

• nell’ analisi congiunta il numero di osservazioni è dato dal numero di stimoli che l’ intervistato riesce a valutare; di conseguenza, per garantire la qualità delle stime, il numero di stimoli sottoposti a valutazione dovrebbe essere sufficientemente elevato in relazione al numero dei parametri da stimare, a sua volta dipendente dal grado di complessità del modello adottato;

• l’ esperienza suggerisce tuttavia che quando si supera il numero di 35 o 40 stimoli diventa molto difficile raccogliere le informazioni richieste, anche prevedendo piccole remunerazioni in denaro o premi in natura per gli intervistati.

Nell’ esempio sui pacchetti turistici mare in periodo non estivo, ipotizzando 4 livelli per il luogo della vacanza, 3 per la durata, 3 per il tipo di trattamento e 3 per il prezzo, il numero degli stimoli possibili risulta pari a 4x3x3x3 =108, un numero praticamente impossibile da rilevare utilizzando l’ approccio full-profile. È pertanto indispensabile qualche semplificazione. Un metodo per ridurre il numero degli stimoli consiste nell’ eliminare le combinazioni teoriche di caratteristiche che appaiono meno verosimili. In particolare, quelle che:

• corrispondono a prodotti che prevedono soluzioni pressoché impossibili dal punto di vista tecnico od organizzativo; per esempio i pacchetti turistici che prevedono viaggi a lungo o lunghissimo raggio (> 10 ore di volo) e durata di 4 o 5 giorni;

• corrispondono a soluzioni molto elevate dal punto di vista qualitativo, ma con prezzi particolarmente modesti, non sostenibili dal lato dell’ offerta e nel contempo sempre massimamente preferite dal consumatore;

• corrispondono a soluzioni di modesto livello qualitativo, ma con prezzi elevati, il che configura una combinazione speculare alla precedente e analogamente improbabile.

Altri metodi di riduzione del numero degli stimoli si rifanno a schemi di disegno degli esperimenti e si fondano sulla stima degli effetti principali degli attributi e, a volte, degli effetti della interazione tra due attributi, assumendo che le interazioni di ordine più elevato siano trascurabili8. Per quanto attiene la presentazione degli stimoli all’ intervistato, possono essere impiegate tre modalità alternative: la descrizione verbale, la rappresentazione visiva, la rappresentazione verbale e visiva. Nella descrizione verbale per ciascuno stimolo oggetto di valutazione si predispone una scheda che contiene una descrizione generale del prodotto e le caratteristiche tecniche, cioè i livelli degli attributi. Dato che le valutazioni risultano in qualche modo dipendenti dall’ ordine con cui vengono sottoposte all’ intervistato, le schede andrebbero disposte quanto più possibile casualmente sopra un tavolo di grandi dimensioni. La rappresentazione visiva comporta sicuri vantaggi in termini di carico di informazioni trasmesse all’ intervistato, al quale viene risparmiato lo sforzo di traduzione dal livello verbale a quello visivo. Tuttavia, il modo migliore di rappresentare gli stimoli all’ intervistato è quello congiunto, presentando cioè l’ immagine del prodotto che corrisponde a quello stimolo. Quando possibile, per ingombri e fattibilità tecnica, è utile presentare il prototipo del prodotto, unitamente a una scheda tecnica contenente la descrizione delle caratteristiche tecniche e il livello del prezzo. 5.4.3 La stima del modello

8 Tra tali metodi di riduzione vanno citati quello delle matrici ortogonali, il quadrato latino e il campionamento casuale da una distribuzione multivariata. Per una trattazione di tali metodi di disegno degli esperimenti si veda Molteni (1993).

Page 52: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

I metodi di stima utilizzabili per l’ analisi congiunta sono diversi a seconda della modalità di rilevazione delle preferenze. Nel caso di preferenze rilevate in modo metrico, cioè in termini di punteggio, il modello può essere stimato mediante una regressione lineare multipla, con il metodo dei minimi quadrati ordinari, ponendo il vettore delle preferenze come variabile di risposta e i k pseudoattributi come variabili esplicative (vedi Capitolo 4). Quando invece si chiede all’ intervistato di effettuare un ordinamento degli stimoli si può ricorrere alla procedura MONANOVA di Kruskal (1965). Il metodo MONANOVA fornisce le stime delle utilità parziali dei singoli attributi in modo tale che l’ ordinamento delle loro somme (utilità globale) rispecchi il più possibile l’ ordinamento dei valori di preferenza espressi dall’ intervistato. Consideriamo il caso del modello misto. In primo luogo i valori di preferenza espressi dall’ intervistato per ciascuno stimolo (pj) vanno assegnati in ordine inverso, ovvero allo stimolo preferito va assegnato un valore massimo, di solito pari al numero degli stimoli, mentre allo stimolo meno preferito va assegnato il valore minimo, pari a uno. L’ utilità globale stimata per il j-esimo stimolo è data dalla seguente espressione:

jU = c + �=

k

t 1

ωt zjt,

dove c e ωt sono i k+1 parametri stimati in relazione ai k pseudoattributi. In particolare, ωt saranno le stime di ut. Assumendo pj come variabile dipendente e ztj (t = 1, … k) come variabili indipendenti, la stima dei parametri del modello avviene mediante il metodo dei minimi quadrati con vincoli sugli ordinamenti della variabile dipendente. Per chiarire meglio, a differenza del metodo dei minimi quadrati ordinari, che stima i parametri minimizzando la somma dei quadrati degli scarti tra valori osservati e valori teorici, in questo caso la stima avviene in modo da minimizzare le violazioni, da parte dei valori stimati jU , dell’ ordinamento dei valori di preferenza espressi (pj). Tornando all’ esempio, se p assume un valore più elevato per un certo pacchetto turistico rispetto a un altro, anche il valore U relativo al primo pacchetto dovrà essere maggiore, o al più uguale, a quello assunto dal secondo. Per quanto attiene alla misura della bontà dell’ adattamento, una volta stimato il modello si tratta di verificare quante correzioni sono necessarie alla U per arrivare a una U che sia in relazione di monotonicità debole con la p. Si calcola cioè U = jU + e In modo tale che: se pa > pb -----� Ua � Ub L’ indice più comunemente utilizzato per valutare la bontà dell’ adattamento ordinale di U con p è l’ indice di STRESS, definito nel modo seguente:

S = [�=

n

j 1

( )ˆjj UU − ]2 / �

=

n

j 1

[( jU – )ˆ( jUµ )2]1/2,

Page 53: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

dove: • n è il numero degli stimoli sottoposti a valutazione; • )ˆ( jUµ è la media aritmetica di jU .

L’ indice di STRESS può essere visto come una misura relativizzata di quanto U viola l’ ordinamento delle preferenze espresse p. Infatti, al numeratore figura la devianza del vettore dei termini di correzione e9, mentre al denominatore troviamo la devianza di U , che è un fattore di scala che serve a relativizzare la misura del numeratore. Un valore dell’ indice di STRESS pari a zero significa che il vettore dei termini di correzione è costituito da tutti termini nulli e che, dunque, U rispecchia perfettamente l’ ordinamento delle preferenze p. Valori dell’ indice via via più elevati stanno invece a significare che U viola sempre più l’ ordinamento di p. Un altro indicatore della bontà dell’ adattamento è il coefficiente di correlazione tra ranghi di Spearman tra U e p. Nella Tabella 5.5.2 viene proposto un esempio di calcolo del vettore di correzione e, da sommare al vettore U per ottenere U che sia in relazione monotona non decrescente con p. Tabella 5.5.2 Relazioni tra p U e U.

p U U e 15 4,03 4,03 0,00 14 3,56 3,56 0,00 13 3,53 3,53 0,00 12 2,86 2,90 0,04 11 2,94 2,90 -0,04 10 2,70 2,70 0,00 9 2,58 2,58 0,00 8 2,23 2,23 0,00 7 1,94 2,10 0,16 6 2,16 2,10 -0,06 5 2,20 2,10 -0,10 4 1,90 1,90 0,00 3 1,54 1,54 0,00 2 1,23 1,23 0,00 1 1,12 1,12 0,00

Nella Tabella: 15 è il numero degli stimoli sottoposti all’ intervistato per la valutazione di preferenza in termini ordinali; p è la preferenza espressa dall’ intervistato in ordine decrescente, cioè p = 15 è lo stimolo preferito e p = 1 il meno preferito; U è l’ utilità globale che deriva dalla stima di un modello di regressione di p sui livelli, o trasformazione di livelli, degli pseudo attributi; U è il vettore derivante dalle minime trasformazioni di U tale da essere in condizione monotona non decrescente con p; e è il vettore di tali minime trasformazioni additive. Nella Figura 5.5.1 è riportato il grafico dell’ andamento di U e U in relazione a p.

9 In quanto, per costruzione, ei=Uj – jU e la media del vettore e è pari a zero.

Page 54: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Infine, per misurare l’ importanza relativa del t-esimo attributo nel processo di scelta del consumatore si può ricorrere alla seguente espressione:

IMPt = [max(Ut) – min(Ut)] / �=

k

h 1

[max(Ut) – min(Ut)].

Si tratta del rapporto tra il range di utilità relativo all’ attributo considerato e il range complessivo di utilità per tutti gli attributi. Altri modelli consentono di simulare il processo di scelta dei potenziali clienti e di stimare la quota di consumatori che sceglierà un particolare profilo di offerta (stimolo), definito in base ai livelli degli attributi considerati. Al riguardo si segnalano il modello first-choice, il modello BTL e il modello Logit10. Figura 5.5.1 Utilità U e U in relazione alla preferenza.

5.4.4 L’analisi congiunta in SAS 10 Per una trattazione di questi metodi si rimanda a Molteni (1993).

Utilità U^ ed U in relazione alla preferenza

0

0.5

1

1.5

2

2.5

3

3.5

4

4.5

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

p

U^

U

Page 55: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

La procedura SAS che consente di realizzare l’ analisi congiunta è la PROC TRANSREG. Essa consente di stimare modelli di regressione con trasformazioni non lineari delle variabili e di stimare i parametri dell’ analisi congiunta sia di tipo metrico che non metrico. La sintassi essenziale è la seguente. PROC TRANSREG UTILITIES DATA=nome; Il sds che contiene gli stimoli con le modalità degli attributi e le valutazioni. Lo statement fondamentale è: MODEL seguito da LINEAR per un’ analisi congiunta di tipo metrico. MONOTONE per un’ analisi congiunta di tipo non metrico. (variabile dipendente/ REFLECT) = CLASS( ) IDENTITY( ) MONOTONE ( ) WEIGHT peso; Per analisi di simulazione. OUTPUT DAPPROXIMATION OUT=nome Sds di output. Esempio 5.5.1 Applicazione della procedura transreg Di seguito viene riportato il programma che realizza l’ analisi congiunta relativamente all’ esempio sulle preferenze dei viaggi mare. Quattro sono gli attributi considerati.

1. Il luogo del viaggio con tre livelli (Mar Rosso, Oceano indiano e Cuba); 2. Il prezzo con tre livelli (1000, 1500 e 2000 euro); 3. Il trattamento anch’ esso con tre livelli (mezza pensione, pensione completa e all inclusive); 4. La durata del viaggio (1 o 2 settimane).

I 54 stimoli che esprimono tutte le combinazioni tra tutti i livelli degli attributi (3x3x3x2) sono stati ridotti a 24 eliminando quelli improbabili. Per esempio sono state eliminate tutte le combinazioni Mar Rosso e Oceano indiano con il prezzo massimo di 2000 euro, nonché le combinazioni che prevedono Cuba a 1000 euro. title 'Analisi congiunta non metrica sugli ordinamenti'; proc format; value luogof 1 = 'Mar Rosso ' 2 = 'Oceano Ind' 3 = 'Cuba '; value Prezzof 1 = '1000' 2 = '1500' 3 = '2000'; value Trattamentof 1 = 'mezza pensione' 2 = 'pensione compl' 3 = 'All inclusive '; value durataf 1 = '1 settimana' 2 = '2 settimane'; run; data mare; input luogo Prezzo trattamento durata Rank; format luogo luogof11. Prezzo prezzof4. trattamento trattamentof14. durata durataf11.; datalines;

Page 56: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

1 1 2 1 3 1 1 2 2 2 1 1 3 1 14 1 1 3 2 10 1 2 2 1 17 1 2 2 2 12 1 2 3 1 21 1 2 3 2 22 2 1 2 1 7 2 1 2 2 1 2 1 3 1 8 2 1 3 2 5 2 2 2 1 13 2 2 2 2 16 2 2 3 1 19 2 2 3 2 23 3 2 1 1 6 3 2 2 1 4 3 2 3 1 15 3 2 1 1 9 3 3 3 2 18 3 3 1 2 11 3 3 2 2 20 3 3 2 2 24 ; proc transreg maxiter=50 utilities short; ods select ConvergenceStatus FitStatistics Utilities; model monotone(Rank / reflect) = class(luogo prezzo durata trattamento / zero=sum); output ireplace predicted; run; proc print label; var Rank TRank PRank luogo prezzo durata trattamento; label PRank = 'Predicted Ranks'; run; �

����������������������������������� ��A�

���������������<���H=�

������������������������,�����-�$�

�������������������� ������"$#)''2����������#$(�#)�

��������������������������%"$'####�����������#$(%�/�

����������������44�8�������%)$'"�)2�

��������������0������������ �0������������������0��� ��������

����������������������������1�������-��

�������������������������������<I������� �

������-�������������������� ����������1����,�����=��8����0����

1������������������%%$&/#���#$)�//#����������1���������

�����������������������&$(%"���#$/&)%'�����"%$�"/�������$�������B������

�����>������1����������%$2'/���#$/&)%'���������������$����>�����B1��

������0������������'$/)(���%$#�("2���������������$�����0��

Page 57: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

C��--��%###����������%"$�"%���#$("#))�����''$)2��������$C��--�%###�

C��--��%'##�����������#$&"#���#$/#%�)���������������$C��--�%'##�

C��--��"###�����������%"$/�#���%$")((%���������������$C��--�"###�

�����%������������������%$%&(���#$'%)�#������'$#�#�������$����%B����������

�����"�����������������%$%&(���#$'%)�#���������������$����"B����������

��������������--�������������&$)2/���%$#�%2'�����%/$2�(�������$�������������--�B���������

�����������������������������#$)(%���#$)/)''���������������$�������������������B������

����������������������,������$&/2���#$/#�('���������������$��������������B������,��

A������������������������������������������4������7�����,����0���������������������������4�������

���������������������������0������<��������������=$�

����������������������������������������������������������������������%"�

�������������H�����C�������

>�������H������4����-����������H�������������C��--������������������������

�%���&�����%($2)2&����%($�&#2����������������%###���%���������������������������

�"���"�����""$"2('����"%$/#2&����������������%###���"���������������������������

�&���%������%#$(&//����%�$&)%"����������������%###���%����������������������,��

�����%#�����%)$(###����%)$)&22����������������%###���"����������������������,��

�'���%/�����/$##&������/$&"()����������������%'##���%���������������������������

�)���%"�����%#$(&//�����($)#/%����������������%'##���"���������������������������

�/���"%�����&$()2'�����"$")#%����������������%'##���%����������������������,��

�2���""�����&$()2'������$'&/)����������������%'##���"����������������������,��

�(���/�����%($/"2/����"%$�2)%���>������1����%###���%���������������������������

�%#���%�����"�$�/�'����"&$/)&)���>������1����%###���"���������������������������

�%%���2�����%2$'/"%����%)$�%))���>������1����%###���%����������������������,��

�%"���'�����%($/"2/����%2$)(�%���>������1����%###���"����������������������,��

�%&���%&�����%#$(&//�����($&2�(���>������1����%'##���%���������������������������

�%����%)�����%#$(&//����%%$))"'���>������1����%'##���"���������������������������

�%'���%(�����&$()2'������$&%'����>������1����%'##���%����������������������,��

�%)���"&�����&$()2'�����)$'(&#���>������1����%'##���"����������������������,��

�%/���)�����%($/"2/����"#$##)(����0�������%'##���%��������������--�����������

�%2���������%($/"2/����%/$#%%'����0�������%'##���%���������������������������

�%(���%'�����%#$(&//����%%$(�%(����0�������%'##���%����������������������,��

�"#���(�����%2$'/"%����"#$##)(����0�������%'##���%��������������--�����������

�"%���%2�����&$()2'�����%$%'(2����0�������"###���"����������������������,��

�""���%%�����%#$(&//�����($""�/����0�������"###���"��������������--�����������

�"&���"#�����&$()2'�����)$""(&����0�������"###���"���������������������������

�"����"������&$()2'�����)$""(&����0�������"###���"��������������������������

Page 58: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

5.5 Un caso di studio A conclusione del capitolo presentiamo un caso di studio relativo al Centro commerciale Alfa. Si tratta di un’ analisi di posizionamento relativo effettuata da un centro commerciale a distanza di circa due anni dalla sua inaugurazione. Le motivazioni che hanno indotto la direzione a realizzare questa indagine, oltre a una verifica sulla tipologia di clientela prevalente, sono state dettate dal fatto che il volume dei ricavi, sia del grande supermercato alimentare sia degli altri esercizi commerciali, si era attestato su valori decisamente inferiori alle attese. L’ indagine è avvenuta tramite intervista diretta a un campione di clienti potenziali del centro commerciale. Si è deciso di realizzare un’ indagine campionaria su tutta la popolazione residente nell’ area oggetto di studio, definita in via convenzionale con l’ isocrona dei 20 minuti di tempo di percorrenza stradale dalla sede del centro. Il campione è stato estratto dalle liste telefoniche. L’ indagine è avvenuta mediante intervista diretta con rilevatore presso il domicilio del nucleo familiare. I rilevatori sono stati lasciati liberi in merito alla possibilità di tentare o meno un contatto telefonico per prendere un appuntamento con la famiglia. In ogni caso, risorse rilevanti sono state impiegate per ridurre al minimo la quota di non risposte totali, in particolare tornando più volte in caso di famiglia assente o presenza di persona non idonea a rispondere. Essendo la residenza della famiglia l’ unica informazione ausiliaria presente nelle liste telefoniche, si è adottato uno schema di campionamento di tipo stratificato per zona di residenza della famiglia. In sede di progettazione dell’ indagine è stata fissata una numerosità campionaria di 763 nuclei familiari, pari al 2,6% rispetto alle circa 29 mila famiglie residenti nell’ area di studio. Per evitare la dilatazione dei tempi della rilevazione con la sostituzione delle unità non rispondenti, si è fatta l’ ipotesi di avere un tasso di mancate risposte del 17% e si è effettuato un sovracampionamento, senza successiva sostituzione delle unità non rispondenti, pari a 922 nuclei familiari. Tra gli obiettivi conoscitivi dell’ analisi vi era la valutazione delle opinioni dei non clienti e dei fattori che ne determinano lo stato. Le opinioni dei non clienti risultavano infatti determinanti alla direzione del centro al fine di mettere in campo idonee strategie di promozione e immagine finalizzate a un recupero di quote di mercato. L’ area oggetto di studio è stata inoltre ripartita in cinque sub-aree; l’ area di prossimità, coincidente con l’ isocrona dei 10 minuti e le altre aree per direzione di provenienza. In questo esercizio applicativo ci limitiamo ad analizzare le metodologie utilizzate e le risposte date dall’ analisi in relazione all’ obiettivo proposto in relazione all’ area di prossimità. Il questionario, strutturato in modo da rispondere agli obiettivi conoscitivi richiesti, si componeva delle seguenti parti:

• composizione e struttura del nucleo familiare; • spesa in beni alimentari e ripartizione tra i vari esercizi; • opinioni delle diverse insegne di supermercati; • domanda filtro: Quante volte ha frequentato il centro commerciale?

Mai Si chiede la motivazione e termina il questionario. < 5 volte Si rilevano le opinioni dei non clienti. >= 5 volte Si rilevano le opinioni dei clienti abituali o occasionali.

Per quanto attiene alle opinioni dei non clienti le domande del questionario erano le seguenti. D14 – In generale che cosa ne pensa del Centro commerciale Alfa? - È una bella realizzazione per la nostra zona. - È bello e funzionale ma non risponde alle mie esigenze. - È inutile: c’ erano già abbastanza negozi e supermercati. - È dannoso: toglie lavoro agli altri negozi. - È esagerato rispetto alla nostra zona.

Page 59: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

D15 – Che cosa ne pensa dei prezzi? - Inferiori a quelli degli altri esercizi. - Più o meno allo stesso livello. - Superiori a quelli dei negozi di cui mi servo. D16 – Che cosa ne pensa dell’ assortimento dei prodotti? - Molto vasta. - Cose che trovo dovunque. - Molto vasta ma di prodotti che non mi interessano. Al fine di effettuare un raggruppamento dei non clienti dell’ area di prossimità è stata effettuata una analisi dei gruppi. Le variabili inserite nell’ analisi, oltre alle domande 14, 15 e 16, sono la dimensione del nucleo familiare, l’ età del capofamiglia, la spesa procapite per beni alimentari, e la condizione occupazionale del capofamiglia. Essendo il data set composto sia da variabili quantitative che qualitative, la matrice delle distanze è stata calcolata utilizzando l’ indice di Gower e a essa è stata applicata una analisi dei gruppi col metodo gerarchico del legame completo. Di seguito si riporta il programma utilizzato e l’ output della procedura che contiene la matrice dei dati di dimensioni 41x7, uno stralcio della matrice delle distanze di dimensioni 41x41, oltre alla procedura cluster e al dendrogramma. proc print data=caso1; var dimens cf_e d1_sproc cond d14 d15 d16; run; proc distance data=caso1 method=dgower out=risu shape=tri; var ratio(dimens cf_e d1_sproc) nominal(cond d14 d15 d16); run; proc print data=risu; run; proc cluster data=risu(type=distance) method=com outtree=topo nonorm; proc tree data=topo; run; ������>�����1��� ���4B���%B��������>������������%����%'���%)�

�������%����)����&2���%�%$))/��>��������������%���"���%�

�������"����"����&"����"'$###��>��������������%���"���%�

�������&����"�����)����"'$###��>��������������%���"���"�

������������'����''����2#$###����,$��������������%���%���%�

�������'����&����'2���%&&$&&&��C��������������������"���%���"�

�������)����"����/#���%##$###��C��������������������"���"���"�

�������/����&����/����%&&$&&&��C��������������������"���%���"�

�������2����&����)(���"2&$&&&��C��������������������"���"���"�

�������(����'����&2����2#$###��>��������������'���"���%�

�������%#����&����/&���%&&$&&&��C��������������������"���&���"�

�������%%����&����)&���"2&$&&&����,$��������������"���"���"�

�������%"���������&(���%##$###����,$��������������%���"���%�

�������%&����������"���%##$###����,$��������������%���"���%�

�������%�����"����)2����"'$###��C������������������������"���%�

�������%'����&����'(���%&&$&&&��C������������������������%���%�

�������%)����"����'/���%##$###��>��������������#���#���#�

�������%/���������&2���&%"$'##����,$��������������"���"���%�

�������%2����&����'����%&&$&&&��C��������������������"���"���%�

�������%(��������������%##$###����,$��������������'���"���%�

�������"#����&����'"����%)$))/����,$������������������"���%�

�������"%���������&/���&/'$###��>��������������%���"���%�

Page 60: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

�������""���������'"���%##$###����,$��������������#���#���#�

�������"&����%����(����2'#$###��C������������������������"���%�

�������"�����&����)"���%&&$&&&��C��������������������&���"���%�

�������"'���������)/���&%"$'##��C��������������������&���"���%�

�������")����'����'����%"#$###��1���������������$���%���"���%�

�������"/����&�����"���%&&$&&&��1���������������$���%���"���%�

�������"2����"����'2����"'$###��>��������������%���"���&�

�������"(����'����&)����2#$###��>��������������%���"���%�

�������&#����������2���%'#$###����,$��������������'���#���%�

�������&%���������)(���%##$###����,$��������������#���#���#�

�������&"����&����)"���%&&$&&&��C��������������������&���#���%�

�������&&����"����)'����"'$###��C��������������������"���#���%�

�������&�����������&���%##$###��>��������������%���"���%�

�������&'����"����))���"##$###��C��������������������%���#���%�

�������&)����'����'2���"'#$###��C��������������������%���"���%�

�������&/����"����")����"'$###����,$��������������'���"���%�

�������&2����%����/)���"##$###��C��������������������%���"���%�

�������&(����'�����&���%"#$###��1���������������$���%���"���%�

��������#���������''���&%"$'##��>��������������%���#���%�

��������%����"����)#���%##$###��C��������������������'���"���% �

��>�������%������"������&�������������'������)������/������2������(������%#��

���%�#$#####�$����$����$����$����$����$����$����$����$�����

���"�#$%'%(2�#$#####�$����$����$����$����$����$����$����$�����

���&�#$"(/2/�#$%)�%&�#$#####�$����$����$����$����$����$����$�����

�����#$&�'/"�#$�'##2�#$'/%))�#$#####�$����$����$����$����$����$�����

���'�#$)/�)'�#$)2&//�#$'%()��#$�2(/%�#$#####�$����$����$����$����$�����

���)�#$'/(���#$'�#(��#$&/)2%�#$))(#%�#$%(#'%�#$#####�$����$����$����$�����

���/�#$)(2(/�#$/#2#(�#$'�&('�#$'%�#&�#$#"�&"�#$%/2&'�#$#####�$����$����$�����

���2�#$'/#("�#$'&"�"�#$&)2"(�#$)/�'#�#$%2�/2�#$#')%��#$%/')/�#$#####�$����$�����

���(�#$%//#&�#$"2%&(�#$�"/"2�#$�'��%�#$)'2�%�#$''%((�#$)2"/"�#$''/�2�#$#####�$�����

���%#�#$)(/�'�#$/#)'/�#$'�"�&�#$)''&/�#$%)')'�#$%/)2&�#$%��&2�#$%/�%'�#$)2%"#�#$#####��

����������������������������� ����

������������������������������������������������

������������������������������������

�����������������������������������

�������������������������������������

��������������������������������������������+����

���������#��>!%"����>!%&�������"��#$##�)�

��������&(��>!")����>!&(�������"��#$#%)/�

��������&2��>!'�����>!/�������"��#$#"�&�

��������&/��>!""����>!&%�������"��#$#"'2�

��������&)��>!%�����>!"(�������"��#$#&/"�

��������&'��>!"%����>!&������������"����#$#''&�

����������������&�����>!)���������>!2��������������"����#$#')%�

����������������&&����>!"���������>!"'�������������"����#$#)%'�

����������������&"������&(��������>!"/�������������&����#$#)2%�

����������������&%������&)����������&'������������������#$#22��

����������������&#����>!%(��������>!&/�������������"����#$%"()�

����������������"(����>!&)��������>!&2�������������"�����#$%&%�

����������������"2����>!%���������>!"&�������������"����#$%&�2�

����������������"/������&%��������>!"��������������'�����#$%'"�

����������������")����>!&���������>!"2�������������"����#$%)%%�

����������������"'������&2��������>!%#�������������&����#$%)'/�

����������������"�����>!%2��������>!�%�������������"����#$%2%��

����������������"&����>!&&��������>!&'�������������"����#$%2""�

����������������""�������#��������>!%/�������������&����#$%2�/�

Page 61: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

����������������"%������"'����������&��������������'����#$%(#'�

����������������"#������&&��������>!&"�������������&����#$"#���

����������������%(����>!%)����������&/�������������&����#$"#2/�

����������������%2������&#��������>!"#�������������&�����#$"&"�

����������������%/������"�����������"(������������������#$"�"'�

����������������%)������"/��������>!�#�������������)�����#$"�'�

����������������%'������""����������%2�������������)����#$")(��

����������������%�������"%��������>!%%�������������)����#$&"/)�

����������������%&����>!����������>!&#�������������"����#$&&%(�

����������������%"����>!(�����������&"������������������#$&�2��

����������������%%����>!%'����������"#������������������#$&'%2�

����������������%#������%)����������")�������������2����#$&)'(�

�����������������(������%%����������"&�������������)����#$&)//�

�����������������2������"2����������%/�������������)����#$&(&)�

�����������������/������%#����������%"������������%"����#$��''�

�����������������)������%&����������%'�������������2����#$�'("�

�����������������'������2�����������(�������������%"����#$'#"��

������������������������%�����������'�������������%2����#$)'%&�

�����������������&������/�����������)�������������"#����#$)2#'�

�����������������"������&�������������������������&2����#$/%/"�

�����������������%������"�����������%(�������������%����#$2&"/ Alla prima iterazione l’ analisi dei gruppi va a cercare il minimo valore all’ interno della matrice D e procede alla fusione degli elementi corrispondenti; questo minimo valore corrisponde a 0,046 e vengono fusi i soggetti 12 e 13. Dalla matrice dei dati si può osservare come i soggetti 12 e 13 abbiano espresso esattamente le stesse opinioni sul centro commerciale; sono entrambi lavoratori indipendenti, entrambe le famiglie sono di 4 componenti e hanno la stessa spesa media mensile per componente pari a 100 euro; l’ unica differenza è nell’ età del capofamiglia, il primo di 39 anni e il secondo di 42. Alla terza iterazione vengono aggregati i soggetti 5 e 7 a un livello di distanza pari a 0,0243 che si può evidenziare anche nello stralcio della matrice D che viene riportato. La procedura continua poi ad aggregare mettendo insieme soggetti via via meno simili.

Distanza massima tra cluster

0. 0

0. 2

0. 4

0. 6

0. 8

1. 0

Nome del l ' osservazi one o cl ust er

OB1

OB29

OB21

OB34

OB2

OB40

OB3

OB28

OB9

OB26

OB39

OB27

OB4

OB30

OB12

OB13

OB17

OB19

OB37

OB20

OB5

OB7

OB10

OB6

OB8

OB11

OB14

OB23

OB18

OB41

OB36

OB38

OB15

OB24

OB25

OB32

OB33

OB35

OB16

OB22

OB31

Page 62: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Sulla base del dendrogramma si è deciso di arrestare il processo di aggregazione con la considerazione di 5 gruppi in quanto raggruppamenti ulteriori avvenivano a livelli di distanza piuttosto elevati. Tabella 5.6.1 Alcune caratteristiche distintive dei gruppi

Identificate attraverso una analisi descrittiva delle principali variabili rilevate, le caratteristiche distintive dei gruppi sono le seguenti.

• Gruppo 1: famiglie giovani o di mezza età, con figli e spesso allargate ai nonni con il capofamiglia generalmente dipendente e opinioni piuttosto neutrali sul centro commerciale.

• Gruppo 2: famiglie giovani o di mezza età, spesa media alta, capofamiglia indipendente e opinioni decisamente negative sul centro commerciale; si tratta spesso di commercianti che probabilmente vedono direttamente penalizzati i propri interessi dall’ apertura del centro commerciale.

• Gruppo 3: famiglie anziane con bassa spesa procapite, prevalentemente pensionati, e opinioni mediamente negative sul centro.

• Gruppo 4: famiglie anziane, con spesa media elevata, pensionati e opinioni piuttosto indifferenti.

• Gruppo 5: anziani, con spesa bassa e opinioni non espresse. Successivamente, sulla stessa matrice delle distanze, è stata effettuata una analisi di scaling multidimensionale non metrica con due dimensioni. Il programma utilizzato e il relativo output sono i seguenti. PROC MDS DATA=RISU LEVEL=ORDINAL DIM=2 OUT=RISU1; PROC PRINT DATA=RISU1; RUN; ����������������� ��������������������@������*9>�D$�1 �$�����

���������������������*��1��A�������-����*����1E���,����*>��1����

������������������4*1����1�G�����������*"�������*%�����������*%�

��������������,����*#$#%�A���,����*#$#%���+����*%##�>,��*"�����*#$###%�

��������������������������������������������������������������������,�����-��

����������������������������!��������������0�����������......................�

�1����-������������������������4�������������������������������������A��������

�.............................................................................�

�������#�������1��-�����������#$"2%#���������������$������������$������������$�

�������%����������������������#$"'#%����������#$#&%#�������#$%%)2�������#$�'#2�

�������"�������A����F��������#$"%�2����������#$#&'&������������$������������$�

�������&����������������������#$"%"2��������#$##%()"�������#$#"2%�������#$%//��

���������������A����F��������#$"%##��������#$##"2#%������������$������������$�

�������'����������������������#$"#2���������#$##%)�"�������#$#"�)�������#$%&#2�

�������)�������A����F��������#$"#/#��������#$##%�%#������������$������������$�

Occupazione del capofamiglia (%)

Dipendenti Indipendenti Pensionati

1 12 3,92 43 228 91,7 8,3 0,02 8 3,75 43 211 0,0 100,0 0,03 6 2,83 67 178 0,0 16,7 83,34 12 2,58 66 275 8,3 0,0 91,75 3 3,33 59 100 33,3 66,7 0,0

Totale 41 3,29 54 221 31,7 29,3 39,0

Spesa media alimentare pro

capiteGruppo Numerosità

del gruppo

Dimensione media del

nucleo fam.

Età media del capofamiglia

Page 63: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

�������/����������������������#$"#))��������#$###&/%�������#$#%%/�������#$#('(�

�������2�������A����F��������#$"#)"��������#$###&/%������������$������������$�

�������(����������������������#$"#)%�������#$####22������#$##))")�������#$#2""�

������%#�������A����F��������#$"#'���������#$###/&#������������$�������#$#%%)�

������%%�������A����F��������#$"#'��������#$####"%/������������$�����#$##/'/"�

��������1��������������,�����-�����������4����$�

Nelle successive iterazioni della procedura il criterio di badness of fit, misurato attraverso l’ indice di Stress passa da 0,28 a 0,20 il che evidenzia un adattamento appena sufficiente. �

�>�����B�1��� B���B����1EB���B�GC�B������B��!��B���B����B��������%����������"�

���%�������"����������$��������1���1>������������������������#$"#'�#�����$�

���"�������"����������$�������>��1A����������%���������%�����%$&'&2�����#$"�%)#�

���&�������"����������$�������>��1A����������"���������"�����%$%�'%)����#$))/#/�

�����������"����������$�������>��1A����������&���������&�����%$#'"#(����%$&#''"�

���'�������"����������$�������>��1A��������������������������#$22##'����%$"#�()�

���)�������"����������$�������>��1A����������'���������'�����"$#('2"����#$"&"&&�

���/�������"����������$�������>��1A����������)���������)�����%$&/&2'����#$(&#2)�

���2�������"����������$�������>��1A����������/���������/�����"$%(/##����#$&'('"�

���(�������"����������$�������>��1A����������2���������2�����%$&&%"/����#$(%%''�

��%#�������"����������$�������>��1A����������(���������(�����%$�#/%)����#$%/(�'�

��%%�������"����������$�������>��1A����������%#��������%#����"$%(#�"����#$'(#"%�

��%"�������"����������$�������>��1A����������%%��������%%����%$��(�"����#$&2'���

��%&�������"����������$�������>��1A����������%"��������%"����#$/(/)�����#$&"����

��%��������"����������$�������>��1A����������%&��������%&����#$/)%%�����#$&%�2(�

��%'�������"����������$�������>��1A����������%���������%�����#$""%/)����%$#(%)��

��%)�������"����������$�������>��1A����������%'��������%'����%$%))������#$&)%)��

��%/�������"����������$�������>��1A����������%)��������%)����#$()(%/����"$%)(#)�

��%2�������"����������$�������>��1A����������%/��������%/����#$%�((#����#$'%'(2�

��%(�������"����������$�������>��1A����������%2��������%2����#$'"//%����#$&&""%�

��"#�������"����������$�������>��1A����������%(��������%(����#$'&'#&����#$/'&')�

��"%�������"����������$�������>��1A����������"#��������"#����#$"'%�%����#$"'�)(�

��""�������"����������$�������>��1A����������"%��������"%����%$%2�')����#$�#�2/�

��"&�������"����������$�������>��1A����������""��������""����#$&�)/�����"$&%/)/�

��"��������"����������$�������>��1A����������"&��������"&����#$&/%(%����"$#"%&#�

��"'�������"����������$�������>��1A����������"���������"�����#$�#")/����#$�/2�(�

��")�������"����������$�������>��1A����������"'��������"'����#$"//&�����#$/'%(&�

��"/�������"����������$�������>��1A����������")��������")����#$('&(�����#$"&((/�

��"2�������"����������$�������>��1A����������"/��������"/����#$/'�2/����#$"2'#&�

��"(�������"����������$�������>��1A����������"2��������"2����%$&')"(����%$"%2#/�

��&#�������"����������$�������>��1A����������"(��������"(����%$"2'#(����#$%/#&)�

��&%�������"����������$�������>��1A����������&#��������&#����#$%(2/"����%$�(/(%�

��&"�������"����������$�������>��1A����������&%��������&%����#$')/�(����"$&"%'&�

��&&�������"����������$�������>��1A����������&"��������&"����%$#'//"����#$))(%��

��&��������"����������$�������>��1A����������&&��������&&����%$"�/(/����#$#/&#��

��&'�������"����������$�������>��1A����������&���������&�����%$#/#'"����#$#/&'��

��&)�������"����������$�������>��1A����������&'��������&'����#$'2//)����#$%'%%��

��&/�������"����������$�������>��1A����������&)��������&)����#$&%(/2����#$'&(#"�

��&2�������"����������$�������>��1A����������&/��������&/����#$/'"'(����#$/2�2#�

��&(�������"����������$�������>��1A����������&2��������&2����#$%/"/)����#$2&'�"�

���#�������"����������$�������>��1A����������&(��������&(����%$#/"'(����#$%))(2�

���%�������"����������$�������>��1A�����������#���������#����%$"&((#����#$2&�2"�

���"�������"����������$�������>��1A�����������%���������%����#$&%"'(����#$'�&&2 Nel grafico seguente sono rappresentate le unità statistiche appartenenti ai 5 gruppi secondo le nuove dimensioni emerse dall’ analisi di scaling multidimensionale.

Page 64: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Se si eccettua qualche possibile confusione tra il gruppo 3 e il gruppo 4, e una unità del gruppo 1 che appare più lontana dalle altre, l’ analisi di scaling multidimensionale conferma i risultati dell’ analisi dei gruppi e ne consente una immediata percezione visiva mediante la rappresentazione grafica. Inoltre, attraverso lo studio dell’ associazione tra le nuove dimensioni che emergono dall’ analisi di scaling multidimensionale e le variabili osservate, si può tentare di dare un’ interpretazione agli assi dello spazio di proiezione. Nel nostro caso l’ asse verticale è risultato molto legato positivamente all’ età del capofamiglia e in modo inverso alla dimensione del nucleo familiare, mentre l’ asse orizzontale è risultato positivamente correlato alla spesa media pro capite.

Famiglie non clienti dell'area di prossimità secondo il gruppo e le dimensioni dello scaling multidimensionale

-2

-1,5

-1

-0,5

0

0,5

1

1,5

2

2,5

-3 -2 -1 0 1 2 3

Dim 2

Dim

1

gruppo 1gruppo 2gruppo 3gruppo 4gruppo 5

Page 65: 5. Le tecniche di analisi multidimensionale e la ... · Nell’ambito delle tecniche statistiche che costituiscono l’analisi dei gruppi, una prima distinzione va fatta tra metodi

Bibliografia essenziale Carrol, J.D. e Chang, J.J. (1970), Analysis of individual differences in multidimensional scaling via an n-way generalization of “Eckart-Young” decomposition, in Psycometrika, 35, pp.283-319. Chamberlin, E.G. (1933), The theory of monopolistic competition, Harvard University Press, Boston. Fabbris, L. (1997), Statistica multivariata. Analisi esplorativa dei dati, Mc-Graw Hill, Milano. Green, P.E. e Rao, V.R. (1971), Conjoint measurement for quantifying judgmental data, in Journal of marketing research, 8, pp. 355-363. Kruskal, J.B. (1964), Non-metric multidimensional scaling: a numerical method, in Psycometrica, 29, pp. 209-229. Kruskal, J.B. (1965), Analysis of factorial experiments by estimating monotone transformations of the data, in Journal of Royal Statistical Society, 27, pp. 251-263. Lancaster, K. (1966), A new approach to consumer theory, in Journal of Political economics, 74, pp. 132-157.