s. casacci, a. pareto - la costruzione di indicatori soggettivi mediante indici di dissomiglianza:...
TRANSCRIPT
La costruzione di indicatori soggettivi mediante indici di dissomiglianza: un’applicazione all’indagine sugli aspetti della vita quotidiana
Sara Casacci e Adriano ParetoIstituto Nazionale di Statistica
Sommario
1. Introduzione
2. I metodi classici
3. Il metodo basato sull’indice di dissomiglianza
4. Un’applicazione ai dati di soddisfazione per la vita
5. Conclusioni
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
La costruzione di indicatori soggettivi riguardanti:- giudizi;- percezioni;- atteggiamenti;- ecc.nei confronti di un fenomeno, secondo le modalità di una variabile qualitativa ordinale, è una questione di particolare interesse in statistica.
Si pensi, in particolare, all’analisi dei dati riguardanti le opinioni dei cittadini, rilevate attraverso le indagini Multiscopo sulle famiglie condotte dall’Istat.
In tal caso, il problema è duplice e riguarda due aspetti:- la quantificazione;- la sintesi.
Introduzione
1La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
La quantificazione
Come passare da una misura su scala ordinale (per esempio, molto, abbastanza, poco, per niente) a una misura su scala di intervallo.
Introduzione
2La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Perché quantificare?
Fase descrittiva
Fase investigativa
Introduzione
3La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Ai fini della descrizione, la quantificazione è inutile e può essere fuorviante.
Per lo studio delle relazioni e i confronti, la quantificazione consente di superare i limiti degli strumenti per scale ordinali.
Esempio
Moda e mediana delle due distribuzioni sono uguali.
Per evidenziare lo ‘spostamento’ verso le modalità più basse, è necessario quantificare.
t0 t1
Molto 25 5Abbastanza 20 10Poco 50 45Per niente 5 40
Livello di soddisfazione
Frequenza (%)
La sintesi
Come passare da una misura su singoli individui (per esempio, l’insieme dei maschi) a una misura complessiva.
Introduzione
4La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
In questo lavoro, si propone un metodo per la costruzione di un indicatore soggettivo per gruppi di individui (per esempio, per regione).
Introduzione
5La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
REGIONE Molto Abbastanza Poco Per nienteIndicatore di
soddisfazione
Piemonte 1,9 40,1 39,2 18,8 ?Valle d'Aosta 4,6 53,9 29,7 11,8 ?Liguria 1,0 45,1 38,6 15,4 ?Lombardia 2,3 47,1 35,5 15,1 ?Bolzano/Bozen 8,2 63,3 22,0 6,6 ?Trento 2,6 61,0 25,7 10,7 ?Veneto 2,0 42,5 35,9 19,6 ?Friuli-Venezia Giulia 2,6 48,1 33,7 15,5 ?Emilia-Romagna 3,0 43,5 38,8 14,8 ?Toscana 2,4 41,7 39,7 16,2 ?Umbria 2,8 42,1 37,1 17,9 ?Marche 1,4 41,3 40,4 16,9 ?Lazio 1,7 38,0 40,8 19,5 ?Abruzzo 2,2 39,9 39,7 18,2 ?Molise 1,0 39,8 38,4 20,8 ?Campania 0,8 31,5 45,8 21,9 ?Puglia 1,6 30,8 45,9 21,7 ?Basilicata 1,4 41,0 39,5 18,2 ?Calabria 1,2 26,7 48,3 23,8 ?Sicilia 1,2 24,9 46,3 27,5 ?Sardegna 1,2 29,9 40,6 28,2 ?Italia 1,9 38,9 40,1 19,1 ?
Persone di 14 anni e oltre per livello di soddisfazione rispetto alla situazioneeconomica per regione - Anno 2013 (valori percentuali)
Metodo della percentuale (PERC): Si calcola la proporzione di tutti gli individui ‘soddisfatti’, a prescindere dal livello di soddisfazione.
I metodi classici
6La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Gruppo MoltoAbba-stanza
Poco Per niente Totale PERC
A 100 0 0 0 100 1,00B 50 50 0 0 100 1,00C 0 100 0 0 100 1,00D 25 20 50 5 100 0,45E 5 10 45 40 100 0,15F 0 0 100 0 100 0,00G 0 0 50 50 100 0,00H 0 0 0 100 100 0,00
Quantificazione diretta (EQUI): Si assegnano dei valori ordinati ed equidistanti ai livelli di soddisfazione e si calcola la media ponderata.
I metodi classici
7La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Gruppo MoltoAbba-stanza
Poco Per niente Totale EQUI
A 100 0 0 0 100 1,00B 50 50 0 0 100 0,83C 0 100 0 0 100 0,67D 25 20 50 5 100 0,55E 5 10 45 40 100 0,27F 0 0 100 0 100 0,33G 0 0 50 50 100 0,17H 0 0 0 100 100 0,00
Quantif. 1,00 0,67 0,33 0,00
Si calcola l’indice quadratico relativo di dissomiglianza della distribuzione di ciascun gruppo dalla distribuzione di massima insoddisfazione.
Il metodo basato sull’indice di dissomiglianza (DISS)
8La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Gruppo MoltoAbba-stanza
Poco Per niente Totale DISS
A 100 0 0 0 100 1,00B 50 50 0 0 100 0,87C 0 100 0 0 100 0,82D 25 20 50 5 100 0,62E 5 10 45 40 100 0,36F 0 0 100 0 100 0,58G 0 0 50 50 100 0,29H 0 0 0 100 100 0,00
Rif. 0 0 0 100 100
In formule, si ha:
dove: = freq. cumulata della modalità k nella distribuzione del gruppo G; = freq. cumulata della modalità k nella distribuzione di riferimento R;m = numero di modalità.
Poiché: = 0 (k=1, …, m-1) e = 1 (k=m)
si ottiene:
Il metodo basato sull’indice di dissomiglianza (DISS)
9La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
1
)F(FDISS
1-
1
2RG
2
mz
m
kkk
GFkRFk
1
)(FDISS
1-
1
2G
m
m
kk
RFkRFk
Un’applicazione ai dati di soddisfazione per la vita
I dati utilizzati sono tratti dall’Indagine sugli Aspetti della vita quotidiana.
10
Un’applicazione ai dati di soddisfazione per la vita
Le variabili analizzate riguardano la soddisfazione per l’anno trascorso rispetto ad alcuni aspetti della vita quotidiana:
Per queste informazioni sono disponibili le serie storiche dal 1993 a oggi.
11
Un’applicazione ai dati di soddisfazione per la vita
12
DISS
1992
1994
1996
1998
2000
2002
2004
2006
2008
2010
2012
2014
0 ,4
0 ,5
0 ,6
0 ,7
0 ,8
0 ,9
1 ,0In
dic
e d
i so
dd
isfa
zio
ne
EQUI
S ituaz ione_ec onomic a Sa lu te Re laz ion i_ f amilia r i Re laz ion i_c on_amic i Tempo_ libero
1992
1994
1996
1998
2000
2002
2004
2006
2008
2010
2012
2014
Anno
0 ,4
0 ,5
0 ,6
0 ,7
0 ,8
0 ,9
1 ,0
PERC
1992
1994
1996
1998
2000
2002
2004
2006
2008
2010
2012
2014
0 ,4
0 ,5
0 ,6
0 ,7
0 ,8
0 ,9
1 ,0
DISS è una via di mezzo e riesce a cogliere le differenze
tra ‘molto’ e ‘abbastanza’, senza quantificare
esplicitamente
PERC tende a separare i
‘soddisfatti’ dagli ‘insoddisfatti’,
perché aggrega
EQUI tende a ‘equidistanziare’
le ‘serie’, a causa della quantifica-
zione diretta
Risultati coerenti: tutti i metodi ricostruiscono gli
stessi andamenti nel tempoLe scale
sono uguali, ma i valori non sono
direttamente confrontabili
:PERC è una frequenza;EQUI è una
media;DISS è una
distanza
Un’applicazione ai dati di soddisfazione per la vita
13
DISS EQUI PERC DISS EQUI PERCDISS-EQUI
DISS-PERC
EQUI-PERC
Piemonte 0,528 0,417 0,420 14 14 14 0 0 0Valle d'Aosta 0,612 0,504 0,585 3 3 3 0 0 0Liguria 0,556 0,439 0,461 7 7 7 0 0 0Lombardia 0,567 0,455 0,494 5 5 5 0 0 0Bolzano/Bozen 0,680 0,577 0,714 1 1 1 0 0 0Trento 0,633 0,518 0,636 2 2 2 0 0 0Veneto 0,531 0,423 0,445 13 11 9 2 4 2Friuli-Venezia Giulia 0,569 0,460 0,508 4 4 4 0 0 0Emilia-Romagna 0,561 0,449 0,464 6 6 6 0 0 0Toscana 0,547 0,435 0,441 8 8 10 0 -2 -2Umbria 0,540 0,433 0,450 9 9 8 0 1 1Marche 0,539 0,424 0,427 10 10 11 0 -1 -1Lazio 0,519 0,407 0,398 15 15 16 0 -1 -1Abruzzo 0,531 0,420 0,421 12 12 13 0 -1 -1Molise 0,514 0,403 0,408 16 16 15 0 1 1Campania 0,488 0,371 0,323 18 18 18 0 0 0Puglia 0,490 0,375 0,325 17 17 17 0 0 0Basilicata 0,532 0,419 0,424 11 13 12 -2 -1 1Calabria 0,469 0,351 0,279 19 19 20 0 -1 -1Sicilia 0,445 0,333 0,262 21 21 21 0 0 0Sardegna 0,452 0,347 0,311 20 20 19 0 1 1Italia 0,524 0,413 0,409
Diff. media assoluta 0,2 0,7 0,6Rho di Spearman 0,995 0,982 0,990
Indice di soddisfazione sulla situazione economica per metodo di quantificazione - Anno 2013
Rango
Regione
Valore Differenza di rango
Le distribuzioni regionali sono concentrate, per circa l’80%, su ‘abbastanza’ e ‘poco’
(‘molto’ soddisfatti = 2%)
L’effetto ‘aggregazione’
di PERC è trascurabile
Per la situazione
economica, non ci sono differenze
rilevanti tra i metodi
Un’applicazione ai dati di soddisfazione per la vita
14
DISS EQUI PERC DISS EQUI PERCDISS-EQUI
DISS-PERC
EQUI-PERC
Piemonte 0,730 0,643 0,816 13 13 12 0 1 1Valle d'Aosta 0,755 0,670 0,853 3 3 3 0 0 0Liguria 0,738 0,654 0,830 8 9 6 -1 2 3Lombardia 0,748 0,666 0,847 4 4 4 0 0 0Bolzano/Bozen 0,801 0,749 0,918 1 1 1 0 0 0Trento 0,773 0,699 0,882 2 2 2 0 0 0Veneto 0,739 0,657 0,828 6 7 7 -1 -1 0Friuli-Venezia Giulia 0,745 0,666 0,841 5 5 5 0 0 0Emilia-Romagna 0,739 0,658 0,825 7 6 8 1 -1 -2Toscana 0,736 0,652 0,823 9 10 9 -1 0 1Umbria 0,735 0,655 0,821 10 8 10 2 0 -2Marche 0,733 0,645 0,819 11 12 11 -1 0 1Lazio 0,728 0,635 0,812 16 17 15 -1 1 2Abruzzo 0,732 0,648 0,815 12 11 14 1 -2 -3Molise 0,729 0,637 0,809 15 14 16 1 -1 -2Campania 0,730 0,636 0,815 14 16 13 -2 1 3Puglia 0,711 0,626 0,778 19 19 19 0 0 0Basilicata 0,721 0,627 0,799 17 18 18 -1 -1 0Calabria 0,701 0,610 0,758 20 20 20 0 0 0Sicilia 0,721 0,637 0,803 18 15 17 3 1 -2Sardegna 0,692 0,602 0,745 21 21 21 0 0 0Italia 0,732 0,646 0,817
Diff. media assoluta 0,8 0,6 1,0Rho di Spearman 0,983 0,990 0,968
Indice di soddisfazione sulla salute per metodo di quantificazione - Anno 2013
Rango
Regione
Valore Differenza di rango
Lievi differenze tra
i metodi
Le distribuzioni
regionali sono concentrate,
per oltre il 60%, su
‘abbastanza’ (‘per niente’ soddisfatti =
5%) Al max.
3 ranghi di diff.
Un’applicazione ai dati di soddisfazione per la vita
15
DISS EQUI PERC DISS EQUI PERCDISS-EQUI
DISS-PERC
EQUI-PERC
Piemonte 0,808 0,757 0,928 10 11 9 -1 1 2Valle d'Aosta 0,803 0,745 0,923 14 14 11 0 3 3Liguria 0,809 0,757 0,931 8 9 6 -1 2 3Lombardia 0,812 0,769 0,923 5 5 13 0 -8 -8Bolzano/Bozen 0,843 0,815 0,948 1 1 1 0 0 0Trento 0,830 0,796 0,942 2 2 2 0 0 0Veneto 0,812 0,769 0,921 4 4 15 0 -11 -11Friuli-Venezia Giulia 0,810 0,768 0,918 7 6 16 1 -9 -10Emilia-Romagna 0,807 0,760 0,914 12 8 19 4 -7 -11Toscana 0,811 0,767 0,922 6 7 14 -1 -8 -7Umbria 0,824 0,780 0,942 3 3 3 0 0 0Marche 0,808 0,751 0,934 9 12 4 -3 5 8Lazio 0,793 0,730 0,914 18 17 18 1 0 -1Abruzzo 0,807 0,757 0,923 11 10 12 1 -1 -2Molise 0,803 0,743 0,929 15 15 7 0 8 8Campania 0,785 0,708 0,909 20 21 20 -1 0 1Puglia 0,782 0,713 0,891 21 20 21 1 0 -1Basilicata 0,791 0,722 0,916 19 19 17 0 2 2Calabria 0,798 0,729 0,929 17 18 8 -1 9 10Sicilia 0,801 0,737 0,927 16 16 10 0 6 6Sardegna 0,805 0,745 0,932 13 13 5 0 8 8Italia 0,803 0,749 0,920
Diff. media assoluta 0,8 4,2 4,9Rho di Spearman 0,978 0,566 0,470
Indice di soddisfazione sulle relazioni familiari per metodo di quantificazione - Anno 2013
Rango
Regione
Valore Differenza di rango Le distribuzioni
sono concentrate, per il 90%, su ‘molto’ e
‘abbastanza’
Per le relazioni familiari, si registrano
sensibili differenze
PERC porta a risultati molto diversi
dagli altri metodi
Un’applicazione ai dati di soddisfazione per la vita
16
DISS EQUI PERC DISS EQUI PERCDISS-EQUI
DISS-PERC
EQUI-PERC
Piemonte 0,762 0,693 0,858 7 10 7 -3 0 3Valle d'Aosta 0,775 0,703 0,885 2 4 2 -2 0 2Liguria 0,769 0,704 0,862 4 3 5 1 -1 -2Lombardia 0,755 0,697 0,838 12 8 15 4 -3 -7Bolzano/Bozen 0,802 0,756 0,911 1 1 1 0 0 0Trento 0,768 0,710 0,871 5 2 3 3 2 -1Veneto 0,756 0,695 0,838 10 9 14 1 -4 -5Friuli-Venezia Giulia 0,759 0,702 0,838 8 5 13 3 -5 -8Emilia-Romagna 0,752 0,687 0,834 15 12 17 3 -2 -5Toscana 0,756 0,689 0,845 9 11 11 -2 -2 0Umbria 0,762 0,699 0,859 6 7 6 -1 0 1Marche 0,752 0,680 0,840 16 14 12 2 4 2Lazio 0,746 0,671 0,837 17 18 16 -1 1 2Abruzzo 0,770 0,699 0,868 3 6 4 -3 -1 2Molise 0,743 0,672 0,826 18 16 18 2 0 -2Campania 0,725 0,638 0,791 21 21 21 0 0 0Puglia 0,732 0,654 0,805 20 20 20 0 0 0Basilicata 0,755 0,673 0,855 13 15 9 -2 4 6Calabria 0,755 0,671 0,850 14 17 10 -3 4 7Sicilia 0,737 0,663 0,817 19 19 19 0 0 0Sardegna 0,755 0,683 0,858 11 13 8 -2 3 5Italia 0,749 0,680 0,835
Diff. media assoluta 1,8 1,7 2,9Rho di Spearman 0,936 0,921 0,800
Indice di soddisfazione sulle relazioni con amici per metodo di quantificazione - Anno 2013
Rango
Regione
Valore Differenza di rango
Anche per le relazioni con gli amici, i risultati
differiscono sensibilmente
Le distribuzioni sono simili a quelle delle
relazioni familiari,
concentrate, per l'80%, su
'molto' e 'abbastanza'
Un’applicazione ai dati di soddisfazione per la vita
17
DISS EQUI PERC DISS EQUI PERCDISS-EQUI
DISS-PERC
EQUI-PERC
Piemonte 0,661 0,573 0,659 14 12 12 2 2 0Valle d'Aosta 0,684 0,598 0,686 5 5 6 0 -1 -1Liguria 0,690 0,605 0,715 3 3 2 0 1 1Lombardia 0,678 0,597 0,686 6 6 5 0 1 1Bolzano/Bozen 0,750 0,686 0,831 1 1 1 0 0 0Trento 0,693 0,618 0,712 2 2 3 0 -1 -1Veneto 0,663 0,581 0,661 12 11 11 1 1 0Friuli-Venezia Giulia 0,667 0,584 0,653 9 9 14 0 -5 -5Emilia-Romagna 0,668 0,589 0,670 8 8 9 0 -1 -1Toscana 0,662 0,581 0,669 13 10 10 3 3 0Umbria 0,687 0,605 0,700 4 4 4 0 0 0Marche 0,676 0,590 0,678 7 7 7 0 0 0Lazio 0,647 0,552 0,623 18 17 17 1 1 0Abruzzo 0,664 0,570 0,658 10 14 13 -4 -3 1Molise 0,663 0,572 0,674 11 13 8 -2 3 5Campania 0,620 0,521 0,573 19 21 20 -2 -1 1Puglia 0,616 0,529 0,600 21 19 19 2 2 0Basilicata 0,651 0,556 0,652 15 16 15 -1 0 1Calabria 0,649 0,551 0,625 16 18 16 -2 0 2Sicilia 0,620 0,529 0,568 20 20 21 0 -1 -1Sardegna 0,647 0,557 0,617 17 15 18 2 -1 -3Italia 0,654 0,567 0,644
Diff. media assoluta 1,0 1,3 1,1Rho di Spearman 0,966 0,955 0,953
Indice di soddisfazione sul tempo libero per metodo di quantificazione - Anno 2013
Rango
Regione
Valore Differenza di rango
Risultati simili a quelli per la
salute
Le distribuzioni
sono concentrate,
per circa l’80%, su
‘abbastanza’ e ‘poco’
(‘per niente’ soddisfatti =
8%)
Conclusioni
18
I risultati forniti dai diversi metodi sono concordanti nel tempo ed evidenziano un ‘crollo’ della soddisfazione per la situazione economica personale a partire dall’anno 2001.
Dal punto di vista territoriale, invece, le maggiori differenze riguardano il livello di soddisfazione per le relazioni familiari e amicali, a causa dell’effetto ‘aggregazione’ del metodo PERC.
Nel complesso, il metodo basato sull’indice di dissomiglianza sembra collocarsi a metà strada tra i due metodi classici, senza averne gli inconvenienti.
Il metodo DISS, infatti, non comporta perdita di informazione (come avviene in PERC) e non richiede una quantificazione arbitraria ‘esplicita’ (come avviene in EQUI).
Inoltre, l’uso di un indicatore soggettivo di soddisfazione consente di superare i limiti di indici di posizione, come la moda e la mediana.
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Bibliografia
Casacci C., Pareto A. (2014). Methods for Quantifying Ordinal Variables: A Comparative Study. Quality & Quantity, doi: 10.1007/s11135-014-0063-2
Hensler C., Stipak B. (1979). Estimating Interval Scale Values for Survey Item Response Categories. Am. J. Polit. Sci., 23, pp. 627-648
Herzel A. (1974). Un criterio di quantificazione. Aspetti statistici. Metron, 32, pp. 3-54
Istat (2006). Il sistema di indagini sociali multiscopo. Contenuti e metodologia delle indagini. Metodi e norme, n. 31
Istat (2013). La soddisfazione dei cittadini per le condizioni di vita. Statistiche report, 20 novembre 2013
Jamieson S. (2004). Likert scales: how to (ab)use them. Med. Educ., 38, pp. 1212-1218
Leti G. (1983). Statistica descrittiva. Il Mulino, Bologna
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano ParetoQualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015