-
Sociologia generale e Statistica sociale (14)
Corso di Lingue, Letterature e Culture Straniere
Anno accademico 2019-2020
Prof. Michele Marzulli
mailto:[email protected]
-
Leggere: le fonti statistiche
• Statistiche ufficiali
1. I dati amministrativi (esaustivi, coprono la popolazione, scarso valore informativo).
2. Censimenti (anche informazione).
3. Survey (indagini campionarie, alto contenuto informativo)
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale2
-
Leggere: le fonti statistiche
• I dati prodotti dai processi amministrativi – Pubblici registri, prodotti da enti pubblici o privati (camere
di commercio, ACI…).
– Soprattutto: l’anagrafe comunale:• Saldo positivo della popolazione (nascite e immigrazioni)
• Saldo negativo (morti e emigrazioni)
• La famiglia anagrafica: vincoli (matrimonio, affinità, affetto…) con dimora abituale nello stesso comune.
• Convivenza: caserme e navi mercantili, conventi, ospedali e case di cura, carceri o case dello studente.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale3
-
Anagrafe comunale
• Le persone sono registrate su base demografica:
– età, sesso, stato civile, composizione famigliare.
• Studi su natalità e mortalità, nuzialità, migrazione, fecondità…
• Analisi dei bisogni della popolazione per programmare il sistema dei servizi sociali.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale4
-
Leggere: le fonti statistiche
• Altre fonti:• Censimenti come «popolazione e abitazioni»
(conteggio popolazione residente, primo 1861 -ultimo 2011), agricoltura, industria e servizi…
• Questi dati sono la base per il policy makingnazionale e locale.
• Censimento sul non-profit (2000).• Le indagini Multiscopo (indagine campionaria,
situazione sociale del paese. https://www.istat.it/it/archivio/91926
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale5
https://www.istat.it/it/archivio/91926
-
Leggere: le fonti statistiche
• ISTAT https://www.istat.it/ ; http://demo.istat.it/
• https://www.istat.it/it/archivio/224669 (Rapporto Bes2018: il benessere equo e sostenibile in Italia).
• https://www.istat.it/it/archivio/14562 (HFA)
• EUROSTAT https://ec.europa.eu/eurostat
• Disabilità: http://dati.disabilitaincifre.it/dawinciMD.jsp
• OCSE https://data.oecd.org/
• http://www.ismu.org/ricerca/dati-sulle-migrazioni/
• https://www.google.com/publicdata/directory
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale6
https://www.istat.it/http://demo.istat.it/https://www.istat.it/it/archivio/224669https://www.istat.it/it/archivio/14562https://ec.europa.eu/eurostathttp://dati.disabilitaincifre.it/dawinciMD.jsphttps://data.oecd.org/http://www.ismu.org/ricerca/dati-sulle-migrazioni/https://www.google.com/publicdata/directory
-
L’inchiesta campionaria
• L’interrogazione nell’approccio quantitativo ostandard conduce alla costruzione di variabilida inserire in una matrice di dati.
• L’obiettivo è quello di generalizzare i datiraccolti (costruiti), attraverso l’analisi dellerelazioni tra variabili.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale7
-
L’inchiesta campionaria
• Caratteristiche
1. L’unità di analisi è l’individuo.
2. I casi da intervistare sono selezionati tramitetecniche di campionamento statistico.
3. Invarianza dello stimolo: stesse domande,formulate nello stesso modo.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale8
-
La survey e il sondaggio
• L’impostazione teorica di una survey è il trattocaratteristico che la differenzia da sondaggi di opinionee poll (per es. online).
• Il sondaggio si limita a esplorare un fenomeno(sondare), cercando di quantificare per es. come siposiziona la popolazione. In genere si scelgonoargomenti dirimenti o si usano in previsione di elezioni.– Ciò che manca è l’analisi, cioè la relazione tra variabili
(per es. il nesso causale).
– Per garantirne validità: norma specifica (L. 28/2000,http://www.sondaggipoliticoelettorali.it/).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale9
http://www.sondaggipoliticoelettorali.it/
-
Il questionario
• Lo strumento prediletto dell’indaginecampionaria.
• Un elenco di domande predefinite dal ricercatore.
• Rivolto, in genere, a una parte della popolazione(campione).
• I rispondenti devono scegliere fra una serie dialternative predisposte dal ricercatore.
• In questo modo, il questionario è uno strumentoche garantisce la neutralità della rilevazione.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale10
-
La frequenza
• Statistica descrittiva monovariata
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale11
-
I dati grezzi
• Il risultato della rilevazione del fenomeno X sulla popolazione U (numerosità N) è un insieme di N osservazioni.
• Ciascuna osservazione coincide con una (e una sola) delle k modalità xi previste dalla scala utilizzata.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale12
-
I dati grezzi (Mecatti, 25 e ss)
• Es.: il comportamento sessuale degli studenti universitari (60 intervistati, ultimi 12 mesi)
• X: fenomeno quantitativo e discreto (si rileva contando);
• le sue modalità xi sono i numeri interi 0, 1,...
• la scala delle modalità è quantitativa rapporto(assoluta), cioè: 0, 1, 2,…
• U: gruppi studenti M/F
• N: 60
• X: numero partner negli ultimi 12 mesi
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale13
-
I dati grezzi
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale14
• Queste sono le 60 risposte date dagli studenti intervistati: presentato in questa forma il fenomeno (X) non è comprensibile.
-
Distribuzione di frequenza
• Si dovrà quindi tradurre il dato grezzo in una informazione intellegibile.
• Cioè una tabella (o un grafico) che presenta la distribuzione di frequenza (e le variabili statistiche).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale15
-
Distribuzione di frequenza
• Il dato grezzo diceva che il fenomeno X aveva 9 (k=9) modalità xi differenti: da 0 a 8 (n° dei partner).
• Possiamo allora contare quante volte le k modalità (x1,… x9) si presentano nel campione.
– Scopriamo per es. che la k modalità di xi con proprietà 0 (nessun partner) ha una frequenza (fi):
f1 = 11 cioè 11 studenti/esse non hanno avuto partner.
– Inoltre, 10 studenti/esse hanno avuto 1 partner:
cioè f2 = 10.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale16
-
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale17
Nella colonna dx c’è la frequenza assoluta di xi: quante volte (11) si presenta la modalità (x1=0).Modalità xi
Distrib
uzio
ne
di
freq
ue
nza
di X
su U
.
-
Distribuzione
• La somma delle frequenze assolute di xi è uguale a N (60).
• La tab. nel suo insieme, cioè le k coppieformate da modalità (xi)-frequenza (0,…8) è definita variabile statistica (v.s.).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale18
-
Distribuzione di frequenza
• Il numero di volte in cui una modalità xi è stata rilevata in U si chiama frequenza (assoluta). La somma delle frequenze assolute riproduce la numerosità N di U.
• La freq. ass. viene indicata con fi (i-esima frequenza).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale19
-
Variabili statistiche
• Le modalità xi a seconda della natura del fenomeno Xe della tipologia di scala utilizzata, possono essere attributi, categorie, numeri, intervalli.
• Le frequenze fi sono sempre numeri interi.
• Una v. s. è un insieme di k coppie {xi , fi}
• v. s. = { (xi , fi), }
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale20
-
Variabili statistiche
• Questo significa innanzitutto che ora, dopo questo processo (tradotto in tavola di frequenza) con X indichiamo sia il fenomenostatistico di interesse (prima della rilevazione) sia la v.s. (dopo la rilevazione).
• Cfr. Lez. 13.stat.: come ci costruiscono le VAR.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale21
-
Esercizio Metodologia del servizio sociale 30 + L
Sociologia generale 28
Metodologia della ricerca sociale 25
Microeconomia 30 + L
Diritto penale 26
Psicologia dello sviluppo 26
Diritto pubblico 27
Diritto privato 26
Storia contemporanea 28
Principi, fondamenti e metodi del servizio sociale 29
Psicologia generale 24
Politiche sociali e tecniche del servizio sociale 24
Istituzioni di politica economica 25
Igiene 27
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale22
-
Esercizio: tab. freq. ass.
• xi = x1, … xk• k= 7
• x1=24, x2=25, x3=26, x4=27, x5=28, x6=29, x7=31
• Distribuzione f.a.:
24=2; 25=2; 26=3; 27=2; 28=2; 29=1; 31=2.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale23
-
Esercizio: tab. freq. ass.
xi fi24 2
25 2
26 3
27 2
28 2
29 1
31 2
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale24
-
Altri tipi di frequenza
• Le frequenze assolute sono solo un tipo di frequenze che si possono costruire a partire dai dati grezzi.
• Ci sono innanzitutto anche le frequenze relative e percentuali.
– NB: per costruire le freq. % (ciò che siamo abituati a chiamare appunto «percentuali») è indispensabile avere prima costruito le freq. assolute. Anche quando si affrontano esercizi.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale25
-
Frequenze relative e percentuali
• Se confronto due popolazioni di numerosità differente (per es. N1=40 e N2=28) posso confrontare le frequenze assolute?
• Il valore (assoluto) «2» assunto nella popolazione 1 ha lo stesso significato che nella popolazione 2?
– Cioè i 2 studenti che hanno avuto 4 partner nella U1 e i 2 che hanno avuto 4 partner nella U2?
– No. Perché 2/40 è diverso da 2/28.
• Allora devo costruire le frequenze relative.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale26
-
Confronto delle distribuzioni di frequenza di X su più popolazioni con numerosità diversa.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale27
Distrib
uzio
ne d
i X
Distrib
uzio
ne d
i X
Popolazione U1 Popolazione U2
Numerosità della popolazione
-
Frequenze relative
• Per effettuare un confronto devo depurare il dato dall’influenza di N, cioè dalla numerosità della popolazione.
• Più grande è N, maggiore sarà la frequenza (fi), perché la somma di tutte le fi è proprio N.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale28
-
Frequenze relative
• Come si fa a depurare il dato rilevato dall’influenza di N, cioè dalla numerosità della popolazione?
• La frequenza relativa associata alla modalità xi è il rapporto tra la freq. ass. e la numerosità di U (cioè N).
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale29
-
Frequenze relative
• Cioè: 𝑝𝑖 = 𝑓 ሶ𝑖
𝑁
– Nel nostro caso: freq. rel. = 2/40= 0,050
• Una grandezza relativa è un rapporto che ha al denominatore (40) la grandezza che «disturba» il confronto della quantità (2) che sta al numeratore.
• Le f.r. in quanto grandezze adimensionali sono sempre confrontabili.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale30
-
Frequenze relative
• Confronto / confrontabili?
• I 2 studenti che hanno avuto 4 partner:
– nella popolazione U1 = 2/40=0,050
– Nella popolazione U2= 2/28=0,071
• Il fenomeno X ha quindi un comportamento diverso nelle due popolazioni.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale31
-
Frequenze relative
• Le f.r. (pi) sono rapporti particolari, che hanno al denominatore il totale del numeratore. Sono una parte del tutto, dell’intero.
• Quindi sono sempre comprese fra 0… 1.
0 ≤ pi ≤ 1
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale32
-
Frequenza relativa
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale33
• La somma delle f.r. è sempre 1.
-
Frequenze relative
• U1: la popolazione degli studenti/esse di Sociologia.
• xi: le modalità di disposta (n° partner).
• fi: frequenza della modalità di risposta xi
• La colonna pi è la distribuzione di frequenza relativa del fenomeno X su U1
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale34
ogia
-
Frequenze percentuali (%)
• Moltiplicando per 100 le frequenze relative si ottengono le frequenze percentuali (%).
pi ∙ 100
• Le % sono consigliabili soprattutto in termini di chiarezza comunicativa.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale35
-
Freq. relative e percentuali
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale36
-
Freq. relative e percentuali
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale37
• La parte inferiore della tabella ci aiuta a comprendere che le due popolazioni non si comportano nello stesso modo.• La U1 è più attiva della U2? Certamente il 2,5%
della U1 ha avuto 8 partner e contro lo 0,0% della U2.
-
Frequenza cumulata
• È buona norma ordinare in senso crescente le modalità osservate:– Cioè prendere in considerazione i valori minimo e
massimo.
• Ci aiuta a capire per es. quante sono le unità statistiche (tre le N) che manifestano una modalità grande fino a… xi.– Per es. quante persone in Italia hanno almeno t.studio =
licenza superiore.
• Basta sommare (cumulare) le frequenze associate alle diverse modalità.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale38
-
Frequenza cumulata
• Frequenze cumulate assolute: Fi (f maiuscolo)
• Frequenze cumulate relative o percentuali: Фi (phicon i)
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale39
-
Frequenza cumulata
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale40
• Фi ci aiuta a dire che il 78% della popolazione ha avuto da 0 a 4 partner. Oppure che il 47,5% ne ha al max 1.
-
Frequenza cumulata
xi fi pi % Фi0 9 0,225 22,5 22,5
1 10 0.250 25,0 47,5
2 7 0,175 17,5 65,0
3 4 0,100 10,0 75,0
4 2 0,050 5,0 80,0
5 4 0,100 10,0 90,0
6 1 0,025 2,5 92,5
7 2 0,050 5,0 97,5
8 1 0,025 2,5 100,0
40 1,000 100,0
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale41
-
Frequenze cumulate (ass. e rel.)
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale42
-
Densità di frequenza
• Fenomeni quantitativi continui (numeri e si misurano).
• Il fenomeno X ha xi modalità che possono essere considerate intervalli.
• Cioè all’intervallo tra x1 e x2 possono appartenere diverse unità statistiche. Quante?
• La distribuzione di frequenza all’interno degli intervalli è ignota.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale43
-
Densità di frequenza
• Se la distribuzione è ignota possiamo fare però due ipotesi per ripartire le unità statistiche tra gli intervalli (cioè densità).
1. Il valore centrale
2. La distribuzione uniforme
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale44
-
Densità di frequenza
• Valore centrale: in medio stat virtus
– Si associa a tutte le frequenze il valore centrale dell’intervallo: tra 45 e 55? 50.
• Distribuzione uniforme: ogni possibilità è alla pari.
– Tutte le unità sono distribuite in modo uniforme ed equidistante.
a.a. 2019/2020Michele Marzulli - Sociologia e Statistica
sociale45