3(5 ,/ 0$5.(7,1* - riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd...
TRANSCRIPT
![Page 2: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/2.jpg)
ASSOCIAZIONE TRA UN FENOMENO QUANTITATIVO ED UNO NOMINALE
![Page 3: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/3.jpg)
Rapporti di correlazione (p.143)X nominale Y quantitativo
• Scomposizione della varianza di Y nei gruppi e fra i gruppi:
• I gruppi sono le categorie di X (es. Maschi e Femmine; Y = voto in statistica)
• Var(Y) = Var FRA + Var NEI
• Var FRA : funzione delle differenze tra le medie dei gruppi e la media generale
• Var NEI : funzione delle differenze tra i singoli valori e la media del rispettivo gruppo
![Page 4: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/4.jpg)
Scomposizione della varianza
• Notazione
• g gruppi
• nj = numero di unità statistiche appartenenti al gruppo j
• n = n1+ …+ ng
![Page 5: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/5.jpg)
Scomposizione della varianza
![Page 6: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/6.jpg)
Significato delle varianze
• Var FRA = 0 → Var (Y) = Var NEI
• Non vi sono differenze tra le medie dei gruppi (categorie) (voto medio maschi = voto medio femmine)
• Var Nei = 0 → Var (Y) = Var FRA
• La variabilità di Y è dovuta interamente alle differenze fra le medie dei gruppi. Ogni gruppo è perfettamente omogeneo nel suo interno (assume un solo valore)
![Page 7: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/7.jpg)
Rapporto di correlazione
• ɳ y│x eta di Y dato X
• ɳ y│x = Var FRA / Var (Y)
• ɳ y│x = 1 - [Var NEI/ Var (Y)]
• ɳ y│x = 0 sse Y è indip. in media da X
• ɳ y│x = 1 sse vi è massima dipendenza in media di Y da X
![Page 8: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/8.jpg)
Esercizio.
• File UNIVUSAanova.
• Si può sostenere l’ipotesi che le rette medie per iscriversi a scuole statali, private o del clero differiscano tra loro significativamente? (variabile “retta”, variabile di raggruppamento “affil”). Effettuare analisi preliminari (boxplot e intervallo di confidenza per ogni gruppo)
• Scomporre la variabilità totale della spesa di iscrizione (variabile “retta” nella quota tra i gruppi e nei gruppi).
![Page 9: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/9.jpg)
Analisi esplorativa preliminare
![Page 10: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/10.jpg)
Scomposizione della varianza
• V. file di Excel UnivUSAanova.xlsx
![Page 11: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/11.jpg)
RIEPILOGO ANALISI UNIVARIATE E BIVARIATE
• Per ogni variabile qualitativa (e quantitativa discreta): distribuzione di frequenze
• Per ogni variabile binaria (codificata come numerica 0-1): media = frequenza relativa
• Per ogni variabile quantitativa: media e deviazione standard, CV = σ/M, in % oppure MAD/Me
• Per tutte le coppie di variabili qualitative: tavole di contingenza, verifica dell’ipotesi d’indipendenza (chi-quadrato) e indici di associazione
• Per tutte le coppie di variabili quantitative: matrice di correlazione con P-VALUE(eventualmente anche di matrice di cograduazione)
![Page 12: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/12.jpg)
RAPPRESENTAZIONI GRAFICHE
Nella comunicazione una figura vale più di cento numeri e di mille
parole!
![Page 13: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/13.jpg)
SCOPI DELLE RAPPRESENTAZIONI GRAFICHENELLE ANALISI PRELIMINARI:• individuazione di valori anomali• ricerca di strutture (pattern) nei dati
- relazioni, anche non lineari, tra variabili- somiglianze tra unità e gruppi omogenei
• NELLA PRESENTAZIONE DEI RISULTATI:comunicazione ai “non addetti ai lavori”
![Page 14: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/14.jpg)
Smartphone
Z(prezzo) Z(peso)
![Page 15: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/15.jpg)
Smartphone (continua).
Necessità di avere un contorno robusto bivariato
![Page 16: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/16.jpg)
Il convex hull nel diagramma di dispersione
(fig. 5.1 , p. 178)
• In un diagramma di dispersione unisco tra loro i punti più esterni: ottengo un “guscio convesso”
• Ripeto l’operazione con riferimento ai punti interni rimanenti, etc.
• Ottengo una successione di poligoni convessi, che forniscono una stima delle “curve di livello”
• Informazioni sugli outliers e sulla forma di distribuzione bivariata
• I gusci più interni non risentono degli outliers• Il “contorno interno” (core) che contiene una
percentuale non maggiore del 50% ha un significato analogo alla scatola del boxplot
![Page 17: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/17.jpg)
Scatter della performance (asse x) e volatilità (asse y) di 23 fondi di investimento con convex hull e boxplot
bivariati
![Page 18: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/18.jpg)
Costruzione boxplot bivariato
![Page 19: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/19.jpg)
RAPPRESENTAZIONE DI 3 VARIABILI (p. 180)
• Diagramma di dispersione a tre dimensioni (in R3) :- di difficile lettura, sovrapposizione di punti, mancanza di prospettiva. Esempio: Benessere regionale: reddito medio, mediano, % famiglie povere
• MATRICE DEI DIAGRAMMI DI DISPERSIONE (scatterplot matrix):informazioni: outliers univariati e bivariati, relazioni tra coppie di variabili, gruppi omogenei di unità, estensione a più di 3 variabili
![Page 20: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/20.jpg)
Home theatre (p. 183)
![Page 21: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/21.jpg)
RAPPRESENTAZIONE DI PIU’ DI 3 VARIABILI
• MATRICE DEI DIAGRAMMI DI DISPERSIONElimitazione: se il numero di variabili è troppo grande i singoli riquadri diventano illeggibili
• ESEMPIO: 14 settori industriali (p. 188-189)
![Page 22: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/22.jpg)
SCATTERPLOT MATRIX (p.188 14 settori, con raffinerie)
![Page 23: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/23.jpg)
13 settori (p. 189 senza raffinerie)
![Page 24: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/24.jpg)
Scatter plot matrix con indicazione dei gruppi
![Page 25: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/25.jpg)
Esercizio
Si disegni una matrice dei diagrammi di dispersione riferita a 10 unità ed a 3 variabili X, Y, Z che presenti tutte le seguenti caratteristiche:
• Correlazione tra X ed Y diretta e molto elevata.
• Correlazione inversa tra X e Z di discreta entità.
• Un valore anomalo, eccezionalmente grande, per Z.
![Page 26: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/26.jpg)
COORDINATE PARALLELEn unità statistiche e p variabili
• Si tracciano p parallele equidistanti
• Su ogni parallela si indica la scala di misurazione
• Abitualmente si considerano le variabili in termini di scostamenti standardizzati
• Per ogni unità si individuano i rispettivi valori (standardizzati) su ciascuna parallela e si uniscono tra loro, ottenendo una spezzatarappresentativa di tale unità
![Page 27: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/27.jpg)
Esempio
![Page 28: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/28.jpg)
Visualizzazione in termini di coordinate parallele
![Page 29: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/29.jpg)
FASHION: costlav roe indeb• BENETTON 31,30 9,90 ,70
• ARMANI 37,60 29,30 ,10
• MARZOTTO 70,40 11,80 ,80
• STEFANEL 49,30 11,00 ,40
• ZEGNA 72,40 6,80 1,20
• DOLCEeG. 24,90 40,90 ,40
• MISSONI 50,70 4,30 ,80
• FERRE' 82,10 ,00 2,10
![Page 30: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/30.jpg)
Zcostlav Zroe Zindeb• BENETTON -1,01 -,32 ,18• ARMANI -,71 1,09 -1,15• MARZOTTO ,87 -,18 -,02• STEFANEL -,15 -,24 -,67• ZEGNA ,96 -,54 ,63• DOLCEeG. -1,32 1,93 -,67• MISSONI -,08 -,72 -,02• FERRE' 1,43 -1,03 2,09
![Page 31: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/31.jpg)
FASHION
FERRE’
D. e G.
![Page 32: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/32.jpg)
Implementazione coordinate parallele in Excel
• File parcoord_fashion.xlsxcostlav roe indeb
costlav 1roe -0,72286 1indeb 0,792001 -0,68765 1
![Page 33: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/33.jpg)
INFORMAZIONI FORNITE DALLE COORDINATE PARALLELE
• Ogni spezzata pone in evidenza i valori della corrispondente unità per tutte le variabili
• Segnalano la relazione tra coppie di variabili consecutive nel grafico
• Mostrano gli eventuali gruppi omogenei di unità (fasci di spezzate con andamento simile)
• Segnalano gli outliers multivariati (spezzate con andamento molto diverso dalle altre)
DIFETTO:“Lettura” meno immediata rispetto alla
scatterplot matrix.
![Page 34: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/34.jpg)
Esempio di rappresentazione in coordinate parallele
![Page 35: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/35.jpg)
LAVATRICIprezzo giri cons energia
prezzo 1 0.822022 -0.52604 -0.09361giri 0.822022 1 -0.45639 0.123789cons -0.52604 -0.45639 1 0.42507energia -0.09361 0.123789 0.42507 1
![Page 36: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/36.jpg)
File parcoord1.xlsx
![Page 37: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/37.jpg)
Esercizio
• Supponiamo di essere in presenza di 10 unità e 5 variabili di cui le prime 3 correlate in maniera forte e diretta e le ultime due correlate in maniera forte ma indiretta con le prime tre. Disegnare il diagramma in coordinate parallele che ci si attende
![Page 38: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/38.jpg)
RAPPRESENTAZIONI ICONICHEn unità statistiche e p variabili
• Si disegna per ogni unità statistica una figura con p caratteristiche
• Le figure più utili sono le cosiddette “stelle”:• Si divide l’angolo giro in p parti uguali • Si associa ad ogni semiretta uscente dal centro una variabile• Si scegli un’opportuna unità di misura per ogni semiretta• Per l’unità statistica considerata s’individuano i rispettivi valori
delle p variabili sulle p semirette e uniscono tra loro• Si ottiene un poligono irregolare chiamato “stella”• Analogamente si traccia una stella per ogni unità statistica
![Page 39: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/39.jpg)
STELLE FASHIONROE
COSTLAV
INDEB
![Page 40: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/40.jpg)
14 settori e 5 variabili (p.197)
![Page 41: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/41.jpg)
INFORMAZIONI FORNITE DALLE STELLE
• Evidenziano l’ordine di grandezza di ogni unità
• Mostrano le somiglianze tra le unità (stelle di forma analoga)
• Segnalano gli outliers multivariati (stelle di forma molto diversa dalle altre)
• In una stella, una punta molto acuta segnala un valore eccezionalmente grande di quella variabile
DIFETTI
Non evidenziano le relazioni tra le variabili
![Page 42: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/42.jpg)
16 LAVATRICI, 4 VARIABILI(prezzo, giri, consumo acqua, energia)
![Page 43: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/43.jpg)
Implementazione delle stelle in Excel
• File stars.xlsx
![Page 44: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/44.jpg)
Le facce di Chernoff
![Page 45: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/45.jpg)
TRASFORMAZIONI DEI DATI
• Trasformazioni lineari:• Scostamenti dalla media: xi – M• Scostamenti standardizzati:
zi = (xi – M) / s = xi/s – M/s
• Visualizzazione nel diagramma di dispersione: origine degli assi nel punto di coordinate(MX, MY) = centroide
• Esempio: tablets (peso, prezzo)
![Page 46: 3(5 ,/ 0$5.(7,1* - Riani · 5,(3,/2*2 $1$/,6, 81,9$5,$7( ( %,9$5,$7( 3hu rjql yduldeloh txdolwdwlyd h txdqwlwdwlyd glvfuhwd glvwulex]lrqh gl iuhtxhq]h 3hu rjql yduldeloh elqduld frglilfdwd](https://reader036.vdocuments.pub/reader036/viewer/2022071014/5fcc4b58fb1f7235a544285a/html5/thumbnails/46.jpg)
TRASFORMAZIONI NON LINEARI
• Trasformazione logaritmica, quadratica, cubica, ecc. (casi particolari della trasformazione di Box and Cox, p. 205)
MOTIVAZIONI:• Ricondurre la distribuzione alla simmetria Esempio: distribuzione con forte asimmetria positiva (coda
destra più lunga) - Trasformazione logaritmica:x = 10 ; Log x = 1x = 100; Log x = 2
• Ricondurre alla linearità la relazione tra due (o più) variabili
Esempio: relazione tra PIL pro capite e speranza di vita in 109 Paesi (pp. 207-212)