formati & analisi fattoriale metodi quantitativi per economia, finanza e management...
TRANSCRIPT
FormatiFormati& &
Analisi fattorialeAnalisi fattoriale
Metodi Quantitativi per Economia, Finanza e Management
Esercitazione n°8
FormatiFormati
Gestione dei formati La procedura FORMAT permette all’utente di creare formati personalizzati in
aggiunta a quelli già forniti con SAS System. I formati permettono di visualizzare il contenuto di una variabile in differenti modi, per esempio, visualizzare un codice come la sua descrizione. Sono i più utili nelle procedure di Reporting in quanto permettono di personalizzare meglio gli output.
Esempio distribuzione di frequenza della variabile area geografica senza utilizzare il formato $area
Esempio distribuzione di frequenza della variabile area geografica utilizzando il formato $area
area Frequency PercentC 18 32.14N 18 32.14S 20 35.71
area Frequency PercentCentro 18 32.14Nord 18 32.14Sud 20 35.71
PROC FORMAT – Sintassi generale proc format;
value ($)nome_formato
valori /intervalli /insiemi
;
run;
N.B. Il nome del formato inizia con $ se è da applicare a variabili alfanumeriche, senza $ per variabili numeriche
Esempi
proc format;value $AREA'NE'="Nord-Est"'NO'="Nord-Ovest"'C'="Centro"'SI'="Sud-Isole“;run;
proc format;value fmtritlow-0=‘In orario'1-10='1-10 minuti'11-high='+10 minuti‘;run;
Variabile alfanumerica:
Nome formato: $area
NE, NO, C,SI= modalità della variabile
Variabile numerica
Nome formato: fmtrit
Low-0, 1-10, 11-high=intervalli della variabile numerica a cui voglio associare una descrizione
Esempio di Freq con formato
proc format;value $area'N'='Nord''C'='Centro''S'='Sud‘;run;
proc freq data=nome_dataset;tables area;format area $area.;run;
area Frequency PercentCentro 18 32.14Nord 18 32.14Sud 20 35.71
Label
Aprendo un data set si possono visualizzare i nomi delle variabili o le etichette
Analisi fattorialeAnalisi fattoriale
Step di analisi (1/2)STEP 1: scegliere quanti fattori considerare (scelta di varie soluzioni)
la regola autovalori > 1 lettura dello SCREE PLOT
STEP 2: confrontare le soluzioni scelte
loadings cumunalità finali
PROC FACTOR DATA=data set SCREE FUZZ=k;
VAR elenco variabili;
RUN;
PROC FACTOR DATA=data set SCREE FUZZ=k N=n;
VAR elenco variabili;
RUN;
Step di analisi (2/2)
STEP 3: una volta scelta la soluzione finale
ruotare i fattori interpretare i fattori salvare il data set con i fattori
STEP 4: se l’interpretazione non è soddisfacente ripetere lo step n°3 variando metodo di rotazione o provando un’altra soluzione.
PROC FACTOR DATA=data set SCREE FUZZ=k OUT=data set output ROTATE= metodo di rotazione REORDER;
VAR elenco variabili;
RUN;
PROC FACTOR – Sintassi generale
proc factor data= dataset option(s);
var variabile1 … variabile2 variabilen;
run;
Analisi fattoriale con il metodo delle componenti principali.
OPZIONE DESCRIZIONEOUT = Produce in output un data set che contiene le variabili originali e i fattori non ruotati
N=num Consente di specificare il numero di fattori che si vuole estrarre
ROTATE=metodo Specifica che il criterio per la rotazione dei fattori (VARIMAX, …)
SCREE Produce scree plot
REORDER Ordina le variabili in modo da facilitare la lettura dei loadings
FUZZ=valore Stampa solo |loadings| > valore indicato.
Esercizio 1Il data set ECONOMIC_FREEDOM contiene i seguenti indicatori relativi alla libertà economica nei diversi stati del mondo. Svolgere un’analisi fattoriale a partire da tali indicatori.
COUNTRY Nome del paese
CONTINENTE AF-Africa; AM-America Nord; AS-Asia; OC-Oceania; EU-Europa
A. Attività del settore pubblico e tassazione
A_ GVT_CONSUMPT Consumi pubblici Rapporto tra consumi pubblici e consume totali (indice)
A_ GVT_INVEST Investimenti pubblici Rapporto tra investimenti pubblici e investimenti totali (indice)
B_JUD_IMPART Imparzialità delle corti: contesto legale in cui i privati possono opporsi legalmente ad azioni del governo.
B_MILITARY_POL Interferenza militare nel sistema giudiziario e politico (indice elevato se l’interferenza è bassa)
B_LAW_INTEGRITY Integrità del sistema giudiziario
C. Accesso al contante
C_GR_MONEY_SUPPLY Crescita media annuale dell’offerta di moneta (ultimi 5 anni) ‑ Crescita media annuale PIL (ultimi 10 anni)
C_INFL Tasso di inflazione recente (indice alto se inflazione bassa)
C_STD_INFL Variabilità del tasso di inflazione negli ultimi 5 anni. (indice alto se inflazione stabile)
C_FREEDOM_BANK Libertà di possedere conti presso banche straniere nel paese o all’estero
D. Commercio internazionale
D_TARIF Tasse sul commercio con l’estero (indice alto se tasse basse e poco variabili)
D_ACTUAL_EXP_TRADE Dimensione del settore del commercio internazionale rispetto a quella attesa
D_INT_CAP_CONTROL Livello del controllo sul mercato dei capitali internazionali (indice elevato se è elevata la libertà di accesso ai capitali e ai mercati internazionali)
E. Regolamentazione del credito, del lavoro e del business
E_CREDIT_REG Regolamentazione del mercato del credito (indice elevato se c’è concorrenza con banche straniere, se molte banche sono private, se il credito al settore privato è elevato, se i tassi di interesse sono determinati dal libero mercato)
E_NEW_BUSINESS Faciltà e trasparenza nella realizzazione di nuovi business
Soluzione es 1 (1/7)
PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM SCREE FUZZ=0.35 ;VAR A_GVT_CONSUMPT A_GVT_INVEST B_JUD_IMPART B_LAW_INTEGRITY B_MILITARY_POL C_FREEDOM_BANK C_GR_MONEY_SUPPLY C_INFL C_STD_INFL D_ACTUAL_EXP_TRADE D_INT_CAP_CONTROL D_TARIF E_CREDIT_REG E_NEW_BUSINESS;RUN;
Estrazione fattori:
Soluzione es 1 (2/7)
La regola degli autovalori > 1 suggerisce di prendere in considerazione 3 fattori, che spiegano insieme il 63% della varianza totale.
Lo scree plot mostra un gomito netto in corrispondenza di 2 fattori e uno ‘accennato’ in corrispondenza di 4 fattori.
AUTOVALORI
Eigenvalue Difference Proportion Cumulative
1 5.7462 4.0829 0.4104 0.4104
2 1.6633 0.2815 0.1188 0.5293
3 1.3818 0.3921 0.0987 0.6280
4 0.9898 0.1855 0.0707 0.6986
5 0.8043 0.0997 0.0574 0.7561
6 0.7046 0.0992 0.0503 0.8064
7 0.6053 0.1194 0.0432 0.8497
8 0.4859 0.0524 0.0347 0.8844
9 0.4335 0.0979 0.0310 0.9153
10 0.3356 0.0733 0.0240 0.9393
11 0.2623 0.0098 0.0187 0.9580
12 0.2525 0.0544 0.0180 0.9761
13 0.1981 0.0613 0.0142 0.9902
14 0.1368 0.0098 1.0000
Quanti fattori considerare?
0
1
2
3
4
5
6
7
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Fattori
Aut
ova
lori
Soluzione es 1 (3/7)
PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM SCREE FUZZ=0.35 N=2;VAR lista variabili;RUN;
Estrazione fattori per la soluzione a 2 e a 4 fattori:
PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM SCREE FUZZ=0.35 N=4;VAR lista variabili;RUN;
N.B. La soluzione a 3 fattori l’abbiamo già estratta: quando nella PROC FACTOR non viene indicato il numero di fattori con l’opzione “N = “ SAS adotta la regola degli autovalori >1 per scegliere il numero di fattori.
Soluzione es 1 (4/7)Variable
LOADINGS CUMUNALITA'
Prin1 Prin2 Prin3 Prin4 n=2 n=3 n=4
A_GVT_CONSUMPT -0.73 0.31 0.31 0.53 0.62 0.72
A_GVT_INVEST 0.64 0.35 0.42 0.54 0.54
B_JUD_IMPART 0.79 -0.38 0.62 0.77 0.78
B_MILITARY_POL 0.8 0.65 0.65 0.66
B_LAW_INTEGRITY 0.8 0.64 0.67 0.69
C_GR_MONEY_SUPPLY 0.43 0.66 0.35 0.62 0.63 0.75
C_INFL 0.45 0.66 0.65 0.65 0.69
C_FREEDOM_BANK 0.6 -0.45 0.46 0.56 0.77 0.83
C_STD_INFL 0.45 0.55 0.51 0.53 0.53
D_TARIF 0.69 0.51 0.58 0.58
D_ACTUAL_EXP_TRADE -0.72 0.38 0.07 0.58 0.73
D_INT_CAP_CONTROL 0.65 -0.4 0.41 0.59 0.65 0.82
E_CREDIT_REG 0.65 -0.54 0.42 0.45 0.74
E_NEW_BUSINESS 0.78 0.63 0.70 0.73
La soluzione a 2 fattori non fornisce una spiegazione adeguata di alcune variabili: tali variabili hanno probabilmente un alto contenuto di specificità. La soluzione a 4 sarebbe motivata dal recupero di capacità esplicativa solo su un paio di variabili. Inoltre per ogni variabile la % di varianza spiegata dati fattori è già soddisfacente e non aumenta in maniera sostanziale per effetto dell’estrazione del quarto fattore.
Per ogni variabile si evidenziano le celle in corrispon-denza delle quali la comunalità aumenta in maniera sostanziale per effetto dell’estra-zione di un ulteriore fattore.
Soluzione es 1 (5/7)
PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM OUT=CORSO.FACTORS N=3 ROTATE=VARIMAX REORDER FUZZ=0.35;VAR lista variabili;RUN;
Consideriamo la soluzione a 3 fattori e operiamo una rotazione dei fattori con il metodo Varimax.
IMPORTANTE:la % di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la % di varianza spiegata da ciascun fattore
Soluzione es 1 (6/7)
Variabile Descrizione Factor1 Factor2 Factor3
C_FREEDOM_BANK Libertà conti c/o banche stran. o estero 0.87
D_INT_CAP_CONTROL Libertà di accesso a cap. e mkt internaz. 0.77
D_TARIF Basse tasse su comm. con estero 0.71
A_GVT_INVEST Investimenti pubblici 0.62 0.39
B_MILITARY_POL Bassa Interf. militare 0.58 0.52
E_CREDIT_REG Regolament. mkt credito 0.54
B_JUD_IMPART Imparzialità delle corti 0.76
E_NEW_BUSINESS Faciltà realizz. newbusiness 0.44 0.69
D_ACTUAL_EXP_TRADE Dim. settore comm. internaz. 0.69
B_LAW_INTEGRITY Integrità sist. giudiz. 0.44 0.61
A_GVT_CONSUMPT Consumi pubblici -0.66
C_INFL Bassa infl. recente 0.79
C_GR_MONEY_SUPPLY Crescita offerta di moneta 0.78
C_STD_INFL Bassa variab. tasso infl. 0.7
LIBERTA’ DI
CAPITALI
LIBERTA’ DI
CAPITALI
LIBERTA’ DI
BUSINESS
LIBERTA’ DI
BUSINESS
MONETAMONETA
Interpretazione fattori:
Estraendo 3 fattori riusciamo a spiegare il 63% della varianza totale.
Soluzione es 1 (7/7)
Varianza spiegata da ciascun fattore
TotaleFactor1 Factor2 Factor3
5.75 1.66 1.388.79
Varianza spiegata dai fattori:
La % di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la % di varianza spiegata da ciascun fattore
Varianza spiegata da ciascun fattore
TotaleFactor1 Factor2 Factor3
3.55 2.83 2.418.79
PRIMA DELLA ROTAZIONE
DOPO LA ROTAZIONE