statistica per le decisioni di marketing andrea cerioli andrea.cerioli@unipr.it sito web del corso...
Post on 02-May-2015
225 Views
Preview:
TRANSCRIPT
STATISTICA PER LE DECISIONI DI MARKETING
Andrea Cerioliandrea.cerioli@unipr.it
Sito web del corso
ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE
MULTIPLAMaggiore flessibilità per
applicazioni aziendali(Capitoli 4 – 5 del libro)
Regressione con variabili esplicative qualitative
(categoriali)
• caratteristiche socio-demografiche dei consumatori (sesso, professione, …)
• tipologia e area geografica dei punti vendita
• categoria merceologica dei prodotti• brand• …• in generale: gruppi diversi di
osservazioni
Es.: consumo e reddito USA (miliardi di $): §4.1
Reddito
Consumo
Negli anni 1942-1945 il modello sembra diverso: c’è una variabile importante esclusa dal modello
Aggiunta di una variabile dummy (variabile indicatrice con valori 0-1)
Il modello di regressione diventa multiplo:
Consumo = f(Reddito, dummy)
Risultati del modello di regr. lineare multiplo
�̂�=−𝟏𝟎 .𝟏+𝟎 .𝟗𝟔 𝑿𝟏−𝟓𝟓 .𝟒𝟔 𝑿𝟐
X1 = Reddito
X2 = Dummy
Interpretazione coefficienti?
Ricordando la definizione di X2 (dummy):
a parità di reddito (X1), la stima dell’ammontare dei consumi (y cappello) diminuisce di un ammontare pari a -55.46 (miliardi di $) negli anni in cui dummy=1 (cioè passando da un periodo di pace a uno di guerra)
se X2 = 0 (pace)
se X2 = 1 (guerra)
Rappresentazione grafica dell’effetto della variabile dummy (β2=-55.46): v. p. 113
Reddito
Consumo
L’adattamento migliora sensibilmente con la variabile dummy: v. p. 114
Generalizzazione al caso di variabili qualitative con più
di due modalità
Esempio: destagionalizzazione di una serie storica
Serie storica delle vendite di un bene (§4.2)
v. file: Esempio dati vendite stagionali
Modello:vendite stimate = f(trend + stagionalità + componente
erratica)
In questo esempio è presente solo la serie storica Y: le uniche variabili esplicative sono definite in funzione del tempo (trend, stagionalità e eventualmente ciclo)
Il modello può essere generalizzato includendo anche altre variabili esplicative (variabili esogene) se disponibili
Come possiamo rappresentare X?
• Perché manca la dummy per l’inverno?• formulazione alternativa (4 dummy; no intercetta): p.
117• La scelta della dummy da eliminare (o della
formulazione del modello) non cambia l’adattamento né le previsioni
La prima osservazione fa riferimento al primo trimestre (primavera);
La seconda osservazione fa riferimento al secondo trimestre (estate);
Ecc.
Stima dei parametri
• I coefficienti delle dummy stagionali rappresentano l’effetto della stagione considerata relativo alla stagione esclusa, a parità di trend
• Su tali stime si possono applicare tutte le procedure della regressione multipla (intervalli, test …): v. libro
Destagionalizzazione (p. 119-120)
La serie destagionalizzata non risente più delle ciclicità stagionali
Detrendizzazione (p. 119-120)
La serie detrendizzata non mostra più un andamento di lungo periodo (è stazionaria)
La serie detrendizzata e destagionalizzata non risente più né delle ciclicità stagionali né dell’andamento di lungo periodo: dovrebbe essere assimilabile alla componente erratica
(in realtà ciò è vero solo in parte: perché?)
Esercitazioni con variabili dummy
• Seminar sulla previsione delle vendite per il budgeting
• Previsione del consumo di gas (Esercizio 5.1, pp. 133-141)
Eteroschedasticità
• Assunzione del modello:
Var(i) = Var(yi) = 2 costante (omoschedasticità)
• In pratica, l’ipotesi è spesso violata tipicamente: Var(yi) varia in funzione del livello di una o più esplicative
Esempio: dati trade
La variabilità della spesa aumenta con il numero di visite
Implicazioni di marketing
Esempio: dati trade
visite_tot Tracciato dei residui
-200
0
200
0 50 100 150
visite_tot
Res
idu
i
Anche la variabilità dei residui aumenta con il numero di visite
Trasformazioni di Y
• Trasformare Y può aiutare a rendere Var(yi) approx costante (cioè a eliminare l’eteroschedasticità)
• Trasformazioni più comuni:– log(yi) se i E(yi)
– (yi)1/2 se yi è un conteggio
– Classe generale: Box-Cox (v. Zani-Cerioli, pp. 203-212)
• Le trasformazioni dei dati possono aiutare anche a– rendere migliore l’approx della distribuzione
di Y a una Normale
– rendere migliore l’approx di una funzione lineare
Esempio dati trade – log(Y)
La trasformazione logaritmica non sembra del tutto soddisfacente
Esempio dati trade – sqrt(Y)
Esempio dati trade – normalità Y
Y Sqrt(Y)
log(Y): la trasformazione logaritmica può essere preferibile dal punto di vista dell’approx della distribuzione di Y con una Normale
Esempio dati trade – log(Y) – log(X)
Interpretazione coefficienti
Analisi per esercizio
Autocorrelazione
• Assunzione del modello:
I disturbi i, e quindi le osservazioni yi, sono tra loro incorrelati (indipendenti)
• In pratica, l’ipotesi è spesso violata quando Y è una serie storica tipicamente il valore di Y al tempo t è influenzato dai valori di Y ai tempi precedenti: autocorrelazione (correlazione seriale)
• Dettagli: §4.4
top related