statistica per le decisioni di marketing andrea cerioli andrea.cerioli@unipr.it sito web del corso...

STATISTICA PER LE DECISIONI DI MARKETING

Andrea Cerioliandrea.cerioli@unipr.it

Sito web del corso

ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE

MULTIPLAMaggiore flessibilità per

applicazioni aziendali(Capitoli 4 – 5 del libro)

Regressione con variabili esplicative qualitative

(categoriali)

• caratteristiche socio-demografiche dei consumatori (sesso, professione, …)

• tipologia e area geografica dei punti vendita

• categoria merceologica dei prodotti• brand• …• in generale: gruppi diversi di

osservazioni

Es.: consumo e reddito USA (miliardi di $): §4.1

Reddito

Consumo

Negli anni 1942-1945 il modello sembra diverso: c’è una variabile importante esclusa dal modello

Aggiunta di una variabile dummy (variabile indicatrice con valori 0-1)

Il modello di regressione diventa multiplo:

Consumo = f(Reddito, dummy)

Risultati del modello di regr. lineare multiplo

�̂�=−𝟏𝟎 .𝟏+𝟎 .𝟗𝟔 𝑿𝟏−𝟓𝟓 .𝟒𝟔 𝑿𝟐

X1 = Reddito

X2 = Dummy

Interpretazione coefficienti?

Ricordando la definizione di X2 (dummy):

a parità di reddito (X1), la stima dell’ammontare dei consumi (y cappello) diminuisce di un ammontare pari a -55.46 (miliardi di $) negli anni in cui dummy=1 (cioè passando da un periodo di pace a uno di guerra)

se X2 = 0 (pace)

se X2 = 1 (guerra)

Rappresentazione grafica dell’effetto della variabile dummy (β2=-55.46): v. p. 113

Reddito

Consumo

L’adattamento migliora sensibilmente con la variabile dummy: v. p. 114

Generalizzazione al caso di variabili qualitative con più

di due modalità

Esempio: destagionalizzazione di una serie storica

Serie storica delle vendite di un bene (§4.2)

v. file: Esempio dati vendite stagionali

Modello:vendite stimate = f(trend + stagionalità + componente

erratica)

In questo esempio è presente solo la serie storica Y: le uniche variabili esplicative sono definite in funzione del tempo (trend, stagionalità e eventualmente ciclo)

Il modello può essere generalizzato includendo anche altre variabili esplicative (variabili esogene) se disponibili

Come possiamo rappresentare X?

• Perché manca la dummy per l’inverno?• formulazione alternativa (4 dummy; no intercetta): p.

117• La scelta della dummy da eliminare (o della

formulazione del modello) non cambia l’adattamento né le previsioni

La prima osservazione fa riferimento al primo trimestre (primavera);

La seconda osservazione fa riferimento al secondo trimestre (estate);

Stima dei parametri

• I coefficienti delle dummy stagionali rappresentano l’effetto della stagione considerata relativo alla stagione esclusa, a parità di trend

• Su tali stime si possono applicare tutte le procedure della regressione multipla (intervalli, test …): v. libro

Destagionalizzazione (p. 119-120)

La serie destagionalizzata non risente più delle ciclicità stagionali

Detrendizzazione (p. 119-120)

La serie detrendizzata non mostra più un andamento di lungo periodo (è stazionaria)

La serie detrendizzata e destagionalizzata non risente più né delle ciclicità stagionali né dell’andamento di lungo periodo: dovrebbe essere assimilabile alla componente erratica

(in realtà ciò è vero solo in parte: perché?)

Esercitazioni con variabili dummy

• Seminar sulla previsione delle vendite per il budgeting

• Previsione del consumo di gas (Esercizio 5.1, pp. 133-141)

Eteroschedasticità

• Assunzione del modello:

Var(i) = Var(yi) = 2 costante (omoschedasticità)

• In pratica, l’ipotesi è spesso violata tipicamente: Var(yi) varia in funzione del livello di una o più esplicative

Esempio: dati trade

La variabilità della spesa aumenta con il numero di visite

Implicazioni di marketing

Esempio: dati trade

visite_tot Tracciato dei residui

0 50 100 150

visite_tot

Anche la variabilità dei residui aumenta con il numero di visite

Trasformazioni di Y

• Trasformare Y può aiutare a rendere Var(yi) approx costante (cioè a eliminare l’eteroschedasticità)

• Trasformazioni più comuni:– log(yi) se i E(yi)

– (yi)1/2 se yi è un conteggio

– Classe generale: Box-Cox (v. Zani-Cerioli, pp. 203-212)

• Le trasformazioni dei dati possono aiutare anche a– rendere migliore l’approx della distribuzione

di Y a una Normale

– rendere migliore l’approx di una funzione lineare

Esempio dati trade – log(Y)

La trasformazione logaritmica non sembra del tutto soddisfacente

Esempio dati trade – sqrt(Y)

Esempio dati trade – normalità Y

Y Sqrt(Y)

log(Y): la trasformazione logaritmica può essere preferibile dal punto di vista dell’approx della distribuzione di Y con una Normale

Esempio dati trade – log(Y) – log(X)

Interpretazione coefficienti

Analisi per esercizio

Autocorrelazione

• Assunzione del modello:

I disturbi i, e quindi le osservazioni yi, sono tra loro incorrelati (indipendenti)

• In pratica, l’ipotesi è spesso violata quando Y è una serie storica tipicamente il valore di Y al tempo t è influenzato dai valori di Y ai tempi precedenti: autocorrelazione (correlazione seriale)

• Dettagli: §4.4

statistica per le decisioni di marketing andrea cerioli andrea.cerioli@unipr.it sito web del corso...

Documents

estensioni semplici e teorema dell’elemento primitivo

conf. cephalal. - vol. xxvi - n. 2 - settembre 2016 | issn...

india (estensioni)

nuove estensioni nomi a dominio: cosa cambia? focus tmch

laboratorio di analisi avanzata dei dati andrea cerioli...

ivan cerioli via pozzoli,1 26856 senna lodigiana (lo) ·...

data mining per il marketing andrea cerioli...

santa paola elisabetta cerioli curricolo 2014 classe 3 ·...

statistica per le decisioni di marketing andrea cerioli...

il giardino tinazzo cerioli di soncino cr

workshop 6: il paziente fragile moderatori: g. angarano, v....

13 estensioni mendel

cerioli volantino

istituto comprensivo a. moro scuola primaria … ·...

“estensione orchha – khajuraho - varanasi” › viaggi...

deviazioni ed estensioni genetica mendeliana pt.2

data mining per il marketing andrea cerioli...

data mining per il marketing andrea cerioli...

weka: struttura ed estensioni esercitazione data mining

pubblicare estensioni per libreoffice · dizionari e simili...