c_dummy-2013
DESCRIPTION
econometrieTRANSCRIPT
![Page 1: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/1.jpg)
ECONOMETRIE
- 2013 -
![Page 2: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/2.jpg)
Modele de regresie cu variabile alternative
Modele ANOVA
Modele ANCOVA
Variabilele alternative (dummy) sunt variabile categoriale care pot lua doar două valori. Acestor două valori li se acordă două coduri: codul 1 şi codul 0.
Exemplu: - sexul persoanei: masculin şi feminin.
![Page 3: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/3.jpg)
MODELE ANOVA (I)Modelele ANOVA sunt modelele în care variabilele independente sunt variabile dummy.Variabilele dummy vor fi notate cu D, iar parametrii asociaţi acestora cu ai.
Forma generală a modelului ANOVA cu variabile dummy este:
Y= a0+ a1D+ε
Valorile variabilei independente sunt: D=1, dacă se îndeplineşte o anumită condiţie sau proprietate pentru unităţi; D=0, dacă nu se îndeplineşte proprietatea.
De exemplu, pentru variabila D = sexul persoanei, valorile sunt:-D=1, dacă persoanele de sex masculin,-D=0, dacă persoanele nu sunt de sex masculin (sunt de sex feminin).
-M(Y/D)= a0, D=0 a0 + a1, D=1
![Page 4: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/4.jpg)
MODELE ANOVA (II)
Interpretarea parametrilor- a0 este nivelul mediu al variabilei Y pentru categoria D=0;
- a0+a1 arată nivelul mediu al variabilei Y pentru categoria D=1;
- a1 arată cu cât diferă nivelul mediu al variabilei Y în funcţie de cele două categorii (diferenţa dintre nivelul mediu al variabilei Y pentru categoria 1 şi nivelul mediu al variabilei Y pentru categoria 0).
În situaţia în care nu există nici o diferenţă semnificativă între valoarea medie a variabilei Y, obţinută pentru variabila dummy când D = 0 şi valoarea medie a variabile Y când D = 1, variabila dummy nu exercită o influenţă semnificativă asupra variabilei Y.
![Page 5: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/5.jpg)
MODELE ANOVA (III)
Pentru o populaţie împărţită în două grupe, se utilizează modelul de regresie:Y= a0+ a1D+ε
Notăm cu:- μ1 media variabilei pentru prima grupă (D=0);
- μ2 media variabilei pentru a doua grupă (D=1);
Regresia este: M(Y/D)= a0 = μ1, D=0
a0 + a1 = μ2, D=1
Pentru parametrii modelului se construiesc estimatorii:
10 ˆˆ
210 ˆˆˆ
121 ˆˆˆ
![Page 6: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/6.jpg)
MODELE ANOVA (IV)
Estimaţiile parametrilor modelului sunt:
unde n1 este volumul eşantionului pentru prima grupă, iar n2 este volumul eşantionului pentru a doua grupă.
Estimarea parametrului α1 echivalează cu estimarea diferenţei μ1-μ2, iar testarea parametrului echivalează cu testarea ipotezeiH0: μ1=μ2
1
110 n
yya
2
2210 n
yyaa
121 yya
![Page 7: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/7.jpg)
Exemplu: Pentru un eşantion format din 10 persoane, se înregistrează salariul lunar obţinut (mil.lei/lună) pe sexe (1- masculin; 0 feminin).
Salariu (mil.lei)
Sexul persoanei
15 1
10 0
9 0
17 1
11 0
18 1
17 1
12 0
11 0
19 1
MODELE ANOVA (V)
![Page 8: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/8.jpg)
În urma prelucrării datelor s-au obţinut următoarele rezultate:Estimarea parametrilor modelului : Yi=10,6+6,6D
Coefficientsa
10,600 ,592 17,917 ,000
6,600 ,837 ,941 7,889 ,000
(Constant)
sexul
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: salariua.
MODELE ANOVA (VI)
Valorile estimate ale parametrilor:- salariului mediu corespunzător persoanelor de sex feminin este de 10,6 mil. lei/lună (estimaţia lui a0).- diferenţa dintre salariul mediu al persoanelor de sex masculin şi salariul mediu al persoanelor de sex feminin este de 6,6 mil.lei/lună (estimaţia lui a1 ) iar nivelul mediu al salariului persoanelor de sex masculin este de 17,2 mil. lei/lună (estimaţia lui a0+ a1).
![Page 9: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/9.jpg)
Testarea semnificaţiei parametrilor - atât pentru parametrul α0,
cât şi pentru parametrul a1 avem sig.< 5% => respingem H0 cu un risc asumat de 5%.Din tabelele de mai jos rezultă că intensitatea legăturii dintre variabile, măsurată prin R, este de 0,941, iar raportul de corelaţie diferă semnificativ de zero (sig. < 0.05).
Model Summary
,941a ,886 ,872 1,32288Model1
R R SquareAdjustedR Square
Std. Error ofthe Estimate
Predictors: (Constant), sexula.
MODELE ANOVA (VII)
ANOVAb
108,900 1 108,900 62,229 ,000a
14,000 8 1,750
122,900 9
Regression
Residual
Total
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), sexula.
Dependent Variable: salariub.
![Page 10: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/10.jpg)
MODELE ANOVA (VIII)
Pentru o populaţie împărţită în trei grupe cu ajutorul unei variabile nominale, construirea unui model de regresie ANOVA presupune construirea mai multor variabile alternative. Dacă variabila nominală are p categorii, atunci se vor construi p-1 variabile alternative.De exemplu, pentru o variabilă nominală cu 3 categorii, care împarte populaţia în 3 grupe, cele două variabilele dummy, D1 şi D2, se construiesc astfel:
Pentru verificarea diferenţelor dintre cele trei grupe se utilizează modelul ANOVA: Y = α0+α1D1+α2D2+ε.
Grupa D1 D2
1 1 0
2 0 1
3 0 0
![Page 11: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/11.jpg)
MODELE ANOVA (IX)
Mediile condiţionate sunt:
M(Y/D)= α0, D1=0, D2=0
α0+α1, D1=1, D2=0
α0+α2, D1=0, D2=1
Interpretare- Parametrul α0 este media grupei 3, adică μ3;- α0+α1 este media grupei 1, adică μ1;- α0+α2 este media grupei 2, adică μ2;- α1 este diferenţa dintre grupa 1 şi grupa 3, μ1- μ3;- α2 este diferenţa dintre grupa 2 şi grupa 3, μ2- μ3.
Grupul pentru care nu se construieşte explicit o variabilă dummy este considerat grup de referinţă (de comparare).
![Page 12: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/12.jpg)
MODELE ANOVA (X)
ExempluSe consideră legătura dintre venitul persoanelor şi nivelul de educaţie. Variabila nivelul de educaţie are trei categorii: gimnazial, liceal şi universitar. Pentru a analiza legătura dintre venit şi educaţie se construiesc două variabile dummy, gimnazial şi liceal:
Grupa D1 D2
Gimnazial 1 0
Liceal 0 1
Universitar 0 0
![Page 13: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/13.jpg)
MODELE ANOVA (XI)
Ecuaţia estimată a modelului este:Y = 12-7.667D1-4.5D2+ε.
Interpretare:-a0: venitul mediu pentru persoanele cu studii universitare;
-a1: diferenţa dintre veniturile medii ale persoanelor cu studii gimnaziale şi universitare;-a2: diferenţa dintre veniturile medii ale persoanelor cu studii liceale şi universitare;-a0+a1=12-7.667=4.333: venitul mediu pentru persoanele cu studii gimnaziale;
-a0+a2=12-4.5=7.5: venitul mediu pentru persoanele cu studii liceale.
Coefficientsa
12.000 .626 19.178 .000
-7.667 .921 -1.016 -8.324 .000
-4.500 .857 -.641 -5.252 .000
(Constant)
gimnazial
liceal
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: venita.
![Page 14: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/14.jpg)
Modele de regresie cu variabile alternative (II)
Modele ANCOVA
Modelele ANCOVA sunt modele de regresie în care variabila dependentă este numerică iar variabilele independente sunt numerice şi categoriale (dummy).
![Page 15: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/15.jpg)
MODELE ANCOVA (1)
Modelul ANCOVA cu o variabilă dummy şi o variabilă numerică
Forma generală a modelului: Y=α0+ α1D+ βX+εunde:- Y este variabila dependentă numerică;- D este variabila independentă dummy;- X este variabila independentă numerică;- α0 este nivelul mediu al variabilei Y când D=0, în condiţiile în care X=0;
- α0 + α1 este nivelul mediu al variabilei Y atunci când D=1, în condiţiile în care X=0;
- α1 arată diferenţa dintre valoarea medie a variabilei Y pe cele două categorii (categoria 1 şi categoria 0), în condiţiile în care X=0;
- β arată cu cât variază, în medie, nivelul variabilei Y la o creştere cu o unitate a lui X, indiferent de grup (categorie).
- M(Y/D)= a0+β, D=0 (a0+a1) + βX, D=1.
![Page 16: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/16.jpg)
MODELE ANCOVA (2)
Exemplu: Pentru un eşantion de persoane se înregistrează salariul lunar obţinut (Y, mil.lei), sexul persoanei (1-masculin, 0- feminin) şi numărul de ani de şcoală.
În urma prelucrării datelor s-au obţinut următoarele rezultate:
Coefficientsa
3,109 2,592 1,199 ,276
5,757 ,689 ,778 8,351 ,000
,480 ,165 ,272 2,914 ,027
(Constant)
sexul
ani_scoala
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: salariua.
![Page 17: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/17.jpg)
MODELE ANCOVA (3)
- a0: Nivelul mediu al salariului pentru persoanele de sex feminin, în condiţiile în care nivelul educaţiei este de 0 ani;
-a0+ a1 = 8,866: Nivelul mediu estimat al salariului pentru persoanele de sex masculin, în condiţiile în care nivelul educaţiei este de 0 ani;
- a1: Nivelul mediu al salariului persoanelor de sex masculin este mai mare cu 5,757 mil. lei/lună decât nivelul mediu al salariului persoanelor de sex feminin, în condiţiile în care nivelul educaţiei este nul;
- b: La o creştere cu un an a numărului de ani de şcoală, nivelul salariului, în medie, cu 0,48 mil. lei/lună, indiferent de sexul persoanelor.
Observaţie: dacă valoarea parametrului α1 este semnificativ diferită de zero, atunci există diferenţe între nivelurile medii ale salariului pe sexe.
![Page 18: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/18.jpg)
MODELE ANCOVA (4)
Modelul ANCOVA cu două variabile dummy şi o variabilă numerică
Pentru acest tip de model, populaţia este structurată în 3 grupe, pentru care creăm două variabile dummy.
Forma modelului: Y=a0+ α1D1+ α2D2+ βX+ε,unde:Y = variabila rezultativă, numerică;D1, respectiv D2 = variabile factoriale, dummy, ale căror variante sunt „da” şi „nu” (posedă sau nu posedă însuşirea), respectiv „1” şi „0”;X = variabila explicativă (factorială), numerică.
Rezultă 3 regresii:
α0+βX, D1=0, D2=0
M(Y/X, D1, D2)= (α0+α1)+βX, D1=1, D2=0
(α0+α2)+βX, D1=0, D2=1
![Page 19: C_dummy-2013](https://reader036.vdocuments.pub/reader036/viewer/2022071806/55cf9026550346703ba34e47/html5/thumbnails/19.jpg)
MODELE ANCOVA (5)
Variabila categorială este regiunea de provenienţă (OECD, Europa de Est şi Asia). D1 este creată pentru OECD, iar D2 pentru EE.
Interpretare:-a0=47.226 este nivelul mediu estimat al speranţei de viaţă pentru femei din Asia;- a1=4.379 este diferenţa dintre speranţa de viaţă a femeilor din OECD faţă de cele din Asia. Speranţa medie de viaţă a femeilor din OECD este cu 4.379 ani mai mare decât acelor din Asia;- a2=-1.653 este diferenţa dintre speranţa de viaţă a femeilor din EE faţă de cele din Asia. Speranţa medie de viaţă a femeilor din EE este cu 1.653 ani mai mică decât acelor din Asia; - b=0.304 este creşterea medie a speranţei de viaţă a femeilor la o creştere cu 1% a RAF;- a0+a1=51.505 este nivelul mediu estimat al SVF pentru persoanele din OECD;- a0+a2=45.573 este nivelul mediu estimat al SVF pentru persoanele din EE;
Coefficientsa
47.226 1.785 26.457 .000
.304 .027 .811 11.386 .000
4.379 2.745 .105 1.595 .115
-1.653 2.402 -.048 -.688 .493
(Constant)
Rata de alfabetizarepentru femei (%)
OECD
EE
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Speranta medie de viata pentru femeia.