Download - Proiect seminar Econometrie
PROIECT ECONOMETRIE AN III ZI, MANAGEMENT
Problema AÎnregistrați pentru 42 de unități (județe), valorile specifice ale unei
perechi de caracteristici (X și Y) între care există o legătură logică. Datele prezentate sub forma tabelară fac parte din lucrare.
Y – rata criminalitatii
X1 – rata somajului
X2 – rata infractionalitatii
1. Prezentarea problemei (inclusiv descrierea naturii legăturii dintre cele două variabile, conform teoriei economice);
Cercetarea de fata are ca obiectiv punerea in evidenta a legaturii dintre rata somajului, respective rata infractionalitatii si rata criminalitatii. Rata somajului se calculează ca raport procentual între masa şomajului (numărul mediu al şomerilor) şi unul din parametrii de referinţă ai acestuia. Astfel de parametrii sunt: populaţia activă, populaţia active disponibilă, populaţia ocupată etc. Ocuparea deplină a forţei de muncă nu înseamnă o rată de ocupare de 100%, deoarece există întotdeauna persoane neocupate dar care se află în perioada necesară schimbării locului de muncă. Ponderea acestora este exprimată de rata naturală a şomajului. Rata infractionalitatii reprezintă numărul infracţiunilor cercetate de poliţie raportat la 100000 de locuitori.Rata criminalitatii reprezintă numărul persoanelor condamnate definitiv raportat la 100000 de locuitori.Care este legatura intre somaj, respective infractionalitate si criminalitate? Cat din variatia criminalitatii este explicate de somaj, respectiv de infractionalitate?
2. Definirea modelului de regresie simplă liniară2.1- Forma, variabilele și parametrii modelului de regresieNotand cu y (variabila dependenta) rata criminalitatii si cu x (variabila
independenta) rata somajului, respective rata infractionalitatii cu α,β – parametrii modelului, cu β>0, atunci ecuatia de regresie pentru populatia statistica generala poate fi descrisa prin modelul probabilistic linear:
y=α+βx(relatie determinista/exacta)
Intrucat in realitate dependeta dintre rata criminalitatii si rata somajului, respecti rata infractionalitatii este una stochastica, iar in determinarea ratei criminalitatii nu s-a
1
luat in calcul decat un singur factor, desi dependentele sunt mai numeroase, modelul econometric al ratei criminalitatii va fi dat de :
y i=α+β x i+e i
Unde α ,β- parametric de regresie si :α- punct de intersectie al dreptei de regresie cu axa Oyβ- panta dreptei, coefficient de regresie care arata cu cate unitati de masura se modifica y daca x se modifica cu o unitate de masurae i- component reziduala (abaterea) – este partea din valoarea lui y care nu poate fi determinate cunoscand valoarea individuala (x i)
y i= y i+εi
Unde :ε i- component predictibila (determinista) adica specifica modelului matematic.
Partea din valoarea lui y care poate fi determinate cunoscand valoarea lui xi :y i=α+β x i
Pentru esantion modelul de regresie liniara este :y i= α+ β x i+e i
cu componenta predictibila:y i= α+ β x i
Unde:α , β- estimatorii punctului de intersectie (α) si ai pantei liniei de regresie (β)
obtinuta pe esantione i- estimatorul componentei reziduale ε i
Variabilele au urmatoarele valori in anul 2010:
Rata somaj 2010 (x1)
Rata infractionalitatii 2010 (x2)
Rata criminalităţii 2010 (Y)
Alba 10.00% 2,094 275Arad 5.20% 1,304 222Argeş 7.60% 1,255 152Bacău 7.80% 1,234 234Bihor 5.90% 1,290 208Bistriţa-Năsăud 6.40% 1,352 171Botoşani 6.40% 1,093 219Brăila 8.70% 1,236 244Braşov 7.20% 1,332 206Buzău 9.70% 1,124 118Călăraşi 8.80% 1,702 216Caraş-Severin 9.00% 1,550 134Cluj 4.90% 1,699 192Constanţa 5.80% 1,209 200Covasna 10.00% 1,151 176Dâmboviţa 8.50% 1,402 137Dolj 9.80% 1,559 163
2
Rata somaj 2010 (x1)
Rata infractionalitatii 2010 (x2)
Rata criminalităţii 2010 (Y)
Galaţi 10.40% 985 285Giurgiu 8.40% 1,772 132Gorj 10.10% 1,916 250Harghita 8.80% 1,680 212Hunedoara 8.50% 2,384 289Ialomiţa 9.90% 1,419 186Iaşi 7.00% 1,088 206Ilfov 2.70% - 103Maramureş 6.00% 1,373 248Mehedinţi 10.50% 1,607 277Municipiul Bucureşti 2.30% 1,307 160Mureş 8.00% 1,713 223Neamţ 7.70% 1,123 216Olt 8.20% 1,542 202Prahova 8.60% 1,145 122Sălaj 8.40% 1,302 229Satu Mare 6.10% 1,467 239Sibiu 5.80% 1,362 218Suceava 7.30% 1,062 159Teleorman 10.90% 1,034 158Timiş 3.70% 1,133 141Tulcea 8.10% 1,638 240Vâlcea 7.70% 1,477 121Vaslui 11.80% 1,282 284Vrancea 7.40% 1,219 249
Sursa: Repere economice şi sociale regionale: Statistică teritorială (INS)
2.2- Reprezentarea grafică a modelului legăturii dintre variabilePrimul model:
3
0% 2% 4% 6% 8% 10% 12% 14%50
100
150
200
250
300
350
f(x) = 693.906152585776 x + 146.520617680247
Legatura intre rata criminalitatii si rata somajului la 2010
Rata criminalităţii 2010 (Y) Linear (Rata criminalităţii 2010 (Y))Rata somajului
Rata
crim
inal
itatii
100
125
150
175
200
225
250
275
300
.02 .04 .06 .08 .10 .12
RATASOMAJ
RA
TA
CR
IMIN
ALI
TA
TII
Al doilea model
4
0 500 1,000 1,500 2,000 2,500 3,00050
100
150
200
250
300
350
f(x) = 0.057182748070708 x + 121.937113979955
Legatura intre rata criminalitatii si rata infrac-tionalitatii la 2010
Rata criminalităţii 2010 (Y) Linear (Rata criminalităţii 2010 (Y))Rata infractionalitatii
Rata
crim
inal
itatii
100
125
150
175
200
225
250
275
300
0 500 1,000 1,500 2,000 2,500
RATAINFRACTIONALITATII
RA
TA
CR
IMIN
AL
ITA
TII
3. Estimarea parametrilor modelului și interpretarea acestora3.1- Estimarea punctuală a parametrilor
Pentru primul model
Dependent Variable: RATACRIMINALITATIIMethod: Least SquaresDate: 05/02/14 Time: 20:17Sample: 1 42Included observations: 42RATACRIMINALITATII=C(1)+C(2)*RATASOMAJ
Coefficient Std. Error t-Statistic Prob.
5
C(1) 146.5206 29.10590 5.034052 0.0000C(2) 693.9062 361.9955 1.916892 0.0624
R-squared 0.084133 Mean dependent var 200.3810Adjusted R-squared 0.061237 S.D. dependent var 50.79512S.E. of regression 49.21529 Akaike info criterion 10.67673Sum squared resid 96885.80 Schwarz criterion 10.75948Log likelihood -222.2114 Hannan-Quinn criter. 10.70706F-statistic 3.674473 Durbin-Watson stat 2.197276Prob(F-statistic) 0.062415
Pentru al doilea model
Dependent Variable: RATACRIMINALITATIIMethod: Least SquaresDate: 05/02/14 Time: 20:30Sample: 1 42Included observations: 42RATACRIMINALITATII=C(3)+C(4)*RATAINFRACTIONALITATII
Coefficient Std. Error t-Statistic Prob.
C(3) 121.9371 28.38127 4.296394 0.0001C(4) 0.057183 0.020006 2.858257 0.0067
R-squared 0.169601 Mean dependent var 200.3810Adjusted R-squared 0.148841 S.D. dependent var 50.79512S.E. of regression 46.86269 Akaike info criterion 10.57877Sum squared resid 87844.47 Schwarz criterion 10.66151Log likelihood -220.1541 Hannan-Quinn criter. 10.60910F-statistic 8.169636 Durbin-Watson stat 2.362007Prob(F-statistic) 0.006732
Pentru estimarea parametrilor modelului linear de regresie se utilizeaza metoda minimizarii sumei patratelor deviatiilor (abaterilor reziduale ei ). Cu cat este mai mica ei, cu atat este mai aproape y i (valoarea determinista ) de valoarea observata yi.
S (α , β )=min∑i
e i2=min∑
i
( yi−α− β x i)2
Din care rezulta sistemul:
{ n α + β∑ x i=∑ yi
α∑ x i+ β∑ x i2=∑ x i y i
Coeficientul alpha si beta se poate deduce ecuatia
β=∑ ( x i−x )∗( y i− y )
∑ ( x i−x )2
α= y− β∗xEcuatia :Pentru primul model
y i= α+ β x i=¿693,91x+146.52
6
Pentru al doilea modely i= α+ β x i=0,0572x+121,94
(vezi sheet Info centralizate A -2)
3.2- Estimarea parametrilor prin interval de încredereIntervalul de incredere al celor doi parametri – alpha si beta – se
estimeaza cu ajutorul erorii standard aferenta lor (Standard Error din Excel, tabelul cu parametri - ES) si a testului statistic (t-stat din acelasi tabel), astfel:
α−t tab∗ES ( α )≤ α ≤ α+ ttab∗ES (α )
β−t tab∗ES ( β ) ≤ β ≤ β+t tab∗ES( β )
Pentru a calcula acest interval de incredere, trebuie sa calculam urmatoarele:
ES ( α )=√σ2[ 1n+ x2
∑ ( x i−x )2], unde: σ=√ 1
n−m−1∗∑ ( y i− y )
2
n- no Observatii (42)
m- numar de variabile endogene (regresie simpla – 1 variabila => m=1, regresie multipla cu 2 variabile – m=2)
ES ( β )=√ σ2
∑ ( x i−x )2
t tab – este preluat din tabelul distributiei t-Student pentru interval (two-tailed, pentru interval de incredere de 95%, grade de libertate 41 – adica numarul de observatii minus 1) = 2.021
Astfel, putem afirma, cu un grad de incredere de 95%, ca intervalele in care se afla parametrii modelului de regresie liniara sunt:
- Pentru primul model:coeficient ES t-stat Lower 95% Upper 95%
beta 693.91
361.9955
1.92
-37.71 1,425.53
alpha 146.52
29.11
5.03
87.70 205.35
Beta apartine intervalului -37.71, 1,425.53 ;Alpha apartine intervalului 87.70 , 205.35.
- Pentru al doilea model:coeficient ES t-stat Lower 95% Upper 95%
beta 0.06
0.0200
2.86 0.02
0.10
alpha 121.94
28.38
4.30 64.58
179.30
7
(vezi sheet Info centralizate A -2)
4. Testarea semnificației corelației și a parametrilor modelului de regresie4.1- Testarea semnificației corelațieiPrimul model:Masurarea intensitatii legaturii se face prin raportul de corelatie:
R=√R2=√∑ ( y i− y )2
∑ ¿¿¿¿
(Unde R2- R-Squared din ecuatia Excel). Aceasta valoare arata ca exista o legatura slaba si directa deoarece valoarea indicatorilor relativi utilizati pentru masurarea intensitatii legaturii este in intervalul 0-0.5.
Coeficientul de determinatie
R2=∑ ( y i− y )2
∑ ¿¿¿Arata ca 8% din variatia totala a variabilei rata criminalitatii este explicata de
variatia ratei somajului.
Teoria raportului de corelatie:Ipoteza nula H0: R=0 ( R nu este seminificativ satistic)Ipoteza alternative H1: R != 0 ( R este semnificativ statistic)Pentru testarea semnificatiei se utilizeaza testul Fisher:
F calc=n−m−1
mR2
1−R2 =8.17
Unde :m- numarul de variabile exogene (1)
F tabelar=F0.05 ;1 ;42−1=4.08De unde rezulta ca Fisher calculat> Fisher tabular, deci se accepta ipoteza H 1.
Raportul de corelatie este semnificativ diferit de 0, semnificativ statistica.
Al doilea model:Masurarea intensitatii legaturii se face prin raportul de corelatie:
R=√R2=√∑ ( y i− y )2
∑ ¿¿¿¿
(Unde R2- R-Squared din ecuatia Excel). Aceasta valoare arata ca exista o legatura slaba si directa deoarece valoarea indicatorilor relative utilizati pentru masurarea intensitatii legaturii este in intervalul 0-0.5.
Coeficientul de determinatie
R2=∑ ( y i− y )2
∑ ¿¿¿Arata ca 17% din variatia totala a variabilei rata criminalitatii este explicate de
variatia ratei infractionalitatii.Teoria raportului de corelatie:
8
Ipoteza nula H0: R=0 ( R nu este seminificativ satistic)Ipoteza alternative H1: R != 0 ( R este semnificativ statistic)Pentru testarea semnificatiei se utilizeaza testul Fisher:
F calc=n−m−1
mR2
1−R2 =3.674
Unde :m- numarul de variabile exogene (1)
F tabelar=F0.05 ;1 ;42−1=4.08De unde rezulta ca Fisher calculat> Fisher tabular, deci se accepta ipoteza H 1.
Raportul de corelatie este semnificativ diferit de 0, semnificativ statistica.
4.2- Testarea parametrilor unui model de regresie simpluTestarea parametrilor unui model de regresie simplu se face cu ajutorul valorii
nivelului de semnificatie – P-value din Excel pentru fiecare parametru – sau cu ajutorul t calculat dupa cum urmeaza:
Testarea semnificatiilor parametrilor pentru α Pentru primul model:
t α=α
ES (α , )=5.034 t α
2,n−2
=t 0.05,41=2.021
H0: daca α=0 - nu este semnificativ statisticH1: daca α !=0 – este semnificativ statistic, semnificativ diferit de 05.034>2.021 se respinge H0, se accepta H1 (α este semnificativ din punct de
vedere statistic) pentru α .Testarea semnificatiilor parametrilor pentru β
t β=β
ES ( β)=1.92 t α
2, n−2
=t 0.05,41=2.021
H0: daca β=0 - nu este semnificativ statisticH1: daca β !=0 – este semnificativ statistic, semnificativ diferit de 01.92<2.021 se accepta H0, se respinge H1 (β este semnificativ din punct de vedere
statistic) pentru β.Testele Akaike si Schwarz sunt folosite pentru compararea a 2 sau mai multe
modele. Cel mai bun model este acela care are valorile cele mai mici pentru aceste doua teste.
Sc=−2 L
n+ K∗ln n
n=10.75948
Aic=−2L
n+2 K
n=10.67673
Pentru al doilea model:
9
t α=α
ES (α , )=4.30 t α
2,n−2
= t0.05,41=2.021
H0: daca α=0 - nu este semnificativ statisticH1: daca α !=0 – este semnificativ statistic, semnificativ diferit de 04.30>2.021 se respinge H0, se accepta H1 (α este semnificativ din punct de vedere
statistic) pentru α .Testarea semnificatiilor parametrilor pentru β
t β=β
ES ( β)=2.85 t α
2,n−2
=t 0.05,41=2.021
H0: daca β=0 - nu este semnificativ statisticH1: daca β !=0 – este semnificativ statistic, semnificativ diferit de 02.85>2.021 se respinge H0, se accepta H1 (β este semnificativ din punct de vedere
statistic) pentru β.Testele Akaike si Schwarz sunt folosite pentru compararea a 2 sau mai multe
modele. Cel mai bun model este acela care are valorile cele mai mici pentru aceste doua teste.
Sc=−2 L
n+ K∗ln n
n=10.57877
Aic=−2 L
n+2 K
n=10.66151
5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de regresie simplu și interpretarea rezultatelor
10
Primul model
SUMMARY OUTPUT
Regression StatisticsMultiple R 0.290057R Square 0.084133Adjusted R Square 0.061237Standard Error 49.21529Observations 42
ANOVA
df SS MS FSignifican
ce F
Regression 18900.10
68900.10
63.67447
30.062414
63
Residual 40 96885.82422.14
5
Total 41105785.
9
Coefficient
sStandard Error t Stat P-value
Lower 95% Upper 95%
Lower 95.0%
Upper 95.0%
Intercept 146.5206 29.10595.03405
2 0.0000
87.6953943
205.345841
87.69539
205.3458
Rata somaj 2010 (x1)
693.9062 361.9955
1.916892
0.0624
-37.71409
1425.5264 -37.7141
1425.526
11
882.021075
39
RESIDUAL OUTPUT PROBABILITY OUTPUT
Observation
Predicted Rata
criminalităţii 2010 (Y)
Residuals
Standard
Residuals Percentile
Rata criminalităţii 2010 (Y)
1 215.911259.0887
71.21553
31.190476
19 103
2 182.603739.3962
60.81043
33.571428
57 118
3 199.2575-
47.2575-
0.972155.952380
95 121
4 200.6453 33.3547 0.686158.333333
33 122
5 187.461120.5389
20.42251
210.71428
57 132
6 190.9306-
19.9306 -0.4113.09523
81 134
7 190.930628.0693
90.57742
415.47619
05 137
8 206.890537.1095
50.76339
217.85714
29 141
9 196.48199.51813
90.19580
120.23809
52 15210 213.8295 - - 22.61904 158
12
95.8295 1.97134 76
11 207.58448.41564
10.17312
1 25 159
12 208.9722-
74.9722-
1.5422827.38095
24 160
13 180.52211.4779
80.23611
729.76190
48 163
14 186.767213.2328
30.27221
732.14285
71 171
15 215.9112-
39.9112-
0.8210334.52380
95 176
16 205.5026-
68.5026-
1.4091936.90476
19 186
17 214.5234-
51.5234 -1.059939.28571
43 192
18 218.686966.3131
41.36414
841.66666
67 200
19 204.8087-
72.8087-
1.4977744.04761
9 202
20 216.605133.3948
60.68697
646.42857
14 206
21 207.58444.41564
10.09083
648.80952
38 206
22 205.502683.4973
6 1.7176551.19047
62 208
23 215.2173-
29.2173-
0.6010453.57142
86 212
24 195.09410.9059
5 0.2243555.95238
1 216
25 165.2561-
62.2561-
1.2806958.33333
33 21626 188.155 59.8450 1.23109 60.71428 218
13
1 57
27 219.380857.6192
41.18530
363.09523
81 219
28 162.4805-
2.48046-
0.0510365.47619
05 222
29 202.033120.9668
90.43131
667.85714
29 223
30 199.951416.0486
10.33014
170.23809
52 229
31 203.4209-
1.42092-
0.0292372.61904
76 234
32 206.1965-
84.1965-
1.73203 75 239
33 204.808724.1912
70.49764
677.38095
24 240
34 188.848950.1511
11.03167
479.76190
48 244
35 186.767231.2328
3 0.642582.14285
71 248
36 197.1758-
38.1758-
0.7853384.52380
95 249
37 222.1564-
64.1564-
1.3197886.90476
19 250
38 172.1951-
31.1951-
0.6417289.28571
43 275
39 202.72737.2729
80.76675
491.66666
67 277
40 199.9514-
78.9514-
1.6241394.04761
9 284
41 228.401555.5984
61.14373
396.42857
14 28542 197.8697 51.1303 1.05181 98.80952 289
14
3 8 38
0.00%2.00%
4.00%6.00%
8.00%
10.00%
12.00%
14.00%
-150-100
-500
50100
Rata somaj 2010 (x1) Re-sidual Plot
Rata somaj 2010 (x1)
Resid
uals
0.00% 5.00% 10.00% 15.00%0
100200300400
Rata somaj 2010 (x1) Line Fit Plot
Rata criminalităţii 2010 (Y)Predicted Rata crim-inalităţii 2010 (Y)
Rata somaj 2010 (x1)
Rata
crim
inal
ităţii
201
0 (Y
)
0 20 40 60 80 100 1200
100200300400
Normal Probability Plot
Sample PercentileRata
crim
inal
ităţii
201
0 (Y
)
15
Al doilea model
SUMMARY OUTPUT
Regression StatisticsMultiple R 0.411827
R Square 0.1696010.4118
27Adjusted R Square 0.148841Standard Error 46.86269Observations 42
ANOVA
df SS MS FSignifica
nce F
Regression 117941.
4317941.
438.1696
360.00673
2
Residual 4087844.
472196.1
12
Total 4110578
5.9
Coefficients
Standard
t Stat P-value
Lower 95%
Upper 95%
Lower 95.0%
Upper 95.0%
16
Error
Intercept 121.937128.381
274.2963
940.0001
0864.5764
3 179.297864.576
43179.29
78Rata infractionalitatii 2010 (x2) 0.057183
0.020006
2.858257
0.006732
0.016749 0.097617
0.016749
0.097617
RESIDUAL OUTPUT PROBABILITY OUTPUT
Observation
Predicted Rata
criminalităţii 2010
(Y)Residu
als
Standard
Residuals
Percentile
Rata criminalităţii 2010
(Y)
1 241.677833.322
210.7198
941.19047
6 103
2 196.503425.496
580.5508
293.57142
9 118
3 193.7015
-41.701
5
-0.9009
25.95238
1 121
4 192.500641.499
370.8965
548.33333
3 122
5 195.702912.297
140.2656
6810.7142
9 132
6 199.2482
-28.248
2
-0.6102
713.0952
4 1347 184.4379 34.562 0.7466 15.4761 137
17
14 81 9
8 192.61551.385
011.1101
2317.8571
4 141
9 198.10457.8954
660.1705
74 20.2381 152
10 186.2105
-68.210
5
-1.4736
222.6190
5 158
11 219.2622
-3.2621
5
-0.0704
8 25 159
12 210.5704
-76.570
4
-1.6542
327.3809
5 160
13 219.0906
-27.090
6
-0.5852
7 29.7619 163
14 191.07118.9289
440.1929
0132.1428
6 171
15 187.7545
-11.754
5
-0.2539
434.5238
1 176
16 202.1073
-65.107
3
-1.4065
836.9047
6 186
17 211.085-
48.085
-1.0388
339.2857
1 192
18 178.2621106.73
792.3059
6841.6666
7 20019 223.2649 -
91.264-
1.971644.0476
2202
18
9 9
20 231.499318.500
740.3996
9146.4285
7 206
21 218.0041
-6.0041
3
-0.1297
148.8095
2 206
22 258.260830.739
210.6640
9151.1904
8 208
23 203.0794
-17.079
4
-0.3689
853.5714
3 212
24 184.151921.848
060.4720
0655.9523
8 216
25 121.9371
-18.937
1
-0.4091
258.3333
3 216
26 200.44947.550
971.0272
9360.7142
9 218
27 213.829863.170
211.3647
3163.0952
4 219
28 196.675-
36.675
-0.7923
365.4761
9 222
29 219.89123.1088
390.0671
6367.8571
4 223
30 186.153329.846
660.6448
08 70.2381 229
31 210.1129
-8.1129
1
-0.1752
772.6190
5 23432 187.4114 -
65.411-
1.413175 239
19
4 5
33 196.389132.610
950.7045
2877.3809
5 240
34 205.824233.175
790.7167
31 79.7619 244
35 199.8218.179
980.3927
6182.1428
6 248
36 182.6652
-23.665
2
-0.5112
684.5238
1 249
37 181.0641
-23.064
1
-0.4982
886.9047
6 250
38 186.7252
-45.725
2
-0.9878
589.2857
1 275
39 215.602524.397
540.5270
8591.6666
7 277
40 206.396-
85.396-
1.844994.0476
2 284
41 195.245488.754
61.9174
5796.4285
7 285
42 191.642957.357
121.2391
4598.8095
2 289
20
- 500 1,000 1,500 2,000 2,500 3,000
-200-100
0100200
Rata infractionalitatii 2010 (x2) Residual Plot
Rata infractionalitatii 2010 (x2)
Resid
uals
- 1,000 2,000 3,000 0
100200300400
Rata infractionalitatii 2010 (x2) Line Fit Plot
Rata criminalităţii 2010 (Y)
Predicted Rata criminalităţii 2010 (Y)
Rata infractionalitatii 2010 (x2)
Rata
crim
inal
ităţii
201
0 (Y
)
0 20 40 60 80 100 1200
100200300400
Normal Probability Plot
Sample PercentileRata
crim
inal
ităţii
201
0 (Y
)
21
6. Testarea ipotezelor clasice asupra modelului de regresie simplăPrimul model:Heteroskedasticity Test: White
F-statistic 2.702686 Prob. F(2,39) 0.0796Obs*R-squared 5.112572 Prob. Chi-Square(2) 0.0776Scaled explained SS 2.282338 Prob. Chi-Square(2) 0.3194
Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 05/04/14 Time: 02:26Sample: 1 42Included observations: 42
Variable Coefficient Std. Error t-Statistic Prob.
C 1452.113 2960.431 0.490507 0.6265RATASOMAJ -24250.05 83768.56 -0.289489 0.7737
RATASOMAJ^2 423362.4 576192.8 0.734758 0.4669
R-squared 0.121728 Mean dependent var 2306.805Adjusted R-squared 0.076688 S.D. dependent var 2316.424S.E. of regression 2225.831 Akaike info criterion 18.32240Sum squared resid 1.93E+08 Schwarz criterion 18.44652Log likelihood -381.7704 Hannan-Quinn criter. 18.36789F-statistic 2.702686 Durbin-Watson stat 2.719525Prob(F-statistic) 0.079573
0
1
2
3
4
5
6
7
-100 -80 -60 -40 -20 0 20 40 60 80
Series: ResidualsSample 1 42Observations 42
Mean -2.33e-14Median 11.19197Maximum 83.49736Minimum -95.82951Std. Dev. 48.61140Skewness -0.381841Kurtosis 1.984349
Jarque-Bera 2.825826Probability 0.243433
22
Al doilea model:Heteroskedasticity Test: White
F-statistic 0.370798 Prob. F(2,39) 0.6926Obs*R-squared 0.783740 Prob. Chi-Square(2) 0.6758Scaled explained SS 0.559651 Prob. Chi-Square(2) 0.7559
Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 05/04/14 Time: 02:27Sample: 1 42Included observations: 42
Variable Coefficient Std. Error t-Statistic Prob.
C 909.5870 2561.462 0.355105 0.7244RATAINFRACTIONALITATII 2.438161 3.559027 0.685064 0.4974RATAINFRACTIONALITATII^
2 -0.001075 0.001315 -0.817069 0.4189
R-squared 0.018660 Mean dependent var 2091.535Adjusted R-squared -0.031665 S.D. dependent var 2656.287S.E. of regression 2698.014 Akaike info criterion 18.70717Sum squared resid 2.84E+08 Schwarz criterion 18.83129Log likelihood -389.8505 Hannan-Quinn criter. 18.75266F-statistic 0.370798 Durbin-Watson stat 1.412206Prob(F-statistic) 0.692590
0
2
4
6
8
10
-100 -75 -50 -25 0 25 50 75 100 125
Series: ResidualsSample 1 42Observations 42
Mean 1.08e-14Median 5.502152Maximum 106.7379Minimum -91.26494Std. Dev. 46.28767Skewness -0.045578Kurtosis 2.574542
Jarque-Bera 0.331317Probability 0.847336
6.1- Ipoteze statistice clasice supra modelului de regresie simplăTestarea raportului de corelatie – vezi 4.1
Testarea parametrilor unui model de regresie simplu – vezi 4.2
23
Teste de detectarea heteroscedasticitatii si de corectare a acesteia – precum Goldfield-Quandt (pentru serii lungi de date si in care una dintre variabile reprezinta cauza heteroscedasticitatii).
6.2- Testarea liniarității modelului propusLiniaritatea poate sa fie testata intr-un mod evident prin graficul care compara
valorile observate ale ratei criminalitatii versus valorile obtinute prin functia de regresie. In ambele modele, valorile sunt distribuite simetric in jurul liniei de regresie.
6.3- Testarea normalității erorilorTestul Jarque-Bera ( verificarea ipotezei de normalitate a erorilor)
JB=n [ S2
6+
( k−3 )2
2 n ] χα ,r2
H0: erorile nu sunt distribuite normalH1: erorile sunt distribuite normalTestul Jarque-Bera se bazeaza pe ipoteza ca distributia normala are un coefficient
de asimetrie ( S=0) si un coeficient de aplatizare ( k=3)Daca p(JB) – valoarea probabilitatii lui Jarque-Bera- este suficient de scazuta,
rezulta ca ipoteza de normalitate a erorilor este respinsa (JB > χα , r2 ; 0.282, respectiv
0.331>5.9915 rezulta ca se respinge H0).
6.4- Testarea ipotezei de homoscedasticitateTestul WhitePresupune construirea unei regresii auxiliare bazate pe presupunerea unei relatii
de dependent intre patratul valorii erorilor, variabila exogena inclusa in modelul initial ( consumul ) si patratul valorilor acestuia.
ε i2=α 0+α1 xi+α2 xi
2+wi
H0: α¿α 1=α 0=0 ( nici un α nu e semnificativ statistic- homoscedast – media erorilor e 0, iar dispersia este 1)H1: ∃∀α i≠0 ( exista cel putin un αi care este semnificativ statistic)6.5- Testarea ipotezei de autocorelare a erorilorPrimul model:Testul Durbin-Watson
∆ W =∑i=2
n
( εi− εi−1)2
∑ εi2 =2.71
Cu n=41,α=0.05,p=2 de unde rezulta ca d1=1.44,d2= 1.54. Astfel, ne aflam in cazul 5( 4-d1≤∆W≤4), autocorelandu-se negativ.
Al doilea model:Testul Durbin-Watson
∆ W =∑i=2
n
( εi− εi−1)2
∑ εi2 =1.41
24
Cu n=41,α=0.05,p=2 de unde rezulta ca d1=1.44,d2= 1.54. Astfel, ne aflam in cazul 5(d1≤∆W≤ d1), testul nefiind concludent.
7. Previziunea valorii variabilei Y dacă variabila X crește cu 10% față de ultima valoare înregistrată (inclusiv interval de încredere) pentru toate variantele cunoscute.
Daca variabila creste cu 10% fata de ultima valoare inregistrata, adica fata de 7.4%, respectiv 1,219 in modelul 1, respectiv modelul 2, adica 0.74%, respectiv 121.9 atunci:
Pentru primul modely i= α+ β x i=¿693,91x+146.52 se transforma in: y i= α+ β x i=¿693,91x+197.87
Pentru al doilea model:y i= α+ β x i=0,0572x+121,94 se transforma in: y i= α+ β x i=0,0572x+128.91
Rezolvarea problemei A de exemplificat atât în Excel cât și în Eviews.Problema B
1. Definirea modelului de regresie multiplă liniară
2.1- Forma, variabilele, parametrii modelului de regresie multiplă
Forma: Y=α+β1*X1+ β2*X2
Variabilele: X1 – rata somajului
X2 – rata infractionalitatii
Y – rata criminalitatii
Parametrii:α- punct de intersectie al dreptei de regresie cu axa Oyβ1,2- panta dreptei, coefficient de regresie care arata cu cate unitati de masura se modifica y daca x1,2 se modifica cu o unitate de masura
25
2.2 -Reprezentarea grafică a modelului legăturii dintre variabile
0
500
1,000
1,500
2,000
2,500
.02 .04 .06 .08 .10 .12
RATASOMAJ
RA
TA
INF
RA
CT
ION
ALI
TA
TII
100
150
200
250
300
.02 .04 .06 .08 .10 .12
RATASOMAJ
RA
TA
CR
IMIN
ALI
TA
TII
2. Estimarea parametrilor modelului și interpretarea acestora 3.1- Estimare punctuală a parametrilor
Dependent Variable: RATACRIMINALITATIIMethod: Least SquaresDate: 05/02/14 Time: 20:31Sample: 1 42Included observations: 42RATACRIMINALITATII=C(5)+C(6)*RATASOMAJ+C(7)*RATAINFRACTIONALI TATII
Coefficient Std. Error t-Statistic Prob.
C(5) 102.0218 33.71642 3.025878 0.0044
26
C(6) 399.1964 366.8711 1.088111 0.2832C(7) 0.049113 0.021293 2.306489 0.0265
R-squared 0.194068 Mean dependent var 200.3810Adjusted R-squared 0.152738 S.D. dependent var 50.79512S.E. of regression 46.75529 Akaike info criterion 10.59648Sum squared resid 85256.21 Schwarz criterion 10.72060Log likelihood -219.5261 Hannan-Quinn criter. 10.64198F-statistic 4.695599 Durbin-Watson stat 2.248401Prob(F-statistic) 0.014887
Metoda celor mai mici patrate permite calculul estimatorilor α , β1 , β2 prin minimizarea
functiei:
W =∑ ( yi−α− β1 x1 i− β2 x2 i)2
Din sistemul de mai jos se vor extrage α , β1 , β2:
{ n α + β1∑ x1 i+ β2∑ x2 i=∑ y i
α∑ x1 i+ β1∑ x1 i2+ β2∑ x2 i∗x1 i=∑ yi∗x1i
α∑ x2 i+ β1∑ x1 i∗x2i+ β2∑ x2i2=∑ y i∗x2i
3.2- Estimarea parametrilor prin interval de încredereIntervalul de incredere al celor doi parametri – alpha si beta -1 si 2 – se estimeaza
cu ajutorul erorii standard aferenta lor (Standard Error din Excel, tabelul cu parametri - ES) si a testului statistic (t-stat din acelasi tabel), astfel:
α−t tab∗ES ( α )≤ α ≤ α+ ttab∗ES (α )
β1−t tab∗ES ( β1 )≤ β1≤ β1+ ttab∗ES ( β1)
β2−t tab∗ES ( β2 )≤ β2 ≤ β2+ttab∗ES ( β2)
Pentru a calcula acest interval de incredere, trebuie sa calculam urmatoarele: ES ( α ) , ES ( β1 ) , ES( β2) si t tab – este preluat din tabelul distributiei t-Student pentru interval (two-tailed, pentru interval de incredere de 95%, grade de libertate 41 – adica numarul de observatii minus 1) = 2.021
Astfel, putem afirma, cu un grad de incredere de 95%, ca intervalele in care se afla parametrii modelului de regresie liniara sunt:
coeficient ES t-stat Lower 95% Upper 95% Beta1 399.20 366.87 1.09 -342.87 1,141.26 Beta2 0.05 0.02 2.31 0.01 0.09 alpha 102.02 33.72 3.03 33.82 170.22
4. Testarea semnificației corelației și a parametrilor modelului de regresie4.1- Testarea semnificației corelațieiMasurarea intensitatii legaturii se face prin raportul de corelatie:
27
R=√R2=√1− ∑ ei2
∑ ¿¿¿¿
(Unde R2- R-Squared din ecuatia Excel). Aceasta valoare arata ca exista o legatura slaba si directa deoarece valoarea indicatorilor relativi utilizati pentru masurarea intensitatii legaturii este in intervalul 0-0.5.
Coeficientul de determinatie
R2=1− ∑ ei2
∑ ¿¿¿Arata ca 19% din variatia totala a variabilei rata criminalitatii este explicata de
variatia ratei somajului si a ratei infractionalitatii.
Teoria raportului de corelatie:Ipoteza nula H0: R=0 ( R nu este seminificativ satistic)Ipoteza alternative H1: R != 0 ( R este semnificativ statistic)Pentru testarea semnificatiei se utilizeaza testul Fisher:
F calc=n−m−1
mR2
1−R2 =4.6955
Unde :m- numarul de variabile exogene (1)
F tabelar=F0.05 ;1 ;42−1=4.08De unde rezulta ca Fisher calculat> Fisher tabular, deci se accepta ipoteza H 1.
Raportul de corelatie este semnificativ diferit de 0, semnificativ statistica.
4.2- Testarea parametrilor unui model de regresie multiplaTestarea parametrilor unui model de regresie simplu se face cu ajutorul valorii
nivelului de semnificatie – P-value din Excel pentru fiecare parametru – sau cu ajutorul t calculat dupa cum urmeaza:
Testarea semnificatiilor parametrilor pentru α t α=3.03 t α
2, n−2
=t0.05,41=2.021
H0: daca α=0 - nu este semnificativ statisticH1: daca α !=0 – este semnificativ statistic, semnificativ diferit de 03.03>2.021 se respinge H0, se accepta H1 (α este semnificativ din punct de vedere
statistic) pentru α .Testarea semnificatiilor parametrilor pentru β1
t β 1
=1.09 t α2
,n−2= t0.05,41=2.021
H0: daca β=0 - nu este semnificativ statisticH1: daca β !=0 – este semnificativ statistic, semnificativ diferit de 01.09<2.021 se accepta H0, se respinge H1 (β1 este semnificativ din punct de vedere
statistic) pentruβ1 .
Testarea semnificatiilor parametrilor pentru β2
t β 2
=2.31 t α2
,n−2=t 0.05,41=2.021
28
H0: daca β=0 - nu este semnificativ statisticH1: daca β !=0 – este semnificativ statistic, semnificativ diferit de 03.03>2.021 se respinge H0, se accepta H1 (β2 este semnificativ din punct de vedere
statistic) pentru β2.
Testele Akaike si Schwarz sunt folosite pentru compararea a 2 sau mai multe modele. Cel mai bun model este acela care are valorile cele mai mici pentru aceste doua teste.
Sc=−2 L
n+ K∗ln n
n=10.72060
Aic=−2L
n+2 K
n=10.59648
29
3. Aplicarea analizei de tip ANOVA pentru validitatea modelului de regresie multiplă și interpretarea rezultatelor
SUMMARY OUTPUT
Regression StatisticsMultiple R 0.440532R Square 0.194068Adjusted R Square 0.152738Standard Error 46.75529Observations 42
ANOVA
df SS MS FSignificanc
e FRegression 2 20529.69 10264.85 4.695599 0.014887Residual 39 85256.21 2186.057Total 41 105785.9
CoefficientsStandard Error t Stat P-value Lower 95% Upper 95%
Lower 95.0%
Upper 95.0%
Intercept 102.0218 33.71642 3.025878 0.004374 33.82388 170.2197 33.82388 170.2197Rata somaj 2010 (x1) 399.1964 366.8711 1.088111 0.283225 -342.87 1141.263 -342.87 1141.263Rata infractionalitatii 2010 (x2) 0.049113 0.021293 2.306489 0.026484 0.006043 0.092183 0.006043 0.092183
30
RESIDUAL OUTPUT PROBABILITY OUTPUT
Observation
Predicted Rata
criminalităţii 2010 (Y)
Residuals
Standard Residual
s Percentile
Rata criminalităţi
i 2010 (Y)1 244.7844 30.21557 0.662613 1.190476 1032 186.8236 35.17642 0.771402 3.571429 1183 193.9977 -41.9977 -0.92099 5.952381 1214 193.7648 40.23524 0.882339 8.333333 1225 188.9304 19.06963 0.418188 10.71429 1326 193.9714 -22.9714 -0.50375 13.09524 1347 181.2511 37.74895 0.827816 15.47619 1378 197.4558 46.54424 1.020692 17.85714 1419 196.1827 9.817324 0.215289 20.2381 152
10 195.947 -77.947 -1.70934 22.61905 15811 220.7417 -4.7417 -0.10398 25 15912 214.0749 -80.0749 -1.756 27.38095 16013 205.0257 -13.0257 -0.28565 29.7619 16314 184.553 15.447 0.338745 32.14286 17115 198.4707 -22.4707 -0.49277 34.52381 17616 204.8102 -67.8102 -1.48704 36.90476 18617 217.7105 -54.7105 -1.19977 39.28571 19218 191.9147 93.08532 2.041315 41.66667 200
31
19 222.5828 -90.5828 -1.98644 44.04762 20220 236.4415 13.55852 0.297332 46.42857 20621 219.6612 -7.66121 -0.16801 48.80952 20622 253.0393 35.96069 0.7886 51.19048 20823 211.2338 -25.2338 -0.55337 53.57143 21224 183.4007 22.59934 0.495592 55.95238 21625 112.8001 -9.80007 -0.21491 58.33333 21626 193.406 54.59404 1.19722 60.71429 21827 222.8623 54.13772 1.187214 63.09524 21928 175.3942 -15.3942 -0.33759 65.47619 22229 218.0884 4.911626 0.10771 67.85714 22330 187.914 28.086 0.615912 70.2381 22931 210.4884 -8.48841 -0.18615 72.61905 23432 192.5873 -70.5873 -1.54794 75 23933 199.4996 29.50036 0.646928 77.38095 24034 198.4218 40.5782 0.88986 79.7619 24435 192.0673 25.93268 0.568691 82.14286 24836 183.3213 -24.3213 -0.53335 84.52381 24937 196.3172 -38.3172 -0.84028 86.90476 25038 172.4373 -31.4373 -0.6894 89.28571 27539 214.8041 25.19592 0.552534 91.66667 27740 205.3001 -84.3001 -1.84866 94.04762 28441 212.09 71.90995 1.57695 96.42857 28542 191.4313 57.56872 1.262454 98.80952 289
32
0.00%2.00%
4.00%6.00%
8.00%
10.00%
12.00%
14.00%-100
0
100
Rata somaj 2010 (x1) Re-sidual Plot
Rata somaj 2010 (x1)
Resid
uals
- 500 1,000 1,500 2,000 2,500 3,000 -100
-500
50100150
Rata infractionalitatii 2010 (x2) Residual Plot
Rata infractionalitatii 2010 (x2)
Resid
uals
0.00% 5.00% 10.00% 15.00%0
50100150200250300350
Rata somaj 2010 (x1) Line Fit Plot
Rata criminalităţii 2010 (Y)Predicted Rata crim-inalităţii 2010 (Y)
Rata somaj 2010 (x1)
Rata
crim
inal
ităţii
201
0 (Y
)
- 1,000 2,000 3,000 0
50100150200250300350
Rata infractionalitatii 2010 (x2) Line Fit Plot
Rata criminalităţii 2010 (Y)Predicted Rata crim-inalităţii 2010 (Y)
Rata infractionalitatii 2010 (x2)
Rata
crim
inal
ităţii
201
0 (Y
)
33
0 20 40 60 80 100 1200
50100150200250300350
Normal Probability Plot
Sample Percentile
Rata
crim
inal
ităţii
201
0 (Y
)
34
4. Testarea ipotezelor clasice asupra modelului de regresie multiplăHeteroskedasticity Test: White
F-statistic 1.778369 Prob. F(5,36) 0.1422Obs*R-squared 8.319050 Prob. Chi-Square(5) 0.1395Scaled explained SS 4.858863 Prob. Chi-Square(5) 0.4333
Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 05/04/14 Time: 06:49Sample: 1 42Included observations: 42
Variable Coefficient Std. Error t-Statistic Prob.
C -3068.666 4061.802 -0.755494 0.4549RATASOMAJ 98548.58 124700.3 0.790284 0.4345
RATASOMAJ^2 212947.5 655707.2 0.324760 0.7472RATASOMAJ*RATAINFRACTIONALITAT
II -64.26460 66.89205 -0.960721 0.3431RATAINFRACTIONALITATII 0.682481 3.399694 0.200748 0.8420
RATAINFRACTIONALITATII^2 0.001068 0.002219 0.481276 0.6332
R-squared 0.198073 Mean dependent var 2029.910Adjusted R-squared 0.086694 S.D. dependent var 2391.331S.E. of regression 2285.324 Akaike info criterion 18.43797Sum squared resid 1.88E+08 Schwarz criterion 18.68621Log likelihood -381.1973 Hannan-Quinn criter. 18.52896F-statistic 1.778369 Durbin-Watson stat 1.941922Prob(F-statistic) 0.142152
0
1
2
3
4
5
6
-100 -80 -60 -40 -20 0 20 40 60 80 100
Series: ResidualsSample 1 42Observations 42
Mean -4.06e-15Median 7.364475Maximum 93.08532Minimum -90.58284Std. Dev. 45.60066Skewness -0.306715Kurtosis 2.354754
Jarque-Bera 1.387117Probability 0.499794
35
6.1 Ipoteze statistice clasice asupra modelului de regresie multiplăTestarea raportului de corelatie – vezi 4.1
Testarea parametrilor unui model de regresie simplu – vezi 4.2
Teste de detectarea heteroscedasticitatii si de corectare a acesteia – precum Goldfield-Quandt (pentru serii lungi de date si in care una dintre variabile reprezinta cauza heteroscedasticitatii).
6.2 Testarea liniarității modelului propusLiniaritatea poate sa fie testata intr-un mod evident prin graficul care compara
valorile observate ale ratei criminalitatii versus valorile obtinute prin functia de regresie. In ambele modele, valorile sunt distribuite simetric in jurul liniei de regresie.
6.3 Testarea normalității erorilorTestul Jarque-Bera ( verificarea ipotezei de normalitate a erorilor)
JB=n [ S2
6+
( k−3 )2
2 n ] χα ,r2
H0: erorile nu sunt distribuite normalH1: erorile sunt distribuite normalTestul Jarque-Bera se bazeaza pe ipoteza ca distributia normala are un coefficient
de asimetrie ( S=0) si un coeficient de aplatizare ( k=3)Daca p(JB) – valoarea probabilitatii lui Jarque-Bera- este suficient de scazuta,
rezulta ca ipoteza de normalitate a erorilor este respinsa (JB > χα , r2 ; 1.387>5.9915 rezulta
ca se respinge H0).
6.4- Testarea ipotezei de homoscedasticitateTestul WhitePresupune construirea unei regresii auxiliare bazate pe presupunerea unei relatii
de dependent intre patratul valorii erorilor, variabila exogena inclusa in modelul initial ( consumul ) si patratul valorilor acestuia.
ε i2=α 0+α1 xi+α2 xi
2+wi
H0: α¿α 1=α 0=0 ( nici un α nu e semnificativ statistic- homoscedast – media erorilor e 0, iar dispersia este 1)H1: ∃∀α i≠0 ( exista cel putin un αi care este semnificativ statistic) 6.5 Testarea ipotezei de autocorelare a erorilor
Testul Durbin-Watson
∆ W =∑i=2
n
( εi− εi−1)2
∑ εi2 =1.94
Cu n=41,α=0.05,p=2 de unde rezulta ca d1=1.44,d2= 1.54. Astfel, ne aflam in cazul 5(d2≤∆W≤4- d2), se accepta H0 – erorile sunt necorelate.
36
7. Previziunea valorii variabilei Y dacă variabila X crește cu 10% față de ultima valoare înregistrată (inclusiv interval de încredere) pentru toate variantele cunoscute.
Daca variabila creste cu 10% fata de ultima valoare inregistrata, adica fata de 7.4%, si 1,219, adica 0.74% si121.9 atunci:
Y=102.2+399.2*X1+ 0.05*X2 se transforma in : Y=192.69+399.2*X1+ 0.05*X2
Rezolvarea problemei B de exemplificat atât în Excel cât și în Eviews.
Problema CFolosind datele Problemei A, să se testeze dacă dispersiile (variaţiile) celor două populaţii (variabila exogenă și variabila endogenă) sunt egale; testați dacă mediile celor două populaţii sunt egale. Rezolvarea problemei C de exemplificat în Excel, cu interpretarea rezultatelor și parcurgerea etapelor testării ipotezelor statistice.
- Dispersiile celor doua populatii sunt egale
- Daca mediile celor doua populatii sunt egale
37