Download - Proiect seminar Econometrie

PROIECT ECONOMETRIE AN III ZI, MANAGEMENT

Problema AÎnregistrați pentru 42 de unități (județe), valorile specifice ale unei

perechi de caracteristici (X și Y) între care există o legătură logică. Datele prezentate sub forma tabelară fac parte din lucrare.

Y – rata criminalitatii

X1 – rata somajului

X2 – rata infractionalitatii

1. Prezentarea problemei (inclusiv descrierea naturii legăturii dintre cele două variabile, conform teoriei economice);

Cercetarea de fata are ca obiectiv punerea in evidenta a legaturii dintre rata somajului, respective rata infractionalitatii si rata criminalitatii. Rata somajului se calculează ca raport procentual între masa şomajului (numărul mediu al şomerilor) şi unul din parametrii de referinţă ai acestuia. Astfel de parametrii sunt: populaţia activă, populaţia active disponibilă, populaţia ocupată etc. Ocuparea deplină a forţei de muncă nu înseamnă o rată de ocupare de 100%, deoarece există întotdeauna persoane neocupate dar care se află în perioada necesară schimbării locului de muncă. Ponderea acestora este exprimată de rata naturală a şomajului. Rata infractionalitatii reprezintă numărul infracţiunilor cercetate de poliţie raportat la 100000 de locuitori.Rata criminalitatii reprezintă numărul persoanelor condamnate definitiv raportat la 100000 de locuitori.Care este legatura intre somaj, respective infractionalitate si criminalitate? Cat din variatia criminalitatii este explicate de somaj, respectiv de infractionalitate?

2. Definirea modelului de regresie simplă liniară2.1- Forma, variabilele și parametrii modelului de regresieNotand cu y (variabila dependenta) rata criminalitatii si cu x (variabila

independenta) rata somajului, respective rata infractionalitatii cu α,β – parametrii modelului, cu β>0, atunci ecuatia de regresie pentru populatia statistica generala poate fi descrisa prin modelul probabilistic linear:

y=α+βx(relatie determinista/exacta)

Intrucat in realitate dependeta dintre rata criminalitatii si rata somajului, respecti rata infractionalitatii este una stochastica, iar in determinarea ratei criminalitatii nu s-a

1

luat in calcul decat un singur factor, desi dependentele sunt mai numeroase, modelul econometric al ratei criminalitatii va fi dat de :

y i=α+β x i+e i

Unde α ,β- parametric de regresie si :α- punct de intersectie al dreptei de regresie cu axa Oyβ- panta dreptei, coefficient de regresie care arata cu cate unitati de masura se modifica y daca x se modifica cu o unitate de masurae i- component reziduala (abaterea) – este partea din valoarea lui y care nu poate fi determinate cunoscand valoarea individuala (x i)

y i= y i+εi

Unde :ε i- component predictibila (determinista) adica specifica modelului matematic.

Partea din valoarea lui y care poate fi determinate cunoscand valoarea lui xi :y i=α+β x i

Pentru esantion modelul de regresie liniara este :y i= α+ β x i+e i

cu componenta predictibila:y i= α+ β x i

Unde:α , β- estimatorii punctului de intersectie (α) si ai pantei liniei de regresie (β)

obtinuta pe esantione i- estimatorul componentei reziduale ε i

Variabilele au urmatoarele valori in anul 2010:

Rata somaj 2010 (x1)

Rata infractionalitatii 2010 (x2)

Rata criminalităţii 2010 (Y)

Alba 10.00% 2,094 275Arad 5.20% 1,304 222Argeş 7.60% 1,255 152Bacău 7.80% 1,234 234Bihor 5.90% 1,290 208Bistriţa-Năsăud 6.40% 1,352 171Botoşani 6.40% 1,093 219Brăila 8.70% 1,236 244Braşov 7.20% 1,332 206Buzău 9.70% 1,124 118Călăraşi 8.80% 1,702 216Caraş-Severin 9.00% 1,550 134Cluj 4.90% 1,699 192Constanţa 5.80% 1,209 200Covasna 10.00% 1,151 176Dâmboviţa 8.50% 1,402 137Dolj 9.80% 1,559 163

2




Galaţi 10.40% 985 285Giurgiu 8.40% 1,772 132Gorj 10.10% 1,916 250Harghita 8.80% 1,680 212Hunedoara 8.50% 2,384 289Ialomiţa 9.90% 1,419 186Iaşi 7.00% 1,088 206Ilfov 2.70% - 103Maramureş 6.00% 1,373 248Mehedinţi 10.50% 1,607 277Municipiul Bucureşti 2.30% 1,307 160Mureş 8.00% 1,713 223Neamţ 7.70% 1,123 216Olt 8.20% 1,542 202Prahova 8.60% 1,145 122Sălaj 8.40% 1,302 229Satu Mare 6.10% 1,467 239Sibiu 5.80% 1,362 218Suceava 7.30% 1,062 159Teleorman 10.90% 1,034 158Timiş 3.70% 1,133 141Tulcea 8.10% 1,638 240Vâlcea 7.70% 1,477 121Vaslui 11.80% 1,282 284Vrancea 7.40% 1,219 249

Sursa: Repere economice şi sociale regionale: Statistică teritorială (INS)

2.2- Reprezentarea grafică a modelului legăturii dintre variabilePrimul model:

3

0% 2% 4% 6% 8% 10% 12% 14%50

100

150

200

250

300

350

f(x) = 693.906152585776 x + 146.520617680247

Legatura intre rata criminalitatii si rata somajului la 2010

Rata criminalităţii 2010 (Y) Linear (Rata criminalităţii 2010 (Y))Rata somajului

Rata

crim

inal

itatii

100

125

150

175

200

225

250

275

300

.02 .04 .06 .08 .10 .12

RATASOMAJ

RA

TA

CR

IMIN

ALI

TA

TII

Al doilea model

4

0 500 1,000 1,500 2,000 2,500 3,00050

100

150

200

250

300

350

f(x) = 0.057182748070708 x + 121.937113979955

Legatura intre rata criminalitatii si rata infrac-tionalitatii la 2010

Rata criminalităţii 2010 (Y) Linear (Rata criminalităţii 2010 (Y))Rata infractionalitatii

Rata

crim

inal

itatii

100

125

150

175

200

225

250

275

300

0 500 1,000 1,500 2,000 2,500

RATAINFRACTIONALITATII

RA

TA

CR

IMIN

AL

ITA

TII

3. Estimarea parametrilor modelului și interpretarea acestora3.1- Estimarea punctuală a parametrilor

Pentru primul model

Dependent Variable: RATACRIMINALITATIIMethod: Least SquaresDate: 05/02/14 Time: 20:17Sample: 1 42Included observations: 42RATACRIMINALITATII=C(1)+C(2)*RATASOMAJ

Coefficient Std. Error t-Statistic Prob.

5

C(1) 146.5206 29.10590 5.034052 0.0000C(2) 693.9062 361.9955 1.916892 0.0624

R-squared 0.084133 Mean dependent var 200.3810Adjusted R-squared 0.061237 S.D. dependent var 50.79512S.E. of regression 49.21529 Akaike info criterion 10.67673Sum squared resid 96885.80 Schwarz criterion 10.75948Log likelihood -222.2114 Hannan-Quinn criter. 10.70706F-statistic 3.674473 Durbin-Watson stat 2.197276Prob(F-statistic) 0.062415

Pentru al doilea model

Dependent Variable: RATACRIMINALITATIIMethod: Least SquaresDate: 05/02/14 Time: 20:30Sample: 1 42Included observations: 42RATACRIMINALITATII=C(3)+C(4)*RATAINFRACTIONALITATII


C(3) 121.9371 28.38127 4.296394 0.0001C(4) 0.057183 0.020006 2.858257 0.0067


Pentru estimarea parametrilor modelului linear de regresie se utilizeaza metoda minimizarii sumei patratelor deviatiilor (abaterilor reziduale ei ). Cu cat este mai mica ei, cu atat este mai aproape y i (valoarea determinista ) de valoarea observata yi.

S (α , β )=min∑i

e i2=min∑

i

( yi−α− β x i)2

Din care rezulta sistemul:

{ n α + β∑ x i=∑ yi

α∑ x i+ β∑ x i2=∑ x i y i

Coeficientul alpha si beta se poate deduce ecuatia

β=∑ ( x i−x )∗( y i− y )

∑ ( x i−x )2

α= y− β∗xEcuatia :Pentru primul model

y i= α+ β x i=¿693,91x+146.52

6

Pentru al doilea modely i= α+ β x i=0,0572x+121,94

(vezi sheet Info centralizate A -2)

3.2- Estimarea parametrilor prin interval de încredereIntervalul de incredere al celor doi parametri – alpha si beta – se

estimeaza cu ajutorul erorii standard aferenta lor (Standard Error din Excel, tabelul cu parametri - ES) si a testului statistic (t-stat din acelasi tabel), astfel:

α−t tab∗ES ( α )≤ α ≤ α+ ttab∗ES (α )

β−t tab∗ES ( β ) ≤ β ≤ β+t tab∗ES( β )

Pentru a calcula acest interval de incredere, trebuie sa calculam urmatoarele:

ES ( α )=√σ2[ 1n+ x2

∑ ( x i−x )2], unde: σ=√ 1

n−m−1∗∑ ( y i− y )

2

n- no Observatii (42)

m- numar de variabile endogene (regresie simpla – 1 variabila => m=1, regresie multipla cu 2 variabile – m=2)

ES ( β )=√ σ2

∑ ( x i−x )2

t tab – este preluat din tabelul distributiei t-Student pentru interval (two-tailed, pentru interval de incredere de 95%, grade de libertate 41 – adica numarul de observatii minus 1) = 2.021

Astfel, putem afirma, cu un grad de incredere de 95%, ca intervalele in care se afla parametrii modelului de regresie liniara sunt:

- Pentru primul model:coeficient ES t-stat Lower 95% Upper 95%

beta 693.91

361.9955

1.92

-37.71 1,425.53

alpha 146.52

29.11

5.03

87.70 205.35

Beta apartine intervalului -37.71, 1,425.53 ;Alpha apartine intervalului 87.70 , 205.35.

- Pentru al doilea model:coeficient ES t-stat Lower 95% Upper 95%

beta 0.06

0.0200

2.86 0.02

0.10

alpha 121.94

28.38

4.30 64.58

179.30

7

(vezi sheet Info centralizate A -2)

4. Testarea semnificației corelației și a parametrilor modelului de regresie4.1- Testarea semnificației corelațieiPrimul model:Masurarea intensitatii legaturii se face prin raportul de corelatie:

R=√R2=√∑ ( y i− y )2

∑ ¿¿¿¿

(Unde R2- R-Squared din ecuatia Excel). Aceasta valoare arata ca exista o legatura slaba si directa deoarece valoarea indicatorilor relativi utilizati pentru masurarea intensitatii legaturii este in intervalul 0-0.5.

Coeficientul de determinatie

R2=∑ ( y i− y )2

∑ ¿¿¿Arata ca 8% din variatia totala a variabilei rata criminalitatii este explicata de

variatia ratei somajului.

Teoria raportului de corelatie:Ipoteza nula H0: R=0 ( R nu este seminificativ satistic)Ipoteza alternative H1: R != 0 ( R este semnificativ statistic)Pentru testarea semnificatiei se utilizeaza testul Fisher:

F calc=n−m−1

mR2

1−R2 =8.17

Unde :m- numarul de variabile exogene (1)

F tabelar=F0.05 ;1 ;42−1=4.08De unde rezulta ca Fisher calculat> Fisher tabular, deci se accepta ipoteza H 1.

Raportul de corelatie este semnificativ diferit de 0, semnificativ statistica.

Al doilea model:Masurarea intensitatii legaturii se face prin raportul de corelatie:

R=√R2=√∑ ( y i− y )2

∑ ¿¿¿¿

(Unde R2- R-Squared din ecuatia Excel). Aceasta valoare arata ca exista o legatura slaba si directa deoarece valoarea indicatorilor relative utilizati pentru masurarea intensitatii legaturii este in intervalul 0-0.5.


R2=∑ ( y i− y )2

∑ ¿¿¿Arata ca 17% din variatia totala a variabilei rata criminalitatii este explicate de

variatia ratei infractionalitatii.Teoria raportului de corelatie:

8

Ipoteza nula H0: R=0 ( R nu este seminificativ satistic)Ipoteza alternative H1: R != 0 ( R este semnificativ statistic)Pentru testarea semnificatiei se utilizeaza testul Fisher:

F calc=n−m−1

mR2

1−R2 =3.674




4.2- Testarea parametrilor unui model de regresie simpluTestarea parametrilor unui model de regresie simplu se face cu ajutorul valorii

nivelului de semnificatie – P-value din Excel pentru fiecare parametru – sau cu ajutorul t calculat dupa cum urmeaza:

Testarea semnificatiilor parametrilor pentru α Pentru primul model:

t α=α

ES (α , )=5.034 t α

2,n−2

=t 0.05,41=2.021

H0: daca α=0 - nu este semnificativ statisticH1: daca α !=0 – este semnificativ statistic, semnificativ diferit de 05.034>2.021 se respinge H0, se accepta H1 (α este semnificativ din punct de

vedere statistic) pentru α .Testarea semnificatiilor parametrilor pentru β

t β=β

ES ( β)=1.92 t α

2, n−2

=t 0.05,41=2.021

H0: daca β=0 - nu este semnificativ statisticH1: daca β !=0 – este semnificativ statistic, semnificativ diferit de 01.92<2.021 se accepta H0, se respinge H1 (β este semnificativ din punct de vedere

statistic) pentru β.Testele Akaike si Schwarz sunt folosite pentru compararea a 2 sau mai multe

modele. Cel mai bun model este acela care are valorile cele mai mici pentru aceste doua teste.

Sc=−2 L

n+ K∗ln n

n=10.75948

Aic=−2L

n+2 K

n=10.67673

Pentru al doilea model:

9

t α=α

ES (α , )=4.30 t α

2,n−2

= t0.05,41=2.021

H0: daca α=0 - nu este semnificativ statisticH1: daca α !=0 – este semnificativ statistic, semnificativ diferit de 04.30>2.021 se respinge H0, se accepta H1 (α este semnificativ din punct de vedere

statistic) pentru α .Testarea semnificatiilor parametrilor pentru β

t β=β

ES ( β)=2.85 t α

2,n−2

=t 0.05,41=2.021

H0: daca β=0 - nu este semnificativ statisticH1: daca β !=0 – este semnificativ statistic, semnificativ diferit de 02.85>2.021 se respinge H0, se accepta H1 (β este semnificativ din punct de vedere

statistic) pentru β.Testele Akaike si Schwarz sunt folosite pentru compararea a 2 sau mai multe

modele. Cel mai bun model este acela care are valorile cele mai mici pentru aceste doua teste.

Sc=−2 L

n+ K∗ln n

n=10.57877

Aic=−2 L

n+2 K

n=10.66151

5. Aplicarea analizei de tip ANOVA pentru validitatea modelului de regresie simplu și interpretarea rezultatelor

10

Primul model

SUMMARY OUTPUT

Regression StatisticsMultiple R 0.290057R Square 0.084133Adjusted R Square 0.061237Standard Error 49.21529Observations 42

ANOVA

df SS MS FSignifican

ce F

Regression 18900.10

68900.10

63.67447

30.062414

63

Residual 40 96885.82422.14

5

Total 41105785.

9

Coefficient

sStandard Error t Stat P-value

Lower 95% Upper 95%

Lower 95.0%

Upper 95.0%

Intercept 146.5206 29.10595.03405

2 0.0000

87.6953943

205.345841

87.69539

205.3458


693.9062 361.9955

1.916892

0.0624

-37.71409

1425.5264 -37.7141

1425.526

11

882.021075

39

RESIDUAL OUTPUT PROBABILITY OUTPUT

Observation

Predicted Rata

criminalităţii 2010 (Y)

Residuals

Standard

Residuals Percentile


1 215.911259.0887

71.21553

31.190476

19 103

2 182.603739.3962

60.81043

33.571428

57 118

3 199.2575-

47.2575-

0.972155.952380

95 121

4 200.6453 33.3547 0.686158.333333

33 122

5 187.461120.5389

20.42251

210.71428

57 132

6 190.9306-

19.9306 -0.4113.09523

81 134

7 190.930628.0693

90.57742

415.47619

05 137

8 206.890537.1095

50.76339

217.85714

29 141

9 196.48199.51813

90.19580

120.23809

52 15210 213.8295 - - 22.61904 158

12

95.8295 1.97134 76

11 207.58448.41564

10.17312

1 25 159

12 208.9722-

74.9722-

1.5422827.38095

24 160

13 180.52211.4779

80.23611

729.76190

48 163

14 186.767213.2328

30.27221

732.14285

71 171

15 215.9112-

39.9112-

0.8210334.52380

95 176

16 205.5026-

68.5026-

1.4091936.90476

19 186

17 214.5234-

51.5234 -1.059939.28571

43 192

18 218.686966.3131

41.36414

841.66666

67 200

19 204.8087-

72.8087-

1.4977744.04761

9 202

20 216.605133.3948

60.68697

646.42857

14 206

21 207.58444.41564

10.09083

648.80952

38 206

22 205.502683.4973

6 1.7176551.19047

62 208

23 215.2173-

29.2173-

0.6010453.57142

86 212

24 195.09410.9059

5 0.2243555.95238

1 216

25 165.2561-

62.2561-

1.2806958.33333

33 21626 188.155 59.8450 1.23109 60.71428 218

13

1 57

27 219.380857.6192

41.18530

363.09523

81 219

28 162.4805-

2.48046-

0.0510365.47619

05 222

29 202.033120.9668

90.43131

667.85714

29 223

30 199.951416.0486

10.33014

170.23809

52 229

31 203.4209-

1.42092-

0.0292372.61904

76 234

32 206.1965-

84.1965-

1.73203 75 239

33 204.808724.1912

70.49764

677.38095

24 240

34 188.848950.1511

11.03167

479.76190

48 244

35 186.767231.2328

3 0.642582.14285

71 248

36 197.1758-

38.1758-

0.7853384.52380

95 249

37 222.1564-

64.1564-

1.3197886.90476

19 250

38 172.1951-

31.1951-

0.6417289.28571

43 275

39 202.72737.2729

80.76675

491.66666

67 277

40 199.9514-

78.9514-

1.6241394.04761

9 284

41 228.401555.5984

61.14373

396.42857

14 28542 197.8697 51.1303 1.05181 98.80952 289

14

3 8 38

0.00%2.00%

4.00%6.00%

8.00%

10.00%

12.00%

14.00%

-150-100

-500

50100

Rata somaj 2010 (x1) Re-sidual Plot


Resid

uals

0.00% 5.00% 10.00% 15.00%0

100200300400

Rata somaj 2010 (x1) Line Fit Plot

Rata criminalităţii 2010 (Y)Predicted Rata crim-inalităţii 2010 (Y)


Rata

crim

inal

ităţii

201

0 (Y

)

0 20 40 60 80 100 1200

100200300400

Normal Probability Plot

Sample PercentileRata

crim

inal

ităţii

201

0 (Y

)

15

Al doilea model

SUMMARY OUTPUT

Regression StatisticsMultiple R 0.411827

R Square 0.1696010.4118

27Adjusted R Square 0.148841Standard Error 46.86269Observations 42

ANOVA

df SS MS FSignifica

nce F

Regression 117941.

4317941.

438.1696

360.00673

2

Residual 4087844.

472196.1

12

Total 4110578

5.9

Coefficients

Standard

t Stat P-value

Lower 95%

Upper 95%

Lower 95.0%

Upper 95.0%

16

Error

Intercept 121.937128.381

274.2963

940.0001

0864.5764

3 179.297864.576

43179.29

78Rata infractionalitatii 2010 (x2) 0.057183

0.020006

2.858257

0.006732

0.016749 0.097617

0.016749

0.097617


Observation

Predicted Rata

criminalităţii 2010

(Y)Residu

als

Standard

Residuals

Percentile

Rata criminalităţii 2010

(Y)

1 241.677833.322

210.7198

941.19047

6 103

2 196.503425.496

580.5508

293.57142

9 118

3 193.7015

-41.701

5

-0.9009

25.95238

1 121

4 192.500641.499

370.8965

548.33333

3 122

5 195.702912.297

140.2656

6810.7142

9 132

6 199.2482

-28.248

2

-0.6102

713.0952

4 1347 184.4379 34.562 0.7466 15.4761 137

17

14 81 9

8 192.61551.385

011.1101

2317.8571

4 141

9 198.10457.8954

660.1705

74 20.2381 152

10 186.2105

-68.210

5

-1.4736

222.6190

5 158

11 219.2622

-3.2621

5

-0.0704

8 25 159

12 210.5704

-76.570

4

-1.6542

327.3809

5 160

13 219.0906

-27.090

6

-0.5852

7 29.7619 163

14 191.07118.9289

440.1929

0132.1428

6 171

15 187.7545

-11.754

5

-0.2539

434.5238

1 176

16 202.1073

-65.107

3

-1.4065

836.9047

6 186

17 211.085-

48.085

-1.0388

339.2857

1 192

18 178.2621106.73

792.3059

6841.6666

7 20019 223.2649 -

91.264-

1.971644.0476

2202

18

9 9

20 231.499318.500

740.3996

9146.4285

7 206

21 218.0041

-6.0041

3

-0.1297

148.8095

2 206

22 258.260830.739

210.6640

9151.1904

8 208

23 203.0794

-17.079

4

-0.3689

853.5714

3 212

24 184.151921.848

060.4720

0655.9523

8 216

25 121.9371

-18.937

1

-0.4091

258.3333

3 216

26 200.44947.550

971.0272

9360.7142

9 218

27 213.829863.170

211.3647

3163.0952

4 219

28 196.675-

36.675

-0.7923

365.4761

9 222

29 219.89123.1088

390.0671

6367.8571

4 223

30 186.153329.846

660.6448

08 70.2381 229

31 210.1129

-8.1129

1

-0.1752

772.6190

5 23432 187.4114 -

65.411-

1.413175 239

19

4 5

33 196.389132.610

950.7045

2877.3809

5 240

34 205.824233.175

790.7167

31 79.7619 244

35 199.8218.179

980.3927

6182.1428

6 248

36 182.6652

-23.665

2

-0.5112

684.5238

1 249

37 181.0641

-23.064

1

-0.4982

886.9047

6 250

38 186.7252

-45.725

2

-0.9878

589.2857

1 275

39 215.602524.397

540.5270

8591.6666

7 277

40 206.396-

85.396-

1.844994.0476

2 284

41 195.245488.754

61.9174

5796.4285

7 285

42 191.642957.357

121.2391

4598.8095

2 289

20

- 500 1,000 1,500 2,000 2,500 3,000

-200-100

0100200

Rata infractionalitatii 2010 (x2) Residual Plot


Resid

uals

- 1,000 2,000 3,000 0

100200300400

Rata infractionalitatii 2010 (x2) Line Fit Plot


Predicted Rata criminalităţii 2010 (Y)


Rata

crim

inal

ităţii

201

0 (Y

)

0 20 40 60 80 100 1200

100200300400


Sample PercentileRata

crim

inal

ităţii

201

0 (Y

)

21

6. Testarea ipotezelor clasice asupra modelului de regresie simplăPrimul model:Heteroskedasticity Test: White

F-statistic 2.702686 Prob. F(2,39) 0.0796Obs*R-squared 5.112572 Prob. Chi-Square(2) 0.0776Scaled explained SS 2.282338 Prob. Chi-Square(2) 0.3194

Test Equation:Dependent Variable: RESID^2Method: Least SquaresDate: 05/04/14 Time: 02:26Sample: 1 42Included observations: 42

Variable Coefficient Std. Error t-Statistic Prob.

C 1452.113 2960.431 0.490507 0.6265RATASOMAJ -24250.05 83768.56 -0.289489 0.7737

RATASOMAJ^2 423362.4 576192.8 0.734758 0.4669

R-squared 0.121728 Mean dependent var 2306.805Adjusted R-squared 0.076688 S.D. dependent var 2316.424S.E. of regression 2225.831 Akaike info criterion 18.32240Sum squared resid 1.93E+08 Schwarz criterion 18.44652Log likelihood -381.7704 Hannan-Quinn criter. 18.36789F-statistic 2.702686 Durbin-Watson stat 2.719525Prob(F-statistic) 0.079573

0

1

2

3

4

5

6

7

-100 -80 -60 -40 -20 0 20 40 60 80

Series: ResidualsSample 1 42Observations 42

Mean -2.33e-14Median 11.19197Maximum 83.49736Minimum -95.82951Std. Dev. 48.61140Skewness -0.381841Kurtosis 1.984349

Jarque-Bera 2.825826Probability 0.243433

22

Al doilea model:Heteroskedasticity Test: White




C 909.5870 2561.462 0.355105 0.7244RATAINFRACTIONALITATII 2.438161 3.559027 0.685064 0.4974RATAINFRACTIONALITATII^

2 -0.001075 0.001315 -0.817069 0.4189

R-squared 0.018660 Mean dependent var 2091.535Adjusted R-squared -0.031665 S.D. dependent var 2656.287S.E. of regression 2698.014 Akaike info criterion 18.70717Sum squared resid 2.84E+08 Schwarz criterion 18.83129Log likelihood -389.8505 Hannan-Quinn criter. 18.75266F-statistic 0.370798 Durbin-Watson stat 1.412206Prob(F-statistic) 0.692590

0

2

4

6

8

10

-100 -75 -50 -25 0 25 50 75 100 125


Mean 1.08e-14Median 5.502152Maximum 106.7379Minimum -91.26494Std. Dev. 46.28767Skewness -0.045578Kurtosis 2.574542


6.1- Ipoteze statistice clasice supra modelului de regresie simplăTestarea raportului de corelatie – vezi 4.1

Testarea parametrilor unui model de regresie simplu – vezi 4.2

23

Teste de detectarea heteroscedasticitatii si de corectare a acesteia – precum Goldfield-Quandt (pentru serii lungi de date si in care una dintre variabile reprezinta cauza heteroscedasticitatii).

6.2- Testarea liniarității modelului propusLiniaritatea poate sa fie testata intr-un mod evident prin graficul care compara

valorile observate ale ratei criminalitatii versus valorile obtinute prin functia de regresie. In ambele modele, valorile sunt distribuite simetric in jurul liniei de regresie.

6.3- Testarea normalității erorilorTestul Jarque-Bera ( verificarea ipotezei de normalitate a erorilor)

JB=n [ S2

6+

( k−3 )2

2 n ] χα ,r2

H0: erorile nu sunt distribuite normalH1: erorile sunt distribuite normalTestul Jarque-Bera se bazeaza pe ipoteza ca distributia normala are un coefficient

de asimetrie ( S=0) si un coeficient de aplatizare ( k=3)Daca p(JB) – valoarea probabilitatii lui Jarque-Bera- este suficient de scazuta,

rezulta ca ipoteza de normalitate a erorilor este respinsa (JB > χα , r2 ; 0.282, respectiv

0.331>5.9915 rezulta ca se respinge H0).

6.4- Testarea ipotezei de homoscedasticitateTestul WhitePresupune construirea unei regresii auxiliare bazate pe presupunerea unei relatii

de dependent intre patratul valorii erorilor, variabila exogena inclusa in modelul initial ( consumul ) si patratul valorilor acestuia.

ε i2=α 0+α1 xi+α2 xi

2+wi

H0: α¿α 1=α 0=0 ( nici un α nu e semnificativ statistic- homoscedast – media erorilor e 0, iar dispersia este 1)H1: ∃∀α i≠0 ( exista cel putin un αi care este semnificativ statistic)6.5- Testarea ipotezei de autocorelare a erorilorPrimul model:Testul Durbin-Watson

∆ W =∑i=2

n

( εi− εi−1)2

∑ εi2 =2.71

Cu n=41,α=0.05,p=2 de unde rezulta ca d1=1.44,d2= 1.54. Astfel, ne aflam in cazul 5( 4-d1≤∆W≤4), autocorelandu-se negativ.

Al doilea model:Testul Durbin-Watson

∆ W =∑i=2

n

( εi− εi−1)2

∑ εi2 =1.41

24

Cu n=41,α=0.05,p=2 de unde rezulta ca d1=1.44,d2= 1.54. Astfel, ne aflam in cazul 5(d1≤∆W≤ d1), testul nefiind concludent.

7. Previziunea valorii variabilei Y dacă variabila X crește cu 10% față de ultima valoare înregistrată (inclusiv interval de încredere) pentru toate variantele cunoscute.

Daca variabila creste cu 10% fata de ultima valoare inregistrata, adica fata de 7.4%, respectiv 1,219 in modelul 1, respectiv modelul 2, adica 0.74%, respectiv 121.9 atunci:

Pentru primul modely i= α+ β x i=¿693,91x+146.52 se transforma in: y i= α+ β x i=¿693,91x+197.87

Pentru al doilea model:y i= α+ β x i=0,0572x+121,94 se transforma in: y i= α+ β x i=0,0572x+128.91

Rezolvarea problemei A de exemplificat atât în Excel cât și în Eviews.Problema B

1. Definirea modelului de regresie multiplă liniară

2.1- Forma, variabilele, parametrii modelului de regresie multiplă

Forma: Y=α+β1*X1+ β2*X2

Variabilele: X1 – rata somajului

X2 – rata infractionalitatii

Y – rata criminalitatii

Parametrii:α- punct de intersectie al dreptei de regresie cu axa Oyβ1,2- panta dreptei, coefficient de regresie care arata cu cate unitati de masura se modifica y daca x1,2 se modifica cu o unitate de masura

25

2.2 -Reprezentarea grafică a modelului legăturii dintre variabile

0

500

1,000

1,500

2,000

2,500

.02 .04 .06 .08 .10 .12

RATASOMAJ

RA

TA

INF

RA

CT

ION

ALI

TA

TII

100

150

200

250

300

.02 .04 .06 .08 .10 .12

RATASOMAJ

RA

TA

CR

IMIN

ALI

TA

TII

2. Estimarea parametrilor modelului și interpretarea acestora 3.1- Estimare punctuală a parametrilor

Dependent Variable: RATACRIMINALITATIIMethod: Least SquaresDate: 05/02/14 Time: 20:31Sample: 1 42Included observations: 42RATACRIMINALITATII=C(5)+C(6)*RATASOMAJ+C(7)*RATAINFRACTIONALI TATII


C(5) 102.0218 33.71642 3.025878 0.0044

26

C(6) 399.1964 366.8711 1.088111 0.2832C(7) 0.049113 0.021293 2.306489 0.0265


Metoda celor mai mici patrate permite calculul estimatorilor α , β1 , β2 prin minimizarea

functiei:

W =∑ ( yi−α− β1 x1 i− β2 x2 i)2

Din sistemul de mai jos se vor extrage α , β1 , β2:

{ n α + β1∑ x1 i+ β2∑ x2 i=∑ y i

α∑ x1 i+ β1∑ x1 i2+ β2∑ x2 i∗x1 i=∑ yi∗x1i

α∑ x2 i+ β1∑ x1 i∗x2i+ β2∑ x2i2=∑ y i∗x2i

3.2- Estimarea parametrilor prin interval de încredereIntervalul de incredere al celor doi parametri – alpha si beta -1 si 2 – se estimeaza

cu ajutorul erorii standard aferenta lor (Standard Error din Excel, tabelul cu parametri - ES) si a testului statistic (t-stat din acelasi tabel), astfel:

α−t tab∗ES ( α )≤ α ≤ α+ ttab∗ES (α )

β1−t tab∗ES ( β1 )≤ β1≤ β1+ ttab∗ES ( β1)

β2−t tab∗ES ( β2 )≤ β2 ≤ β2+ttab∗ES ( β2)

Pentru a calcula acest interval de incredere, trebuie sa calculam urmatoarele: ES ( α ) , ES ( β1 ) , ES( β2) si t tab – este preluat din tabelul distributiei t-Student pentru interval (two-tailed, pentru interval de incredere de 95%, grade de libertate 41 – adica numarul de observatii minus 1) = 2.021

Astfel, putem afirma, cu un grad de incredere de 95%, ca intervalele in care se afla parametrii modelului de regresie liniara sunt:

coeficient ES t-stat Lower 95% Upper 95% Beta1 399.20 366.87 1.09 -342.87 1,141.26 Beta2 0.05 0.02 2.31 0.01 0.09 alpha 102.02 33.72 3.03 33.82 170.22

4. Testarea semnificației corelației și a parametrilor modelului de regresie4.1- Testarea semnificației corelațieiMasurarea intensitatii legaturii se face prin raportul de corelatie:

27

R=√R2=√1− ∑ ei2

∑ ¿¿¿¿

(Unde R2- R-Squared din ecuatia Excel). Aceasta valoare arata ca exista o legatura slaba si directa deoarece valoarea indicatorilor relativi utilizati pentru masurarea intensitatii legaturii este in intervalul 0-0.5.


R2=1− ∑ ei2

∑ ¿¿¿Arata ca 19% din variatia totala a variabilei rata criminalitatii este explicata de

variatia ratei somajului si a ratei infractionalitatii.

Teoria raportului de corelatie:Ipoteza nula H0: R=0 ( R nu este seminificativ satistic)Ipoteza alternative H1: R != 0 ( R este semnificativ statistic)Pentru testarea semnificatiei se utilizeaza testul Fisher:

F calc=n−m−1

mR2

1−R2 =4.6955




4.2- Testarea parametrilor unui model de regresie multiplaTestarea parametrilor unui model de regresie simplu se face cu ajutorul valorii

nivelului de semnificatie – P-value din Excel pentru fiecare parametru – sau cu ajutorul t calculat dupa cum urmeaza:

Testarea semnificatiilor parametrilor pentru α t α=3.03 t α

2, n−2

=t0.05,41=2.021

H0: daca α=0 - nu este semnificativ statisticH1: daca α !=0 – este semnificativ statistic, semnificativ diferit de 03.03>2.021 se respinge H0, se accepta H1 (α este semnificativ din punct de vedere

statistic) pentru α .Testarea semnificatiilor parametrilor pentru β1

t β 1

=1.09 t α2

,n−2= t0.05,41=2.021

H0: daca β=0 - nu este semnificativ statisticH1: daca β !=0 – este semnificativ statistic, semnificativ diferit de 01.09<2.021 se accepta H0, se respinge H1 (β1 este semnificativ din punct de vedere

statistic) pentruβ1 .

Testarea semnificatiilor parametrilor pentru β2

t β 2

=2.31 t α2

,n−2=t 0.05,41=2.021

28

H0: daca β=0 - nu este semnificativ statisticH1: daca β !=0 – este semnificativ statistic, semnificativ diferit de 03.03>2.021 se respinge H0, se accepta H1 (β2 este semnificativ din punct de vedere

statistic) pentru β2.

Testele Akaike si Schwarz sunt folosite pentru compararea a 2 sau mai multe modele. Cel mai bun model este acela care are valorile cele mai mici pentru aceste doua teste.

Sc=−2 L

n+ K∗ln n

n=10.72060

Aic=−2L

n+2 K

n=10.59648

29

3. Aplicarea analizei de tip ANOVA pentru validitatea modelului de regresie multiplă și interpretarea rezultatelor

SUMMARY OUTPUT

Regression StatisticsMultiple R 0.440532R Square 0.194068Adjusted R Square 0.152738Standard Error 46.75529Observations 42

ANOVA

df SS MS FSignificanc

e FRegression 2 20529.69 10264.85 4.695599 0.014887Residual 39 85256.21 2186.057Total 41 105785.9

CoefficientsStandard Error t Stat P-value Lower 95% Upper 95%

Lower 95.0%

Upper 95.0%

Intercept 102.0218 33.71642 3.025878 0.004374 33.82388 170.2197 33.82388 170.2197Rata somaj 2010 (x1) 399.1964 366.8711 1.088111 0.283225 -342.87 1141.263 -342.87 1141.263Rata infractionalitatii 2010 (x2) 0.049113 0.021293 2.306489 0.026484 0.006043 0.092183 0.006043 0.092183

30


Observation

Predicted Rata

criminalităţii 2010 (Y)

Residuals

Standard Residual

s Percentile

Rata criminalităţi

i 2010 (Y)1 244.7844 30.21557 0.662613 1.190476 1032 186.8236 35.17642 0.771402 3.571429 1183 193.9977 -41.9977 -0.92099 5.952381 1214 193.7648 40.23524 0.882339 8.333333 1225 188.9304 19.06963 0.418188 10.71429 1326 193.9714 -22.9714 -0.50375 13.09524 1347 181.2511 37.74895 0.827816 15.47619 1378 197.4558 46.54424 1.020692 17.85714 1419 196.1827 9.817324 0.215289 20.2381 152

10 195.947 -77.947 -1.70934 22.61905 15811 220.7417 -4.7417 -0.10398 25 15912 214.0749 -80.0749 -1.756 27.38095 16013 205.0257 -13.0257 -0.28565 29.7619 16314 184.553 15.447 0.338745 32.14286 17115 198.4707 -22.4707 -0.49277 34.52381 17616 204.8102 -67.8102 -1.48704 36.90476 18617 217.7105 -54.7105 -1.19977 39.28571 19218 191.9147 93.08532 2.041315 41.66667 200

31

19 222.5828 -90.5828 -1.98644 44.04762 20220 236.4415 13.55852 0.297332 46.42857 20621 219.6612 -7.66121 -0.16801 48.80952 20622 253.0393 35.96069 0.7886 51.19048 20823 211.2338 -25.2338 -0.55337 53.57143 21224 183.4007 22.59934 0.495592 55.95238 21625 112.8001 -9.80007 -0.21491 58.33333 21626 193.406 54.59404 1.19722 60.71429 21827 222.8623 54.13772 1.187214 63.09524 21928 175.3942 -15.3942 -0.33759 65.47619 22229 218.0884 4.911626 0.10771 67.85714 22330 187.914 28.086 0.615912 70.2381 22931 210.4884 -8.48841 -0.18615 72.61905 23432 192.5873 -70.5873 -1.54794 75 23933 199.4996 29.50036 0.646928 77.38095 24034 198.4218 40.5782 0.88986 79.7619 24435 192.0673 25.93268 0.568691 82.14286 24836 183.3213 -24.3213 -0.53335 84.52381 24937 196.3172 -38.3172 -0.84028 86.90476 25038 172.4373 -31.4373 -0.6894 89.28571 27539 214.8041 25.19592 0.552534 91.66667 27740 205.3001 -84.3001 -1.84866 94.04762 28441 212.09 71.90995 1.57695 96.42857 28542 191.4313 57.56872 1.262454 98.80952 289

32

0.00%2.00%

4.00%6.00%

8.00%

10.00%

12.00%

14.00%-100

0

100

Rata somaj 2010 (x1) Re-sidual Plot


Resid

uals

- 500 1,000 1,500 2,000 2,500 3,000 -100

-500

50100150

Rata infractionalitatii 2010 (x2) Residual Plot


Resid

uals

0.00% 5.00% 10.00% 15.00%0

50100150200250300350

Rata somaj 2010 (x1) Line Fit Plot



Rata

crim

inal

ităţii

201

0 (Y

)

- 1,000 2,000 3,000 0

50100150200250300350

Rata infractionalitatii 2010 (x2) Line Fit Plot



Rata

crim

inal

ităţii

201

0 (Y

)

33

0 20 40 60 80 100 1200

50100150200250300350


Sample Percentile

Rata

crim

inal

ităţii

201

0 (Y

)

34

4. Testarea ipotezelor clasice asupra modelului de regresie multiplăHeteroskedasticity Test: White




C -3068.666 4061.802 -0.755494 0.4549RATASOMAJ 98548.58 124700.3 0.790284 0.4345

RATASOMAJ^2 212947.5 655707.2 0.324760 0.7472RATASOMAJ*RATAINFRACTIONALITAT

II -64.26460 66.89205 -0.960721 0.3431RATAINFRACTIONALITATII 0.682481 3.399694 0.200748 0.8420

RATAINFRACTIONALITATII^2 0.001068 0.002219 0.481276 0.6332

R-squared 0.198073 Mean dependent var 2029.910Adjusted R-squared 0.086694 S.D. dependent var 2391.331S.E. of regression 2285.324 Akaike info criterion 18.43797Sum squared resid 1.88E+08 Schwarz criterion 18.68621Log likelihood -381.1973 Hannan-Quinn criter. 18.52896F-statistic 1.778369 Durbin-Watson stat 1.941922Prob(F-statistic) 0.142152

0

1

2

3

4

5

6

-100 -80 -60 -40 -20 0 20 40 60 80 100


Mean -4.06e-15Median 7.364475Maximum 93.08532Minimum -90.58284Std. Dev. 45.60066Skewness -0.306715Kurtosis 2.354754


35

6.1 Ipoteze statistice clasice asupra modelului de regresie multiplăTestarea raportului de corelatie – vezi 4.1

Testarea parametrilor unui model de regresie simplu – vezi 4.2

Teste de detectarea heteroscedasticitatii si de corectare a acesteia – precum Goldfield-Quandt (pentru serii lungi de date si in care una dintre variabile reprezinta cauza heteroscedasticitatii).

6.2 Testarea liniarității modelului propusLiniaritatea poate sa fie testata intr-un mod evident prin graficul care compara

valorile observate ale ratei criminalitatii versus valorile obtinute prin functia de regresie. In ambele modele, valorile sunt distribuite simetric in jurul liniei de regresie.

6.3 Testarea normalității erorilorTestul Jarque-Bera ( verificarea ipotezei de normalitate a erorilor)

JB=n [ S2

6+

( k−3 )2

2 n ] χα ,r2

H0: erorile nu sunt distribuite normalH1: erorile sunt distribuite normalTestul Jarque-Bera se bazeaza pe ipoteza ca distributia normala are un coefficient

de asimetrie ( S=0) si un coeficient de aplatizare ( k=3)Daca p(JB) – valoarea probabilitatii lui Jarque-Bera- este suficient de scazuta,

rezulta ca ipoteza de normalitate a erorilor este respinsa (JB > χα , r2 ; 1.387>5.9915 rezulta

ca se respinge H0).

6.4- Testarea ipotezei de homoscedasticitateTestul WhitePresupune construirea unei regresii auxiliare bazate pe presupunerea unei relatii

de dependent intre patratul valorii erorilor, variabila exogena inclusa in modelul initial ( consumul ) si patratul valorilor acestuia.

ε i2=α 0+α1 xi+α2 xi

2+wi

H0: α¿α 1=α 0=0 ( nici un α nu e semnificativ statistic- homoscedast – media erorilor e 0, iar dispersia este 1)H1: ∃∀α i≠0 ( exista cel putin un αi care este semnificativ statistic) 6.5 Testarea ipotezei de autocorelare a erorilor

Testul Durbin-Watson

∆ W =∑i=2

n

( εi− εi−1)2

∑ εi2 =1.94

Cu n=41,α=0.05,p=2 de unde rezulta ca d1=1.44,d2= 1.54. Astfel, ne aflam in cazul 5(d2≤∆W≤4- d2), se accepta H0 – erorile sunt necorelate.

36

7. Previziunea valorii variabilei Y dacă variabila X crește cu 10% față de ultima valoare înregistrată (inclusiv interval de încredere) pentru toate variantele cunoscute.

Daca variabila creste cu 10% fata de ultima valoare inregistrata, adica fata de 7.4%, si 1,219, adica 0.74% si121.9 atunci:

Y=102.2+399.2*X1+ 0.05*X2 se transforma in : Y=192.69+399.2*X1+ 0.05*X2

Rezolvarea problemei B de exemplificat atât în Excel cât și în Eviews.

Problema CFolosind datele Problemei A, să se testeze dacă dispersiile (variaţiile) celor două populaţii (variabila exogenă și variabila endogenă) sunt egale; testați dacă mediile celor două populaţii sunt egale. Rezolvarea problemei C de exemplificat în Excel, cu interpretarea rezultatelor și parcurgerea etapelor testării ipotezelor statistice.

- Dispersiile celor doua populatii sunt egale

- Daca mediile celor doua populatii sunt egale

37

Download - Proiect seminar Econometrie

Top Related