bÀi 6 ĐÁnh giÁ cÁc khuyẾt tẬt

25
Bài 6: Đánh giá các khuyết tật 118 TXT0KT04_Bài6_v1.0015108207 BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT Hướng dẫn học: Trong nội dung các bài học trước, sinh viên đã làm quen với công việc phân tích hồi quy cho các dạng hồi quy khác nhau: hồi quy đơn, hồi quy bội, hồi quy với biến giả,… Trên thực tế, các công việc phân tích hồi quy như: ước lượng, kiểm định, dự báo cho mô hình hồi quy để đạt được độ chính xác và kết quả đáng tin cậy cần dựa trên giả định các giả thiết cơ bản của phương pháp bình phương nhỏ nhất (gọi tắt là các giả thiết OLS) phải thỏa mãn. Trong bài học này, sinh viên sẽ tiếp xúc với các tình huống số liệu thực tế có xuất hiện sự vi phạm của các giả thiết OLS, khi đó mô hình hồi quy sẽ có khuyết tật. Các hiện tượng này sẽ được giới thiệu dưới các góc độ: bản chất – nguyên nhân, hậu quả, cách phát hiện và cách khắc phục đối với từng hiện tượng. Bên cạnh đó, bài học cũng giới thiệu một số tiêu chí đánh giá một mô hình thích hợp cho các phân tích thực nghiệm. Để học tốt bài này sinh viên cần thực hiện: Học đúng lịch trình của môn học theo tuần, đọc kĩ các khái niệm. Theo dõi ví dụ để hiểu ý nghĩa. Đọc tài liệu: Nguyễn Quang Dong, Nguyễn Thị Minh, 2012, Giáo trình kinh tế lượng, NXB Đại học Kinh tế quốc dân. Sinh viên tự học, làm việc theo nhóm, trao đổi với giảng viên. Tham khảo các thông tin từ trang Web của môn học. Nội dung: Một số tiêu chí đánh giá mô hình Hiện tượng dạng hàm hồi quy xác định sai: bản chất, hậu quả, cách phát hiện và một số cách khắc phục. Hiện tượng phương sai sai số thay đổi: bản chất – nguyên nhân, hậu quả, cách phát hiện, và khắc phục. Hiện tượng sai số ngẫu nhiên không phân phối chuẩn: hậu quả và cách phát hiện. Mục tiêu: Sau khi học xong bài này, sinh viên cần đảm bảo được các yêu cầu sau: Nắm được các tiêu chí cơ bản đánh giá một mô hình thích hợp cho phân tích thực nghiệm; Hiểu rõ bản chất của các khuyết tật có thể gặp phải khi sử dụng một mô hình để phân tích; Nắm được hậu quả và cách phát hiện một số khuyết tật cơ bản của mô hình hồi quy; Nắm được một số phương pháp khắc phục đơn giản cho các khuyết tật của mô hình.

Upload: others

Post on 03-Oct-2021

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

118 TXT0KT04_Bài6_v1.0015108207

BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Hướng dẫn học:

Trong nội dung các bài học trước, sinh viên đã làm quen với công việc phân tích hồi quy cho các dạng hồi quy khác nhau: hồi quy đơn, hồi quy bội, hồi quy với biến giả,… Trên thực tế, các công việc phân tích hồi quy như: ước lượng, kiểm định, dự báo cho mô hình hồi quy để đạt được độ chính xác và kết quả đáng tin cậy cần dựa trên giả định các giả thiết cơ bản của phương pháp bình phương nhỏ nhất (gọi tắt là các giả thiết OLS) phải thỏa mãn.

Trong bài học này, sinh viên sẽ tiếp xúc với các tình huống số liệu thực tế có xuất hiện sự vi phạm của các giả thiết OLS, khi đó mô hình hồi quy sẽ có khuyết tật. Các hiện tượng này sẽ được giới thiệu dưới các góc độ: bản chất – nguyên nhân, hậu quả, cách phát hiện và cách khắc phục đối với từng hiện tượng.

Bên cạnh đó, bài học cũng giới thiệu một số tiêu chí đánh giá một mô hình thích hợp cho các phân tích thực nghiệm.

Để học tốt bài này sinh viên cần thực hiện:

Học đúng lịch trình của môn học theo tuần, đọc kĩ các khái niệm.

Theo dõi ví dụ để hiểu ý nghĩa.

Đọc tài liệu: Nguyễn Quang Dong, Nguyễn Thị Minh, 2012, Giáo trình kinh tế lượng, NXB Đại học Kinh tế quốc dân.

Sinh viên tự học, làm việc theo nhóm, trao đổi với giảng viên.

Tham khảo các thông tin từ trang Web của môn học.

Nội dung:

Một số tiêu chí đánh giá mô hình

Hiện tượng dạng hàm hồi quy xác định sai: bản chất, hậu quả, cách phát hiện và một số cách khắc phục.

Hiện tượng phương sai sai số thay đổi: bản chất – nguyên nhân, hậu quả, cách phát hiện, và khắc phục.

Hiện tượng sai số ngẫu nhiên không phân phối chuẩn: hậu quả và cách phát hiện.

Mục tiêu:

Sau khi học xong bài này, sinh viên cần đảm bảo được các yêu cầu sau:

Nắm được các tiêu chí cơ bản đánh giá một mô hình thích hợp cho phân tích thực nghiệm;

Hiểu rõ bản chất của các khuyết tật có thể gặp phải khi sử dụng một mô hình để phân tích;

Nắm được hậu quả và cách phát hiện một số khuyết tật cơ bản của mô hình hồi quy;

Nắm được một số phương pháp khắc phục đơn giản cho các khuyết tật của mô hình.

Page 2: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 119

Tình huống dẫn nhập

Tiếp tục sử dụng bộ số liệu thống nhất từ bài số 1: Chi tiêu (CT) phụ thuộc Thu nhập (TN) rút ra từ bộ số liệu VHLSS 2012. Tuy nhiên chúng ta sử dụng các quan sát của các hộ gia đình có mức chi tiêu/năm trên 200 triệu.

Chi tiêu Thu nhập Chi tiêu Thu nhập Chi tiêu Thu nhập Chi tiêu Thu nhập

201 159 230 227 266 375 296 349

205 294 232 228 273 285 297 396

205 294 233 347 274 298 298 351

207 252 233 265 275 334 302 372

207 254 235 267 276 290 303 374

208 224 236 263 277 325 304 361

210 239 241 333 278 396 308 358

210 258 242 362 280 385 318 378

211 195 243 203 281 364 333 385

211 202 245 225 281 312 334 362

212 274 246 276 282 325 336 392

213 229 246 240 288 271 337 392

213 154 248 284 289 344 337 380

218 309 249 239 292 394 345 394

226 220 252 346 293 370 360 398

228 306 261 259 294 340

229 227 264 272 294 360

Nghiên cứu mối quan hệ phụ thuộc của chi tiêu vào thu nhập, xây dựng mô hình:

Mô hình (1): uTNCT 21

Mô hình 1 có bị thiếu biến số quan trọng hay không? (với bộ số liệu đang sử dụng)

Nếu có thêm số liệu về biến số người của hộ (SN) thì có nên đưa biến này vào mô hình 1 hay không?

Sai số ngẫu nhiên trong mô hình 1 có phương sai đồng đều hay không?

Sai số ngẫu nhiên của mô hình 1 có phân phối chuẩn hay không? Nếu không, điều này có ảnh hưởng đến các phân tích hồi quy hay không?

Có thể dùng các kết quả ước lượng từ mô hình 1 có đáng tin cậy để thực hiện phân tích hồi quy hay không?

Page 3: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

120 TXT0KT04_Bài6_v1.0015108207

6.1. Tiêu chí đánh giá lựa chọn mô hình thích hợp

Sự xuất hiện các khuyết tật trong mô hình hồi quy có nguyên nhân các giả thiết OLS bị vi phạm. Sự vi phạm của giả thiết 2 sẽ dẫn đến hiện tượng kỳ vọng sai số ngẫu nhiên khác không, giả thiết 3 vi phạm gây ra khuyết tật phương sai sai số thay đổi và sự vi phạm của giả thiết 5 dẫn tới hiện tượng sai số ngẫu nhiên không phân phối chuẩn. Trong các bài học trước, ta ngầm định các giả thiết từ 1 đến 4 đã được thỏa mãn.

Trước khi bắt đầu nghiên cứu từng khuyết tật của mô hình hồi quy, ta đến với một số tiêu chí đánh giá một mô hình thích hợp trong phân tích thực nghiệm.

6.1.1. Tiêu chí lựa chọn mô hình

Theo D.F.Hendry và J.F.Richard (1983), một mô hình được chọn cho nghiên cứu thực nghiệm nên thỏa mãn các tiêu chuẩn sau:

Độ chính xác của số liệu chấp nhận được: khi đó, các kết quả dự báo nhận được từ mô hình là hợp lý.

Độ vững của lý thuyết: Ước lượng cho các hệ số của mô hình thu được cần có ý nghĩa kinh tế phù hợp. Ví dụ, khi mô hình hồi quy chi tiêu theo thu nhập thì hệ số góc được kì vọng là nằm trong khoảng 0 đến 1.

Mô hình có dạng hàm được định dạng đúng: Kỳ vọng của sai số ngẫu nhiên trong mô hình bằng không, phương sai của sai số ngẫu nhiên là đồng đều và các sai số ngẫu nhiên không có tương quan với nhau. Khi đó, các ước lượng nhận được từ mô hình sẽ là các ước lượng tốt nhất.

Tính bao quát: Một mô hình cần chứa đầy đủ thông tin của các mô hình khác có cùng đối tượng cần giải thích. Nói cách khác, không có mô hình nào có thể thích hợp hơn mô hình được chọn cho vấn đề nghiên cứu.

6.1.2. Một số kiểu định dạng hàm sai trong nghiên cứu thực nghiệm

Mô hình bỏ sót biến giải thích quan trọng

Trong mô hình (1), chi tiêu của hộ gia đình trên thực tế có thể còn chịu tác động của nhiều yếu tố khác, việc xác định dạng hàm bỏ sót một hoặc một số biến độc lập sẽ dẫn đến sự vi phạm của giả thiết 2. Các ước lượng nhận được sẽ là các ước lượng chệch và kém ý nghĩa trong phân tích hồi quy.

Ví dụ:

Mô hình (1): 1 2 1CT TN u

Mô hình (2): 1 2 3 2CT TN SN u

Nếu dạng hàm của mô hình (2) là đúng thì:

231 uSNu Như vậy trong trường hợp người nghiên cứu nhất định lựa chọn dạng hàm của mô hình 1 thì ta có:

0),(),(],)([),( 23231 SNTNuESNTNSNESNTNuSNESNTNuE

Page 4: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 121

Mô hình 1 đã vi phạm giả thiết 2, do đó các ước lượng từ mô hình 1 không phải là ước lượng tốt nhất vì nó là ước lượng chệch.

Mô hình chứa các biến không cần thiết

Tương tự trường hợp trên, tuy nhiên khi mô hình được lựa chọn lại chứa các biến không cần thiết dẫn đến việc vi phạm giả thiết 4. Như đã đề cập ở trên, ta không nghiên cứu sự vi phạm của giả thiết này trong chương trình học. Trên thực tế, tình huống mô hình chứa những biến không cần thiết hoặc có thông tin trùng lặp cũng dẫn đến những hậu quả nhất định trong phân tích hồi quy, nhưng kỹ thuật khắc phục hiện tượng này tương đối đơn giản nên các học viên có thể tham khảo thêm trong giáo trình KINH TẾ LƯỢNG của Đại học Kinh tế Quốc dân.

Ví dụ:

Mô hình: 1 2 3TN KN TUOI u

Với các biến: TN thu nhập của người lao động.

KN – số năm kinh nghiệm làm việc trong công việc hiện tại.

TUOI – tuổi đời của người lao động.

Trong mô hình dễ thấy khi tuổi đời tăng lên thì số năm kinh nghiệm của người lao động cũng tăng lên điều này dẫn tới có thông tin trùng lặp trong mô hình, người nghiên cứu có thể bỏ bớt 1 trong 2 biến giải thích của mô hình.

Xác định dạng hàm sai

Ví dụ:

Mô hình xác định dạng hàm sai:

Mô hình (1): 1 2 1Q P u

Mô hình (2): 2 2u1Q P e

Giả sử dạng hàm đúng là mô hình (2), như vậy ta cũng gặp tình huống tương tự như trường hợp mô hình bị bỏ sót biến giải thích quan trọng và dẫn tới các ước lượng bị chệch.

Sai số trong đo lường các biến số

Khi điều tra số liệu nếu ta không thể có thông tin về các biến dự kiến xuất hiện trong mô hình, thì ta có thể sử dụng các biến đại diện (proxy variable(s)). Chất lượng của biến đại diện cũng ảnh hưởng tương đối lớn đến kết quả ước lượng nhận được. Nếu biến đại diện không tốt, ta sẽ gặp tình trạng sai số trong đo lường các biến số.

Ví dụ:

Khi điều tra số liệu nếu ta không thể có thông tin về các biến dự kiến xuất hiện trong mô hình, thì ta có thể sử dụng các biến đại diện (proxy variable(s)). Chất lượng của biến đại diện cũng ảnh hưởng tương đối lớn đến kết quả ước lượng nhận được. Nếu biến đại diện không tốt, ta sẽ gặp tình trạng sai số trong đo lường các biến số.

Page 5: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

122 TXT0KT04_Bài6_v1.0015108207

Ví dụ:

Nghiên cứu sự phụ thuộc của Lượng cầu hàng hóa vào giá bán hàng hóa. Trên thực tế ta cần sử dụng biến đại diện cho biến lượng cầu hàng hóa là “lượng bán của hàng hóa”. Thông thường trong trường hợp này biến đại diện là tốt.

Trong một nghiên cứu khác, xây dựng mô hình đánh giá tác động của năng lực bẩm sinh của cá nhân tới mức độ thành công của người đó. Ở đây, ta phải sử dụng biến đại diện cho cả biến giải thích và biến được giải thích trong mô hình. Mức độ thành công của một người có thể được đại diện bằng thu nhập hoặc địa vị của người đó và năng lực bẩm sinh được đại diện bằng chỉ số IQ của người đó. Dễ nhận thấy các biến đại diện trong trường hợp này không thực sự đảm bảo độ chính xác của thông tin.

Các ví dụ trên có thể được mô tả chi tiết hơn dưới dạng toán học như sau:

Giả sử ta cần nghiên cứu mô hình:

uXY 21

Tuy nhiên, biến Y và biến X trong mô hình trên phải đại diện bởi biến Y* = Y + w và biến X* = X + v. Khi đó mô hình nhận được thực tế trở thành:

)( 221 wvuXY

Thông thường, mức sai lệch v và w càng lớn dẫn tới sự tương quan cao giữa sai số

trong mô hình thực tế và biến giải thích giả thiết 2 bị vi phạm.

6.2. Kỳ vọng của sai số ngẫu nhiên khác không

Hiện tượng kỳ vọng sai số ngẫu nhiên của mô hình hồi quy khác không là hiện tượng sai số ngẫu nhiên u, tại một giá trị nào đó của biến giải thích X, có kỳ vọng khác không.

6.2.1. Nguyên nhân

Như đã đề cập ở mục 6.1.2, giả thiết 2 bị vi phạm với các nguyên nhân chủ yếu đã nêu trên. Bên cạnh đó nguyên nhân giả thiết 2 bị vi phạm còn có thể do tính tác động đồng thời của số liệu, được hiểu là 1 dạng khác của trường hợp mô hình thiếu biến giải thích quan trọng. Để tìm hiểu kỹ hơn về nguyên nhân này, học viên có thể tham khảo giáo trình Kinh tế Lượng của trường Đại học Kinh tế Quốc dân.

Trên thực tế thì nguyên nhân chủ yếu của hiện tượng kỳ vọng sai số ngẫu nhiên khác không vẫn là mô hình bị bỏ sót biến giải thích quan trọng.

6.2.2. Hậu quả của kỳ vọng sai số ngẫu nhiên khác không

Ước lượng OLS bị chệch

Khi giả thiết 2 bị vi phạm thì ta có các ước lượng OLS sẽ là ước lượng chệch:

),1()ˆ( kjE jj

Hệ quả của điều này là các công việc phân tích hồi quy không đáng tin cậy nữa.

Các suy diễn thống kê không đáng tin cậy

Như đã học trong bài 4, các bài toán suy diễn thống kê đối với mô hình hồi quy như bài toán ước lượng hoặc bài toán kiểm định đều cần ước lượng của các βj là

Page 6: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 123

ước lượng tốt nhất. Tuy nhiên khi các j là ước lượng chệch thì đương nhiên

chúng cũng không phải là ước lượng tốt nhất. Các kết quả suy diễn thống kê nhận được đều không đáng tin cậy cho người nghiên cứu.

Phát sinh lượng chệch của ước lượng khi mô hình thiếu biến giải thích quan trọng

Giả sử ta nghiên cứu một mô hình 3 biến và muốn đánh giá tác động của X2 tới Y:

133221 uXXY Thay vì sử dụng mô hình trên, ta quyết định chỉ sử dụng mô hình chỉ có tác động của một mình biến giải thích X2:

2221 uXY Khi đó, ước lượng 2 sẽ có mối liên hệ với hệ số 2 trong mô hình ban đầu dưới dạng:

2322ˆ)ˆ( bE

Với 2b là ước lượng hệ số góc của mô hình:

vXbbX 2213

Lượng chệch của ước lượng 2 chính là 23b . Khi hệ số 3 và 2b càng lớn thì

lượng chệch này cũng tăng lên.

6.2.3. Phát hiện sự khác không của kỳ vọng của sai số ngẫu nhiên

Trường hợp thông tin, số liệu của biến bị thiếu đã biết

Xét mô hình:

uXXY kk .. 221

Để kiểm tra mô hình trên có thiếu biến Z (đã có thông tin, số liệu), ta có thể thực hiện kiểm định t với cặp giả thiết:

0:H

0:H

11

10

k

k

Ý kiến ở H0 thể hiện thông tin biến Z là không cần thiết và mô hình xuất phát không bị thiếu biến. Còn ý kiến ở H1 thể hiện thông tin là mô hình ban đầu bị thiếu biến quan trọng.

Chọn tiêu chuẩn kiểm định:

)ˆ(

ˆ

1

1

k

k

Set

Miền bác bỏ H0: )1(

2: kntTTW

Kết luận: Nếu Wtqs thì bác bỏ H0 và ngược lại thì chưa có cơ sở bác bỏ H0.

Với sự hỗ trợ của phần mềm, học viên cũng có thể sử dụng giá trị Prob. của thống kê t mà phần mềm máy tính tính toán sẵn để đưa ra kết luận về cặp giả thuyết trên. Cách sử dụng giá trị xác suất này đã được trình bày trong bài 4.

Page 7: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

124 TXT0KT04_Bài6_v1.0015108207

Ví dụ: Xét tình huống dẫn nhập, ta có bộ số liệu của 66 hộ gia đình có chi tiêu năm 2012 trên 200 triệu. Bộ số liệu rút ra từ cuộc điều tra VHLSS 2012. Mô hình ban đầu được quan sát là:

121 uTNCT

Dependent Variable: CT

Method: Least Squares

Sample(adjusted): 9 100 IF CT>200

Included observations: 66 after adjusting endpoints

Variable Coefficient Std. Error t – Statistic Prob.

C 108.2196 15.04457 7.193271 0.0000

TN 0.506978 0.048209 10.51618 0.0000

R – squared 0.633427 F – statistic 110.5900

Adjusted R – squared

0.627699 Prob(F – statistic) 0.000000

Người nghiên cứu cần kiểm tra mô hình này có thiếu biến số người của hộ (SN – thông tin của biến này cũng được cung cấp trong bộ số liệu VHLSS 2012) hay không? Mô hình đã thêm biến để kiểm tra:

2321 uSNTNCT

Dependent Variable: CT

Method: Least Squares

Sample(adjusted): 9 100 IF CT>200

Included observations: 66 after adjusting endpoints

Variable Coefficient Std. Error t – Statistic Prob.

C 5.263773 9.943290 0.529379 0.5984

TN 0.582662 0.023434 24.86352 0.0000

SN 18.62580 1.252190 14.87458 0.0000

R – squared 0.918755 F – statistic 356.2169

Adjusted R – squared 0.916176 Prob(F – statistic) 0.000000

Theo kết quả ước lượng, ta có Prob. của hệ số ứng với biến SN =0,0000 < α = 0,05 bác bỏ H0 trong cặp giả thuyết nêu trên. Kết luận biến SN là cần thiết có mặt trong mô hình. Nói cách khác, mô hình xuất phát là thiếu biến.

Ví dụ: Xét bộ số liệu về QA – lượng bán một hàng hóa, PA –giá bán của hàng hóa đó, PB – giá của hàng hóa B thay thế cho hàng hóa A đang được nghiên cứu.

Mô hình xuất phát:

121 uPAQA Ta có kết quả ước lượng của mô hình:

Dependent Variable: QA

Method: Least Squares

Included observations: 52

Page 8: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 125

Variable Coefficient Std. Error t – Statistic Prob.

C 316.3988 10.56304 29.95339 0.0000

PA – 1.287562 0.304836 – 4.223789 0.0001

R – squared 0.262976 F – statistic 17.84040

Adjusted R – squared 0.248236 Prob(F – statistic) 0.000101

Kiểm tra mô hình có bị thiếu các biến PA và PB hay không, ta thực hiện ước lượng mô hình mới:

2321 uPBPAQA Kết quả ước lượng của mô hình mới:

Dependent Variable: QA

Method: Least Squares

Included observations: 52

Variable Coefficient Std. Error t – Statistic Prob.

C 302.9997 2.913554 103.9966 0.0000

PA – 2.959413 0.106124 – 27.88630 0.0000

PB 1.891012 0.075280 25.11967 0.0000

R – squared 0.946891 F – statistic 436.8134

Adjusted R – squared 0.944723 Prob(F – statistic) 0.000000

Theo kết quả ước lượng, ta có Prob. của hệ số ứng với biến PB = 0,0000 < α = 0,05 bác bỏ H0 trong cặp giả thuyết nêu trên. Kết luận biến PB là cần thiết có mặt trong mô hình. Nói cách khác, mô hình xuất phát là thiếu biến.

Trường hợp thông tin, số liệu của biến bị thiếu chưa biết

Trong trường hợp này cần sử dụng thông tin của các biến đại diện cho biến bị thiếu, đưa vào mô hình xuất phát và thực hiện kiểm định theo kỹ thuật nêu trên.

Mô hình xác định dạng hàm sai

Kiểm định RAMSEY: đây là kiểm định tương đối phổ biến được sử dụng để kiểm tra tình trạng mô hình xác định dạng hàm sai. Ý tưởng của kiểm định này là biến giải thích quan trọng bị thiếu là các biến bậc cao của các biến giải thích trong mô hình. Khi làm việc với mô hình hồi quy bội, có thể lượng biến giải thích sẽ tương đối nhiều, ta sẽ sử dụng biến đại diện cho các biến này được lấy từ các dạng biểu

diễn của Y. Biến được chọn là Y , cần chú ý thêm là không thể đưa trực tiếp biến

Y vào mô hình rồi kiểm tra như trên, vì điều này dẫn đến giả thiết 4 bị vi phạm.

Các bước tiến hành của kiểm định RAMSEY:

Bước 1: Hồi quy mô hình ban đầu thu được Y

YuXXY kkˆ..... 221

Bước 2: Hồi quy phụ

(2) Y = 1 + 2X2+…+ kXk + k + 12Y + u

Bước 3: Kiểm định cặp giả thuyết

H0: Mô hình ban đầu xác định đúng (không cần dạng bậc cao của các biến giải thích).

Page 9: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

126 TXT0KT04_Bài6_v1.0015108207

H1: Mô hình ban đầu xác định sai (cần đưa các dạng bậc cao của các biến giải thích).

Kiểm định F: Fqs = = F statistic (Ramsey Reset test)

Nếu Fqs > F (1, n – k – 1) thì bác bỏ H0 và ngược lại thì chưa có cơ sở bác bỏ H0

Có thể sử dụng giá trị xác suất p – value do phần mềm tính toán để thực hiện kiểm định cặp giả thuyết trên:

Prob.(RAMSEY) ≤ Bác bỏ H0

Prob. (RAMSEY) > Chưa có cơ sở bác bỏ H0

Ví dụ:

Tiếp tục với tình huống dẫn nhập, thực hiện kiểm định RAMSEY để kiểm tra khuyết tật mô hình: 121 uTNCT có bị thiếu biến hay không. Kết quả

kiểm định cho thấy:

Ramsey RESET Test:

F – statistic 6.646491 Probability 0.012285

Theo kết quả kiểm định, ta có Prob. của thống kê F trong kiểm định RAMSEY = 0,012285 < α = 0,05 bác bỏ H0 trong cặp giả thuyết nêu trên. Kết luận: mô hình xuất phát là xác định dạng hàm sai.

6.2.4. Một số biện pháp khắc phục

Do nguyên nhân gây ra hiện tượng kỳ vọng sai số khác không trong mô hình hồi quy là khác nhau nên phương pháp khắc phục cũng khác nhau cho từng tình huống.

Nếu mô hình bị thiếu biến và thông tin của biến bị thiếu đã có, ta chỉ cần đưa biến bị thiếu vào mô hình và ước lượng mô hình mới.

Nếu nguyên nhân là dạng hàm bị xác định sai, phát hiện thông qua kiểm định RAMSEY thì ta cần thay đổi dạng hàm của mô hình, chẳng hạn chuyển dạng hàm của mô hình về dạng bậc cao, dạng tuyến tính với các biến logarith,…

Nếu nguyên nhân là mô hình bị thiếu biến mà chưa có thông tin của biến bị thiếu thì có thể sử dụng các biến đại diện và đưa vào mô hình xuất phát để kiểm tra.

6.3. Kiểm định phương sai sai số thay đổi

Định lý Gauss- Markov trong Bài 4 khẳng định rằng để ước lượng OLS là tốt nhất thì phương sai sai số trong mô hình hồi quy phải bằng nhau tại mọi quan sát. Mục này sẽ xem xét nguyên nhân và hậu quả khi giả thiết này không được thỏa mãn, cách phát hiện và một số phương pháp khắc phục hậu quả khi mô hình có hiện tượng phương sai sai số thay đổi.

6.3.1. Nguyên nhân của phương sai sai số thay đổi

Xét mô hình: 1 2 2 k kY X X u (1)

Mô hình trên có chỉ số i xác định cho các trường hợp của biến độc lập.

1

1

1 22

21

22

kn

R

RR

Page 10: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 127

Giả sử trong mô hình (1), sai số ngẫu nhiên u có phương sai thay đổi, nghĩa là có thể

viết như sau: 2i 2i ki ivar(u / X , , X ) (2)

Nghĩa là tại các bộ giá trị (X2i,…, Xki) khác nhau thì phương sai của sai số ngẫu nhiên

nhận các giá trị khác nhau, ký hiệu bởi 2 i .

Một số nguyên nhân thường dẫn đến hiện tượng này bao gồm:

Do bản chất của số liệu

Ta đã biết rằng phương sai của sai số ngẫu nhiên tại quan sát thứ i, cũng chính bằng phương sai của biến phụ thuộc tại quan sát này, Yi. Vì thế nên nếu độ dao động của Yi tại các giá trị khác nhau của biến Xj là khác nhau thì phương sai sai số sẽ thay đổi. Ví dụ ta xét mô hình sau về mối quan hệ giữa chi tiêu và thu nhập:

1 2CT TN u Ta biết rằng với những người có mức thu nhập TN = 3 triệu/tháng thì nói chung chỉ vừa đủ cho chi tiêu sinh hoạt, nên chi tiêu của những người này là rất giống nhau, do đó phương sai của biến CT tại mức TN = 3 là rất bé. Còn với những người có mức thu nhập cao hơn, chẳng hạn 10 triệu, thì họ có thể có mức chi tiêu rất khác nhau, tùy thuộc vào sở thích và kế hoạch của từng cá nhân, và như vậy phương sai của biến CT tại mức TN = 10 là khá lớn.

Do mô hình thiếu biến quan trọng hoặc dạng hàm sai

Chẳng hạn giả sử mô hình phù hợp cho mối quan hệ giữa năng suất tính theo giờ làm việc của người lao động (NS) và số giờ người lao động làm việc trong một ca sản xuất (H) là:

21 2 3 i i i iNS H H u

Trong đó thành phần H2 nhằm tính đến quy luật năng suất biên giảm dần.

Tuy nhiên nếu ta sử dụng mô hình thiếu biến: 1 2 i i iNS a a H v . Khi đó sai số ngẫu

nhiên vì sẽ chứa thành phần 2iH và do đó phương sai của nó tại các quan sát khác

nhau sẽ khác nhau.

Dạng hàm sai cũng có thể là nguyên nhân gây nên hiện tượng phương sai sai số thay

đổi. Chẳng hạn mô hình đúng có dạng: 1 2log( ) log( ) i i iNS H u . Nhưng ta lại

sử dụng mô hình: 1 2 i i iNS a a H v . Khi đó phương sai của sai số ngẫu nhiên trong

mô hình này sẽ thay đổi.

6.3.2. Hậu quả của phương sai sai số thay đổi

Chúng ta sẽ xem xét các hậu quả của phương sai sai số thay đổi khi sử dụng ước lượng OLS với điều kiện là các giả thiết khác của mô hình là thỏa mãn.

Giả sử mô hình (1) có phương sai sai số thay đổi: 22 ),...,/var( kii XXu . Khi đó:

Các ước lượng OLS vẫn là ước lượng không chệch

Nghĩa là khi phương sai sai số thay đổi mà các giả thiết khác của mô hình thỏa mãn

thì ta vẫn có: ˆ( )j jE (j=1,2,, k)

Page 11: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

128 TXT0KT04_Bài6_v1.0015108207

Do đó nếu mục đích của phân tích hồi quy là xác định các ước lượng điểm cho các hệ số hồi quy thì việc vi phạm giả thiết 3 là không gây hậu quả.

Tuy nhiên chúng ta thường muốn đưa ra các suy diễn thống kê về các hệ số trong mô hình hồi quy tổng thể, do đó cần xem xét đến phương sai của các hệ số ước lượng.

Các ước lượng hệ số không còn là ước lượng tốt nhất

Điều này có nghĩa là trong các ước lượng không chệch thì phương sai của các hệ số ước lượng OLS không còn là bé nhất nữa.

Phương sai của hệ số ước lượng là chệch

Việc tính toán phương sai của các hệ số ước lượng như trình bày trong Bài 3 cho thấy nếu phương sai sai số trong mô hình là thay đổi thì phương sai của các hệ số ước lượng tính bởi phương pháp OLS sẽ bị chệch. Khi đó sai số chuẩn sẽ không còn đáng tin cậy nữa, và do đó:

Khoảng tin cậy và kiểm định giả thuyết về các hệ số không còn giá trị sử dụng

Khi phương sai của các hệ số ước lượng là chệch, các thống kê T và F trình bày trong Bài 4 sẽ không tuân theo các quy luật Student và quy luật Fisher tương ứng nữa. Do đó kết luận của kết luận từ bài toán xây dựng khoảng tin cậy và kiểm định giả thuyết về các hệ số hồi quy có thể dẫn đến những kết luận sai lệch.

6.3.3. Phát hiện phương sai sai số thay đổi

Ta xét mô hình hồi quy tuyến tính (1), giả thiết 3 về phương sai sai số không đổi cho

mô hình này là: 22 ),...,/var( kii XXu i (3)

Ta sẽ giả sử rằng mô hình (1) thỏa mãn các giả thiết của mô hình hồi quy tuyến tính cổ điển, ngoại trừ giả thiết 3 mà ta đang xem xét. Do mô hình thỏa mãn giả thiết 2 nên kỳ vọng của sai số ngẫu nhiên bằng 0, hay E(u|X) = 0, từ đó ta có:

),...,/(),...,/var( 22

2 kiikii XXuEXXu

Do đó (3) được viết lại thành: 222

2 )(),...,/( ikii uEXXuE i (4)

Chúng ta sẽ xem xét một số phương pháp thông dụng phục vụ cho việc phát hiện hiện tượng phương sai sai số thay đổi trong mô hình hồi quy.

a. Sử dụng đồ thị phần dư

Đồ thị có thể cung cấp một cái nhìn ban đầu về việc liệu phương sai sai số trong mô

hình có thay đổi hay không. Do trong công thức (4), giá trị 2iu là chưa biết nên phải

thay thế bằng ước lượng của nó là 2ie . Nhìn vào sự biến động của ei hoặc 2

ie trên đồ thị

có thể giúp ta thấy được sự hiện diện hay không của phương sai sai số thay đổi.

Chẳng hạn khi vẽ đồ thị của ei theo một biến Xj nào đó trong mô hình và được đồ thị như sau:

Page 12: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 129

Hình 6.1. Quan hệ giữa e và X2

Đồ thị này cho thấy với các giá trị khác nhau của Xj thì ie khác nhau khá lớn, điều

này gợi ý rằng 2i là thay đổi và là một hàm số nào đó của Xj.

Ví dụ 1: Xét mô hình uTNCT 1211 gọi là mô hình (VD1) trong đó CT1 là chi

tiêu cho ăn uống và TN1 là thu nhập. Với bộ số liệu gồm 40 quan sát thu thập từ 40 cá nhân, ta thu được kết quả:

SRM: CT1 = 7,383 + 0,232 × TN1 + e

(Se) (4,008) (0,055)

Nghi ngờ mô hình (VD1) có hiện tượng phương sai sai số thay đổi, nên ta ghi lại phần dư của mô hình này với tên là E và vẽ đồ thị E theo TN ta có hình sau:

Hình 6.2: Đồ thị phần dư E và và bình phương phần dư theo TN

Quan sát đồ thị bên trái ta thấy: ở các mức thu nhập thấp, phần dư E dao động quanh trục hoành (E = 0) với biên độ dao động nhỏ từ -5 đến 5, trong khi đó ở các mức thu nhập cao hơn, phần dư E có giá trị tuyệt đối lớn hơn, dao động từ -15 đến 15. Đồ thị bên phải của hình 6.2 thể hiện mối quan hệ giữa bình phương phần dư (ký hiệu là E2) với thu nhập. Ta thấy ở các mức thu nhập cao hơn 60 đơn vị giá trị E2 cao hơn rất nhiều so với E2 ở các mức thu nhập thấp hơn. Hình ảnh này cho thấy phương sai của

-15

-10

-5

0

5

10

15

20 40 60 80 100 120

TN

E

0

40

80

120

160

200

240

20 40 60 80 100 120

TN

E2

Page 13: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

130 TXT0KT04_Bài6_v1.0015108207

sai số ngẫu nhiên trong mô hình (VD1) tăng khi thu nhập tăng, tức là mô hình này có hiện tượng phương sai sai số thay đổi.

Đồ thị phần dư cho ta một cái nhìn ban đầu về hiện tượng phương sai sai số thay đổi, nó có thể giúp cho thấy rằng phương sai sai số thay đổi là do sự thay đổi của một biến số nào đó trong mô hình. Tuy nhiên với mô hình hồi quy bội, nhiều khi sự thay đổi trong phương sai sai số là do đóng góp của nhiều biến số, hoặc dạng thức của phương sai sai số thay đổi là phức tạp mà ta khó có thể phát hiện bằng mắt thường. Sau đây ta sẽ xem xét một số kiểm định chi tiết.

b. Kiểm định Breusch – Pagan (BP)

Breusch – Pagan đề xuất ý tưởng xem xét nếu u2 có tương quan với ít nhất một trong các biến độc lập trong mô hình thì mô hình có hiện tượng phương sai sai số thay đổi.

Để xét mô hình (1) 1 2 2 .. k kY X X u có hiện tượng phương sai sai số thay

đổi hay không ta thực hiện như sau:

Bước 1: Ước lượng mô hình (1) bằng phương pháp OLS và thu được phần dư e.

Bước 2: Ước lượng mô hình hồi qui phụ: 2

1 2 2 .. wi i k ki ie b b X b X (*) (với wi là sai số ngẫu nhiên)

thu được hệ số xác định 2*R  

Bước 3: Kiểm định cặp giả thuyết: 0 2 3

2 2 21 2 3

: .. 0

: .. 0

k

k

H b b b

H b b b

H0: Mô hình (1) có phương sai sai số đồng đều tương đương:

H1: Mô hình (1) có phương sai sai số thay đổi

Tính giá trị quan sát của các thống kê kiểm định: 2* *

2* *

/ ( 1)

(1 ) / ( )qs

R kF

R n k

với 2k* là số hệ số trong mô hình (*)

2*qsLM nR

Nếu * *( 1, )qsF f k n k hoặc 2*( 1)qsLM k thì bác bỏ giả thuyết H0, chấp nhận

giả thuyết H1 và ta kết luận rằng mô hình có hiện tượng phương sai sai số thay đổi.

Ngược lại, nếu * *( 1, )qsF f k n k hoặc 2*( 1)qsLM k thì chưa có cơ sở bác bỏ

giả thuyết H0, và ta kết luận rằng mô hình có hiện tượng phương sai sai số đồng đều.

Một cách tương đương, có thể sử dụng giá trị xác suất P tương ứng với thống kê quan sát để đưa ra kết luận tương ứng.

Ví dụ 2: Ta xét mô hình (VD1) đã được trình bày trong ví dụ 1 ở trên. Để kiểm định giả thuyết về phương sai sai số không đổi trong mô hình này bằng kiểm định BP, ta sử

dụng phần dư E và ước lượng mô hình hồi quy phụ sau: 21 2E TN v thu được

kết quả:

SRM: E2 = 74,709 + 1,708 × TN1 + v

(Se) (30,605) (0,422) và 2*R = 0,301

Page 14: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 131

Với mức ý nghĩa 5%, hãy kết luận về hiện tượng phương sai sai số thay đổi trong mô hình (VD1)?

Lời giải:

Cách 1:

Ta cần kiểm định cặp giả thuyết:

H0: Mô hình (VD1) có phương sai sai sai số đồng đều.

H1: Mô hình (VD1) có phương sai sai sai số thay đổi.

Giá trị quan sát của thống kê F là:

0,301/116,363

(1 0,301) / (40 2)qsF

Tra bảng ta có: f0,05(1,38) ≈ f0,05(1,20) = 4,35

Suy ra Fqs > f0,05(1,38) nên bác bỏ giả thuyết H0, chấp nhận giả thuyết H1.

Kết luận: Mô hình (VD1) có hiện tượng phương sai sai số thay đổi.

Cách 2:

Ta cần kiểm định cặp giả thuyết:

H0: Mô hình (VD1) có phương sai sai sai số đồng đều.

H1: Mô hình (VD1) có phương sai sai sai số thay đổi.

Giá trị quan sát của thống kê LM là:

LMqs = 40*0,301 = 12,04

Tra bảng ta có: 20,05 (1) 3,84

Suy ra LMqs > 20,05 (1) nên bác bỏ giả thuyết H0, chấp nhận giả thuyết H1.

Kết luận: Mô hình (VD1) có hiện tượng phương sai sai số thay đổi.

Ví dụ 3: Ta xét mô hình: Q = β1 + β2P + β3PC+ u (gọi là mô hình VD2) đã được trình bày trong bài 4. Để kiểm định giả thuyết về phương sai sai số không đổi trong mô hình này bằng kiểm định BP, ta ước lượng mô hình và thu được phần dư E. Tiếp theo

ta ước lượng mô hình hồi quy phụ sau: 21 2 3E P PC v thu được 2

*R =

0,0567. Với mức ý nghĩa 5% hãy kết luận về hiện tượng phương sai sai số thay đổi trong mô hình (VD2) ?

Lời giải:

Cách 1:

Ta cần kiểm định cặp giả thuyết:

H0: Mô hình (VD2) có phương sai sai số đồng đều.

H1: Mô hình (VD2) có phương sai sai số thay đổi.

Giá trị quan sát của thống kê F là:

0,0567 / 21, 472

(1 0,0567) / (52 3)qsF

Tra bảng ta có: f0,05(2,49) ≈ f0,05(2,20) = 3,49

Suy ra Fqs < f0,05(2,49) nên chưa có cơ sở bác bỏ giả thuyết H0.

Kết luận: Mô hình (VD2) có phương sai sai số đồng đều.

Page 15: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

132 TXT0KT04_Bài6_v1.0015108207

Cách 2:

Ta cần kiểm định cặp giả thuyết:

H0: Mô hình (VD2) có phương sai sai số đồng đều.

H1: Mô hình (VD2) có phương sai sai số thay đổi.

Giá trị quan sát của thống kê LM là:

LMqs = 52 × 0,0567 = 2,948

Tra bảng ta có: 20,05 (2) 5,11

Suy ra LMqs < 20,05 (2) nên chưa có cơ sở bác bỏ giả thuyết H0.

Kết luận: Mô hình (VD2) có phương sai sai số đồng đều.

c. Kiểm định White

Để minh họa kiểm định White, ta xét mô hình hồi quy ba biến như sau:

1 2 2 3 3Y X X u (5)

Kiểm định White cho mô hình hồi quy này được thực hiện như sau:

Bước 1: Ước lượng mô hình (5) và thu được các phần dư ei.

Bước 2: Ước lượng mô hình hồi quy phụ:

2 2 21 2 2 3 3 4 2 5 3 6 2 3i i i i i i i ie X X X X X X v (*)

thu được hệ số xác định, ký hiệu là 2*R

Chú ý: Biến tích 2 3i iX X được gọi là số hạng chéo (Cross term) có thể xuất hiện

trong mô hình hồi quy phụ hoặc không.

Bước 3: Xét cặp giả thuyết:

H0: 062 (Mô hình (5) có phương sai sai số đồng đều)

H1: 026

22 (Mô hình (5) có phương sai sai số thay đổi)

Sử dụng kiểm định F hoặc kiểm định Khi bình phương như nêu trong kiểm định BP để kiểm định cặp giả thuyết này.

Ví dụ 4: Thực hiện kiểm định White cho mô hình (VD2): Q = β1 + β2P + β3PC+ u.

Bước 1: ước lượng mô hình và thu được phần dư E.

Bước 2: Ước lượng mô hình hồi quy phụ sau: 2 2 2

1 2 3 4 5 6E P PC P PC P PC v thu được 2*R = 0,110141.

Với mức ý nghĩa 5% hãy cho biết mô hình (VD2) có hiện tượng phương sai sai số thay đổi hay không?

Lời giải:

Cách 1:

Ta cần kiểm định cặp giả thuyết:

H0: Mô hình (VD2) có phương sai sai số đồng đều.

H1: Mô hình (VD2) có phương sai sai số thay đổi.

Giá trị quan sát của thống kê F là:

Page 16: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 133

0,110141

0,11

/ 51,1387

(1 ) / (52 6)0141qsF

Tra bảng ta có: f0,05(5,46) ≈ f0,05(5,20) = 2,71

Suy ra Fqs < f0,05(5,46) nên chưa có cơ sở bác bỏ giả thuyết H0.

Kết luận: Mô hình (VD2) có phương sai sai số đồng đều.

Cách 2:

Ta cần kiểm định cặp giả thuyết:

H0: Mô hình (VD2) có phương sai sai số đồng đều.

H1: Mô hình (VD2) có phương sai sai số thay đổi.

Giá trị quan sát của thống kê LM tương ứng là:

LMqs = 52 × 0,110141= 5,727328

Tra bảng ta có: 20,05 (5) 11,0705

Suy ra: LMqs < 20,05 (5) nên chưa có cơ sở bác bỏ giả thuyết H0.

Kết luận: Mô hình (VD2) có phương sai sai số đồng đều.

Lưu ý: Kiểm định White được lập trình trong phần mềm Eviews, trong đó các thống kê F, LM và các giá trị xác suất của nó đã được tính sẵn. Sau đây là kết quả kiểm định White cho mô hình (VD2) thu được từ phần mềm Eviews:

White Heteroskedasticity Test:

F – statistic 1.138716 Probability 0.353686

Obs*R – squared 5.727328 Probability 0.333662

Với thông tin từ phần mềm Eviews, ta dễ dàng nhận thấy: Fqs = F-statistic = 1,138716; LMqs = Obs*R-squared = 5,727328. Ta có thể sử dụng các giá trị này và thực hiện kiểm định như trên, hoặc đơn giản hơn ta dùng các giá trị xác suất (Probability) ở cột bên phải so sánh với mức ý nghĩa

 và kết luận (đây là cách 3 và là cách được sử

dụng phổ biến nhất).

Cách 3:

Ta kiểm định cặp giả thuyết:

H0: Mô hình (VD2) có phương sai sai số đồng đều.

H1: Mô hình (VD2) có phương sai sai số thay đổi.

Theo kết quả kiểm định White:

Prob (F) = 0,353686; Prob (LM) = 0,333662

 = 0,05

Ta có Prob >    nên chưa có cơ sở bác bỏ giả thuyết H0.

Kết luận: Mô hình (VD2) có phương sai sai số đồng đều.

Ví dụ 5: Xét tình huống dẫn nhập, ta có bộ số liệu của 66 hộ gia đình có chi tiêu năm 2012 trên 200 triệu. Bộ số liệu rút ra từ cuộc điều tra VHLSS 2012. Mô hình ban đầu được quan sát là: 121 uTNCT Thực hiện kiểm định White cho mô hình này ta thu được kết quả sau:

Page 17: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

134 TXT0KT04_Bài6_v1.0015108207

White Heteroskedasticity Test:

F – statistic 1.625689 Probability 0.204922

Obs*R – squared 3.239041 Probability 0.197994

Với mức ý nghĩa 5% hãy cho biết mô hình này có hiện tượng phương sai sai số thay đổi hay không?

Lời giải:

Ta kiểm định cặp giả thuyết:

H0: Mô hình có phương sai sai số đồng đều.

H1: Mô hình có phương sai sai số thay đổi.

Theo kết quả kiểm định White:

Prob (F) = 0,204922; Prob (LM) = 0,197994

 = 0,05

Ta có Prob > nên chưa có cơ sở bác bỏ giả thuyết H0.

Kết luận: Mô hình có phương sai sai số đồng đều.

6.3.4. Khắc phục vấn đề phương sai sai số thay đổi

Ta biết rằng phương sai sai số thay đổi có thể do mô hình thiếu biến hoặc dạng hàm sai. Do đó trước khi khắc phục hậu quả do phương sai sai số thay đổi, ta cần xem xét vấn đề thiếu biến hoặc dạng hàm sai bởi các công cụ trình bày trong mục 6.2. Chỉ đến khi mô hình không có vấn đề về thiếu biến quan trọng hoặc dạng hàm sai thì ta mới bắt đầu xem xét các giải pháp về vấn đề phương sai sai số thay đổi.

Ta sẽ nghiên cứu lần lượt hai giải pháp sau đây: một là sử dụng phương pháp bình phương bé nhất tổng quát, hai là phương pháp ước lượng sai số chuẩn vững.

a. Phương pháp bình phương bé nhất tổng quát (GLS – generalized least squares)

Ý tưởng của phương pháp là như sau: giả sử đã biết dạng thay đổi của phương sai sai số, khi đó dùng các phép biến đổi tương đương để đưa về một mô hình mới mà sai số ngẫu nhiên trong mô hình này có phương sai sai số không đổi, sau đó sử dụng phương pháp OLS để ước lượng mô hình mới này.

Để minh họa phương pháp GLS khi mô hình có hiện tượng phương sai sai số thay đổi,

chúng ta xét mô hình: 1 2 2 .. k kY X X u (1)

Giả sử mô hình (1) thỏa mãn các giả thiết 1 – 5, ngoại trừ giả thiết phương sai sai số không đổi. Và giả sử rằng phương sai sai số là thay đổi theo dạng:

2 2 22i iX (6)

Khi đó ta thực hiện như sau:

Chia hai vế của (1) cho X2i và thu được:

i

i

i

ktk

i

i

i

i

i

i

X

u

X

X

X

X

XX

Y

222

332

22

Hay: * * * *1 2 2 ..i i k ki iY X X u (7)

Page 18: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 135

trong đó: * * * *2

2 2 2 2

1, , ,i ki i

i i ki ii i i i

Y X uY X X u

X X X X

Với mô hình (7) ta dễ dàng chứng tỏ được rằng sai số ngẫu nhiên mới trong mô hình,

u*, có phương sai là không đổi và bằng 2 . Do đó có thể áp dụng OLS để thu được

các ước lượng tốt nhất cho các hệ số j (j=1,k), và từ đó suy ra ước lượng cho các hệ

số j .

Việc biến đổi một mô hình có khuyết tật thành mô hình không có khuyết tật và sử dụng OLS cho mô hình đã biến đổi như trên được gọi là phương pháp bình phương bé nhất tổng quát.

Việc chuyển từ mô hình (1) sang (7) về thực chất là gán trọng số X2i cho quan sát thứ i. Vì vậy phương pháp ước lượng (1) thông qua mô hình (7) cũng còn được gọi là phương pháp ước lượng bình phương bé nhất có trọng số (WLS - weighted least squares).

Ví dụ 6: Kết quả kiểm định ở các ví dụ trên cho thấy mô hình 1 21 1 CT β β TN u

có hiện tượng phương sai sai số thay đổi và có dạng hàm đúng nên ta có thể khắc phục hậu quả bằng cách áp dụng phương pháp GLS. Chia cả hai vế phương trình (VD2) cho TN và ước lượng phương trình thu được kết quả sau:

SRM: CT1/TN1 = 3,855 × (1/TN1) + 0,285 + v

(Se) (2,542) (0,042)

Trong đó ước lượng của hệ số góc của mô hình ban đầu 2 0,285 (là hệ số chặn của

mô hình đã biến đổi) và 3,855 là ước lượng của hệ số chặn trong mô hình (VD2) ban đầu. Kết quả kiểm định White dưới đây cho thấy mô hình đã biến đổi có phương sai sai số đồng đều, tức là đã khắc phục được khuyết tật của mô hình.

White Heteroskedasticity Test:

F – statistic 0.813054 Probability 0.451268

Obs*R – squared 1.683946 Probability 0.430860

Việc xác định dạng thức của phương sai sai số nhiều khi là rất khó, đặc biệt là khi mô hình có nhiều biến, và do đó phương pháp bình phương bé nhất có trọng số là không khả thi. Khi đó nếu n lớn thì chúng ta có thể áp dụng kỹ thuật ước lượng sai số chuẩn vững (robust standard error) là một pháp được sử dụng rộng rãi trong thời gian gần đây, sẽ được trình bày trong mục tiếp theo dưới đây.

b. Ước lượng sai số chuẩn vững

Nhắc lại rằng khi mô hình có hiện tượng phương sai sai số thay đổi, các ước lượng OLS cho các hệ số vẫn là ước lượng không chệch, chỉ có phương sai của các hệ số ước lượng và hiệp phương sai giữa các hệ số ước lượng thu được bằng phương pháp OLS là chệch. Từ đó White (1980) đề xuất phương pháp sai số chuẩn vững (robust standard error) với tư tưởng như sau: vẫn sử dụng các hệ số ước lượng từ phương pháp OLS, tuy nhiên phương sai các hệ số ước lượng thì được tính toán lại mà không sử dụng đến giả thiết phương sai sai số không đổi.

Page 19: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

136 TXT0KT04_Bài6_v1.0015108207

Để minh họa phương pháp của White, chúng ta sẽ trở về trường hợp mô hình hồi quy hai biến. Ta có khi các giả thiết khác được thỏa mãn thì phương sai của các hệ số bằng:

2 22

12 2

22

1

ˆar( )

n

i ii

n

ii

xv

x

(8)

Khi phương sai sai số đồng đều, tức là 2 2i thì (8) sẽ trở thành công thức tính

phương sai theo phương pháp OLS (được nêu trong định lý 1.2 trong Bài 2). Khi

phương sai sai số thay đổi, tức là 2 2i , White đã đề xuất thay công thức dùng

trong phương pháp OLS bởi công thức sau:

2 22

12 2

22

1

ˆar( )

n

i ii

n

ii

x ev

x

(9)

và sai số chuẩn vững được tính là căn bậc hai của biểu thức trong (9).

White đã chứng minh được rằng khi n là đủ lớn thì (9) tiệm cận về giá trị đúng (8). Việc chứng minh điều này là khá phức tạp, người đọc quan tâm có thể tìm hiểu thêm bài viết của White (1980).

Ví dụ 7: Kết quả kiểm định ở các ví dụ trên cho thấy mô hình:

uTNCT 1211

có hiện tượng phương sai sai số thay đổi và có dạng hàm đúng nên ta có thể khắc phục hậu quả bằng cách áp dụng phương pháp ước lượng sai số chuẩn vững và thu được kết quả sau:

SRM: eTNCT 11 232,0383,7

(Se) (4,403) (0,071)

So với kết quả trình bày trong ví dụ 1, ta thấy các ước lượng OLS không thay đổi nhưng các sai số chuẩn (Se) của nó đã thay đổi và đây là ước lượng vững, đáng tin cậy.

6.4. Sai số ngẫu nhiên không tuân theo tuy luật chuẩn

Bài toán xây dựng khoảng tin cậy, bài toán kiểm định giả thuyết thống kê về các hệ số hồi quy cũng như bài toán dự báo giá trị của biến phụ thuộc trình bày trong Bài 4 được dựa trên giả thiết về phân phối chuẩn của sai số ngẫu nhiên. Tuy nhiên giả thiết này trong nhiều trường hợp là không thỏa mãn.

Chúng ta biết rằng để biến ngẫu nhiên Y nào đó tuân theo quy luật chuẩn hoặc xấp xỉ chuẩn thì hàm mật độ của nó phải đối xứng. Tuy nhiên các biến số như mức lương của người lao động thường là không đối xứng do hàm mật độ của nó bị cắt cụt ở phía trái bởi mức lương tối thiểu và có đuôi dài về phía phải, như trong hình 6.3 dưới đây:

Page 20: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 137

0

4

8

12

16

20

10 20 30 40 50 60 70

Hình 6.3: Phân phối mẫu của mức lương

Hình 6.3 cho thấy khó có thể cho rằng phân phối của biến mức lương là chuẩn hoặc xấp xỉ chuẩn.

Tương tự, điểm thi môn học của sinh viên bị chặn trên bởi 10 và chặn dưới bởi 0, nhưng khó có thể nói phân phối của biến này là đối xứng qua điểm 5, vì như vậy có nghĩa là 50% sinh viên sẽ trượt môn học. Dưới đây là phân phối mẫu của điểm thi môn Kinh tế lượng của sinh viên ngành Ngân hàng trường Kinh tế quốc dân với kích thước mẫu bằng 80.

0

4

8

12

16

20

0 2 4 6 8 10

%

Hình 6.4: Phân phối mẫu của điểm thi môn Kinh tế lượng

Hình 6.3 và 6.4 thể hiện hai phân phối với độ bất đối xứng khá cao, không phân phối chuẩn.

6.4.1. Hậu quả khi sai số ngẫu nhiên không tuân theo quy luật chuẩn

Định lý Gauss- Markov trong Bài 3 khẳng định rằng để ước lượng OLS là ước lượng tốt nhất trong lớp các ước lượng tuyến tính không chệch thì không cần đến giả thiết về phân phối chuẩn của sai số ngẫu nhiên. Tuy nhiên để thực hiện các suy diễn thống kê như trong Bài 4 ta cần đến giả thiết này.

Page 21: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

138 TXT0KT04_Bài6_v1.0015108207

Khi sai số ngẫu nhiên không tuân theo quy luật chuẩn thì các ước lượng ˆj sẽ không

tuân theo quy luật chuẩn và do đó các thống kê t sẽ không tuân theo quy luật Student, thống kê F sẽ không tuân theo quy luật Fisher. Vậy khi đó các suy diễn thống kê về các hệ số còn có đáng tin cậy hay không?

Khi đó nếu kích thước mẫu là nhỏ thì các suy diễn thống kê là không đáng tin cậy.

Tuy nhiên với mẫu kích thước lớn thì các suy diễn thống kê vẫn có giá trị.

6.4.2. Phát hiện khi sai số ngẫu nhiên không tuân theo quy luật chuẩn

Để phát hiện xem có dấu hiệu cho rằng sai số ngẫu nhiên không tuân theo quy luật chuẩn, chúng ta có thể sử dụng thông tin từ phần dư, thông qua một số phương pháp sau đây:

Xem xét đồ thị phần dư

Xem xét đồ thị tần suất (historgram plot) của phần dư có thể giúp chúng ta có ý tưởng về hình dạng của phân phối xác suất. Nếu phân phối quá lệch về bên phải hoặc bên trái, quá nhọn hoặc quá dẹt, thì đấy là các dấu hiệu cho rằng sai số ngẫu nhiên của mô hình là không tuân theo quy luật chuẩn

Kiểm định Jacque – Bera (JB)

Kiểm định JB được đề xuất bởi Jacque và Bera (1987). Ý tưởng của kiểm định Jacque – Bera là như sau:

Ta biết rằng biến ngẫu nhiên phân phối chuẩn sẽ có độ bất đối xứng bằng 0 và độ nhọn bằng 3. Do đó nếu một biến ngẫu nhiên nào đó có độ bất đối xứng quá khác 0 hoặc độ nhọn quá khác 3 thì đấy là dấu hiệu cho rằng biến đó không tuân theo quy luật chuẩn.

Do đó kiểm định Jacque – Bera được thực hiện như sau:

Cho cặp giả thuyết:

H0: u tuân theo phân phối chuẩn.

H1: u không tuân theo phân phối chuẩn.

Bước 1: Ước lượng mô hình hồi quy gốc, thu được các phần dư ei.

Bước 2: Tính giá trị quan sát của thống kê kiểm định: 2 2( 3)

( )( )6 24

S KJB n k

Trong đó S là độ bất đối xứng (Skewness), K là độ nhọn (Kurtosis) của phần dư, n là kích thước mẫu, k là số hệ số có trong mô hình.

Bước 3: Kết luận: Nếu 2 (2)JB thì bác bỏ giả thuyết H0 và thừa nhận giả thuyết

H1. Ngược lại, nếu 2 (2)JB thì chưa có cơ sở bác bỏ giả thuyết H0. Đồng thời, ta

cũng có thể sử dụng giá trị xác suất để kết luận.

Ví dụ 1: Xét mô hình (VD2): Q = β1 + β2P + β3PC+ u. Ta có kết quả ước lượng:

Page 22: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 139

0

1

2

3

4

5

6

7

8

-6 -4 -2 0 2 4

Series: ResidualsSample 1 52Observations 52

Mean -1.86E-14Median 0.163952Maximum 5.201459Minimum -5.840955Std. Dev. 2.344561Skewness -0.269058Kurtosis 3.032343

Jarque-Bera 0.629666Probability 0.729911

Với mức ý nghĩa 5% hãy cho biết sai số ngẫu nhiên trong mô hình này có phân phối chuẩn hay không?

Lời giải:

Cách 1:

Để trả lời câu hỏi này ta cần kiểm định cặp giả thuyết sau:

H0: u tuân theo phân phối chuẩn.

H1: u không tuân theo phân phối chuẩn.

Theo kết quả ước lượng ta có: JBqs = Jarque – Bera = 0,629666 mà 20,05 (2) 5,11 , tức

là JBqs < 20,05 (2) nên chưa có cơ sở bác bỏ H0.

Kết luận: Mô hình (VD2) có sai số ngẫu nhiên tuân theo quy luật phân phối chuẩn.

Cách 2:

Để trả lời câu hỏi này ta cần kiểm định cặp giả thuyết sau:

H0: u tuân theo phân phối chuẩn.

H1: u không tuân theo phân phối chuẩn.

Kết quả ước lượng ta có: Prob (JB) = 0,729911 (giá trị Probability ở dòng cuối cùng trong kết quả ước lượng).

Mà    = 5% nên Prob > suy ra chưa có cơ sở bác bỏ H0.

Kết luận: Mô hình (VD2) có sai số ngẫu nhiên tuân theo quy luật phân phối chuẩn.

Ví dụ 2: Xét tình huống dẫn nhập, ta có bộ số liệu của 66 hộ gia đình có chi tiêu năm 2012 trên 200 triệu. Bộ số liệu rút ra từ cuộc điều tra VHLSS 2012. Mô hình ban đầu được quan sát là: 121 uTNCT Thực hiện kiểm định Jarque – Bera cho mô hình này ta thu được kết quả sau:

Page 23: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

140 TXT0KT04_Bài6_v1.0015108207

0

1

2

3

4

5

6

7

8

9

-40 -20 0 20 40

Series: ResidualsSample 1 66Observations 66

Mean -2.56E-14Median 5.177662Maximum 50.00322Minimum -52.27110Std. Dev. 25.50103Skewness -0.368375Kurtosis 2.402245

Jarque-Bera 2.475304Probability 0.290065

Với mức ý nghĩa 5% hãy cho biết sai số ngẫu nhiên trong mô hình này có phân phối chuẩn hay không?

Lời giải:

Để trả lời câu hỏi này ta cần kiểm định cặp giả thuyết sau:

H0: u tuân theo phân phối chuẩn.

H1: u không tuân theo phân phối chuẩn.

Kết quả ước lượng ta có: Prob (JB) = 0,290065

Mà = 5% nên Prob > suy ra chưa có cơ sở bác bỏ H0.

Kết luận: Mô hình có sai số ngẫu nhiên tuân theo quy luật phân phối chuẩn.

Page 24: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

TXT0KT04_Bài6_v1.0015108207 141

Tóm lược cuối bài Tiêu chí đánh giá mô hình thích hợp cho phân tích thực nghiệm:

Độ chính xác của số liệu;

Độ vững về lý thuyết;

Dạng hàm định dạng đúng;

Tính bao quát.

Kỳ vọng sai số ngẫu nhiên khác không

Hiện tượng kỳ vọng sai số ngẫu nhiên khác không là sai số ngâu nhiên, tại một giá trị nào đó của biến giải thích, có kỳ vọng khác không.

Nguyên nhân chính dẫn tới hiện tượng kỳ vọng sai số ngẫu nhiên khác không là mô hình bị bỏ sót biến hoặc có dạng hàm xác định sai.

Phát hiện: kiểm định ý nghĩa thống kê của hệ số tương ứng với biến bị thiếu, kiểm định RAMSEY.

Phương pháp khắc phục: thêm thông tin của các biến số mới hoặc đổi dạng hàm của mô hình hồi quy.

Phương sai sai số thay đổi

Phương sai sai số thay đổi là hiện tượng phương sai của sai số ngẫu nhiên nhận các giá trị

khác nhau tại các bộ giá trị (X2i ,, Xki) khác nhau.

Nguyên nhân chủ yếu dẫn đến hiện tượng phương sai sai số thay đổi là do bản chất của số liệu và do mô hình thiếu biến quan trọng hoặc dạng hàm sai.

Hậu quả của hiện tượng phương sai sai số thay đổi là các ước lượng OLS vẫn là ước lượng không chệch nhưng không còn là ước lượng tốt nhất, phương sai của hệ số ước lượng là chệch dẫn đến khoảng tin cậy và kiểm định giả thuyết về các hệ số không còn giá trị sử dụng.

Phát hiện: sử dụng đồ thị phần dư, kiểm định Breusch – Pagan, kiểm định White.

Khắc phục: phương pháp GLS hoặc phương pháp ước lượng sai số chuẩn vững.

Sai số chuẩn không tuân theo quy luật chuẩn

Các biến số trong kinh tế có thể có phân phối lệch đuôi, quá nhọn hoặc quá bẹt nên không phân phối chuẩn. Khi biến phụ thuộc không phân phối chuẩn sẽ dẫn đến sai số ngẫu nhiên không phân phối chuẩn.

Khi xảy ra hiện tượng này, các ước lượng OLS vẫn là các ước lượng tuyến tính không chệch và tốt nhất. Tuy nhiên các suy diễn thống kê về các hệ số không còn đáng tin cậy khi có ít quan sát trong mẫu.

Để kiểm định sai số chuẩn có tuân theo quy luật chuẩn hay không ta có thể vẽ đồ thị tần suất của phần dư hoặc thực hiện kiểm định Jarque – Bera.

Page 25: BÀI 6 ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bài 6: Đánh giá các khuyết tật

142 TXT0KT04_Bài6_v1.0015108207

Câu hỏi ôn tập 1. Nêu rõ các tiêu chí đánh giá một mô hình thích hợp cho phân tích thực nghiệm.

2. Thế nào là hiện tượng kỳ vọng sai số ngẫu nhiên khác không?

3. Nêu 2 nguyên nhân chính gây ra hiện tượng kỳ vọng sai số ngẫu nhiên khác không.

4. Trình bày các bước kiểm định RAMSEY phát hiện hiện tượng kỳ vọng sai số ngẫu nhiên khác không.

5. Thế nào là hiện tượng phương sai sai số thay đổi? Nguyên nhân nào dẫn đến hiện tượng này?

6. Hậu quả của phương sai sai số thay đổi? Một mô hình có phương sai sai số thay đổi có nên sử dụng trong phân tích không? Tại sao?

7. Nêu các bước thực hiện kiểm định Breusch – Pagan? Áp dụng cho một mô hình cụ thể bất kỳ?

8. Nêu các bước thực hiện kiểm định White? Áp dụng cho một mô hình cụ thể bất kỳ?

9. Nêu cách khắc phục hiện tượng phương sai sai số thay đổi trong mô hình?

10. Sai số ngẫu nhiên không phân phối chuẩn là gì? Hậu quả và cách phát hiện?