Kinh tế lượng - Chương 6: Đa cộng tuyến

ppt 19 trang vanle 4280
Bạn đang xem tài liệu "Kinh tế lượng - Chương 6: Đa cộng tuyến", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptkinh_te_luong_chuong_6_da_cong_tuyen.ppt

Nội dung text: Kinh tế lượng - Chương 6: Đa cộng tuyến

  1. KINH TẾ LƯỢNG Econometrics Chương 6 ĐA CỘNG TUYẾN 1
  2. 6.1 Bản chất của đa cộng tuyến1 Khi lập mô hình hồi quy bội ˆ ˆ ˆ ˆ ˆ Yi = 1 + 2 X 2i + 3 X3i + + k X ki (k≥3) Nếu tồn tại ít nhất một mối quan hệ cộng tuyến giữa các biến độc lập thì mô hình có hiện tượng đa cộng tuyến. a. Đa cộng tuyến hoàn hảo Tồn tại ít nhất một hệ số j≠0 (j=2÷k) sao cho 1+ 2X2i + + kXki = 0 (Một biến giải thích nào đó là hàm tuyến tính của các biến còn lại). (1) Damodar N. Gujarati P.341 2
  3. b. Đa cộng tuyến không hoàn hảo Là khi các biến độc lập có quan hệ gần tuyến tính với nhau, hay: j 0 ( j = 2  k) sao cho 1+ 2X2i + + kXki + Vi = 0 Vi: sai số ngẫu nhiên 3
  4. H ình 6.1 Y Y X2 X2 X3 X3 Không có đa cộng tuyến Đa cộng tuyến thấp Y Y X2 X3 X3 X2 Đa cộng tuyến vừa Đa cộng tuyến cao 4
  5. 6.2 Ước lượng các tham số khi có đa cộng tuyến * Đa cộng tuyến hoàn hảo: y x x2 − y x x x ˆ  i 2i  3i  i 3i  2i 3i 2 = 2 2 2  x2i  x3i − ( x2i x3i ) Nếu X2i = X3i => x2i = x3i,, với λ ≠ 0  y x x2 −  y x x x => ˆ  i 3i  3i  i 3i  3i 3i 0 2 = 2 2 2 2 2 2 =   x3i  x3i −   x3i  x3i 0 ˆ ˆ => không xác định được 2,3 5
  6. * Đa cộng tuyến không hoàn hảo: Xét mô hình hồi quy 3 biến với: x3i = λx2i + Vi Với λ ≠ 0 và Vi là sai số ngẫu nhiên. Do đó: x2iVi = 0 2 2 2 2 i 2i i 2i i i ( y x )(  2i +  i )− ( y x +  y V )( 2i ) ˆ 2  x V x  = 2 2 2 2 + 2 − 2 2 (x2i )( x2i Vi ) (  x2i ) Tính tương tự với ˆ 3 6
  7. Một số nguyên nhân gây ra hiện tượng đa cộng tuyến - Khi chọn các biến độc lập có quan hệ nhân quả hay có tương quan cao vì đồng phụ thuộc vào một điều kiện khác. - Khi số quan sát nhỏ hơn số biến độc lập. - Cách thu thập mẫu. - Chọn biến Xi có độ biến thiên nhỏ. 7
  8. 6.3 Hậu quả của đa cộng tuyến - Ước lượng các hệ số không hiệu quả do phương sai của ước lượng lớn. - Khoảng tin cậy của các ước lượng rộng - Tỷ số ti không có ý nghĩa - R2 lớn nhưng t nhỏ - Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy với những thay đổi nhỏ của dữ liệu - Dấu các ước lượng của các hệ số hồi quy có thể sai - Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về dấu hoặc thay đổi về độ lớn của các ước lượng. 8
  9. Ta có: 2 var(ˆ 2) =  2 (1− 2)  x2i r 23 2 ˆ 3  var( ) = 2 x3i(1− )  r 23 2 − r 23 cov(ˆ 2, ˆ 3) =  (1− 2) 2 2 r 23  x2i  x3i ˆ ˆ Khi r23 tiến đến 1 thì phương sai của:  2,  3 tăng đến vô hạn; ˆ ˆ cov( 2,  3) cũng tăng về giá trị tuyệt đối. 9
  10. 6.4 Cách phát hiện đa cộng tuyến * R2 lớn nhưng tỷ số t nhỏ * Tương quan cặp giữa các biến giải thích cao (X − X )(Z − Z ) r =  i i XZ 2 2 (X i − X ) (Zi − Z ) Trong đó X, Z là 2 biến giải thích trong mô hình rXZ > 0,8 mà t thấp: Có thể xảy ra hiện tượng đa cộng tuyến 10
  11. Tuy nhiên, có thể không chính xác. Ví dụ: X1 = (1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0, 0,0,0,0,0) X2 = (0,0,0,0,0, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0) X3 = (1,1,1,1,1, 1,1,1,1,1, 0,0,0,0,0, 0,0,0,0,0) X3 = X1 + X2, tức có cộng tuyến hoàn hảo nhưng tương quan cặp giữa các biến không cao: r12 = 0,3333 r13 = r23 = 0,5774 11
  12. * Sử dụng mô hình hồi quy phụ ˆ ˆ ˆ ˆ X 2i = 1 + 3 X3i + + k X ki 2 H0: R = 0 R2 (n − k) F = (1− R2 )(k −1) Nếu F > F (k-1, n-k): bác bỏ H0 => có đa cộng tuyến Nếu F ≤ F (k-1, n-k): chấp nhận H0 => không có đa cộng tuyến 12
  13. * Sử dụng nhân tử phóng đại phương sai (Variance – inflation factor - VIF) Đối với hàm hồi quy 2 biến giải thích, VIF được định nghĩa như sau: 1 VIF = 2 (1− r23) Đối với trường hợp tổng quát, có (k-1) biến giải thích thì: 1 VIF = 2 (1− Rj ) 2 2 R j: là giá trị R trong hàm hồi quy của Xj theo (k-2) biến giải thích còn lại. 2 Thông thường khi VIF của 1 biến > 10 (R j > 0,9), thì biến này được coi là có cộng tuyến cao. 13
  14. Ta có: 2 2 var(ˆ 2) =  =  VIF 2 (1− 2) 2 x2i r 23  x2i 2 2 ˆ 3   var( ) = 2 = 2 VIF x3i(1− )  r 23 x3i 14
  15. B ảng 6.1 Giá trị của r VIF 23 Var(ˆ 2) Cov(ˆ 2, ˆ 3) 0,00 1,00 1A 0 0,50 1,33 1,33A 0,67B 0,70 1,96 1,96A 1,37B 0,80 2,78 2,78A 2,22B 0,90 5,76 5,76A 4,73B 0,95 10,26 10,26A 9,74B 0,97 16,92 16,92A 16,41B 0,99 50,25 50,25 49,57B 0,995 100,00 100A 99,5B 0,999 500,00 500A 499,5B 2 − 2  B =  A = 2 2 2 x2i x2i x3i 15
  16. H ình 6.2 Khi r23 tăng từ 0,9 đến 1 thì VIF tăng rất nhanh. Khi r VIF 23 = 1 thì VIF là vô hạn. 100 50 10 1 0 r 0,9 1 23 16
  17. 6.5 Biện pháp khắc phục 6.5.1 Dùng thông tin tiên nghiệm Ví dụ khi hồi quy mô hình sản xuất Cobb-Douglas 2 3 ui Yi =  0Ki Li e Ln(Yi)=1 + 2ln(Ki)+ 3ln(Li) + ui Có thể gặp hiện tượng đa cộng tuyến do K và L cùng tăng theo quy mô sản xuất. Nếu ta biết là hiệu suất không đổi theo quy mô tức là 2+3=1. Ln(Yi)=1 + 2ln(Ki)+ (1-2)ln(Li) + ui Ln(Yi) – Ln(Li) = 1 + 2[ln(Ki) - ln(Li)] + ui Ln(Yi/Li) = 1 + 2ln(Ki/Li) + ui => mất đa cộng tuyến (vì đây là mô hình hồi quy đơn). 17
  18. 6.5.2 Loại trừ một biến giải thích ra khỏi mô hình B1: Xem cặp biến giải thích nào có quan hệ chặt chẽ B2: Tính R2 đối với các hàm hồi quy: có mặt cả 2 biến; không có mặt một trong 2 biến B3: Loại biến mà giá trị R2 tính được khi không có mặt biến đó là lớn hơn. 6.5.3 Bổ sung thêm dữ liệu hoặc chọn mẫu mới 6.5.4 Dùng sai phân cấp 1 (Phương pháp này chỉ áp dụng cho chuỗi thời gian) 18
  19. Giả sử có số liệu chuỗi thời gian biểu thị mối liên hệ giữa biến Y và các biến giải thích X2 và X3 theo mô hình sau: Yt = β1 + β2X2t + β3X3t + Ut t là thời gian. => Yt-1 = β1 + β2X2t-1 + β3X3t-1 + Ut-1 Đặt: yt = Yt – Yt-1 x2t = X2t – X2t-1 x3t = X3t – X3t-1 Vt = Ut – Ut-1, ta được yt = β2x2t + β3x3t + Vt Mô hình làm giảm tính nghiêm trọng của đa cộng tuyến 19