Quản trị kinh doanh - Chương 6: Hiện tượng đa cộng tuyến (multicollinearity)

ppt 24 trang vanle 2260
Bạn đang xem 20 trang mẫu của tài liệu "Quản trị kinh doanh - Chương 6: Hiện tượng đa cộng tuyến (multicollinearity)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptquan_tri_kinh_doanh_chuong_6_hien_tuong_da_cong_tuyen_multic.ppt

Nội dung text: Quản trị kinh doanh - Chương 6: Hiện tượng đa cộng tuyến (multicollinearity)

  1. CHƯƠNG 6 HIỆN TƯỢNG ĐA CỘNG TUYẾN (MULTICOLLINEARITY)
  2. BIẾN GIẢ 1. Hiểu bản chất và hậu quả của đa cộng tuyến MỤC TIÊU 2. Biết cách phát hiện đa cộng tuyến và biện pháp khắc phục 2
  3. NỘI DUNG 1 Bản chất, nguyên nhân của đa cộng tuyến 2 Ước lượng các tham số 3 Hậu quả 4 Phát hiện đa cộng tuyến 5 Khắc phục đa cộng tuyến 3
  4. 6.1 Bản chất của đa cộng tuyến Đa cộng tuyến Trong mô hình hồi quy bội ˆ ˆ ˆ ˆ ˆ Yi = 1 + 2 X 2i + 3 X3i + + k X ki Có sự phụ thuộc tuyến tính cao giữa các biến giải thích 4
  5. 6.1 Bản chất của đa cộng tuyến a. Đa cộng tuyến hoàn hảo Tồn tại 2, 3, k không đồng thời bằng 0 sao cho 2X2 + 3X3 + + kXk = 0 b. Đa cộng tuyến không hoàn hảo 2X2 + 3X3 + + kXk + vi= 0 với vi là sai số ngẫu nhiên. 5
  6. 6.1 Bản chất của đa cộng tuyến VD X2 10 15 18 24 30 X3 50 75 90 120 150 X4 52 75 97 129 152 V 2 0 7 9 2 X3i = 5X2i, có cộng tuyến hoàn hảo giữa X2 và X3 ; r23 = 1 X2 và X4 có cộng tuyến không hoàn hảo 6
  7. 6.1 Bản chất của đa cộng tuyến Không có đa cộng tuyến Đa cộng tuyến thấp Y Y X3 X3 X2 X2 Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến 7
  8. 6.1 Bản chất của đa cộng tuyến Đa cộng tuyến cao Đa cộng tuyến hoàn hảo Y Y X3 X2 X2 X3 Hình 6.1 Biểu đồ Venn mô tả hiện tượng đa cộng tuyến 8
  9. 6.1 Nguyên nhân của đa cộng tuyến - Chọn các biến độc lập có mối quan có quan hệ nhân quả hay có tương quan cao vì đồng phụ thuộc vào một điều kiện khác. - Số quan sát nhỏ hơn số biến độc lập. - Cách thu thập mẫu: mẫu không đặc trưng cho tổng thể - Chọn biến Xi có độ biến thiên nhỏ. 9
  10. 6.2 Ước lượng khi có đa cộng tuyến 1. Trường hợp có đa cộng tuyến hoàn hảo Xét mô hình hồi qui 3 biến dưới dạng sau: Yi = 2 X2i + 3 X3i + ei giả sử X3i = X2i, mô hình được biến đổi thành: Yi = (2+ 3)X2i + ei = 0 X2i + ei Phương pháp OLS x y ˆ ˆ ˆ  2i i o = (2 + 3 ) = 2  x2i ˆ ˆ ❑ Không thể tìm được lời giải duy nhất cho 2,3 10
  11. 6.2 Ước lượng khi có đa cộng tuyến y x x2 − y x x x ˆ  i 2i  3i  i 3i  2i 3i 2 = 2 2 2  x2i  x3i − ( x2i x3i )  y x x2 −  y x x x ˆ  i 3i  3i  i 3i  3i 3i 0 2 = 2 2 2 2 2 2 =   x3i  x3i −   x3i  x3i 0 ❑ Các hệ số ước lượng không xác định ❑ Phương sai và sai số chuẩn của 2 và 3 là vô hạn 11
  12. 6.2 Ước lượng khi có đa cộng tuyến 2. Trường hợp có đa cộng tuyến không hoàn hảo ❖ Đa cộng tuyến hoàn hảo thường không xảy ra trong thực tế. ❖ Xét mô hình hồi qui 3 biến dưới dạng sau: yi = 2 x2i + 3 x3i + ei Giả sử x3i =  x2i + vi Với  0 và vi là sai số ngẫu nhiên 12
  13. 6.2 Ước lượng khi có đa cộng tuyến ( y x )(2 x2 + v2 )− (2 y x + y v )( x2 ) ˆ =  i 2i  2i  i  i 2i  i i  2i 2 2 2 2 2 2 2 2 ( x2i )(  x2i + vi )− (  x2i ) ❑ Có thể ước lượng được các hệ số hồi quy nhưng sai số chuẩn rất lớn. 13
  14. 6.3 Hậu quả của đa cộng tuyến Nếu có cộng tuyến gần hoàn hảo 1. Phương sai và hiệp phương sai của các ước lượng OLS lớn. 2. Khoảng tin cậy rộng hơn. 3. Tỉ số t "không có ý nghĩa" 4. R2 cao nhưng tỉ số t ít có ý nghĩa 14
  15. 6.3 Hậu quả của đa cộng tuyến 5. Các ước lượng OLS và sai số chuẩn của chúng trở nên rất nhạy với những thay đổi nhỏ trong dữ liệu. 6. Dấu của các ước lượng của các hệ số hồi qui có thể sai 7. Thêm vào hay bớt đi các biến cộng tuyến với các biến khác, mô hình sẽ thay đổi về dấu hoặc thay đổi về độ lớn của các ước lượng. 15
  16. 6.3 Hậu quả của đa cộng tuyến Đa cộng tuyến là một hiện tượng theo mẫu, nghĩa là cho dù các biến độc lập Xi không tương quan tuyến tính trong tổng thể nhưng chúng có thể tương quan tuyến tính trong một mẫu cụ thể nào đó. Do đó cỡ mẫu lớn thì hiện tượng đa cộng tuyến ít nghiêm trọng hơn cỡ mẫu nhỏ 16
  17. 6.4 Cách phát hiện đa cộng tuyến 1. Hệ số R2 lớn nhưng tỷ số t nhỏ 2. Tương quan cặp giữa các biến giải thích cao 3. Sử dụng mô hình hồi qui phụ 4. Sử dụng yếu tố phóng đại phương sai (VIF) 17
  18. 6.4 Cách phát hiện đa cộng tuyến 1. R2 lớn nhưng tỷ số t nhỏ 2. Tương quan cặp giữa các biến giải thích cao (X − X )(Z − Z ) r =  i i XZ 2 2 (X i − X ) (Zi − Z ) Trong đó X, Z là 2 biến giải thích trong mô hình 18
  19. 6.4 Cách phát hiện đa cộng tuyến 3. Sử dụng mô hình hồi quy phụ Hồi qui một biến giải thích X theo các biến còn lại ˆ ˆ ˆ ˆ X 2i = 1 + 3 X3i + + k X mi Tính R2 và F cho mỗi mô hình R2 (n − m) F = (1− R2 )(m −1) 2 Lập giả thiết H0: R = 0 ~ H0: không có đa cộng tuyến Nếu F > F (m-1,n-k): bác bỏ H0 hay có đa cộng tuyến Nếu F < F (m-1,n-k): chấp nhận H0 hay không có đa cộng tuyến 19
  20. 6.4 Cách phát hiện đa cộng tuyến 4. Sử dụng nhân tử phóng đại phương sai (VIF) Đối với hàm hồi quy 2 biến giải thích 1 VIF = 2 (1− r23) Đối với trường hợp tổng quát, có (k-1) biến giải thích 1 VIF = 2 (1− Rj ) 2 2 ❖R j: là giá trị R trong hàm hồi quy của Xj theo (k-2) biến giải thích còn lại. ❖Thông thường khi VIF > 10, thì biến này được coi là có cộng tuyến cao 20
  21. 6.5 Cách khắc phục 1. Dùng thông tin tiên nghiệm Ví dụ mô hình sản xuất Cobb-Douglas Ln(Yi)=1 + 2ln(Ki)+ 3ln(Li) + ui Có thể xảy ra đa cộng tuyến do K và L cùng tăng theo quy mô sản xuất. Nếu biết hiệu suất không đổi theo quy mô tức là 2+3=1 thì Ln(Yi)=1 + 2ln(Ki)+ (1-2)ln(Li) + ui Ln(Yi) – Ln(Li) = 1 + 2[ln(Ki) - ln(Li)] + ui Ln(Yi /Li ) = 1 + 2ln(Ki /Li) + ui => mất đa cộng tuyến (vì đây là mô hình hồi quy đơn) 21
  22. 6.5 Cách khắc phục 2. Loại trừ một biến giải thích ra khỏi mô hình B1: Xem cặp biến giải thích nào có quan hệ chặt chẽ. Giả sử X2, X3 Xk là các biến độc lập, Y là biến phụ thuộc và X2, X3 có tương quan chặt chẽ với nhau. B2: Tính R2 đối với các hàm hồi quy: có mặt cả 2 biến; không có mặt một trong 2 biến B3: Loại biến mà giá trị R2 tính được khi không có mặt biến đó là lớn hơn. 22
  23. 6.5 Cách khắc phục 3. Bổ sung thêm dữ liệu hoặc chọn mẫu mới 2 ˆ  var(2 ) = 2 2  x2i (1− r23) 23
  24. 6.5 Cách khắc phục 4. Dùng sai phân cấp 1 Có hàm hồi qui: yt = 1 + 1x1t + 2x2t + ut suy ra yt-1 = 1 + 1x1,t-1 + 2x2,t-1 + ut-1 Trừ hai vế cho nhau, được: yt – yt – 1 = 1(x1,t – x1,t – 1) + 2(x2,t – x2,t – 1) + (ut – ut – 1) Hay: yt = 1 x1,t + 2 x2,t + et, 24