Kinh tế phát triển - Chương 6: Kiểm định mô hình

34 trang vanle 4310

Download

Bạn đang xem 20 trang mẫu của tài liệu "Kinh tế phát triển - Chương 6: Kiểm định mô hình", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

kinh_te_phat_trien_chuong_6_kiem_dinh_mo_hinh.pdf

Nội dung text: Kinh tế phát triển - Chương 6: Kiểm định mô hình

Chương 6: KIỂM ĐỊNH MÔ HÌNH Th.S NGUYỄN PHƯƠNG Bộ môn Toán kinh tế Trường Đại học Ngân hàng TPHCM Blog: Email: [email protected] Ngày 11 tháng 10 năm 2015 1
NỘI DUNG 1 Kỳ vọng của sai số ngẫu nhiên khác không Nguyên nhân Hậu quả của kỳ vọng sai số ngẫu nhiên khác không Phát hiện về sự khác không của kỳ vọng sai số ngẫu nhiên Một số biện pháp khắc phục 2 Phương sai sai số thay đổi (Heteroscedasticity) Nguyên nhân Hậu quả của phương sai sai số thay đổi Phát hiện phương sai sai số thay đổi Khắc phục hiện tượng phương sai sai số thay đổi 3 Đa cộng tuyến (Multicollinearity) Bản chất đa cộng tuyến Nguyên nhân và hậu quả Cách phát hiện đa cộng tuyến cao Khắc phục hiện tượng đa cộng tuyến 4 Sai số ngẫu nhiên không tuân theo quy luật chuẩn 2
Kỳ vọng của sai số ngẫu nhiên khác không Nguyên nhân Giả thiết 2 của mô hình hồi quy tuyến tính là E(u X2, , Xk) = 0. | Nếu giả thiết này thỏa mãn thì: i)E (u) = 0 ii) cov(Xj, u) = 0, j = 2, , k. ∀ Nguyên nhân ® Mô hình "thiếu biến quan trọng" (omit variable). Mô hình được cho là thiếu biến quan trọng Z nếu: Biến Z có tác động đến biến phụ thuộc Y. Biến Z có tương quan với Xj, j = 2, 3, , k Khi đó cov(Xj, u) , 0. ® Dạng hàm sai (functional form misspecification) ® Tính tác động đồng thời của số liệu ® Sai số đo lường của các biến độc lập. 3
Kỳ vọng của sai số ngẫu nhiên khác không Hậu quả của kỳ vọng sai số ngẫu nhiên khác không Hậu quả của kỳ vọng sai số ngẫu nhiên khác không ˆ ® Ước lượng OLS sẽ là ước lượng chệch, tức là E(βj) , βj. ® Nếu mô hình thiếu biến quan trọng Z thì UL OLS không vững. ® Các suy diễn thống kê không còn đáng tin cậy 4
Kỳ vọng của sai số ngẫu nhiên khác không Phát hiện về sự khác không của kỳ vọng sai số ngẫu nhiên Nếu mô hình bỏ sót biến quan trọng: Giả sử muốn biết mô hình Y = β1 + β2X2 + + βkXk + u có bỏ sót "biến quan trọng Z" hay không ta hồi quy mô hình Y = β1 + β2X2 + + βkXk + αk+1Z + u. Sau đó kiểm định cặp giả thuyết: H0 : αk+1 = 0; H1 : αk+1 , 0. Nếu bác bỏ H0 thì chấp nhận biến Z có tác động đến Y và mô hình đã thiếu "biến quan trọng Z". Nếu mô hình có dạng hàm sai - Sử dụng Kiểm định Ramsey (mô hình có thiếu các biến dạng hàm mũ của các biến độc lập có sẵn trong mô hình?, kiểm định sự khác biệt của hai mô hình lồng nhau) - Sử dụng Kiểm định Davidson-MacKinnon (Kiểm định J) - Sử dụng Kiểm định hàm gộp Mizon-Richard 5
Kỳ vọng của sai số ngẫu nhiên khác không Phát hiện về sự khác không của kỳ vọng sai số ngẫu nhiên Ví dụ 1.1 Sử dụng bộ số liệu ch5vd3.wf1 thu được kết quả ước lượng sau: CT = 42, 73 + 0, 85TN + e Để kiểm định xem mô hình có khuyến tật bỏ sót biến TS hay không, ta thực hiện kiểm định. Hình: Kiểm định thiếu biến 6
Kỳ vọng của sai số ngẫu nhiên khác không Phát hiện về sự khác không của kỳ vọng sai số ngẫu nhiên Ví dụ 1.2 Trong ví dụ trước, ta thấy mô hình bỏ sót biến tài sản (TS). Khi thêm biến TS vào mô hình: CT = β1 + β2TN + β3TS + u Câu hỏi: có vấn đề về dạng hàm sai hay không? Hình: Kiểm định Ramsey RESET 7
Kỳ vọng của sai số ngẫu nhiên khác không Một số biện pháp khắc phục Một số biện pháp khắc phục khi mô hình có kỳ vọng của sai số ngẫu nhiên khác 0 Nếu mô hình thiếu biến quan trọng Z (đã biết) được phát hiện từ kiểm định t thì ta thêm biến Z vào mô hình. Nếu mô hình có dạng hàm sai được phát hiện từ kiểm định Ramsey thì xét các mô hình thay thế. Nếu mô hình thiếu biến không quan sát được thì có thể sử dụng hai phương pháp: - Sử dụng biến đại diện (proxy varable) - Sử dụng biến công cụ (instrumental variable) 8
Phương sai sai số thay đổi (Heteroscedasticity) Xét mô hình hồi quy: Y = β1 + β2X2 + + βkXk + u. Định lý Gause-Markov khẳng định rằng để ước lượng OLS là tốt nhất thì phương sai sai số trong mô hình hồi quy phải bằng nhau tại mọi quan sát. Khi giả thiết này không thỏa mãn thì mô hình có hiện tượng phương sai sai số thay đổi, tức là: 2 var(uj X2i, X3i, , Xki) = σ , i = 1, 2, , n; | i nghĩa là tại các bộ giá trị (X2i, X3i, , Xki) khác nhau thì phương sai của sai số 2 ngẫu nhiên ui nhận các giá trị khác nhau, kí hiệu là σ . 9
Phương sai sai số thay đổi (Heteroscedasticity) Nguyên nhân Nguyên nhân ® Do bản chất của các hiện tượng kinh tế Số liệu theo không gian có quy mô khác nhau quan sát các doanh nghiệp có quy mô quá lớn - quá nhỏ −→ Số liệu theo thời gian qua các giai đoạn có mức biến động khác nhau giai đoạn kinh tế ổn định - giai đoạn khủng hoảng Mối−→ quan hệ sẵn có hiện tượng PSSS thay đổi mối quan hệ của thu nhập – chi tiêu, chỉ số thị trường chứng khoán−→ ® Do số liệu không phản ảnh đúng bản chất của hiện tượng kinh tế ® Do kỹ thuật thu thập, xử lý dữ liệu ngày càng được hoàn thiện nên sai số ngày càng ít ® Do hành vi của con người có sự tiếp thu từ quá khứ ® Do định dạng không đúng dạng hàm của mô hình 10
Phương sai sai số thay đổi (Heteroscedasticity) Hậu quả của phương sai sai số thay đổi Hậu quả của phương sai sai số thay đổi Các ước lượng vẫn ước lượng tuyến tính không chệch tức là E(βˆj) = βj nhưng không tốt nhất, vì các ước lượng này không hiệu quả. Phương sai của các hệ số ước lượng là chệch Khoảng tin cậy và kiểm định giả thuyết về các hệ số không còn giá trị sử dụng do var(βˆj) bị chệch. 11
Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi Dựa vào bản chất của vấn đề nghiên cứu. Trong thực tế thường thì số liệu chéo liên quan đến những đơn vị không thuần nhất xảy ra hiện tượng phương sai thay đổi. Ví dụ:−→ Nghiên cứu mối quan hệ giữa chi phí sản xuất và lượng sản phẩm được sản xuất ra dựa vào mẫu gồm nhưng doanh nghiệp có qui mô khác nhau xảy ra hiện tượng phương sai thay đổi. −→ Sử dụng đồ thị phần dư Ví dụ 2.1 Tệp dữ liệu ch7vd1bis.wf1 chứa các quan sát về chi tiêu cho tiêu dùng(Y) và thu nhập (X) hàng tháng của 20 hộ gia đình ở một vùng nông thôn (đơn vị: 10.000đ) 12
Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi (a) Mô hình hồi quy (b) Kiểm định BP 13
Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi Phương pháp phân tích định lượng 2 2 Ý tưởng: Var(Ui) = σi σi có phụ thuộc vào X2i, X3i, , Xki ? 2 −→ ui , ui có phụ thuộc vào X2i, X3i, , Xki ? −→ 2 | | ui , ui = f (X2i, X3i, , Xki)? −→ | | 2 Mô hình hồi quy mẫu: ei , ei =bf (X2i, X3i, , Xki) −→ |2 | Kiểm định giả thiết H1 : u , ui phụ thuộc vào X2i, X3i, , Xki −→ i | | 2 Kiểm định Breusch-Pagan (BP): ui = α1 + α2X2i + + αkXki + vi 2 2 2 Kđgt: H0 : α1 = α2 = = αk = 0; H1 : α + α + + α > 0 −→ 1 2 k Kiểm định White (3 biến): 2 2 2 ui = α1 + α2X2i + α3X3i + α4X2i + α5X3i + α6X2iX3i + vi 2 2 2 Kđgt: H0 : α1 = α2 = = α6 = 0; H1 : α + α + + α > 0 −→ 1 2 6 14
Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi 2 2 β2 vi 2 2 Kiểm định Park: σi = σ Xi e ln(σi ) = ln(σ ) + β2lnXi + vi 2 −→ ln(u ) = β1 + β2lnXi + vi −→ i Kđgt: H0 : β2 = 0; H1 : β2 , 0 −→ Kiểm định Glejser: ui = β1 + β2Xi + vi (1) | | p ui = β1 + β2 Xi + vi (2) | | 1 ui = β1 + β2 + vi (3) | | Xi 1 ui = β1 + β2 + vi (4) | | √Xi Ví dụ 2.2 Tiếp tục ví dụ 2.1. Kiểm định phương sai có thay đổi không bằng kiểm định Park và kiểm định Glejser. 15
Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi (c) Mô hình hồi quy (d) Kiểm định BP 16
Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi Kiểm định Breusch-Pagan (Kiểm định BP) ® Bước 1: Hồi quy mô hình Y = β1 + β2X2 + + βkXk + u thu được −→ phần dư ei. 2 ® Bước 2: Hồi quy ei theo các biến độc lập trong mô hình 2 ei = α1 + α2X2i + + αkXki + vi 2 thu được hệ số xác định Re . ® Bước 3: Kiểm định cặp giả thuyết 2 2 H0 : α2 = = αk = 0 H1 : α2 + + αk , 0. Kết luận dựa vào p value − Ví dụ 2.3 Với số liệu trong ch4bt8.wf1, hãy ước lượng mô hình hồi quy sau: wage = β1 + β2.age + β3.edu + u trong đó wage, age và edu lần lượt là lương, tuổi và số năm đi học của người lao động. Sau đó dùng kiểm định BP để kiểm định giả thuyết về phương sai sai số không đổi. 17
Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi (e) Kiểm định Park (f) Kiểm định Glejser 1 (g) Kiểm định Glejser 2 18
Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi Kiểm định White ® Bước 1: Hồi quy mô hình: Y=β1 + β2X2 + β3X3 + u thu được phần dư −→ ei và Yˆ . 2 ® Bước 2: Hồi quy ei theo các biến độc lập trong mô hình 2 2 2 ei = α1 + α2X2i + α3X3i + α4X2i + α5X3i + α6X2iX3i + vi 2 thu được hệ số xác định Re . ® Bước 3: Kiểm định cặp giả thuyết 2 2 H0 : α2 = = α6 = 0 H1 : α2 + + α6 , 0. Kết luận dựa vào p-value. Ví dụ 2.4 Với số liệu trong ch4bt8.wf1, hãy ước lượng mô hình hồi quy sau: wage = β1 + β2.age + β3.edu + u trong đó wage, age và edu lần lượt là lương, tuổi và số năm đi học của người lao động. Sau đó dùng kiểm định BP để kiểm định giả thuyết về phương sai sai số không đổi. 19
Phương sai sai số thay đổi (Heteroscedasticity) Phát hiện phương sai sai số thay đổi (h) Mô hình hồi quy (i) Kiểm định White 20
Phương sai sai số thay đổi (Heteroscedasticity) Khắc phục hiện tượng phương sai sai số thay đổi Khắc phục hiện tượng phương sai sai số thay đổi ® Do mô hình thiếu biến hoặc dạng hàm sai cần xem xét vấn đề thiếu biến hoặc dạng hàm sai. −→ ® Dùng phương pháp bình phương bé nhất tổng quát (GLS-Generalized least squares) Xét mô hình hồi quy: Y = β1 + β2X2 + + βkXk + u 2 2 2 Giả sử phương sai thay đổi theo dạng: σi = σ X2i Chia hai vế của phương trình hồi quy cho X2i, ta được: Yi β1 Xki ui = + β2 + + βk + X2i X2i X2i X2i Yi∗ = α1 + α2X2i∗ + + αkXki∗ + ui∗ với Y = Yi , X = 1 , , X = Xki , u = ui . i∗ X2i 2i∗ X2i ki∗ X2i i∗ X2i Thực chất là gán trọng số X2i cho quan sát thứ i phương pháp này còn được gọi là phương pháp ước lượng bình phương−→ bé nhất có trọng số. Nhược điểm: Khi mô hình có nhiều biến, xác định dạng thức của phương sai rất khó không khả khi. −→ Áp dụng kỹ thuật ước lượng sai số21 chuẩn vững (robust standard error).
Phương sai sai số thay đổi (Heteroscedasticity) Khắc phục hiện tượng phương sai sai số thay đổi ® Phương pháp sai số chuẩn vững: Vẫn sử dụng UL OLS vì ước lượng chỉ mất hiệu quả nhưng không mất tính vững, nhưng ta sẽ làm cho kiểm định hệ số đáng tin cậy hơn bằng cách tính lại sai số chuẩn của các hệ số hồi quy. Xét mô hình hồi quy đơn: Yi = β1 + β2X2i + ui P xiyi Ước lượng OLS của β2 là: βb2 = P 2 xi Khi phương sai của ui thay đổi thì P 2 2 xi σi var βb2 = P 2 xi White đề xuất thay bằng công thức P 2 2 xi ei var βb2 = P 2 xi 22
Đa cộng tuyến (Multicollinearity) Bản chất đa cộng tuyến Xét mô hình hồi quy bội Y = β1 + β2X2 + + βkXk + αk+1Z + u. Để có thể thực hiện được các ước lượng OLS, ta cần Giả thiết 4: không có hiện tượng đa cộng tuyến giữa các biến độc lập. Nếu giả thiết này bị vi phạm ta nói mô hình bị đa cộng tuyến. Khi mô hình bị đa cộng tuyến có hai trường hợp: ® Mô hình bị đa cộng tuyến hoàn hảo khi các biến độc lập trong mô hình phụ thuộc tuyến tính lẫn nhau, tức là α1 + α2X2 + α3X3 + + αkXk = 0. ® Mô hình bị đa cộng tuyến không hoàn hảo nếu tồn tại λj, j = 1, 2, , k không đồng thời bằng 0, sao cho α1 + α2X2 + α3X3 + + αkXk + v = 0, trong đó v là sai số ngẫu nhiên. Nếu βj , 0 thì hồi quy mô hình Xj theo các biến độc lập còn lại ta có hệ số xác định R2, khi đó nếu R2 1 thì mô hình có hiện tượng đa cộng j j ≈ tuyến cao. 23
Đa cộng tuyến (Multicollinearity) Nguyên nhân và hậu quả Nguyên nhân gây ra đa cộng tuyến: Do bản chất mối quan hệ giữa các biến độc lập Tồn tại biến độc lập ít biến thiên Số biến giải thích k khá lớn so với kích thước mẫu Mô hình có dạng đa thức, gồm các biến độc lập X, X2 hay X3 thường có quan hệ tuyến tính khá chặt đặc biệt khi X nhận giá trị trong khoảng nhỏ. Mẫu không mang tính đại diện. Hậu quả của đa cộng tuyến cao ® Mô hình có đa cộng tuyến hoàn hảo không ước lượng được mô hình. −→ 2 2 ˆ σ ® Mô hình có đa cộng tuyến cao: R 1 var(βj) = n j 2 P 2 ≈ −→ (1 Rj ) xji ≈ ∞ − i=1 se(βˆj) rất lớn −→ " Khoảng tin cậy cho βj sẽ rộng ước lượng trở nên kém chính xác. −→ " Hệ số ước lượng βj dễ mất ý nghĩa thống kê. " Dấu của hệ số ước lượng của biến Xj có thể ngược với kỳ vọng " Giá trị của ước lượng của βˆj và se(βˆj) rất nhạy đối với việc tăng hoặc bớt đi một quan sát hay loại bỏ biến có mức ý nghĩa thấp 24
Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao Cách phát hiện đa cộng tuyến cao ® Căn cứ vào các kết luận của kiểm định t và F: Nếu các kết luận mâu thuẫn với nhau thì đó có thể là dấu hiệu của đa cộng tuyến. ® Căn cứ vào hệ số tương quan của các biến độc lập: Nếu hệ số tương quan cặp giữa hai biến độc lập nào đó lớn (có trị tuyệt đối lớn hơn 0.8) thì có thể xem như mô hình có đa cộng tuyến cao. ® Dùng hồi quy phụ Bước 1: Xác định mô hình hồi quy phụ giữa các biến độc lập trong mô hình hồi quy gốc: Hồi quy biến Xj với các biến độc lập còn lại Bước 2: Kiểm định cặp giả thiết   H0 : mô hình không có đa cộng tuyến  H1 : mô hình có đa cộng tuyến 25
Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao ® Dùng nhân tử phóng đại phương sai VIF (variance inflation factor) Bước 1: Xác định mô hình hồi quy phụ giữa các biến độc lập trong mô hình hồi quy gốc: Hồi quy biến Xj với các biến độc lập còn lại tìm 2 −→ được Rj . Bước 2: Xác định đại lượng 1 VIF(Xj) = (j = 2 k) 1 R2 ÷ − j Nếu VIF(Xj) > 10 thì Xj có thể cộng tuyến với các biến độc lập còn lại. Ví dụ 3.1 Tệp số liệu baitap6_4.wf1 là số liệu về nhập khẩu, GNP và chỉ số giá tiêu dùng (CPI) của Mỹ trong thời kỳ 1970 - 1983: 26
Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao Năm Nhập khẩu GNP CPI 1970 39866 992,7 116,3 1971 45579 1077,6 121,3 1972 55797 1185,9 125,3 1973 70499 1326,4 133,1 1974 103811 1434,2 147,7 1975 98185 1549,2 161,2 1976 124228 1718 170,5 1977 151907 1918,3 181,5 1978 176010 2163,9 195,4 1979 212028 2417,8 217,4 1980 249781 2631,7 246,8 1981 265086 2,958 272,4 1982 247667 3,069 289,1 1983 261312 3304,8 298,4 a) Dùng số liệu cho trong bảng để ước lượng mô hình: ln (nhập khẩu)t = β1 + β2 ln (GNP)t + β3 ln (CPI)t + ut 27
Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao b) Bạn có nghi ngờ có đa cộng tuyến trong số liệu hay không? c) Ước lượng các hàm hồi quy: ln (nhập khẩu)t = α1 + α2 ln (GNP)t + ut ln (nhập khẩu)t = λ1 + λ2 ln (CPI)t + ut ln (GNP)t = γ1 + γ2 ln (CPI)t + ut Dựa vào các hàm hồi quy này, bạn có thể nói gì về bản chất của đa cộng tuyến trong số liệu? 28
Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao 29
Đa cộng tuyến (Multicollinearity) Cách phát hiện đa cộng tuyến cao 30
Đa cộng tuyến (Multicollinearity) Khắc phục hiện tượng đa cộng tuyến Nếu mục đích của phân tích hồi quy là dự báo thì trong một số trường hợp ta không cần khắc phục đa cộng tuyến. Nếu biến bị đa cộng tuyến cao βˆj có se(βˆj) là không quá lớn so với βj làm cho Xj có ý nghĩa thống kê và không bị đổi dấu, các hậu quả trên không xảy ra thì ta không bận tâm đến đa cộng tuyến nữa. Nếu mô hình với 3 biến độc lập X2, X3, X4 có X2, và X3 tương quan tuyến tính chặt với nhau, X4 không có quan hệ tuyến tính chặt với X2, X3. Mặt khác mối quan tâm chính trong phân tích hồi quy là đánh giá tác động của X4 lên biến phụ thuộc thì việc có đa cộng tuyến cao cũng không làm ảnh hưởng đến chất lượng phân tích của mô hình. Khắc phục đa cộng tuyến ® Thu thập thêm số liệu hoặc lấy mẫu mới. ® Bỏ bớt biến độc lập ra khỏi mô hình nếu có thể. ® Sử dụng thông tin tiên nghiệm. ® Đổi dạng hàm: hồi quy đa thức, sử dụng sai phân cấp 1, phân tích nhân tố, 31
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Hậu quả Các thống kê t và F không tuân theo quy luật Student và quy luật Fisher. Nếu kích thước mẫu nhỏ thì các suy diễn thống kê không đáng tin cậy. ® Xem xét đồ thị phần dư. ® Kiểm định Jacque - Bera (JB) Xét mô hình Y = β1 + β2X2 + + βkXk + u. Kiểm định cặp giả thuyết H0 : ui có phân phối chuẩn; H1 : ui không có phân phối chuẩn Ước lượng mô hình hồi quy thu được ei. −→ P e3 n Tìm hệ số bất đối xứng (Skewness) S = i / và hệ số nhọn P 2 3/2 ( ei /n) P e4 n (Kurtoris) K = i / của các phần dư e P 2 2 i. ( ei /n) Tính giá trị quan sát của tiêu chuẩn kiểm định S2 K2 JB = χ2 = n[ + ]. 6 24 2 Nếu JB > χα(2) thì bác bỏ H0. 32
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Ví dụ 4.1 Sử dụng số liệu trong workfile ch1-5vidu/salary để hồi quy mô hình sau: TN = β1 + β2KN + u Hướng dẫn: Trên cửa sổ màn hình Equation, ta chọn: View/Residual Diagnostics/Histogram - Normality Test33
Sai số ngẫu nhiên không tuân theo quy luật chuẩn Ví dụ 4.2 Tập dữ liệu BT_PQ chứa số liệu 52 tuần của một cửa hàng với P là giá bán, Q là lượng bán, PA là giá bán của cửa hàng cạnh tranh thứ nhất, PB là giá bán của cửa hàng cạnh tranh thứ hai. a) Ước lượng mô hình Q phụ thuộc P và PA. b) Mô hình có thể có đa cộng tuyến không? c) Kiểm định tính phân phối chuẩn của phần dư. d) Kiểm định hiện tượng tự tương quan bằng kiểm định BG. e) Kiểm định phương sai thay đổi bằng kiểm định White. f) Kiểm định dạng hàm bằng kiểm định Ramsey. 34