Kinh tế vi mô - Chương 9: Một số vấn đề mở rộng về dạng hàm và dữ liệu
Bạn đang xem tài liệu "Kinh tế vi mô - Chương 9: Một số vấn đề mở rộng về dạng hàm và dữ liệu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên
Tài liệu đính kèm:
- kinh_te_vi_mo_chuong_9_mot_so_van_de_mo_rong_ve_dang_ham_va.pdf
Nội dung text: Kinh tế vi mô - Chương 9: Một số vấn đề mở rộng về dạng hàm và dữ liệu
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu MỘT SỐ VẤN ĐỀ MỞ RỘNG 9.1 Vấn đề xác định sai dạng hàm VỀ DẠNG HÀM VÀ DỮ LIỆU Chúng ta cĩ thể kiểm định xem liệu mơ hình đang xét cĩ thiếu bình phương hay bậc cao hơn của một biến độc lập hay khơng bằng cách thêm các số hạng này vào mơ hình và kiểm định xem thành phần thêm vào cĩ ý nghĩa thống kê khơng. Ngồi ra, cĩ thể sử dụng kiểm định chung về sai dạng hàm như RESET của Ramsey. Chương 9 Kiểm định sai dạng hàm (RESET) Ý tưởng của RESET là thêm bình phương và bậc cao hơn của giá trị ước lượng của biến phụ thuộc vào hàm hồi quy (giống với kiểm định White rút gọn) Wooldridge: Introductory Econometrics: y 0 1 x 1 k x k u 9.2 A Modern Approach, 5e 2 3 y 0 1 x 1 k x k 1 yˆ 2 yˆ saiso 9.3 Kiểm định xem cĩ nên loại bỏ thành phần này hay khơng. Nếu ta khơng thể loại bỏ chúng, nghĩa là mơ hình đã thiếu bậc cao của biến độc lập và biến tương tác, hay nĩi cách khác, mơ hình sai dạng hàm. H0: 1=0, 2=0 H0: mơ hình (9.2) cĩ dạng hàm đúng © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Ví dụ 9.1: Mơ hình kinh tế về vấn đề tội phạm Dependent Variable: NARR86 (MH2) • Tập tin crime1.wf1 Method: Least Squares Included observations: 2725 Dependent Variable: NARR86 (MH1) Method: Least Squares Variable Coefficient Std. Error t-Statistic Prob. Included observations: 2725 PCNV 0.552524 0.154237 3.582297 0.0003 Variable Coefficient Std. Error t-Statistic Prob. PCNV^2 -0.730212 0.156118 -4.677317 0.0000 AVGSEN -0.017022 0.012054 -1.412124 0.1580 PCNV -0.133234 0.040350 -3.301949 0.0010 TOTTIME 0.011954 0.009282 1.287803 0.1979 AVGSEN -0.011318 0.012240 -0.924645 0.3552 PTIME86 0.287433 0.044258 6.494462 0.0000 TOTTIME 0.012022 0.009435 1.274210 0.2027 PTIME86^2 -0.029608 0.003863 -7.663609 0.0000 PTIME86 -0.040842 0.008812 -4.634769 0.0000 QEMP86 -0.014094 0.017361 -0.811813 0.4170 QEMP86 -0.050540 0.014440 -3.500045 0.0005 INC86 -0.003415 0.000804 -4.249251 0.0000 INC86 -0.001489 0.000341 -4.370173 0.0000 INC86^2 7.19E-06 2.56E-06 2.811369 0.0050 BLACK 0.326503 0.045416 7.189232 0.0000 BLACK 0.292296 0.044830 6.520096 0.0000 HISPAN 0.193914 0.039711 4.883099 0.0000 HISPAN 0.163617 0.039451 4.147388 0.0000 C 0.568685 0.036046 15.77660 0.0000 C 0.504607 0.036835 13.69898 0.0000 R-squared 0.072321 Mean dependent var 0.404404 R-squared 0.103454 Mean dependent var 0.404404 Adjusted R-squared 0.069588 S.D. dependent var 0.859077 Adjusted R-squared 0.099819 S.D. dependent var 0.859077 Biến QEMP86 là 1 biến rời rạc chỉ nhận 5 giá trị. 3 4 1
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI: Phân tích hồi quy bội: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Vấn đề dạng hàm và dữ liệu Wald Test: (MH2) Equation: EQ02 Test Statistic Value df Probability Ví dụ 9.2: Hàm hồi quy giá nhà 9.4 F-statistic 31.40381 (3, 2713) 0.0000 Chi-square 94.21144 3 0.0000 Bằng chứng cho thấy cĩ sai dạng hàm Null Hypothesis: C(2)=0,C(6)=0,C(9)=0 Null Hypothesis Summary: 9.5 Normalized Restriction (= 0) Value Std. Err. Ít bằng chứng cho thấy C(2) -0.730212 0.156118 cĩ sai dạng hàm C(6) -0.029608 0.003863 Thảo luận C(9) 7.19E-06 2.56E-06 Chúng ta cĩ thể thêm vào các bậc cao hơn của yˆ , hàm ý là thêm vào mơ hình các Restrictions are linear in coefficients. biến tương tác phức tạp và bậc cao hơn của các biến độc lập. RESET cung cấp ít thơng tin về nguyên nhân sai dạng hàm. p-value = 0.0000 < 0.05 : bác bỏ H0 Vậy nên chọn mơ hình 2. 5 © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ramsey RESET Test • Tập tin hprice1.wf1 Equation: EQ01 Specification: PRICE C LOTSIZE SQRFT BDRMS Omitted Variables: Powers of fitted values from 2 to 3 Dependent Variable: PRICE (MH 9.4) Value df Probability Method: Least Squares F-statistic 4.668205 (2, 82) 0.0120 Included observations: 88 Likelihood ratio 9.489063 2 0.0087 Unrestricted Test Equation: Variable Coefficient Std. Error t-Statistic Prob. Dependent Variable: PRICE Method: Least Squares Included observations: 88 C -21.77031 29.47504 -0.738601 0.4622 LOTSIZE 0.002068 0.000642 3.220096 0.0018 Variable Coefficient Std. Error t-Statistic Prob. SQRFT 0.122778 0.013237 9.275093 0.0000 C 166.0973 317.4325 0.523252 0.6022 BDRMS 13.85252 9.010145 1.537436 0.1279 LOTSIZE 0.000154 0.005203 0.029545 0.9765 SQRFT 0.017599 0.299251 0.058810 0.9532 BDRMS 2.174904 33.88811 0.064179 0.9490 R-squared 0.672362 Mean dependent var 293.5460 FITTED^2 0.000353 0.007099 0.049786 0.9604 FITTED^3 1.55E-06 6.55E-06 0.235810 0.8142 R-squared 0.705853 Mean dependent var 293.5460 H0: Mơ hình (9.4) cĩ dạng hàm đúng . Với = 3% p-value = 0.0120 < 0.03: bác bỏ H0 7 8 2
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ramsey RESET Test Dependent Variable: LOG(PRICE) (MH 9.5) Equation: EQ01 Specification: PRICE C LOTSIZE SQRFT BDRMS Method: Least Squares Omitted Variables: Powers of fitted values from 2 to 5 Included observations: 88 Value df Probability Variable Coefficient Std. Error t-Statistic Prob. F-statistic 3.225850 (4, 80) 0.0166 Likelihood ratio 13.15896 4 0.0105 C -1.297042 0.651284 -1.991517 0.0497 Unrestricted Test Equation: LOG(LOTSIZE) 0.167967 0.038281 4.387714 0.0000 Dependent Variable: PRICE LOG(SQRFT) 0.700232 0.092865 7.540306 0.0000 Method: Least Squares BDRMS 0.036958 0.027531 1.342415 0.1831 Included observations: 88 Variable Coefficient Std. Error t-Statistic Prob. R-squared 0.642965 Mean dependent var 5.633180 C 340.2329 3320.583 0.102462 0.9186 LOTSIZE 0.002603 0.080979 0.032149 0.9744 SQRFT 0.157983 4.816594 0.032800 0.9739 BDRMS 19.32476 542.8438 0.035599 0.9717 FITTED^2 -0.034809 0.240737 -0.144595 0.8854 FITTED^3 0.000191 0.000714 0.267613 0.7897 FITTED^4 -3.93E-07 1.02E-06 -0.383490 0.7024 FITTED^5 2.83E-10 5.70E-10 0.495886 0.6213 9 10 PHÂN TÍCH HỒI QUY BỘI: Phân tích hồi quy bội: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Ramsey RESET Test Vấn đề dạng hàm và dữ liệu Specification: LOG(PRICE) C LOG(LOTSIZE) LOG(SQRFT) BDRMS Omitted Variables: Powers of fitted values from 2 to 3 Kiểm định đối với mơ hình khơng lồng nhau Value df Probability Dạng hàm nào sẽ F-statistic 2.565041 (2, 82) 0.0831 phù hợp hơn? Likelihood ratio 5.340099 2 0.0692 Mơ hình 1: 9.6 Unrestricted Test Equation: Mơ hình 2: 9.7 Dependent Variable: LOG(PRICE) Included observations: 88 Xây dựng một mơ hình hỗn hợp và mỗi mơ hình ban đầu là trường hợp đặc biệt của mơ hình hỗn hợp và kiểm định: Variable Coefficient Std. Error t-Statistic Prob. 9.8 y 0 1 x 1 2 x 2 3log( x 1 ) 4 log( x 2 ) u C 87.88576 240.9739 0.364711 0.7163 LOG(LOTSIZE) -4.181019 12.59521 -0.331953 0.7408 H : =0, =0 cho mơ hình 9.7 LOG(SQRFT) -17.34933 52.48991 -0.330527 0.7418 0 1 2 BDRMS -0.925342 2.769757 -0.334088 0.7392 H0: 3=0, 4=0 cho mơ hình 9.6 FITTED^2 3.910284 13.01429 0.300461 0.7646 Thảo luận FITTED^3 -0.192766 0.752080 -0.256311 0.7984 Luơn cĩ thể thực hiện; tuy nhiên, khơng cĩ mơ hình chiếm ưu thế rõ ràng. 0 H : Mơ hình (9.5) cĩ dạng hàm đúng . Với = 6% Khơng thể sử dụng nếu các mơ hình cĩ biến phụ thuộc cĩ dạng hàm khác nhau. p-value = 0.0831 > 0.06: chấp nhận H0 11 © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 3
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Tập tin hprice1.wf1 Wald Test: Equation: EQ03 Dependent Variable: PRICE (MH 9.8) Method: Least Squares Test Statistic Value df Probability Included observations: 88 F-statistic 7.792740 (2, 83) 0.0008 Variable Coefficient Std. Error t-Statistic Prob. Chi-square 15.58548 2 0.0004 C 1403.700 970.6562 1.446135 0.1519 Null Hypothesis: C(2)=0, C(3)=0 LOTSIZE -0.000493 0.001021 -0.483133 0.6303 Null Hypothesis Summary: SQRFT 0.247463 0.063686 3.885688 0.0002 LOG(LOTSIZE) 60.21552 20.04305 3.004309 0.0035 Normalized Restriction (= 0) Value Std. Err. LOG(SQRFT) -282.6301 140.5320 -2.011144 0.0476 C(2) -0.000493 0.001021 C(3) 0.247463 0.063686 R-squared 0.713293 Mean dependent var 293.5460 Restrictions are linear in coefficients. p-value = 0.0008 < 0.05: bác bỏ H0: 1=0, 2=0 Mơ hình (9.7) khơng chiếm ưu thế hơn (9.6) 13 14 PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Wald Test: • Cách làm này chỉ cho ra kết quả tốt khi 1 giả thiết bị bác bỏ và 1 giả Equation: EQ03 thiết được chấp nhận. Test Statistic Value df Probability • Cĩ thể dùng kiểm định Davidson-MacKinnon, trang 350. F-statistic 7.259057 (2, 83) 0.0012 Chi-square 14.51811 2 0.0007 Null Hypothesis: C(4)=0,C(5)=0 Null Hypothesis Summary: Normalized Restriction (= 0) Value Std. Err. C(4) 60.21552 20.04305 C(5) -282.6301 140.5320 Restrictions are linear in coefficients. p-value = 0.0012 < 0.05: bác bỏ H0: 3=0, 4=0 Mơ hình (9.6) khơng chiếm ưu thế hơn (9.7) 15 16 4
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Vấn đề dạng hàm và dữ liệu 9.2 Sử dụng biến đại diện cho các biến giải thích khơng quan sát được Giả thiết đối với biến đại diện Biến đại diện “chỉ là đại diện“ cho biến bị bỏ sĩt, nĩ khơng thuộc vào hàm hồi Ví dụ: Bỏ sĩt biến năng lực trong mơ hình tiền lương Thay bằng biến đại diện quy tổng thể, nghĩa là, nĩ khơng tương quan với nhiễu. 9.9 Nếu nhiễu và biến đại diện cĩ tương quan, biến đại Thơng thường, ước lượng của suất sinh lợi giáo dục và kinh nghiệm thường bị chệch bởi vì mơ hình diện cần cĩ mặt trong mơ hình hồi quy tổng thể cĩ thể bỏ sĩt biến năng lực khơng quan sát được. Ý tưởng: tìm một biến đại diện cho năng lực, cĩ thể kiểm sốt và thể hiện được năng lực khác nhau giữa các cá nhân, khi đĩ hệ số hồi quy của các biến khác khơng cịn chệch. Một trong những biến Biến đại diện phải đại diện “tốt“ cho biến bị bỏ sĩt, nghĩa là các biến khác thêm đại diện cho năng lực là chỉ số IQ hoặc kết quả của các bài kiểm tra tương tự. vào khơng giúp gì trong dự đốn biến bị bỏ sĩt. Cách sử dụng biến đại diện trong mơ hình: 9.13 9.10 Nếu điều này khơng thỏa, thì x1 và x2 cần được thêm Biến bỏ sĩt, chẳng hạn: năng lực vào mơ hình hồi quy của 9.11 biến bị bỏ sĩt. Hồi quy biến bỏ sĩt theo biến đại diện của nĩ (x3 đại diện cho x3*) © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Vấn đề dạng hàm và dữ liệu Ví dụ 9.3: IQ là biến đại diện cho năng lực abil Khi thỏa các giả định trên, biến đại diện được sử dụng như sau: Giống với kỳ vọng, suất sinh lợi giáo dục giảm nếu IQ được đưa vào mơ hình để làm đại diện cho biến năng lực khơng quan sát được. Trong mơ hình hồi quy này, sai số ngẫu nhiên e= u+β3v3 khơng tương quan với tất cả biến giải thích. Khi đĩ, hệ số hồi quy sẽ được ước lượng đúng bằng OLS. Hệ số của biến x1 và x2 sẽ xác Hệ số hồi quy đứng trước biến IQ cho định đúng. Hệ số của biến đại diện trong nhiều trường hợp cũng được quan tâm (nĩ là bội số biết sự khác nhau trong năng lực giữa của hệ số đứng trước biến bị bỏ sĩt). các cá nhân cĩ ý nghĩa quan trọng đến tiền lương (ví dụ, mức chênh lệnh 15 Thảo luận về giả thiết biến đại diện trong hàm tiền lương điểm IQ dẫn đến mức chênh lên 5,4 điểm phần trăm trong tiền lương). Giả thiết 1: Chỉ số IQ phải hồn tồn khơng tác động trực tiếp đến tiền lương; quan trọng là một cá nhân chứng minh năng lực trong cơng việc như thế nào. Ngay cả khi chỉ số IQ khơng hồn tồn giải thích sự thay đổi do năng lực, việc Giả thiết 2: Hầu hết sự biến động của biến năng lực cĩ thể được giải thích bởi sự thay đổi thêm nĩ vào mơ hình ít nhất làm giảm tính chệch của suất sinh lợi giáo dục. trong chỉ số IQ, chỉ cĩ một số ít được giải thích bởi học vấn và kinh nghiệm. Tương tác giữa năng lực và học vấn Cĩ thể cĩ đa cộng tuyến cao giữa IQ và educ khơng cĩ ý nghĩa. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 5
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Tập tin wage2.wf1 Dependent Variable: LOG(WAGE) (MH2) Method: Least Squares Dependent Variable: LOG(WAGE) (MH1) Included observations: 935 Method: Least Squares Included observations: 935 Variable Coefficient Std. Error t-Statistic Prob. Variable Coefficient Std. Error t-Statistic Prob. 0.0000 EDUC 0.054411 0.006928 7.853173 EDUC 0.065431 0.006250 10.46826 0.0000 EXPER 0.014146 0.003165 4.469316 0.0000 EXPER 0.014043 0.003185 4.408852 0.0000 TENURE 0.011395 0.002439 4.671302 0.0000 TENURE 0.011747 0.002453 4.788998 0.0000 MARRIED 0.199764 0.038802 5.148237 0.0000 MARRIED 0.199417 0.039050 5.106691 0.0000 SOUTH -0.080169 0.026253 -3.053735 0.0023 SOUTH -0.090904 0.026249 -3.463193 0.0006 URBAN 0.181946 0.026793 6.790848 0.0000 URBAN 0.183912 0.026958 6.822087 0.0000 BLACK -0.143125 0.039492 -3.624118 0.0003 BLACK -0.188350 0.037667 -5.000444 0.0000 IQ 0.003559 0.000992 3.588501 0.0004 C 5.395497 0.113225 47.65286 0.0000 C 5.176439 0.128001 40.44074 0.0000 R-squared 0.252558 Mean dependent var 6.779004 R-squared 0.262809 Mean dependent var 6.779004 Adjusted R-squared 0.246914 S.D. dependent var 0.421144 Adjusted R-squared 0.256441 S.D. dependent var 0.421144 21 22 PHÂN TÍCH HỒI QUY BỘI: Phân tích hồi quy bội: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Vấn đề dạng hàm và dữ liệu Dependent Variable: LOG(WAGE) (MH3) Method: Least Squares Included observations: 935 Sử dụng biến trễ của biến phụ thuộc làm biến đại diện Variable Coefficient Std. Error t-Statistic Prob. Trong nhiều trường hợp, yếu tố khơng quan sát được bị bỏ sĩt cĩ thể được đại diện EDUC 0.018456 0.041061 0.449479 0.6532 bởi giá trị của biến phụ thuộc ở các thời điểm trước. EXPER 0.013907 0.003177 4.377665 0.0000 TENURE 0.011393 0.002440 4.669853 0.0000 Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố MARRIED 0.200866 0.038827 5.173393 0.0000 SOUTH -0.080235 0.026256 -3.055888 0.0023 9.16 URBAN 0.183576 0.026859 6.834892 0.0000 BLACK -0.146699 0.039701 -3.695069 0.0002 IQ -0.000942 0.005163 -0.182424 0.8553 Việc đưa thêm tỷ lệ tội phạm thời điểm trước vào mơ hình ít nhất kiểm sốt được phần nào các EDUC*IQ 0.000340 0.000383 0.888386 0.3746 yếu tố bị bỏ sĩt cĩ tác động đến tỷ lệ tội phạm trong năm đang xét. C 5.648248 0.546296 10.33916 0.0000 So sánh hai thành phố cĩ cùng tỷ lệ tội phạm vào năm trước; nghĩa là, chúng ta đã tránh trường hợp so sánh hai thành phố cĩ sự khác biệt rất lớn trong các yếu tố tác động đến tỷ lệ tội phạm R-squared 0.263438 Mean dependent var 6.779004 khơng quan sát được. Adjusted R-squared 0.256271 S.D. dependent var 0.421144 Kỳ vọng dấu của β3>0. Nếu 2 thành phố cĩ cùng tỷ lệ tội phạm trước đây (crime-1) và tỷ lệ thất nghiệp hiện tại (unem), β2 đo lường tác động của expend lên crime. Chọn MH2. 23 © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 6
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Tập tin crime2.wf1 Dependent Variable: LOG(CRMRTE87) (MH2) • Ví dụ 9.4: Tỷ lệ tội phạm trong thành phố Method: Least Squares Included observations: 46 after adjustments Dependent Variable: LOG(CRMRTE87) (MH1) Method: Least Squares Variable Coefficient Std. Error t-Statistic Prob. Included observations: 46 after adjustments 0.008621 0.6610 UNEM87 0.019517 0.441725 Variable Coefficient Std. Error t-Statistic Prob. LOG(LAWEXPC87) -0.139576 0.108641 -1.284745 0.2059 LOG(CRMRTE82) 1.193923 0.132098 9.038124 0.0000 UNEM87 -0.029003 0.032339 -0.896856 0.3748 C 0.076450 0.821143 0.093102 0.9263 LOG(LAWEXPC87) 0.203365 0.172653 1.177881 0.2453 C 3.342899 1.250526 2.673194 0.0106 R-squared 0.679830 Mean dependent var 4.590739 R-squared 0.057117 Mean dependent var 4.590739 Adjusted R-squared 0.656961 S.D. dependent var 0.325302 Adjusted R-squared 0.013262 S.D. dependent var 0.325302 Dấu của UNEM87 và LOG(LAWEXPC87) đúng với kỳ vọng. Dấu của UNEM87 và LOG(LAWEXPC87) trái với kỳ vọng. 25 26 PHÂN TÍCH HỒI QUY BỘI: Phân tích hồi quy bội: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Vấn đề dạng hàm và dữ liệu • Cách tạo ra biến CRMRTE82: • Tạo ra biến CRMRTE82 từ biến CRMRTE. 9.3 Mơ hình với hệ số gĩc ngẫu nhiên (= Mơ hình cĩ hệ số ngẫu nhiên) (tự đọc) • Thêm 1 quan sát NA vào dịng đầu tiên (Insert obs ). Mơ hình cĩ hệ số chặn ngẫu nhiên và hệ số gĩc ngẫu nhiên 9.18 Hệ số chặn Thành phần Hệ số gĩc Thành phần trung bình ngẫu nhiên trung bình ngẫu nhiên Sai số Thành phần ngẫu nhiên của một cá nhân độc lập với biến Giả thiết: giải thích WLS hay OLS với sai số chuẩn cải thiện sẽ giúp ước lượng vững hệ số chặn trung bình và hệ số gĩc trung bình của tổng thể. 9.20 27 © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 7
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge Phân tích hồi quy bội: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Vấn đề dạng hàm và dữ liệu • Ví dụ 9.5: Hàm tiết kiệm với sai số đo lường Khi chúng ta sử dụng 1 thước đo khơng chính xác cho 1 biến kinh tế trong 1 mơ hình • sav* = β0 +β1inc + β2size + β3educ + β4age + u hồi quy, thì cĩ nghĩa là mơ hình của chúng ta hàm chứa vấn đề sai số đo lường. • sav*: tiết kiệm thật sự, sav: tiết kiệm báo cáo 9.4 Tính chất của OLS khi cĩ sai số trong đo lường • e0 = sav-sav* Sai số đo lường ở biến phụ thuộc • Khá hợp lý nếu giả thiết sai số đo lường khơng tương quan với inc, Giá trị sai = Giá trị đúng + Sai số đo lường 9.24 size, educ, age. • Chúng ta cĩ thể khơng bao giờ biết được sai số đo lường cĩ Hàm hồi quy tổng thể tương quan với inc, educ hay khơng, trừ khi chúng ta thu thập được dữ liệu về sav*. Mơ hình được ước lượng 9.25 • Ví dụ 9.6: Sai số đo lường trong tỷ lệ phế phẩm Hậu quả của sai số đo lường ở biến phụ thuộc Ước lượng kém hiệu quả hơn do phương sai sai số cao hơn. • log(scrap*)= β0 +β1grant + u Tuy nhiên, ước lượng OLS vẫn khơng chệch và vững (với giả thiết sai số đo lường e0 • scrap*: tỷ lệ phế phẩm thực tế, scrap: tỷ lệ phế phẩm cơng ty báo cáo khơng tương quan với các biến giải thích xj). Ngồi ra, các thống kê t, F, LM vẫn hợp lệ. • e0 = log(scrap) - log(scrap*) © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 30 Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Vấn đề dạng hàm và dữ liệu Sai số đo lường ở 1 biến giải thích Hậu quả của sai số đo lường trong biến giải thích Dưới giả thiết sai số trong đo lường cổ điển (CEV), OLS cho ước lượng chệch và 9.28 Giá trị sai = Giá trị đúng + Sai số đo lường khơng vững vì biến đo sai x1 bị nội sinh. Hàm hồi quy tổng thể 9.27 Cĩ thể biểu diễn tính khơng vững của ước lượng như sau: Mơ hình được ước lượng Nhân tử này (liên quan đến phương sai 9.30 của nhiễu trong hàm hồi quy giá trị đúng Sai số khơng 9.33 của x theo các biến giải thích khác) luơn Giả thiết sai số trong đo lường cổ điển: 9.31 tương quan với 1 giá trị đúng nhận giá trị từ 0 đến nhỏ hơn 1. Giá trị sai x1 cĩ Tác động của biến đo sai bị chệch suy giảm, nghĩa là độ lớn tác động của biến đo 9.32 tương quan với sai số của mơ hình sai luơn gần với giá trị 0 hơn so với tác động của biến đúng. Ví dụ nếu β1 >0 thì β1^ - sẽ cĩ xu hướng ước lượng thấp hơn β1. Ngồi ra, tác động của các biến giải thích khác cũng bị chệch. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 8
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI: Phân tích hồi quy bội: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Vấn đề dạng hàm và dữ liệu • Ví dụ 9.7: Phương trình GPA với sai số đo lường • colGPA = β0 +β1faminc* + β2hsGPA + β3SAT + u 9.5 Dữ liệu bị khuyết, mẫu phi ngẫu nhiên, các quan sát bất thường (tự đọc) • faminc*: thu nhập thực tế hàng năm của hộ gia đình • faminc: thu nhập hàng năm của hộ gia đình do sinh viên kê khai Dữ liệu bị khuyết do chọn mẫu • e1 = faminc - faminc* Dữ liệu khuyết là trường hợp đặc biệt của vấn đề chọn mẫu (mẫu phi ngẫu nhiên) khi • Nếu dùng faminc thay cho faminc* sẽ làm chệch ước lượng OLS của quan sát bị thiếu thơng tin khơng thể sử dụng được. β1 về phía 0. Một hậu quả của sự chệch dưới là kiểm định giả thiết H0: β1 =0;H1: β1 > 0 sẽ thường cho kết quả chấp nhận H0 (do |t| Nếu mẫu được chọn dựa trên các biến độc lập thì hàm hồi quy khơng gặp bất kỳ nhỏ). vấn đề nào vì hàm hồi quy xét điều kiện dựa trên các biến dộc lập. Nĩi chung, việc chọn mẫu sẽ khơng cĩ vấn đề gì trong trường hợp nĩ khơng liên quan tới sai số của mơ hình (= chọn mẫu ngoại sinh). Việc chọn mẫu sẽ cĩ vấn đề nếu nĩ dựa trên biến phụ thuộc hoặc sai số (= chọn mẫu nội sinh). 33 © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề dạng hàm và dữ liệu Vấn đề dạng hàm và dữ liệu Ví dụ về chọn mẫu ngoại sinh Quan sát bất thường và quan sát cĩ ảnh hưởng lớn 9.37 Quan sát cĩ giá trị cách xa hay bất thường là vấn đề đặc trưng của OLS vì phương Nếu mẫu phi ngẫu nhiên được chọn theo nhĩm thu nhập, nhĩm tuổi, quy mơ gia đình, thì hàm hồi pháp này dựa trên bình phương phần dư. quy khơng cĩ bất kỳ vấn đề gì bởi vì nĩ nghiên cứu tiết kiệm cho một tập con của tổng thể được Nếu quan sát bất thường do sai sĩt khi nhập liệu, ta chỉ cần bỏ đi các quan sát đĩ. xác định bởi thu nhập, tuổi và quy mơ gia đình. Nếu quan sát bất thường nảy sinh do quá trình thu thập dữ liệu, việc quyết định giữ Ví dụ về chọn mẫu nội sinh lại hay bỏ đi những quan sát này khơng phải dễ dàng. 9.38 Ví dụ 9.8: Cường độ R&D và quy mơ doanh nghiệp Nếu mẫu phi ngẫu nhiên là do các cá nhân từ chối tham gia cuộc khảo sát vì giá trị tài sản của họ 9.40 (wealth) quá cao hoặc thấp, kết quả ước lượng sẽ bị chệch vì những cá nhân này cĩ sự khác biệt một cách hệ thống với những cá nhân khơng từ chối tham gia mẫu khảo sát. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 9
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge Phân tích hồi quy bội: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Vấn đề dạng hàm và dữ liệu • Tập tin rdchem.wf1 Dependent Variable: RDINTENS Ví dụ 9.8: Cường độ R&D và quy mơ doanh nghiệp (tiếp tục) Method: Least Squares Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-Statistic Prob. C 2.622954 0.585494 4.479896 0.0001 SALES 5.35E-05 4.41E-05 1.214138 0.2345 PROFMARG 0.044744 0.046179 0.968926 0.3406 R-squared 0.076490 Mean dependent var 3.265625 Adjusted R-squared 0.012800 S.D. dependent var 1.874079 Giá trị bất thường này khơng phải là lỗi nhập liệu: Một trong các cơng ty trong dữ Kết quả ước lượng khi khơng cĩ quan sát liệu cĩ quy mơ lớn hơn các cơng ty khác bất thường thì cĩ ý nghĩa hơn. © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 38 PHÂN TÍCH HỒI QUY BỘI: Phân tích hồi quy bội: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Vấn đề dạng hàm và dữ liệu Dependent Variable: RDINTENS Method: Least Squares 9.6 Phương pháp độ lệch tuyệt đối nhỏ nhất (LAD) Sample: 1 32 IF (SALES<>39709) Included observations: 31 Phương pháp độ lệch tuyệt đối nhỏ nhất tìm cách cực tiểu hĩa tổng trị tuyệt đối của các Variable Coefficient Std. Error t-Statistic Prob. phần dư (thay vì tổng bình phương phần dư, OLS) C 2.294401 0.591756 3.877273 0.0006 9.45 SALES 0.000186 8.42E-05 2.206527 0.0357 PROFMARG 0.047974 0.044480 1.078555 0.2900 Ít nhạy cảm hơn với các giá trị bất thường vì khơng bình phương phần dư. R-squared 0.173177 Mean dependent var 3.254839 Adjusted R-squared 0.114118 S.D. dependent var 1.904048 Phương pháp độ lệch tuyệt đối nhỏ nhất ước lượng các tham số của trung vị cĩ điều kiện (thay vì trung bình cĩ điều kiện như OLS) Các ước lượng độ lệch tuyệt đối nhỏ nhất là trường hợp đặc biệt của hồi quy phân vị (ước lượng các tham số của phân vị cĩ điều kiện). 39 © 2012 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 10
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU • Tập tin rdchem.wf1 • Nhược điểm của LAD: • Khơng thể viết thành các cơng thức đối với các ước lượng LAD. Dependent Variable: RDINTENS (OLS) • LAD cần nhiều tính tốn hơn so với OLS. Method: Least Squares Included observations: 32 • Các suy diễn thống kê liên quan tới các ước lượng LAD chỉ đúng khi cỡ mẫu lớn. Variable Coefficient Std. Error t-Statistic Prob. • LAD luơn luơn ước lượng khơng vững các tham số xuất hiện trong hàm hồi quy trung bình cĩ điều kiện E(y/x1, xk). C 2.622954 0.585494 4.479896 0.0001 SALES 5.35E-05 4.41E-05 1.214138 0.2345 • Để LAD ước lượng vững trung bình cĩ điều kiện E(y/x1, xk) thì cần thêm 2 giả thiết (ngồi các giả thiết đã biết): PROFMARG 0.044744 0.046179 0.968926 0.3406 – Phân phối của u|x1, , xk đối xứng qua giá trị 0. R-squared 0.076490 Mean dependent var 3.265625 – u độc lập với (x1, , xk). Adjusted R-squared 0.012800 S.D. dependent var 1.874079 S.E. of regression 1.862047 Akaike info criterion 4.170290 Sum squared resid 100.5493 Schwarz criterion 4.307702 Log likelihood -63.72464 Hannan-Quinn criter. 4.215838 F-statistic 1.200970 Durbin-Watson stat 1.694915 Prob(F-statistic) 0.315429 41 42 PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU VẤN ĐỀ DẠNG HÀM VÀ DỮ LIỆU Dependent Variable: RDINTENS (LAD) Method: Quantile Regression (Median) • Kiểm tra giả thiết MLR4: Included observations: 32 Xem Chương 15, mục 15.5 Huber Sandwich Standard Errors & Covariance Sparsity method: Kernel (Epanechnikov) using residuals Bandwidth method: Hall-Sheather, bw=0.30602 Estimation successfully identifies unique optimal solution Variable Coefficient Std. Error t-Statistic Prob. C 1.620740 0.699333 2.317552 0.0277 SALES 1.87E-05 4.99E-05 0.374881 0.7105 PROFMARG 0.118251 0.062049 1.905760 0.0666 Pseudo R-squared 0.059663 Mean dependent var 3.265625 Adjusted R-squared -0.005188 S.D. dependent var 1.874079 S.E. of regression 2.008451 Objective 19.89753 Quantile dependent var 2.620000 Restr. objective 21.16000 Sparsity 4.885282 Quasi-LR statistic 2.067383 Prob(Quasi-LR stat) 0.355692 43 44 11
- Chương 9 - Nhập mơn Kinh tế lượng * Jeffrey M. 09.12.2017 Wooldridge Mời ghé thăm trang web: 45 12