Kinh tế lượng - Chương 3: Phân tích hồi quy bội: Vấn đề ước lượng

pdf 12 trang vanle 2160
Bạn đang xem tài liệu "Kinh tế lượng - Chương 3: Phân tích hồi quy bội: Vấn đề ước lượng", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkinh_te_luong_chuong_3_phan_tich_hoi_quy_boi_van_de_uoc_luon.pdf

Nội dung text: Kinh tế lượng - Chương 3: Phân tích hồi quy bội: Vấn đề ước lượng

  1. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Phân tích hồi quy bội: • Hồi quy đơn (hồi quy 2 biến) • y = β0+β1x1+u Vấn đề ước lượng • β0: hệ số chặn • β1: hệ số gĩc • Hồi quy bội 3 biến Chương 3 • y = β0+β1x1+β2x2+u 3.3 • Hồi quy bội 4 biến • y = β0+β1x1+β2x2+β3x3+u Wooldridge: Introductory Econometrics: • β0: hệ số chặn A Modern Approach, 5e • β1,β2, β3: hệ số gĩc • y: biến phụ thuộc • x1, x2, x3: biến độc lập • u: sai số ngẫu nhiên, nhiễu • β0, β1,β2, β3: hệ số hồi quy © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 2 Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng 3.1 Sự cần thiết nghiên cứu hồi quy bội Sự cần thiết của hồi quy bội Định nghĩa mơ hình hồi quy bội (k+1 biến) Đưa thêm nhiều biến giải thích vào mơ hình “Giải thích biến theo các biến “ Thực hiện phân tích trong điều kiện giữ các yếu tố khác khơng đổi, Hệ số chặn Các hệ số gĩc trừ các yếu tố trong Cho phép sử dụng dạng hàm đa dạng hơn 3.6 Ví dụ: Phương trình tiền lương Cho phép đo lường tác động của trình độ học vấn lên lương trong điều kiện kinh nghiệm là khơng đổi Biến phụ thuộc Sai số ngẫu nhiên, Tất cả các yếu tố khác Biến được giải thích, Biến độc lập, Nhiễu, Biến phản ứng, Biến giải thích, 3.1 Phần chưa quan sát được, Biến kiểm sốt, Tiền lương (USD/giờ) Số năm đi học Kinh nghiệm lao động 3.8 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 1
  2. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng Ví dụ: Điểm kiểm tra trung bình và chi phí trên mỗi sinh viên Ví dụ: Thu nhập và chi tiêu của hộ gia đình 3.4 3.2 Các yếu tố khác Các yếu tố khác Điểm trung bình của Chi phí trên mỗi sinh Thu nhập trung bình Chi tiêu của hộ Thu nhập của hộ Thu nhập của hộ bình phương bài thi chuẩn hĩa viên của trường của gia đình các sinh viên trong trường Mơ hình cĩ hai biến giải thích: thu nhập và thu nhập bình phương Chi phí trên mỗi sinh viên cĩ thể tương quan với thu nhập trung bình của Chi tiêu được giải thích bằng hàm bậc hai của thu nhập các gia đình do vấn đề tài chính Cần cẩn thận khi diễn giải ý nghĩa của các hệ số hồi quy: Nếu bỏ biến thu nhập trung bình của gia đình ra khỏi hàm hồi quy cĩ thể dẫn tới ước lượng tác động của chi phí trên mỗi sinh viên đến điểm trung Mức chi tiêu tăng thêm bao Phụ thuộc vào bình bị chệch. nhiêu đơn vị nếu thu nhập mức chi tiêu cụ tăng thêm một đơn vị? thể đang xét Trong hồi quy đơn, tác động của biến chi phí trên mỗi sinh viên đến điểm số cĩ thể đã bao gồm luơn tác động của biến thu nhập trung bình của gia đình © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng 3.2 Cách thực hiện và diễn giải của phương pháp OLS Ví dụ: tiền lương của CEO, doanh thu và thâm niên của CEO Ước lượng OLS của mơ hình hồi quy bội: 3.7 Mẫu ngẫu nhiên Log của thu nhập CEO Log của doanh thu Hàm bậc hai của số năm thâm niên làm CEO Mơ hình giả định rằng hệ số co giãn của tiền lương CEO theo doanh Phần dư thu của doanh nghiệp là hằng số. 3.11’ Mơ hình giả định rằng mối quan hệ giữa tiền lương CEO và thâm niên Cực tiểu tổng bình phương phần dư làm CEO cĩ dạng hàm bậc hai Ý nghĩa của sự “tuyến tính“ trong hồi quy 3.12’ Mơ hình phải tuyến tính theo tham số (khơng phải theo biến số) Việc tìm giá trị cực tiểu sẽ được thực hiện bởi phần mềm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 2
  3. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng Diễn giải ý nghĩa của mơ hình hồi quy bội Ví dụ 3.1: Các yếu tố tác động đến điểm GPA Cho biết lượng thay đổi của biến phụ thuộc khi biến độc 3.15 lập thứ j thay đổi một đơn vị, trong điều kiện các biến độc lập khác và sai số khơng đổi Điểm GPA trung bình của Điểm GPA trung bình khi Kết quả bài kiểm tra thành tích sinh viên ở đại học học phổ thơng trung học Mơ hình hồi quy bội cho phép giữ nguyên giá trị của các biến giải Diễn giải thích khác khơng đổi, ngay cả khi trong thực tế cĩ thể các biến giải Trong điều kiện ACT khơng đổi, mỗi điểm GPA trung học tăng thêm cĩ thể thích này là cĩ tương quan với nhau. làm tăng 0,453 điểm GPA đại học Cách diễn giải này được gọi là “Các yếu tố khác khơng đổi“ Hoặc: Nếu chúng ta so sánh hai sinh viên cĩ cùng ACT nhưng điểm hsGAP Chúng ta vẫn cần giả định rằng các yếu tố khơng quan sát được u sẽ của sinh viên A cao hơn 1 điểm so với sinh viên B, thì chúng ta dự đốn rằng khơng thay đổi khi biến giải thích thay đổi. sinh viên A sẽ cĩ colGPA cao hơn 0,453 điểm so với sinh viên B Trong điều kiện điểm hsGPA như nhau, mỗi 10 điểm ACT cao hơn cĩ thể làm điểm colGAP cao hơn 0,0094*10 = 0,094 điểm © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. PHÂN TÍCH HỒI QUY BỘI: Phân tích hồi quy bội: VẤN ĐỀ ƯỚC LƯỢNG Vấn đề ước lượng • Tập tin gpa1.wf1 Cách diễn giải tác động riêng phần trong hồi quy bội: Dependent Variable: COLGPA Hệ số hồi quy của biến giải thích trong mơ hình hồi quy bội cĩ Method: Least Squares Included observations: 141 thể được ước lượng và cĩ thể tính tốn được bằng hai bước sau: Variable Coefficient Std. Error t-Statistic Prob. 1) Hồi quy biến giải thích này theo tất cả các biến giải thích cịn lại C 0.902058 0.650366 1.387001 0.1677 2) Hồi quy theo phần dư của hàm hồi quy ở bước 1 HSGPA 0.433794 0.097088 4.468031 0.0000 Tại sao cách này cĩ thể thực hiện được? ACT 0.014486 0.010578 1.369538 0.1731 SKIPPED -0.080661 0.026173 -3.081854 0.0025 Phần dư của hàm hồi quy ở bước 1 đĩ chính là phần cịn lại của biến AGE 0.019904 0.022838 0.871566 0.3850 giải thích và phần cịn lại này khơng tương quan với các biến giải R-squared 0.237850 Mean dependent var 3.056738 thích khác trong mơ hình Hệ số gĩc trong hàm hồi quy ở bước 2 chính là tác động đã tách biệt của riêng biến giải thích đĩ đến biến phụ thuộc © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 12 3
  4. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG VẤN ĐỀ ƯỚC LƯỢNG Dependent Variable: HSGPA Method: Least Squares Dependent Variable: COLGPA Included observations: 141 Method: Least Squares Included observations: 141 Variable Coefficient Std. Error t-Statistic Prob. C 3.793037 0.471721 8.040848 0.0000 Variable Coefficient Std. Error t-Statistic Prob. ACT 0.038582 0.008705 4.432224 0.0000 SKIPPED -0.043514 0.022730 -1.914419 0.0577 C 3.056738 0.029654 103.0787 0.0000 AGE -0.061095 0.019407 -3.148103 0.0020 VM 0.433794 0.103668 4.184439 0.0001 R-squared 0.194848 Mean dependent var 3.402128 R-squared 0.111875 Mean dependent var 3.056738 • HSGPA = β0 + β1 ACT + β2 SKIPPED + β3 AGE + v • Dùng lệnh Genr: vm=resid 13 14 Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng Tính chất của ước lượng OLS với một mẫu dữ liệu bất kỳ Mức độ phù hợp của hàm SRF so với mẫu khảo sát Giá trị ước lượng (Fitted values) và phần dư Sự phân rã của tổng mức biến động 3.20 3.21 3.27 Lưu ý rằng R2 luơn tăng khi thêm biến độc lập vào hàm hồi quy 2 Giá trị ước lượng/Giá trị dự đốn Phần dư R bình phương (R ) 3.28 Tính chất đại số của hồi quy OLS Các biểu diễn khác của R bình phương R2 bằng bình phương của hệ số tương quan giữa giá trị thực tế và giá trị ước lượng của biến phụ thuộc = ( r(y,y^)2 ) 3.29 Tổng phần dư bằng 0 Tương quan giữa biến độc Trung bình mẫu của biến phụ lập xj và phần dư bằng 0 thuộc và các biến độc lập nằm trên đường hồi quy Tính chất: 0 R2 1 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 4
  5. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ Ví dụ 3.5: Hàm hồi quy giải thích cho biến số lần bị bắt giữ (tt) Tỷ lệ số lần bắt Nếu thêm một biến giải thích khác avgsen vào mơ hình: Số lần bị bắt giữ giữ cĩ dẫn đến bị Số tháng bị giam Số quý làm việc trong năm 1986 buộc tội trước đĩ trong năm 1986 trong năm 1986 (khơng phải %) Mức phạt trung bình của các lần phạm tội trước R2 chỉ tăng nhẹ Diễn giải: Diễn giải: Tỷ lệ số lần bị bắt giữ trước đĩ tăng 0,5 lần thì dẫn đến số lần bị bắt giữ Mức phạt trung bình của các lần phạm tội trước cĩ làm tăng số lần bị bắt giữ (?) giảm đi 0,15*0,5 = 0,075 lần (trên 1 người) hay 7,5 lần (trên 100 người) Vai trị của biến giải thích mới thêm vào khá hạn chế khi R2 tăng rất ít Số tháng bị giam tăng 12 tháng thì dẫn đến số lần bị bắt giữ của người đĩ 2 giảm 0,034*12 = 0,408 lần Lưu ý chung về R 2 Số quý làm việc trong năm tăng 1 dẫn đến số lần bị bắt giữ của người đĩ Ngay cả khi R khá nhỏ (như trong ví dụ), hàm hồi quy vẫn cĩ thể dùng để phân giảm 0,104 lần (trên 1 người) hay 10,4 lần (trên 100 người) tích tác động nhân quả riêng phần theo dạng “giữ các yếu tố khác cố định“ © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. PHÂN TÍCH HỒI QUY BỘI: Phân tích hồi quy bội: VẤN ĐỀ ƯỚC LƯỢNG Vấn đề ước lượng Khái niệm đa cộng tuyến Xét mô hình hồi quy bội: 3.3 Giá trị kỳ vọng của ước lượng OLS y = β0 + β1x1 + β2x2 + u Các giả thiết của mơ hình hồi quy bội: y y Giả thiết MLR.1 (Tuyến tính theo tham số) Trong tổng thể, mối liên hệ giữa biến phụ thuộc y và các biến độc lập là tuyến tính theo tham số x1 x2 x1 x2 3.31 Giả thiết MLR.2 (Mẫu ngẫu nhiên) Không có ĐCT ĐCT thấp Mẫu dữ liệu được chọn ngẫu nhiên từ tổng thể y y x2 3.32 x1 x1 x2 x1 x2 Vì vậy, mỗi quan sát đều tuân theo hàm hồi quy tổng thể ĐCT vừa ĐCT cao ĐCT hoàn hảo © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 20 5
  6. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG VẤN ĐỀ ƯỚC LƯỢNG Cách tiếp cận đại số của vấn đề đa cộng tuyến: Xét mơ hình hồi quy bội với hai biến độc lập x1, x2:  Nếu tồn tại các số thực 1, , k khơng đồng thời bằng y = β0+β1x1+ β2x2+u 0 và “số thực” c sao cho: * Nếu cĩ đa cộng tuyến hồn hảo, tồn tại ít nhất một i 0 1x1 + 2x2 + + kxk = c (i= 1, 2) và c sao cho: thì ta nĩi giữa các biến xi (i =1, , k) xảy ra hiện tượng đa cộng tuyến hồn hảo. Ta nĩi các biến xi (i =1, , k) cĩ quan hệ tuyến 1x1+ 2x2 = c tính chính xác. 1 c  Nếu tồn tại các số thực 1, , k khơng đồng thời bằng Giả sử 2 ≠ 0 x x  x c' 2 2 1 1 0 và “số thực” c sao cho: 2 0 + 1x1 + 2x2 + + k 1xk 1 + v = c * Nếu cĩ đa cộng tuyến khơng hồn hảo, tồn tại ít nhất một i 0 với v là sai số ngẫu nhiên (i= 1, 2) và c sao cho: thì ta nĩi giữa các biến xi (i =1, , k) xảy ra hiện tượng đa cộng 1x1+ 2x2+v = c (v là sai số ngẫu nhiên) tuyến khơng hồn hảo. Ta nĩi các biến xi (i =1, , k) cĩ quan hệ tuyến tính khơng chính xác. 1 1 c Giả sử 2 ≠ 0 x x v  xvc ' ' 22 1 2 2 1 21 22 PHÂN TÍCH HỒI QUY BỘI: PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG VẤN ĐỀ ƯỚC LƯỢNG Xét mơ hình hồi quy bội với hai biến độc lập x1, x2: Ví dụ: y = β0+β1x1+ β2x2+u Ta cĩ dữ liệu giả định của các biến sau: Xét hệ số tương quan r = r(x1,x2), ta cĩ: 0 |r| 1 * x1 x2 x2 v • r = 0: x1, x2 khơng cĩ đa cộng tuyến 10 50 52 2 15 75 75 0 • r ≠ 0: x1, x2 cĩ đa cộng tuyến 18 90 97 7 – |r| càng gần 1 thì mức độ ĐCT càng cao 24 120 129 9 – |r| càng gần 0 thì mức độ ĐCT càng thấp 30 150 152 2 – |r|=1: ĐCT hồn hảo x1, x2 cĩ đa cộng tuyến hồn hảo? Lưu ý: Chỉ đúng cho mơ hình cĩ 2 biến độc lập. x1, x2* cĩ đa cộng tuyến hồn hảo? 23 24 6
  7. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 PHÂN TÍCH HỒI QUY BỘI: Phân tích hồi quy bội: VẤN ĐỀ ƯỚC LƯỢNG Vấn đề ước lượng Ví dụ (tt): Ta cĩ x2 = 5x1 nên x1 và x2 cĩ đa cộng tuyến hồn hảo. Các giả thiết của mơ hình hồi quy bội: (tt) Ta thấy hệ số tương quan r(x1,x2) = 1. Giả thiết MLR.3 (Khơng cĩ cộng tuyến hồn hảo) * * Trong mẫu (và vì vậy trong tổng thể), khơng cĩ biến độc lập nào là hằng Ta cĩ x2 = 5x1+v, nên x1 và x2 cĩ đa cộng tuyến khơng hồn hảo. * số và khơng cĩ phụ thuộc tuyến tính chính xác giữa các biến độc lập Ta thấy r(x1,x2*) = 0,9959 nên x1 và x2 cĩ đa cộng tuyến cao, gần hồn hảo. Lưu ý về giả thiết MLR.3 Giả thiết này chỉ loại trừ trường hợp cộng tuyến/tương quan hồn hảo giữa các biến độc lập; các tương quan khơng hồn hảo vẫn cĩ thể xảy ra Nếu một biến độc lập là tổ hợp tuyến tính chính xác của các biến độc lập khác thì biến độc lập đĩ là khơng cần thiết và sẽ bị loại bỏ ra khỏi hàm hồi quy Biến hằng số cũng bị loại bỏ (vì cộng tuyến hồn hảo với hệ số chặn) 25 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng Ví dụ về cộng tuyến hồn hảo: trường hợp mẫu nhỏ Các giả thiết của mơ hình hồi quy bội: (tt) Giả thiết MLR.4 (Trung bình cĩ điều kiện bằng 0) Giá trị của các biến giải thích khơng chứa Trong mẫu nhỏ, biến avginc cĩ thể vơ tình là bội số của biến expend; khi đĩ bất kỳ thơng tin nào về giá trị trung bình khơng thể tách bạch tác động riêng phần cho từng biến vì biến động của chúng là 3.36 của các yếu tố khơng quan sát được như nhau Trong mơ hình hồi quy bội, giả thiết trung bình cĩ điều kiện bằng 0 Ví dụ về cộng tuyến hồn hảo: mối liên hệ giữa các biến độc lập cĩ nhiều khả năng được thỏa mãn hơn vì cĩ ít yếu tố được gộp vào sai số ngẫu nhiên hơn so với hồi quy đơn. Ví dụ: Điểm kiểm tra trung bình Hoặc shareA hoặc shareB sẽ bị loại ra khỏi mơ hình vì cĩ mối liên hệ tuyến tính chính xác giữa chúng: shareA + shareB = 1 Nếu avginc khơng được đưa vào mơ hình, biến này sẽ nằm trong sai số; khi đĩ, khĩ cĩ thể khẳng định rằng biến expend khơng cĩ tương quan với sai số. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 7
  8. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng Thảo luận về giả thiết trung bình cĩ điều kiện bằng 0 Việc thêm biến khơng liên quan vào mơ hình hồi quy Các biến giải thích cĩ tương quan với sai số được gọi là biến nội sinh; Sự 3.38 nội sinh là trường hợp vi phạm giả thiết MLR.4 Các biến giải thích khơng tương quan với sai số được gọi là biến ngoại Khơng cĩ vấn đề gì vì = 0 trong tổng thể sinh; MLR.4 được thỏa mãn nếu tất cả các biến giải thích là ngoại sinh Sự ngoại sinh là giả thiết quan trọng cho việc diễn giải quan hệ nhân quả Tuy nhiên, việc thêm biến khơng liên quan cĩ thể làm tăng phương sai mẫu. của hồi quy bội, và cho tính khơng chệch của ước lượng OLS Bỏ sĩt biến cĩ liên quan: trường hợp đơn giản Định lý 3.1 (Tính khơng chệch của OLS) 3.40 3.37 Mơ hình đúng (chứa x1 và x2) Tính khơng chệch là tính chất về trung bình của các mẫu; cịn khi xét một Mơ hình ước lượng (x bị bỏ sĩt) mẫu cụ thể, ước lượng tính được từ mẫu đĩ cĩ thể khác xa giá trị đúng. 2 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng Chệch do bỏ sĩt biến Ví dụ: Bỏ sĩt biến năng lực khi hồi quy tiền lương Giả sử x1 và x2 cĩ tương quan và mối quan hệ giữa chúng là tuyến tính 3.42 Cả hai đều cĩ thể mang dấu dương Suấtsinhlợigiáodục sẽbịướclượngcaohơnthựctếdo .t Kếtquảhồi quy cho thấy rằng người càng cĩ nhiều năm đi học thì tiền lương sẽ rất cao, nhưng kết Đây là hệ số chặn ước Phần sai số Đây là hệ số gĩc của quả này cĩ thể đúng một phần, nhưng cũng cĩ thể là do người cĩ trình độ học vấn càng lượng được khi y chỉ x1 khi y chỉ hồi quy cao thì nhìn chung năng lực cũng càng cao. hồi quy theo x1 theo x1 Khi nào bỏ sĩt biến khơng gây ra sự chệch cho ước lượng? Kết luận: Tất cả các hệ số ước lượng được đều bị chệch Khi biến bỏ sĩt khơng liên quan hoặc khơng tương quan với các biến giải thích trong mơ hình. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 8
  9. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng 3.4 Phương sai của ước lượng OLS Tính chệch do bỏ sĩt biến: trường hợp tổng quát hơn Các giả thiết của mơ hình hồi quy bội: (tt) Mơ hình đúng (gồm x1, x2 và x3) Giả thiết MLR.5 (Phương sai thuần nhất) 3.49 Giá trị của các biến giải thích khơng hàm chứa bất kỳ thơng tin nào về phương sai Mơ hình ước lượng (x bị bỏ sĩt) 3 của các yếu tố chưa quan sát được. Khơng thể xác định rõ được chiều hướng của phần chệch Ví dụ: phương trình tiền lương Giả thiết này cĩ thể sẽ khĩ kiểm Phân tích như trường hợp đơn giản nếu một biến độc lập khơng chứng trong nhiều trường hợp tương quan với các biến độc lập khác Ví dụ: Bỏ sĩt biến ability trong phương trình hồi quy tiền lương Tất cả các biến giải thích được ký Cách ký hiệu ngắn gọn hiệu chung dưới dạng vector Nếu exper gần như khơng tương quan với educ và abil, thì chiều hướng của với phần chệch do bỏ sĩt biến cĩ thể được phân tích như trong trường hợp đơn giản chỉ cĩ hai biến đã xét trước đĩ. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng Định lý 3.2 (Phương sai mẫu của các hệ số gĩc ước lượng OLS) Các thành phần của phương sai ước lượng OLS (vấn đề đa cộng tuyến): 1) Phương sai của sai số Dưới các giả thiết từ MLR.1 đến MLR.5: Phương sai sai số càng lớn sẽ càng làm tăng phương sai ước lượng vì cĩ nhiều Phương sai của sai số “nhiễu“ hơn trong phương trình Phương sai sai số lớn sẽ làm cho việc ước lượng kém chính xác Phương sai sai số khơng giảm khi kích thước mẫu tăng lên 2) Tổng biến động trong mẫu của biến giải thích 2 Tổng biến động trong mẫu R cĩ được khi hồi quy biến độc lập xj theo tất cả Tổng biến động trong mẫu của biến giải thích càng nhiều thì ước lượng thu được của biến giải thích x : các biến độc lập khác (hồi quy cĩ hệ số chặn) j càng chính xác (more precise) Tổng biến động trong mẫu sẽ tự động tăng khi kích thước mẫu tăng Vì vậy, tăng kích thước mẫu sẽ làm tăng sự chính xác (precision) của ước lượng © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 9
  10. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng 3) Mối quan hệ tuyến tính giữa các biến độc lập Một ví dụ về đa cộng tuyến Các chi phí cho Hồi quy theo tất cả các biến độc lập khác (cĩ hệ số chặn) Điểm trung bình bài thi Chi phí cho nguyên vật liệu Các chi phí khác chuẩn hĩa của trường giáo viên dạy học 2 R của phương trình này càng cao thì xj càng được giải thích nhiều hơn bởi các biến độc lập khác Phương sai mẫu của sẽ càng lớn khi càng được giải thích nhiều bởi các biến độc lập khác Các loại chi phí sẽ cĩ tương quan mạnh với nhau bởi vì một trường học cĩ nguồn lực lớn sẽ chi tiêu lớn cho tất cả các khoản chi. Vấn đề các biến độc lập gần như phụ thuộc tuyến tính nhau được gọi Rất khĩ để ước lượng tác động riêng phần của từng loại chi phí bởi vì tất cả các khoản chi là vấn đề đa cộng tuyến (nghĩa là . với một vài nào đĩ) thường cùng cao hoặc cùng thấp. Để ước lượng tác động một cách chính xác (precise), chúng ta cần thêm các quan sát mà các khoản chi phí này khác nhau một cách đáng kể. Kết quả là, phương sai mẫu của các hệ số hồi quy ước lượng được sẽ lớn. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. PHÂN TÍCH HỒI QUY BỘI: Phân tích hồi quy bội: VẤN ĐỀ ƯỚC LƯỢNG Vấn đề ước lượng • Tập tin gpa1.wf1 Dependent Variable: COLGPA Method: Least Squares Thảo luận về vấn đề đa cộng tuyến Included observations: 141 Variable Coefficient Std. Error t-Statistic Prob. Trong các ví dụ trên, cĩ thể sẽ tốt hơn nếu gom tất cả các khoản chi phí vào C 0.902058 0.650366 1.387001 0.1677 thành một yếu tố vì khơng thể tách biệt tác động của từng khoản chi HSGPA 0.433794 0.097088 4.468031 0.0000 ACT 0.014486 0.010578 1.369538 0.1731 Trong một số trường hợp, việc loại bỏ một số biến độc lập cĩ thể làm giảm SKIPPED -0.080661 0.026173 -3.081854 0.0025 AGE 0.019904 0.022838 0.871566 0.3850 đa cộng tuyến (nhưng cách làm này cĩ thể dẫn tới sự chệch do bỏ sĩt biến) R-squared 0.237850 Mean dependent var 3.056738 Chỉ cĩ phương sai mẫu của biến bị đa cộng tuyến bị “phĩng đại“, ước lượng Variance Inflation Factors của các biến giải thích khác cĩ thể khơng bị ảnh hưởng. Included observations: 141 Lưu ý rằng đa cộng tuyến khơng vi phạm giả thiết MLR.3 Coefficient Uncentered Centered Variable Variance VIF VIF Đa cộng tuyến cĩ thể được phát hiện thơng qua “nhân tử phĩng đại phương C 0.422975 548.3964 NA HSGPA 0.009426 142.6962 1.242002 sai“ Kinh nghiệm: nhân tử phĩng đại ACT 0.000112 85.81015 1.165185 phương sai khơng nên lớn hơn 10 SKIPPED 0.000685 2.074317 1.045578 AGE 0.000522 296.0775 1.084732 VIF > 10: cĩ đa cộng tuyến cao ; VIF < 10: cĩ đa cộng tuyến thấp VIF < 10 : các biến độc lập cĩ đa cộng tuyến thấp © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 40 10
  11. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 PHÂN TÍCH HỒI QUY BỘI: VẤN ĐỀ ƯỚC LƯỢNG Phân tích hồi quy bội: • Cách phát hiện đa cộng tuyến: Vấn đề ước lượng • Dấu của hệ số hồi quy bị sai 2 • Hệ số xác định R cao nhưng tỷ số |t| thấp Phương sai trong mơ hình bị định dạng sai • Hệ số tương quan cặp giữa các biến độc lập cao Việc thêm hay khơng thêm một biến độc lập nào đĩ vào mơ hình cĩ • Kiểm định sử dụng hồi quy phụ thể được xem xét dựa trên sự đánh đổi giữa tính chệch và tính • Nhân tử phĩng đại phương sai VIF hiệu quả của ước lượng Mơ hình đúng của tổng thể • Cách khắc phục đa cộng tuyến: • Sử dụng thơng tin tiên nghiệm 3.52 Mơ hình ước lượng 1 • Thu thập thêm số liệu hoặc lấy thêm mẫu mới • Kết hợp số liệu chéo và số liệu chuỗi thời gian p 3.53 Mơ hình ước lượng 2 • Bỏ bớt biến độc lập • Dùng sai phân cấp 1 Sự chệch do bỏ sĩt biến ở mơ hình bị định dạng sai (mơ hình 2) được • Thay đổi dạng hàm của biến bù đắp bằng phương sai nhỏ của ước lượng thu được 41 © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng Phương sai trong mơ hình bị định dạng sai (tt.) Ước lượng phương sai của sai số 3.54 Xét điều kiện theo x1 và x2 , 3.56 phương sai trong mơ hình 2 luơn nhỏ hơn trong mơ hình 1 3.55 Ước lượng khơng chệch của phương sai sai số cĩ thể tính được dựa trên việc xem xét bậc tự do của mơ hình (df). Bậc tự do cĩ được bằng cách lấy số quan sát trừ cho số tham số. Trường hợp 1: Kết luận: Khơng thêm biến khơng liên quan vào mơ hình Cĩ n sai số bình phương nhưng các thành phần này khơng hồn tồn độc lập mà liên quan với nhau thơng qua k+1 phương trình xác định bởi điều kiện bậc nhất của bài tốn tìm cực tiểu. df = n-(k+1) = số quan sát – số tham số cần ước lượng 3.57 Sự đánh đổi giữa tính chệch và tính hiệu quả Trường hợp 2: Lưu ý: tính chệch khơng biến mất ngay cả khi xét mẫu lớn Định lý 3.3 (Ước lượng khơng chệch của phương sai sai số) © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 11
  12. Chương 3 - Nhập mơn Kinh tế lượng * Jeffrey M. Wooldridge 09.12.2017 Phân tích hồi quy bội: Phân tích hồi quy bội: Vấn đề ước lượng Vấn đề ước lượng Ước lượng phương sai mẫu của các ước lượng OLS 3.5 Tính hiệu quả của OLS: Định lý Gauss-Markov Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là khơng chệch Độ lệch chuẩn đúng của ước Tuy nhiên, dưới các giả thiết này, cũng cĩ nhiều ước lượng khác là lượng của khơng chệch Thay cho phương sai chưa biết Ước lượng khơng chệch nào cĩ phương sai nhỏ nhất? Độ lệch chuẩn ước Để trả lời câu hỏi này, chúng ta thường xét trong lớp các ước lượng lượng của ước lượng của 3.58 tuyến tính, nghĩa là ước lượng là tuyến tính theo biến phụ thuộc. Mặc dù cĩ thể cĩ dạng hàm bất kỳ theo giá trị mẫu Lưu ý rằng các cơng thức này chỉ đúng dưới các giả thiết từ MLR.1 3.60 của tất cả các biến giải thích; ước lượng OLS luơn đến MLR.5 (cụ thể là phải cĩ giả thiết phương sai thuần nhất) cĩ thể đưa về dạng này © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. Phân tích hồi quy bội: Mời ghé thăm trang web: Vấn đề ước lượng 48 Định lý 3.4 (Định lý Gauss-Markov)  Dưới các giả thiết MLR.1 - MLR.5, ước lượng OLS là ước lượng tuyến  tính khơng chệch tốt nhất (BLUE) của các hệ số hồi quy. “Tốt nhất“ nghĩa là “cĩ phương sai nhỏ nhất“ : với mọi sao cho. OLS chỉ cĩ thể là ước lượng tốt nhất nếu MLR.1 – MLR.5 thỏa mãn; nếu các giả thiết này vi phạm, ví dụ phương sai thay đổi, sẽ cĩ ước lượng khác tốt hơn. © 2013 Cengage Learning. All Rights Reserved. May not be scanned, copied or duplicated, or posted to a publicly accessible website, in whole or in part. 12