Kinh tế học - Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi qui

pdf 79 trang vanle 2120
Bạn đang xem 20 trang mẫu của tài liệu "Kinh tế học - Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi qui", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkinh_te_hoc_chuong_3_suy_dien_thong_ke_va_du_bao_tu_mo_hinh.pdf

Nội dung text: Kinh tế học - Chương 3: Suy diễn thống kê và dự báo từ mô hình hồi qui

  1. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số CHƯƠNG 3 SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY Vũ Duy Thành thanhvu.mfe.neu@gmail.com Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân Hà Nội, 2015 Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 1
  2. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ý nghĩa của suy diễn thống kê Câu hỏi tình huống Để đánh giá tác động của số năm đi học và số năm kinh nghiệm lên lương của người lao động. Thu thập thông tin của 100 công nhân, ước lượng mô hình thu được hàm hồi quy mẫu: wage[ i = 2, 3 + 0.25educi + 0.2experi Ý nghĩa của các hệ số trong hàm hồi quy mẫu ở trên? Các hệ số đó phản ánh mối quan hệ trong mẫu nhưng có phản ánh đầy đủ mối quan hệ trong tổng thể? Trong mẫu này, gia tăng một năm đi học mang lại nhiều tiền lương hơn thêm một năm kinh nghiệm? Điều này có đúng trong toàn tổng thể? Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 2
  3. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ý nghĩa của suy diễn thống kê Câu hỏi tình huống Mẫu 1: wage[ i = 2, 3 + 0.25educi + 0.2experi Ước lượng mô hình trên với một mẫu 100 công nhân khác thu được: Mẫu 2: wage[ i = 2, 2 + 0.21educi + 0.24experi Kết quả từ mẫu 2 có gì khác mẫu 1? Trong thực tế tổng thể, liệu tăng 1 năm đi học có thực sự mang lại nhiều lương hơn thêm 1 năm kinh nghiệm? Trong tổng thể, thêm một năm kinh nghiệm tác động thế nào đến mức lương? Tăng 1 năm kinh nghiệm, có làm lương tăng nhiều hơn 220 nghìn đồng? Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 3
  4. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ý nghĩa của suy diễn thống kê Từ các câu hỏi tình huống trên có thể nhận thấy: Các hệ số ước lượng từ hàm hồi quy mẫu chỉ phản ánh quy luật của mẫu đó. Để biết được mối quan hệ trong tổng thể, cần thực hiện các suy diễn thống kê cho tổng thể từ thông tin mẫu. Có hai dạng suy diễn thống kê là ước lượng khoảng tin cậy và kiểm định.giả thuyết Bài toán ước lượng cho biết khoảng tác động của một biến hay một nhóm biến trong tổng thể. với độ tin cậy nhất định. Bài toán kiểm định giả thuyết kiểm tra tính đúng đắn của các giả thuyết thống kê đối với toàn tổng thể dựa trên thông tin mẫu với mức ý nghĩa nhất định. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 4
  5. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Nội dung 1 QUY LUẬT PPXS CỦA MỘT SỐ THỐNG KÊ MẪU 2 ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY 3 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VÊ HỆ SỐ HỒI QUY 4 ĐÁNH GIÁ SAI SỐ DỰ BÁO Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 5
  6. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Nội dung 1 QUY LUẬT PPXS CỦA MỘT SỐ THỐNG KÊ MẪU 2 ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY 3 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VÊ HỆ SỐ HỒI QUY 4 ĐÁNH GIÁ SAI SỐ DỰ BÁO Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 6
  7. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Nhắc lại các giả thiết của phương pháp OLS Giả thiết Giả thiết 1: Việc ước lượng được dựa trên cơ sở mẫu ngẫu nhiên. Giả thiết 2: Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (X2i , , Xki ) bằng 0: E(u|X2i , , Xki ) = 0, ∀i . Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 7
  8. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Nhắc lại các giả thiết của phương pháp OLS Giả thiết Giả thiết 3: Phương sai của sai số ngẫu nhiên tại các giá trị (X2i , , Xki ) đều bằng nhau: 2 Var(u|X2i , , Xki ) = σ , ∀i Giả thiết 4: Giữa các biến độc lập Xj , j = 2, , k không có mối quan hệ tuyến tính, nghĩa là không tồn tại các hằng số (λ2, . . . , λk ) không đồng thời bằng 0 sao cho: λ2X2 + ··· + λk Xk = 0 . Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 8
  9. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Định lý Gauss - Markov Định lý (Định lý Gauss – Markov) Khi các giả thiết 1- 4 thỏa mãn thì các ước lượng thu được từ phương pháp OLS là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch (BLUE - Best Linear Unbiased Estimator). Từ định lý Gauss - Markov, thu được: E(βˆj ) = βj (βˆj là ước lượng không chệch của βj ) Sai số chuẩn của βˆj , kí hiệu se(βˆj ): s 2 s ˆ σˆ RSS/(n − k) Se(βj ) = 2 P 2 = 2 P 2 (1 − Rj ) xji (1 − Rj ) xji Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 9
  10. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Quy luật phân phối của βˆj - Giả thiết số 5 Với mô hình HQTT k biến: Y = β1 + β2X2 + + βk Xk + u Từ mẫu kích thước n: (X2i , , Xki , Yi ), i = 1, 2, , n thu được: ˆ ˆ ˆ ˆ Hàm hồi quy mẫu: Yi = β1 + β2X2i + + βk Xki Để có thể đưa ra các suy diễn cho hệ số hồi quy trong tổng thể cần biết quy luật phân phối của βˆj . Để có được quy luật phân phối của βˆj , giả thiết thứ 5 sẽ được đề xuất. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 10
  11. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Quy luật phân phối của βˆj - Giả thiết số 5 Giả thiết Giả thiết 5: Sai số ngẫu nhiên tuân theo quy luật phân phối chuẩn: 2 ui ∼ N(0, σ ) Các giả thiết 1 - 5 gọi là các GThiết của MH HQTT cổ điển. MH thỏa mãn cả 5 giả thiết trên gọi là MH HQTT cổ điển. Khi có thêm GThiết 5, các ước lượng OLS sẽ trở thành ước lượng không chệch tốt nhất (BUE) kể cả trong các ước lượng tuyến tính hay phi tuyến. Kết quả này mạnh hơn cả định lý Gauss - Markow khi các ước lượng chỉ là ước lượng tuyến tính tốt nhất (BLUE) với 4 GThiết đầu. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 11
  12. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Quy luật phân phối của βˆj Định lý Định lý 3.1: Khi các giả thiết từ 1-5 thỏa mãn thì: βˆj ∼ N(βj , var(βˆj )) Định lý 3.2: Khi các giả thiết từ 1-5 thỏa mãn thì: βˆj − βj t = ∼ Tn−k se(βˆj ) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 12
  13. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Quy luật phân phối của aβˆj + bβˆs Với a và b là hai số thực bất kì không đồng thời bằng 0, ta có: Khi các giả thiết từ 1-5 thỏa mãn thì: (aβˆj + bβˆs ) ∼ N(aβj + bβs , var(aβˆj + bβˆs )) Khi các giả thiết từ 1-5 thỏa mãn thì: (aβˆj + bβˆs ) − (aβj + bβs ) t = ∼ Tn−k se(aβˆj + bβˆs ) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 13
  14. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Nguyên lý xác suất lớn và xác suất nhỏ Nguyên lý xác suất lớn hàm ý sự kiện nào đó xảy ra với mức xác suất rất lớn thì coi như sự kiện ấy xảy ra. Nguyên lý xác suất nhỏ hàm ý sự kiện nào xảy ra với xác suất rất nhỏ thì coi như không xảy ra. Độ tin cậy (1 − α) (ví dụ: 1 − α = 95%) hàm ý, sự kiện nào xảy ra với xác suất lớn ≥ (1 − α) thì coi như sẽ xảy ra, còn α thì có thể xảy ra. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 14
  15. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Nội dung 1 QUY LUẬT PPXS CỦA MỘT SỐ THỐNG KÊ MẪU 2 ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY 3 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VÊ HỆ SỐ HỒI QUY 4 ĐÁNH GIÁ SAI SỐ DỰ BÁO Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 15
  16. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán ước lượng khoảng tin cậy cho các hệ số hồi quy Câu hỏi tình huống Ước lượng chi tiêu của hộ gia đình phụ thuộc vào thu nhập và tài sản thu được hàm hồi quy mẫu: CTdi = 56.60 + 0.794TNi + 0.015TSi (Se) (9.65) (0.016) (0.004) Trong tổng thể, nếu thu nhập tăng thêm 1 triệu đồng thì chi tiêu của hộ gia đình thay đổi trong khoảng nào? Nếu thu nhập tăng thêm 1 triệu đồng và tài sản tăng thêm 3 triệu đồng thì chi tiêu của hộ thay đổi trong khoảng nào? Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 16
  17. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ước lượng Khoảng tin cậy cho một hệ số hồi quy Với mô hình HQTT k biến: Y = β1 + β2X2 + + βk Xk + u Từ mẫu kích thước n: (X2i , , Xki , Yi ), i = 1, 2, , n thu được: ˆ ˆ ˆ ˆ Hàm hồi quy mẫu: Yi = β1 + β2i + + βki Khái niệm Khoảng tin cậy đối xứng cho hệ số βj của tổng thể với độ tin cậy (1 − α) là:  ˆ ˆ ˆ ˆ  βj − tα/2(n − k)se(βj ) ; βj + tα/2(n − k)se(βj ) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 17
  18. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ước lượng Khoảng tin cậy cho một hệ số hồi quy Chứng minh: βˆj − βj Do t = ∼ Tn−k se(βˆj ) Và từ giá trị tới hạn mức α/2 là tα/2 ta có: P(t > tα/2) = P(t < −tα/2) = α/2 ! βˆj − βj → P −tα/2 < < tα/2 = 1 − α se(βˆj )  ˆ ˆ ˆ ˆ  → P βj − tα/2(n − k)se(βj ) < βj < βj + tα/2(n − k)se(βj ) = 1−α Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 18
  19. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ước lượng Khoảng tin cậy cho một hệ số hồi quy Chứng minh: Với độ tin cậy (1 − α), sự kiện với xác suất ≥ (1 − α) coi như xảy ra. Do đó:  ˆ ( ˆ ˆ ˆ  βj − tα/2n − k)se(βj ) < βj < βj + tα/2(n − k)se(βj ) coi như đúng. Vì vậy, với độ tin cậy (1 − α), βj sẽ nằm trong khoảng:  ˆ ˆ ˆ ˆ  βj − tα/2(n − k)se(βj ) ; βj + tα/2(n − k)se(βj ) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 19
  20. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ước lượng Khoảng tin cậy cho một hệ số hồi quy Khái niệm Khoảng tin cậy bên trái cho hệ số βj của tổng thể với độ tin cậy (1 − α) là:   −∞ ; βˆj + tα(n − k)se(βˆj ) Khoảng tin cậy bên phải cho hệ số βj của tổng thể với độ tin cậy (1 − α) là:   βˆj − tα(n − k)se(βˆj ) ; + ∞ Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 20
  21. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ý nghĩa Khoảng tin cậy cho một hệ số hồi quy Ý nghĩa Khoảng tin cậy đối xứng: Với độ tin cậy 1 − α, khi biến độc lập Xj tăng thêm một đơn vị và các biến khác trong mô hình không đổi thì giá trị trung bình của biến phụ thuộc Y sẽ thay đổi trong khoảng:  ˆ ˆ ˆ ˆ  βj − tα/2(n − k)se(βj ) ; βj + tα/2(n − k)se(βj ) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 21
  22. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ý nghĩa Khoảng tin cậy cho một hệ số hồi quy Ý nghĩa Khoảng tin cậy bên trái: Với độ tin cậy 1 − α, khi biến độc lập Xj tăng thêm một đơn vị và các biến khác trong mô hình không đổi thì giá trị trung bình của biến phụ thuộc Y sẽ thay đổi tối đa: βˆj + tα(n − k)se(βˆj ) Khoảng tin cậy bên phải: Với độ tin cậy 1 − α, khi biến độc lập Xj tăng thêm một đơn vị và các biến khác trong mô hình không đổi thì giá trị trung bình của biến phụ thuộc Y sẽ thay đổi tối thiểu: βˆj − tα(n − k)se(βˆj ) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 22
  23. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho một hệ số hồi quy Câu hỏi Ước lượng chi tiêu của hộ gia đình phụ thuộc vào thu nhập và tài sản thu được hàm hồi quy mẫu: (n = 30) CTdi = 56.60 + 0.794TNi + 0.015TSi (Se) (9.65) (0.016) (0.004) (1) Với độ tin cậy 95%, hãy tìm khoảng tin cậy cho hệ số của biến TN và giải thích ý nghĩa? (2) Với độ tin cậy 95%, khi Thu nhập tăng thêm 1 triệu sẽ làm cho Chi tiêu tăng tối đa bao nhiêu đơn vị? (3) Với độ tin cậy 95%, khi Tài sản tăng thêm 1 triệu sẽ làm cho Chi tiêu tăng tối thiểu bao nhiêu đơn vị? Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 23
  24. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho một hệ số hồi quy Trả lời ý 1: Để trả lời câu hỏi này, cần ước lượng khoảng tin cậy đối xứng của β2 Ta có: βˆ2 = 0.794 và se(βˆ2) = 0.016 Với: n = 30, k = 3, n − k = 27, α = 5%, t0.025(27) = 2.052 Khoảng tin cậy đối xứng của β2 là  ˆ ˆ ˆ ˆ  β2 − tα/2(n − k)se(β2) ; β2 + tα/2(n − k)se(β2) = (0.794 − 2.052 × 0.016; 0.794 + 2.052 × 0.016) = (0.761; 0.827) Như vậy, trong điều kiện tài sản không đổi, với độ tin cậy 95%, khi thu nhập tăng thêm 1 triệu đồng sẽ làm cho trung bình chi tiêu tăng thêm trong khoảng từ 761 nghìn đồng đến 827 nghìn đồng. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 24
  25. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho một hệ số hồi quy Trả lời ý 2 : Để trả lời câu hỏi này, cần ước lượng khoảng tin cậy bên trái của β2 Ta có: βˆ2 = 0.794 và se(βˆ2) = 0.016 Với: n = 30, k = 3, n − k = 27, α = 5%, t0.05(27) = 1.703 Khoảng tin cậy bên trái của β2 là (−∞; βˆ2 + tα(n − k)se(βˆ2)) = (−∞; 0.794 + t0.05(27) × 0.016) = (−∞; 0.821) Như vậy, trong điều kiện tài sản không đổi, với độ tin cậy 95%, khi thu nhập tăng thêm 1 triệu đồng sẽ làm cho trung bình chi tiêu tăng thêm tối đa 821 nghìn đồng. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 25
  26. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho một hệ số hồi quy Trả lời ý 3: Để trả lời câu hỏi này, cần ước lượng khoảng tin cậy bên phải của β3 Ta có: βˆ3 = 0.015 và se(βˆ3) = 0.004 Với: n = 30, k = 3, n − k = 27, α = 5%, t0.05(27) = 1.703 Khoảng tin cậy bên phải của β3 là (βˆ3 − tα(n − k)se(βˆ3); +∞) = (0.015 − t0.05(27) × 0.004; +∞) = (0.008; +∞) Như vậy, trong điều kiện thu nhập không đổi, với độ tin cậy 95%, khi tăng tài sản thêm 1 triệu đồng sẽ làm cho trung bình chi tiêu tăng thêm tối thiểu 8 nghìn đồng. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 26
  27. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho biểu thức có hai hệ số hồi quy Câu hỏi tình huống Ước lượng chi tiêu của hộ gia đình phụ thuộc vào thu nhập và tài sản thu được hàm hồi quy mẫu: CTdi = 56.60 + 0.794TNi + 0.015TSi (Se) (9.65) (0.016) (0.004) Nếu thu nhập tăng thêm 1 triệu đồng và tài sản tăng thêm 1 triệu đồng thì trung bình chi tiêu tăng lên trong khoảng nào? Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 27
  28. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho biểu thức có hai hệ số hồi quy Sai lầm tư duy: Với tình huống ở trên, cần xác định khoảng tin cậy của β2 + β3 với độ tin cậy 95 % Giả sử: Khoảng tin cậy của β2 là (a2; b2), của β3 là (a3; b3) Liệu có suy ra được: khoảng tin cậy của β2 + β3 là (a2 + a3; b2 + b3) ( P(a < β < b ) = 95% Câu trả lời là không, do: 2 2 2 P(a3 < β3 < b3) = 95% không suy ra được: P(a2 + a3 < β2 + β3 < b2 + b3) = 95% Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 28
  29. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho biểu thức có hai hệ số hồi quy Xây dựng khoảng tin cậy cho aβj + bβk : Xuất phát từ: (aβˆj + bβˆs ) − (aβj + bβs ) t = ∼ Tn−k se(aβˆj + bβˆs ) Nếu đặt: A = aβj + bβs thì Aˆ = aβˆj + bβˆs Aˆ − A Khi đó: t = ∼ Tn−k se(Aˆ) → Bài toán trở thành tìm khoảng tin cậy cho A. Đây là dạng tương tự như ước lượng khoảng tin cậy cho một hệ số. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 29
  30. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho biểu thức có hai hệ số hồi quy Khái niệm Khoảng tin cậy đối xứng của aβj + bβk là: ˆ ˆ ˆ ˆ (aβj + bβs ) − tα/2(n − k) × se(aβj + bβs ) ˆ ˆ ˆ ˆ (aβj + bβs ) + tα/2(n − k) × se(aβj + bβs ) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 30
  31. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho biểu thức có hai hệ số hồi quy Khái niệm Khoảng tin cậy bên trái của aβj + bβs là:   −∞;(aβˆj + bβˆs ) + tα(n − k) × se(aβˆj + bβˆs ) Khoảng tin cậy bên phải của aβj + bβs là:   (aβˆj + bβˆs ) − tα(n − k) × se(aβˆj + bβˆs ); +∞ Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 31
  32. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Vấn đề tương quan giữa các hệ số Để tính được khoảng tin cậy của biểu thức hai hệ số cần tính được se(aβˆj + bβˆs ): q se(aβˆj + bβˆs ) = var(aβˆj + bβˆs ) q = var(aβˆj ) + var(bβˆs ) + 2ab × cov(βˆj ; βˆs ) q 2 2 = a var(βˆj ) + b var(βˆs ) + 2ab × cov(βˆj ; βˆs ) r 2 2 2   2   = a se(βˆj ) + b se(βˆs ) + 2ab × cov(βˆj ; βˆs ) Như vậy để tính được se(aβˆj + bβˆs ) phải biết cov(βˆj ; βˆs ) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 32
  33. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ý nghĩa Khoảng tin cậy cho một biểu thức gồm hai hồi quy Ý nghĩa Khoảng tin cậy đối xứng: Với độ tin cậy 1 − α, khi biến độc lập Xj tăng thêm a đơn vị và khi biến độc lập Xs tăng thêm b đơn vị,các biến khác trong mô hình không đổi, thì giá trị trung bình của biến phụ thuộc Y sẽ thay đổi trong khoảng: ˆ ˆ ˆ ˆ (aβj + bβs ) − tα/2(n − k) × se(aβj + bβs ) ˆ ˆ ˆ ˆ (aβj + bβs ) + tα/2(n − k) × se(aβj + bβs ) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 33
  34. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ý nghĩa Khoảng tin cậy cho một biểu thức gồm hai hồi quy Ý nghĩa Khoảng tin cậy bên trái: Với độ tin cậy 1 − α, khi biến độc lập Xj tăng thêm a đơn vị và khi biến độc lập Xs tăng thêm b đơn vị,các biến khác trong mô hình không đổi, thì giá trị trung bình của biến phụ thuộc Y sẽ thay đổi tối đa: (aβˆj + bβˆs ) + tα(n − k) × se(aβˆj + bβˆs ) Khoảng tin cậy bên phải: Với độ tin cậy 1 − α, khi biến độc lập Xj tăng thêm a đơn vị và khi biến độc lập Xs tăng thêm b đơn vị,các biến khác trong mô hình không đổi, thì giá trị trung bình của biến phụ thuộc Y sẽ thay đổi tối thiểu: (aβˆj + bβˆs ) − tα(n − k) × se(aβˆj + bβˆs ) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 34
  35. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho một biểu thức gồm hai hồi quy Câu hỏi CTdi = 56.60 + 0.794TNi + 0.015TSi (Se) (9.65) (0.016) (0.004) Với cov(βˆ2; βˆ3) = 0.00001 (1) Với độ tin cậy 95%, hãy xác định mức độ tác động lên chi tiêu khi thu nhập và tài sản cùng tăng thêm 1 triệu? (2) Với độ tin cậy 95%, khi thu nhập tăng thêm 1 triệu và tài sản tăng thêm 5 triệu sẽ làm chi chi tiêu tăng tối đa bao nhiêu? (3) Với độ tin cậy 95%, khi thu nhập tăng thêm 2 triệu và tài sản giảm đi 5 triệu sẽ làm cho chi tiêu tăng tối thiểu bao nhiêu? Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 35
  36. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho một biểu thức gồm hai hồi quy Trả lời ý 1: Ta có: βˆ2 = 0.794, se(βˆ2) = 0.016, βˆ3 = 0.015, se(βˆ3) = 0.004 Với: n = 30, k = 3, n − k = 27, α = 5%, t0.025(27) = 2.052 q se(βˆ2 + βˆ3) = var(βˆ2) + var(βˆ3) + 2cov(βˆ2; βˆ3) √ = 0.0162 + 0.0042 + 2 × 0.00001 = 0.017 Khoảng tin cậy đối xứng của β2 + β3 là (0.809 − 2.052 × 0.017; 0.809 + 2.052 × 0.017) = (0.774; 0.844) Như vậy, với độ tin cậy 95%, khi thu nhập và tài sản cùng tăng thêm 1 triệu đồng sẽ làm cho trung bình chi tiêu tăng thêm trong khoảng từ 774 nghìn đồng đến 844 nghìn đồng. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 36
  37. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho một hệ số hồi quy Trả lời ý 2 : Ta có: βˆ2 = 0.794, se(βˆ2) = 0.016, βˆ3 = 0.015, se(βˆ3) = 0.004 Với: n = 30, k = 3, n − k = 27, α = 5%, t0.05(27) = 1.703 q se(βˆ2 + 5βˆ3) = var(βˆ2) + 25var(βˆ3) + 2 × 5 × cov(βˆ2; βˆ3) √ = 0.0162 + 25 × 0.0042 + 2 × 5 × 0.00001 = 0.027 Khoảng tin cậy bên trái của β2 + 5β3 là (−∞; 0.869 + 1.703 × 0.027) = (−∞; 0.916) Như vậy, với độ tin cậy 95%, khi thu nhập tăng thêm 1 triệu đồng và tài sản tăng thêm 5 triệu đồng sẽ làm cho trung bình chi tiêu tăng thêm tối đa 916 nghìn đồng. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 37
  38. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Khoảng tin cậy cho một hệ số hồi quy Trả lời ý 3 : Ta có: βˆ2 = 0.794, se(βˆ2) = 0.016, βˆ3 = 0.015, se(βˆ3) = 0.004 Với: n = 30, k = 3, n − k = 27, α = 5%, t0.05(27) = 1.703 q se(2βˆ2 −5βˆ3) = 4var(βˆ2) + 25var(βˆ3) + 2 × 2 × 5 × cov(βˆ2; βˆ3) √ = 4 × 0.0162 + 25 × 0.0042 − 2 × 2 × 5 × 0.00001 = 0.035 Khoảng tin cậy bên phải của 2β2 − 5β3 là (1.513 − 1.703 × 0.035; +∞) = (1.453; +∞) Như vậy, trong điều kiện tài sản không đổi, với độ tin cậy 95%, khi thu nhập tăng thêm 2 triệu đồng và tài sản giảm đi 5 triệu đồng sẽ làm cho trung bình chi tiêu tăng thêm tối thiểu 1.453 triệu đồng. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 38
  39. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Ý nghĩa của độ tin cậy 1 − α Với độ tin cậy 95%, khoảng tin cậy của biểu thức A được hiểu là nếu lấy ngẫu nhiên nhiều mẫu từ tổng thể để ước lượng A thì có khoảng 95% các khoảng tin cậy vừa tìm ra chứa giá trị A trong thực tế. Độ tin cậy càng cao thì độ dài khoảng tin cậy càng rộng, hay độ chính xác càng giảm. trường hợp α càng gần 0 hay độ tin cậy càng gần 100% thì khoảng tin cậy càng gần đến (−∞, +∞) Thông thường sử dụng độ tin cậy 95%. Trong một số trường hợp dùng độ tin cậy 90% hoặc 99 Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 39
  40. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Các yếu tố ảnh hưởng đến độ dài khoảng tin cậy Từ công thức khoảng tin cậy đối xứng có thể nhận thấy , độ dài khoảng tin cậy của hệ số βj là: ˆ 2se(βj ) × tα/2(n − k) Có hai nhân tố tác động lên độ dài khoảng tin cậy: Bậc tự do (n − k). tương quan tuyến tính giữa các biến độc lập Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 40
  41. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Các yếu tố ảnh hưởng đến độ dài khoảng tin cậy Bậc tự do (n − k): Bậc tự do (n − k) càng bé thì giá trị tới hạn tα/2(n − k) càng lớn hay độ chính xác của khoảng tin cậy giảm dần. Nếu đưa càng nhiều biến độc lập vào mô hình thì k càng tăng và bậc tự do giảm → khoảng tin cậy kém chính xác. Khi kích cỡ mẫu n nhỏ, tăng k làm bậc tự do thay đổi nhiều; khi n lớn thì tăng k làm giảm bậc tự do không đáng kể → Tăng kích cỡ mẫu làm tăng độ chính xác và giảm tác động làm giảm độ chính xác của việc tăng số biến độc lập. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 41
  42. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Các yếu tố ảnh hưởng đến độ dài khoảng tin cậy Tương quan tuyến tính giữa các biến độc lập: Sai số chuẩn của hệ số ước lượng: s 2 s ˆ σˆ RSS/(n − k) Se(βj ) = 2 P 2 = 2 P 2 (1 − Rj ) xji (1 − Rj ) xji 2 ˆ Khi Rj càng lớn thì se(βj ) càng lớn hay khoảng tin cậy trở nên kém chính xác hơn. Nếu lựa chọn các biến độc lập có tương quan cao với nhau sẽ làm độ dài khoảng tin cậy rộng ra và độ chính xác của khoảng tin cậy giảm xuống. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 42
  43. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Nội dung 1 QUY LUẬT PPXS CỦA MỘT SỐ THỐNG KÊ MẪU 2 ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY 3 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VÊ HỆ SỐ HỒI QUY 4 ĐÁNH GIÁ SAI SỐ DỰ BÁO Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 43
  44. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán kiểm định giả thuyết về một hệ số hồi quy Câu hỏi tình huống Ước lượng chi tiêu của hộ gia đình phụ thuộc vào thu nhập và tài sản thu được hàm hồi quy mẫu: CTdi = 56.60 + 0.794TNi + 0.015TSi (Se) (9.65) (0.016) (0.004) Trong tổng thể, tài sản có thực sự tác động đến chi tiêu? Tác động của thu nhập lên chi tiêu có thực sự nhỏ hơn 1? Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 44
  45. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán kiểm định giả thuyết về một hệ số hồi quy Xác định cặp giả thuyết Xét một mô hình HQ: Y = β1 + β2X2 + β3X3 + + βk Xk + u Thông thường để nhận định về một hệ số, người ta thường so sánh với một giá trị cho trước. Chẳng hạn, khi Xj tăng một đơn vị thì trung bình Y có tăng lên ít hơn, không nhiều hơn, bằng, không ít hơn hay nhiều hơn một giá trị β? nào đó hay không. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 45
  46. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán kiểm định giả thuyết về một hệ số hồi quy Xác định cặp giả thuyết Từ các nhận định, có thể phân chia thành ba dạng cặp giả thuyết: Loại cặp giả thuyết H0 H1 ? ? Hai phía βj = β βj 6= β ? ? Một phía βj = (≥)β βj β Dấu "=" luôn nằm ở H0 và không bao giờ nằm ở H1. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 46
  47. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Kiểm định giả thuyết về một hệ số hồi quy ∗ Giả thuyết gốc H0: βj = β , ta có các giả thiết H1 tương ứng:  ∗ H1 : βj 6= β  ∗ H1 : βj > β ∗  H1 : βj < β Tiêu chuẩn kiểm định: βˆ − β∗ T = j Se(βˆj ) Nếu H0 đúng thì T tuân theo quy luật Student với n − k bậc tự do. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 47
  48. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Kiểm định giả thuyết về một hệ số hồi quy Các miền bác bỏ giả thuyết tương ứng: Loại cặp GT H0 H1 Miền bác bỏ H0 ? ? Hai phía βj = β βj 6= β |tqs | > tα/2(n − k) ? ? Một phía βj = (≥)β βj β tqs > tα(n − k) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 48
  49. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Kiểm định giả thuyết về một hệ số hồi quy Các bước tiến hành một bài toán kiểm định Bước 1: Lập cặp giả thuyết thống kê. Bước 2: Tính toán giá trị quan sát của thống kê kiểm định Bước 3: So sánh thống kê quan sát với giá trị tới hạn để đưa ra kết luận kiểm định. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 49
  50. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán về ý nghĩa thống kê của ước lượng hệ số hồi quy Một biến độc lập chỉ thực sự tồn tại trong mô hình nếu hệ số hồi quy của biến độc lập đó khác 0 trong tổng thể (hay biến đó có tác động đến biến phụ thuộc) Khi biến độc lập thực sự có tác động, thì ước lượng của hệ số trong mẫu mới có ý nghĩa về mặt thống kê. Khái niệm Hệ số ước lượng βˆj trong mẫu có ý nghĩa thống kê khi hệ số hồi quy βj trong tổng thể khác 0. Để biết một hệ số ước lượng có ý nghĩa thống kê, chúng ta kiểm định xem liệu hệ số hồi quy trong tổng thể có khác 0 hay không. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 50
  51. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán về ý nghĩa thống kê của ước lượng hệ số hồi quy Câu hỏi Ước lượng chi tiêu của hộ gia đình phụ thuộc vào thu nhập và tài sản thu được hàm hồi quy mẫu: CTdi = 56.60 + 0.794TNi + 0.015TSi (Se) (9.65) (0.016) (0.004) (1) Với mức ý nghĩa α = 5%, hệ số ước lượng của biến tài sản có ý nghĩa thống kê hay không? Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 51
  52. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán về ý nghĩa thống kê của ước lượng hệ số hồi quy Trả lời: ( H : β = 0 Bước 1: Lập cặp giả thuyết kiểm định: 0 3 H1 : β3 6= 0 Bước 2: Tính toán giá trị quan sát của thống kê kiểm định: βˆ3 − 0 0.015 tqs = = = 3.75 se(βˆ3) 0.004 Bước 3: So sánh thống kê quan sát với giá trị tới hạn: Với mức ý nghĩa 5%, t0.025(27) = 2.05 Ta có: |tqs | = 3.75 > t0.025(27) Do đó, ta có đủ cơ sở để bác bỏ H0 và chấp nhận H1 hay nói cách khác biến tài sản có tác động đến chi tiêu của hộ gia đình. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 52
  53. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán so sánh hệ số hồi quy với một số cho trước Khi xem xét một bài toán so sánh, cần chú ý mối quan hệ về dấu trong giả thuyết để xác định cặp giả thuyết phù hợp: Quan hệ về dấu H0 H1 Bằng = Khác 6= Nhỏ hơn Không nhỏ hơn ≥ Không lớn hơn ≤ Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 53
  54. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán so sánh hệ số hồi quy với một số cho trước Câu hỏi Ước lượng chi tiêu của hộ gia đình phụ thuộc vào thu nhập và tài sản thu được hàm hồi quy mẫu: CTd = 56.60 + 0.794TNi + 0.015TSi (Se) (9.65) (0.016) (0.004) (1)Khi thu nhập tăng lên thì chi tiêu trung bình có tăng ít hơn thu nhập hay không? (α = 5%) (2)Khi tài sản tăng thêm 1 tỷ đồng thì trung bình chi tiêu có tăng thêm nhiều hơn 20 triệu hay không? (α = 5%) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 54
  55. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán so sánh hệ số hồi quy với một số cho trước Trả lời ý 1: Cặp giả thuyết kiểm định: ( H0 : β2 ≥ 1 H1 : β2 < 1 Giá trị quan sát của thống kê kiểm định: βˆ2 − 1 0.794 − 1 tqs = = = −12.85 se(βˆ2) 0.016 Với mức ý nghĩa 5%, t0.05(27) = 1.7 Ta có: tqs = −12.85 < −t0.05(27) Do đó, ta kết luận rằng có đủ cơ sở để bác bỏ H0 và chấp nhận H1 hay nói cách khác thu nhập tăng lên thì chi tiêu trung bình tăng ít hơn lượng tăng của thu nhập. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 55
  56. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán so sánh hệ số hồi quy với một số cho trước Trả lời ý 2: Cặp giả thuyết kiểm định: ( H0 : β3 ≤ 0.02 H1 : β3 > 0.02 Giá trị quan sát của thống kê kiểm định: βˆ3 − 0.02 0.015 − 0.02 tqs = = = −1.25 se(βˆ3) 0.004 Với mức ý nghĩa 5%, t0.05(27) = 1.7. Ta có: tqs < t0.05(27) Do đó, ta kết luận rằng không có đủ cơ sở để bác bỏ H0, vì thế ta chấp nhận H0 hay nói cách khác khi tài sản tăng thêm 1 tỷ đồng thì trung bình chi tiêu tăng thêm không nhiều hơn 20 triệu đồng trong điều kiện thu nhập không đổi. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 56
  57. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán kiểm định giả thuyết về một biểu thức hai hệ số Bài toán kiểm định giả thuyết về một biểu thức hai hệ số được chuyển về dạng tổng quát là so sánh biểu thức aβj + bβs với một giá trị cụ thể. Phương pháp kiểm định tương tự như kiểm định giả thuyết với một hệ số. Xuất phát từ: (aβˆj + bβˆs ) − (aβj + bβs ) t = ∼ Tn−k se(aβˆj + bβˆs ) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 57
  58. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán kiểm định giả thuyết về một biểu thức hai hệ số Thống kê quan sát: aβˆ + bβˆ − β∗ t = j s se(aβˆj + bβˆs ) Các cặp giả thuyết và miền bác bỏ: H0 H1 Miền bác bỏ H0 ∗ ∗ aβj + bβs = β aβj + bβs 6= β |tqs | > tα/2(n − k) ∗ ∗ aβj + bβs = (≥)β aβj + bβs β tqs > tα(n − k) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 58
  59. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán so sánh mức độ tác động của hai biến độc lập Câu hỏi CTdi = 56.60 + 0.794TNi + 0.515TSi (Se) (9.65) (0.016) (0.004) Với cov(βˆ2; βˆ3) = 0.00001 (1) Thu nhập và tài sản có tác động như nhau đến chi tiêu hay không? (α = 5%) (2) Thu nhập có tác động lên chi tiêu nhiều hơn tài sản không? (α = 5%) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 59
  60. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán so sánh mức độ tác động của hai biến độc lập Gợi ý trả lời: ( H : β − β = 0 Ý 1: Cặp giả thuyết: 0 2 3 H1 : β2 − β3 6= 0 se(βˆ2 − βˆ3) = 0.0178, tqs = 15.67, t0.025(27) = 2.05 ( H : β − β ≤ 0 Ý 2: Cặp giả thuyết: 0 2 3 H1 : β2 − β3 > 0 se(βˆ2 − βˆ3) = 0.0178, tqs = 15.67, t0.05(27) = 1.7 Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 60
  61. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán so sánh mức độ tác động của hai biến độc lập Câu hỏi Ước lượng mô hình lợi nhuận của doanh nghiệp (LN) phụ thuộc vào đầu tư máy móc thiết bị (IC) và số đại lý bán hàng (NA): LNc i = 652.25 + 4.2ICi + 2.7NAi (Se) (46.2) (0.15) (0.08) Với cov(βˆ2; βˆ3) = 0.00001 (1) Đầu tư thêm cho máy móc thiết bị có đem lại nhiều lợi nhuận hơn mở thêm đại lý hay không? (α = 5%) Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 61
  62. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán so sánh mức độ tác động của hai biến độc lập Gợi ý trả lời: Nếu không có thêm thông tin gì về chi phí đầu tư máy móc thiết bị và mở rộng đại lý, thì không thể so sánh giữa hai hoạt động trên do hai biến độc lập không có cùng đơn vị tính toán Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 62
  63. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán đánh giá tác động tổng hợp của hai biến độc lập Câu hỏi Ước lượng mô hình sản lượng của công ty (Q - 100 sản phẩm) phụ thuộc vào số máy móc (K - số máy) và số lao động phổ thông (L - 10 người) Qbi = 150 + 0.5Ki + 0.7L (Se) (1.2) (0.1) (0.2) Với n = 30, cov(βˆ2; βˆ3) = 0.017 (1) Công ty muốn tăng thêm một máy sản xuất và thuê thêm 20 lao động thì có giúp sản lượng tăng nhiều hơn 200 hay không? (α = 5%) (2) Công ty muốn giảm bớt 20 lao động và thay bằng 3 máy sản xuất thì có làm ảnh hưởng đến tổng số linh kiện hay Vũ Duy Thành không? (α = 5%) Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 63
  64. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Bài toán đánh giá tác động tổng hợp của hai biến độc lập Gợi ý trả lời: ( H : β + 2β ≤ 2 Ý 1: Cặp giả thuyết: 0 2 3 H1 : β2 + 2β3 > 2 se(βˆ2 + 2βˆ3) = 0.488, tqs = −0.2, t0.05(27) = 1.7 ( H : 3β − 2β = 0 Ý 2: Cặp giả thuyết: 0 2 3 H1 : 3β2 − 2β3 6= 0 se(3βˆ2 − 2βˆ3) = 0.214, tqs = 0.466, t0.025(27) = 2.05 Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 64
  65. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Giá trị xác suất P của các thống kê kiểm định: P-value Bản chất của mức xác xuất p trong các kiểm định: Khi kiểm định một cặp giả thuyết: ( ∗ H0 : βj = β ∗ H1 : βj 6= β Khi đó, nếu H0 đúng, thì: P(|T | > tqs ) = αqs (p–value của kiểm định) → Với mức ý nghĩa α thì: Nếu αqs α thì coi như H0 có thể xảy ra. → Nếu mức ý nghĩa lớn hơn xác xuất của kiểm định thì bác bỏ H0. Nếu mức ý nghĩa nhỏ hơn xác xuất của kiểm định thì thừa nhận H0. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 65
  66. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Giá trị xác suất P của các thống kê kiểm định: P-value Ví dụ Kiểm định cặp giả thuyết: ( ∗ H0 : βj = β ∗ H1 : βj 6= β Giả sử có: tqs = 2.3 và n − k = 26 Khi đó mức xác suất p của kiểm định là: P(|T (26)| > 2.3) = 2 × 0.148 = 0.0296 Kết quả cho thấy: với mức ý nghĩa lớn hơn 2.96% thì bác bỏ H0 Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 66
  67. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Giá trị xác suất P của các thống kê kiểm định: P-value Quy tắc kiểm định sử dụng xác xuất: Nếu giá trị xác suất p của kiểm định là nhỏ hơn mức ý nghĩa α thì ta bác bỏ H0 Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 67
  68. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Kiểm định nhiều ràng buộc các hệ số Ví dụ Ước lượng mô hình năng suất lao động (prod) phụ thuộc vào độ tuổi (age), học vấn (edu) kinh nghiệm (exp), giới tính (gen) và tiền lương (wage): proc = β1 + β2age + β3edu + β4exp + β5gen + β6wage + u Chúng ta muốn kiểm định xem biến wage và biến gen có cùng tác động lên proc. Kiểm định cặp giả thuyết: ( H0 : β5 = β6 = 0 2 2 H1 : β5 + β6 > 0 Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 68
  69. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Kiểm định nhiều ràng buộc các hệ số Xét hai mô hình: Mô hình không có ràng buộc (U - unrestricted): proc = β1 + β2age + β3edu + β4exp + β5gen + β6wage + u Mô hình có ràng buộc (R - restricted): proc = β1 + β2age + β3edu + β4exp + u Nếu H0 đúng thì hai mô hình trên là như nhau. Do đó, dùng RSS để kiểm tra. Nếu RSS rất nhỏ thì H0 đúng. Nếu RSS đủ lớn thì có sự sai khác giữa hai mô hình. Bài toán này còn được gọi là bài toán kiểm định mở rộng (thu hẹp) hàm hồi quy. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 69
  70. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Các bước kiểm định nhiều ràng buộc các hệ số Bước 1: Thiết lập các cặp giả thuyết thống kê. Bước 2: Ước lượng hàm hồi quy không có ràng buộc và có ràng buộc; sau đó, tính các giá trị RSS(U) và RSS(R) (hoặc R2(U) và R2(R))tương ứng. Bước 3: Tính giá trị quan sát của thống kê F: (RSS(R) − RSS(U))/m (R2(U) − R2(R))/m F = = qs RSS(U)/(n − k(U)) (1 − R2(U))/(n − k(U)) Trong đó: m là số ràng buộc trong H0, k(U) là số hệ số có trong mô hình không có ràng buộc. Bước 4: So sánh với giá trị tới hạn, nếu Fqs > fα(m; n − k(U)) thì bác bỏ H0, trong trường hợp ngược lại thì chấp nhận H0 với mức ý nghĩa α cho trước. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 70
  71. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Các bước kiểm định nhiều ràng buộc các hệ số Ví dụ Hồi quy tiền lương (wage) theo trình độ học vấn (educ), trình độ học vấn của người mẹ (medu) và số anh chị em trong gia đình (ssib) thu được: wage[ i = 2404 + 86.12edui + 14.88medui − 30.25ssibi RSS = 3649563 và n = 32 Nếu nghi ngờ rằng: trình độ học vấn của người mẹ và số anh chị em trong gia đình không cùng tác động đến mức lương. Kiểm định: ( H0 : β3 = β4 = 0 2 2 H1 : β3 + β4 6= 0 Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 71
  72. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Các bước kiểm định nhiều ràng buộc các hệ số Ví dụ Ước lượng mô hình có ràng buộc: wage = α1 + α2edu + u thu được: RSS(R) = 3770332 Khi đó, giá trị quan sát của thống kê F: (3770332 − 3649563)/2 F = = 0.46 qs 3649563/28 Nhận thấy: Fqs < f0.05(2, 28) = 3.49 Do đó, không đủ cơ sở bác bỏ H0 hay thừa nhận H0 tức là hai biến medu và ssib cùng không có tác động đến biến wage. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 72
  73. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Kiểm định sự phù hợp của hàm hồi quy Với mô hình HQTT k biến: Y = β1 + β2X2 + + βk Xk + u Mô hình hồi quy chỉ phù hợp (hay có ý nghĩa) khi ít nhất một trong các biến độc lập có tác động lên biến phụ thuộc. Nói các khác, một trong các hệ số βj khác 0 với j > 1. Kiểm định cặp giả thuyết: ( H0 : β2 = β3 = = βk = 0 2 2 2 H1 : β2 + β3 + + βk > 0. Đây là trường hợp đặc biệt của bài toán kiểm định thu hẹp hàm hồi quy. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 73
  74. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Kiểm định sự phù hợp của hàm hồi quy Sử dụng giá trị quan sát của thống kê F: R2/(k − 1) F = qs (1 − R2)/(n − k) Trong đó: R2 là hệ số xác định của mô hình (đầy đủ các biến) và k là số hệ số trong mô hình. Nếu: Fqs > fα(k − 1, n − k) → bác bỏ H0 và thừa nhận H1 tức là hàm hồi quy phù hợp. Trong trường hợp ngược lại, thừa nhận H0 hay hàm hồi quy không phù hợp. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 74
  75. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Kiểm định sự phù hợp của hàm hồi quy Ví dụ Hồi quy tiền lương (wage) theo trình độ học vấn (educ), trình độ học vấn của người mẹ (medu) và số anh chị em trong gia đình (ssib) thu được: wage[ i = 2404 + 86.12edui + 14.88medui − 30.25ssibi 2 R = 0.169;Fqs = 1.89;P(F − stat) = 0.15 và n = 32 Do: Fqs = 1.89 < f0.05(3.28) = 2.95 Như vậy, không đủ cơ sở bác bỏ H0 hay ta thừa nhận H0 tức là hàm hồi quy trên là không phù hợp Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 75
  76. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Kiểm định t và kiểm định F Trong bài toán kiểm định một hệ số hồi quy: ( ∗ H0 : βj = β ∗ H1 : βj 6= β Người ta chứng minh được: 2 (tqs ) = Fqs 2 (tα/2(n − k)) = Fα(1; n − k) Do đó, trong bài toán có một ràng buộc, kiểm định t và kiểm định F cho kết quả như nhau và cùng mức xác suất kiểm định. Tuy nhiên, kiểm định t đơn giản hơn. Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 76
  77. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Nội dung 1 QUY LUẬT PPXS CỦA MỘT SỐ THỐNG KÊ MẪU 2 ƯỚC LƯỢNG KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI QUY 3 KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ VÊ HỆ SỐ HỒI QUY 4 ĐÁNH GIÁ SAI SỐ DỰ BÁO Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 77
  78. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Đánh giá sai số dự báo của mô hình Các chỉ tiêu đánh giá sai số dự báo của mô hình Căn bậc hai của trung bình bình phương sai số: v u n u P ˆ 2 u (Yi − Yi ) RMSE = t i=1 n Sai số trung bình tuyệt đối n P |Yˆi − Yi | MAE = i=1 n Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 78
  79. PPXS CỦA TK MẪU Ước lượng KTC Kiểm định giả thuyết đánh giá sai số Đánh giá sai số dự báo của mô hình Sai số trung bình tuyệt đối tính theo phần trăm n Yˆ − Y P i i i=1 Yi MAPE = n Giá trị của RMSE và MAE phụ thuộc vào đơn vị đo của Y còn giá trị MAPE không phụ thuộc Thông thường với số liệu KTXH, MAPE thường được yêu cầu < 5%, một số biến số khác yêu cầu dự báo với sai số thấp hơn rất nhiều như VNINDEX hay CPI theo tháng, Vũ Duy Thành Khoa Toán Kinh tế - Trường Đại học Kinh tế Quốc dân SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH HỒI QUY 79