Kinh tế lượng - Chương 4: Mô hình hồi quy bội

ppt 54 trang vanle 4470
Bạn đang xem 20 trang mẫu của tài liệu "Kinh tế lượng - Chương 4: Mô hình hồi quy bội", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptkinh_te_luong_chuong_4_mo_hinh_hoi_quy_boi.ppt

Nội dung text: Kinh tế lượng - Chương 4: Mô hình hồi quy bội

  1. KINH TẾ LƯỢNG Econometrics Chương 4 MÔ HÌNH HỒI QUY BỘI 1
  2. 4.1. Mô hình hồi quy tuyến tính 3 biến Hàm hồi quy tổng thể E(Y / X 2 , X 3 ) = 1 + 2 X 2 + 3 X 3 Gọi Yi là giá trị quan sát thứ i của biến Y, khi đó: Yi = 1 + 2 X 2i + 3 X 3i +ui ui: sai số ngẫu nhiên 2
  3. 4.1.1 Ý nghĩa của các hệ số β1, β2, β3: β1: Hệ số tự do (hệ số chặn), nó chính là giá trị trung bình của biến Y khi X2 = X3= 0. E =  2. Điều này có nghĩa là khi chúng X 2 ta giữ nguyên yếu tố X3 thì giá trị trung bình của biến phụ thuộc Y sẽ thay đổi (tăng hoặc giảm tùy thuộc vào dấu của β2) β2 đơn vị cho mỗi đơn vị tăng của yếu tố X2. 3
  4. E Tương tự, =  3 X 3 có nghĩa là giá trị trung bình của biến Y tăng (hoặc giảm) β3 đơn vị cho mỗi đơn vị tăng của X3. 4
  5. 4.1.2 Các giả thiết của mô hình: - Giá trị trung bình của Ui bằng 0 hay: (i) E(Ui/X2i, X3i) = 0 - Phương sai của các Ui là không đổi hay: 2 Var(Ui) = σ - Không có hiện tượng tự tương quan giữa các Ui, tức: Cov(Ui, Uj) = 0 i j - Giữa các biến giải thích X2, X3 không có quan hệ tuyến tính (hiện tượng đa cộng tuyến). 2 - Ui có phân phối chuẩn: Ui ~ N(0, ) 5
  6. 4.1.3 Ước lượng các tham số: Sử dụng phương pháp bình phương nhỏ nhất (Ordinary Least Squares - OLS) để ước lượng các tham số của mô hình: E(Y/X2i, X3i) = β1 + β2X2i + β3X3i Giả sử có n quan sát, quan sát thứ i có 3 giá trị ứng với Y, X2 và X3, ký hiệu là: (Yi, X2i, X3i). 6
  7. Hàm hồi quy mẫu SRF được xây dựng từ n quan sát này có dạng: Yˆi = ˆ1 + ˆ 2 X 2i + ˆ 3 X 3i ˆ Trong đó j là ước lượng điểm của βj (j=1,2,3). Khi đó: Yi = ˆ1 + ˆ 2 X 2i + ˆ 3 X 3i + ei ei là phần dư ứng với quan sát thứ i. ei = Yi −Yˆi = Yi − ˆ1 − ˆ 2 X 2i − ˆ 3 X 3i 7
  8. Theo nguyên lý của phương pháp bình phương ˆ ˆ nhỏ nhất, các giá trị ˆ1 ,  2 và  3 được chọn sao cho: 2 2 2 = ˆ = ˆ ˆ ˆ → min ei (Yi −Yi) (Yi − 1− 2 X 2i − 3 X 3i) Hay: n n 2 2 f (ˆ1, ˆ 2, ˆ 3) = = ˆ ˆ ˆ → min ei (Yi − 1− 2 X 2i − 3 X 3i) i=1 i=1 8
  9. Tính các đạo hàm riêng bậc 1 của f (ˆ1, ˆ 2, ˆ 3) theo ˆ1, ˆ 2, ˆ 3 và cho các đạo hàm riêng đó bằng 0, ta được: ˆ ˆ ˆ n f ( 1,  2,  3) ˆ ˆ ˆ = 2(Yi −  1 −  2 X 2i −  3 X 3i)(−1) = 0 (1) ˆ1 i=1 ˆ ˆ ˆ n f ( 1,  2,  3) ˆ ˆ ˆ = 2(Yi −  1 −  2 X 2i −  3 X 3i)(−X 2i) = 0 (2) ˆ 2 i=1 ˆ ˆ ˆ n f ( 1,  2,  3) ˆ ˆ ˆ = 2(Yi −  1 −  2 X 2i −  3 X 3i)(−X 3i) = 0 (3) ˆ 3 i=1 9
  10. (1) n ˆ ˆ ˆ (Yi −  1 −  2 X 2i −  3 X 3i) = 0 i=1 ˆ ˆ ˆ Yi − n 1 −  2 X 2i −  3 X 3i = 0 n n n Yi  X 2i  X 3i i=1 i=1 i=1 ˆ1 = − ˆ 2 − ˆ 3 n n n ˆ1 = Y − ˆ 2 X 2i − ˆ 3 X 3i 10
  11. Thay kết quả vào các phương trình còn lại và giải, ta được: ˆ ˆ ˆ 1 =Y − 2 X 2i − 3 X3i y x x2 − y x x x ˆ  i 2i  3i  i 3i  2i 3i 2 = 2 2 2  x2i  x3i − ( x2i x3i ) y x x2 − y x x x ˆ  i 3i  2i  i 2i  2i 3i 3 = 2 2 2  x2i  x3i − ( x2i x3i ) xi = X i − X yi = Yi −Y 11
  12. Thí du 1: Bảng dưới đây cho các số liệu về doanh số bán (Y), chi phí chào hàng (X2) và chi phí quảng cáo (X3) trong năm 2001 ở khu vực bán hang của một công ty. Hãy ước lượng hàm hồi qui tuyến tính của doanh số bán hàng theo chi phí chào hàng và chi phí quảng cáo.
  13. Doanh số bán Yi Chi phí chào hàng Chi phí quảng cáo (triệu đồng) X2i (triệu đồng) X3i (triệu đồng) 1270 100 180 1490 106 248 1060 60 190 1626 160 240 1020 70 150 1800 170 260 1610 140 250 1280 120 160 1390 116 170 1440 120 230 1590 140 220 1380 150 150
  14. Giải: Từ các số liệu của bảng trên ta tính được các tổng: Yi =16956 ;  X2i =1452 ;  X3i = 2448 ; 2 2 X 2 = 518504 ; Yi = 24549576 ;  X2i =188192 ; 3i XY= 3542360 ;  3ii  XX23ii= 303608 ;  XY2ii= 2128740 ; Từ đó, ta tính được: 16956 1452 2448 Y ==1413 ; X ==121 ; X 2 ==204 . 12 2 12 12
  15. Ta tính được: nn 2 2 2 2 yii= Y − n( Y ) =24549576 − 12.(1413) = 590748 ; ii==11 nn 2 2 2 2 x2ii= X 2 − n( X 2 ) =188192 − 12.(121) = 125 ; ii==11 nn 2 2 2 x3ii= X 3 − n( X 3 ) =518504 − 12.(204) = 19112 ; ii==11
  16. nn x2i y i= X 2 i Y i − n X 2 Y =2128740 − 12.121.1413 = 77064 ii==11 nn x3i y i= X 3 i Y i − n X 3 Y =3542360 − 12.204.1413 = 83336 ii==11 nn x2i x 3 i= X 2 i X 3 i − n X 2 X 3 =303608 − 12.121.204 = 7400 ii==11
  17. 77064.19112− 83336.7400 ˆ ==4,64951 2 12500.19112− 74002 83336.12500− 77064.7400 ˆ ==2,560152 3 12500.19112− 74002 ˆ 1 =1413 − 4,64951.121 − 2,560152.204 = 328,1383 Vậy hàm hồi quy biến tuyến tính mẫu của doanh số bán theo chi phí chào hàng và chi phí quảng cáo là: YXX1=328,138 + 4,64951. 2ii + 2,560152.204. 3
  18. Kết quả trên cho thấy: •Khi chi phí chào hàng và chi phí quảng cáo đều bằng 0 thì doanh số bán trung bình của một khu vực bán hàng là 328,1383 triệu đồng/ năm. •Nếu giữ chi phí quảng cáo không đổi, khi chi phí chào hàng tăng lên 1 triệu đồng/ năm sẽ làm cho doanh thu trung bình của một khu vực bán hàng tăng lên 4,6495 triệu đồng/ năm. • Nếu giữ chi phí chào hàng không đổi, khi chi phí quảng cáo tăng lên 1 triệu đồng/ năm sẽ làm cho doanh thu trung bình của một khu vực bán hàng tăng lên 2,56 triệu đồng/ năm.
  19. 4.1.2. Phương sai của các ước lượng X 2 x2 + X 2 x2 − 2X X x x ˆ 1 2  3i 3  2i 2 3  2i 3i 2 Var(1) = ( + 2 2 2 ) n  x2i  x3i − ( x2i x3i ) x2 ˆ  3i 2 Var(2 ) = 2 2 2   x2i  x3i − ( x2i x3i ) x2 ˆ  2i 2 Var(3 ) = 2 2 2   x2i  x3i − ( x2i x3i ) 2 Do  là phương sai của ui chưa biết nên trong thực tế người ta dùng ước lượng không chệch của nó: 2 2 2 2 ei (1− R ) yi ˆ = = 19 n − 3 n − 3
  20. se(ˆ1) = Var(ˆ1) se(ˆ 2) = Var(ˆ 2) se(ˆ 3) = Var(ˆ 3) n 2 TSS = 2 − n Yi (Y ) i=1 n n ˆ ˆ ESS =  2 yix2i +  3 yix3i i=1 i=1 20
  21. Với các số liệu ở ví dụ trên, ta có: TSS =24549576 − 12( 1413)2 = 590748 ESS =4,64951.77064 + 2,560152.83336 = 5716662,67 RSS =590748 − 5716662,67 = 19085,33
  22. 19085,33 ˆ 2 = = 2120,592 12− 3 19112 Var(ˆ )== .2120,592 0,220097 2 12500.19112− 74002 ˆ se(2 ) = 0,220097 = 0,46915 12500 Var(ˆ )== .2120,592 0,143952 3 12500.19112− 74002 ˆ se(3 ) = 0,143952 = 0,379407
  23. 4.1.3. Hệ số xác định và hệ số xác định hiệu chỉnh 2 n Hệ số xác định R 2 ei 2 ESS RSS i=1 R = =1− =1− n TSS TSS 2  yi i=1 ˆ y x + ˆ y x MH hồi quy 3 biến 2 2  i 2i 3  i 3i R = 2  yi 2 Hệ số xác định hiệu chỉnh ei (n − k) R 2 =1− Với k là tham số của mô hình, 2  yi kể cả hệ số tự do (n −1)23
  24. Mối quan hệ giữa R2 và R 2 n −1 R 2 =1− (1− R2 ) n − k Người ta dùng để xem xét việc đưa thêm 1 biến vào mô hình. Biến mới đưa vào mô hình phải thỏa 2 điều kiện: - Làm tăng - Khi kiểm định giả thuyết hệ số của biến này trong mô hình với giả thuyết H0 thì phải bác bỏ H0. 24
  25. Từ kết quả ở ví dụ trên thì: 571662,67 R2 ==0,9677 590478 2 n −−1 12 1 RR=1 − (1 −2 ) = 1 − (1 − 0,9677) = 0,9605 nk−−12 3 Ở mô hình hồi qui 2 biến (biến phụ thuộc Y và biến độc lập X2) ta tính được: 2 12− 1 RR2 =0,80425 = 1 − (1 − 0,80425) = 0,78467 12− 2 2 2 Như vậy R = 0,9605 0,78467 tức R có tăng lên Ta tiến hành kiểm định giả thiết: HH0: 3= 0; 1 : 3 0
  26. ˆ 2,560152 t =3 = = 6,748 ˆ se()3 0,37941 Vì t > t0,025=2,262 nên ta bác bỏ giả thiết H0. Vậy việc thêm biến chi phí quảng cáo (X3) vào mô hình là cần thiết.
  27. 4.1.4. Khoảng tin cậy của các tham số Khoảng tin cậy của tham số i với mức ý nghĩa hay độ tin cậy 1- ˆ ˆ i (i −i ;i +i ) ˆ i = SE(i )t(n−3, / 2) 27
  28. Ví dụ: Với số liệu ở thí dụ 1, tìm khoảng tin cậy của  và với hệ số tin cậy mà 95%. 1 2 Giải: Với hệ số tin cậy 1− = 95% = 5% / 2 = 0,025 Tra bảng phân phối Student ta được t / 2 (n −3) =t 0,025(9) = 2,262 Sử dụng các kết quả tính toán ở phần trên ta có: Khoảng tin cậy của 4,64951 2,262 0,469148 hay :(3,588 2 5,711)
  29. Kết quả trên cho biết, nếu giữ chi phí quảng cáo không đổi, khi chi phí chào hàng tăng lên 1 triệu đ/năm thì doanh số bán trung bình ở một khu vực bán hàng tăng trong khoảng từ 3,588 đến 5,711 triệu đ/năm. Khoảng tin cậy của 3 2,560152 2,262 0,379407 hay :(1,702 3 3,418) Tức là nếu giữ chi phí chào hàng không đổi, khi chi phí quảng cáo tăng lên 1 triệu đ/năm thì doanh số bán trung bình ở một khu vực bán hàng tăng trong khoảng từ 1,702 đến 3,418 triệu đ/năm.
  30. 4.1.5. Kiểm định giả thuyết  =  * * Kiểm định giả thuyết H0: i i ˆ −  * t = i i i ˆ SE(i ) Nguyên tắc quyết định: Nếu ti > t(n-3, /2) hoặc ti < -t(n-3, /2) : bác bỏ H0 Nếu - t(n-3, /2) ≤ ti ≤ t(n-3, /2) : chấp nhận H0 30
  31. * Kiểm định giả thuyết đồng thời bằng không: H0: 2 = 3 = 0. H1: ít nhất 1 trong 2 tham số khác 0) R2 (n −3) F = (1− R2 )2 Nguyên tắc quyết định: - F > F (2, n-3): Bác bỏ H0: Mô hình phù hợp - F ≤ F (2, n-3): Chấp nhận H0: Mô hình không phù hợp 31
  32. Thí dụ: Với số liệu cho ở thí dụ 1 , ta kiểm định các giả thiết: H0: 2 = 0 và H1: 2 0 với mức ý nghĩa = 5% ^ ^  − 0  4,64951 Giải: Ta có: t = 2 = 2 = = 9,911 ^ ^ 0,469148 se(2 ) se(2 ) Với mức ý nghĩa , tra bảng ta được: t0,025(9) = 2,262 Vì t t / 2 (9) nên ta bác bỏ giả thiết H0: 2 = 0, tức chi phí chào hàng thực sự có ảnh hưởng đến doanh thu số bán ở một khu vực bán hàng.
  33. 4.2. Mô hình hồi quy k biến Mô hình hồi quy tổng thể E(Y / X 2 , X k ) = 1 + 2 X 2i + + k X ki Mô hình hồi quy mẫu ngẫu nhiên: ˆ ˆ ˆ ˆ Yi = 1 + 2 X 2i + + k X ki + ei ˆ ˆ ˆ ˆ ˆ => ei =Yi −Yi =Yi − 1 − 2 X 2i − 3 X3i − − k X ki 33
  34. 4.2.1. Ước lượng các tham số của mô hình (OLS) n n 2 2 ˆ ˆ ˆ ˆ ei = (Yi − 1 − 2 X 2i − 3 X 3i − − k X ki ) → min i=1 i=1 n 2 ei n i=1 = −2 Y − ˆ − ˆ X − ˆ X − − ˆ X = 0 ˆ  ( i 1 2 2i 3 3i k ki ) 1 i=1 n 2 ei n i=1 = −2 Y − ˆ − ˆ X − ˆ X − − ˆ X X = 0 ˆ  ( i 1 2 2i 3 3i k k ,i ) 2i 2 i=1 n 2 ei n i=1 = −2 Y − ˆ − ˆ X − ˆ X − − ˆ X X = 0 ˆ  ( i 1 2 2i 3 3i k ki ) ki k i=1 34
  35. Giả sử ta có n quan sát, mỗi quan sát gồm có k ___ giá trị (Yi, X2i, , Xki), i = 1,n Y 1 =  1 +  2 X 21 +  3 X 31 + + kXk1 + U1 Y2 =  1 +  2 X 22 +  3 X 32 + + kXk 2 + U2 Yn =  1 +  2 X 2n +  3 X 3n + + kXkn + Un 35
  36. Ký hiệu: Y1  1 U 1 Y2  2 U 2 Y =  = U = Yn n Un 1 X 21 X 31 Xk1 1 X 22 X 32 Xk 2 X = 1 X 2n X 3n Xkn Y = X.β + U 36
  37. Hàm hồi qui mẫu SRF có dạng: Yˆi = ˆ1 + ˆ 2 X 2i + + ˆkXki ˆ ˆ ˆ ___ Y =  1 +  2 X 2i + + kXki + ei (i =1,n) Y = Xˆ + e ˆ1 e1 ˆ 2 e2 ˆ = e = = Y − Xˆ ˆ k en 37
  38. T Ta ký hiệu XT, YT,  ˆ , eT tương ứng là các ma trận chuyển vị của X, Y,  ˆ , e 1 1 1 X 21 X 22 X 2n T = X Xk1 Xk 2 Xkn T Y = (Y 1,Y 2, Yn) T ˆ ˆ ˆ ˆ = ( 1,  2, , k) T e = (e1,e2, ,en) 38
  39. Khi đó: T 2 T T = . = ˆ . ˆ = T T ˆ ei e e (Y −X.) (Y −X.) (Y −ˆ .X ) (Y −X.) T T =Y T Y − ˆ . X T .Y −Y T . X .ˆ + ˆ . X T . X .ˆ T T =Y T Y − 2 ˆ . X T .Y + ˆ . X T . X .ˆ Với: T T T = T ˆ = ˆ . T . (Y X n*k ˆ ) (Y .X.)  X Y 1*n  k*1 1*1 39
  40. ( T . ) e e = 0 ( T . ). ˆ = T . ˆ X X  X Y −1 T ˆ = (X T.X) X .Y X ki n  X 2i  X 3i  2 T  X 2i  X 2i  X 2i X 3i  X 2i X ki X . X = 2  X ki  X ki X 2i  X ki X 3i  X ki 40
  41. XTX là ma trận đối xứng. Y i T Y i X 1i X .Y =  Y i X k−1,i k*1 41
  42. Ma trận hiệp phương sai: ˆ ˆ ˆ ˆ ˆ var( 1) cov( 1, 2) cov( 1,k cov(ˆ 2,ˆ1) var(ˆ 2) cov(ˆ 2,ˆk cov(ˆ) = ˆ ˆ ˆ ˆ ˆ cov(k, 1) cov(k, 2) var(k) −1 cov(ˆ) = 2 (X T.X) 2 Do σ là phương sai của ui chưa biết nên trong thực tế người ta dùng ước lượng không chệch của nó: 2 RSS = ˆ n − k 42
  43. Ví dụ: Có bảng số liệu: Yi X2i X3i 20 8 2 Y: lượng hàng bán 18 7 3 được của 1 loại hàng (tấn/tháng). 19 8 4 18 8 4 X2: Thu nhập của người tiêu dùng 17 6 5 (triệu đ/năm). 17 6 5 X3: Giá bán của 16 5 6 loại hàng này (ngàn 15 5 7 đ/kg). 13 4 8 12 3 8 43
  44. Giải: Yi = 165 X 2i = 60 −1  10 60 52 X 3i = 52 39980 −3816 −3256  −1 1 2 T = = −3816 376 300 = 2781 (X X ) 60 388 282 Y i 1528 −3256 300 280 2 = 388 52 282 308  X 2i 2 = 308  X 3i 39980 −3816 −3256 165 22908/1528 X 2iX 3i = 282  ˆ 1  = −3816 376 300 1029 = 1164 /1528 YiX 2i = 1029 1528  −3256 300 280 813 −900 /1528 YiX 3i = 813 14,99215 ˆ = 0,76178 − 0,58901 Yˆi =14,99215 + 0,76178X 2i − 0,58901X 3i 44
  45. 39980 −3816 −3256 0,327 cov(ˆ) = −3816 376 300 1528 −3256 300 280 8,55593 − 0,81664 − 0,6968 cov(ˆ) = − 0,81664 0,080466 0,0642 − 0,6968 0,0642 0,05992 45
  46. ˆ 2 var(j) = cjj ( j =1,2, ,k) cjj là phần tử nằm trên dòng j và cột j của ma trận (XTX)-1 var(ˆ1) = 8,55593 var(ˆ 2) = 0,080466 var(ˆ 3) = 0,05992 46
  47. 4.2.2. Khoảng tin cậy của các tham số, kiểm định các giả thuyết hồi quy * Khoảng tin cậy các tham số ˆ ˆ ˆ i (i −i ;i +i ) i = SE(i )t(n−k, / 2) * Kiểm định giả thuyết * Kiểm định giả thuyết H0: i = i ˆ −  * t = i i i ˆ SE(i ) Nguyên tắc quyết định: Nếu ti > t(n-k, /2) hoặc ti < -t(n-k, /2) : bác bỏ H0 Nếu - t(n-k, /2) ≤ ti ≤ t(n-k, /2) : chấp nhận H0 47
  48. Tìm khoảng tin cậy của 2 trong mô hình hồi qui nêu trong thí dụ 2 ở trên với hệ số tin cậy là 95%? Giải: Từ kết quả tính ở thí dụ 2 ta có: ^ ^ 2 376 ^ var ( ) =  .C = 0,327. = 0,080466; se ( ) = 0,28344 2 22 1528 2 Vậy khoảng tin cậy của là: 0,76178 2,365 0,28344 hay :(0,091 2 1,432) 0 Kiểm định giả thiết H0 :  j =  j ( j =1,2, ,k) Ta dùng thống kê: ^ ^ B − B t = j 0 ( j =1,2, ,k) se(Bj )
  49. 4.2.3. Hệ số xác định và kiểm định sự phù hợp của mô hình ˆ ˆ ˆ 2 2  yi x2i + 3  yi x3i + + k  yi xki R = 2  yi n −1 R 2 =1− (1− R2 ) n − k 49
  50. Kiểm định sự phù hợp của mô hình tức là kiểm định giả thiết đồng thời bằng không: H0: 2 = 3 = = k = 0 ESS H : j 1  0 : ( j = 2  k) F = k −1 RSS n − k Với mức ý nghĩa α, tra bảng phân phối Fisher- Snedecor với bậc tự do n1= (k-1) và n2= n-k để tìm giá trị Fα (k-1, n-k); n là số quan sát, k là số biến trong mô hình hồi quy. Fα là giá trị thỏa mãn điều kiện: P[F F (k −1,n − k)] = 50
  51. R2 (n − k) F = (1− R2 )(k −1) Nguyên tắc quyết định: Nếu F > F (k-1, n-k): Bác bỏ H0: Mô hình phù hợp Nếu F ≤ F (k-1, n-k): Chấp nhận H0: Mô hình không phù hợp 51
  52. 4.2.4. Dự báo Cho: 1 0 0 X 2 X = 0 X k ta cần dự báo giá trị trung bình của biến phụ thuộc Y: 0 E( / 0) = + X + + 0 Y X  1  2 2  k X k 52
  53. 0 ˆ * Dự báo điểm của E(Y/X ) là Y 0 0 0 ˆ = ˆ + ˆ 2 + + ˆ k Y 0  1  2 X  k X * Dự báo khoảng: - Giá trị trung bình: T 0 ˆ = 0T ˆ = ˆ 0 Với X=X , ta có: Y 0 X   X −1 Var( ˆ ) = 0T cov(ˆ) 0 2 0T T 0 Y 0 X X = X (X X) X 2 2 Thay  bằng  ˆ se( ˆ ) = var( ˆ ) Y 0 Y 0 53
  54. Với độ tin cậy 1-α, dự báo khoảng của E(Y/X0) là:  ˆ − ( ˆ ); ˆ + ( ˆ ) Y 0 t / 2,n−k se Y 0 Y 0 t / 2,n−k se Y 0 - Giá trị cá biệt: Khoảng tin cậy của Y0 với độ tin cậy 1-α là: − ( ); + ( ) ˆ / 2,n−k ˆ ˆ / 2,n−k ˆ Y 0 t se Y 0−Y 0 Y 0 t se Y 0−Y 0 var( − ˆ ) = var( ˆ ) + 2 Y 0 Y 0 Y 0 ˆ se( − ˆ ) = var( − ˆ ) Y 0 Y 0 Y 0 Y 0 54