Kinh tế lượng - Chương 5: Hồi quy với biến giả

ppt 37 trang vanle 4400
Bạn đang xem 20 trang mẫu của tài liệu "Kinh tế lượng - Chương 5: Hồi quy với biến giả", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptkinh_te_luong_chuong_5_hoi_quy_voi_bien_gia.ppt

Nội dung text: Kinh tế lượng - Chương 5: Hồi quy với biến giả

  1. KINH TẾ LƯỢNG Econometrics Chương 5 HỒI QUY VỚI BIẾN GIẢ 1
  2. Để lượng hóa được những biến định tính, trong phân tích hồi quy người ta sử dụng biến giả (dummy variables). 2
  3. 5.1. Mô hình trong đó biến giải thích là biến định tính Ví dụ 5.1: Xét sự phụ thuộc của thu nhập (Y) (triệu đồng/tháng) vào nơi làm việc của người lao động (DNNN và DNTN). D = 1: làm trong DNNN và D = 0: làm trong DNTN Trong đó Y là biến số lượng, còn D là chỉ tiêu chất lượng. D được gọi là biến giả trong mô hình 3
  4. Mô hình hồi quy: Yi = β1 + β2Di + ui E(Yi/Di) = 1 + 2Di E(Yi/Di=0) = 1 E(Yi/,Di=1) = 1 + 2 Hệ số β1 biểu thị mức thu nhập bình quân tháng của người lao động tại DNTN. Tổng β1 + β2 thể hiện mức thu nhập bình quân tháng của người lao động tại DNNN. 4
  5. Trường hợp có nhiều hơn 2 phạm trù: Giả sử xét trường hợp người lao động làm việc ở 3 nơi: DNNN, DNTN và DNLD. Trong trường hợp này ta sử dụng 2 biến giả, mô hình là: Yi = β1 + β2D1i + β3D2i + ui D1i = 1 nếu làm việc ở DNNN D1i = 0 nếu làm việc ở DN khác D2i = 1 nếu làm việc ở DNTN D2i = 0 nếu làm việc ở DN khác 5
  6. E(Yi/D1i=1, D2i=0) = β1 + β2 → làm việc ở DNNN E(Yi/D1i=0, D2i=1) = β1 + β3 → làm việc ở DNTN E(Yi/D1i=0, D2i=0) = β1 → làm việc ở DNLD 6
  7. Ví dụ 5.2: Khảo sát về năng suất Bảng 5.1: Y Z của hai công nghệ sản xuất, i i người ta thu được số liệu ở bảng 28 0 sau: 32 1 ___ 35 1 Trong đó: Yi(i = (1,10) 27 0 là năng suất một ngày (đơn vị 25 0 tính: tấn) 37 1 Zi = 1 nếu là công nghệ A; Zi = 0 29 0 nếu là công nghệ B. 34 1 33 1 30 0 7
  8. Từ số liệu đã cho, hàm hồi quy tuyến tính của mẫu Y theo Z là: Yˆi = 27,8 + 6,4Zi R2 = 0,7758 Năng suất trung bình của công nghệ B là 27,8 tấn/ngày. Năng suất trung bình của công nghệ A là 27,8 + 6,4 = 34,2 tấn/ngày. Lưu ý: Một chỉ tiêu chất lượng có m phạm trù khác nhau thì ta phải dùng m-1 biến giả để lượng hoá cho chỉ tiêu chất lượng đó. 8
  9. 5.2 Mô hình với biến định lượng và biến định tính * Trường hợp có 1 biến định tính: Ví dụ 5.3: Xét sự phụ thuộc của thu nhập (Y) (triệu đồng/tháng) vào thời gian công tác (X) (năm) và nơi làm việc của người lao động (DNNN, DNTN và DNLD) 9
  10. Để lượng hoá chỉ tiêu chất lượng trên, ta phải dùng 2 biến giả Z1 và Z2. 1 DNNN 1 DNTN Z1i = Z2i = 0 DNNN 0 DNTN 10
  11. E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i E(Y/X,Z1=0,Z2=0) = 1 + 2Xi → làm việc ở DNLD E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3 → làm việc ở DNNN E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4 → làm việc ở DNTN 11
  12. E(Y/X,Z) = 1 + 2Xi + 3Zi Y ˆ + ˆ 1 3 ˆ 3 ˆ 1 Hình 5.1 X 12
  13. E(Y/X,Z) = 1 + 2Xi + 3Zi + 4XiZi Y ˆ ˆ 1 + 3 ˆ 3 ˆ 1 Hình 5.2 X 13
  14. * Trường hợp có 2 biến định tính Ví dụ 5.4: Tiếp theo ví dụ 5.3, thu nhập còn phụ thuộc vào trình độ người lao động (từ đại học trở lên, cao đẳng và khác) 1: nếu là trình độ từ đại học trở lên D = 1i 0: nếu là trình độ khác 1: nếu là trình độ cao đẳng D = 2i 0: nếu là trình độ khác 14
  15. Tổng quát: số biến giả đưa vào mô hình phụ thuộc vào số biến định tính và số phạm trù có ở mỗi biến định tính. Số biến giả đưa vào mô hình có thể được xác định theo công thức sau: k n = (ni −1) i=1 Trong đó: n – số biến giả đưa vào mô hình; k – số biến định tính; ni – số phạm trù của biến định tính thứ i. 15
  16. 5.3. Sử dụng biến giả trong phân tích mùa Thông thường, người ta muốn loại nhân tố mùa khỏi chuỗi thời gian để có thể tập trung vào các thành phần khác của chuỗi thời gian như khuynh hướng tăng hoặc giảm hoàn toàn đều đặn trong một thời kỳ dài. Quá trình loại thành phần khỏi chuỗi thời gian như vậy gọi là chuỗi thời gian được điều chỉnh theo mùa. Ta xét phương pháp biến giả để điều chỉnh mùa theo chuỗi thời gian. 16
  17. Z = 1, nếu quan sát trong mùa, và Z=0 nếu quan sát không nằm trong mùa. Từ tháng 1-6: trong mùa, Tháng 7-12: ngoài mùa. Y: chi tiêu cho quần áo, X: thu nhập khả dụng - Nếu yếu tố mùa chỉ ảnh hưởng đến hệ số chặn ˆ ˆ ˆ ˆ Yi = 1 + 2 Xi + 3Zi - Nếu yếu tố mùa có ảnh hưởng đến hệ số góc thì ˆ ˆ ˆ ˆ ˆ Yi = 1 + 2 Xi + 3Zi + 4 XiZi Mô hình sau có tính tổng quát hơn. Thông qua việc kiểm định giả thiết chúng ta sẽ biết được hệ số góc nào có ý nghĩa. 17
  18. Ví dụ 5.5: Khảo sát số lượng tủ lạnh bán được tại Mỹ từ quý 1 năm 1978 đến quý 4 năm 1985, ta có bảng số liệu (đơn vị: ngàn cái) sau (Bảng 5.2): 18
  19. Năm: FRIG D1 D2 D3 Năm: FRIG D1 D2 D3 quý quý 1978:1 1317 1 0 0 1982:1 943 1 0 0 1978:2 1615 0 1 0 1982:2 1175 0 1 0 1978:3 1662 0 0 1 1982:3 1269 0 0 1 1978:4 1295 0 0 0 1982:4 973 0 0 0 1979:1 1271 1 0 0 1983:1 1102 1 0 0 1979:2 1555 0 1 0 1983:2 1344 0 1 0 1979:3 1639 0 0 1 1983:3 1641 0 0 1 1979:4 1238 0 0 0 1983:4 1225 0 0 0 1980:1 1277 1 0 0 1984:1 1429 1 0 0 1980:2 1258 0 1 0 1984:2 1699 0 1 0 1980:3 1417 0 0 1 1984:3 1749 0 0 1 1980:4 1185 0 0 0 1984:4 1117 0 0 0 1981:1 1196 1 0 0 1985:1 1242 1 0 0 1981:2 1410 0 1 0 1985:2 1684 0 1 0 1981:3 1417 0 0 1 1985:3 1764 0 0 1 1981:4 919 0 0 0 1985:4 1328 0 0 0 19
  20. Dependent Variable: FRIG Method: Least Squares Date: 10/01/10 Time: 09:50 Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-Statistic Prob. D1 62.12500 84.83926 0.732267 0.4701 D2 307.5000 84.83926 3.624501 0.0011 D3 409.7500 84.83926 4.829722 0.0000 C 1160.000 59.99041 19.33642 0.0000 R-squared 0.531797 Mean dependent var 1354.844 Adjusted R-squared 0.481632 S.D. dependent var 235.6719 S.E. of regression 169.6785 Akaike info criterion 13.22216 Sum squared resid 806142.4 Schwarz criterion 13.40537 Log likelihood -207.5545 F-statistic 10.60102 Durbin-Watson stat 0.392512 Prob(F-statistic) 0.000079 20
  21. 5.4 Kiểm định sự ổn định cấu trúc của các mô hình hồi quy bằng biến giả Giả sử ta cần khảo sát hành vi tiết kiệm (Y) theo thu nhập (X) ở hai thời kỳ gắn với những biến cố thực tế khác nhau. Nếu việc tiết kiệm ở hai thời kỳ không có sự khác biệt thì ta chỉ cần sử dụng 1 hàm hồi quy, nếu có sự khác nhau thì cần phân biệt bằng cách có thể sử dụng 2 hàm hồi quy. 21
  22. Ví dụ 5.6: Cho số liệu tiết kiệm và thu nhập cá nhân ở nước Anh từ 1946-63 (triệu pounds). Số liệu được chia làm hai giai đoạn, 1946 – 1954 (thời kỳ sau chiến tranh thế giới thứ II, gọi là thời kỳ tái thiết) và 1955 – 1963 (thời kỳ hậu tái thiết). 22
  23. Thời kỳ Tiết kiệm Thu nhập 1946 0.36 8.8 1947 0.21 9.4 1948 0.08 10 1949 0.2 10.6 1950 0.1 11 1951 0.12 11.9 1952 0.41 12.7 1953 0.5 13.5 1954 0.43 14.3 1955 0.59 15.5 1956 0.9 16.7 1957 0.95 17.7 1958 0.82 18.6 1959 1.04 19.7 1960 1.53 21.1 1961 1.94 22.8 1962 1.75 23.9 23 1963 1.99 25.2
  24. Dependent Variable: Y Method: Least Squares Date: 10/01/10 Time: 09:44 Sample: 1 18 Included observations: 18 Variable Coefficient Std. Error t-Statistic Prob. X 0.150450 0.016286 9.238172 0.0000 Z 1.483923 0.470362 3.154852 0.0070 X*Z -0.103422 0.033260 -3.109471 0.0077 C -1.750172 0.331888 -5.273377 0.0001 R-squared 0.952626 Mean dependent var 0.773333 Adjusted R-squared 0.942475 S.D. dependent var 0.642806 S.E. of regression 0.154173 Akaike info criterion -0.708351 Sum squared resid 0.332771 Schwarz criterion -0.510490 Log likelihood 10.37516 F-statistic 93.84109 Durbin-Watson stat 1.468099 Prob(F-statistic) 0.000000 24
  25. Hàm tiết kiệm Thời kỳ tái thiết: 1946-54 Yi = 1 + 2 X i + vi Thời kỳ hậu tái thiết Yi = 1 + 2 X i +i có các trường hợp sau xảy ra: =  1 1 1 = 1 1 1 1 1 =  2 2 2 2 2 = 2 2 2 25
  26. * Kiểm định Chow: Kiểm định dựa trên những giả thiết: 2 - Các nhiễu (U1i và U2i) ~N(0,σ ). - U1i và U2j có phân phối độc lập. B1: Ước lượng mô hình hồi qui với mẫu quan sát n = n1 + n2 Yi = α1 + α2Xi + Ui Từ hồi qui ta thu được RSS với số bậc tự do là n1 + n2 – k ( k là tham số được ước lượng) 26
  27. B2: Ước lượng riêng từng mô hình hồi qui và thu được RSS1 và RSS2 với bậc tự do tương ứng n1 – k và n2 – k. ___ Đặt: RSS = RSS 1 + RSS 2 , với bậc tự do n1 + n2 – 2k B3: Tính giá trị kiểm định F như sau: ___ (RSS − RSS ) / k F = ___ RSS/(n1 + n2 − 2k) 27
  28. Với bậc tự do k, n1 + n2 – 2k, nếu giá trị F tính được vượt giá trị F tới hạn thì ta bác bỏ giả thuyết cho rằng hồi qui 2 giai đoạn là như nhau, tức là các quan sát của 2 nhóm là không gộp được. 28
  29. Phương pháp biến giả: Chúng ta kiểm tra xem hàm tiết kiệm có bị thay đổi cấu trúc giữa 2 thời kỳ hay không. Chúng ta xét hàm tiết kiệm tổng quát của cả 2 thời kỳ: ˆ ˆ ˆ ˆ Yi = 1 + 2 Xi + 3Zi + 4 XiZi + ei Với n = n1 + n2 Trong đó Z = 1: quan sát thuộc thời kỳ tái thiết Z = 0 : quan sát thuộc thời kỳ hậu tái thiết * Kiểm định giả thiết H0: 3=0 Nếu chấp nhận H0: loại bỏ Z ra khỏi mô hình * Kiểm định giả thiết H0: 4=0 Nếu chấp nhận H0: loại bỏ ZiXi ra khỏi mô hình 29
  30. Từ số liệu ở bảng ta có kết quả hồi quy theo mô hình như sau: Yi = −1,75 + 0,15045X i +1,4839Zi −0,1034X i Zi + ei t = (-5,27) (9,238) (3,155) (-3,109) pt = (0,000) (0,000) (0,007) (0,008) Kết quả trên cho thấy cả tung độ gốc và hệ số góc chênh lệch đều có ý nghĩa thống kê. Điều đó chứng tỏ rằng các hồi quy trong hai thời kỳ là khác nhau. 30
  31. Từ kết quả trên, chúng ta có thể tính hồi quy cho 2 thời kỳ như sau: Thời kỳ tái thiết: Z = 1 Yi = −1,75 + 0,15045X i +1,4839 − 0,1034X i + ei Yi = −0,2661+ 0,0475X i + ei Thời kỳ hậu tái thiết: Z = 0 Yi = −1,75 + 0,15045X i + ei 31
  32. Tiết kiệm ˆ Yi = −1,75 + 0,15045Xi ˆ Yi = −0,2661+0,0475Xi Thu nhập -0.27 -1.75 32
  33. 5.5 Hồi quy tuyến tính từng khúc Trong trường hợp hàm hồi quy có sự thay đổi về mặt cấu trúc ứng với từng khoảng giá trị khác nhau của biến độc lập, nghĩa là mỗi một khoảng tương ứng với một cấu trúc khác nhau của hàm hồi quy, lúc đó ta có thể dùng một hàm hồi quy tuyến tính từng khúc biểu diễn chung cho các cấu trúc khác nhau. 33
  34. Ví dụ 5.5: Sản lượng dưới X*, thì chi phí hoa hồng sẽ khác với khi sản lượng trên X*. Hàm hồi quy sẽ có dạng: * Yi = 1 + 2 X i + 3 (X i − X )Zi + ui Y: Chi phí; X: sản lượng; X*: giá trị ngưỡng sản lượng * 1: X i X Z = 1i * 0 : X i X 34
  35. Y * X X 35
  36. Chi phí (USD) Sản lượng (tấn) 256 1000 414 2000 634 3000 778 4000 1003 5000 Tổng SL làm thay đổi độ dốc 1839 6000 (X*) là 5500 tấn 2081 7000 2423 8000 2734 9000 Kết quả hồi quy: 2914 10000 * Yi = −145,717 + 0,279X i + 0,095(X i − X )Zi + ei t = (-0,824) (6,607) (1,145) R2 = 0,9737 X* = 5500 36
  37. Lưu ý: Nếu biến phụ thuộc là biến giả: Nếu ta có một biến phụ thuộc là biến giả tức là biến chỉ nhận hai giá trị 0 và 1. Chúng ta không thể sử dụng phương pháp bình phương bé nhất (OLS) để ước lượng hàm hồi quy mà phải dùng các phương pháp khác để ước lượng như: -Mô hình xác suất tuyến tính (LPM) -Mô hình Logit (Logit model) -Mô hình Probit (Probit model) -Mô hình Tobit (Tobit model) 37