Kinh tế lượng - Chương 5: Biến giả trong phân tích hồi quy

pdf 49 trang vanle 2440
Bạn đang xem 20 trang mẫu của tài liệu "Kinh tế lượng - Chương 5: Biến giả trong phân tích hồi quy", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkinh_te_luong_chuong_5_bien_gia_trong_phan_tich_hoi_quy.pdf

Nội dung text: Kinh tế lượng - Chương 5: Biến giả trong phân tích hồi quy

  1. CHƯƠNG 5 BIẾN GIẢ TRONG PHÂN TÍCH HỒI QUY
  2. BIẾN GIẢ 1. Biết cách đặt biến giả MỤC 2. Nắm phương pháp sử dụng TIÊU biến giả trong phân tích hồi quy 2
  3. NỘI DUNG 1 Khái niệm biến giả 2 Sử dụng biến giả trong mô hình hồi quy 3 Kỹ thuật sử dụng biến giả
  4. 5.1 KHÁI NIỆM • Biến định lượng: các giá trị quan sát được thể hệ bằng con số • Biến định tính: thể hiện một số tính chất nào đó • Để đưa những thuộc tính của biến định tính vào mô hình hồi quy, cần lượng hóa chúng => sử dụng biến giả (dummy variables) 4
  5. Chi tiêu của hộ = α + β1* quy mô hộ + β2*trình độ văn hóa của chủ hộ+ β3* tuổi của chủ hộ + β4* giới tính của chủ hộ β5* nơi sinh sống của hộ Trình độ Tuổi văn hóa của Giới Quy của chủ chủ tính Mã hộ mô hộ Chi tiêu của hộ hộ hộ chủ hộ Nơi sinh sống 38820 4 10097.37 3 48 Nam Nông thôn 38818 6 14695.2 8 42 Nữ Nông thôn 38817 8 11733.34 4 37 Nữ Nông thôn 38816 3 7087.489 0 21 Nữ Nông thôn 38815 9 22809.3 6 48 Nữ Nông thôn 38813 4 9554.563 2 76 Nữ Nông thôn 11212 7 69258.09 9 42 Nữ Thành thị 11211 3 13680.91 0 77 Nữ Thành thị 11209 3 27651.65 13 32 Nữ Thành thị 11208 4 32102.67 8 47 Nữ Thành thị 11207 2 11464.6 7 38 Nam Thành thị 11206 4 17199.63 5 93 Nam Thành thị 5
  6. Ví dụ • Có hai biến độc lập định tính là giới tính của chủ hộ và nơi sinh sống của hộ. Để phân tích hồi quy cần phải lượng hóa hai biến định tính này. • Thực hiện: Giới tính gồm hai biểu hiện là nam và nữ và mã hóa như sau: Nam=1, Nữ=0. • Nơi sinh sống của hộ gồm thành thị và nông thôn nên mã hóa như sau: Thành thị=1, Nông thôn=0. (Việc chọn số mã hóa tùy nhà phân tích). 6
  7. Dữ liệu đã mã hóa Trình độ văn Chi tiêu của hóa của chủ Tuổi của Giới tính Nơi sinh Mã hộ Quy mô hộ hộ hộ chủ hộ chủ hộ sống 38820 4 10097.37 3 48 1 0 38818 6 14695.2 8 42 0 0 38817 8 11733.34 4 37 0 0 38816 3 7087.489 0 21 0 0 38815 9 22809.3 6 48 0 0 38813 4 9554.563 2 76 0 0 11212 7 69258.09 9 42 0 1 11211 3 13680.91 0 77 0 1 11209 3 27651.65 13 32 0 1 11208 4 32102.67 8 47 0 1 11207 2 11464.6 7 38 1 1 11206 4 17199.63 5 93 1 1 7
  8. Ví dụ Chi tiêu Trình độ văn Tuổi của Nghề nghiệp Mã hộ Quy mô hộ của hộ hóa của chủ hộ chủ hộ chủ hộ 38820 4 10097.37 3 48 Bác sĩ 38818 6 14695.2 8 42 Giáo viên 38817 8 11733.34 4 37 Nông dân 38816 3 7087.489 0 21 Bác sĩ 38815 9 22809.3 6 48 Giáo viên 38813 4 9554.563 2 76 Nông dân 11212 7 69258.09 9 42 Bác sĩ 11211 3 13680.91 0 77 Giáo viên 11209 3 27651.65 13 32 Nông dân 11208 4 32102.67 8 47 Bác sĩ 11207 2 11464.6 7 38 Giáo viên 11206 4 17199.63 5 93 Nông dân 8
  9. Ví dụ 1. Nghề nghiệp có 3 nghề (3 phạm trù) 2. Chọn 1 nghề làm phạm trù cơ sở Ví dụ: chọn bác sĩ 3. Hai nghề còn lại là hai biến mới Vậy số biến mới = số phạm trù -1 4. Biến Giáo viên nhận 2 giá trị: 1 nếu là giáo viên; 0 nếu không phải là giáo viên 5. Biến Nông dân nhận 2 giá trị: 1 nếu là nông dân; 0 nếu không phải là nông dân 9
  10. Trình độ văn Quy hóa Nghề mô Chi tiêu của Tuổi của nghiệp chủ Nông Mã hộ hộ của hộ chủ hộ chủ hộ hộ Giáo viên dân ### 4 ### 3 48 Bác sĩ 0 0 ### 6 ### 8 42 Giáo viên 1 0 ### 8 ### 4 37 Nông dân 0 1 ### 3 ### 0 21 Bác sĩ 0 0 ### 9 ### 6 48 Giáo viên 1 0 ### 4 ### 2 76 Nông dân ### 7 ### 9 42 Bác sĩ ### 3 ### 0 77 Giáo viên ### 3 ### 13 32 Nông dân ### 4 ### 8 47 Bác sĩ ### 2 ### 7 38 Giáo viên ### 4 ### 5 93 Nông dân 10
  11. Câu hỏi • Nếu có thêm nghề kế toán thì sao? 11
  12. HỒI QUY VỚI BiẾN ĐỊNH TÍNH Quy tắc: Nếu biến định tính có m biểu hiện thì sử dụng m-1 biến. Ví dụ: Tổng chi tiêu của hộ phụ thuộc vào (1) Giới tính của chủ hộ (2) Số thành viên trong hộ (3) Vùng nơi hộ sinh sống (có 8 vùng) Biến định tính là biến nào? 12
  13. 5.2 Sử dụng biến giả trong mô hình hồi quy Ví dụ 5.1: Xét mô hình Yi = 1 + 2Xi + 3Di + Ui với Y Tiền lương (triệu đồng/tháng) X Bậc thợ D=1 nếu công nhân làm trong khu vực tư nhân D=0 nếu công nhân làm trong khu vực nhà nước D được gọi là biến giả trong mô hình 13
  14. 5.2 Sử dụng biến giả trong mô hình hồi quy Y (thu nhập) X (số năm) D (nơi làm việc) 4 3 1 5 5 0 3 3 0 6 4 1 7 5 1 14
  15. 5.2 Sử dụng biến giả trong mô hình hồi quy E(Y/X,D) = 1 + 2Xi + 3Di (5.1) E(Y/X,D=0) = 1 + 2Xi (5.2) E(Y/X,D=1) = 1 + 2Xi + 3 (5.3) (5.2): tiền lương trung bình của công nhân làm việc trong khu vực quốc doanh với bậc thợ là X (5.3): tiền lương trung bình của công nhân làm việc trong khu vực tư nhân với bậc thợ là X 15
  16. 5.2 Sử dụng biến giả trong mô hình hồi quy 2 tốc độ tăng lương theo bậc thợ 3 chênh lệch tiền lương trung bình của công nhân làm việc ở hai khu vực và cùng bậc thợ (Giả thiết của mô hình: tốc độ tăng lương theo bậc thợ ở hai khu vực giống nhau) 16
  17. E(Y/X,Z) = 1 + 2Xi + 3Di Y ˆ ˆ 1 3 ˆ  3 ˆ  1 X Hình 5.1 mức thu nhập bình quân tháng của người lao động tại KVQD và KVTN khi có bậc thợ là X 17
  18. 5.2 Sử dụng biến giả trong mô hình hồi quy Ví dụ 5.2: Xét sự phụ thuộc của thu nhập (Y) (triệu đồng/tháng) vào thời gian công tác (X) (năm) và nơi làm việc của người lao động (DNNN, DNTN và DNLD) Dùng 2 biến giả Z1 và Z2 với Z1i =1 nơi làm việc tại DNNN Z1i =0 nơi làm việc tại nơi khác Z2i =1 nơi làm việc tại DNTN Z2i =0 nơi làm việc tại nơi khác Z1i = 0 và Z2i = 0 phạm trù cơ sở 18
  19. 5.2 Sử dụng biến giả trong mô hình hồi quy Y (thu X (số Nơi làm Z1 Z2 nhập) năm) việc 4 3 DNNN 1 0 5 5 DNTN 0 1 3 3 DNLD 0 0 6 4 DNTN 1 7 5 DNNN 1 19
  20. 5.2 Sử dụng biến giả trong mô hình hồi quy E(Y/X,Z1,Z2) = 1 + 2Xi + 3Z1i + 4Z2i E(Y/X,Z1=0,Z2=0) = 1 + 2Xi E(Y/X,Z1=1,Z2=0) = 1 + 2Xi + 3 E(Y/X,Z1=0,Z2=1) = 1 + 2Xi + 4 • 3 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNNN và DNLD khi có cùng thời gian làm việc X năm • 4 chênh lệch thu nhập trung bình của nhân viên làm việc tại DNTN và DNLD khi có cùng thời gian làm việc X năm 20
  21. 5.2 Sử dụng biến giả trong mô hình hồi quy Ví dụ 5.3. thu nhập còn phụ thuộc vào trình độ người lao động (từ đại học trở lên, cao đẳng và khác) 1: nếu trình độ từ đại học trở lên D = 1i 0: trường hợp khác 1: nếu trình độ cao đẳng D = 2i 0: trường hợp khác Một chỉ tiêu chất lượng có n phạm trù (thuộc tính) khác nhau thì dùng n-1 biến giả 21
  22. 5.2 Sử dụng biến giả trong mô hình hồi quy Giả sử Y, X là biến định lượng, Z là biến giả (định tính) TH1: Y= 1 + 2Z + 3X + U TH2: Y= 1 + 2X + 3(ZX) + U TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U 22
  23. 5.2 Sử dụng biến giả trong mô hình hồi quy VD 5.4: Khảo sát lương của nhân viên theo số năm kinh nghiệm và giới tính TH1: Y= 1 + 2Z + 3X + U TH2: Y= 1 + 2X + 3(ZX) + U TH3: Y= 1 + 2Z + 3X + 4(ZX)+ U Trong đó Y lương X số năm kinh nghiệm Z giới tính với Z=1: nam; Z=0: nữ 23
  24. 5.2 Sử dụng biến giả trong mô hình hồi quy TH1: Lương khởi điểm của nv nam và nữ khác nhau nhưng tốc độ tăng lương theo số năm kinh nghiệm như nhau TH2: Lương khởi điểm như nhau nhưng tốc độ tăng lương khác nhau TH3: Lương khởi điểm và tốc độ tăng lương khác nhau 24
  25. 5.2 Sử dụng biến giả trong mô hình hồi quy TH1: Lương khởi điểm của nv nam và nữ khác nhau nhưng tốc độ tăng lương theo số năm kinh nghiệm như nhau Hàm PRF: Y= 1 + 2Z + 3X + U Hàm SRF ứng với nữ (Z=0) : ˆ ˆ ˆ Y  1  3 X Hàm SRF ứng với nam (Z=1) : ˆ ˆ ˆ ˆ Y  1  2  3 X 25
  26. 5.2 Sử dụng biến giả trong mô hình hồi quy Y ˆ ˆ ˆ ˆ Y  1  2  3 X ˆ ˆ ˆ Y  1  3 X ˆ ˆ 1 2 ˆ ˆ ˆ  1 ,  2 ,  3 0 ˆ  1 0 X Hình 5.2 Lương khởi điểm của nv nam và nữ khác nhau 26
  27. 5.2 Sử dụng biến giả trong mô hình hồi quy TH2: Lương khởi điểm như nhau nhưng tốc độ tăng lương khác nhau Hàm PRF: Y= 1 + 2X + 3(ZX) + U Với ZX gọi là biến tương tác Hàm SRF ứng với nữ (Z=0) : ˆ ˆ ˆ Y  1  2 X Hàm SRF ứng với nam (Z=1) : ˆ ˆ ˆ ˆ ˆ ˆ ˆ Y  1  2 X  3 X  1 (  2  3 ) X 27
  28. 5.2 Sử dụng biến giả trong mô hình hồi quy Y ˆ ˆ ˆ ˆ Y  1 (  2  3 ) X ˆ ˆ ˆ Y  1  2 X ˆ ˆ ˆ  1 ,  2 ,  3 0 ˆ  1 0 X Hình 5.3 Mức tăng lương theo số năm kinh nghiệm của nv nam và nữ khác nhau 28
  29. 5.2 Sử dụng biến giả trong mô hình hồi quy TH3: Lương khởi điểm và tốc độ tăng lương khác nhau Hàm PRF: Y= 1 + 2Z + 3X + 4(ZX)+ U Hàm SRF ứng với nữ (Z=0) : ˆ ˆ ˆ Y  1  3 X Hàm SRF ứng với nam (Z=1) : ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ Y 1 2 3 X 4 X (1 2 ) (3 4 )X 29
  30. 5.2 Sử dụng biến giả trong mô hình hồi quy Y ˆ ˆ ˆ ˆ ˆ Y (1 2 ) (3 4 )X ˆ ˆ ˆ Y  1  3 X ˆ ˆ  1  2 ˆ ˆ ˆ ˆ  1 ,  2 ,  3 ,  4 0 ˆ  1 0 X Hình 5.4 Lương khởi điểm và mức tăng lương của nv nam và nữ khác nhau 30
  31. 5.3 Ứng dụng sử dụng biến giả 5.3.1 Sử dụng biến giả trong phân tích mùa Y chi tiêu cho tiêu dùng X thu nhập Z = 1 nếu quan sát trong mùa (tháng 1-6) Z = 0 nếu quan sát không nằm trong mùa (tháng 7-12) TH1: Nếu yếu tố mùa chỉ TH2: Nếu yếu tố mùa có ảnh hưởng đến hệ số ảnh hưởng đến hệ số chặn góc ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ Yi 1 2 Xi 3Zi Yi 1  2 X i 3Z i 4 X i Zi (*) Mô hình * có tính tổng quát hơn. Qua việc kiểm định giả thiết để biết được hệ số góc nào có ý nghĩa. 31
  32. Ví dụ Có bảng số liệu sau về doanh số bán từng quý (triệu đồng). Hãy sắp xếp lại số liệu, sử dụng biến giả và viết mô hình hồi quy. Năm Quý Doanh số Năm Quý Doanh số 1970 1 992.7 1971 4 1918.3 1970 2 1077.6 1972 1 2163.9 1970 3 1185.9 1972 2 2417.8 1970 4 1326.4 1972 3 2631.7 1971 1 1434.2 1972 4 2957.8 1971 2 1549.2 1973 1 3069.3 1971 3 1718 1973 2 3304.8 32
  33. Ví dụ Năm Quý Doanh số D2 D3 D4 1970 1 992.7 0 0 0 1970 2 1077.6 1 0 0 1970 3 1185.9 0 1 0 1970 4 1326.4 0 0 1 1971 1 1434.2 0 0 0 1971 2 1549.2 1 0 0 1971 3 1718 0 1 0 1971 4 1918.3 0 0 1 1972 1 2163.9 0 0 0 1972 2 2417.8 1 0 0 1972 3 2631.7 0 1 0 1972 4 2957.8 0 0 1 1973 1 3069.3 0 0 0 1973 2 3304.8 1 0 0 33
  34. Viết mô hình hồi quy mẫu và ý nghĩa các hệ số 34
  35. 5.3 Ứng dụng sử dụng biến giả 5.3.2 Kiểm định tính ổn định cấu trúc của các mô hình hồi quy Ví dụ 5.5. Số liệu tiết kiệm (Y) và thu nhập cá nhân (X) ở nước Anh từ 1946-63 (triệu pounds) TK I Tiết kiệm Thu nhập TK II Tiết kiệm Thu nhập 1946 0.36 8.8 1955 0.59 15.5 1947 0.21 9.4 1956 0.9 16.7 1948 0.08 10 1957 0.95 17.7 1949 0.2 10.6 1958 0.82 18.6 1950 0.1 11 1959 1.04 19.7 1951 0.12 11.9 1960 1.53 21.1 1952 0.41 12.7 1961 1.94 22.8 1953 0.5 13.5 1962 1.75 23.9 1954 0.43 14.3 1963 1.99 25.2 35
  36. 5.3 Ứng dụng sử dụng biến giả Mục tiêu: Kiểm tra hàm tiết kiệm có thay đổi cấu trúc giữa 2 thời kỳ hay không. Cách 1 Lập hai mô hình tiết kiệm ở 2 thời kỳ Thời kỳ tái thiết: 1946-54 Yi 1 2 Xi U1i (5.3.1) Thời kỳ hậu tái thiết: 1955-63 (5.3.2) Yi 1 2 Xi U2i Và kiểm định các trường hợp sau  1 1 1 1 1 1 1 1  2 2 2  2 2  2 2 2 36
  37. Kiểm định Chow Giả thiết: H0: Hai hàm (5.3.1) và (5.3.2) giống nhau B1: Gộp hai nhóm quan sát n=n1+n2 và tính RSS có bậc tự do df= n1+n2-k từ mô hình hồi quy Yi 1 2 Xi U2i B2: Ước lượng (5.3.1) và (5.3.2) và thu được RSS1 có df = n1-k, RSS2 có df = n2-k. Đặt RSS*=RSS1+RSS2 B3: Tính RSS RSS* /k F * RSS /(n1 n2 2k) B4: Nếu F > Fα(k, n1+n2-2k): bác bỏ H0 37
  38. 5.3 Ứng dụng sử dụng biến giả Cách 2 Sử dụng biến giả B1. Lập hàm tiết kiệm tổng quát của cả 2 thời kỳ ˆ ˆ ˆ ˆ Yi 1 2 X i 3Zi  4 X i Zi ei Với n = n1 + n2 Z = 1 quan sát thuộc thời kỳ tái thiết Z = 0 quan sát thuộc thời kỳ hậu tái thiết B2. Kiểm định giả thiết H0: 3=0 Nếu chấp nhận H0: loại bỏ Z ra khỏi mô hình B3. Kiểm định giả thiết H0: 4=0 Nếu chấp nhận H0: loại bỏ ZiXi ra khỏi mô hình 41
  39. 5.3 Ứng dụng sử dụng biến giả Kết quả hồi quy theo mô hình như sau Yi 1,75 0,15045X i 1,4839Zi 0,1034X i Zi ei t = (-5,27) (9,238) (3,155) (-3,109) p = (0,000) (0,000) (0,007) (0,008) Nhận xét •Tung độ gốc chênh lệch và hệ số góc chênh lệch có ý nghĩa thống kê •Các hồi quy trong hai thời kỳ là khác nhau 43
  40. 5.3 Ứng dụng sử dụng biến giả Thời kỳ tái thiết: Z = 1 ˆ Yi 1,75 0,15045X i 1,4839 0,1034X i ˆ Yi 0,2661 0,0475X i Thời kỳ hậu tái thiết: Z = 0 ˆ Yi 1,75 0,15045 X i 44
  41. 5.3 Ứng dụng sử dụng biến giả Tiết kiệm ˆ Yi 1,75 0,15045Xi Thời kỳ hậu tái thiết ˆ Yi 0,2661 0,0475X i Thời kỳ tái thiết Thu nhập -0.27 -1.75 Hình 5.6 Mô hình hồi quy cho 2 thời kỳ 45
  42. 5.3 Ứng dụng sử dụng biến giả 5.3.3. Hàm tuyến tính từng khúc Ví dụ 5.6: Doanh thu dưới X* thì tiền hoa hồng sẽ khác với khi doanh thu trên X*. Hàm hồi quy có dạng * Yi 1  2 X i  3 ( X i X )Z i ui Y Tiền hoa hồng X Doanh thu X* Giá trị ngưỡng sản lượng Zi =1 nếu Xi > X* Zi =0 nếu Xi ≤ X* 46
  43. 5.3 Ứng dụng sử dụng biến giả Y X * X Hình 5.7 Hàm tuyến tính từng khúc •Kiểm định giả thiết H0: 3=0 Nếu bác bỏ H0: hàm hồi quy thay đổi cấu trúc 47
  44. 5.3 Ứng dụng sử dụng biến giả Ví dụ: Sản lượng dưới X*, thì chi phí hoa hồng sẽ khác với khi sản lượng trên X*. Hàm hồi quy sẽ có dạng: * Yi 1  2 X i  3 ( X i X )Z i ui Y: Chi phí; X: sản lượng; X*=5.500 tấn: giá trị ngưỡng sản lượng * 1: X i X Z 1i * 0 : X i X 48
  45. 5.3 Ứng dụng sử dụng biến giả CP 256 414 634 778 1003 SL 1000 2000 3000 4000 5000 CP 1839 2081 2423 2734 2914 SL 6000 7000 8000 9000 10000 Ta có kết quả hồi quy như sau: * Yi 145,717 0,279Xi 0,095(Xi X )Zi ei t = (-0,824) (6,607) (1,145) R2 = 0,9737 X* = 5500 49