Kinh tế lượng - Chương 2: Mô hình hồi quy hai biến

ppt 55 trang vanle 3070
Bạn đang xem 20 trang mẫu của tài liệu "Kinh tế lượng - Chương 2: Mô hình hồi quy hai biến", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptkinh_te_luong_chuong_2_mo_hinh_hoi_quy_hai_bien.ppt

Nội dung text: Kinh tế lượng - Chương 2: Mô hình hồi quy hai biến

  1. KINH TẾ LƯỢNG Econometrics Chương 2 MÔ HÌNH HỒI QUY HAI BIẾN 1
  2. 2.1. Giới thiệu 2.1.1. Khái niệm về hồi quy Phân tích hồi qui là nghiên cứu sự phụ thuộc của 1 biến (biến phụ thuộc) vào 1 hay nhiều biến khác (biến độc lập), nhằm mục đích ước lượng (hay dự đoán) giá trị trung bình của biến phụ thuộc trên cơ sở các giá trị biết trước của các biến độc lập. Hồi qui 2 biến là trường hợp nghiên cứu sự phụ thuộc của 1 biến phụ thuộc vào 1 biến độc lập. 2
  3. CHIEUCAO vs. TUOI 135 130 O A C U 125 E I H C 120 115 9 10 11 12 13 14 15 TUOI
  4. 2.1.2. Sự khác nhau giữa các dạng quan hệ ➢Quan hệ hàm số và quan hệ thống kê: - Y = aX + b Các biến không phải là ngẫu nhiên, ứng với mỗi giá trị của biến độc lập có 1 giá trị của biến phụ thuộc. - Năng suất lúa = f(nhiệt độ, lượng nắng, mưa, phân bón ) Biến phụ thuộc là đại lượng ngẫu nhiên. Giá trị của các biến giải thích (biến độc lập) đã biết.Ứng với mỗi giá trị đã biết của biến độc lập có thể có nhiều giá trị khác nhau của biến phụ thuộc. 4
  5. ➢ Hồi quy và quan hệ nhân quả: Phân tích hồi qui không nhất thiết bao hàm quan hệ nhân quả. Lý thuyết kinh tế đề xuất những mối liên hệ hữu ích giữa các biến được sử dụng trong hồi qui, ví dụ như tiêu dùng thì phụ thuộc vào thu nhập thực tế, nhưng thu nhập không phải là nguyên nhân khiến người ta tiêu dùng, nói cách khác, đó không phải là quan hệ nhân quả. 5
  6. ➢Hồi quy và tương quan: - Phân tích tương quan là đo mức độ kết hợp tuyến tính giữa hai biến; không có sự phân biệt giữa các biến; các biến có tính chất đối xứng. r(X,Y) = r(Y,X). - Phân tích hồi quy ước lượng hoặc dự báo một biến trên cơ sở giá trị đã cho của các biến khác. Các biến không có tính chất đối xứng. Biến phụ thuộc là đại lượng ngẫu nhiên. 6
  7. 2.2.Mô hình hồi quy tổng thể và hồi quy mẫu 2.2.1. Mô hình hồi quy tổng thể (PRF) Ví dụ 2.1. Hồi quy tiêu dùng Y theo thu nhập X. Xét sự phụ thuộc chi tiêu của một gia đình vào thu nhập ở một địa phương có tổng cộng 40 hộ gia đình. Ta được số liệu cho ở bảng sau: 7
  8. Bảng 2.1. Chi tiêu và thu nhập của hộ gia đình: X (USD/tuần) 80 100 120 140 160 180 200 Y 55 65 79 80 102 105 120 (USD/tuần) 60 70 84 93 107 110 136 65 74 90 95 110 110 140 70 80 94 103 116 115 144 75 85 98 108 118 120 145 88 113 125 130 115  325 462 445 707 678 690 685 E(Y/Xi) 65 77 89 101 113 115 137 8
  9. Hình 2.1: Quan hệ giữa tiêu dùng và thu nhập TD vs. TN 160 140 120 D 100 T 80 60 40 60 80 100 120 140 160 180 200 220 9 TN
  10. Mô hình hồi quy tổng thể: E(Y/Xi) = f(Xi) = b1 + b2Xi b1 : là hệ số chặn (hệ số tung độ gốc) b2 : hệ số góc - hệ số đo độ dốc đường hồi quy Ví dụ ở hộ gia đình có mức chi tiêu 130 ta có: 130 = b1 + b2.180 + 15 115 Mô hình hồi quy tổng thể ngẫu nhiên: Yi = b1 + b2Xi + ui ui: sai số ngẫu nhiên của tổng thể ứng với quan sát thứ i. Nó đại diện những nhân tố còn lại ảnh hưởng đến chi tiêu 10
  11. Sai số ngẫu nhiên hình thành từ nhiều nguyên nhân: - Bỏ sót biến giải thích. - Sai số khi đo lường biến phụ thuộc. - Dạng mô hình hồi quy không phù hợp. - Các tác động không tiên đoán được. 11
  12. 2.2.2. Mô hình hồi quy mẫu (SRF) Mô hình hồi quy mẫu: ˆ ˆ ˆ Yi = b1 + b2 Xi Trong đó ˆ b1 : ước lượng cho b1. ˆ b 2 : Ước lượng cho b2. ˆ : Ước lượng cho E(Y/Xi) Yi Mô hình hồi quy mẫu ngẫu nhiên ˆ ˆ Yi = b1 + b2 Xi + ei 12
  13. Hình 2.2 Đường hồi quy tuyến tính mẫu và tổng thể Y SRF :Yˆi = bˆ1 + bˆ 2 Xi Y Yi i ei ui PRF : E(Y / Xi) = b 1 + b 2 X Yˆi E(Y/Xi) E(Y/Xi) A consumption expenditure consumption X Xi disposable income 13
  14. 2.2.3. Mô hình hồi quy tuyến tính (LRF) Hồi quy tuyến tính chỉ yêu cầu tuyến tính trong các tham số, không yêu cầu tuyến tính trong biến số. * Mô hình 1 Y = b + b + u 1 2 X i là mô hình tuyến tính trong các tham số nhưng phi tuyến theo biến số. * Mô hình 2 Y = b1 + (1− b2 ) X + ui là mô hình phi tuyến trong các tham số nhưng tuyến tính trong biến số. Hồi quy tuyến tính theo OLS chỉ chấp nhận dạng mô hình tuyến tính trong tham số. 14
  15. 2.3. Ước lượng các hệ số của mô hình hồi quy theo phương pháp bình phương tối thiểu (Ordinary Least Squares – OLS) 2.3.1.Các giả định của mô hình hồi quy tuyến tính cổ điển Giả thiết 1: Các biến giải thích là phi ngẫu nhiên tức là các giá trị của chúng được cho trước hoặc được xác định. Giả thiết 2: Kỳ vọng của yếu tố ngẫu nhiên ui bằng 0, tức là: Eui X i = 0 Giả thiết 3: Các ui có phương sai bằng nhau (phương 2 sai thuần nhất) varui X i = 15
  16. Giả thiết 4: Không có tự tương quan giữa các u: cov[ui, uj] = 0 i j Giả thiết 5: Không tự tương quan giữa ui với Xi: Cov (ui,Xi) = 0 Định lý Gauss-Markov Nếu các giả thiết được thỏa mãn, thì theo định lý Gauss - Markov, các ước lượng OLS sẽ là ước lượng tuyến tính, không chệch và tốt nhất trong số các ước lượng tuyến tính không chệch. 16
  17. 2.3.2. Nội dung của phương pháp Cho n quan sát của 2 đại lượng (Yi, Xi), i =1,n Mô hình hồi quy mẫu ngẫu nhiên ˆ ˆ Yi = b1 + b2 Xi + ei ___ n n 2 2 = ˆ ˆ (i = ) ei (Yi −b 1−b 2 Xi) Do Yi, Xi, 1,n đã biết nên i=1 i=1 là hàm của bˆ1 và bˆ 2 Vì vậy, ta cần tìm và sao cho: n 2 f (bˆ1, bˆ 2) = ˆ ˆ = min (Yi −b 1−b 2 Xi) i=1 17
  18. Điều kiện để phương trình đạt cực trị: - Điều kiện cần: n  e2  i n n i=1 = −2 Y − bˆ − bˆ X = −2 e = 0 ˆ ( i 1 2 i )  i b1 i=1 i=1 n  e2  i n n i=1 = −2 Y −bˆ −bˆ X X = −2 e X = 0 ˆ ( i 1 2 i ) i  i i b2 i=1 i=1 18
  19. Giải hệ phương trình trên được: ˆ ˆ b1 = Y − b2 X n  X i Yi X i − n.X.Y X = ˆ i=1 n b2 = n 2 2 Yi  X i − n.(X ) Y = i=1 n n đặt x = X − X  xiyi i i i=1 ˆ 2 b = n yi = Yi −Y 2  xi i=1 19
  20. - Xét điều kiện đủ: Ta có ma trận Hessian như sau: '' '' 2 Xi f bˆ1bˆ1 f bˆ1bˆ 2 2n  H = = '' '' 2 2 Xi 2 f ˆ ˆ f ˆ ˆ  Xi b 2 b 1 b 2 b 2 '' Với H 1 = f = 2n 0 bˆ1bˆ1 2 2 2 2 2 H 2 = H = 4[n −( ] = 4n[ − n ] = 4n 0 Xi  Xi) Xi (X) xi ˆ ˆ (b 1, b 2) là điểm cực tiểu của f (bˆ1, bˆ 2) 20
  21. Thí dụ: Bảng sau đây cho số liệu về mức chi tiêu tiêu dùng (Y – đô la/tuần) và thu nhập hàng tuần (X - $/tuần) của một mẫu gồm 10 hộ gia đình. Giả sử X và Y quan hệ tương quan tuyến tính. Hãy ước lượng hàm hồi quy của Y theo X. Yi 70 65 90 95 110 115 120 140 155 150 Xi 80 100 120 140 160 180 200 220 240 260 Phân tích: nn Yi X i− n X Y x i y i bˆ ==ii==11ˆˆ 2 nnbb12=−YX 2 2 2 Xii− n.( X ) x ii==11
  22. Giải: 2 YXXXYi=1110;  i = 1700;  i = 322000;  i i = 205500; X 1700 1110 XY= i = =170; = = 111 n 10 10 n  xi y i= Y i X i − n. X . Y = 205500 − 10 170 111 = 16800 i=1 n 2 2 2 2  xii= X − n.( X ) = 322000 − 10.( 170) = 33000 i=1 n  xyii ˆ i=1 16800 ˆ ˆ b2 = n ==0,5091 bb1 = YX−2 =111 − 0,5091( 170) = 24,453 2 33000  xi i=1 YXi =+24,453 0,5091
  23. Giá trị b 1 = 24,453 là tung độ gốc, chỉ mức tiêu dùng trung bình hàng tuần khi mà thu nhập hàng tuần bằng 0. Giá trị b 2 = 0,5091 chỉ ra rằng, xét các giá trị của X nằm trong khoảng (80;260), khi thu nhập tăng 1$/tuần thì chi tiêu tiêu dùng của một gia đình tăng trung bình khoảng 0,51 $/tuần.
  24. 2.4. Phương sai, sai số chuẩn của các ước lượng, hệ số xác định R2, hệ số tương quan r 2.4.1. Phương sai và sai số chuẩn của các ước lượng 24
  25. Phương sai Sai số chuẩn 2 2  i 2 2 ˆ1 X ˆ Var(b ) = ˆ = 2 se(b1) = ˆ = ˆ  b 1 n   b 1  b 1 xi 2 2 1 2 ˆ se(bˆ 2) = = Var(b 2) = ˆ = bˆ 2 bˆ 2  b 2 2    xi 2 2 Trong đó :  = var (Ui). Do  chưa biết 2 nên dùng ước lượng của nó là: 2 = ei ˆ n − 2 25
  26. 2.4.2. Hệ số xác định R2 và hệ số tương quan r: TSS (Total Sum of Squares): Tổng bình phương tất cả các sai lệch giữa giá trị thực tế của Y với giá trị trung bình của nó. ESS (Explained Sum of Squares): Tổng bình phương tất cả các sai lệch giữa giá trị của Y được tính theo mô hình với giá trị trung bình của nó. RSS (Residual Sum of Squares): Tổng bình phương tất cả các sai lệch giữa giá trị thực tế với giá trị lý thuyết theo mô hình của Y. 26
  27. n 2 2 TSS = = 2 − n. (Yi −Y ) Yi (Y ) i=1 n 2 2 n ESS = ˆ = ˆ 2 (Yi −Y ) (b 2) xi i=1 i=1 n n 2 RSS = 2 = ˆ ei (Yi −Yi) i=1 i=1 TSS = ESS + RSS (Đối với mô hình hồi quy có hệ số chặn) 27
  28. Hình 2.3: Ý nghĩa hình học của TSS, ESS và RSS Y SRF Y bˆ1 + bˆ 2 Xi Yˆi −Y Yi −Y Yˆi ei Yi X O X i X 28
  29. Ta định nghĩa: 2 n n 2 2 ˆ 2  i  i 2 ESS RSS b x e = =1− = i=1 =1− i=1 R TSS TSS n 2 n 2  yi  yi i=1 i=1 Là hệ số xác định (coefficient of determination) được sử dụng để đo mức độ phù hợp của hàm hồi quy. 0 R2 1 29
  30. Tính chất của R2: - 0≤ R2 ≤1. Với R2=0 thể hiện X và Y độc lập thống kê. R2 =1 thể hiện X và Y phụ thuộc tuyến tính hoàn hảo. - R2 không xét đến quan hệ nhân quả. 30
  31. 2 ESS=( Y − Y )2 =b x 2 = (0,5091) 2 33000 = 8553,0327 i ( 2 ) i 2 TSS= Y2 − n. Y = 132100 − 10 1112 = 8890  i ( ) ( ) ESS 8553,0327 R2 = = = 0,9621 TSS 8890 RSS= TSS −ES S = 8890 − 8553,0327 = 336,9678 2 336,9678  ==42,1210 10− 2 X 2 322000 ˆ 22 i Var(bˆ )== 42,1210 41,1 Var()b1 == ˆ 2  1 b1 10 33000 nx i 42,1210 1 ˆ ˆ 22Var(b2 )== 0,001276 Var()b2 == ˆ  b2 2 33000  xi
  32. Hệ số tương quan r: Hệ số tương quan r đo lường mức độ phụ thuộc tuyến tính giữa 2 đại lượng X và Y. n  yi xi r = i=1 n n 2 2  yi  xi i=1 i=1 32
  33. Tính chất của r: - r > 0: giữa X và Y có quan hệ đồng biến r→ ± 1: X và Y có quan hệ tuyến tính chặt chẽ r → 0: X và Y có quan hệ tuyến tính không chặt chẽ r 0, b, d là hằng số, và: * X i = aX i + b * Yi = cYi + d Thì : rXY = rX*Y* 33
  34. - Nếu X, Y độc lập thì r = 0. - r chỉ là đại lượng đo sự kết hợp tuyến tính hay phụ thuộc tuyến tính, r không có ý nghĩa để mô tả quan hệ phi tuyến. - rXY = ± R 2 n  x i yi 2 i=1 2 R = n n = rX,Y 2 2  x i  yi i=1 i=1 rXY ==0,9621 0,9808 34
  35. 2.5. Phân bố xác suất của các ước lượng 2 Giả thiết 6: ui có phân phối chuẩn N (0,  ), ˆ ˆ 2 Với các giả thiết nêu trên, các ước lượng b 1 , b 2 ,  ˆ có các tính chất sau: - Chúng là các ước lượng không chệch - Có phương sai cực tiểu - Khi số quan sát đủ lớn thì các ước lượng này xấp xỉ với giá trị thực của phân phối ˆ ˆ 2 b1 − b1 b1 ~ N(b1, ˆ ) Z = ~ N(0,1) b1  ˆ b1 ˆ ˆ 2 b2 − b2 b2 ~ N(b2 , ˆ ) Z = ~ N(0,1) b2  ˆ b2 35
  36. X 2 ˆ 22 i ˆ 2 Var()b1 = ˆ = se()b1 == ˆˆ  b1 2 bb11 nx i ˆ 221 ˆ 2 Var()b2 = ˆ =  se(b2 ) = ˆ =  ˆ b2 2 bb22  xi 2 2 e RSS  == i nn−−22
  37. 2 2 (n − 2)ˆ 2  = 2 ~  (n − 2)  2 Yi ~ N(b 1 + b 2 Xi, ) Với các tính chất trên ta có thể tìm khoảng tin cậy và kiểm định giả thiết về các tham số hồi qui. 37
  38. 2.6. Khoảng tin cậy của các tham số Ước lượng khoảng cho hệ số hồi quy với mức ý nghĩa α (độ tin cậy 1- α) như sau: ˆ ˆ bi (bi −i ;bi +i ) ˆ i = t(n−2, / 2)SE(bi ) 38
  39. Khoảng tin cậy của σ2 (với hệ số tin cậy 1 – α) được xác định: 2 2 (n − 2) 2 P ˆ =1−  1− / 2 2  / 2  2 2 (n − 2) 2 (n − 2) P ˆ ˆ =1− 2  2  / 2  1− / 2 39
  40. • Tìm khoảng tin cậy 95% của β , β 2 1 2 ESS=( Y − Y )2 =b x 2 = (0,5091) 2 33000 = 8553,0327 i ( 2 ) i 2 TSS= Y2 − n. Y = 132100 − 10 1112 = 8890  i ( ) ( ) ESS 8553,0327 R2 = = = 0,9621 TSS 8890 RSS= TSS −ES S = 8890 − 8553,0327 = 336,9678 2 336,9678  ==42,1210 10− 2 X 2 ˆ 22 i ˆ 322000 Var()b1 == ˆ  Var(b )== 42,1210 41,0999 b1 2 1 nx i 10 33000 42,1210 221 ˆ ˆ Var(b2 )== 0,001276 Var()b2 == ˆ 2  b2 33000  xi
  41. se(bb11 )= v ar( ) = 41,0999 = 6,4109 se(bb22 )=v ar( ) = 0,001276 = 0,03572
  42. • Với độ tin cậy 95% thì t( n− 2, / 2) = t (8;0,025) = 2,306 • Vậy khoảng tin cậy 95% của β1 là 24,453 2,306 6,4109 hay 9,6695 b1 39,2365 • Vậy khoảng tin cậy 95% của β2 là 0,5091 2,306 0,03572 hay 0,4267 b2 0,5915 Ý nghĩa: Với các điều kiện các yếu tố khác không thay đổi, khi thu nhập tăng 1$/tuần thì chi tiêu tiêu dùng trung bình của một gia đình tăng trong khoảng từ 0,4267 đến 0,5914 $/tuần
  43. 2.7. Kiểm định giả thuyết về hệ số hồi quy H : b = b * 0 2 2 H : b b * 1 2 2 Có 3 cách để kiểm định giả thuyết: Cách 1: Kiểm định t bˆ − b * t = 2 2 ˆ SE(b2 ) Quy tắc quyết định t t Nếu ( n − 2 , / 2 ) thì bác bỏ H0. Nếu t t ( n − 2 , / 2 ) thì ta không thể bác bỏ H0. 43
  44. Hình 2.4: Khoảng tin cậy của β f(t) /2 /2 -t t /2 /2 -4 -3 -2 -1 0 1 2 3 4 t 44
  45. Cách 2: Phương pháp khoảng tin cậy Giả sử ta tìm được khoảng tin cậy của bi là: ˆ ˆ ˆ bi (bi −i ;bi +i ) i = t(n−2, / 2)SE(bi ) với mức ý nghĩa trùng với mức ý nghĩa của gt H0 Quy tắc quyết định * ˆ ˆ - Nếu b i ( b i −  i ; b i +  i ) chấp nhận H0 * ˆ ˆ - Nếu b i ( b i −  i ; b i +  i ) bác bỏ H0 45
  46. Cách 3: Phương pháp P-value bˆ − b * t = i i i ˆ SE(bi ) Tính P(T ti ) = p Quy tắc quyết định - Nếu p ≤ : Bác bỏ H0 - Nếu p > : Chấp nhận H0 (Phương pháp này thường dùng khi tiến hành trên máy vi tính) 46
  47. Kiểm định giả thiết β2 = 0 với giả thiết đối β2 ≠ 0 với mức ý nghĩa α = 5%. bb22==0,5091;se ( ) 0,03572 0,5091− 0 t ==14,2525 0,03572 Với mức ý nghĩa α = 5% và bậc tự do là n – 2 =8 thì t(n-2;α/2 ) =2,306 tt (n− 2, /2) Bác bỏ giả thiết H0 Ý nghĩa: biến thu nhập thực sự có ảnh hưởng đến chi tiêu.
  48. 2.8. Kiểm định sự phù hợp của mô hình – Dự báo 2.8.1. Kiểm định sự phù hợp của mô hình 2 Kiểm định giả thiết H0: R = 0 với mức ý nghĩa hay độ tin cậy 1 - Xét thống kê R2 (n − 2) F = 1− R2 Quy tắc quyết định - Nếu F > F (1,n-2): Bác bỏ H0 - Nếu F ≤ F (1,n-2): Chấp nhận H0 48
  49. Hình 2.5: Kiểm định F f(F) =0,05 Miền bác bỏ Miền chấp nhận F 49 F (1,n-2)
  50. 2.8.2. Dự báo Cho trước giá trị X = X0, hãy dự báo giá trị trung bình và giá trị cá biệt của Y với mức ý nghĩa hay độ tin cậy 1 - . ˆ ˆ ˆ Yi = b1 + b2 Xi * Dự báo điểm ˆ ˆ ˆ Y0 = b1 + b2 X0 50
  51. * Dự báo giá trị trung bình của Y ˆ ˆ E(Y / X0 ) (Y0 −0;Y 0+0 ) ˆ Với:  0 = SE(Y0 )t(n−2, / 2) ˆ ˆ SE(Y0 ) = Var(Y0 ) 1 (X − X )2 ˆ ˆ 2 0 Var(Y0 ) =  ( + 2 ) n  xì 51
  52. * Dự báo giá trị cá biệt của Y ˆ ' ˆ ' Y0 (Y0 −0;Y 0+0 ) ' ˆ Với: 0 = SE(Y0 −Y0 )t(n−2, / 2) ˆ ˆ SE(Y0 −Y0 ) = Var(Y0 −Y0 ) 1 (X − X )2 ˆ ˆ 2 0 Var(Y0 −Y0 ) =  (1+ + 2 ) n  xì 52
  53. Hình 2.6: Khoảng tin cậy của giá trị trung bình 12 11 10 9 8 Y CANTREN 7 CANDUOI YF 6 5 4 3 4 6 8 10 12 14 16 18 X 53
  54. Hình 2.7: Khoảng tin cậy của giá trị cá biệt 14 12 10 Y 8 TCABIET DCABIET YF 6 4 2 4 6 8 10 12 14 16 18 X 54
  55. Hãy dự báo giá trị trung bình của chi tiêu cho tiêu dùng khi thu nhập ở mức 100$/tuần với hệ số tin cậy 95%. YX0=bb 1 + 2 0 =24,453 + 0,5091 100 = 75,363 2 1 (100− 170) Var( Y0 )= 42,1210 + = 10,4664 10 33000 se( Y0 )= Var ( Y 0 ) = 3,2352; t (n− 2; /2) = 2,306 75,363 2,306 3,2352