Kinh tế lượng - Chương 1: Mô hình hồi qui hai biến

pdf 36 trang vanle 2110
Bạn đang xem 20 trang mẫu của tài liệu "Kinh tế lượng - Chương 1: Mô hình hồi qui hai biến", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkinh_te_luong_chuong_1_mo_hinh_hoi_qui_hai_bien.pdf

Nội dung text: Kinh tế lượng - Chương 1: Mô hình hồi qui hai biến

  1. Chương 1 MÔ HÌNH HỒI QUI HAI BIẾN Những khái ni ệm cơ bản 1
  2. Phạm Văn Minh biên soạn NỘI DUNG 1. Bản chất c ủa phân tích hồi quy 2. Bản chất và nguồn s ố li ệu cho PTHQ 3. Mô hình hồi quy hai bi ến 2
  3. Phạm Văn Minh biên soạn 1. Bản chất của phân tích hồi quy (1)  Phân tích hồi quy là tìm quan hệ ph ụ thu ộc của một bi ến, được gọi là bi ến ph ụ thu ộc vào một ho ặc nhi ều bi ến khác, được gọi là bi ến độ c lập nh ằm mục đích ước lượng ho ặc tiên đoán giá tr ị kỳ vọng (trung bình) của bi ến ph ụ thu ộc khi bi ết tr ước giá tr ị của bi ến độ c lập.  Bi ến độ c lập hay bi ến gi ải thích là bi ến phi ng ẫu nhiên nó ảnh hưởng hay tác độ ng tới bi ến khác, th ường được ký hi ệu là X.  Bi ến ph ụ thu ộc hay bi ến được gi ải thích là bi ến ng ẫu nhiên, nó ch ịu ảnh hưởng hay ch ịu tác độ ng của bi ến khác, th ường được ký hi ệu là Y. 3
  4. Phạm Văn Minh biên soạn 1. Bản chất của phân tích hồi quy (2)  Ví dụ BIẾN PHỤ THUỘC - Y BIẾN ĐỘC LẬP - Xi (Dependent variable) (Independent variable) Chi tiêu ? Chiều cao ? Thu nhập ? Số vụ tai nạn ? Doanh thu ? Sản lượng nông sản ? 4
  5. Phạm Văn Minh biên soạn 1. Bản chất của phân tích hồi quy (2)  Ví dụ BIẾN PHỤ THUỘC - Y BIẾN ĐỘC LẬP - Xi (Dependent variable) (Independent variable) Chi tiêu Thu nhập, Giới tính, v.v. Chiều cao Tuổi, Giới tính, v.v. Thunhập Tuổi,Trìnhđộhọcvấn, v.v. Sốvụ tai nạn Lượngbiatiêuthụ, v.v. Doanh thu Chi phí quảng cáo, v.v. Sản lượng nông sản Lượng nước, Phân bón, v.v. 5
  6. Phạm Văn Minh biên soạn 1. Bản chất của phân tích hồi quy (3) 135 130 125 CHIEUCAO 120 115 9 10 11 12 13 14 15 TUOI Bi ểu đồ phân tán: Chi ều cao theo độ tu ổi 6
  7. Phạm Văn Minh biên soạn 1. Bản chất của phân tích hồi quy (4) Phân tích hồi quy gi ải quy ết các vấn đề sau đây: 1. Ước lượng giá tr ị trung bình của bi ến ph ụ thu ộc với giá tr ị đã cho của bi ến độ c lập. 2. Ki ểm đị nh gi ả thi ết về bản ch ất của sự ph ụ thu ộc. 3. Dự đoán giá tr ị trung bình của bi ến ph ụ thu ộc khi bi ết giá tr ị đã cho của bi ến độ c lập. 7
  8. 1.1. Sự khác nhau gi ữa các dạng quan hệ (1) • Quan hệ hàm số (t ất đị nh) và quan hệ th ống kê QHHS: Shcn = Dài x Rộng;Y=2.X+3. QHTK: Cùng di ện tích và kỹ thu ật nuôi tôm  năng su ất khác nhau. • Hồi quy và quan hệ nhân qu ả V Có th ể hồi quy số vụ tr ộm theo số nhân viên cảnh sát ho ặc ng ược lại. V Quan hệ nhân qu ả ch ỉ ra rằng số cảnh sát tăng do số vụ tr ộm tăng. • Hồi quy và tương quan V Phân tích tương quan ch ỉ cho th ấy độ mạnh yếu của mối quan hệ tuy ến tính gi ữa hai bi ến số. 8
  9. 2. Bản chất và nguồn s ố li ệu cho PTHQ 2.1. Các loại s ố li ệu Số li ệu chu ỗi th ời gian (time-series) V Là một tập hợp quan sát về các giá tr ị mà một hay nhi ều bi ến số ở cùng một đơ n vị (đị a ph ươ ng) nh ận trong nh ững th ời gian khác nhau. VD: GDP, Số ng ườ i th ất nghi ệp của Vi ệt Nam từ 1986 đế n 2015, v.v. Số li ệu chéo (cross-sectional) (*) V Là số li ệu của một hay nhi ều bi ến thu th ập tại cùng một th ời điểm ở nhi ều đơ n vị (đị a ph ươ ng khác nhau). VD: Điều tra dân số Vi ệt Nam năm 2014, Giá thuê văn phòng tại các qu ận Tp.HCM, v.v. Số li ệu tổng hợp (pooled data) V Bao gồm cả số li ệu chu ỗi th ời gian và số li ệu chéo. VD: Sản lượ ng cà phê từ năm 2002 đế n năm 2012 của các tỉnh Bình Ph ướ c, Đắ c Lắc, Gia Lai, v.v. 9
  10. 2. Bản chất và nguồn s ố li ệu cho PTHQ 2.1. Các loại s ố li ệu (tt) Số li ệu chu ỗi th ời gian (time-series) Giá dầu ($/thùng) trung bình hàng năm từ 1999 - 2014 Inflation Inflation Nominal Nominal Year Adjusted Year Adjusted Price Price Price Price 1999 $16.56 $23.42 2007 $64.20 $72.99 2000 $27.39 $37.55 2008 $91.48 $100.01 2001 $23.00 $30.69 2009 $53.48 $58.76 2002 $22.81 $29.92 2010 $71.21 $77.11 2003 $27.69 $35.55 2011 $87.04 $91.39 2004 $37.66 $47.05 2012 $86.46 $88.95 2005 $50.04 $60.45 2013 $91.17 $92.41 2006 $58.30 $68.28 2014 $89.08 $89.08 10 Ngu ồn:
  11. 2. Bản chất và nguồn s ố li ệu cho PTHQ 2.1. Các loại s ố li ệu (tt) Số li ệu chéo (cross-sectional) - Th ườ ng dùng trong KTL Di ện tích, dân số và mật độ dân số năm 2013 phân theo đị a ph ươ ng Diện tích Dân số trung bình Mật độ dân số (Km2) (Nghìn người) (Người/km2) Hà Nội 3324.3 6936.9 2087.0 Vĩnh Phúc 1238.6 1029.4 831.0 Bắc Ninh 822.7 1114.0 1354.0 Quảng Ninh 6102.4 1185.2 194.0 Hải Dương 1656.0 1747.5 1055.0 Hải Phòng 1527.4 1925.2 1260.0 Hưng Yên 926.0 1151.6 1244.0 Thái Bình 1570.5 1788.4 1139.0 Hà Nam 860.5 794.3 923.0 Nam Định 1652.8 1839.9 1113.0 Ninh Bình 1378.1 927.0 673.0 11 Ngu ồn:
  12. 2. Bản chất và nguồn s ố li ệu cho PTHQ 2.1. Các loại s ố li ệu (tt) Số li ệu tổng hợp (pooled data) Số lượ t hành khách vận chuy ển phân theo đị a ph ươ ng Triệu lượt người 2005 2006 2007 2008 2009 2010 2011 2012 Hà Giang 0,5 0,6 0,7 0,8 1,0 1,1 1,6 1,8 Cao Bằng 1,1 0,9 1,0 1,2 1,2 1,2 1,2 1,3 Bắc Kạn 1,3 1,4 1,5 1,6 2,1 2,2 3,0 3,0 Tuyên Quang 3,4 4,2 3,6 5,3 5,7 5,8 5,8 6,0 Lào Cai 2,5 3,0 3,4 4,0 4,1 4,2 4,6 4,6 Yên Bái 4,5 4,8 5,0 5,2 5,5 5,9 5,9 6,4 Thái Nguyên 2,5 3,2 4,0 4,8 5,9 6,3 7,2 8,2 Lạng Sơn 3,4 3,6 4,0 5,1 6,5 7,5 8,2 8,6 Ngu ồn: 12
  13. 2. Bản chất và nguồn s ố li ệu cho PTHQ 2.2. Bản chất và nguồn s ố li ệu  Số li ệu sơ cấp ho ặc th ứ cấp.  Th ực nghi ệm, thu được qua thí nghi ệm (k ỹ thu ật, Khoa học tự nhiên).  Phi th ực nghi ệm, thu th ập từ th ực tế (KHXH&NV, Kinh tế).  Các số li ệu có th ể thu th ập bởi:  Cơ quan nhà nướ c (T ổng cục th ống kê, Qu ốc Hội, v.v.)  Các tổ ch ức qu ốc tế (WB, IMF, WHO, v.v.)  Các công ty (Ch ứng khoán, Sàn vàng, v.v.)  Các cá nhân (Nhà nghiên cứu, Sinh viên, v.v.) 13
  14. 2. Bản chất và nguồn s ố li ệu cho PTHQ 2.3. Tính chính xác c ủa s ố li ệu  Trên thực tế có rất nhiều nguồn số liệu nhưng độ chính xác thường không đủ cao, đó là do:  Sai số đo lường (do tính gần đúng hay làm tròn số).  Thiên lệch lựa chọn trong mẫu (sample bias): Đối tượng đã được chọn phù hợp từ chối trả lời phiếu câu hỏi của cuộc điều tra. Người trả lời không trả lời hết các câu hỏi trong bảng phỏng vấn, nhờ người khác trả lời, v.v.  Phương pháp chọn mẫu khác nhau.  Số liệu kinh tế thường ở mức rất tổng hợp.  Một số số liệu quan trọng nhưng do tính bảo mật nên không được công bố (vd: thuế TNCN).  Luôn nhớ rằng “Garbage In – Garbage Out” !!! 14
  15. 3. Mô hình hồi quy 2 bi ến Một vài ý t ưởng c ơ bản 1. Đị nh nghĩa v ề phân tích hồi quy 2. Hồi quy 2 bi ến 3. Hàm hồi quy t ổng thể (PRF) 4. Hàm hồi quy mẫu (SRF) 15
  16. 3. Mô hình hồi quy 2 bi ến 3.1. Đị nh nghĩa về mô hình hồi qui Mô hình hồi quy là mô hình xem xét về xu th ế thay đổ i của một bi ến này theo một bi ến ho ặc một số bi ến khác; ho ặc xu th ế thay đổ i của một bi ến theo th ời gian và xu th ế thay đổ i đó th ể hi ện bởi một ph ương trình toán học gọi là ph ương trình hồi quy. Trong tr ường hợp một bi ến thay đổ i theo các bi ến khác, thì bi ến đó th ường được gọi là bi ến ph ụ thu ộc (dependent variable) và các bi ến gi ải thích cho sự thay đổ i gọi là các bi ến độ c lập (independent variables). 16
  17. 3. Mô hình hồi quy 2 bi ến 3.2. Hồi qui 2 bi ến  Ước lượng hay dự đoán giá tr ị trung bình (t ổng th ể) của bi ến ph ụ thu ộc trên cơ sở các giá tr ị đã bi ết ho ặc đã xác đị nh của 1 bi ến gi ải thích.  Ví dụ: Gi ả thi ết có một qu ốc gia gồm 60 hộ gia đình. Xét mối quan hệ gi ữa Y, chi tiêu hàng tu ần của hộ gia đình, và X, thu nh ập kh ả dụng (sau thu ế) hàng tu ần của hộ gia đình. Hay đơ n gi ản hơn là dự đoán mức trung bình của chi tiêu tiêu dùng hàng tu ần khi bi ết thu nh ập hàng tu ần của gia đình.  Th ực hi ện: chia 60 gia đình ra 10 nhóm có thu nh ập tươ ng đố i nh ư nhau theo bảng sau: 17
  18. 3. Mô hình hồi quy 2 bi ến 3.2. Hồi qui 2 bi ến (tt) Thu nhập và chi tiêu của các hộ gia đình X  80 100 120 140 160 180 200 220 240 260 55 65 79 80 102 110 120 135 137 150 60 70 84 93 107 115 136 137 145 152 Y  65 74 90 95 110 120 140 140 155 175 70 80 94 103 116 130 144 152 165 178 75 85 98 108 118 135 145 157 175 180 88 113 125 140 160 189 185 115 162 191 ΣY 325 462 445 707 678 750 685 1043 966 1211 Ngu ồn: Bảng 2.1 (Giáo trình KTL, tr. 16) 18
  19. 3. Mô hình hồi quy 2 bi ến 3.2. Hồi qui 2 bi ến (tt) ° Bảng trên đây là phân phối có điều kiện của Y phụ thuộc vào các giá trị nhất định của X. ° Xác suất có điều kiện của Y theo X, p(Y|X), có thể được tính. Ví dụ, với X=80$, có 5 giá trị của Y là 55, 60, 65, 70, 75. Như vậy, với X=80, XS có bất kỳ một trong những chi tiêu này là p(Y=55|X=80) = 1/5. Tương tự, p(Y=150|X=260) = 1/7 19
  20. 3. Mô hình hồi quy 2 bi ến 3.2. Hồi qui 2 bi ến (tt) Xác suất có điều ki ện của dữ li ệu trong B2.1 Xi  80 100 120 140 160 180 200 220 240 260 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 Xác su ất có ĐK 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 của Y 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 p(Y Xi) 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7  1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 Trung 1/6 1/7 1/6 1/6 1/7 1/6 1/7 bình có ĐK c ủa 1/7 1/7 1/7 Y 65 77 89 101 113 125 137 149 161 173 Ngu ồn: Bảng 2.2 (Giáo trình KTL, tr. 17) 20
  21. 3. Mô hình hồi quy 2 bi ến 3.2. Hồi qui 2 bi ến (tt) ° Vậy từ mỗi xác su ất có điều ki ện của Y, ta có th ể tính giá tr ị trung bình của Y, được gọi là trung bình có điều ki ện hay kỳ vọng có điều ki ện, và được ký hi ệu là E(Y|Xi) ° E(Y|X=80) = 55(1/5) + 60(1/5) + 65(1/5) + 70(1/5) + 75(1/5) = 65 21
  22. 3. Mô hình hồi quy 2 bi ến Ngu ồn: Ch ạy Eviews 6.0 File 3.2. Hồi qui 2 bi ến (tt) (thidu1.wf1) 22
  23. 3. Mô hình hồi quy 2 bi ến 3.2. Hồi qui 2 bi ến (tt) ° Đồ th ị phân tán cho th ấy rằng mặc dù có bi ến đổ i trong chi tiêu nh ưng chi tiêu tiêu dùng về mặt trung bình sẽ tăng khi thu nh ập tăng. ° Các giá tr ị trung bình có điều ki ện nằm trên một hàng th ẳng với độ dốc đồ ng bi ến và còn đượ c gọi là đường hồi qui tổng th ể. 23
  24. 3. Mô hình hồi quy 2 bi ến 3.3. Mô hình hồi quy t ổng thể (PRF)  Theo ví dụ tr ướ c, mỗi trung bình có điều ki ện của Y là một hàm của Xi và có th ể đượ c th ể hi ện nh ư sau: E(Y|X i) = f(X i) : Hàm hồi qui tổng th ể hai bi ến.  Trung bình (t ổng th ể) của phân ph ối của Y với điều ki ện Xi là có quan hệ hàm số với Xi. Nói một cách khác, nó cho bi ết giá tr ị trung bình của Y bi ến đổ i nh ư th ế nào so với X.  Dạng hàm hồi qui tổng th ể: Theo gi ả đị nh thì hàm này có dạng tuy ến tính theo công th ức sau: β β E(Y|X i) = 1 + 2Xi β β 1 là tung độ gốc và 2 là hệ số góc (hay độ dốc). 24
  25. 3. Mô hình hồi quy 2 bi ến 3.3. Mô hình hồi quy t ổng thể (PRF) (tt)  Sự tuy ến tính theo các bi ến số  Về mặt hình học, đườ ng cong tuy ến tính trong tr ườ ng hợp này là một đườ ng th ẳng. β β 2  Nh ư vậy hàm sau đây E(Y|X i) = 1 + 2X i không tuy ến tính vì bi ến X xu ất hi ện lũy th ừa 2, và đo đó đườ ng quan hệ không ph ải đườ ng th ẳng.  Sự tuy ến tính theo các tham số (hay thông số) β β 2 β β E(Y|X i) = 1 + 2X i là mô hình tuy ến tính theo tham số 1 và 2. ( ) =β + β EYXi1 2 X i là KHÔNG TUY ẾN TÍNH theo tham số.  Tuy ến tính theo tham số có liên quan đế n sự phát tri ển của lý thuy ết hồi qui và do đó kể từ nay tr ở đi khi đề cập đế n 2 ch ữ “tuy ến tính” thì nên hi ểu là tuy ến tính theo tham số. 25
  26. 3. Mô hình hồi quy 2 bi ến Đặc tr ưng “ngẫu nhiên” c ủa PRF  Với mức thu nhập Xi, mức chi tiêu tiêu dùng của một gia đình có thể nằm xung quanh chi tiêu bình quân hay kỳ vọng có điều kiện của nó. Độ lệch của một Yi xung quanh giá trị kỳ vọng như sau: ui = Yi – E(Y|Xi) hay Đồ thị cho thấy khi thu nhập gia Yi = E(Y|Xi) + ui, với ui là đình tăng, chi tiêu tiêu dùng bình sai số nhiễu ngẫu nhiên. quân của gia đình cũng tăng theo. 26
  27. 3. Mô hình hồi quy 2 bi ến Đặc tr ưng “ngẫu nhiên” c ủa PRF β β  Nếu E(Y|X i) = 1 + 2Xi, ta có th ể th ể hi ện giá tr ị Y i sau: β β Yi = 1 + 2Xi + u i (*)  Với X = 80$, các giá tr ị Y i β β Y1 = 55 = 1 + 2(80) + u 1 β β Y2 = 60 = 1 + 2(80) + u 2 β β Y3 = 65 = 1 + 2(80) + u 3 β β Y4 = 70 = 1 + 2(80) + u 4 β β Y5 = 75 = 1 + 2(80) + u 5  Nếu l ấy giá tr ị k ỳ v ọng c ả 2 v ế c ủa (*) 27 E(Y i| X i) = E[E(Y| X i)] + E(u i| X i) = E(Y| X i) + E(u i| X i)
  28. 3. Mô hình hồi quy 2 bi ến Đặc tr ưng “ngẫu nhiên” c ủa PRF (tt) E(Y i| Xi) = E[E(Y| Xi)] + E(u i| Xi) = E(Y| Xi) + E(u i| Xi) Do E(Y i| Xi) = E(Y| Xi)  E(ui| Xi) = 0  Khi các giá trị trung bình có điều kiện của ui bằng 0 nghĩa là đường hồi qui đi ngang qua các giá trị trung bình có điều kiện của Y.  Đặc trưng ngẫu nhiên cho thấy rằng có những biến số khác ngoài thu nhập (?) có thể có ảnh hưởng đến chi tiêu tiêu dùng. 28
  29. Y 160 140 β β Yi= 1+ 2Xi+u i 120 β β ui E(Y/Xi)= 1+ 2Xi Chi tiêu , 100 Y 80 Yi β 2 Y = E(Y/Xi) 60 β 1 40 X 50 100 150 200 250 Thu nh ập kh ả d ụng , X 29
  30. 3. Mô hình hồi quy 2 bi ến Ý nghĩa c ủa s ố hạng nhi ễu ngẫu nhiên ui  Số hạng nhi ễu ui thay th ế cho tất cả nh ững bi ến số bị bỏ ra kh ỏi mô hình nh ưng nh ững bi ến số đó lại có ảnh hưở ng đế n Y. Vậy tại sao không tìm cách đư a vào tất cả các bi ến số càng nhi ều càng tốt?  Sự mơ hồ của lý thuy ết: Chúng ta th ườ ng không có cơ sở ch ắc ch ắn để bi ết hết nh ững bi ến số nào sẽ ảnh hưở ng đế n Y.  Dữ li ệu không có sẵn: Cho dù khi bi ết chính xác bi ến nào tác độ ng đế n Y nh ưng vi ệc thu th ập số li ệu lại gặp khó kh ăn.  Một số bi ến có tác độ ng không đáng kể và vi ệc đư a vào sẽ làm gi ảm hi ệu qu ả chi phí của mô hình.  Bản ch ất ng ẫu nhiên trong hành vi con ng ườ i:Tồn tại ngay cả khi đã có đầ y đủ các bi ến số cần thi ết. 30
  31. 3. Mô hình hồi quy 2 bi ến Ý nghĩa c ủa nhi ễu ngẫu nhiên ui (tt)  Số hạng nhi ễu ui thay th ế cho tất cả nh ững bi ến số bị bỏ ra kh ỏi mô hình nh ưng nh ững bi ến số đó lại có ảnh hưở ng đế n Y. Vậy tại sao không tìm cách đư a vào tất cả các bi ến số càng nhi ều càng tốt? (ti ếp theo)  Các bi ến thay th ế kém: Có một số dữ li ệu không th ể quan sát đượ c tr ực ti ếp mà ph ải dùng các bi ến thay th ế và hầu hết các bi ến thay th ế không đủ tính đạ i di ện.  Nguyên tắc chi li : mục tiêu tiên quy ết là gi ữ cho mô hình càng đơ n gi ản càng tốt.  Dạng hàm sai : tuy ến tính hay phi tuy ến? 31
  32. 3. Mô hình hồi quy 2 bi ến 3.4. Mô hình hồi quy mẫu (SRF)  Chúng ta đã xem xét hàm hồi qui tổng thể với các giá trị tổng thể của Y. Nhưng trên thực tế cái chúng ta có chỉ thường là một mẫu các giá trị của Y tương ứng với một số X không đổi. Mẫu ngẫu nhiên 1 Mẫu ngẫu nhiên 2 YX YX 70 80 55 80 65 100 88 100 90 120 90 120 95 140 80 140 110 160 118 160 115 180 120 180 120 200 145 200 140 220 175 220 155 240 150 260 32
  33. 3. Mô hình hồi quy 2 bi ến 3.4. Mô hình hồi quy mẫu (SRF) (tt) 33
  34. 3. Mô hình hồi quy 2 bi ến 3.4. Mô hình hồi quy mẫu (SRF) (tt)  Nhiệm vụ là phải tính toán PRF trên cơ sở thông tin mẫu nhưng liệu chúng ta có thể thực sự tính toán được PRF từ những dữ liệu mẫu đó không?  Câu trả lời thường là KHÔNG vì có sai số trong việc lấy mẫu. 34
  35. 3. Mô hình hồi quy 2 bi ến 3.4. Mô hình hồi quy mẫu (SRF) (tt)  Hàm h ồi qui mẫu có d ạng ) = β) + β) Yi 1 2 X i ˆ Trong đó Yi = ướ c l ượ ng điểm c ủa E(Y| X i) βˆ β 1 = ướ c l ượ ng điểm c ủa 1 βˆ β 2 = ướ c l ượ ng điểm c ủa 2 ) ei (hay u i, ph ần d ư) = ướ c l ượ ng điểm c ủa u i ) )  Dướ i d ạng ng ẫu nhiên = β + β + Yi 1 2 X i ei  Đố i v ới X=X i, ta có một quan sát (mẫu) Y=Y i. )  Theo SRF  Y = Y + e ) i i i ui = +  Theo PRF  Yi EYX( i) u i 35
  36. CHI TIÊU vs. THU NH ẬP 140 ) = β) + β) SRF: Yi 1 2 X i Yi 120 ) ui ˆ Yi ui ˆ 100 Yi PRF: Y = β + β X + u CHI CHI TIÊU i 1 2 i i 80 60 50 100 150 200 250 THU NHẬP Mô hình h ồi quy t ổng th ể và mẫu tuy ến tính 36