Kinh tế lượng - Chương 2: Mô hình hồi qui hai biến (tt)

pdf 29 trang vanle 1700
Bạn đang xem 20 trang mẫu của tài liệu "Kinh tế lượng - Chương 2: Mô hình hồi qui hai biến (tt)", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkinh_te_luong_chuong_2_mo_hinh_hoi_qui_hai_bien_tt.pdf

Nội dung text: Kinh tế lượng - Chương 2: Mô hình hồi qui hai biến (tt)

  1. Chương 2 (tt) MÔ HÌNH HỒI QUI HAI BIẾN Khoảng tin cậy, r, R2 và Ki ểm đị nh hệ s ố hồi quy 1
  2. Phạm Văn Minh biên soạn NỘI DUNG 1. Hệ số xác đị nh R2 2. Hệ số tương quan (r) 3. Tính ch ất của hệ số tương quan 4. Phân ph ối xác su ất của các ước lượng β β σ2 5. Kho ảng tin cậy của 1, 2 và 6. Ki ểm đị nh gi ả thi ết về các hệ số hồi qui 2
  3. Phạm Văn Minh biên soạn 1. Hệ số xác đị nh R2  Hàm hồi quy đặ t ra nh ằm xem xét bi ến ph ụ thu ộc ch ịu ảnh hưởng của bi ến độ c lập nh ư th ế nào. Tuy nhiên, bên cạnh bi ến độ c lập, còn nhi ều yếu tố khác cũng ảnh hưởng.  Một hàm hồi quy được coi là th ực sự phù hợp khi bi ến độ c lập có ảnh hưở ng th ực sự đáng kể, ảnh hưở ng một cách có ý ngh ĩa khi so sánh với các yếu tố ng ẫu nhiên khác . Bên cạnh đó, với cùng một bi ến độ c lập nh ưng nếu dạng hàm khác nhau thì mức độ ảnh hưởng cũng khác nhau.  Đạ i lượng để đo mức độ ảnh hưởng làm tương quan so sánh với yếu tố ng ẫu nhiên thì gọi là độ phù hợp của hàm hồi quy . Đó chính là R2, hệ số xác đị nh (Coefficient of Determination) 3
  4. 1. Hệ s ố xác đị nh R2 (tt) Hệ số xác đị nh R2 – Đạ i lượng đo “s ự thích hợp” (Goodness-of-fit)  Nếu tất cả các quan sát đề u nằm trên đườ ng hồi qui thì sự thích hợp là “hoàn hảo”. Tuy nhiên, tr ườ ng hợp này rất hi ếm. Điều chúng ta hy vọng là nh ững ph ần dư xung quanh đườ ng hồi qui này càng nh ỏ càng tốt. 2 2  Hệ số xác đị nh r (tr ườ ng hợp hai bi ến) hay R (tr ườ ng hợp đa bi ến) là đạ i lượ ng cho ta bi ết rằng đườ ng hồi qui mẫu thích hợp nh ư th ế nào đố i với dữ li ệu. (?)  Ph ươ ng pháp đồ th ị Venn, hay là Ballentine  Vòng tròn Y tượ ng tr ưng cho bi ến thiên trong bi ến ph ụ thu ộc Y  Vòng tròn X tượ ng tr ưng cho bi ến thiên trong bi ến gi ải thích X 4
  5. 1. Hệ s ố xác đị nh R2 (tt) Hệ số xác đị nh R2 – Đạ i lượng đo “s ự thích hợp” (Goodness-of-fit) Quan điểm Ballentine đố i với R2: (a) R2 = 0; (f) R2 = 1. 5
  6. 1. Hệ s ố xác đị nh R2 (tt) Th ước đo độ phù h ợp c ủa mô Y hình đố i v ới d ữ li ệu mẫu là R2 SRF Yi Y −Yˆ = e  (RSS) Yˆ Y −Y = y i i i i i i ˆ − =  (TSS) Yi Y yˆi  (ESS) Y TSS = RSS + ESS X
  7. 1. Hệ s ố xác đị nh R2 (tt) TSS (Total Sum of Squares): Tổng bình ph ươ ng tất cả các sai lệch gi ữa các giá tr ị quan sát Yi với giá tr ị trung bình của chúng. 2 TSS=∑( Y −= Y )2 ∑ Y 2 − n . ( Y ) i i ESS (Explained Sum of Squares): Tổng bình ph ươ ng tất cả các sai lệch gi ữa giá tr ị của bi ến Y tính theo MHHQ mẫu với giá tr ị trung bình của chúng. (Đo độ chính xác của hàm HQ) 2 2 ESS=−=∑(Y)ˆ Y2(βˆ ) ( ∑ XnX 2 − . ( ) ) i 2 i RSS (Residual Sum of Squares): Tổng bình ph ươ ng tất cả các sai lệch gi ữa các giá tr ị quan sát (giá tr ị th ực tế) của bi ến Y với các giá tr ị nh ận đượ c (giá tr ị lí thuy ết) từ hàm HQ mẫu. 2 RSS= e2 =( Y − Yˆ ) ∑i ∑ i i 7
  8. 1. Hệ s ố xác đị nh R2 (tt) n 2 ∑ei 2 = ESS = − RSS = − i=1 R 1 1 n TSS TSS 2 ∑ yi i=1 Với MHHQ 2 bi ến, ng ười ta ch ứng minh được: n βˆ 2 x 2 2 ∑ i x = X −X R 2 = i =1 với i i n y = Y −Y 2 i i ∑ y i i =1
  9. 1. Hệ s ố xác đị nh R2 (tt)  Có th ể nói R2 ph ản ánh tỷ lệ mô hình lý thuy ết ph ản ánh th ực tế. Tính chất của R2 : 0 ≤ R2 ≤ 1 ° R2 = 0: th ể hi ện X và Y độ c lập th ống kê. ° R2 = 1: đường hồi quy phù hợp hoàn hảo, ngh ĩa là tất cả các sai lệch của Y so với giá tr ị trung bình đề u gi ải thích được bởi mô hình hồi quy. ° Ví dụ: R2 = 0,95: có nghĩa biến độc lập X giải thích 95% sự thay đổi của biến phụ thuộc Y. Trong trường hợp này, mức độ phù hợp của SRF với tập dữ liệu mẫu là khá cao. 9
  10. Phạm Văn Minh biên soạn 2. Hệ số tương quan (r) Hệ số tương quan r: Hệ số tương quan r đo lường mức độ ph ụ thu ộc tuy ến tính gi ữa 2 đạ i lượng (hay bi ến) X và Y. n y x Lưu ý: ∑ i i r không có ý = r = i 1 ngh ĩa để mô n n tả quan hệ 2 2 phi tuy ến. ∑ y i ∑ x i i =1 i =1 10
  11. Phạm Văn Minh biên soạn 3. Tính chất của hệ số tương quan ° r > 0: gi ữaXvàYcóquanhệ đồ ng bi ến. ° r  ± 1: XvàYcóquanhệ tuy ến tính ch ặt ch ẽ. ° r  0: XvàYcóquanhệ tuy ến tính không ch ặt ch ẽ. ° r 0,b,dlàhằng số, và: * = + * = + X i aX i b & Yi cYi d thì : rXY = rX*Y* 11
  12. 3. Tính chất của hệ số t ương quan (tt) ° Nếu X, Y độ c lập theo quan điểm th ống kê thì hệ số tương quan gi ữa chúng bằng 0. ° r ch ỉ là đạ i lượng đo sự kết hợp tuy ến tính hay ph ụ thu ộc tuy ến tính. r không có ý ngh ĩa để mô tả quan hệ phi tuy ến.  n  2  ∑ xi yi  2 =  i=1  = 2 R n n rX ,Y 2 2 ∑ xi ∑ yi i=1 i=1 rXY = ± R ˆ = + VD: Yi 6,25 0,75 X i Với R2 = 0,81  r = ± 0,9 = 0,9
  13. 4. Phân phối xác suất của các ước lượng δ2 Gi ả thi ết 6: ui có phân ph ối N(0, ) Với gi ả thi ết nêu trên, các ước lượng βˆ βˆ δˆ2 1, 2 , có các tính ch ất sau: - Chúng là các ước lượng không ch ệch. - Có ph ương sai cực ti ểu. - Khi số quan sát đủ lớn thì các ước lượng này xấp xỉ với giá tr ị th ực của phân ph ối. βˆ β δ 2 βˆ β δ 2 1 ~ N ( 1 , βˆ 1 ) 2 ~ N ( 2 , βˆ 2 ) 13
  14. Phạm Văn Minh biên soạn β β σ2 5. Khoảng tin cậy của 1, 2 và Ước l ượng các tham s ố thống kê c ủa t ổng thể Có 2 loại ước lượng:  Ước lượng điểm của một tham số tổng th ể là cách th ức tính toán một giá tr ị đơn lẻ của tham số tổng th ể dựa trên dữ li ệu mẫu.  Ước lượng khoảng của một tham số tổng th ể là cách th ức tính toán 2 giá tr ị dựa trên dữ li ệu mẫu, từ đó tạo nên một kho ảng được kỳ vọng ch ứa tham số th ống kê của tổng th ể. 14
  15. Phạm Văn Minh biên soạn β β σ2 5. Khoảng tin cậy của 1, 2 và Ước l ượng (theo) khoảng  Ướ c lượ ng kho ảng đượ c xây dựng để cho khi lấy mẫu lặp lại nhi ều lần thì một tỷ lệ lớn các kho ảng này sẽ bao quanh tham số tổng th ể mà chúng ta đang quan tâm.Tỷ lệ này là hệ số tin cậy (confidence coefficient). Kho ảng đượ c tạo ra đượ c gọi là kho ảng tin cậy (confidence interval).  Một kho ảng tin cậy mẫu lớn với hệ số tin cậy (1-α)*100% dựa trên một ướ c lượ ng không bị lệch (không ch ệch) có phân ph ối chu ẩn đượ c tính nh ư sau: Ước l ượng điểm ± tα/2 * Sai số chu ẩn c ủa ước l ượng  (gi ới h ạn tin c ậy d ướ i, gi ới h ạn tin c ậy trên) 15
  16. Phạm Văn Minh biên soạn β β σ2 5. Khoảng tin cậy của 1, 2 và Ước l ượng khoảng Thông th ường th ể hi ện kho ảng tin cậy 95%. Có nghĩa: Nếu lấy mẫu và phân tích được lặp đi lặp lại trong cùng một điều ki ện (cho ra bộ dữ li ệu khác nhau), kho ảng cách gi ữa hai giá tr ị sẽ bao gồm giá tr ị th ật (t ổng th ể) đạ t 95% giá tr ị trong tổng số các tr ường hợp có th ể xảy ra. 16
  17. Phạm Văn Minh biên soạn β β 5. Khoảng tin cậy của 1, 2 Ước lượng kho ảng cho hệ số hồi quy với mức ý nghĩa α nh ư sau β ∈ βˆ − ε βˆ + ε ε = βˆ i ( i i ; i i ) i t(n−2,α / 2) Se ( i ) Trong đó: ° 1 – α được gọi là độ tin cậy. ° ε (>0) được gọi là độ chính xác của ước lượng . βˆ − ε ° i i là gi ới hạn tin cậy dưới. βˆ + ε ° i i là gi ới hạn tin cậy trên . 17
  18. β β 5. Khoảng tin cậy của 1, 2 (tt) Với độ tin cậy 1−α, ta có β∈ β −t se β β + t se β 1( 1α /2.(); 11 α /2 .() 1 ) ββββ∈∈ − −tt se se ββ ββ  + + t t se se β β 22(( 22αα /2 /2.();.(); 22 22 α α /2 /2 .() .() 2 2 )) Trong đó tα/ 2 là giá tr ị của đạ i lượng ng ẫu nhiên T phân ph ối theo quy lu ật Student với (n – 2) P T> t = α bậc tự do sao cho. ( α / 2 ) Pβ − t se βββ ≤≤+ t se β =− α ( 1α/2.() 1 1 1 α /2 .()1 1 ) Pβ − t se βββ ≤≤+ t se β =− α ( 2α/2.() 2 2 2 α /2 .()1 2 ) Để tim tα/2 , ta tra bảng (xem Ph ụ l ục 2, tr.315 SGK) ho ặc dùng hàm TINV( α,df) trong Excel.
  19. β β 5. Khoảng tin cậy của 1, 2 (tt) Ví dụ:Sử dụng số li ệu VD2: với độ tin cậy 95%. Tìm khoảng tin cậy của β1 , β2  Với độ tin c ậy 95% tra b ảng trang 315: = = Excel: t(n− 2,α /2) t (8;0,025) 2,306 =TINV(0.05,8)  Vậy kho ảng tin c ậy c ủa β1 là 24,453± 2,306 × 6,4109 <β < hay 9,66951 39,2365 ± ×  Vậy kho ảng tin c ậy c ủa β2 là 0,5091 2,306 0,03572 <β < hay 0,4267 2 0,5915 Ý nghĩa: Trong điều ki ện các yếu tố khác không thay đổ i, khi thu nh ập tăng 1$/tu ần thì chi tiêu tiêu dùng trung bình của một gia đình tăng trong kho ảng từ 0,4267 đế n 0,5914 $/tu ần.
  20. β β σ2 5. Khoảng tin cậy của 1, 2 và (tt) Phân phối Student
  21. 5. Khoảng tin cậy của σ2 Đố i với σ2, ta có ước lượng kho ảng: 2 2  (n− 2)σ ( n − 2) σ  σ 2 ∈ ;  χ2 χ 2  α/2 1/2− α  2 2  (n− 2)σ ( n − 2) σ  với xác suất P ≤≤σ2  =−1 α χ2 χ 2  α/2 1/2− α  χ2 χ 2 trong đóα/2, 1− α /2 làcácgiátr ị của đạ i lượng ng ẫu nhiênχ 2 phân ph ối theo quy lu ật “khi bình ph ương” (hay “chi bình ph ương”) với n – 2 bậc tự do, th ỏa mãn điều ki ện P χ2> χ 2 = α P χ2> χ 2 = − α (α / 2 )/2 (1−α / 2 )1/2 Để tìm các giá tr ị này, ta tra bảng ho ặc dùng hàm CHIINV trong Excel. 21
  22. 6. Ki ểm đị nh gi ả thi ết về các hệ số hồi qui  Trong th ống kê, gi ả thi ết phát bi ểu cần đượ c kiểm đị nh đượ c gọi là gi ả thi ết không (H 0). Gi ả thi ết đố i đượ c ký hi ệu là gi ả thi ết H1. Chú ý  Khi nói “ch ấp nh ận gi ả thi ết H0”, không có ngh ĩa H0 đúng mà là “không có cơ sở để bác bỏ H0”.  Lựa ch ọn mức ý ngh ĩa α: α có th ể tùy chọn, th ường ng ườ i ta ch ọn mức 1%, 5%, ho ặc 10%.  Các gi ả thi ết cần ki ểm đị nh gồm: V Các gi ả thi ết về hệ số hồi quy V Các gi ả thi ết về ph ươ ng sai của Ui V Các gi ả thi ết về sự phù hợp của mô hình  Các cách ki ểm đị nh cơ bản:  Ph ươ ng pháp ki ểm đị nh t (Student's t-test)  Ph ươ ng pháp kho ảng tin cậy 22  Ph ươ ng pháp p-value (dùng máy vi tính)
  23. β β 6. Ki ểm đị nh gi ả thi ết đối với 1, 2 (tt) β Ta có th ể ki ểm đị nh gi ả thi ết nào đó về 1 với mức ý ngh ĩa α cho tr ước. Ta có bảng tóm tắt sau đây: β − β * vớit = 1 1 làgiátr ị ki ểm đị nh. Tương tự cho β se β 2 (1 ) β= β * = Lưu ý. Nếu đư a ra gi ả thi ết2 2 0 thì điều này có ngh ĩa là đư a ra gi ả thi ết bi ến độ c lập X không ảnh hưở ng đế n bi ến ph ụ thu ộc Y. 23
  24. β β 6. Ki ểm đị nh gi ả thi ết đối với 1, 2 (tt) Ki ểm đinh t *  H : β= β Gi ả thuy ết không: 0 i i *  β≠ β Gi ả thuy ết đố i: H1 : i i CÁCH 1 βˆ − β * i i  Bước 1: Tính giá tr ị t = i βˆ s e (i )  Bước 2: Tra b ảng t-student tìm t(n− 2,α /2)  Bước 3: Quy t ắc ra quy ết đị nh >  Nếu t t ( n − ,2 α )2/ bác b ỏ H0 ≤  Nếu t t ( n − ,2 α )2/ không có c ơ s ở bác b ỏ H0 24
  25. β β 6. Ki ểm đị nh gi ả thi ết đối với 1, 2 (tt) Ki ểm đinh t f(t) Phân phối Student Mi ền Mi ền tới h ạn tới h ạn α/ 2 α/ 2 -t α/2 tα/2 -4 -3 -2 -1 0 1 2 3 4 t
  26. β β 6. Ki ểm đị nh gi ả thi ết đối với 1, 2 (tt) Ki ểm đinh t, Ví dụ Ví dụ: Với mức ý nghĩa 5% (α=0,05 ), thu nh ập có ảnh hưởng đế n chi tiêu không? Ki ểm đị nh β  Gi ả thi ết H0: 2 = 0 (thu nhập không ảnh hưởng đến chi tiêu) β  Gi ả thi ết H1: 2 ≠ 0 (thu nhập có ảnh hưởng đến chi tiêu)
  27. β β 6. Ki ểm đị nh gi ả thi ết đối với 1, 2 (tt) Ki ểm đinh t, Ví dụ (tt) Ta có: βˆ= β ˆ = 20,5091;se ( 2 ) 0,03572 0,5091− 0 Tính t: t = =14,2525 0,03572 Với mức ý ngh ĩa α = 5% và bậc tự do là n – 2 = 8 thì t(n-2;α/2) = 2,306 > ⇒ t t (n− 2,α /2) Bác b ỏ gi ả thi ết H0 Ý nghĩa: bi ến thu nh ập th ực sự có ảnh hưởng đế n chi tiêu.
  28. β β 6. Ki ểm đị nh gi ả thi ết đối với 1, 2 (tt) Ki ểm đinh bằng khoảng tin c ậy CÁCH 2: Ph ương pháp kho ảng tin cậy β Gi ả s ử ta tìm được kho ảng tin c ậy c ủa i là: β ∈ βˆ −ε βˆ +ε ε = βˆ i ( i i ; i i ) , i t(n− ,2 α / 2)Se ( i ) với mức ý ngh ĩa α trùng v ới mức ý ngh ĩa c ủa gi ả thi ết H0 Quy t ắc quy ết đị nh β * ∈ βˆ −ε βˆ +ε -Nếu i ( i i ; i i ) “ch ấp nh ận” H0 β * ∉ βˆ −ε βˆ +ε -Nếu i ( i i ; i i ) bác bỏ H0 28
  29. β β 6. Ki ểm đị nh gi ả thi ết đối với 1, 2 (tt) Ki ểm đinh bằng P-value CÁCH 3: Phương pháp P-value βˆ − β * t = i i i βˆ Se ( i ) Tính > = P (T t i ) p Quy t ắc quyết đị nh α - Nếu p ≤ : Bác bỏ H0 α -Nếu p > : “chấp nhận” H0 (Ph ương pháp này th ường dùng khi ti ến hành trên máy vi tính) 29