Quản trị kinh doanh - Chương 4: Phân tích hồi quy và tương quan

pptx 50 trang vanle 2240
Bạn đang xem 20 trang mẫu của tài liệu "Quản trị kinh doanh - Chương 4: Phân tích hồi quy và tương quan", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pptxquan_tri_kinh_doanh_chuong_4_phan_tich_hoi_quy_va_tuong_quan.pptx

Nội dung text: Quản trị kinh doanh - Chương 4: Phân tích hồi quy và tương quan

  1. CHƯƠNG 4 PHÂN TÍCH HỒI QUY VÀ TƯƠNG QUAN
  2. NHỮNG CHỦ ĐỀ CHÍNH 1. Mối liên hệ giữa các hiện tượng KT-XH và phương pháp hồi quy tương quan 2. Xác định mô hình hồi quy tuyến tính đơn 3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình 4. Ước lượng giá trị trong tương lai dựa vào mô hình hồi quy 5. Mô hình hồi quy bội
  3. 1. Mối quan hệ giữa các hiện KT – XH và phương pháp hồi quy tương quan ▪ Phân tích hồi quy được sử dụng đầu tiên để dự đoán Một mô hình thống kê được sử dụng để dự đoán giá trị của biến phụ thuộc (biến kết quả) dựa trên những giá trị của ít nhất một biến độc lập (biến nguyên nhân) ▪ Phân tích tương quan được sử dụng làm thước đo độ lớn trong mối liên hệ giữa các biến định lượng.
  4. Biểu đồ phân tán (Scatter) ▪ Đồ thị gồm tất cả các cặp ( XYii, ) Y X
  5. Các loại mô hình hồi quy Mối liên hệ phi tuyến Mối liên hệ tuyến tính thuận Mối liên hệ tuyến tính nghịch Không có mối liên hệ
  6. 2. Xác định mô hình hồi quy tuyến tính đơn ▪ Mối liên hệ giữa các biến là một phương trình đường thẳng ▪ Đường thẳng là phù hợp nhất với dữ liệu YXi=b01 + b i + e i Y: biến phụ thuộc; X: biến độc lập; b0: Hệ số chặn b1 : Hệ số góc (độ dốc của đường hồi quy) ei : Sai số mô hình
  7. Giả định ▪ Mối quan hệ giữa X và Y là tuyến tính ▪ X và Y là biến định lượng ▪ X không có sai số ngẫu nhiên; ▪ Các giá trị của Y độc lập với nhau ( ví dụ Y1 không liên quan tới Y2) 2 ▪ Sai số ngẫu nhiên e i ~ N(0, )
  8. Mô hình hồi quy của tổng thể chung Y Giá trị YXYii ==bb010 ++ bb1X ii ++ ee ii quan sát ei : Sai số ngẫu nhiên Yi = b0 + b1 X i + e i X Giá trị quan sát EPI 809/Spring 2008 8
  9. Tổng thể và mô hình hồi quy mẫu Tổng thể ☺ ☺ ☺ ☺ ☺ EPI 809/Spring 2008 9
  10. Tổng thể và mô hình hồi quy mẫu Tổng thể Unknown Relationship ☺ Yi = b0 + b1 X i + e i ☺ ☺ ☺ ☺ EPI 809/Spring 2008 10
  11. Tổng thể và mô hình hồi quy mẫu Tổng thể Mẫu ngẫu nhiên Unknown Relationship ☺ ☺ Yi = b0 + b1 X i + e i ☺ ☺ ☺ ☺ ☺ EPI 809/Spring 2008 11
  12. Tổng thể và hàm hồi quy mẫu Tổng thể Mẫu ngẫu nhiên Unknown Yi = b0 + b1 X i + e i Relationship ☺ ☺ Y = b + b X + e i 0 1 i i ☺ ☺ ☺ ☺ ☺ EPI 809/Spring 2008 12
  13. Ước lượng mô hình hồi quy ▪ Mô hình được ước lượng bằng cách ● Thu thập mẫu từ tổng thể ● Tính toán các giá trị thống kê của tổng thể mẫu. ● Xác định đường thẳng đi qua tập dữ liệu y w w đường thẳng nào w là tốt nhất? w w w w w w w w w w w w x 13
  14. Phương pháp bình phương tối thiểu (Ordinary Least Square ) Đường hồi quy tìm được là đường thẳng sao cho tổng bình phương sai số từ điểm quan sát tới đường thẳng đó là nhỏ nhất
  15. Phương pháp bình phương tối thiểu Sum of squared differences =(2 - 1)2 +(4 - 2)2 +(1.5 - 3)2 +(3.2 - 4)2 = 6.89 Sum of squared differences =(2 -2.5)2 +(4 - 2.5)2 +(1.5 - 2.5)2 +(3.2 - 2.5)2 = 3.99 Let us compare two lines 4 (2,4) w The second line is horizontal (4,3.2) 3 w 2.5 2 (1,2)w w (3,1.5) 1 The smaller the sum of squared differences the better the fit of the 1 2 3 4 line to the data. 15
  16. Phương pháp bình phương tối thiểu Cần tìm bb01, sao cho nn 22 ei=(Y i − b01 − b X i ) → min ii==11 thỏa mãn Suy ra bb12, n 2 ei n i=1 = 2(Yii − b01 − b X )( − 1) = 0 b1 i=1 n 2 ei n i=1 = 2(Yi − b01 − b X i )( − X i ) = 0 b2 i=1
  17. Ước lượng hệ số hồi quy Ta thu được công thức sau: SSxy b1 = SSxx b01=− Y b X SSxy=( X i − X)( Y i − Y) = n( XY − X. Y ) 2 22 SSxx=( x i − x) = n() X i − X Hàm hồi quy có dạng ˆ Yii=+ b01 b X 17
  18. Ví dụ 1 ▪ Giả sử cần nghiên cứu chi tiêu tiêu dùng của hộ gia đình phụ thuộc thế nào vào thu nhập của họ, người ta tiến hành điều tra, thu được một mẫu gồm 10 hộ gia đình với số liệu như sau : Y 70 65 90 95 110 115 120 140 155 150 X 80 100 120 140 160 180 200 220 240 260 ● Y: Chi tiêu của hộ gia đình (USD/Tuần) ● Thu nhập của hộ gia đình (USD/Tuần)
  19. Thuyết minh kết quả Y = 24.46 + 0.509 X Hệ số chặn: 24.46 → dù không có thu nhập thì mỗi gia đình cũng phải tiêu ít nhất 24.46 usd/tuần Độ dốc: 0.509 → mỗi khi thu nhập tăng lên 10 usd thì trung bình mỗi gia đình sẽ tiêu thêm khoảng 5 usd một tuần
  20. Ước tính bằng R ▪ Chúng ta muốn ước tính mối liên quan giữa việc thích mua sắm và xu hướng mua hàng ngẫu nhiên của người tiêu dùng ▪ Mô hình hồi quy tuyến tính IB= b01 + b ShopEnjoy + ei ▪ R: lm(IB~ShopEnjoy)
  21. >library(foreign) >ibdata = read.spss("DataIBforpractice.sav", to.data.frame=T) # Tạo biến trung gian >ibdata$ShopEnjoy = (ibdata$Shopenjoy1+ ibdata$Shopenjoy2+ ibdata$Shopenjoy3+ ibdata$Shopenjoy4+ ibdata$Shopenjoy5+ ibdata$Shopenjoy6)/6 >ibdata$IB = (ibdata$IB1+ibdata$IB2) >attach(ibdata) # Phân tích hồi quy >f = lm(IB~ShopEnjoy) >summary (f)
  22. Diễn giải kết quả Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.74330 0.10349 16.85 <2e-16 ShopEnjoy 0.34936 0.02953 11.83 <2e-16 Mô hình mô tả tương quan giữa IB và ShopEnjoy IB = 1.7433 + 0.34936*ShopEnjoy
  23. Diễn giải kết quả Residual standard error: 0.8295 on 784 degrees of freedom Multiple R-squared: 0.1515, Adjusted R-squared: 0.1504 F-statistic: 140 on 1 and 784 DF, p-value: < 2.2e-16 ▪ Ý nghĩa của ● R square ● Adjusted R-squared ● F- test
  24. Câu hỏi? ▪ Mô hình này tốt hay xấu ▪ Tiêu chí để định nghĩa là tốt ▪ Tốt có nghĩa là mô hình phản ảnh giá trị quan sát ● Giá trị tiên lượng (predicted values) gần với giá trị quan sát (observed values)
  25. Kết luận về hệ số hồi quy kiểm định t ▪ Kiểm định t về hệ số hồi quy của tổng thể chung → Có mối liên hệ tuyến tính giữa X và Y không? ▪ Giả thiết “không” và giả thiết đối H0: b1 = 0 H1: b1 ≠ 0 (or 0) ▪ Giá trị thống kê b − b t = 11 s b1 ˆ Se SSE YYii− Với df = n-2 và s = 2 ( ) b1 Se == SSXX nn−−22
  26. 3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình Các mức độ biến đổi ▪ SSE = Tổng bình phương do sai số ● Sự biến đổi do các nhân tố khác ngoài mối liên hệ giữa X và Y ▪ SSR=Tổng bình phương được giải thích bằng hồi quy ● Giải thích sự biến đổi do mối liên hệ giữa X và Y ▪ SST = Tổng bình phương chung ● Đo độ biến đổi của giá trị 푌푖 quanh giá trịnh trung bình 푌ത
  27. 3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình Các mức độ biến đổi
  28. Xác định hệ số xác định SSR regression sum of squares SSE R2 = = =1 − SST total sum of squares SST Miền xác định củaR2 01 R2 R → 1 hàm hồi quy càng phù hợp R →0 hàm hồi quy càng không phù hợp
  29. Hệ số tương quan Thước đo cường độ của mối liên hệ ▪ Trả lời câu hỏi “Mối liên hệ tuyến tính giữa hai biến mạnh như thế nào”? (X−− X)(Y Y) r =  ii 22 (Xii−− X) (Y Y) ▪ Chứng minh được rR= 2
  30. r > 0,8 : tương quan mạnh r = 0,4 - 0,8 : tương quan trung bình r < 0,4 : tương quan yếu r càng lớn thì tương quan giữa X và Y càng mạnh 0 < r 1 gọi là tương quan tuyến tính thuận (X, Y) -1 r < 0 gọi là tương quan tuyến tính nghịch (X, Y) r = 0 : giữa X và Y không có mối quan hệ tuyến tính
  31. Kiểm định sự phù hợp của mô hình hồi quy ▪ Sử dụng kiểm định t → sự phù hợp của hệ số hồi quy ▪ Sử dụng kiểm định F: Sự phù hợp của mô hình (mô hình có giải thích được hiện tượng hay không): R2 (n− 2) F = (1− R2 ) ▪ Trong thực tế F>2 hàm hồi quy có ý nghĩa
  32. 4. Ước lượng các giá trị trong tương lai dựa vào mô hình hồi quy ▪ Ước lượng giá trị trung bình cho Y khi X đạt giá trị cá biệt nào đó 2 ˆ 1 ()XX0 − Y0 + t e /2,n− 2. S n n 2 ( XXi − ) i=1
  33. Ước lượng khoảng tin cậy của Y tại một giá trị cá biệt của X 2 ˆ 1 ()XX0 − Y02 tn− .1 Se + + n n 2 ( XXi − ) i=1
  34. 4. Ước lượng các giá trị trong tương lai dựa vào mô hình hồi quy
  35. 5. Mô hình hồi quy bội 5.1 Mô hình hồi bội 5.2 Xác định hệ số hồi quy 5.3 Xây dựng mô hình
  36. 5.1 Mô hình hồi quy bội ▪ Mỗi liên hệ giữa 1 biến phụ thuộc với 2 hoặc hơn 2 biến độc lập YXXXi=b0 + b 1 1 i + b 2 2 i + + b pi pi + e i ˆ Yi= b0 + b 1 X 1 i + b 2 X 2 i + + b pi X pi
  37. 5.1 Mô hình hồi quy bội
  38. ▪ Kết quả chạy mô hình ˆ YXXi =562.270 − 5.43812 − 20.027
  39. Sử dụng mô hình để dự đoán Ước lượng nhiên liệu bình quân một tháng cho mỗi hộ gia đình nếu nhiệt độ trung bình là 30 độ F và độ dày tấm cách nhiệt là 6 inches ˆ YXXi =562.270 − 5.43812 − 20.027 =562.270 − 5.438.30 − 20.012.6 = 278.969
  40. Xác định hệ số xác định bội
  41. Kiểm định mức ý nghĩa chung ▪ Chỉ ra có mối liên hệ giữa tất cả các biến X với Y hay không ▪ Sử dụng kiểm định F H0: b 1= b 2 = = bp = 0 (Không có mối quan hệ tuyến tính) Hb1 :0 i Có ít nhất 1 biến độc lập ảnh hưởng tới Y F>2→ Hàm hồi quy có nghĩa
  42. Kiểm định ý nghĩa cá biệt ▪ Cho biết có mối liên hệ tuyến tính giữa biến 푖 và Y hay khổng ▪ Sử dụng kiểm định thống kê t ▪ Giả thiết: 푯풐: 풊 = (không có mối liên hệ tuyến tính) 푯 : 풊 ≠ (có mối liên hệ tuyến tính giữa 푖 và Y)
  43. Ước lượng khoảng tin cậy cho độ dốc
  44. 5.3 Xây dựng mô hình ▪ 1. Mục đích để xây dưng mô hình với số biến nguyên nhân ít nhất ● Dễ dàng thuyết minh ● Xác suất cộng tuyến nhỏ hơn ▪ Thực hiện hồi quy từng bước ● Nhằm lựa chọn mô hình phù hợp ▪ Tiếp cận tập hợp con một cách tốt nhất
  45. Nghiên cứu các yếu tố ảnh hưởng đến hành vi mua hàng ngẫu hứng Traditional trend Modern Individual Trend Shop Impulse Age Enjoy Buying
  46. #Tạo các biến trung gian >Modern = (Modern1+ Modern2+ Modern3+ Modern4+ Modern5)/5 >Trad =(Trad1 +Trad2+Trad3+Trad4+Trad5)/5 >Indiv =(Indiv1+Indiv2+Indiv3+Indiv4+Indiv5+Indiv6+Indiv7)/7 #phân tích >f2 = lm(IB~ShopEnjoy+Modern+Trad+Indiv+Age) >summary(f2)
  47. Phân tích kết quả Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 2.615644 0.279454 9.360 < 2e-16 ShopEnjoy 0.325801 0.030045 10.844 < 2e-16 Modern 0.125704 0.054355 2.313 0.02101 * Trad -0.232754 0.052500 -4.433 1.06e-05 Indiv -0.064620 0.060412 -1.070 0.28511 Age -0.008635 0.003124 -2.764 0.00584
  48. Tóm tắt ▪ Các loại mô hình hồi quy ▪ Xác định mô hình hồi quy tuyến tính đơn ▪ Các mức độ biến đổi trong hồi quy tương quan ▪ Ước lượng các giá trị dự đoán ▪ Xác định mô hình hồi quy bối