Kinh tế - Phân tích dữ liệu và dự báo - Bài: Các mô hình dữ liệu giản đơn

pdf 54 trang vanle 2950
Bạn đang xem 20 trang mẫu của tài liệu "Kinh tế - Phân tích dữ liệu và dự báo - Bài: Các mô hình dữ liệu giản đơn", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfkinh_te_phan_tich_du_lieu_va_du_bao_bai_cac_mo_hinh_du_lieu.pdf

Nội dung text: Kinh tế - Phân tích dữ liệu và dự báo - Bài: Các mô hình dữ liệu giản đơn

  1. PHÂN TÍCH DỮ LIỆU VÀ DỰ BÁO P.T.B KHOA KINH TẾ ptbinh[a-cũng]ueh.edu.vn ả ự ả đơ Bài gi ng 3: Cỏc mụ hỡnh d bỏo gi n n
  2. Nội dung: Dự bỏo thụ Trung bỡnh giản đơn Trung bỡnh di động đơn/kộp San mũ giản đơn San mũ Holt/San mũ Winter Phõn tỏch chuỗi thời gian Phần mềm ForecastX/Crystal Ball
  3. Phõn biệt 3 phương phỏp đơn giản: . Cỏc phương phỏp dự bỏo thụ: Giả định dữ liệu gần nhất cung cỏp cỏc dự đoỏn tốt nhất tương lai. . Cỏc phương phỏp bỡnh quõn: Dự bỏo dựa trờn giỏ trị trung bỡnh của cỏc quan sỏt quỏ khứ (tầm quan trọng như nhau). . Cỏc phương phỏp san mũ: Dự bỏo bằng cỏch lấy trung bỡnh giỏ trị quỏ khứ của chuỗi dữ liệu với trọng số giảm dần (tầm quan trọng giảm dần).
  4. Một chiến lược tốt để đỏnh giỏ dự bỏo thường gồm cỏc bước sau (Hanke, 2005): 1. Một phương phỏp dự bỏo được chọn dựa trờn phõn tớch và cảm nhận của người làm dự bỏo về bản chất của dữ liệu. 2. Bộ dữ liệu được chia thành 2 phần: Phần chạy thử và phần kiểm định. 3. Phương phỏp dự bỏo được chọn được sử dụng để tớnh cỏc giỏ trị ước lượng cho phần chạy thử.
  5. 4.Phương phỏp được sử dụng để dự bỏo phần kiểm định của dữ liệu, và sai số dự bỏo được xỏc định và dựng để so sỏnh/đỏnh giỏ. 5.Ra quyết định
  6. Dự bỏo thụ (Naùve forecast) (hoặc simple random walk!!!) Thớch hợp với cỏc doanh nghiệp mới thành lập vỡ cú rất ớt dữ liệu. Giả định giai đoạn gần nhất là ước lượng tốt nhất cho tương lai: Yt 1 Yt
  7. Vớ dụ xem file Table4.1H 800 700 600 500 400 300 200 100 2 4 6 8 10 12 14 16 18 20 22 24 26 28 SALES
  8. Lấy dữ liệu trong giai đoạn 1996 – 2001 là dữ liệu ước lượng, vậy giỏ trị dự bỏo 2002Q1 sẽ là: ^ ^ Y25 Y24 Y25 650 Sai số dự bỏo: e25 = 200, , e26 = - 250 Kết hợp đồ thị thấy dữ liệu cú xu thế, nờn mụ hỡnh dự bỏo thụ giản đơn sẽ dự bỏo “thấp”.
  9. Để khắc phục nhược điểm của mụ hỡnh dự bỏo thụ giản đơn ta cú thể xem xột thờm xu hướng của nú như sau: Yt 1 Y P(Y Y ) t t t-1 Trong đú: P là tỷ lệ thay đổi giữa hai giai đoạn kế nhau 0 P 1. P bao nhiờu là tốt nhất?
  10. Cú khi người ta cú thể sử dụng tỷ lệ thay đổi thay cho số thay đổi tuyệt đối: ^ Y Y t Yt 1 t Yt 1 Dự bỏo thụ cho dữ liệu mựa (khụng xu thế): ^ Yt 1 Yt 3
  11. Nếu dữ liệu mựa và cú xu thế thỡ cỏch dự bỏo như thế sẽ dự bỏo “thấp”, vậy: ^ (Yt Yt 1) (Yt 3 Yt 4 ) Yt 1 Y t 3 4 ^ (Yt Yt 4 ) Yt 1 Yt 3 4 Nếu dữ liệu theo thỏng và cú xu thế? Table4.1 H
  12. c1t3&f6
  13. Trung bỡnh giản đơn (simple average forecast) Cụng thức: 1 t Y t 1 Y t i i 1 t Yt 1 Yt 1 Yt 2 t 1
  14. Phương phỏp trung bỡnh giản đơn phự hợp khi cỏc nhõn tố ảnh hưởng đến đối tượng dự bỏo cú tớnh ổn định, và mụi trường liờn quan đến chuỗi dữ liệu là khụng thay đổi. Phương phỏp trung bỡnh giản đơn sử dụng giỏ trị trung bỡnh của tất cả cỏc quan sỏt quỏ khứ làm giỏ trị dự bỏo cho giai đoạn tiếp theo. Phự hợp với dữ liệu dừng.
  15. 320 310 300 290 280 270 260 250 240 5 10 15 20 25 30 Table4.3 H
  16. Trung bỡnh di động (moving average forecast) Quan tõm đến một số cố định cỏc quan sỏt gần nhất. Khi cú thờm một quan sỏt mới, ta cú một giỏ trị trung bỡnh mới. Yt Yt-1 Yt-k 1 Yt 1 MA(k) k ^ Y t+1 : giỏ trị dự bỏo giai đoạn tiếp theo Yt : giỏ trị thực tại thời điểm t k : hệ số trượt
  17. Cụng thức trờn Eviews: @MOVAV(Yt,k) 320 310 300 290 280 270 260 250 240 5 10 15 20 25 30 GALLONS @MOVAV(GALLONS,4) Table4.3 H
  18. Chọn hệ số trượt bao nhiờu tựy vào độ dài của chu kỳ hay bản chất của dữ liệu. Để so sỏnh và chọn mụ hỡnh tốt, nờn dựa vào cỏc tiờu chớ thống kờ (RMSE). Thường dựng đối với dữ liệu quý hoặc thỏng để làm trơn cỏc thành phần trong chuỗi thời gian. Thường dựng với chuỗi dừng.
  19. Trung bỡnh di động kộp (double moving average forecast) Khi dữ liệu cú xu thế tuyến tớnh thỡ ta sử dụng phương phỏp bỡnh phương di động điều chỉnh, được gọi là “trung bỡnh di động kộp”: Yt Yt-1 Yt-k 1 M Yt 1 t k ' M t Mt-1 Mt-k 1 Mt k
  20. ' ' at Mt (Mt Mt ) 2Mt - Mt 2 b (M M' ) t k -1 t t Yt p at bt p
  21. Table4.4 H
  22. MSE = 133 MSE = 63.7
  23. San mũ giản đơn (simple exponential smoothing forecast) Giống trung bỡnh di động, được sử dụng khi dữ liệu khụng cú yếu tố xu thế và mựa vụ. Trong khi MA chỉ dựa vào cỏc quan sỏt gần nhất để dự bỏo, thỡ san mũ dựa vào tất cả cỏc quan sỏt trước đú để dự bỏo nhưng với trọng số giảm dần.
  24. Giỏ trị dự bỏo tại bất kỳ thời điểm nào là giỏ trị trung bỡnh cú trọng số của tất cả cỏc giỏ trị sẵn cú trước đú. Giỏ trị càng xa hiện tại thỡ trọng số càng giảm. Nghĩa là, cỏc quan sỏt gần nhất được cho là chứa đựng thụng tin thớch hợp nhất, và cú ảnh hưởng lớn hơn cỏc quan sỏt quỏ khứ.
  25. Quan sỏt gần nhất cú trọng số (0< <1), quan sỏt kế tiếp là (1- ), quan sỏt tiếp theo nữa là (1- )2, Trọng số được gọi là hệ số mũ. Mụ hỡnh san mũ giản đơn cú thể được viết như sau: Yt 1 Yt (1- )Yt
  26. Phương trỡnh này cú thể được viết lại như sau: Yt 1 Yt (1- )Yt Yt Yt - Yt Yt (Yt - Yt ) Yt et
  27. Yt Yt-1 (1- )Yt-1 Yt 1 Yt (1- )Yt Yt (1- )[ Yt-1 (1- )Yt-1] 2 Yt (1- )Yt-1 (1- ) Yt-1 2 3 Yt (1- )Yt-1 (1- ) Yt-2 (1- ) Yt-3
  28. Tốc độ mà cỏc quan sỏt quỏ khứ khụng cũn tỏc động đến giỏ trị san mũ phụ thuộc vào .
  29. Chọn giỏ trị là vấn đề quan trọng nhất của phương phỏp san mũ: . Nếu cỏc dự đoỏn ổn định và biến đổi ngẫu nhiờn ớt, thỡ chọn nhỏ, ngược lại nờn chọn lớn. . Một cỏch phổ biến để ước lượng là dựa vào một quy trỡnh lặp đi lặp lại sao cho tối thiểu húa MSE (hoặc RMSE).
  30. Cú thể sử dụng phõn tớch độ nhạy để xỏc định hệ số san mũ tối ưu. Quy trỡnh thực hiện trờn Eviews: . Quick/Series Statistics/Exponential Smoothing . Series Name . Xuất hiện box sau:
  31. Chọn phương phỏp (single) Chọn hệ số nếu khụng biết thỡ chọn E (Eviews sẽ ước tớnh)
  32. . Nhõn tố thứ hai sau là việc chọn giỏ trị ^ san mũ đầu tiờn Y 1 cho chuỗi giỏ trị san mũ (giỏ trị dự bỏo). . Lấy giỏ trị Y1: Gỏn cho Y1 trọng số quỏ lớn, nhưng ảnh hưởng này sẽ giảm khi t tăng. . Lấy giỏ trị trung bỡnh của một số quan sỏt đầu tiờn. . Cũng cú thể chọn giỏ trị đầu tiờn tối ưu bằng phõn tớch độ nhạy (cho cố định).
  33. San mũ Holt (san mũ kộp) Khi chuỗi thời gian cú yếu tố xu thế (và khụng cú yếu tố mựa vụ). Là một mở rộng của phương phỏp san mũ giản đơn bằng việc đưa thờm một thừa số xu thế vào phương trỡnh san mũ để điều chỉnh yếu tố xu thế. 3 phương trỡnh và 2 hằng số san mũ được sử dụng trong mụ hỡnh Holt như sau:
  34. Giỏ trị san mũ (giỏ trị trung bỡnh) Yt Yt (1- )(Yt-1 Tt-1) Ước lượng xu thế: Tt (Yt Yt-1) (1- )Tt-1) Giỏ trị dự bỏo giai đoạn p trong tương lai: Ht p Yt pTt
  35. Y t : giỏ trị san mũ giai đoạn t Yt : giỏ trị thực giai đoạn t Tt : giỏ trị ước lượng xu thế : hệ số san mũ của ước lượng giỏ trị trung bỡnh : hệ số san mũ của ước lượng giỏ trị xu thế p : số giai đoạn dự bỏo trong tương lai Ht+p : giỏ trị dự bỏo Holt ở giai đoạn p
  36. Hệ số và cú thể được chọn theo chủ quan hoặc tối thiểu húa sai số dự bỏo như MSE: Khi cú thay đổi lớn trong giỏ trị cỏc thành phần thỡ sử dụng trọng số lớn, và ngược lại. Cú thể ỏp dụng phõn tớch độ nhạy hai chiều trờn Excel.
  37. Chọn giỏ trị ban Y t đầu cho: . Cỏch 1: Lấy quan sỏt thứ nhất, và xu thế bằng 0. . Cỏch 2: Trung bỡnh của 5 hoặc 6 quan sỏt đầu tiờn và xu thế là hệ số gốc của đường xu thế của cỏc quan sỏt này. . Cỏch 3: Hệ số cắt và hệ số gốc của đường xu thế tương ứng là giỏ trị ban đầu và giỏ trị xu thế ban đầu.
  38. Quy trỡnh thực hiện trờn Eviews: . Quick/Series Statistics/Expon ential Smoothing . Series Name . Xuất hiện box sau: Table4.1 H
  39. L1 = Y1 = 500
  40. Yt Giỏ trị san mũ : Yt (1- )(Yt-1 Tt-1) St-s Ước lượng xu thế: Tt (Yt Yt-1) (1- )Tt-1) Yt Ước lượng mựa vụ: St (1- )St-s ) Yt Dự bỏo p giai đoạn trong tương lai: Wt p (Yt pTt )St-s p
  41. Y t : giỏ trị san mũ Tt : ước lượng xu thế St : ước lượng mựa vụ : hệ số san mũ của giỏ trị trung bỡnh : hệ số san mũ của ước lượng xu thế : hệ số san mũ của ước lượng mựa vụ p : số giai đoạn dự bỏo trong tương lai s : độ dài mựa vụ Wt+p: giỏ trị dự bỏo Winter ở giai đoạn p
  42. Cỏc hệ số , , và cú thể được chọn theo chủ quan hoặc tối thiểu húa sai số dự bỏo như MSE. Chọn giỏ trị ban đầu cho Y 1, T1, và S1: . Cỏch 1: Lấy quan sỏt thứ nhất, xu thế bằng 0, và chỉ số mựa vụ bằng 1. . Cỏch 2: Hồi quy Y = f(t), hằng số sẽ là ước lượng ban đầu của giỏ trị san mũ, hệ số dốc là ước lượng ban đầu cho xu thế. Giỏ trị ban đầu của thành phần mựa vụ từ cỏc hệ số hồi quy của biến giả.
  43. Table4.1 H
  44. Quy trỡnh thực hiện trờn Eviews: . Quick/Series Statistics/Expone ntial Smoothing . Series Name . Xuất hiện box sau: Table4.1 H
  45. Phõn tỏch thành phần chuỗi thời gian (decomposition forecast) Mụ hỡnh cộng (additive) Yt = Trt + Clt + Snt + Irt Mụ hỡnh nhõn (Multiplicative) Yt = Trt. Clt. Snt. Irt
  46. 9700 9200 8700 8200 7700 7200 6700 6200 1000 5700 900 5200 800 4700 700 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 600 500 Monthly Sales Monthly 400 300 200 100 0 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 Month
  47. Phần mềm? ForecastX Crystal Ball