Bài giảng Kiểm định giả thuyết thống kê - Phần: Bài toán kiểm định giả thuyết thống kê

pdf 105 trang Đức Chiến 03/01/2024 580
Bạn đang xem 20 trang mẫu của tài liệu "Bài giảng Kiểm định giả thuyết thống kê - Phần: Bài toán kiểm định giả thuyết thống kê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfbai_giang_kiem_dinh_gia_thuyet_thong_ke_phan_bai_toan_kiem_d.pdf

Nội dung text: Bài giảng Kiểm định giả thuyết thống kê - Phần: Bài toán kiểm định giả thuyết thống kê

  1. Kiểm định giả thuyết thống kê Hoàng Văn Hà Ngày 6 tháng 4 năm 2012
  2. Bài toán kiểm định giả thuyết thống kê
  3. Bài toán kiểm định giả thuyết thống kê ■ Định nghĩa ■ Giả thuyết không và đối thuyết ■ Cách đặt giả thuyết ■ Miền bác bỏ - Tiêu chuẩn kiểm định ■ Sai lầm loại I và loại II ■ Bổ đề Neyman - Pearson ■ Kiểm định tỷ lệ hợp lý ■ p - giá trị Kiểm định giả thuyết thống kê Hoàng Văn Hà – 3
  4. Định nghĩa Định nghĩa 1. Giả thuyết thống kê là những phát biểu về các tham số, quy luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. Việc tìm ra kết luận để bác bỏ hay chấp nhận một giả thuyết gọi là kiểm định giả thuyết thống kê. Ví dụ 1. Giám đốc một nhà máy sản xuất bo mạch chủ máy vi tính tuyên bố rằng tuổi thọ trung bình của một bo mạch chủ do nhà máy sản xuất ra là 5 năm; đây là một giả thuyết về kỳ vọng của biến ngẫu nhiên X = tuổi thọ của một bo mạch chủ. Để đưa ra kết luận là chấp nhận hay bác bỏ giả thuyết trên, ta cần dựa vào mẫu điều tra và quy tắc kiểm định thống kê. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 4
  5. Giả thuyết không và đối thuyết Định nghĩa 2. Trong bài toán kiểm định giả thuyết, giả thuyết cần được kiểm định gọi là Giả thuyết không (null hypothesis), ký hiệu là H0. Mệnh đề đối lập với H0 gọi là đối thuyết (alternative hypothesis), ký hiệu là H1. Xét bài toán kiểm định tham số, giả sử ta quan trắc mẫu ngẫu nhiên (X1, ,Xn) từ biến ngẫu nhiên X có hàm mật độ xác suất f(x; θ) phụ c thuộc vào tham số θ. Gọi Θ là không gian tham số, và Θ0 và Θ0 là hai tập con rời nhau của Θ sao cho Θ Θc = Θ. Giả thuyết (giả thuyết không) và 0 ∪ 0 đối thuyết của bài toán có dạng như sau H0 : θ Θ0 ∈ c (1) (H1 : θ Θ0 ∈ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 5
  6. Giả thuyết không và đối thuyết Ví dụ 2. 1. Gọi µ là độ thay đổi trung bình trong huyết áp của một bệnh nhân sau khi dùng thuốc; bác sĩ điều trị cần quan tâm đến giả thuyết sau H0 : µ =0 Không có ảnh hưởng của thuốc lên huyết áp của bệnh nhân (H1 : µ =0 Có ảnh hưởng của thuốc lên huyết áp của bệnh nhân 6 2. Một khách hàng quan tâm đến tỷ lệ sản phẩm kém chất lượng trong một lô hàng mua của một nhà cung cấp. Giả sử tỷ lệ sản phấm kém tối đa được phép là 5%. Khách hàng cần quan tâm đến giả thuyết sau H : p 0.05 Tỷ lệ sản phẩm kém cao hơn mức cho phép 0 ≥ (H1 : p < 0.05 Tỷ lệ sản phẩm kém ở mức chấp nhận được Kiểm định giả thuyết thống kê Hoàng Văn Hà – 6
  7. Cách đặt giả thuyết 1. Giả thuyết được đặt ra với ý đồ bác bỏ nó, nghĩa lã giả thuyết đặt ra ngược lại với điều ta muốn chứng minh, muốn thuyết phục. 2. Giả thuyết được đặt ra sao cho khi chấp nhận hay bác bỏ nó sẽ có tác dụng trả lời bài toán thực tế đặt ra. 3. Giả thuyết được đặt ra sao cho nếu nó đúng thì ta sẽ xác định được quy luật phân phối xác suất của đại lượng ngẫu nhiên được chọn làm tiểu chuẩn kiểm định. 4. Khi đặt giả thuyết, ta thường so sánh cái chưa biết với cái đã biết. Cái chưa biết là điều mà ta cần kiểm định, kiểm tra, làm rõ. "Cái đã biết" là những thông tin trong quá khứ, các định mức kinh tế, kỹ thuật. 5. Giả thuyết đặt ra thường mang ý nghĩa: "không khác nhau" hoặc "khác nhau không có ý nghĩa" hoặc "bằng nhau". Kiểm định giả thuyết thống kê Hoàng Văn Hà – 7
  8. Cách đặt giả thuyết Tổng quát, một bài toán kiểm định giả thuyết cho tham số θ sẽ có một trong 3 dạng dưới đây (θ0 là giá trị kiểm định đã biết): Hai phía: H0 : θ = θ0 (H1 : θ = θ0 6 Một phía bên trái: H : θ θ 0 ≥ 0 (H1 : θ θ0 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 8
  9. Miền bác bỏ - Tiêu chuẩn kiểm định Định nghĩa 3. Xét bài toán kiểm định giả thuyết có giả thuyết H0 và đối thuyết H1. Giả sử rằng H0 đúng, từ mẫu ngẫu nhiên X =(X1, ,Xn) chọn hàm Z = h(X1, ,Xn; θ0) sao cho với số α > 0 bé tùy ý ta có thể tìm được tập hợp Wα thỏa điều kiện P (Z W ) = α (2) ∈ α c Tập hợp Wα gọi là miền bác bỏ giả thuyết H0 và phần bù Wα gọi là miền chấp nhận giả thuyết H0. Đại lượng ngẫu nhiên Z = h(X1, ,Xn; θ0) gọi là tiêu chuẩn kiểm định giả thuyết H0. Giá trị α gọi là mức ý nghĩa của bài toán kiểm định. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 9
  10. Miền bác bỏ - Tiêu chuẩn kiểm định Thực hiện quan trắc dựa trên mẫu ngẫu nhiên (X1, ,Xn) ta thu được mẫu thực nghiệm (x1, ,xn). Từ mẫu thực nghiệm này, ta tính được giá trị của Z là z = h(x1, ,xn; θ0). ■ Nếu z W thì ta bác bỏ giả thuyết H . ∈ α 0 ■ Nếu z W c thì ta kết luận chưa đủ cơ sở để bác bỏ H . ∈ α 0 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 10
  11. Sai lầm loại I và loại II Trong bài toán kiểm định giả thuyết thống kê, ta có thể mắc phải các sai lầm sau a. Sai lầm loại I: là sai lầm mắc phải khi ta bác bỏ H0 trong khi thực tế giả thuyết H0 đúng. Sai lầm loại I ký hiệu là α, chính là mức ý nghĩa của kiểm định. α = P (W H ) (3) α| 0 b. Sai lầm loại II: là sai lầm mắc phải khi ta chấp nhận giả thuyết H0 trong khi thực tế H0 sai. Sai lầm loại II ký hiệu là β. β = P (W c H ) (4) α| 1 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 11
  12. Sai lầm loại I và loại II X XXX XXX Thực tế XX H0 đúng H0 sai Quyết định XXX Không có sai lầm Sai lầm loại II Không bác bỏ H 0 (1 α) β − Sai lầm loại I Không có sai lầm Bác bỏ H 0 α (1 β) − Kiểm định giả thuyết thống kê Hoàng Văn Hà – 12
  13. Sai lầm loại I và loại II - Ví dụ Khảo sát tốc độ cháy của một loại nhiên liệu rắn dùng để đẩy tên lửa ra khỏi giàn phóng. Giả sử biến ngẫu nhiên X = tốc độ cháy của nhiên liệu (cm/s) có phân phối chuẩn với kỳ vọng µ và độ lệch chuẩn σ =2.5. Ta cần kiểm định giả thuyết H0 : µ = 50 (H1 : µ = 50 6 Giả sử bác bỏ H0 khi: x¯ 51.5. Các giá trị 48.5 và 51.5 gọi là giá trị tới hạn (critical value). Giả sử khảo sát mẫu ngẫu nhiên cỡ n = 10, ta tìm xác suất sai lầm loại I. α = P(Bác bỏ H0 khi H0 đúng) Kiểm định giả thuyết thống kê Hoàng Văn Hà – 13
  14. Sai lầm loại I và loại II - Ví dụ Tức là, α = P(X¯ 51.5 µ = 50) | | X¯ 50 48.5 50 X¯ 50 51.5 50 = P − 1.90) = 0.0287 + 0.0287 = 0.0574 − nghĩa là có 5.74% số mẫu ngẫu nhiên khảo sát được sẽ dẫn đến kết luận bác bỏ giả thuyết H0 : µ = 50 (cm/s) khi tốc độ cháy trung bình thực sự là 50 (cm/s). Ta có thể giảm sai lầm α bằng cách mở rộng miền chấp nhận. Giả sử với cỡ mẫu n = 10, miền chấp nhận là 48 x¯ 52, khi đó giá trị của α là ≤ ≤ 48 50 52 50 α = P Z − 2.5/√10 2.5/√10     =0.0057 + 0.0057 = 0.0114 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 14
  15. Sai lầm loại I và loại II - Ví dụ Cách thứ hai để giảm α là tăng cỡ mẫu khảo sát, giả sử cỡ mẫu n = 16, ta có σ/√n =2.5/√16=0.625, với miền bác bỏ là x¯ 51.5, ta có α = P(X¯ 51.5 µ = 50) | | 48.5 50 51.5 = P Z 0.625 0.625     =0.0082 + 0.0082 = 0.0164 Xác suất sai lầm loại II β được tính như sau β = P(Không bác bỏ H0 khi H0 sai) Để tính β, ta cần chỉ ra một giá trị cụ thể cho tham số trong đối thuyết H1. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 15
  16. Sai lầm loại I và loại II - Ví dụ Giả sử với cỡ mẫu n = 10, miền chấp nhận của giả thuyết H0 là 48.5 X¯ 51.5 trong khi giá trị thực sự của µ = 52. Sai lầm β cho bởi ≤ ≤ β = P(48.5 X¯ 51.5 µ = 52) ≤ ≤ | 48.5 52 X¯ 52 51.5 52 = P − − − 2.5/√10 ≤ 2.5/√10 ≤ 2.5/√10   = P( 4.43 Z 0.63) = P(Z 0.63) P(Z 4.43) − ≤ ≤ − ≤ − − ≤ − =0.2643 0.0000 = 0.2643 − Giả sử giá trị thực sự µ = 50.5, khi đó β = P(48.5 X¯ 51.5 µ = 50.5) ≤ ≤ | 48.5 50.5 X¯ 50.5 51.5 50.5 = P − − − √ ≤ √ ≤ √  2.5/ 10 2.5/ 10 2.5/ 10  = P( 2.53 Z 1.27) = 0.8980 0.0057 = 0.8923 − ≤ ≤ − Kiểm định giả thuyết thống kê Hoàng Văn Hà – 16
  17. Sai lầm loại I và loại II - Ví dụ Tương tự α, tăng cỡ mẫu sẽ làm giảm sai lầm β, với cỡ mẫu n = 16 và miền chấp nhận là 48 < X¯ < 52, ta tính được β =0.229. Bảng 1 tổng kết sai lầm lầm loại I và loại II với miền chấp nhận và cỡ mẫu khác nhau Miền chấp nhận n α β với µ = 52 β với µ = 50.5 48.5 < x¯ < 51.5 10 0.0574 0.2643 0.8923 48 < x¯ < 52 10 0.0114 0.5000 0.9705 48.5 < x¯ < 51.5 16 0.0164 0.2119 0.9445 48 < x¯ < 52 16 0.0014 0.5000 0.9918 Bảng 1: Sai lầm loại I và loại II Kiểm định giả thuyết thống kê Hoàng Văn Hà – 17
  18. Sai lầm loại I và loại II - Nhận xét 1. Ta có thể giảm kích thước của miền bác bỏ (tương ứng tăng kích thước miền chấp nhận), và xác suất sai lầm loại I α bằng cách chọn những điểm tới hạn thích hợp. 2. Xác suất sai lầm loại I và loại II có liên quan với nhau. Với một cỡ mẫu cố định, việc giảm sai lầm loại này sẽ làm tăng sai lầm loại kia. 3. Cố định các điểm tới hạn, tăng cỡ mẫu n sẽ làm giảm xác suất sai lầm loại I α và loại II β. 4. Nếu H0 sai, sai lầm β sẽ tăng khi giá trị thực của tham số tiến gần đến giá trị được phát biểu trong giả thuyết H0. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 18
  19. Sai lầm loại I và loại II - Ví dụ Ví dụ 3. 1. Xét X là biến ngẫu nhiên có phân phối nhị thức. Ta cần kiểm định giả thuyết H0 : p =0.8 và đối thuyết H1 : p 15. Giả sử α =0.05, a. Tìm miền bác bỏ có dạng X>c¯ . { } b. Với đối thuyết H1 : µ = 16, tính β. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 19
  20. Bổ đề Neyman-Pearson Định nghĩa 4. Giả sử Z = h(X1, ,Xn) là một tiêu chuẩn kiểm định và Wα là miền bác bỏ của một bài toán kiểm định giả thuyết thống liên quan đến tham số θ. Độ mạnh của kiểm định là xác suất bác bỏ giả thuyết H0 khi đối thuyết H1 đúng, ký hiệu π. π = P(W H )=1 P(W c H )=1 β (5) α| 1 − α| 1 − Một tiêu chuẩn kiểm định tốt sẽ có độ mạnh cao. Định nghĩa 5. Xét bài toán kiểm định giả thuyết thống kê có giả thuyết H0, c đối thuyết H1, miền bác bỏ Wα và miền chấp nhận Wα. Cho α, β lần lượt là sai lầm loại I và loại II. Cố định giá trị α nhỏ, trong tất cả các tiêu chuẩn kiểm định Z = h(X1, ,Xn) có cùng mức sai lầm α thì tiêu chuẩn nào có độ mạnh π =1 β lớn nhất thì được gọi là tiêu chuẩn tốt nhất (tối ưu). − Kiểm định giả thuyết thống kê Hoàng Văn Hà – 20
  21. Bổ đề Neyman-Pearson Định lý 6 (Bổ đề Neyman-Pearson). Xét bài toán kiểm định giả thuyết thống kê H0, đối thuyết H1 dựa trên một mẫu ngẫu nhiên (X1, ,Xn) lấy từ một phân phối phụ thuộc vào tham số θ. Xét L(θ) = L(θ X , ,X ) > 0 là hàm | 1 n hợp lý dựa trên mẫu ngẫu nhiên X =(X1, ,Xn). Nếu tồn tại một hằng số dương C và một tập con W Rn sao cho ⊂ L(θ0) 1. C với x =(x1, ,xn) W L(θ1) ≤ ∈ L(θ0) c c n 2. >C với x =(x1, ,xn) W , với W W = R L(θ1) ∈ ∪ 3. P [(X , ,X ) W ; θ ] = α. 1 n ∈ 0 thì kiểm định với miền bác bỏ W sẽ có độ mạnh lớn nhất với giả thuyết H0 và đối thuyết H1. Ta gọi α là độ lớn (size) của kiểm định và W là miền bác bỏ tốt nhất với độ lớn α. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 21
  22. Bổ đề Neyman-Pearson - Ví dụ Xét X1, ,Xn là mẫu ngẫu nhiên chọn từ tổng thể có phân phối Poisson với trung bình λ. Tìm kiểm định có độ mạnh lớn nhất cho giả thuyết H0 : λ =2 và H1 : λ =1/2. e−λλx Hàm xác suất của X P (λ): f(x) = , với x =0, 1, 2, ∼ x! Hàm hợp lý là − n n 1 n m −λn L(λ) = f(xi) = λ e (xi!) với m = xi ! Yi=1 Yi=1 Xi=1 Với λ =2 − n 1 m −2n L(2) = 2 e (xi!) ! Yi=1 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 22
  23. Bổ đề Neyman-Pearson - Ví dụ và λ =1/2, − n 1 m −(1/2)n L(1/2) = (1/2) e (xi!) ! Yi=1 Theo bổ đề Neyman-Pearson, miền bác bỏ thỏa m −2n L(2) 2 e − 3n m 2 = m − n =4 e C L(1/2) 1 2 ≤ 2 e Lấy logarit 2 vế ta được,  3n log(C)+(3n/2) m log(4) < log(C) m < − 2 ⇒ log(4) log(C)+(3n/2) Đặt C0 = , ta sẽ bác bỏ H khi n x C0. log(4) 0 i=1 i ≤ P Kiểm định giả thuyết thống kê Hoàng Văn Hà – 23
  24. Kiểm định tỷ lệ hợp lý (LRT) Xét bài toán kiểm định giả thuyết H0 : θ Θ0 ∈ c (H1 : θ Θ0 ∈ Với θ là tham số chưa biết của tổng thể nhận giá trị trong không gian tham số Θ, và Θ Θ. Xét mẫu ngẫu nhiên cỡ n: X =(X , ,X ) và hàm hợp 0 ⊂ 1 n lý L(θ x , ,x ) = L(θ x). | 1 n | Định nghĩa 7. Kiểm định tỷ lệ hợp lý (Likelihood ratio test) cho kiểm định thống kê với giả thuyết H : θ Θ và đối thuyết H : θ Θc là 0 ∈ 0 1 ∈ 0 supL(θ x) Θ0 | λ(x) = (6) supL(θ x) Θ | Chú ý rằng 0 λ(x) 1. Kiểm định giả thuyết thống kê≤ ≤ Hoàng Văn Hà – 24
  25. Kiểm định tỷ lệ hợp lý Gọi θˆ0 và θˆ lần lượt là ước lượng hợp lý cực đại của tham số θ xác định trên không gian tham số Θ0 và Θ. Khi đó, kiểm định tỷ lệ hợp lý là L(θˆ x) λ(x) = 0| (7) L(θˆ x) | Bác bỏ giả thuyết H0 khi λ(x) C ≤ Hằng số C được chọn sao cho kiểm định có mức ý nghĩa cho trước là α. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 25
  26. Kiểm định tỷ lệ hợp lý - Ví dụ i.i.d Ví dụ 4. Xét X ,X , ,X (µ,σ2). Giả sử σ2 đã biết. Ta cần kiểm 1 2 n ∼ N định, với mức ý nghĩa α, H : µ = µ và H : µ = µ . Hãy tìm một kiểm định 0 0 1 6 0 tỷ lệ hợp lý. Với σ2 đã biết, hàm hợp lý có dạng 1 1 − n (x −µ)2 L(µ) = e 2σ2 i=1 i n (σ√2π) P Các không gian tham số: Θ = µ , Θc = R µ . Khi đó, 0 { 0} 0 \{ 0} 1 n 2 1 − (x −µ0) L(µ ) = e 2σ2 i=1 i 0 n (σ√2π) P Ước lượng hợp lý cực đại của µ trên R là µˆ = X¯. Do đó, 1 1 − n (x −X¯)2 L(ˆµ) = e 2σ2 i=1 i n (σ√2π) P Kiểm định giả thuyết thống kê Hoàng Văn Hà – 26
  27. Kiểm định tỷ lệ hợp lý - Ví dụ Kiểm định tỷ lệ hợp lý 1 n 2 − 2 (xi−µ0) 2σ i=1 2 2 L(µ0) e −n(X¯−µ0) /2σ λ(x) = = 1 = e − P n (x −X¯)2 L(ˆµ) e 2σ2 i=1 i P Bác bỏ H khi: λ(x) C, tương đương với 0 ≤ n (X¯ µ )2 (X¯ µ )2 log(C) − 0 2log(C) − 2σ2 − 0 ≤ ⇔ σ2/n ≥ X¯ µ − 0 2log(C) = C ⇔ σ/√n ≥ 1 Tìm C1: ta có nhận xét rằng nếu H0 đúng, X¯ µ − 0 (0, 1) σ/√n ∼ N Kiểm định giả thuyết thống kê Hoàng Văn Hà – 27
  28. Kiểm định tỷ lệ hợp lý - Ví dụ Với mức ý nghĩa α cho trước X¯ µ P − 0 C = P ( Z C ) = α σ/√n ≥ 1 | | ≥ 1   hay P (Z C ) + P (Z C ) = α ≤ − 1 ≥ 1 Ta tính được C = z − : phân vị mức 1 α/2 của Z (0, 1). 1 1 α/2 − ∼ N Vậy, bác bỏ H0 khi X¯ µ0 − z − σ/√n ≥ 1 α/2 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 28
  29. p - giá trị (p - value) Định nghĩa 8. Tương ứng với một giá trị thống kê kiểm định tính trên một mẫu các giá trị quan trắc xác định, p - giá trị là mức ý nghĩa nhỏ nhất dùng để bác bỏ giả thuyết H0. Dựa vào đối thuyết H1, các bước tính p-giá trị như sau: 1. Xác định thống kê kiểm định: T S. Tính giá trị thống kê kiểm định dựa trên mẫu (x1, ,xn), giả sử bằng a. 2. p-giá trị cho bởi P( T S > a H ), kiểm định hai phía | | | || 0 p = P(TS a H ), kiểm định một phía - bên phải | 0  Kết luận: Bác bỏ giả thuyết H nếu p-giá trị α. 0 ≤ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 29
  30. Kiểm định giả thuyết cho trường hợp một mẫu
  31. Kiểm định giả thuyết cho trường hợp một mẫu ■ Kiểm định giả thuyết cho kỳ vọng ◆ Trường hợp biết phương sai, ◆ Trường hợp không biết phương sai, mẫu nhỏ, ◆ Trường hợp không biết phương sai, mẫu lớn. ■ Kiểm định giả thuyết cho tỷ lệ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 31
  32. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 Các giả định: • ■ Mẫu ngẫu nhiên X1, ,Xn được chọn từ tổng thể có phân phối chuẩn (µ,σ2) với kỳ vọng µ chưa biết. N ■ Phương sai σ2 đã biết. ■ Cho trước giá trị µ0, cần so sánh kỳ vọng µ với µ0. Bài toán kiểm định có 3 trường hợp: • H : µ = µ H : µ = µ H : µ = µ (a) 0 0 (b) 0 0 (c) 0 0 (H1 : µ = µ0 (H1 : µ µ0 6 với mức ý nghĩa α cho trước. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 32
  33. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 Các bước kiểm định 1. Phát biểu giả thuyết không và đối thuyết 2. Xác định mức ý nghĩa α 3. Lấy mẫu ngẫu nhiên cỡ n: X1, ,Xn và tính thống kê kiểm định X¯ µ Z = − 0 (9) 0 σ/√n 4. Xác định miền bác bỏ Wα: bảng 2 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 33
  34. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 Giả thuyết Miền bác bỏ H0 : µ = µ0 Wα = z0 : z0 >z1−α/2 H1 : µ = µ0 | | 6 n o H0 : µ = µ0 Wα = z0 : z0 z1−α H1 : µ>µ0 n o Bảng 2: Miền bác bỏ với đối thuyết tương ứng 5. Kết luận: Bác bỏ H0/ Chưa đủ cơ sở để bác bỏ H0. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 34
  35. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối thuyết và kết • luận bác bỏ H khi p -giá trị α, với mức ý nghĩa α cho trước. Công thức 0 ≤ tính p - giá trị theo các trường hợp xem ở bảng 3. Giả thuyết p - giá trị H0 : µ = µ0 p = 2[1 Φ( z0 )] H1 : µ = µ0 − | | 6 H0 : µ = µ0 p = Φ(z0) H1 : µ µ0 − Bảng 3: p-giá trị với đối thuyết tương ứng Kiểm định giả thuyết thống kê Hoàng Văn Hà – 35
  36. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 - Ví dụ Ví dụ 5 (Kiểm định 2 phía). Dây chuyền sản xuất kem đánh răng P/S được thiết kế để đóng hộp những tuýt kem có trọng lượng trung bình là 6 oz (1 oz = 28g). Một mẫu gồm 30 tuýt kem được chọn ngẫu nhiên để kiểm tra định kỳ. Bộ phận điều khiển dây chuyền phải đảm bảo để trọng lượng trung bình mỗi tuýt kem là 6 oz; nếu nhiều hơn hoặc ít hơn, dây chuyền phải được điều chỉnh lại. Giả sử trung bình mẫu của 30 tuýt kem là 6.1 oz và độ lệch tiêu chuẩn của tổng thể σ =0.2 oz. Thực hiện kiểm định giả thuyết với mức ý nghĩa 3% để xác định xem dây chuyền sản xuất có vận hành tốt hay không? Kiểm định giả thuyết thống kê Hoàng Văn Hà – 36
  37. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 - Ví dụ Gọi X là trọng lượng của một tuýt kem đánh răng, giả sử X (µ, 0.22). ∼ N Các bước kiểm định như sau: 1. Phát biểu giả thuyết: H0 : µ =6 (H1 : µ =6 6 2. Xác định mức ý nghĩa: α =0.03 3. Tính giá trị thống kê kiểm định x¯ µ0 6.1 6.0 z0 = − = − =2.74 σ/√n 0.2/√30 4. Xác định miền bác bỏ: Bác bỏ H khi z >z − 0 | 0| 1 α/2 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 37
  38. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 - Ví dụ α = 3% nên z1−α/2 = z0.985 =2.17. Vậy bác bỏ H0 nếu z 2.17 0 − 0 5. Kết luận: do z0 =2.74 > 2.17 nên bác bỏ H0. Ta kết luận với 97% độ tin cậy rằng trọng lượng trung bình mỗi tuýt kem không bằng 6. Sử dụng p - giá trị: • 4a. Tính p-giá trị, bài toán kiểm định hai phía p = 2[1 Φ( z )] = 2[1 Φ(2.74)] = 2[1 0.9969] = 0.0062 − | 0| − − 5a. Kết luận: với α =0.03, ta có p =0.0062 < 0.03 nên bác bỏ H0. Ta kết luận với 97% độ tin cậy rằng trọng lượng trung bình mỗi tuýt kem không bằng 6. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 38
  39. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 - Ví dụ Ví dụ 6 (Kiểm định một phía). Metro EMS: Một bệnh viện tại trung tâm thành phố cung cấp dịch vụ cấp cứu tại nhà. Với khoảng 20 xe cấp cứu, mục tiêu của trung tâm là cung cấp dịch vụ cấp cứu trong khoảng thời gian trung bình là 12 phút sau khi nhận được điện thoại yêu cầu. Một mẫu ngẫu nhiên gồm thời gian đáp ứng khi có yêu cầu của 40 ca cấp cứu được chọn. Trung bình mẫu là 13.25 phút. Biết rằng độ lệch tiêu chuẩn của tổng thể là σ =3.2 phút. Giám đốc EMS muốn thực hiện một kiểm định, với mức ý nghĩa 5%, để xác định xem liệu thời gian một ca cấp cứu có bé hơn hoặc bằng 12 phút hay không? Các bước kiểm định: 1. Phát biểu giả thuyết H0 : µ = 12: Thời gian đáp ứng của dịch vụ cấp cứu đạt yêu cầu, không cần phải thay đổi. H1 : µ > 12: Thời gian đáp ứng của dịch vụ không đạt yêu cầu, cần thay đổi. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 39
  40. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 - Ví dụ 2. Xác định mức ý nghĩa: α =0.05 3. Tính giá trị thống kê kiểm định x¯ 12 13.25 12 z0 = − = − =2.47 σ/√n 3.2/√40 4. Xác định miền bác bỏ: bác bỏ H0 nếu z0 >z1−α = z0.95 =1.645 5. Kết luận: z0 =2.47 > 1.645 nên bác bỏ H0. Ta kết luận rằng với 95% độ tin cậy, Mertro EMS không đáp ứng được mục tiêu thời gian phục vụ khách hàng từ 12 phút trở xuống. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 40
  41. Kiểm định giả thuyết cho kỳ vọng - TH biết σ2 - Ví dụ Sử dụng p - giá trị: • 4a. Tính p-giá trị, bài toán kiểm định một phía - bên phải p =1 Φ(z )=1 Φ(2.47) = 1 0.9932 = 0.0068 − 0 − − 5a. Kết luận: với α =0.05, ta có p =0.0068 < 0.05 nên bác bỏ H0. Ta kết luận với 95% độ tin cậy rằng Metro EMS không đáp ứng được mục tiêu thời gian phục vụ khách hàng từ 12 phút trở xuống. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 41
  42. Kiểm định giả thuyết cho kỳ vọng - TH không biết σ2, mẫu nhỏ Các giả định: • ■ Mẫu ngẫu nhiên X1, ,Xn được chọn từ tổng thể có phân phối chuẩn (µ,σ2) với kỳ vọng µ và phương sai σ2 không biết. N ■ Sử dụng ước lượng không chệch S thay cho σ. ■ Cỡ mẫu nhỏ: n 30. ≤ Bài toán kiểm định có 3 trường hợp: • H : µ = µ H : µ = µ H : µ = µ (a) 0 0 (b) 0 0 (c) 0 0 (H1 : µ = µ0 (H1 : µ µ0 6 với mức ý nghĩa α cho trước. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 42
  43. Kiểm định giả thuyết cho kỳ vọng - TH không biết σ2, mẫu nhỏ Các bước kiểm định 1. Phát biểu giả thuyết không và đối thuyết 2. Xác định mức ý nghĩa α 3. Lấy mẫu ngẫu nhiên cỡ n: X1, ,Xn và tính thống kê kiểm định X¯ µ T = − 0 (10) 0 S/√n Biến ngẫu nhiên T có phân phối Student với n 1 bậc tự do. 0 − 4. Xác định miền bác bỏ Wα: bảng 4 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 43
  44. Kiểm định giả thuyết cho kỳ vọng - TH không biết σ2, mẫu nhỏ Giả thuyết Miền bác bỏ H0 : µ = µ0 n−1 Wα = t0 : t0 >t1−α/2 H1 : µ = µ0 | | 6 n o H0 : µ = µ0 n−1 Wα = t0 : t0 t1−α H1 : µ>µ0 n o Bảng 4: Miền bác bỏ với đối thuyết tương ứng (trường hợp mẫu nhỏ) 5. Kết luận: Bác bỏ H0/ Chưa đủ cơ sở để bác bỏ H0. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 44
  45. Kiểm định giả thuyết cho kỳ vọng - TH không biết σ2, mẫu nhỏ Sử dụng p-giá trị (p - value): tính p-giá trị dựa theo đối thuyết và kết • luận bác bỏ H khi p -giá trị α, với mức ý nghĩa α cho trước. Công thức 0 ≤ tính p - giá trị theo các trường hợp xem ở bảng 5. Giả thuyết p - giá trị H0 : µ = µ0 p =2P(Tn−1 t0 ) H1 : µ = µ0 ≥| | 6 H0 : µ = µ0 p = P(Tn−1 t0 H1 : µ µ0 ≥ Bảng 5: p-giá trị với đối thuyết tương ứng (trường hợp mẫu nhỏ) Kiểm định giả thuyết thống kê Hoàng Văn Hà – 45
  46. Kiểm định giả thuyết cho kỳ vọng - TH không biết σ2, mẫu lớn Các giả định: • ■ Mẫu ngẫu nhiên X1, ,Xn được chọn từ tổng thể có kỳ vọng µ và phương sai σ2 không biết. ■ Sử dụng ước lượng không chệch S thay cho σ. ■ Cỡ mẫu lớn: n > 30. Khi cỡ mẫu lớn biến ngẫu nhiên • X¯ µ Z = − 0 (11) 0 S/√n sẽ hội tụ về phân phối chuẩn hóa Z (0, 1). Khi đó miền bác bỏ W hoặc ∼ N α p-giá trị sẽ được tính tương tự như trường hợp biết phương sai, chỉ thay thế X¯ µ − 0 bằng Z ở phương trình (11). σ/√n 0 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 46
  47. Kiểm định giả thuyết cho kỳ vọng - TH không biết σ2 - Ví dụ Ví dụ 7. Trạm cảnh sát giao thông trên đường cao tốc sẽ thực hiện việc bắn tốc độ định kỳ tại các địa điểm khác nhau để kiểm tra tốc độ của các phương tiện giao thông. Một mẫu về tốc độ của các loại xe được chọn để thực hiện kiểm định giả thuyết sau H0 : µ = 65 (H1 : µ > 65 Những vị trí mà bác bỏ H0 là những vị trí tốt nhất được chọn để đặt radar kiểm soát tốc độ. Tại địa điểm F, một mẫu gồm tốc độ của 64 phương tiện được bắn tốc độ ngẫu nhiên có trung bình là 66.2 mph và độ lệch tiêu chuẩn 4.2 mph. Sử dụng α = 5% để kiểm định giả thuyết. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 47
  48. Kiểm định giả thuyết cho kỳ vọng - TH không biết σ2 - Ví dụ Các bước kiểm định: • 1. Phát biểu giả thuyết: H0 : µ = 65 (H1 : µ > 65 2. Xác định mức ý nghĩa: α =0.05 3. Tính giá trị thống kê kiểm định khi σ2 không biết và cỡ mẫu n = 64 (lớn) x¯ µ0 66.2 65 z0 = − = − =2.286 s/√n 4.2/√64 4. Xác định miền bác bỏ: Bác bỏ H0 khi z0 >z1−α = z0.95 =1.645 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 48
  49. Kiểm định giả thuyết cho kỳ vọng - TH không biết σ2 - Ví dụ 5. Kết luận: z0 =2.286 > 1.645 nên bác bỏ H0, ta kết luận với 95% độ tin cậy rằng tốc độ trung bình tại địa điểm F lớn hơn 65 mph. Địa điểm F là địa điểm tốt để đặt radar kiểm soát tốc độ. Sử dụng p-giá trị: • 4a. Tính p-giá trị: Với z =2.286, p =1 Φ(z )=1 Φ(2.286) = 0.0111 0 − 0 − 5a. Kết luận: p =0.0111 < 0.05 nên bác bỏ H0, ta kết luận với 95% độ tin cậy rằng tốc độ trung bình tại địa điểm F lớn hơn 65 mph. Địa điểm F là địa điểm tốt để đặt radar kiểm soát tốc độ. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 49
  50. Kiểm định giả thuyết cho tỷ lệ Bài toán: • Cho tổng thể X, trong đó tỷ lệ phần tử mang đặc tính A nào đó là trong tổng thể là p (p chưa biết). Từ mẫu ngẫu nhiên (X1,X2, ,Xn) hãy kiểm định H : p = p H : p = p H : p = p (a) 0 0 (b) 0 0 (c) 0 0 (H1 : p = p0 (H1 : p p0 6 với mức ý nghĩa α. Giả định: • ■ Cỡ mẫu n lớn; để phân phối chuẩn xấp xỉ phân phối nhị thức tốt cần có np 5 và n(1 p ) 5. 0 ≥ − 0 ≥ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 50
  51. Kiểm định giả thuyết cho tỷ lệ Quan sát sự xuất hiện của biến cố "phần tử mang đặc tính A" trong n • phép thử độc lập. Gọi Y là số lần xuất hiện biến cố trên thì Y B(n, p). Và ∼ Y Pˆ = n là một ước lượng không chệch cho p. Nếu H đúng, thống kê • 0 Pˆ p0 Z0 = − p (1 p ) 0 − 0 r n có phân phối chuẩn hóa (0, 1). Chọn Z làm tiêu chuẩn kiểm định. N 0 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 51
  52. Kiểm định giả thuyết cho tỷ lệ Các bước kiểm định 1. Phát biểu giả thuyết và đối thuyết 2. Xác định mức ý nghĩa α 3. Tính giá trị thống kê kiểm định Pˆ p0 Z0 = − p (1 p ) 0 − 0 r n 4. Xác định miền bác bỏ: bảng 6 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 52
  53. Kiểm định giả thuyết cho tỷ lệ Giả thuyết Miền bác bỏ H0 : p = p0 Wα = z0 : z0 >z1−α/2 H1 : p = p0 | | 6 n o H0 : p = p0 Wα = z0 : z0 z1−α H1 : p > p0 n o Bảng 6: Miền bác bỏ cho bài toán kiểm định tỷ lệ 5. Kết luận: Bác bỏ H0/ Chưa đủ cơ sở để bác bỏ H0. Sử dụng p-giá trị: p-giá trị tính tương tự như bảng 3. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 53
  54. Kiểm định giả thuyết cho tỷ lệ - Ví dụ Ví dụ 8. Trong kỳ nghỉ giáng sinh và đầu năm mới, Cục An toàn giao thông đã thống kê được rằng có 500 người chết và 25000 người bị thương do các vụ tại nạn giao thông trên toàn quốc. Theo thông cáo của Cục ATGT thì khoảng 50% số vụ tai nạn có liên quan đến rượu bia. Khảo sát ngẫu nhiên 120 vụ tai nạn thấy có 67 vụ do ảnh hưởng của rượu bia. Sử dụng số liệu trên để kiểm định lời khẳng định của Cục An toàn giao thông với mức ý nghĩa α = 5%. Các bước kiểm định: 1. Phát biểu giả thuyết: H0 : p =0.5 (H1 : p =0.5 6 2. Xác định mức ý nghĩa: α =0.05 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 54
  55. Kiểm định giả thuyết cho tỷ lệ - Ví dụ 3. Tính giá trị thống kê kiểm định p0(1 p0) 0.5(1 0.5 σpˆ = − = − =0.045644 r n r 120 pˆ p0 (67/120) 0.5 z0 = − = − =1.28 σpˆ 0.045644 4. Xác định miền bác bỏ: bác bỏ H khi z >z =1.96 hoặc tính 0 | 0| 0.975 p-giá trị p = [(1 Φ(z )] = 2[1 Φ(1.28)] = 2(1 0.8977) = 0.2006 − 0 − − 5. Kết luận: do z0 =1.28 0.05) nên kết luận chưa đủ cơ sở để bác bỏ giả thuyết H0. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 55
  56. Kiểm định giả thuyết cho trường hợp hai mẫu độc lập
  57. So sánh hai kỳ vọng, trường hợp biết phương sai Các giả định: • ■ X1,X2, ,Xn là mẫu ngẫu nhiên được chọn từ tổng thể 1 có phân 2 phối chuẩn với kỳ vọng µ1 và phương sai σ1. ■ Y1,Y2, ,Ym là mẫu ngẫu nhiên được chọn từ tổng thể 2 có phân phối 2 chuẩn với kỳ vọng µ2 và phương sai σ2. ■ Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau. ■ 2 2 Các phương sai σ1 và σ2 đã biết. Bài toán kiểm định giả thuyết trên hai mẫu độc lập gồm các dạng sau: • H : µ µ = D H : µ µ = D H : µ µ = D (a) 0 1 − 2 0 (b) 0 1 − 2 0 (c) 0 1 − 2 0 (H1 : µ1 µ2 = D0 (H1 : µ1 µ2 D0 − 6 − − với mức ý nghĩa α cho trước. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 57
  58. So sánh hai kỳ vọng, trường hợp biết phương sai Các bước kiểm định 1. Phát biểu giả thuyết H0 và đối thuyết H1 2. Xác định mức ý nghĩa α 3. Tính thống kiểm định X¯ Y¯ (µ1 µ2) Z0 = − − − (12) σ2 σ2 1 + 2 r n m thống kê Z (0, 1). 0 ∼ N 4. Xác định miền bác bỏ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 58
  59. So sánh hai kỳ vọng, trường hợp biết phương sai Miền bác bỏ và p-giá trị tương ứng Đối thuyết Miền bác bỏ p - giá trị H : µ µ = D z >z − p = 2[1 Φ( z )] 1 1 − 2 6 0 | 0| 1 α/2 − | 0| H : µ µ D z >z − p =1 Φ(z ) 1 1 − 2 0 0 1 α − 0 5. Kết luận: Nếu bác bỏ H , ta kết luận H đúng với (1 α)100% độ tin 0 1 − cậy. Ngược lại ta kết luận chưa đủ cơ sở để bác bỏ H0 với α cho trước. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 59
  60. So sánh hai kỳ vọng - Ví dụ Ví dụ 9. Một công ty sản xuất sơn nghiên cứu về 1 loại phụ gia làm giảm thời gian khô của sơn. Thực hiện thí nghiệm trên 2 mẫu: mẫu thứ nhất gồm 10 mẫu vật được sơn bằng loại sơn bình thường; mẫu thứ hai gồm 10 mẫu vật được sơn với sơn có chất phụ gia mới. Trong những nghiên cứu trước, biết rằng độ lệch tiêu chuẩn của thời gian khô sau khi quét sơn là 8 phút và không thay đổi khi thêm phụ gia vào. Trung bình của mẫu 1 và 2 lần lượt là x¯ = 121 phút và y¯ = 112 phút. Với mức ý nghĩa 5%, hãy cho kết luận về loại sơn với chất phụ gia mới. 1. Phát biểu giả thuyết và đối thuyết H : µ µ =0 chất phụ gia mới không có hiệu quả 0 1 − 2 (H1 : µ1 >µ2 chất phụ gia mới có hiệu quả 2. Mức ý nghĩa: α =0.05 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 60
  61. So sánh hai kỳ vọng - Ví dụ 3. Tính giá trị thống kê kiểm định, với x¯ = 121, y¯ = 112 và σ1 = σ2 =8 ta có x¯ y¯ 0 121 112 z = − − = − =2.52 0 2 2 2 2 8 8 σ1 σ2 10 + 10 + n2 sn1 q 4. Xác định miền bác bỏ: bác bỏ H0 khi z0 >z1−α = z0.95 =1.65. 5. Kết luận: Ta có z0 =2.52 > 165 nên bác bỏ H0. Ta kết luận rằng với 95% độ tin cậy, chất phụ gia có hiệu quả làm giảm thời gian khô sau khi sơn. 5a. Sử dụng p - giá trị: ta có p =1 Φ(z )=1 Φ(2.52) = 0.0059 < 0.05 nên bác bỏ H . − 0 − 0 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 61
  62. So sánh hai kỳ vọng, trường hợp không biết phương sai, mẫu lớn Các giả định: • ■ X1,X2, ,Xn là mẫu ngẫu nhiên được chọn từ tổng thể 1 có kỳ vọng 2 µ1 và phương sai σ1 không biết. ■ Y1,Y2, ,Ym là mẫu ngẫu nhiên được chọn từ tổng thể 2 có kỳ vọng 2 µ2 và phương sai σ2 không biết. ■ Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau. ■ Cỡ mẫu lớn: n > 30 và m > 30. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 62
  63. So sánh hai kỳ vọng, trường hợp không biết phương sai, mẫu lớn ■ 2 2 Đối với trường hợp mẫu lớn, khi phương sai tổng thể σ1 và σ2 không 2 2 biết, ta thay thế bằng các phương sai mẫu S1 và S2 mà không tạo ra nhiều khác biệt. ■ Khi cả n > 30 và m > 30, đại lượng X¯ Y¯ (µ1 µ2) Z0 = − − − (13) S2 S2 1 + 2 r n m sẽ xấp xỉ phân phối chuẩn hóa (0, 1). N ■ Miền bác bỏ (hoặc p - giá trị) trong trường hợp này được tính tương tự như trường hợp biết phương sai (thay thế σ1 và σ2 bởi S1 và S2). Kiểm định giả thuyết thống kê Hoàng Văn Hà – 63
  64. So sánh hai kỳ vọng, trường hợp không biết phương sai, mẫu lớn Ví dụ 10. Khảo sát về chiều cao của sinh viên hai khoa Toán và CNTT: chọn ngẫu nhiên 50 sinh viên khoa Toán, tính được chiều cao trung bình là 163 (cm) và độ lệch tiêu chuẩn 5 (cm). Đo chiều cao 50 khoa CNTT, có trung bình mẫu là 166 (cm) và độ lệch tiêu chuẩn 8 (cm). Với mức ý nghĩa α = 1%, hãy cho kết luận về chiều cao của sinh viên hai khoa. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 64
  65. So sánh hai kỳ vọng, trường hợp không biết phương sai, mẫu nhỏ Các giả định: • ■ X1,X2, ,Xn là mẫu ngẫu nhiên được chọn từ tổng thể 1 có phân 2 phối chuẩn với kỳ vọng µ1 và phương sai σ1 không biết. ■ Y1,Y2, ,Ym là mẫu ngẫu nhiên được chọn từ tổng thể 2 có phân phối 2 chuẩn với kỳ vọng µ2 và phương sai σ2 không biết. ■ Tổng thể 1 và 2 (đại diện bởi X và Y ) độc lập với nhau. ■ Cỡ mẫu nhỏ: n 30 hoặc m 30. ≤ ≤ Ta xét hai trường hợp: • 2 2 1. Trường hợp phương sai bằng nhau σ1 = σ2, 2. Trường hợp phương sai khác nhau σ2 = σ2. 1 6 2 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 65
  66. So sánh hai phương sai Giả sử X , ,X và Y , ,Y lần lượt là hai mẫu ngẫu nhiên chọn từ • 1 n 1 m hai tổng thể độc lập và có phân phối chuẩn với kỳ vọng và phương sai là 2 2 (µ1,σ1) và (µ2,σ2). Ta cần kiểm định giả thuyết 2 2 H0 : σ1 = σ2 2 2 (14) (H1 : σ1 = σ2 6 Nếu S2 là phương sai mẫu ngẫu nhiên (X , ,X ) thì • 1 1 n 2 (n 1)S1 2 − 2 χ (n 1) (15) σ1 ∼ − tương tự, ta có 2 (m 1)S2 2 −2 χ (m 1) σ2 ∼ − Kiểm định giả thuyết thống kê Hoàng Văn Hà – 66
  67. So sánh hai phương sai Khi đó, đại lượng • 2 2 S1 /σ1 F = 2 2 (16) S2 /σ2 sẽ có phân phối với (n 1,m 1) bậc tự do. F − − Xét biến ngẫu nhiên F (u, v) có hàm mật độ xác suất là f(x), phân vị • ∼F trên mức α của F là fα,u,v được định nghĩa như sau ∞ P(F > fα,u,v) = f(x)dx = α (17) Zfα,u,v Phân vị dưới mức 1 α của F cho bởi • − 1 f1−α,u,v = (18) fα,u,v Kiểm định giả thuyết thống kê Hoàng Văn Hà – 67
  68. So sánh hai phương sai Các bước kiểm định 1. Phát biểu giả thuyết H : σ2 = σ2 và đối thuyết H : σ2 = σ2 0 1 2 1 1 6 2 2. Xác định mức ý nghĩa α 3. Khi H0 đúng, thống kê 2 S1 F = 2 (19) S2 có phân phối với (n 1,m 1) bậc tự do. F − − 4. Xác định miền bác bỏ: bác bỏ H0 khi f > fα/2,n−1,m−1 hoặc f < f1−α/2,n−1,m−1 5. Kết luận: Nếu bác bỏ H , ta kết luận H đúng với (1 α) 100% độ 0 1 − ∗ tin cậy. Ngược lại kết luận chưa đủ cơ sở để bác bỏ H0. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 68
  69. So sánh hai kỳ vọng, mẫu nhỏ, trường 2 2 2 hợp σ1 = σ2 = σ ■ 2 2 2 2 Trường hơp σ1 = σ2 = σ , ta sử dụng một ước lượng chung cho cả σ1 2 2 và σ2 là Sp gọi là phương sai mẫu chung (pooled sample variance) (n 1)S2 +(m 1)S2 S2 = − 1 − 2 (20) p n + m 2 − ■ Thống kê X¯ Y¯ (µ1 µ2) T0 = − − − (21) 1 1 S + p n m r có phân phối Student với n + m 2 bậc tự do − Kiểm định giả thuyết thống kê Hoàng Văn Hà – 69
  70. So sánh hai kỳ vọng, mẫu nhỏ, trường 2 2 2 hợp σ1 = σ2 = σ ■ Đặt df = n + m 2, miền bác bỏ và p - giá trị trong trường hợp này có − dạng Đối thuyết Miền bác bỏ p - giá trị H : µ µ = D t >tdf p =2P(T t ) 1 1 − 2 6 0 | 0| 1−α/2 df ≥| 0| df H : µ µ D t >t − p = P(T t ) 1 1 − 2 0 0 1 α df ≥ 0 ■ Kết luận: Bác bỏ H0/Chưa đủ cơ sở để bác bỏ H0. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 70
  71. So sánh hai kỳ vọng, mẫu nhỏ, trường hợp σ2 = σ2 1 6 2 ■ Khi σ2 = σ2, sử dụng thống kê 1 6 2 X¯ Y¯ (µ1 µ2) T0 = − − − (22) S2 S2 1 + 2 r n m ■ Khi đó T0 có phân phối Student với bậc tự do df được xác định như sau (s2/n)+(s2/m) 2 df = 1 2 (23) (s2/n)2 (s2/m)2  1 + 2  n 1 m 1 − − ■ Miền bác bỏ trong trường hợp này giống như trường hợp phương sai bằng nhau, chỉ thay bậc tự do df cho bởi phương trình (23). Kiểm định giả thuyết thống kê Hoàng Văn Hà – 71
  72. So sánh hai kỳ vọng, trường hợp không biết phương sai - Ví dụ Ví dụ 11. Tại một thành phố, ở khu vực A, người ta chọn ngẫu nhiên 17 sinh viên và cho làm 1 bài kiểm tra để đo chỉ số IQs, thu được trung bình mẫu là 106 và độ lệch tiêu chuẩn bằng 10; tại khu vực B, chỉ số IQs trung bình của một mẫu gồm 14 sinh viên bằng 109 với độ lệch tiêu chuẩn là 7. Giả sử phương sai bằng nhau. Có sự khác biệt về chỉ số IQs của sinh viên ở hai khu vực A và B hay không? α =0.02. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 72
  73. So sánh hai kỳ vọng, trường hợp không biết phương sai - Ví dụ Ví dụ 12. Hàm lượng thạch tín (Asen) (Đv: ppb) trong nước càng cao càng có hại cho sức khỏe. Người ta kiểm tra hàm lượng thạch tín ở hai khu vực là trung tâm thành phố Biên Hòa và khu vực gần sân bay Biên Hòa. Tại mỗi khu vực, người ta đo ngẫu nhiên hàm lượng thạch tín trong nước ứng với 10 địa điểm khác nhau. Số liệu cho bởi bảng thống kê bên dưới Trung tâm TP 3 7 25 10 15 6 12 25 15 7 Khu vực gần sân bay 48 44 40 38 33 21 20 12 1 18 Với α =0.05, hãy kiểm tra xem có sự khác biệt về hàm lượng thạch tín ở hai khu vực này. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 73
  74. So sánh hai tỷ lệ Khảo sát những phần tử thỏa một tính chất A nào đó trên hai tổng thể độc • lập với tỷ lệ tương ứng là p1 và p2; từ hai tổng thể chọn ra hai mẫu với cỡ lần lượt là n và m. Gọi X và Y là số phần tử thỏa tính chất A trong mẫu 1 và mẫu 2. Khi đó, ta có X B(n, p ) và Y B(m, p ). ∼ 1 ∼ 2 Bài toán: so sánh tỷ lệ p và p . • 1 2 Bài toán kiểm định giả thuyết gồm các trường hợp sau: • H : p p = D H : p p = D H : p p = D (a) 0 1 − 2 0 (b) 0 1 − 2 0 (c) 0 1 − 2 0 (H1 : p1 p2 = D0 (H1 : p1 p2 D0 − 6 − − Các giả định • ■ Hai mẫu độc lập, ■ Cỡ mẫu lớn và np > 5; n(1 p ) > 5 và mp > 5; m(1 p ) > 5. 1 − 1 2 − 2 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 74
  75. So sánh hai tỷ lệ Các bước kiểm định 1. Phát biểu giả thuyết H0 và đối thuyết H1 2. Xác định mức ý nghĩa α 3. Tính thống kê kiểm định Pˆ1 Pˆ2 D0 Z0 = − − (24) 1 1 Pˆ(1 Pˆ) + − n m s   với X Y X + Y Pˆ = ; Pˆ = ; Pˆ = 1 n 2 m n + m nếu H đúng, Z (0, 1). 0 ∼ N Kiểm định giả thuyết thống kê Hoàng Văn Hà – 75
  76. So sánh hai tỷ lệ 4. Xác định miền bác bỏ Đối thuyết Miền bác bỏ p - giá trị H : p p = D z >z − p = 2[1 Φ( z )] 1 1 − 2 6 0 | 0| 1 α/2 − | 0| H : p p D z >z − p =1 Φ(z ) 1 1 − 2 0 0 1 α − 0 5. Kết luận: Nếu bác bỏ H , ta kết luận H đúng với (1 α)100% độ tin 0 1 − cậy. Ngược lại ta kết luận chưa đủ cơ sở để bác bỏ H0 với α cho trước. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 76
  77. So sánh hai tỷ lệ - Ví dụ Ví dụ 13. Một công ty sản xuất thuốc cần kiểm tra một loại thuốc có tác dụng là giảm việc xuất hiện cơn đau ngực ở các bệnh nhân. Công ty thực hiện thí nghiệm trên 400 người, chia làm hai nhóm: nhóm 1 gồm 200 được uống thuốc và nhóm 2 gồm 200 người được uống giả dược. Theo dõi thấy ở nhóm 1 có 8 người lên cơn đau ngực và nhóm 2 có 25 người lên cơn đau ngực. Với α =0.05, hay cho kết luận về hiệu quả của thuốc mới sản xuất. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 77
  78. So sánh hai mẫu không độc lập
  79. So sánh hai mẫu không độc lập (paired t - test) ■ Khi hai mẫu không độc lập thì mỗi giá trị quan trắc được trong một mẫu có mối liên hệ tương ứng với một giá trị quan trắc ở mẫu thứ hai. Như vậy, ta có thể ghép cặp từng giá trị trong hai mẫu với nhau. ■ Việc ghép cặp là kết quả của việc ◆ quan trắc giá trị trước và sau khi thực hiện 1 thí nghiệm. Chẳng hạn như đo trọng lượng trước và sau khi thực hiện một chế độ ăn kiêng. ◆ so sánh cùng 1 đặc tính. ◆ thí nghiệm trên cùng 1 địa điểm. ◆ thí nghiệm với cùng thời gian. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 79
  80. So sánh hai mẫu không độc lập (paired t - test) ■ Xét (X1i,X2i), với i =1, 2, ,n, là tập gồm n cặp giá trị quan trắc với giả sử rằng kỳ vọng và phương sai của tổng thể đại diện bởi X1 là 2 µ1 và σ1 và kỳ vọng và phương sai của tổng thể đại diện bởi X2 là µ2 và σ2. X và X (i = j) độc lập. 2 1i 2j 6 ■ Định nghĩa độ sai khác giữa mỗi cặp trong tập hợp các giá trị quan trắc là D = X X , i =1, ,n (25) i 1i − 2i ■ Các Di,i =1, ,n được giả sử có phân phối chuẩn. ■ Goi µD = E(Di), bởi vì D1, ,Dn là những biến ngẫu nhiên độc lập và có cùng phân phối, nếu d1, ,dn là những giá trị của D1, ,Dn, ta định nghĩa Kiểm định giả thuyết thống kê Hoàng Văn Hà – 80
  81. So sánh hai mẫu không độc lập (paired t - test) ■ Goi µD = E(Di), bởi vì D1, ,Dn là những biến ngẫu nhiên độc lập và có cùng phân phối, nếu d1, ,dn là những giá trị của D1, ,Dn, ta định nghĩa n 1 d¯= d (26) n i i=1 X n n 1 1 n s2 = (d d¯)2 = d2 (d¯)2 (27) d n 1 i − n 1 i − n 1 − Xi=1 − Xi=1 − ■ Ta cần kiểm định các giả thuyết và đối thuyết sau H : µ = D H : µ = D H : µ = D (a) 0 D 0 (b) 0 D 0 (c) 0 D 0 (H1 : µD = D0 (H1 : µD D0 6 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 81
  82. So sánh hai mẫu không độc lập (paired t - test) Các bước kiểm định 1. Phát biểu giả thuyết H0 và đối thuyết H1 2. Xác định mức ý nghĩa α 3. Tính thống kê kiểm định D¯ D0 T0 = − (28) SD/√n thống kê T có phân phối Student với n 1 bậc tự do. 0 − 4. Xác định miền bác bỏ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 82
  83. So sánh hai mẫu không độc lập (paired t - test) Miền bác bỏ và p - giá trị trong trường hợp này có dạng Đối thuyết Miền bác bỏ p - giá trị n−1 H : µ = D t >t p =2P(T − t ) 1 D 6 0 | 0| 1−α/2 n 1 ≥| 0| n−1 H : µ D t >t − p = P(T − t ) 1 D 0 0 1 α n 1 ≥ 0 5. Kết luận: Nếu bác bỏ H , ta kết luận H đúng với (1 α) 100% độ 0 1 − ∗ tin cậy. Ngược lại kết luận chưa đủ cơ sở để bác bỏ H0. Trường hợp cỡ mẫu n > 30, bài toán kiểm định hai mẫu phụ thuộc thực • hiện tương tự như trường hợp một mẫu dựa trên mẫu ngẫu nhiên (D1, ,Dn). Kiểm định giả thuyết thống kê Hoàng Văn Hà – 83
  84. So sánh hai mẫu không độc lập - Ví dụ Ví dụ 14. Một bác dinh dưỡng nghiên cứu một chế độ ăn kiêng và tập thể dục mới để làm giảm lượng đường trong máu của các bệnh nhân bị bệnh tiểu đường. 10 bệnh nhân bị bệnh tiểu đường được chọn để thử nghiệm chương trình này, bảng kết quả bên dưới cho biết lượng đường trong máu trước và sau khi các bệnh nhân tham gia chương trình Trước 268 225 252 192 307 228 246 298 231 185 Sau 106 186 223 110 203 101 211 176 194 203 Số liệu được cung cấp có đủ bằng chứng để kết luận rằng chế độ ăn kiêng và tập thể dục có tác dụng làm giảm lượng đường trong máu không? α =0.05. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 84
  85. Kiểm định Chi bình phương (Goodness-of-Fit-test)
  86. Kiểm định giả thuyết về phân phối Bài toán: Khảo sát biến ngẫu nhiên X liên liên quan đến một tổng thể • có phân phối chưa biết. Cần kiểm định xem phân phối của tổng thể có phải là F (x; θ) hay không? Chẳng hạn, ta cần kiểm định phân phối của tổng thể đang xét là phân phối chuẩn. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 86
  87. Kiểm định giả thuyết về phân phối Các bước kiểm định 1. Chọn mẫu ngẫu nhiên cỡ n: (X1, ,Xn). Chia miền giá trị của các biến ngẫu nhiên Xi thành K khoảng không trùng nhau l1, l2, ,lK (Trường hợp X là biến ngẫu nhiên rời rạc, ta chia thành K điểm: x1, x2, , xK ). 2. Gọi Oj là số các giá trị mẫu nằm trong khoảng lj (j =1, 2, ,K) (Trường hợp X là biến ngẫu nhiên rời rạc là tần số lặp lại của giá trị xj). Oj gọi là các tần số thực nghiệm. 3. Phát biểu giả thuyết H0: X tuân theo luật phân phối F (x; θ). Khi đó, tính p = P(X l ) (hoặc P(X = x ) nếu X rời rạc). Đặt j ∈ j j Ej = npj, Ej gọi là các tần số lý thuyết. Điều kiện: E 5, j =1, 2, ,K. j ≥ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 87
  88. Kiểm định giả thuyết về phân phối 4. Thống kê kiểm định Q2 cho bởi công thức K (O E )2 Q2 = j − j (29) Ej Xj=1 Q2 xấp xỉ phân phối χ2 với K 1 bậc tự do. − 5. Bác bỏ H0 nếu 2 2 Q χ − − (30) ≥ α,K r 1 2 với r là số tham số ước lượng. Tìm χα,K−r−1: tra bảng Chi - bình phương. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 88
  89. Kiểm định giả thuyết về phân phối - Ví dụ Ví dụ 15. Bảng thống kê số vụ tai nạn xe máy/ngày ở quận 5 trong 80 ngày Số vụ tai nạn Số ngày 0 34 1 25 2 11 3 7 4 3 Với mức ý nghĩa 5%, hãy kiểm tra xem số vụ tai nạn xe máy hàng ngày có tuân theo luật phân phối Poisson hay không? Kiểm định giả thuyết thống kê Hoàng Văn Hà – 89
  90. Kiểm định giả thuyết về phân phối - Ví dụ 1. Gọi X = số vụ tai nạn xe máy/ngày ở Q.5; phát biểu giả thuyết H0 : X tuân theo luật phân phối Poisson với tham số λ 2. Tính các tần số thực lý thuyết Ej,j =1, , 5. E = np = nP(X = x ). Nếu X P (λ), các xác suất p được tính j j j ∼ j như sau − e λλxj pj = P(X = xj) = xj! Do λ chưa biết nên ta sử dụng ước lượng của λ là 5 1 λˆ = O x =1 n i i Xi=1 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 90
  91. Kiểm định giả thuyết về phân phối - Ví dụ 3. Xác suất và kết quả tính tần số lý thuyết cho ở bảng bên dưới pi = P(X = xi) Ei = npi e−110 p1 = 0! =0.368 29.44 e−111 p2 = 1! =0.368 29.44 e−112 p3 = 2! =0.184 14.72 e−113 p4 = 3! =0.061 4.88 p =1 4 p =0.019 1.52 5 − i=1 i P 4. Tính thống kê Q2, 5 (O E )2 (34 29.44)2 (3 1.52)2 Q2 = j − j = − + + − =4.67 Ej 29.44 1.52 Xj=1 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 91
  92. Kiểm định giả thuyết về phân phối - Ví dụ 5. Bác bỏ H0 khi: 2 2 2 Q χ − − = χ − − ≥ α,K r 1 0.05,5 1 1 2 Tra bảng, ta có χ0.05,3 =7.815. 2 6. Do Q =4.67 < 7.815 nên kết luận chưa đủ cơ sở để bác bỏ H0. Vậy, số vụ tai nạn giao thông/ ngày ở Q.5 tuân theo luật phân phối Poisson. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 92
  93. Kiểm định giả thuyết về phân phối - Ví dụ Ví dụ 16. Điểm thi của 200 sinh viên trong một lớp học cho bởi bảng bên dưới. Có ý kiến cho rằng điểm thi của sinh viên là đại lượng ngẫu nhiên có phân phối chuẩn với điểm trung bình bằng 75 và độ lệch chuẩn bằng 8. Với α =0.05, hãy kiểm tra ý kiến này. Điểm thi (0, 60] (60, 70] (70, 80] (80, 90] (90, 100] Số sinh viên 12 36 90 44 18 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 93
  94. Kiểm định giả thuyết về phân phối - Ví dụ Ví dụ 17. Nhóm máu của 500 người chọn ngẫu nhiên từ một khu vực cho bởi bảng sau A B AB O 75 150 15 260 Theo từ điển y khoa thì tỷ lệ nhóm máu trong dân số là 0.18, 0.28, 0.05, 0.49. Hỏi nhóm máu trong dân số có phù hợp với từ điển y khoa hay không? Mức ý nghĩa 1%. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 94
  95. Kiểm định giả thuyết về tính độc lập Bài toán: • ■ Giả sử mỗi phần tử trong một tổng thể có thể được phân loại theo hai đặc tính khác nhau, gọi là đặc tính X và đặc tính Y . X có r giá trị và Y có s giá trị. Gọi Pij = P(X = xi,Y = yj) với i =1, ,r và j =1, ,s. Pij là xác suất chọn được một phần tử trong tổng thể có đặc tính X bằng i và đặc tính Y bằng j. ■ Gọi s pi = P(X = xi) = Pij, i =1, ,r Xj=1 và r qj = P(Y = yj) = Pij, j =1, ,s Xi=1 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 95
  96. Kiểm định giả thuyết về tính độc lập pi là xác suất chọn được một phần tử của tổng thể có đặc tính X bằng xi, qj là xác suất chọn được môt phần tử của tổng thể có đặc tính Y bằng yj. ■ Ta cần kiểm định xem X có độc lập với Y hay không? Phát biểu giả thuyết H : P = p q i =1, ,r; j =1, ,s 0 ij i j ∀ và đối thuyết H : (i,j) sao cho P = p q 1 ∃ ij 6 i j Kiểm định giả thuyết thống kê Hoàng Văn Hà – 96
  97. Kiểm định giả thuyết về tính độc lập ■ Khảo sát N phần tử, ta được bảng kết quả, trong bài toán này gọi là bảng ngẫu nhiên (contingency table): H HH Y H y1 y2 ys Tổng hàng X HH ··· x n n n n 1 11 12 ··· 1s 1 x2 n21 n22 n2s n2 . . . ···. . . . . . . . . x n n n n r r1 r2 ··· rs r Tổng cột m m m N 1 2 ··· s Bảng 7 trong đó, các nij gọi là tần số thực nghiệm. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 97
  98. Kiểm định giả thuyết về tính độc lập ■ Ước lượng của pi và qj lần lượt bằng n pˆ = i , i =1, ,r i N m qˆ = j , j =1, ,s j N ■ Gọi Nij là số phần tử có đặc tính (xi, yj) trong N phần tử khảo sát, thì N B(N,P ). Khi đó, ij ∼ ij E(Nij) = NPij = Npiqj khi H0 đúng Đặt n m e = Npˆ qˆ = i j ij i j N eij gọi là tần số lý thuyết. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 98
  99. Kiểm định giả thuyết về tính độc lập Định lý 9 (Pearson). Với Nij và Eij = NPij, biến ngẫu nhiên r s (N E )2 ij − ij Eij Xi=1 Xj=1 2 sẽ hội tụ theo phân phối về biến ngẫu nhiên Chi bình phương χ(r−1)(s−1) bậc tự do. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 99
  100. Kiểm định giả thuyết về tính độc lập Các bước kiểm định 1. Phát biểu giả thuyết H0: X và Y độc lập 2. Xác định tần số thực nghiệm nij và tần số lý thuyết n m e = i j ij N với ni và mj là tổng hàng i và tổng cột j tương ứng, Điều kiện: e 5. ij ≥ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 100
  101. Kiểm định giả thuyết về tính độc lập 3. Tính thống kê kiểm định r s (n e )2 r s n2 Q2 = ij − ij = ij N (31) eij eij − Xi=1 Xj=1 Xi=1 Xj=1 2 Nếu H0 đúng, thống kê Q có phân phối Chi bình phương với (r 1)(s 1) bậc tự do − − 4. Bác bỏ H0 khi 2 2 Q >χ(r−1)(s−1)(α) (32) 4b. Sử dụng p-giá trị: 2 2 p = P χ − − Q (33) (r 1)(s 1) ≥   Bác bỏ H khi: p α. 0 ≤ Kiểm định giả thuyết thống kê Hoàng Văn Hà – 101
  102. Kiểm định giả thuyết về tính độc lập - Ví dụ Ví dụ 18. Một báo cáo khoa học trong y khoa tuyên bố rằng việc sở hữu một thú cưng trong nhà (chó hoặc mèo) sẽ làm tăng khả năng sống sót của những người chủ mà thường bị lên cơn đau tim. Một mẫu ngẫu nhiên gồm 95 người đã lên cơn đau tim được chọn để khảo sát. Dữ liệu của mỗi người khảo sát được chia làm 2 loại: - Những người sống sót/tử vong 1 năm sau khi lên cơn đau tim. - Người sống sót/tử vong có nuôi thú cưng trong nhà hay không. Kết quả cho bởi bảng sau Có nuôi thú cưng Không nuôi thú cưng Sống sót 28 44 Tử vong 8 15 Kiểm định giả thuyết thống kê Hoàng Văn Hà – 102
  103. Kiểm định giả thuyết về tính độc lập - Ví dụ 1. Phát biểu giả thuyết, H0: Bệnh lên cơn đau tim độc lập với việc nuôi thú cưng, 2. Tính tần số thực nghiệm: với n1 = 72, n2 = 23, m1 = 36, m2 = 59 n m 72 36 n m 72 59 e = 1 1 = × = 27.284; e = 1 2 = × = 44.716 11 N 95 12 N 95 n m 23 36 n m 23 59 e = 2 1 = × =8.716; e = 2 2 = × = 14.284 21 N 95 22 N 95 3. Tính giá trị thống kê Q2 2 2 n2 282 442 82 152 Q2 = ij n = + + + 95=0.125 eij − 27.284 44.716 8.716 15.284 − Xi=1 Xj=1   Kiểm định giả thuyết thống kê Hoàng Văn Hà – 103
  104. Kiểm định giả thuyết về tính độc lập - Ví dụ 2 2 2 4. Bác bỏ H0 khi: Q >χ(r−1)(s−1)(α) = χ1(0.05). 2 Tra bảng Chi - bình phương, ta được χ1(0.05) = 3.841. Q2 =0.125, suy ra Q2 < 3.841. Ta kết luận chưa đủ cơ sở để bác bỏ H0 tức là bệnh lên cơn đau tim độc lập với việc nuôi thú cưng. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 104
  105. Kiểm định giả thuyết về tính độc lập - Ví dụ Ví dụ 19. Vé máy bay của hãng hàng không Việt Nam Airline được chia làm 3 loại: Hạng thường (C), hạng trung (B) và hạng doanh nhân (A). Hành khách đi máy bay của VN Airlines nằm trong 1 trong 2 dạng sau: bay nội địa hoặc quốc tế. Khảo sát 920 hành khách đã bay của hãng, cho kết quả sau: Loại chuyến bay Loại vé Nội địa Quốc tế Hạng thường 29 22 Hạng trung 95 121 Hạng doanh nhân 518 135 Có ý kiến cho rằng hành khách mua loại vé nào (A, B, C) sẽ phụ thuộc vào việc người đó bay nội địa hay quốc tế. Với mức ý nghĩa 5%, hãy kiểm tra ý kiến trên. Kiểm định giả thuyết thống kê Hoàng Văn Hà – 105