Giáo trình Xác suất thống kê

123 trang vanle 6170

Download

Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình Xác suất thống kê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

giao_trinh_xac_suat_thong_ke.pdf

Nội dung text: Giáo trình Xác suất thống kê

Giáo trình Xác suất thống kê
"Cần nhớ rằng môn khoa học bắt đầu từ việc xem xét các trò chơi may rủi lại hứa hẹn trở thành đối tượng quan trọng nhất của tri thức loài người. Phần lớn những vấn đề quan trọng nhất của đời sống thực ra chỉ là những bài toán của lý thuyết xác suất" P.S. Laplace(1812) Chương mở đầu 1. Giới thiệu về sự ra đời của xác suất Sự ra đời của lý thuyết xác suất bắt đầu từ những thư từ trao đổi giữa hai nhà toán học vĩ đại người Pháp là Pascal (1632 − 1662) và Fermat (1601 − 1665) xung quanh cách giải đáp một số vấn đề rắc rối nẩy sinh trong các trò chơi cờ bạc mà một quý tộc Pháp đặt ra cho Pascal. Dựa vào các thành tựu của lý thuyết xác suất, thống kê xây dựng các phương pháp ra quyết định trong điều kiện thông tin không đầy đủ. Hơn 300 năm phát triển đến nay nội dung và các phương pháp xác suất và thống kê toán rất phong phú, được ứng dụng rộng rãi trong nhiều lĩnh vực tự nhiên và xã hội khác nhau. 2. Tổng quan về mối liên hệ giữa tổng thể và mẫu Một tập hợp các phần tử hoặc các đối tượng cần nghiên cứu để rút ra một kết luận nào đó được gọi là tổng thể. Tập hợp con hoặc một phần của tổng thể được sử dụng để đưa ra kết luận về tổng thể được gọi là mẫu. Ví dụ 1. Chúng ta muốn nghiên cứu chiều cao của thanh niên Việt Nam trong vòng 5 năm từ 2004 − 2009. Tổng thể trong trường hợp này là "toàn bộ thanh niên Việt Nam". Thực tế ta không thể đo được chiều cao của toàn bộ thanh niên Việt Nam (chẳng hạn như: điều kiện kinh tế, thời gian, nhân lực, v.v ) mà chỉ có thể chọn ngẫu nhiên "một bộ phận thanh niên Việt Nam", bộ phận này được gọi là mẫu Muốn từ kết quả của mẫu suy ra kết quả cho tổng thể tốt thì mẫu phải đại diện được cho tổng thể, muốn vậy thì mẫu phải được lấy một cách ngẫu nhiên. Ví dụ 2. Xét điểm thi của toàn thể sinh viên Khoa Kinh Tế khi thi kết thúc môn XSTK thì tổng thể là toàn bộ điểm thi của sinh viên Khoa Kinh Tế. Nếu chọn ngẫu nhiên từ mỗi lớp ra 10 sinh Trang 1
viên để khảo sát điểm thi thì tập hợp tất cả điểm thi của các sinh viên này là một mẫu (đại diện cho điểm thi của toàn bộ sinh viên Khoa Kinh Tế). Dựa vào mẫu này ta có thể rút ra một số kết luận như: Điểm trung bình môn thi XSTK của toàn bộ sinh viên Khoa Kinh Tế, Độ phân tán điểm thi môn XSTK của toàn bộ sinh viên Khoa Kinh Tế v.v Số lượng phần tử của tổng thể gọi là kích thước của tổng thể (có thể vô hạn). Số lượng phần tử của mẫu gọi là kích thước mẫu (cỡ mẫu), kí hiệu là n. Mối quan hệ giữa tổng thể và mẫu 3. Một vài cách trình bày về bảng số liệu của mẫu 3.1. Bảng phân phối tần số Giá trị quan sát (xi) x1 x2 xn Số lần (fi) f1 f2 fn 3.2. Bảng phân phối tần số ghép lớp Giá trị quan sát a1 − a2 a2 − a3 an−1 − an Số lần (fi) f1 f2 fn xi giá trị đại diện của nhóm i được tính theo công thức sau amin + amax xi = (1) 2 trong đó fi là tần số của nhóm i trong bảng phân phối tần số ghép lớp. 3.3. Bảng phân phối 2 chiều Trang 2
4. Các tham số đặc trưng mẫu • Cỡ mẫu: n. • Trung bình mẫu: n P xi x = i=1 (2) n trong đó xi là giá trị quan sát được trên đơn vị thứ i. • Phương sai mẫu: n P 2 (xi − x) s2 = i=n (3) b n • Độ lệch chuẩn mẫu: √ 2 sb = sb (4) • Phương sai mẫu hiệu chỉnh: n X 2 (xi − x) s2 = i=n (5) n − 1 • Độ lệch chuẩn mẫu hiệu chỉnh: √ s = s2 (6) Trường hợp bảng số liệu có dạng 3.2. Trang 3
• Trung bình mẫu: n X xifi i=1 x = n (7) X fi i=1 Pn trong đó i=1 fi = n là kích cỡ mẫu. • Phương sai mẫu: n X 2 (xi − x) fi 2 i=n sb = n (8) X fi i=1 • Độ lệch chuẩn: √ 2 sb = sb (9) • Phương sai mẫu hiệu chỉnh: n X 2 (xi − x) fi 2 i=n s = n (10) X fi − 1 i=1 • Độ lệch chuẩn mẫu hiệu chỉnh: √ s = s2 (11) Ví dụ 3. Giả sử ta có số liệu về tiền lương (nghìn đ/tuần) của 2 nhóm công nhân như sau: Nhóm 1: 300, 400, 500, 600, 700 Nhóm 2: 400, 450, 500, 550, 600 a) So sánh số trung bình mẫu về tiền lương giữa 2 nhóm công nhân. b) So sánh độ lệch chuẩn mẫu hiệu chỉnh về tiền lương giữa 2 nhóm công nhân. Nhận xét. Giải: 2 2 Nhóm 1: x1 = 500, s1 = 20000 (VND ) 2 2 Nhóm 2: x2 = 500, s2 = 5000 (VND ) Trang 4
Nhận xét: Mặc dù tiền lương trung bình của 2 nhóm công nhân là bằng nhau nhưng độ lệch chuẩn mẫu hiệu chỉnh của nhóm 1 cao hơn nhóm 2 nên độ phân tán của nhóm 1 về tiền lương lớn hơn so với nhóm 2 (ta cũng có thể nói là nhóm 2 có mức tiền lương "đồng đều" hơn nhóm 1). Ví dụ 4. Giả sử ta có số liệu về lượng nước tiêu thụ (m3/tháng) của 200 hộ gia đình tại huyện X như sau: Lượng nước tiêu thụ (m3/tháng) Số hộ 0 - 25 24 25 - 50 66 50 - 75 80 75 - 100 20 100 - 125 10 Cộng 200 Tính các tham số đặc trưng mẫu: x, s. 5. Hình dáng phân phối của một tập dữ liệu 5.1. Khái niệm về Histogram và Diagram • Histogram Biểu đồ Histogram được vẽ từ bảng phân phối tần số với trục nằm ngang mô tả biểu hiện của các nhóm, trục đứng mô tả tần số. Nhận xét: Histogram cho ta cảm nhận về bản chất của tập dữ liệu đó là 1 tập dữ liệu có phân phối cân xứng hay không cân xứng. Ví dụ 5. Để nghiên cứu tình hình năng suất lao động của công nhân tại một xí nghiệp, người ta chọn ngẫu nhiên một mẫu 50 công nhân và thu được kết quả như sau: Năng suất lao động (kg) Số công nhân 20 - 30 14 30 - 40 18 40 - 50 10 50 - 60 5 ≥60 3 Cộng 50 Trang 5
Histogram của bảng số liệu trên là sơ đồ sau • Diagram Cho ta cảm nhận về mối liên hệ giữa 2 giá trị quan sát thông qua một số loại đồ thị tiêu biểu là Crosstabulation và Scatter Diagram. • Crosstabulation Là phương pháp có thể dùng để tóm tắt dữ liệu đồng thời cho giá trị quan sát x và y. Ví dụ 6. Zargat là một dịch vụ cung cấp các dữ liệu về các nhà hàng nằm khắp nơi trên thế giới. Dữ liệu dựa trên các biến khác nhau như là đánh giá chất lượng và giá cả của bữa ăn được chọn lựa. Biến chất lượng được đánh giá trên các tiêu chí "Tốt, Rất tốt, Tuyệt vời" và biến giá cả được tính từ $10 đến $49. Zargat tiến hành khảo sát một mẫu gồm 300 nhà hàng ở khu vực Los Angeles và thu được kết quả như sau: Trang 6
Nhà hàng Chất lượng Giá cả 1 Tốt 18 2 Rất tốt 22 3 Tốt 28 4 Tuyệt vời 38 5 Rất tốt 33 6 Tốt 28 7 Rất tốt 19 8 Rất tốt 11 9 Rất tốt 23 10 Tốt 13 Bảng Crosstabulation Giá cả Chất lượng 10-19 20-29 30-39 40-49 Tổng số Tốt 42 40 2 0 84 Rất tốt 34 64 46 6 150 Tuyệt vời 2 14 28 22 66 Tổng số 78 118 76 28 300 • Scatter Diagram Là đồ thị biểu thị mối liên hệ giữa hai biến định lượng Ví dụ 7. Trong suốt 10 tuần, một cửa hàng đã sử dụng chương trình truyền hình để quảng cáo cho mặt hàng của mình nhằm thúc đẩy doanh số bán hàng. Nhà quản lý muốn điều tra mối liên hệ giữa số lần lên sóng của mặt hàng và doanh số của cửa hàng. Số liệu thu được trong 10 tuần được thể hiện trong bảng sau: Trang 7
Tuần Số lần lên sóng Doanh số (đơn vị $100) x y 1 2 50 2 5 57 3 1 41 4 3 54 5 4 54 6 1 38 7 5 63 8 3 48 9 4 59 10 2 46 Đồ thị Scatter 5.2. Phân phối cân đối và phân phối lệch • Phân phối cân đối: Là phân phối mà dữ liệu nằm đối xứng với nhau xung quanh giá trị trung bình mẫu Trang 8
• Phân phối lệch: Là phân phối mà dữ liệu nằm lệch về một bên so với giá trị trung bình mẫu. Trang 9
Chương 1 Xác suất và công thức tính xác suất 1. Nhắc lại về đại số tổ hợp 1.1. Quy tắc cộng Nếu một công việc có thể thực hiện theo k phương án A1,A2, , Ak và mỗi phương án Ai có ni (i = 1, 2, , k) cách thực hiện thì số cách thực hiện công việc là k X n = ni = n1 + n2 + + nk. i=1 Ví dụ 8. Một người muốn mua một đôi giày cỡ 39 hoặc 40. Cỡ 39 có hai màu đen và trắng, cỡ 40 có ba màu đen, trắng và nâu. Khi đó số cách chọn mua giày của người đó là 2 + 3 = 5. 1.2. Quy tắc nhân Nếu một công việc bao gồm k giai đoạn và mỗi giai đoạn có ni (i = 1, 2, , k) cách thực hiện thì số cách thực hiện công việc là k Y n = ni = n1n2 nk. i=1 Trang 10
Ví dụ 9. Trong một trò chơi, mỗi thí sinh phải chọn một trong 5 câu hỏi trắc nghiệm có sẵn của ban tổ chức để trả lời, mỗi câu hỏi có 4 lựa chọn. Khi đó số khả năng xảy ra là 5 × 4 = 20. Ví dụ 10. Người ta phát hành vé số, trên mỗi vé gồm 6 số được chọn từ các chữ số 0, 1, 2, , 9. Hỏi có thể có bao nhiêu tờ vé số được phát hành? 1.3. Hoán vị Cho tập hợp có n phần tử (khác nhau). Mỗi cách sắp xếp n phần tử theo một thứ tự được gọi là một hoán vị. Số hoán vị của n phần tử là Pn = n! Quy ước: 0! = 1. Ví dụ 11. Một bàn có 4 học sinh. Hỏi có bao nhiêu cách xếp chỗ ngồi. Mỗi cách sắp xếp chỗ ngồi cho 4 học sinh theo một thứ tự là một hoán vị của 4 phần tử. Số cách xếp chỗ ngồi là số hoán vị của 4 phần tử P4 = 4! = 24. 1.4. Chỉnh hợp Cho tập hợp có n phần tử (khác nhau). Mỗi nhóm k phần tử (1 ≤ k ≤ n) có thứ tự của tập hợp này được gọi là một chỉnh hợp chập k của n. Số chỉnh hợp chập k của n phần tử là n! Ak = . n (n − k)! Quy ước: 0 An = 1. Ví dụ 12. Có thể lập được bao nhiêu số tự nhiên gồm 3 chữ số khác nhau từ các số 1, 2, 3, 4, 5. Trang 11
Mỗi một số tự nhiên có 3 chữ số khác nhau tạo thành từ các chữ số 1, 2, 3, 4, 5 là một chỉnh hợp chập 3 của 5. Số các số tự nhiên có 3 chữ số khác nhau tạo thành từ các chữ 5! số 1, 2, 3, 4, 5 là: A3 = = 20. 5 (5 − 3)! Ví dụ 13. Có thể lập được bao nhiêu số tự nhiên gồm 4 chữ số khác nhau từ các số 0, 1, 2, , 6. 1.5. Tổ hợp Cho tập hợp có n phần tử (khác nhau). Mỗi nhóm k phần tử (1 ≤ k ≤ n) của tập hợp này được gọi là một tổ hợp chập k của n. Số tổ hợp chập k của n phần tử là n! Ck = . n k!(n − k)! Ví dụ 14. Một hộp đựng 9 thẻ, các thẻ được đánh số 1, 2, , 9. Có bao nhiêu cách chọn 3 thẻ từ 9 thẻ trên (không phân biệt thứ tự của các thẻ)? Vì không phân biệt thứ tự của các thẻ trong mỗi lần chọn nên mỗi cách chọn một bộ 3 gồm 3 thẻ từ 9 thẻ là một tổ hợp chập 3 của 9. Số cách chọn một bộ 3 thẻ từ 9 thẻ là C9 . Ví dụ 15. Một lớp học có 30 học sinh nam và 20 học sinh nữ. Cần lập ra một đội văn nghệ gồm 5 nam và 5 nữ từ các học sinh nói trên. Hỏi có bao nhiêu cách thực hiện việc này. Tính chất k n−k Cn = Cn k k k−1 Cn+1 = Cn + Cn (Hằng đẳng thức Pascal). 1.6. Nhị thức Newton Nhị thức Newton n n X k n−k k 0 n 1 n−1 2 n−2 2 n−1 n−1 n n (a + b) = Cna b = Cna + Cna b + Cna b + + Cn ab + Cn b . k=0 Trang 12
Tam giác Pascal n = 0 : 1 n = 1 : 1 1 n = 2 : 1 2 1 n = 3 : 1 3 3 1 n = 4 : 1 4 6 4 1 n = 5 : 1 5 10 10 5 1 n = 6 : 1 6 15 20 15 6 1 n = 7 : 1 7 21 35 35 21 7 1 Ví dụ 16. Cho tập hợp có n phần tử. Có bao nhiêu tập hợp con của tập hợp trên? Giả sử tập hợp A có n phần tử. Vì các phần tử trong một tập hợp không phân biệt thứ tự nên mỗi tập hợp con gồm k phần tử (0 ≤ k ≤ n) của A là một tổ hợp chập k của n k và số cách chọn một tập hợp con gồm k phần tử từ n phần tử của A là Cn. Vì vậy số tập hợp con của A là 0 1 2 n n n Cn + Cn + Cn + Cn = (1 + 1) = 2 . Trang 13
Bảng tóm tắt Đại số tổ hợp Trang 14
2. Các khái niệm 2.1. Phép thử và biến cố Xét việc tung một đồng xu cân đối, đồng chất trên mặt phẳng nằm ngang (điều kiện nhất định) thì thường chỉ có 2 khả năng xảy ra: hoặc xuất hiện mặt ngửa "N" (mặt ngửa là mặt hiện giá trị của đồng xu) hoặc xuất hiện mặt sấp "S". Việc xuất hiện mặt sấp hay ngửa là ngẫu nhiên (không dự đoán trước được). Tập hợp các trường hợp xảy ra {S, N} được gọi là không gian mẫu và việc tung đồng xu với các điều kiện trên gọi là phép thử ngẫu nhiên. Phép thử ngẫu nhiên được xem như là một quá trình thực hiện một nhóm các điều kiện và quan sát hiện tượng mà kết quả của nó không đoán trước được. Tập hợp các kết quả có thể xảy ra của một phép thử gọi là không gian mẫu, kí hiệu Ω. Ví dụ 17. Trong phép thử tung hai đồng xu, nếu xét kết quả xuất hiện là mặt "sấp" S hay "ngửa" N thì không gian mẫu sẽ là Ω = {SS,SN,NS,NN}. Người ta quy ước mặt "ngửa" là mặt hiện giá trị của đồng xu và mặt "sấp" là phía ngược lại. Ví dụ 18. Tuy nhiên nếu ta quan tâm đến tổng số mặt sấp S xuất hiện trong phép thử tung hai đồng xu thì không gian mẫu sẽ là Ω = {0; 1; 2}. Ví dụ 19. Nếu người ta thực hiện tung một đồng xu cho đến khi xuất hiện mặt sấp S thì không gian mẫu của phép thử này sẽ là Ω = {1; 2; 3; 4; }. Ví dụ 20. Xét phép thử tung 2 con xúc sắc cân đối, đồng chất. Xác định không gian mẫu của phép thử. Biến cố là một tập hợp con của không gian mẫu. Người ta thường kí hiệu các biến cố bằng các chữ cái in hoa: A, B, C, Biến cố A gọi là biến cố sơ cấp nếu A chỉ chứa một phần tử của không gian mẫu Ω. Ví dụ 21. Trong ví dụ 17, biến cố "có ít nhất một mặt sấp" là A = {SS, SN, NS} Trang 15
Ví dụ 22. Trong ví dụ 17, các biến cố sơ cấp là A1 = {SS},A2 = {SN},A3 = {NS},A4 = {NN} Biến cố chắc chắn là biến cố luôn xảy ra. Không gian mẫu là Ω là biến cố chắc chắn. Biến cố không thể là biến cố không thể xảy ra, kí hiệu ∅. Ví dụ 23. Bảng số liệu về trình độ học vấn và giới tính của 26293 người tuổi từ 18 trở lên trong Điều tra mức sống của dân cư một vùng trong năm 2006 được thể hiện như sau: Chọn ngẫu nhiên một người trong mẫu này. Hãy xác định không gian mẫu và các biến cố sơ cấp. 2.2. Quan hệ của các biến cố 2.2.1. Biến cố tích (biến cố giao) Tich của hai biến cố A và B, kí hiệu A ∩ B hoặc A.B, là biến cố "A và B đồng thời xảy ra". Ví dụ 24. Xét phép thử tung hai đồng xu. Gọi A là biến cố "xuất hiện mặt sấp ở đồng xu thứ nhất", B là biến cố "xuất hiện mặt sấp ở đồng xu thứ hai". Khi đó A ∩ B là biến cố "xuất hiện mặt sấp ở cả hai đồng xu". Trang 16
Ví dụ 25. Một lớp có 30 sinh viên biết ít nhất một trong hai ngoại ngữ Anh văn hoặc Pháp văn, trong đó có 20 sinh viên giỏi Anh văn, 15 sinh viên giỏi Pháp văn. Hỏi có bao nhiêu sinh viên giỏi cả hai môn. Tổng quát n Q Tích của n biến cố A1,A2, , An, kí hiệu là Ai = A1.A2 An, là biến cố "A1,A2, , An i=1 đồng thời xảy ra". 2.2.2. Biến cố hợp Hợp của hai biến cố A và B, kí hiệu A ∪ B, là biến cố "ít nhất một trong hai biến cố A, B xảy ra". Trong trường hợp A.B = ∅ thì ta dùng kí hiệu A + B thay cho A ∪ B. Ví dụ 26. Xét phép thử tung ba đồng xu. Gọi A là biến cố "xuất hiện đúng hai mặt sấp trong ba đồng xu", B là biến cố "xuất hiện mặt sấp ở cả ba đồng xu". Khi đó A ∪ B là biến cố "có ít nhất hai mặt sấp trong ba đồng xu". Tổng quát n S Hợp của n biến cố A1,A2, , An, kí hiệu là Ai = A1 ∪ A2 ∪ ∪ An, là biến cố "ít nhất i=1 một trong các biến cố a1,A2, , An xảy ra". 2.2.3. Biến cố xung khắc Biến cố A và B gọi là xung khắc nếu chúng không đồng thời xảy ra trong một phép thử, nghĩa là A ∩ B = ∅. Trang 17
Ví dụ 27. Xét phép thử trong ví dụ 26. Biến cố A ∩ B = ∅ nên A và B là hai biến cố xung khắc Ví dụ 28. Xét phép thử tung một con xíuc sắc cân đối đồng chất. Các biến cố nào sau đây là xung khắc với nhau? A là biến cố "xuất hiện mặt chẵn". B là biến cố "xuất hiện mặt nhị". C là biến cố "xuất hiện mặt lẻ". D là biến cố "xuất hiện mặt nhất hoặc tam". 2.2.4. Biến cố kéo theo Biến cố A gọi là kéo theo biến cố B, kí hiệu A ⊂ B, nếu A xảy ra thì B xảy ra. Ví dụ 29. Xét phép thử tung hai đồng xu, B là biến cố "mặt sấp xuất hiện ít nhất một lần" và A là biến cố "mặt sấp xuất hiện trong cả 2 lần tung đồng xu". Khi đó nếu biến cố A xảy ra thì biến cố B cũng xảy ra (A ⊂ B). Do đó biến cố A là kéo theo biến cố B. 2.2.5. Biến cố bù (biến cố đối lập) Biến cố bù của biến cố A, kí hiệu A hoặc Ac, là biến cố "A không xảy ra". Ví dụ 30. Xét phép thử tung một đồng xu 2 lần và A là biến cố "mặt sấp S xuất hiện ít nhất một lần". Khi đó biến cố bù A là biến cố "mặt sấp không xuất hiện trong cả 2 lần tung đồng xu". Ví dụ 31. Bắn lần lượt ba viên đạn vào một bia. Gọi Ai là biến cố "viên đạn thứ i trúng bia" (i = 1, 2, 3). Khi đó biến cố 1. "có đúng một viên đạn trúng bia" là A = A1.A2.A3 ∪ A1.A2.A3 ∪ A1.A2.A3. Trang 18
2. "có đúng hai viên đạn trúng bia" là B = A1A2A3 ∪ A1A2A3 ∪ A1A2A3. 3. "có 3 viên đạn trúng bia" là C = A1A2A3. 4. "không có viên đạn nào trúng bia" là D = A1.A2.A3. 2.2.6. Một vài tính chất Giả sử A, B, C là các biến cố trong không gian mẫu Ω. Khi đó ta có các tính chất sau: 1. Tính chất giao hoán A.B = B.A và A ∪ B = B ∪ A. 2. Tính chất kết hợp (A.B).C = A.(B.C) và (A ∪ B) ∪ C = A ∪ (B ∪ C). 3. Luật De-Morgan A ∪ B = A.B. A.B = A + B. A1 ∪ A2 ∪ ∪ An = A1.A2 An. A1.A2 An = A1 ∪ A2 ∪ An. 4. A + A = Ω và A.A = ∅. 3. Xác suất và công thức tính Xác suất là một đại lượng thể hiện mức độ xảy ra (thường xuyên hay ít khi) của một biến cố. Số gán cho biến cố A, kí hiệu là P (A), gọi là xác suất của biến cố A. 3.1. Định nghĩa xác suất 3.1.1. Định nghĩa xác suất theo quan điểm cổ điển Giả sử không gian mẫu Ω của một phép thử gồm có n(Ω) biến cố sơ cấp, các biến cố sơ cấp này là đồng khả năng và biến cố A gồm có n(A) biến cố sơ cấp (n(A) là số phần tử của A). Khi đó xác suất của biến cố A là số n(A) P (A) = . n(Ω) Trang 19
Ví dụ 32. Xét phép thử tung hai đồng xu cân đối, đồng chất trong ví dụ 17 và A là biến cố "có đúng một mặt sấp S", nghĩa là A = {SN, NS}. Khi đó xác suất của biến cố A là n(A) 2 1 P (A) = = = . n(Ω) 4 2 Ví dụ 33. Xét phép thử tung 2 con xúc sắc (6 mặt) cân đối, đồng chất. Tính xác suất a) Để xuất hiện 2 mặt giống nhau. b) Để tổng số nốt xuất hiện là chẵn. c) Để tổng số nốt xuất hiện là bội của 3. Tham khảo cách liệt kê của ví dụ 20. Ví dụ 34. Một nhóm học sinh gồm 3 nam và 4 nữ xếp thành một hàng dài. Hãy tính xác suất để 3 bạn nam a) Xếp hàng cạnh nhau. b) Xếp hàng không có ai đứng cạnh nhau. c) Xếp hàng không đứng cạnh nhau. Nếu xếp 3 bạn nam và 4 bạn nữ một cách tùy ý thì mỗi cách xếp là một hoán vị của 7 người nên có 7! cách xếp. a) Đối với yêu cầu xếp 3 bạn nam đứng cạnh nhau, chúng ta thực hiện như sau: • Giai đoạn một, xem 3 bạn nam là một nhóm, và hoán vị 4 bạn nữ và một nhóm nam, số cách xếp là 5! cách. • Giai đoạn hai, hoán vị chỗ của 3 bạn nam, số cách xếp là 3! cách. Vậy số cách xếp 3 bạn nam cạnh nhau là 3! × 5!. Khi đó xác suất để 3 bạn nam 3! × 5! 1 đứng cạnh nhau là = . 7! 7 Trang 20
b) Đối với yêu cầu xếp 3 bạn nam không có ai đứng cạnh nhau, chúng ta thực hiện như sau: • Giai đoạn một, hoán vị 4 bạn nữ, số cách xếp là 4! cách. • Giai đoạn hai, xếp 3 bạn nam vào các chỗ trống giữa hai bạn nữ hoặc hai đầu dãy (minh họa bằng hình dưới, các ô tròn tượng trưng cho các bạn nữ) Vì yêu cầu các bạn nam không có ai xếp hàng cạnh nhau nên giữa hai bạn nữ chỉ xếp được một nam và mỗi đầu dãy chỉ xếp được một nam. Như vậy có 5 vị trí có thể xếp được các bạn nam vào đó. Do chỉ có 3 bạn nam và các 3 cách xếp phân biệt thứ tự nên số cách xếp 3 nam vào 5 vị trí là A5 cách. 3 Vậy số cách xếp 3 nam không đứng cạnh nhau là 4!×A5 và xác suất để 3 bạn nam 4! × A3 2 không đứng cạnh nhau là 5 = . 7! 7 Lưu ý: Trong ví dụ 34 các biến cố A "3 bạn nam xếp hàng cạnh nhau" và B "3 bạn nam không có ai xếp hàng cạnh nhau" không phải là hai biến cố xung khắc. 3.1.2. Định nghĩa xác suất theo quan điểm thống kê Trong thực tiễn nhiều khi chúng ta không thể xác định được số phần tử n(Ω) của không gian mẫu Ω, số phần tử n(A) của biến cố A hoặc việc xác định các thông số trên là có thể nhưng khó khăn hoặc gây thiệt hại về kinh tế (chẳng hạn như: xác định tỉ lệ (xác suất) hộp sữa hỏng trong một kho, xác định xác suất bắn trúng mục tiêu của một xạ thủ, ). Do đó người ta đưa một cách tính xác suất theo quan điểm thống kê như sau: Giả sử một phép thử được tiến hành N lần và biến cố A xuất hiện m lần. Xác suất của biến cố A theo quan điểm thống kê là số P (A) = lim fA, N→+∞ m trong đó fA = , số này gọi là tần suất của biến cố A. N Ví dụ 35. Xét phép thử tung một con súc sắc cân đối, đồng chất và A là biến cố "xuất hiện mặt một chấm". Thực hiện phép thử 30 lần và 600 lần, ta thu được 2 bảng sau: Dấu hiệu (số chấm) 1 2 3 4 5 6 Tần số 4 5 4 7 4 6 n = 30 Trang 21
Dấu hiệu (số chấm) 1 2 3 4 5 6 Tần số 96 107 98 103 97 99 n = 600 4 Tần suất của biến cố A lần lượt trong hai lần thực hiện là f = ≈ 0, 13333 (tương ứng với A 30 96 1 việc thực hiện phép thử 30 lần) và f = = 0, 16 ≈ (tương ứng với việc thực hiện phép A 600 6 thử 600 lần). So sánh hai kết quả trên, ta nhận thấy việc thực hiện phép thử 600 lần cho kết quả tần suất gần với xác suất định kiến của biến cố A hơn. Trong thực tế nếu số lần thực hiện phép thử lớn thì ta có thể xem tần suất của biến cố A là xác suất của biến cố A. 3.1.3. Định nghĩa xác suất theo quan điểm hình học Giả sử một điểm được gieo ngẫu nhiên vào một miền D và A là một miền con của D. Khi đó xác suất của biến cố "điểm đó rơi vào miền A" là S(A) P (A) = , S(D) trong đó S(.) là số đo miền (.) (số đo có thể là độ dài, diện tích, thể tích ). Ví dụ 36. Gieo ngẫu nhiên một điểm M vào trong hình vuông có cạnh là a. Tìm xác suất để điểm đó rơi vào hình tròn nội tiếp hình vuông. Gọi A là biến cố điểm M rơi vào hình tròn nội tiếp hình vuông. Khi đó a2 π × Shình tròn 2 π P (A) = = 2 = . Shình vuông a 4 Ví dụ 37. Hai người hẹn gặp nhau tại một địa điểm vào khoảng từ 11 giờ đến 12 giờ. Họ quy ước rằng người đến trước sẽ chỉ đợi 20 phút, nếu không gặp sẽ bỏ đi. Giả sử việc đến điểm hẹn của mỗi người là ngẫu nhiên. Tìm xác suất để hai người gặp nhau. Trang 22
Gọi x, y là thời điểm đến điểm hẹn của người thứ nhất và người thứ hai (x, y tính theo đơn vị là phút). Để đơn giản ta giả sử 0 ≤ x ≤ 60; 0 ≤ y ≤ 60 (thay vì 11 ≤ x ≤ 12; 11 ≤ y ≤ 12 và x, y tính theo đơn vị giờ). Biểu diễn x, y lên mặt phẳng tọa độ Oxy. Không gian mẫu là tập hợp các điểm của một hình vuông Ω = {(x; y)0 ≤ x ≤ 60; 0 ≤ y ≤ 60}. Đặt A là biến cố "hai người gặp nhau". Vì hai người chỉ gặp nhau khi thời điểm đến điểm hẹn của cả hai không lệch quá 20 phút, nghĩa là |x − y| ≤ 20, do đó A chính là tập hợp các điểm trong phần tô đậm, A = {(x; y) ∈ Ω|x − y| ≤ 20}. Xác suất để hai người gặp nhau là S(A) 602 − 402 5 P (A) = = = . S(Ω) 602 9 3.2. Các tính chất của xác suất Định lý 1.1. Giả sử một phép thử có không gian mẫu là Ω và A là một biến cố. Khi đó 1. 0 ≤ P (A) ≤ 1. 2. P (Ω) = 1. 3. P (∅) = 0. 4. Nếu A ⊂ B thì P (A) ≤ P (B). 5. Giả sử biến cố A có biến cố bù là A. Khi đó P (A) = 1 − P (A). Trang 23
Ví dụ 38. Xét phép thử tung một đồng xu 4 lần và A là biến cố "có ít nhất một mặt sấp". Trong phép thử này việc xác định trực tiếp biến cố A tương đối phức tạp, trong khi việc xác định biến cố bù của A là A = {NNNN}, đơn giản hơn. Không gian mẫu Ω có n(Ω) = 24 và 1 15 do đó P (A) = . Vậy P (A) = 1 − P (A) = . 24 16 Ví dụ 39. Giả sử ba xạ thủ bắn độc lập vào một mục tiêu. Xác suất bắn trúng của mỗi xạ thủ lần lượt là 0, 8; 0, 7; 0, 6. Hãy tính xác suất để có ít nhất một xạ thủ băn trúng đích. 3.3. Một số quy tắc tính xác suất 3.3.1. Quy tắc cộng xác suất Quy tắc cộng đơn giản Định lý 1.2. Nếu A, B là các biến cố xung khắc, thì P (A + B) = P (A) + P (B). Ví dụ 40. Xét phép thử tung một đồng xu 4 lần. Gọi A là biến cố "mặt sấp S xuất hiện ít nhất ba lần". Tìm xác suất của biến cố A. Trong phép thử này, không gian mẫu Ω là Ω = {0, 1, 2, 3, 4} (i là số lần xuất hiện mặt sấp, i = 0 4). Khi đó biến cố A là hợp của hai biến cố A1 "mặt sấp xuất hiện 3 lần" và A2 "mặt sấp xuất hiện 4 A3 1 1 1 lần". Hai biến cố A ,A là hai biến cố xung khắc và P (A ) = 4 = , P (A ) = = . 1 2 1 3! × 24 4 2 24 16 Theo định lý 1.2 xác suất của biến cố A, là 1 1 5 P (A) = P (A ∪ A ) = P (A ) + P (A ) = + = . 1 2 1 2 4 16 16 Định lý 1.3. Nếu A1,A2, , An là các biến cố xung khắc nhau đôi một thì n n X X P Ai = P (Ai) i=1 i=1 Ví dụ 41. Ba xạ thủ bắn độc lập vào một mục tiêu với xác suất trúng đích lần lượt là 0, 9; 0, 8; 0, 7. Hãy tính xác suất để chỉ có một xạ thủ trúng đích. Trang 24
Quy tắc cộng tổng quát Định lý 1.4. Nếu A, B là hai biến cố bất kì, thì P (A ∪ B) = P (A) + P (B) − P (A.B). Ví dụ 42. Xét phép thử chọn ngẫu nhiên một lá từ bộ bài 52 lá. Đặt A là biến cố "lá được chọn là K đỏ hoặc quân cơ". Biến cố A xem như là hợp của hai biến cố A1 "lá được chọn là K đỏ" và A2 "lá được chọn là quân cơ". Hai biến cố A1,A2 không xung khắc nhau, xác suất 2 13 1 P (A ) = , P (A ) = và P (A ∩ A ) = . Theo định lý 1.4 xác suất của biến cố A, là 1 52 2 52 1 2 52 14 7 P (A) = P (A ∪ A ) = P (A ) + P (A ) − P (A .A ) = = . 1 2 1 2 1 2 52 26 Ví dụ 43. Xét phép thử tung hai con xúc xắc cân đối, đồng chất. Gọi A là biến cố "tổng số nốt xuất hiện là một số chia hết cho 4 hoặc chia hết cho 6". Biến cố A có thể xem là hợp của hai biến cố A1 "tổng số nốt xuất hiện chia hết cho 4" và A2 "tổng số nốt xuất hiện chia hết cho 6". Hai biến cố A1,A2 rõ ràng là không xung khắc và xác suất Định lý 1.5. Với mọi biến cố A, B, C, P (A ∪ B ∪ C) = P (A) + P (B) + P (C) − P (A.B) − P (B.C) − P (C.A) + P (A.B.C). Ví dụ 44. Một lớp có 50 sinh viên, mỗi sinh viên đều biết ít nhất một ngoại ngữ. Biết rằng có 25 sinh viên biết tiếng Anh, 20 sinh viên biết tiếng Hoa, 15 sinh viên biết tiếng Pháp, 5 sinh viên biết hai ngoại ngữ Anh và Hoa, 4 sinh viên biết hai ngoại ngữ Anh và Pháp, 3 sinh viên biết ba ngoại ngữ Pháp và Hoa. Chọn ngẫu nhiên một sinh viên trong lớp. Hãy tính xác suất để sinh viên được chọn biết cả ba ngoại ngữ Anh, Pháp, Hoa. Định lý 1.6. Với mọi biến cố A, B, C, D, P (A ∪ B ∪ C ∪ D) = P (A) + P (B) + P (C) − P (A.B) − P (A.C) − P (A.D) − P (B.C) − P (B.D) − P (C.D) + P (A.B.C) + P (A.B.D) + P (A.C.D) + P (B.C.D) − P (A.B.C.D). Trang 25
Công thức cộng tổng quát cho trường hợp n biến cố tùy ý A1,A2, An cũng có quy luật tương tự như trên. 3.3.2. Quy tắc nhân xác suất Một hộp chứa 10 quả bóng khác nhau được đánh số từ 1, , 10. Xét phép thử lấy ngẫu nhiên lần lượt 2 quả bóng trong hộp (mỗi lần lấy xong bóng nào thì trả lại ngay bóng đó vào hộp). Gọi A là biến cố "lấy được bóng số 1 ở lần thứ nhất" và B là biến cố "lấy được bóng số 1 ở lần thứ hai". Trong phép thử này ta thấy kết quả của biến cố A và B không phụ thuộc nhau, nghĩa là xác suất của biến cố B không bị ảnh hưởng bởi việc xuất hiện hay không xuất hiện biến cố A. Người ta nói A và B là hai biến cố độc lập nhau. Định nghĩa 1.1. Hai biến cố A và B được gọi là độc lập với nhau nếu xác suất của biến cố này không phụ thuộc vào việc xuất hiện hay không xuất hiện của biến cố kia. Định nghĩa 1.2. Ba biến cố A, B, C được gọi là độc lập nếu các cặp biến cố sau là độc lập: A và B, B và C, A và C, A và B.C, B và A.C, C và A.B. Định lý 1.7. Hai biến cố A, B độc lập khi và chỉ khi P (A.B) = P (A)P (B). Định lý 1.8. Nếu ba biến cố A, B, C độc lập thì P (A.B.C) = P (A).P (B).P (C) Ví dụ 45. Một hộp có tám thẻ khác nhau được đánh số từ 1 đến 8. Chọn ngẫu nhiên lần lượt hai thẻ (mỗi lần lấy xong thẻ nào thì trả lại ngay thẻ đó vào hộp). Gọi A là biến cố "lấy được thẻ đánh số chẵn ở lần thứ nhất" và B là biến cố "lấy được thẻ đánh số lẻ ở lần thứ hai". Xác suất 4 1 4 1 của biến cố A là P (A) = = và xác suất của biến cố B là P (B) = = . Vì hai biến cố A 8 2 8 2 và B độc lập với nhau nên xác suất của biến cố "lấy được thẻ đánh số chẵn ở lần thứ nhất và lấy được thẻ đánh số lẻ ở lần thứ hai" là 1 P (A.B) = P (A).P (B) = . 4 Ví dụ 46. Có hai túi đựng các quả cầu giống nhau. Túi thứ nhất có 5 quả cầu trắng, 3 quả cầu đỏ. Túi thứ hai có 8 quả cầu trắng, 4 quả cầu đỏ. Lấy ngẫu nhiên ở mỗi túi một quả cầu. Hãy tính xác suất để lấy được hai quả cầu cùng màu. Định lý 1.9. Hai biến cố A, B độc lập khi và chỉ khi các cặp biến cố sau cũng độc lập Trang 26
1. A và B. 2. A và B. 3. A và A. 3.4. Xác suất có điều kiện 3.4.1. Định nghĩa và công thức tính Một hộp có 10 quả bóng khác nhau gồm 4 bóng vàng, 3 bóng đỏ và 3 bóng trắng. Lấy ngẫu nhiên lần lượt hai bóng (mỗi lần lấy xong không trả lại bóng vào hộp). Đặt A1 là biến cố "lấy được bóng màu vàng ở lần thứ nhất" và A2 là biến cố "lấy được bóng màu 0 vàng ở lần thứ hai". Gọi A1 là biến cố bù của biến cố A1. Bảng sau mô tả xác suất xảy ra biến cố A2 trong các trường hợp A1 xảy ra hay không xảy ra. 0 A1 A1 Số bóng vàng còn lại 3 4 Số bóng còn lại 9 9 1 4 P (A ) 2 3 9 Như vậy xác suất xảy ra biến cố A2 phụ thuộc vào việc xuất hiện hay không xuất hiện biến cố A1. Trong trường hợp này ta dùng kí hiệu P (A2|A1) (thay vì dùng kí hiệu P (A2)) 0 để chỉ xác suất xảy ra biến cố A2 khi A1 đã xảy ra và kí hiệu P (A2|A1) để chỉ xác suất xảy ra biến cố A2 khi A1 không xảy ra. Các xác suất này được gọi là xác suất có điều kiện. Định nghĩa 1.3. Xác suất có điều kiện của biến cố A khi biến cố B đã xảy ra (P (B) 6= 0) là P (A ∩ B) P (A|B) = . P (B) Ví dụ 47. Trong cuộc khảo sát về một quy định mới, người ta hỏi 500 người bao gồm 240 nam, 260 nữ của một vùng và thu được kết quả "có 136 nam và 224 nữ trả lời tán thành". a) Giả sử bạn gặp một người nữ trong số những người này. Hãy tính xác suất để câu trả lời của người đó là "tán thành". b) Giả sử bạn gặp một người có câu trả lời là "tán thành". Hãy tính xác suất để người đó là nam. Kết quả của cuộc khảo sát trên được mô tả tóm tắt bằng bảng sau Trang 27
Tán thành Không tán thành Tổng số Nam 136 104 240 Nữ 224 36 260 Tổng số 360 140 500 a) Gọi A là biến cố "gặp người nữ" và B là biến cố "câu trả lời là tán thành". Khi đó 224 56 xác suất cần tính là P (B|A). Theo bảng số liệu trên ta có P (A ∩ B) = = 500 125 260 13 P (A ∩ B) 56 và P (A) = = . Vậy P (B|A) = = . 500 25 P (A) 65 b) Gọi A là biến cố "gặp người nữ" và B là biến cố "câu trả lời là tán thành". Khi đó 136 34 xác suất cần tính là P (A0|B). Theo bảng số liệu trên ta có P (A0 ∩ B) = = 500 125 360 18 P (A0 ∩ B) 17 và P (B) = = . Vậy P (A0|B) = = . 500 25 P (B) 45 Ví dụ 48. Một lô hàng có 20 sản phẩm, trong đó có 2 sản phẩm xấu. Chọn lần lượt mỗi lần một sản phẩm (không hoàn lại) cho đến khi có đủ 2 sản phẩm xấu được chọn thì dừng. Hãy tính xác suất để quá trình chọn trên dừng lại ở lần thứ 3. 3.4.2. Quy tắc nhân xác suất tổng quát Định lý 1.10. Với mọi biến cố A, B, P (A.B) = P (B).P (A|B) = P (A).P (B|A). Định lý 1.11. Với mọi biến cố A, B, C, P (A.B.C) = P (A).P (B|A).P (C|A.B). Ví dụ 49. Một lô hàng có 20 sản phẩm, trong đó có 3 phế phẩm. Lấy ngẫu nhiên lần lượt hai sản phẩm, mỗi lần lấy một sản phẩm và không hoàn lại. Tính xác suất để lấy được 2 phế phẩm. Gọi Ai(i = 1, 2) là biến cố "lấy được phế phẩm ở lần thứ i". Xác suất cần tính là 3 2 3 P (A1.A2). Ta có P (A1) = và P (A2|A1) = . Vậy P (A1.A2) = . 20 19 190 Ví dụ 50. Có 8 quả bóng gồm 2 bóng đỏ và 6 bóng trắng (giống hệt nhau), được phân phối ngẫu nhiên vào 2 hộp, mỗi hộp 4 bóng. Tìm xác suất để mỗi hộp đều có bóng đỏ. Trang 28
Vì số bóng đỏ là 2 nên mỗi hộp chỉ có 1 bóng đỏ. Gọi Ai (i = 1, 2) là biến cố "hộp thứ i có 1 bóng đỏ". Xác suất cần tính là P (A1.A2). Xác suất để hộp thứ nhất có 1 bóng đỏ là 1 3 C2 × C6 4 4 P (A1) = 4 = và P (A2|A1) = 1. Vậy P (A1.A2) = P (A1).P (A2|A1) = . C8 7 7 3.5. Công thức xác suất đầy đủ Định nghĩa 1.4. Một họ các biến cố A1,A2, , An được gọi là đầy đủ nếu chúng xung khắc đôi một và hợp của chúng là biến cố chắc chắn, nghĩa là n [ Ai ∩ Aj = ∅ với mọi i 6= j và Ai = Ω. i=1 Ví dụ 51. Xét phép thử tung một con xúc xắc (6 mặt) cân đối, đồng chất. Gọi A1 là biến cố "xuất hiện mặt chẵn", A2 là biến cố "xuất hiện mặt lẻ". Ta dễ dàng kiểm tra được A1,A2 xung khắc nhau và A1 ∪ A2 = Ω, vì vậy họ hai biến cố A1,A2 là một họ đầy đủ. Ví dụ 52. Một hộp phấn có 5 viên phấn trắng, 3 viên phấn xanh, 2 viên phấn đỏ. Lấy ngẫu nhiên cùng lúc 2 viên phấn ra xem màu. Gọi A1 là biến cố "lấy được 2 viên phấn trắng", A2 là biến cố "lấy được 2 viên phấn đỏ", A3 là biến cố "lấy được 2 viên phấn xanh", A4 là biến cố "lấy được 2 viên phấn khác màu". Hỏi họ 4 biến cố A1,A2,A3,A4 có phải là một họ đầy đủ hay không? Vì sao? Định lý 1.12 (Công thức xác suất đầy đủ). Nếu họ các biến cố B1,B2, , Bn là đầy đủ thì với mọi biến cố A, n X P (A) = P (Bi).P (A|Bi). i=1 Trang 29
Ví dụ 53. Có 3 hộp đựng các sản phẩm mô tả bởi bảng sau 5 phế phẩm 10 phế phẩm 5 phế phẩm 20 sản phẩm tốt 25 sản phẩm tốt 35 sản phẩm tốt Hộp 1 Hộp 2 Hộp 3 Lấy ngẫu nhiên một hộp và chọn trong hộp đó một sản phẩm. Tìm xác suất để lấy được phế phẩm. Gọi Bi (i = 1, 2, 3) là biến cố "chọn hộp thứ i". Các biến cố B1,B2,B3 xung khắc nhau đôi một và biến cố B1 ∪ B2 ∪ B3 là một biến cố chắc chắn. Như vậy họ gồm ba biến cố B1,B2,B3 là một họ đầy đủ. Đặt A là biến cố "chọn được phế phẩm". Khi đó xác suất cần tính là P (A) = P (B1).P (A|B1) + P (B2).P (A|B2) + P (B3).P (A|B3). Dựa vào bảng số liệu, ta có 1 P (B ) = P (B ) = P (B ) = 1 2 3 3 5 10 5 P (A|B ) = ,P (A|B ) = ,P (A|B ) = 1 25 2 35 3 40 57 Khi đó P (A) = . 280 Ví dụ 54. Một nông trường có 4 đội sản xuất. Đội một sản xuất được một lượng hàng hóa 1 1 bằng sản lượng của nông trường, đội hai sản xuất được một lượng hàng hóa bằng sản 3 4 1 lượng của nông trường, đội ba sản xuất được một lượng hàng hóa bằng sản lượng của nông 6 trường. Tỉ lệ phế phẩm tương ứng của bốn đội là 0, 15; 0, 08; 0, 05; 0, 01. Lấy ngẫu nhiên một sản phẩm trong kho của nông trường. Tìm xác suất để lấy được một phế phẩm. Gọi B1,B2,B3,B4 tương ứng là biến cố "chọn đội 1", "chọn đội 2", "chọn đội 3", "chọn đội 4" và A là biến cố "chọn được phế phẩm". Họ B1,B2,B3,B4 xung khắc nhau đôi một và có hợp B1 ∪ B2 ∪ B3 ∪ B4 là một biến cố chắc chắn do đó nó là một họ đầy đủ. Khi đó xác suất cần tính là P (A) =P (B1).P (A|B1) + P (B2).P (A|B2) + P (B3).P (A|B3) + P (B4).P (A|B4) 1 1 1 1 = × 0, 15 + × 0, 08 + × 0, 05 + × 0, 01 3 4 6 4 97 = . 1200 Trang 30
3.6. Công thức Bayes Định lý 1.13. Nếu họ các biến cố B1,B2, , Bn là đầy đủ thì với mọi biến cố A, P (Bj)P (A|Bj) P (Bj|A) = n . P P (Bi)P (A|Bi) i=1 Ví dụ 55. Có 3 hộp đựng các sản phẩm mô tả bởi bảng sau 5 phế phẩm 10 phế phẩm 5 phế phẩm 20 sản phẩm tốt 25 sản phẩm tốt 35 sản phẩm tốt Hộp 1 Hộp 2 Hộp 3 Lấy ngẫu nhiên một hộp và chọn trong hộp đó một sản phẩm. Tìm xác suất để lấy được phế phẩm của hộp thứ nhất. Gọi Bi (i = 1, 2, 3) là biến cố "chọn hộp thứ i". Các biến cố B1,B2,B3 xung khắc nhau đôi một và biến cố B1 ∪ B2 ∪ B3 là một biến cố chắc chắn. Như vậy họ gồm ba biến cố B1,B2,B3 là một họ đầy đủ. Đặt A là biến cố "chọn được phế phẩm". Khi đó xác suất Trang 31
cần tính là P (B )P (A|B ) P (B |A) = 1 1 1 P3 i=1 P (Bi)P (A|Bi) 1 5 × = 3 25 1 5 1 10 1 5 × + × + × 3 25 3 35 3 40 56 = . 171 Ví dụ 56. Một xét nghiệm y học về bệnh X có tính chất sau 1. Nếu người được xét nghiệm có bệnh X thì phép thử cho kết quả dương tính với xác suất 0, 92. 2. Nếu người được xét nghiệm không có bệnh X thì phép thử vẫn có thể cho kết quả dương tính với xác suất 0, 04. Giả sử tỉ lệ mắc bệnh X là 0, 1% trên toàn bộ dân số. Nếu một người đi xét nghiệm và kết quả là dương tính thì xác suất để người đó mắc bệnh X là bao nhiêu? Gọi A là biến cố "người được xét nghiệm mắc phải bệnh X" và B là biến cố "kết quả xét nghiệm là dương tính". Kết quả của phép thử trên có thể mô tả tóm tắt bằng bảng sau A A Kết quả xét nghiệm L 0, 92 0, 04 Từ tỉ lệ mắc bệnh X trong toàn bộ dân số là 0, 1% ta có P (A) = 0, 001,P (A) = 0, 999. Từ các giả thiết 1 và 2 ta có P (B|A) = 0, 92,P (B|A) = 0, 04. Xác suất cần tìm là P (A).P (B|A) P (A|B) = = 0, 0225. P (A).P (B|A) + P (A).P (B|A) Như vậy trong trường hợp kết quả thử nghiệm là dương tính thì xác suất mắc phải bệnh X là 2, 25%. Ví dụ 57. Một cửa hàng bán máy tính xách tay chuyên kinh doanh 3 loại nhãn hiệu Dell, Toshiba và IBM. Trong cơ cấu bán hàng, tỉ lệ máy Dell là 40%, tỉ lệ máy Toshiba là 30% và phần còn lại là máy nhãn hiệu IBM. Tất cả các máy tính bán ra tại cửa hàng đều có thời hạn bảo hành là 12 tháng. Chủ cửa hàng cho biết, theo kinh nghiệm kinh doanh, tỉ lệ máy nhãn hiệu Trang 32
Dell phải sửa chữa trong thời gian bảo hành là 10%, tỉ lệ máy nhãn hiệu Toshiba phải sửa chữa trong thời gian bảo hành là 5% và tỉ lệ máy nhãn hiệu IBM phải sửa chữa trong thời gian bảo hành là 4%. Nếu một khách hàng mua một máy tính của cửa hàng. a) Hãy tính xác suất để người đó phải mang máy tính đi sửa chữa trong thời gian bảo hành. b) Giả sử người đó sử dụng máy tính mới được 9 tháng thì phải đem máy đi sửa chữa. Hãy tính xác suất để máy tính này có nhãn hiệu là Toshiba. c) Giả sử người đó sử dụng máy tính mới được 9 tháng thì phải đem máy đi sửa chữa. Hãy tính xác suất để máy tính này không phải của hãng Dell. 4. Dãy phép thử Bernoulli Giả sử một xạ thủ bắn n lần độc lập vào một mục tiêu (mỗi lần một viên đạn) với xác suất trúng đích là p. Trong mỗi lần bắn của xạ thủ chỉ có 2 khả năng đối nhau xảy ra A "trúng mục tiêu" hoặc A "không trúng mục tiêu". Xác suất bắn trúng đích của mỗi lần bắn luôn là p và các phép thử này tiến hành độc lập nhau. Dãy phép thử có tính chất trên được gọi là dãy phép thử Bernoulli. Định nghĩa 1.5. Dãy n phép thử được gọi là dãy phép thử Bernoulli nếu nó thỏa mãn các điều kiện sau (i) Mỗi phép thử có hai biến cố A và A (là biến cố bù của A). (ii) Dãy phép thử là độc lập. (iii) Xác suất xảy ra biến cố A trong dãy phép thử luôn là hằng số, nghĩa là P (A) = p. Định lý 1.14. Xác suất để biến cố A xuất hiện k (0 ≤ k ≤ n) lần trong dãy phép thử Bernoulli là k k n−k Pk = Cnp q với q = 1 − p. Ví dụ 58. Một phân xưởng có 5 máy độc lập nhau. Xác suất để trong một ca mỗi máy bị hỏng là 0, 1. Tìm xác suất để trong một ca có đúng 2 máy bị hỏng. Trang 33
Gọi Ai là biến cố máy thứ i bị hỏng trong ca làm việc (i = 1, 2, , 5). Chúng ta nhận thấy rằng mỗi máy i chỉ có 2 khả năng đối lập xảy ra: hoặc xuất hiện biến cố Ai (nghĩa là máy bị hỏng) hoặc xuất hiện biến cố Ai (nghĩa là máy không bị hỏng). Thêm nữa các máy hoạt động độc lập và có xác suất hỏng luôn là hằng số p = 0, 1. Vì vậy dãy phép thử với 5 máy trên là dãy phép thử Bernoulli. Khi đó xác suất để có đúng 2 máy hỏng trong ca làm việc là 2 2 3 P2 = C5 p q = 0, 0729 Ví dụ 59. Trong một lô thuốc, xác suất để nhận được một lọ thuốc hỏng là p = 0, 1. Lấy ngẫu nhiên 3 lọ để kiểm tra. Hãy tính xác suất để a) Cả ba lọ đều hỏng. b) Có hai lọ hỏng và một lọ tốt. c) Có một lọ hỏng và hai lọ tốt. d) Cả ba lọ đều tốt. Trang 34
Chương 2 Giới thiệu về biến ngẫu nhiên Trong thực tiễn, có nhiều hiện tượng ngẫu nhiên mà kết quả của nó hoặc là các con số, hoặc có thể đặc trưng bởi các con số. Ví dụ "số lần xuất hiện mặt sấp" trong phép thử tung 4 đồng xu, "số lần bắn trúng mục tiêu" trong phép thử bắn n phát đạn, "số xe ghé trạm bơm xăng trong một ngày" Vì vậy, để thuận tiện cho việc nghiên cứu, người ta đưa ra khái niệm biến ngẫu nhiên. 1. Khái niệm về biến ngẫu nhiên Biến ngẫu nhiên X là một ánh xạ cho tương ứng mỗi phần tử e của không gian mẫu Ω với một số thực x. X :Ω → R e 7→ X(e) = x Tập hợp X(Ω) (hoặc Imf(X)) gọi là tập giá trị của biến ngẫu nhiên X. Cũng giống như biến cố ngẫu nhiên, giá trị của biến ngẫu nhiên, X(e), là một số ngẫu nhiên. Ví dụ 60. Xét phép thử tung hai đồng xu. Không gian mẫu là Ω = {SS,SN,NS,NN}. Gọi X là "số lần xuất hiện mặt sấp" trong phép thử trên. Khi đó X là biến ngẫu nhiên, e ∈ Ω NN NS SN SS X(e) 0 1 1 2 và tập giá trị của biến ngẫu nhiên X là X(Ω) = {0; 1; 2}. Trang 35
Ví dụ 61. Một hộp đựng 10 lọ thuốc, trong đó có 2 lọ không đạt chuẩn. Lấy ngẫu nhiên từng lọ trong hộp để kiểm tra cho đến khi gặp lọ kém phẩm chất thì dừng. Gọi X là số lần kiểm tra. Khi đó X là biến ngẫu nhiên và X(Ω) = {1; 2; 3; 4; 5; 6; 7; 8; 9}. Ví dụ 62. Một xạ thủ thực hiện phép thử bắn không hạn chế vào một mục tiêu cho đến khi có một viên đạn trúng đích thì dừng. Gọi X là số lần bắn. Khi đó X là biến ngẫu nhiên và X(Ω) = {1; 2; 3; } Ví dụ 63. Người ta tiến hành khảo sát số xe máy hiện có trong 6487 hộ gia đình tại thành phố Hồ Chí Minh năm 2003 và thu được bảng số liệu sau Số xe máy Số hộ (xi) Tần suất (fi) 0 27 0,004 1 1422 0,219 2 2865 0,442 3 1796 0,277 4 324 0,050 5 53 0,008 Tổng 6487 1 Nếu chúng ta gọi X là số xe máy có trong mỗi hộ gia đình thì X là một biến ngẫu nhiên vì X nhận các giá trị là một trong các số 0, 1, 2, 3, 4, 5 một cách ngẫu nhiên. Tập giá trị của biến ngẫu nhiên X trong ví dụ này là X(Ω) = {0, 1, 2, 3, 4, 5}. 2. Phân loại biến ngẫu nhiên 2.1. Biến ngẫu nhiên rời rạc Định nghĩa 2.1. Biến ngẫu nhiên X gọi là biến ngẫu nhiên rời rạc nếu X(Ω) = {x1, x2, , xn} (hữu hạn), hay X(Ω) = {x1, x2, x3, } (vô hạn đếm được). Định nghĩa 2.2. Hàm số fX (x) = P [X = x], với x = x1, x2, x3, gọi là hàm mật độ xác suất rời rạc của biến ngẫu nhiên X, hay gọi tắt là hàm mật độ. Trang 36
Hàm mật độ xác suất của biến ngẫu nhiên rời rạc X được mô tả bằng bảng phân phối xác suất Trường hợp hữu hạn X x1 x2 x3 xn fX (x) = P [X = x] p1 p2 p3 pn Trường hợp vô hạn X x1 x2 x3 xn fX (x) = P [X = x] p1 p2 p3 pn Ví dụ 64. Xét phép thử tung một đồng xu 3 lần và gọi X là "số lần xuất hiện mặt sấp". Khi đó ta có X(Ω) = {0; 1; 2; 3} và bảng phân phối xác suất của biến ngẫu nhiên X như sau X 0 1 2 3 1 3 3 1 f (x) X 8 8 8 8 Ví dụ 65. Một hộp có 10 sản phẩm trong đó có 3 phế phẩm. Lấy ngẫu nhiên 3 sản phẩm trong hộp để kiểm tra. Gọi X là số phế phẩm lấy được. Khi đó X(Ω) = {0; 1; 2; 3} và 3 C7 7 fX (0) =P [X = 0] = 3 = , C10 24 2 1 C7 × C3 21 fX (1) =P [X = 1] = 3 = , C10 40 1 2 C7 × C3 7 fX (2) =P [X = 2] = 3 = , C10 40 3 C3 1 fX (3) =P [X = 3] = 3 = . C10 120 X 0 1 2 3 7 21 7 1 f (x) X 24 40 40 120 2.2. Biến ngẫu nhiên liên tục Thực tế có những hiện tượng mà X(Ω) là một khoảng, chẳng hạn "thời gian chờ xe buýt tại trạm", "lượng mưa trong một năm của một vùng", "khoảng thời gian giữa hai lần có tín hiệu đèn xanh của một trụ đèn giao thông", X, khi đó, gọi là biến ngẫu nhiên liên tục. Định nghĩa 2.3. Biến ngẫu nhiên X gọi là biến ngẫu nhiên liên tục nếu X(Ω) là một khoảng, hoặc hợp của nhiều khoảng, hoặc toàn bộ R. Trang 37
Chương 3 Phân phối xác suất đối với biến ngẫu nhiên rời rạc 1. Hàm mật độ xác suất rời rạc Định nghĩa 3.1. Giả sử Ω là không gian mẫu, X là biến ngẫu nhiên rời rạc và X(Ω) = {x1, x2, }. Khi đó hàm số fX (x) = P [X = x], với x = x1, x2, x3, gọi là hàm mật độ xác suất rời rạc của biến ngẫu nhiên X, hay gọi tắt là hàm mật độ. Hàm mật độ xác suất của biến ngẫu nhiên rời rạc X thường được mô tả dưới dạng bảng, bảng này được gọi là bảng phân phối xác suất rời rạc Trường hợp X(Ω) hữu hạn X x1 x2 xn P [X = x] p1 p2 pn Trường hợp X(Ω) vô hạn X x1 x2 xn P [X = x] p1 p2 pn Định lý 3.1. Giả sử fX (x) là hàm mật độ xác suất rời rạc của biến ngẫu nhiên X. Khi đó (i) f(xi) ≥ 0, với mọi i = 1, 2, 3, , Trang 38
P (ii) fX (xi) = 1. xi Ví dụ 66. Một hộp có 7 quả bóng gồm 4 bóng xanh và 3 bóng đỏ. Lấy ngẫu nhiên 2 bóng trong hộp. Gọi X là số bóng đỏ lấy được. Khi đó X là biến ngẫu nhiên và có bảng phân phối như sau X 0 1 2 P 2 4 1 fX (x) 7 7 7 1 Ví dụ 67. Có hai kiện hàng. Kiện một có 3 sản phẩm tốt, 2 sản phẩm xấu. Kiện hai có 2 sản phẩm tốt, 3 sản phẩm xấu. Lấy ngẫu nhiên từ kiện một ra hai sản phẩm và từ kiện hai ra một sản phẩm. Gọi X là số sản phẩm tốt trong 3 sản phẩm được lấy. Hãy tìm hàm mật độ phân phối xác suất của X. Ví dụ 68. Có hai hộp đựng bi. Hộp thứ nhất có 5 bi màu vàng, 6 bi màu xanh. Hộp thứ hai có 7 bi màu vàng, 3 bi màu xanh. Lấy ngẫu nhiên 2 bi từ hộp thứ nhất bỏ sang hộp thứ hai và chọn ngẫu nhiên 2 bi từ hộp thứ hai. Gọi X là số bi màu xanh lấy được từ hộp thứ hai. Hãy lập bảng phân phối xác suất của X. 2. Hàm phân phối xác suất rời rạc Định nghĩa 3.2. Giả sử biến ngẫu nhiên X có hàm mật độ là fX (x). Hàm phân phối xác suất của biến ngẫu nhiên rời rạc X là F (x) = P [X 4. Từ định nghĩa hàm phân phối xác suất của biến ngẫu nhiên X (F (x) = P [X < x]) và bảng phân phối xác suất của X, ta có: Trang 39
• Nếu x ≤ 0: Biến cố "X < x" là biến cố "tập hợp các giá trị của X thỏa điều kiện X < x". Do x ≤ 0 nên theo bảng phân phối xác suất [X < x] = ∅. Vậy F (x) = P [X < x] = 0. • Nếu 0 < x ≤ 1 Biến cố "X < x" là biến cố "tập hợp các giá trị của X thỏa điều kiện X < x". Do 0 < x ≤ 1 nên theo bảng phân phối xác suất [X < x] = {X = 0}. Vậy 1 F (x) = P [X < x] = 16 • Nếu 1 < x ≤ 2 Biến cố "X < x" là biến cố "tập hợp các giá trị của X thỏa điều kiện X < x". Do 1 < x ≤ 2 nên [X < x] = {X = 0,X = 1}. Vậy 1 1 5 F (x) = P [X < x] = + = 16 4 16 • Nếu 2 < x ≤ 3 Biến cố "X < x" là biến cố "tập hợp các giá trị của X thỏa điều kiện X < x". Do 2 < x ≤ 3 nên [X < x] = {X = 0,X = 1,X = 2}. Vậy 1 1 3 11 F (x) = P [X < x] = + + = 16 4 8 16 • Nếu 3 < x ≤ 4 Biến cố "X < x" là biến cố "tập hợp các giá trị của X thỏa điều kiện X < x". Do 3 < x ≤ 4 nên [X < x] = {X = 0,X = 1,X = 2,X = 3}. Vậy 1 1 3 1 15 F (x) = P [X < x] = + + + = 16 4 8 4 16 • Nếu 4 < x Biến cố "X < x" là biến cố "tập hợp các giá trị của X thỏa điều kiện X < x". Do 4 < x nên [X < x] = {X = 0,X = 1,X = 2,X = 3,X = 4}. Vậy 1 1 3 1 1 F (x) = P [X < x] = + + + + = 1 16 4 8 4 16 Trang 40
Hàm phân phối xác suất của biến ngẫu nhiên rời rạc X được xác định như sau   0, x ≤ 0   1 , 0 4. Ý nghĩa. Hàm phân phối xác suất của X cho biết xác suất của biến cố "X < x". Từ kết quả của ví dụ trên ta có đồ thị của hàm phân phối xác suất F (x): Định lý 3.2. Giả sử F(x) là hàm phân phối xác suất của biến ngẫu nhiên X. Khi đó a) 0 ≤ F (x) ≤ 1, ∀x ∈ R. P P b) F (x) = P [X = xi] = pi. xi<x xi<x c) lim F (x) = 0, lim F (x) = 1. x→−∞ x→+∞ d) P [a ≤ X < b] = F (b) − F (a). Trang 41
e) F (x) là hàm không giảm và liên tục trái. Dựa vào các tính chất trên, đối với biến ngẫu nhiên rời rạc X có bảng phân phối như sau X x1 x2 x3 xn−1 xn P p1 p2 p3 pn−1 pn ta có hàm phân phối xác suất rời rạc của X là   0 nếu x ≤ x1    p1 nếu x1 xn Ví dụ 70. Một phân xưởng có ba máy hoạt động độc lập. Xác suất trong một ngày làm việc các máy I, II, III bị hỏng tương ứng là 0,1; 0,2; 0,3. Gọi X là số máy bị hỏng trong một ngày làm việc. a) Lập bảng phân phối xác suất của X. b) Xác định và vẽ đồ thị hàm phân phối xác suất của X. c) Tính xác suất của biến cố "có ít nhất 2 máy hỏng". d) Tính xác suất của biến cố "có từ 1 đến 2 máy bị hỏng". 3. Các tham số đặc trưng của biến ngẫu nhiên rời rạc Ngoài luật phân phối xác suất còn có những số đặc trưng cho biết thông tin nhất định về biến ngẫu nhiên. Các số đặc trưng này chia làm hai loại: • Loại đặc trưng cho tính chất hướng tâm. • Loại đặc trưng cho độ phân tán. 3.1. Kỳ vọng Giả sử biến ngẫu nhiên rời rạc X có bảng phân phối xác suất như sau Trang 42
X x1 x2 x3 xn fX (x) = P [X = x] p1 p2 p3 pn Khi đó kỳ vọng của biến ngẫu nhiên rời rạc X, kí hiệu EX, là đại lượng n X EX = xipi. i=1 Ví dụ 71. Giả sử biến ngẫu nhiên X có bảng phân phối xác suất như sau X 1 2 3 4 5 fX (x) = P [X = x] 0, 1 0, 3 0, 2 0, 3 0, 1 Khi đó kỳ vọng của biến ngẫu nhiên X là EX = 1 × 0, 1 + 2 × 0, 3 + 3 × 0, 2 + 4 × 0, 3 + 5 × 0, 1 = 3. Ý nghĩa của kỳ vọng Kỳ vọng EX là giá trị trung bình của biến ngẫu nhiên X. Trong thực tế sản xuất hay kinh doanh nếu cần chọn phương án cho năng suất cao (hay lợi nhuận cao) thì người ta chọn phương án có kì vọng cao. Định lý 3.3 (Các tính chất của kỳ vọng). Giả sử X là biến ngẫu nhiên rời rạc và C là một hằng số. Khi đó a) EC = C. b) E(CX) = C.EX. c) E(X ± Y ) = EX ± EY . d) Nếu X, Y là hai biến ngẫu nhiên độc lập thì E(X.Y ) = EX.EY . Ví dụ 72. Theo thống kê, xác suất để một người ở độ tuổi 40 sống thêm một năm là 0, 995. Một công ty bảo hiểm nhân thọ dự định kế hoạch bán bảo hiểm như sau: một năm người mua bảo hiểm trả cho công ty 2 triệu đồng, và nếu người mua chết thì số tiền bồi thường của công ty bảo hiểm là 50 triệu đồng. Hỏi công ty đó có nên chọn phương án kính doanh này không? Gọi X là lợi nhuận thu được khi bán bảo hiểm (đơn vị: triệu đồng). Khi đó X có bảng phân phối sau Trang 43
X −48 2 fX (x) = P [X = x] 0, 005 0, 995 Kỳ vọng của biến ngẫu nhiên X là EX = −48 × 0, 005 + 2 × 0, 995 = 1, 75. Vì lợi nhuận dương nên phương án này có thể chấp nhận Ví dụ 73. Có hai người tiến hành trò chơi như sau: người thứ nhất tung hai con xúc sắc cân đối đồng chất, nếu được 2 mặt giống nhau thì người thứ hai phải trả cho người thứ nhất 200 USD, trong các trường hợp khác, người thứ nhất phải trả cho người thứ hai 50 USD. Gọi X là số tiền mà người thứ nhất có thể có được sau một lần tung xúc xắc. Theo bạn, người thứ nhất có nên tham gia trò chơi này không? 3.2. Phương sai − Độ lệch chuẩn Giả sử biến ngẫu nhiên rời rạc X có bảng phân phối xác suất như sau X x1 x2 x3 xn fX (x) = P [X = x] p1 p2 p3 pn Khi đó phương sai của biến ngẫu nhiên rời rạc X, kí hiệu VarX, là đại lượng n 2 X 2 VarX = E(X − EX) = (xi − EX) pi. i=1 Độ lệch chuẩn của biến ngẫu nhiên X là đại lượng √ σX = VarX. Để thuận lợi cho việc tính toán phương sai, người ta lập bảng sau X x1 x2 x3 xn fX (x) = P [X = x] p1 p2 p3 pn 2 2 2 2 2 (X − EX) (x1 − EX) (x2 − EX) (x3 − EX) (xn − EX) Ví dụ 74. Một hộp đựng 6 quả bóng trong đó có 2 bóng màu đỏ, 4 bóng màu trắng. Lấy ngẫu nhiên 3 bóng và gọi X là số bóng đỏ lấy được. Tính kỳ vọng và phương sai của X. Biến ngẫu nhiên X có bảng phân phối xác suất như sau X 0 1 2 1 3 1 fX (x) 5 5 5 Trang 44
Kỳ vọng của biến ngẫu nhiên X là EX = 1. Dựa vào nhận xét ở trên, chúng ta lập bảng sau để tính phương sai của biến ngẫu nhiên X, X 0 1 2 1 3 1 fX (x) 5 5 5 (X − EX)2 12 02 12 và ta có 1 3 1 VarX = .12 + .02 + .12 = 0, 4. 5 5 5 Định lý 3.4 (Các tính chất của phương sai và độ lệch chuẩn). Giả sử X là biến ngẫu nhiên rời rạc và C là một hằng số. Khi đó a) VarX ≥ 0. b) VarX = EX2 − E2X. c) VarC = 0. d) Var(CX) = C2.VarX. e) σ(CX) = |C|.σX. f) Nếu X, Y là hai biến ngẫu nhiên độc lập thì √ Var(X ± Y ) = VarX + VarY và σ(X ± Y ) = σ2X + σ2Y. Dựa vào tính chất (b): VarX = EX2 − E2X, ta có bảng sau để tính phương sai X x1 x2 x3 xn fX (x) p1 p2 p3 pn 2 2 2 2 2 X x1 x2 x3 xn Ví dụ 75. Xét trở lại ví dụ 74, để tính phương sai của biến ngẫu nhiên X ta lập bảng sau: X 0 1 2 1 3 1 fX (x) 5 5 5 X2 0 1 4 Trang 45
Dựa theo công thức (b), chúng ta lần lượt tính E2X và X2 như sau: EX = 1 ⇒ E2X = 12. 1 3 1 7 EX2 = P x2.p = 02. + 12. + 22. = . i i 5 5 5 5 Suy ra VarX = EX2 − E2X = 0, 4. Ví dụ 76. Năng suất của hai máy tương ứng là các biến ngẫu nhiên X, Y (đơn vị: sản phẩm/phút) có phân phối xác suất là X 1 2 3 4 fX (x) = P [X = x] 0, 3 0, 1 0, 5 0, 1 Y 2 3 4 5 fY (y) = P [Y = y] 0, 1 0, 4 0, 4 0, 1 Khi đó EX = 2, 4; EY = 3, 5 và VarX = 1, 04; VarY = 0, 65. So sánh các số đặc trưng ta nhận thấy • EX VarY : nghĩa là năng suất của Y ổn định hơn X. Vậy chọn mua máy Y để sản xuất sẽ có lợi hơn. Ý nghĩa của phương sai và độ lệch chuẩn Vì X − EX là độ lệch giữa các giá trị của biến ngẫu nhiên X và giá trị trung bình EX, nên phương sai chính là trung bình của bình phương độ lệch. Nó đặc trưng cho độ phân tán của biến ngẫu nhiên X xung quanh giá trị trung bình. Trong kỹ thuật, phương sai đặc trưng cho độ sai số của thiết bị, còn trong kinh doanh, nó đặc trưng cho độ rủi ro của các quyết định kinh doanh. Vì đơn vị đo của phương sai VarX bằng bình phương đơn vị đo của X (khó so sánh với √ các số đặc trưng khác), nên người ta đưa ra số đặc trưng độ lệch chuẩn σX = DX có cùng đơn vị đo với biến ngẫu nhiên X (nên dễ so sánh với các số đặc trưng khác hơn). 3.3. Một vài số đặc trưng khác 3.3.1. ModX Giả sử X là biến ngẫu nhiên rời rạc. ModX là tập hợp các giá trị của X tương ứng với xác suất lớn nhất. Trang 46
X x1 x2 x3 xn fX (x) = P [X = x] p1 p2 p3 pn xk ∈ ModX nếu pk = max pi. i 3.3.2. Trung vị Giả sử X là biến ngẫu nhiên rời rạc. Trung vị của X, kí hiệu MedX, là đại lượng được xác định như sau: 1 MedX = xk ⇔ F (xk) ≤ ≤ F (xk+1), ∀xi ∈ X(Ω). 2 Ví dụ 77. Giả sử biến ngẫu nhiên X có bảng phân phối xác suất là X −1 0 1 2 fX (x) 0, 25 0, 15 0, 3 0, 3 Vì biến ngẫu nhiên X có hai giá trị X = 1 và X = 2 có xác suất lớn nhất p = 0, 3 nên ModX = {2; 3}. Muốn xác định MedX trước tiên chúng ta xác định hàm phân phối xác suất của biến ngẫu nhiên X,   0, x ≤ −1,    0, 25, −1 2. MedX = 1. 3.3.3. Moment Giả sử X là biến ngẫu nhiên rời rạc. Moment trung tâm cấp k của X, kí hiệu µk, là đại lượng k µk = E(X − EX) , 0 và moment gốc cấp k của X, kí hiệu µk, là đại lượng 0 k µk = E(X ). 3.3.4. Hệ số biến thiên Trang 47
σX Giả sử X là biến ngẫu nhiên rời rạc. Hệ số biến thiên của X là đại lượng × 100%. EX Hệ số biến thiên của biến ngẫu nhiên X được sử dụng trong trường hợp so sánh độ phân tán của các biến ngẫu nhiên có kỳ vọng và phương sai khác nhau. 3.3.5. Hệ số bất đối xứng µ3 Hệ số bất đối xứng của biến ngẫu nhiên X, kí hiệu α3, là đại lượng . σ3X • α3 = 0: đồ thị hàm mật độ đối xứng. • α3 > 0: đồ thị hàm mật độ lệch về bên trái, xuôi về bên phải. • α3 3: tập trung cao (nhọn). Trang 48
4. Các phân phối xác suất rời rạc thông dụng 4.1. Phân phối nhị thức 4.1.1. Dãy phép thử Bernoulli Giả sử một xạ thủ bắn n lần độc lập vào một mục tiêu (mỗi lần một viên đạn) với xác suất trúng đích là p. Trong mỗi lần bắn của xạ thủ chỉ có 2 khả năng đối nhau xảy ra A "trúng mục tiêu" hoặc A "không trúng mục tiêu". Xác suất bắn trúng đích của mỗi lần bắn luôn là p và các biến cố A, A trong dãy n phép thử này là độc lập. Dãy phép thử có tính chất trên được gọi là dãy phép thử Bernoulli. Định nghĩa 3.3. Dãy n phép thử được gọi là dãy phép thử Bernoulli nếu nó thỏa mãn các điều kiện sau (i) Mỗi phép thử có hai biến cố A và A (là biến cố bù của A). (ii) Các biến cố A, A trong dãy phép thử là độc lập. (iii) Xác suất xảy ra biến cố A trong dãy phép thử luôn là hằng số, nghĩa là P (A) = p. 4.1.2. Phân phối nhị thức Giả sử một xạ thủ bắn n lần độc lập (mỗi lần một viên đạn) vào một mục tiêu với xác suất trúng đích là p. Gọi X là số lần bắn trúng mục tiêu của dãy n phép thử này. Khi đó X là biến ngẫu nhiên rời rạc và X(Ω) = {0; 1; ; n}. Trang 49
Xác suất để X = k, nghĩa là có k phát trúng (và n − k phát trật) là k k n−k P [X = k] = Cnp (1 − p) . (3.2) Công thức (3.2) là hàm mật độ xác suất X, và biến ngẫu nhiên rời rạc X gọi là thỏa phân phối nhị thức với tham số (n, p). Định nghĩa 3.4. Biến ngẫu nhiên rời rạc X gọi là có phân phối nhị thức với tham số (n, p), kí hiệu X ∼ B(n, p), nếu (i) X(Ω) = {0; 1; ; n}. k k n−k (ii) P [X = k] = Cnp q , với q = 1 − p. Định lý 3.5 (Các tham số đặc trưng). Nếu X ∼ B(n, p) thì a) EX = np. b) VarX = npq, với q = 1 − p. Ví dụ 78. Một xạ thủ bắn lần lượt (độc lập) 5 phát vào một mục tiêu với xác suất trúng đích là 0, 6. Gọi X là số phát đạn trúng đích trong 5 lần bắn. Khi đó X ∼ B(n = 5, p = 0, 6). 2 2 3 • Xác suất của biến cố "có 2 viên đạn trúng đích" là P [X = 2] = C5 .p .q = 0, 2304. 4 P k k 5−k • Xác suất "có từ 2 đến 4 viên đạn trúng đích" là P [2 ≤ X ≤ 4] = C5 p q = k=2 0, 8352. Ví dụ 79. Người ta điều tra được ở tỉnh A có 65% gia đình có xe gắn máy. Chọn ngẫu nhiên 12 gia đình và gọi X là số gia đình có xe gắn máy trong số 12 gia đình này. a) Hãy lập bảng phân phối xác suất của X. b) Tính xác suất để có đúng 5 gia đình có xe gắn máy. c) Tìm kỳ vọng và độ lệch chuẩn của X. Ví dụ 80. Tại một phân xưởng, người ta đóng mỗi 10 sản phẩm thành một kiện hàng. Trong mỗi kiện hàng luôn có 7 sản phẩm loại I và 3 sản phẩm loại II. Khách hàng trước khi mua sẽ tiến hành kiểm tra như sau: trong mỗi kiện hàng, khách hàng lấy ngẫu nhiên 2 sản phẩm ra để Trang 50
kiểm tra, nếu cả 2 sản phẩm đều tốt thì khách hàng mới nhận kiện hàng đó. Trong ngày hôm đó khách hàng kiểm tra 10 kiện hàng. Gọi X là số kiện hàng được khách hàng nhận. Hãy lập bảng phân phối xác suất của X và tính giá trị của các đại lượng EX, VarX, ModX. 4.2. Phân phối Poisson Phân phối Poisson được mô tả lần đầu tiên bởi Simeon Denis Poisson (1887). Trong thực tế có nhiều mô hình thỏa phân phối Poisson, chẳng hạn: số cuộc gọi đến tổng đài điện thoại trong 1 phút, số khách hàng đến rút tiền tại một ngân hàng trong 1 ngày, số người truy cập vào trang web www.ecoforumm.com trong 30 phút, Tất cả các sự kiện trong những ví dụ trên đều có một nét đặc trưng chung, đó là đều đề cập đến "cường độ" (hay số lần xuất hiện) của biến ngẫu nhiên. 4.2.1. Định nghĩa và các tính chất của phân phối Poisson Định nghĩa 3.5. Cho λ là một số thực dương. Biến ngẫu nhiên rời rạc X gọi là có phân phối Poisson với tham số λ, kí hiệu X ∼ P (λ), nếu (i) X(Ω) = {0; 1; 2; }. e−λλk (ii) P [X = k] = . k! Định lý 3.6 (Các số đặc trưng). Nếu X ∼ P (λ) thì a) EX = λ. b) DX = λ. Ví dụ 81. Tại một giao lộ giao thông người ta nhận thấy số vụ tai nạn giao thông xảy ra trong một tháng là biến ngẫu nhiên X có phân phối Poisson với tham số λ = 2. Hãy tính xác suất xảy ra 3 tai nạn trong khoảng thời gian 1 tháng. Ta có X ∼ P (λ = 2). Xác suất để có 3 tai nạn xảy ra trong 1 tháng là 23 P [X = 3] = e−2. = 0, 18 3! Trong trường hợp không biết trước λ chúng ta có thể dựa vào thông tin về "cường độ" để xác định λ. Giả sử một biến cố A xuất hiện một cách ngẫu nhiên, trong đó số lần xuất hiện của biến cố A trong khoảng thời gian (a; b) nào đó không ảnh hưởng đến số lần xuất hiện của Trang 51
biến cố A trong những khoảng thời gian sau đó và "cường độ" xuất hiện của biến cố A là không đổi ("cường độ", kí hiệu là c, được đề cập ở đây có thể hiểu đơn giản là số lần xuất hiện biến cố A trong 1 đơn vị thời gian). Gọi X là số lần xuất hiện biến cố A trong khoảng thời gian (a; b). Khi đó X ∼ P (λ), với λ = c(b − a), (c là "cường độ" xuất hiện biến cố A). Ví dụ 82. Tại một giao lộ, người ta nhận thấy trung bình mỗi tháng có 2 vụ tai nạn giao thông. Hãy tính xác suất để a) có 3 vụ tai nạn giao thông trong khoảng thời gian 2 tháng (X ∼ P (λ = 2 × 2)). 2 1 b) có ít nhất một tai nạn giao thông trong khoảng thời gian một tuần (X ∼ P λ = = ). 4 2 4.2.2. Xấp xỉ phân phối nhị thức bằng phân phối Poisson Giả sử biến ngẫu nhiên X ∼ B(n, p) và p rất nhỏ (gần 0). Khi đó nếu n là số rất lớn thì X ∼ P (λ), với λ = n.p. Ví dụ 83. Giả sử tỉ lệ phế phẩm của một nhà máy sản xuất transistor là 1%. Mỗi máy tính được lắp ráp cần sử dụng 100 transistor. Giả sử việc chọn lựa các transistor để lắp ráp là ngẫu nhiên. Gọi X là số transistor phế phẩm trong mỗi máy tính. Khi đó X ∼ B(n = 100, p = 0, 01) và X ∼ P (λ = n.p = 1). 4.3. Phân phối Pascal (Phân phối hình học) Định nghĩa 3.6. Biến ngẫu nhiên rời rạc X gọi là có phân phối Pascal với tham số p, kí hiệu X ∼ Pa(λ), nếu (i) X(Ω) = {0; 1; , 2; }. (ii) P [X = k] = pk(1 − p). Ví dụ 84. Xác suất trúng đích trong mỗi lần bắn của một xạ thủ là q = 0, 2. Xạ thủ đó bắn độc lập, không hạn chế vào mục tiêu cho đến khi trúng đích mới dừng. Gọi X là số viên đạn bị tiêu hao. Khi đó X ∼ Pa(p = 0, 8). Trang 52
4.4. Phân phối siêu bội (Hypergeometric Distribution) Định nghĩa 3.7. Xét tập hợp gồm N phần tử, trong đó có M phần tử "có tính chất A" và N − M phần tử "không có tính chất A". Chọn ngẫu nhiên n phần tử từ tập hợp trên và gọi X là số phần tử có tính chất A trong n phần tử được chọn. Khi đó X là biến ngẫu nhiên rời rạc và (i) X(Ω) = {0; 1; , 2; ; n}. k n−k CM .CN−M (ii) P [X = k] = n . CN Khi đó người ta nói X có phân phối siêu bội với tham số (N, M, n). Ví dụ 85. Trong một đợt phát hành vé số, người ta bán ra 500 vé, trong đó có 50 vé trúng thưởng. Một người mua ngẫu nhiên 20 vé. Gọi X là số vé trúng thưởng trong 20 vé người đó mua. Khi đó X có phân phối siêu bội với tham số (N = 500,M = 50, n = 20). 5. Xác suất hợp của nhiều biến ngẫu nhiên rời rạc Trong nhiều bài toán thực tế, chúng ta cần phải xét đồng thời nhiều biến ngẫu nhiên có quan hệ với nhau, gọi là biến ngẫu nhiên nhiều chiều (hay vectơ ngẫu nhiên). Ví dụ 86. Thống kê điểm thi Đại học khối A của mỗi Sinh viên, bao gồm 3 môn thi Toán (X), Lý (Y ), Hóa (Z), khi đó bộ 3 biến ngẫu nhiên X, Y, Z gọi là biến ngẫu nhiên ba chiều. Ví dụ 87. Trong kinh tế, người ta thường quan tâm đến mối liên hệ giữa giá cả và mức tiêu thụ. Nếu ta đặt giá cả là X và mức tiêu thụ là Y thì bộ 2 biến ngẫu nhiên X, Y là biến ngẫu nhiên hai chiều. Trong phần này chúng ta chỉ xét trường hợp đơn giản với số biến là 2, trong đó hai biến ngẫu nhiên X, Y đồng thời là rời rạc. 5.1. Phân phối xác suất đồng thời Giả sử Z = (X, Y ) là biến ngẫu nhiên 2 chiều. Xác suất để hai biến ngẫu nhiên X và Y đồng thời nhận hai giá trị tương ứng xi, yj được gọi là xác suất đồng thời của biến ngẫu nhiên hai chiều Z = (X, Y ), kí hiệu Pij = P [X = xi; Y = yj] Người ta thường biểu diễn các xác suất đồng thời của biến ngẫu nhiên hai chiều Z = (X, Y ) dưới dạng bảng hai chiều và gọi bảng này là bảng phân phối xác suất đồng thời. Trang 53
Tính chất Định lý 3.7. Giả sử Z = (X, Y ) là biến ngẫu nhiên rời rạc hai chiều. Khi đó a) 0 ≤ Pij ≤ 1, ∀i = 1, , m; j = 1, , n, i=m j=n P b) Pij = 1. i=1 j=1 Ví dụ 88. Xét phép thử tung hai đồng xu cân đối, đồng chất. Ta quy ước gán số 0 cho biến cố "mặt sấp xuất hiện" và gán số 1 cho biến cố "mặt ngửa xuất hiện". Khi đó mỗi đồng xu chỉ có hai giá trị là 0 hoặc 1. Gọi X là giá trị của đồng xu thứ nhất và Y là giá trị của đồng xu thứ hai. Ta có bảng mô ta sau Giá trị P11, P12, P21, P22 là xác suất để hai biến ngẫu nhiên X, Y đồng thời nhận giá trị {X = 0,Y = 0}, {X = 0,Y = 1}, {X = 1,Y = 0}, {X = 1,Y = 1}, tương ứng. Ta đã biết 1 1 1 1 xác suất P [X = 0] = ,P [X = 1] = ,P [Y = 0] = ,P [Y = 1] = và hai biến X, Y độc 2 2 2 2 1 lập với nhau. Do đó P = P [X = 0].P [Y = 0] = . Thực hiện tính toán tương tự cho các 11 4 bảng còn lại, chúng ta có bảng phân phối xác suất đồng thời của hai biến ngẫu nhiên X, Y như sau: Trang 54
Định nghĩa 3.8. Hàm phân phối xác suất của biến ngẫu nhiên hai chiều rời rạc X, Y là hàm số xác định trên R và có công thức như sau F (x; y) = P [X 1 và y ≤ 0; 0 1. Dựa theo công thức hàm phân phối xác suất và bảng phân phối xác suất của biến ngẫu nhiên hai chiều X, Y ta có  0 x ≤ 0, y ≤ 0  nếu   0 nếu x ≤ 0, 0 1    0 nếu 0 1  2 nếu   0 nếu x > 1, y ≤ 0    1 x > 1, 0 1, y > 1 5.2. Tính chất của hàm phân phối xác suất đồng thời Định lý 3.8. Giả sử F (x, y) là hàm phân phối xác suất của biến ngẫu nhiên hai chiều rời rạc. Khi đó a) 0 ≤ F (x, y) ≤ 1, ∀x, y ∈ R. P b) F (x, y) = Pij. xi<x yj <y c) F (x; y) là hàm không giảm theo từng biến. Trang 55
d) lim F (x, y) = 0 và lim F (x, y) = 1. x,y→−∞ x,y→+∞ e) P [x1 ≤ X < x2; y1 ≤ Y < y2] = F (x2, y2) + F (x1, y1) − F (x2, y1) − F (x1, y2). f) lim F (x, y) = FX (x) và lim F (x, y) = FY (y). y→+∞ x→+∞ Ví dụ 90. Trong một nhà máy chế tạo máy, tại một phân xưởng người ta cần thực hiện hai công đoạn. Gọi X là số lỗi kỹ thuật mắc phải khi thực hiện công đoạn thứ nhất và Y là số lỗi kỹ thuật mắc phải khi thực hiện công đoạn thứ hai. Bảng phân phối xác suất đồng thời của biến ngẫu nhiên hai chiều X, Y được cho như sau: a) Hãy tính xác suất để không mắc lỗi kỹ thuật trong cả hai công đoạn. b) Hãy tính xác suất để chỉ có 1 lỗi kỹ thuật trong cả hai công đoạn. c) Hãy tính xác suất để chỉ có tối đa 2 lỗi kỹ thuật trong cả hai công đoạn. 5.3. Phân phối xác suất lề Giả sử biến ngẫu nhiên hai chiều (X, Y ) có bảng phân phối xác suất đồng thời là Bảng phân phối xác suất lề của biến ngẫu nhiên X là Trang 56
X x1 x2 xn P P (x1) P (x2) P (xn) Trong đó n X P (xi) = Pij, ∀i = 1, , m. j=1 Bảng phân phối xác suất lề của biến ngẫu nhiên Y là Y y1 y2 ym Q Q(y1) Q(y2) Q(ym) Trong đó m X Q(yj) = Pij, ∀j = 1, , n. i=1 Thông thường người ta thường hay ghép bảng phân phối xác suất lề với bảng phân phối xác suất đồng thời để có bảng sau: Ví dụ 91. Hãy tính các phân phối lề trong ví dụ 90. 5.4. Phân phối xác suất có điều kiện Giả sử biến ngẫu nhiên hai chiều (X, Y ) có bảng phân phối xác suất đồng thời là Trang 57
• Phân phối có điều kiện của biến ngẫu nhiên X khi Y = yj, j = 1, , n là X x1 x2 xm P P1/yj P2/yj Pm/yj trong đó Pij Pi/yj = P [X = xi/Y = yj] = Q(yj) • Phân phối có điều kiện của biến ngẫu nhiên Y khi X = Xi, i = 1, , m là Y y1 y2 yn Q Q1/xi Q2/xi Qn/xi trong đó Pij Qj/xi = P [X = xi/Y = yj] = P (xi) Ví dụ 92. Xét ví dụ 90. Hãy xác định các phân phối xác suất có điều kiện a) của biến ngẫu nhiên X khi Y = 1. b) của biến ngẫu nhiên Y khi X = 2. 5.5. Biến ngẫu nhiên độc lập Giả sử biến ngẫu nhiên hai chiều (X, Y ) có bảng phân phối xác suất đồng thời và phân phối lề là Hai biến ngẫu nhiên X, Y được gọi là độc lập nếu Pij = P (xi).Q(yj), với mọi i = 1, , m; j = 1, , n. Trang 58
Ví dụ 93. Cho hai biến ngẫu nhiên X, Y có bảng phân phối xác suất là Y 1 2 3 X 0 0, 10 0, 25 0, 16 1 0, 15 0, 22 0, 12 a) Tìm hàm phân phối xác suất của biến ngẫu nhiên hai chiều X, Y . b) Xét tính độc lập của X, Y ? c) Lập bảng phân phối xác suất có điều kiện của X khi Y = 3 đã xảy ra. 5.6. Các tham số đặc trưng 5.6.1. Kỳ vọng có điều kiện Giả sử biến ngẫu nhiên hai chiều (X, Y ) có bảng phân phối xác suất đồng thời và phân phối lề là và các bảng phân phối xác suất có điều kiện X x1 x2 xm P P1/yj P2/yj Pm/yj Y y1 y2 yn Q Q1/xi Q2/xi Qn/xi • Kỳ vọng có điều kiện của biến ngẫu nhiên X khi Y = yj, kí hiệu E(XY = yj), là n X E(XY = yj) = xi.Pi/yj (3.4) i=1 Trang 59
• Kỳ vọng có điều kiện của biến ngẫu nhiên Y khi X = xi, kí hiệu E(Y X = xi), là n X E(Y X = xi) = yj.Pj/xi (3.5) j=1 Ví dụ 94. Xét lại ví dụ 93. Hãy tính a) Kỳ vọng EX của biến ngẫu nhiên X. b) Kỳ vọng có điều kiện của biến ngẫu nhiên X khi Y = 2. 5.6.2. Hiệp phương sai Giả sử hai biến ngẫu nhiên X, Y lần lượt có kỳ vọng là EX, EY . Hiệp phương sai của hai biến ngẫu nhiên X, Y , kí hiệu cov(X, Y ), được xác định bởi công thức i=n j=m X cov(X, Y ) = E (X − EX)(Y − EY ) = (Xi − EX)(Yj − EY ).Pij (3.6) i=1 j=1 Định lý 3.9. cov(X, Y ) = E(XY ) − EX.EY (3.7) Ý nghĩa. Người ta dùng cov(X, Y ) để đo mức độ phụ thuộc tuyến tính của hai biến ngẫu nhiên X, Y . Tính chất a) cov(X, Y ) = cov(Y, X). b) cov(X, Y ) > 0: hai biến ngẫu nhiên X, Y có tương quan thuận. c) cov(X, Y ) < 0: hai biến ngẫu nhiên X, Y có tương quan nghịch. d) cov(X ± Z, Y ) = cov(X, Y ) + cov(Z, Y ). 5.6.3. Hệ số tương quan Hiệp phương sai có hạn chế là khó xác định miền biến thiên, vì vậy người ta đưa ra đại lượng hệ số tương quan để dễ khảo sát tính chất trên. Trang 60
Định nghĩa 3.9. Hệ số tương quan của biến ngẫu nhiên X và Y , kí hiệu ρX,Y , được xác định bởi công thức cov(X, Y ) p p ρX,Y = , σ(X) = Var(X), σ(Y ) = Var(Y ) (3.8) σ(X).σ(Y ) Tính chất a) |ρX;Y | ≤ 1. b) |ρX;Y | = 1 khi và chỉ khi X, Y phụ thuộc tuyến tính, nghĩa là Y = aX + b. c) ρX;Y = 0 khi và chỉ khi X, Y độc lập. Hệ số tương quan đo mức độ phụ thuộc tuyến tính của X và Y . |ρX;Y | càng gần 1 thì mức độ phụ thuộc tuyến tính của X và Y càng chặt. |ρX;Y | càng gần 0 thì mối quan hệ tuyến tính càng yếu. Ví dụ 95. Có hai hộp, mỗi hộp đựng 6 thẻ. Trong hộp một có: 1 thẻ mang số 1, 2 thẻ mang số 2, 3 thẻ mang số 3. Trong hộp hai có: 2 thẻ mang số 1, 3 thẻ mang số 2, 1 thẻ mang số 3. Rút ngẫu nhiên mỗi hộp một thẻ. Gọi X là số trên thẻ rút từ hộp một, Y là số trên thẻ rút từ hộp hai. a) Hãy lập bảng phân phối xác suất và phân phối xác suất lề của hai biến ngẫu nhiên X, Y . b) Hãy tính hệ số tương quan ρX,Y của hai biến ngẫu nhiên X, Y . Hai biến ngẫu nhiên X và Y có độc lập với nhau không? Ví dụ 96. Có hai loại cổ phiếu A và B được bán trên thị trường chứng khoán và lãi suất của chúng là hai biến ngẫu nhiên X, Y tương ứng. Giả sử bảng phân phối xác suất của X, Y như sau (đơn vị tính bằng %): Trang 61
a) Nếu đầu tư toàn bộ vốn vào cổ phiếu A thì lãi suất kỳ vọng và mức độ rủi ro là bao nhiêu? b) Nếu mục tiêu là đạt lãi suất kỳ vọng lớn nhất thì nên đầu tư vào các cổ phiếu A, B theo tỉ lệ là bao nhiêu? c) Muốn mức độ rủi ro thấp nhất thì nên đầu tư vào các cổ phiếu A, B theo tỉ lệ là bao nhiêu? 5.6.4. Định lý về tổng và hiệu của các biến ngẫu nhiên Định lý 3.10. Giả sử (X, Y ) là biến ngẫu nhiên hai chiều. Đặt Z = X ± Y . Khi đó ta có a) P [Z = zk] = P [X = xi,Y = yj], với xi ± yj = zk. P b) EZ = zk.Pk, với Pk = P [Z = zk]. k c) VarZ = EZ2 − E2Z. Ví dụ 97. Cho hai biến ngẫu nhiên X, Y có bảng phân phối xác suất đồng thời như sau Đặt Z = X + Y . Hãy lập bảng phân phối xác suất của biến ngẫu nhiên Z và tính kỳ vọng và phương sai của Z. Trang 62
Chương 4 Phân phối xác suất đối với biến ngẫu nhiên liên tục 1. Hàm mật độ xác suất Định nghĩa 4.1. Giả sử X là biến ngẫu nhiên liên tục. Hàm số f : R → [0; 1] được gọi là hàm mật độ xác suất của biến ngẫu nhiên X nếu (i) f(x) ≥ 0, ∀x ∈ R. +∞ (ii) R f(x)dx = 1. −∞ b (iii) P [a ≤ X 0, 5 Tính P [0, 2 ≤ X < 0, 3]. 2. Hàm phân phối xác suất Định nghĩa 4.2. Giả sử X là biến ngẫu nhiên liên tục. Hàm phân phối xác suất của biến ngẫu nhiên X, kí hiệu là F (x), là hàm số xác định bởi công thức, x Z F (x) = P [X < x] = f(t)dt, ∀x ∈ R. (4.1) −∞ Trang 63
2.1. Ý nghĩa hình học. Giá trị của hàm phân phối xác suất F (x) chính là diện tích hình giới hạn bởi đường cong f(x) và trục hoành Ox tính từ −∞ đến x. 2.2. Tính chất của hàm phân phối xác suất Giả sử biến ngẫu nhiên liên tục X có hàm mật độ xác suất là f(x) và hàm phân phối xác suất là F (x). Khi đó (i) P [X ≤ x] = P [X 0, 5 a) Hãy xác định hàm phân phối xác suất của biến ngẫu nhiên X. b) Tính P [X < 0, 3] và P [0, 2 ≤ X < 0, 3] bằng cách sử dụng hàm phân phối. Giải. x a) Từ công thức F (x) = P [X < x] = R f(t)dt và công thức hàm mật độ xác suất f(x) −∞ của biến ngẫu nhiên X, ta có Trang 64
• Nếu x ≤ 0, 1 thì, x x Z Z P1 = f(t)dt = 0.dt = 0. −∞ −∞ • Nếu 0, 1 0, 5 thì, x 0,1 0,5 x 0,1 0,5 x Z Z Z Z Z Z 25 5 Z f(t)dt = f(t)dt+ f(t)dt+ f(t)dt = 0.dt+ t− dt+ 0.dt = 1. 2 4 −∞ −∞ 0,1 0,5 −∞ 0,1 0,5 Vậy hàm phân phối xác suất của biến ngẫu nhiên X là   0 , nếu x ≤ 0, 1  F (x) = 6, 25x2 − 1, 25x + 0, 0625 , nếu 0, 1 0, 5 b) Từ định nghĩa F (x) = P [X < x] suy ra P [X < 0, 3] = F (0, 3) = 0, 25. Tiếp theo ta tính P [0, 2 ≤ X < 0, 3] như sau: P [0, 2 ≤ X < 0, 3] = P [X < 0, 3] − P [X < 0, 2] = F (0, 3) − F (0, 2) = 0, 1875. Xác suất P [0, 2 ≤ X < 0, 3] được mô tả bằng hình vẽ sau Trang 65
Ví dụ 100. Cho biến ngẫu nhiên liên tục X có hàm mật độ là  0 x ≤ 0  , nếu   x , nếu 0 2 trong đó a là tham số. a) Xác định tham số a. Vẽ đồ thị của hàm f(x) tương ứng với a vừa tìm được. b) Xác định hàm phân phối xác suất F (x) của biến ngẫu nhiên X và vẽ đồ thị của nó. c) Tính các xác suất P [1 ≤ X < 2, 5] và P [X ≥ 1, 5] bằng cách dùng hàm phân phối xác suất. 3. Các tham số đặc trưng 3.1. Kỳ vọng Định nghĩa 4.3. Giả sử biến ngẫu nhiên liên tục X có hàm mật độ xác suất là f(x). Khi đó kỳ vọng của X, kí hiệu là EX, được xác định bởi công thức, +∞ Z EX = x.f(x)dx (4.2) −∞ Ví dụ 101. Cho biến ngẫu nhiên liên tục X có hàm mậc độ xác định như sau   x + 1 , nếu − 1 ≤ x < 0  f(x) = −x + 1 , nếu 0 ≤ x < 1   0 , nơi khác Hãy tìm kỳ vọng của biến ngẫu nhiên X. 3.2. Phương sai Định nghĩa 4.4. Phương sai của biến ngẫu nhiên liên tục X, kí hiệu là VarX, được xác định bởi công thức, VarX = E(X − EX)2 (4.3) Trang 66
Định lý 4.1. Nếu biến ngẫu nhiên liên tục X có hàm mật độ là f(x). Khi đó +∞ +∞ Z Z 2 VarX = EX2 − E2X = x2.f(x)dx − x.f(x)dx (4.4) −∞ −∞ Ví dụ 102. Cho biến ngẩu nhiên liên tục X có hàm mật độ xác suất là  3  (1 − x2) , nếu |x| ≤ 1 f(x) = 4  0 , nơi khác Hãy tìm kỳ vọng và phương sai của biến ngẫu nhiên X. Ví dụ 103. Cho biến ngẫu nhiên X có hàm mật độ xác suất là   ax2 + b , nếu 0 ≤ x < 1 f(x) =  0 , nơi khác 1 1 Biết rằng P X < = . Hãy tính kỳ vọng EX và phương sai VarX. 2 3 4. Phân phối chuẩn Phân phối chuẩn, hay còn gọi là phân phối Gauss, là phân phối xác suất được sử dụng phổ biến trong xác suất thống kê. Hàm mật độ xác suất của phân phối chuẩn được DeMoivre tìm ra năm 1733 trong khi tính giới hạn hàm mật độ của phân phối nhị thức. 4.1. Hàm mật độ phân phối chuẩn Định nghĩa 4.5. Biến ngẫu nhiên liên tục X được gọi là có phân phối chuẩn với tham số trung bình µ và phương sai σ2, kí hiệu là X ∼ N(µ, σ2), nếu hàm mật độ xác suất của X có dạng, (x − µ)2 1 − f(x) = √ e 2σ , ∀x ∈ R. (4.5) σ 2π 4.1.1. Đồ thị của hàm mật độ phân phối chuẩn Đồ thị của hàm mật độ phân phối chuẩn có các tính chất sau đây (i) Đồ thị của hàm mật độ phân phối chuẩn có dạng hình chuông và nhận đường thẳng x = µ làm trục đối xứng và có đỉnh là điểm có hoành độ là x = µ. (ii) Khoảng 95% các giá trị của X sẽ tập trung trong khoảng (µ − 2σ; µ + 2σ). Trang 67
(iii) Diện tích của đường cong giới hạn bởi trục hoành Ox và đường cong f(x) là 1 và diện tích của mỗi nửa chuông là 0, 5. (iv) Khi µ thay đổi thì đồ thị của hàm mật độ phân phối chuẩn sẽ bị dịch sang trái hoặc dịch sang phải. Đồ thị của hàm mật độ phân phối chuẩn khi µ thay đổi (v) Khi σ tăng thì đồ thị của hàm mật độ phân phối chuẩn sẽ tù hơn và khi σ giảm thì đồ thị của hàm mật độ phân phối chuẩn sẽ nhọn hơn. Đồ thị của hàm mật độ phân phối chuẩn khi σ thay đổi Trang 68
4.1.2. Tính chất của phân phối chuẩn Định lý 4.2. Giả sử biến ngẫu nhiên liên tục X ∼ N(µ, σ2) và có hàm mật độ phân phối chuẩn là f(x). Khi đó µ +∞ 1 (i) R f(x)dx = R f(x)dx = . −∞ µ 2 (ii) EX = µ. (iii) VarX = σ2. 4.2. Hàm phân phối xác suất của phân phối chuẩn Giả sử biến ngẫu nhiên liên tục X ∼ N(µ, σ2). Hàm phân phối xác suất của X là x (t − µ)2 1 Z − F (x) = P [X < x] = √ e 2σ2 dt (4.6) σ 2π −∞ Ý nghĩa hình học Giá trị của hàm phân phối xác suất F (x) của phân phối chuẩn là diện tích của hình giới (t − µ)2 1 − hạn bởi đường cong f(x) = √ e 2σ2 và trục hoành Ox tính từ "−∞ đến x" σ 2π 5. Phân phối chuẩn tắc Giả sử X ∼ N(µ; σ2). Nếu µ = 0 và σ2 = 1 thì X gọi là có phân phối chuẩn tắc, kí hiệu X ∼ N(0; 1). 5.1. Hàm mật độ phân phối chuẩn tắc Trang 69
Nếu biến ngẫu nhiên liên tục X có phân phối chuẩn tắc N(0, 1) thì hàm mật độ phân phối chuẩn tắc có dạng x2 1 − f(x) = √ e 2 , ∀x ∈ R (4.7) 2π 5.1.1. Đồ thị của hàm mật độ phân phối chuẩn tắc Đồ thị của hàm mật độ phân phối chuẩn tắc có dạng hình chuông, đỉnh nằm trên trục tung Oy và nhận trục tung Oy làm trục đối xứng. 5.1.2. Tính chất Định lý 4.3. Giả sử X ∼ N(0; 1) và có hàm mật độ xác suất là f(x). Khi đó 0 +∞ 1 (i) R f(x)dx = R f(x)dx = . −∞ 0 2 (ii) EX = 0. (iii) DX = 1. 5.2. Hàm phân phối xác suất của phân phối chuẩn tắc Hàm phân phối xác suất của biến ngẫu nhiên X ∼ N(0, 1) là hàm số xác định bởi công thức x t2 1 Z − ϕ(x) = √ e 2 dt, ∀x ∈ R (4.8) 2π −∞ Hàm phân phối xác suất của phân phối chuẩn tắc còn được gọi là tích phân Laplace. Giá trị của của hàm ϕ(x) được xác định từ bảng tích phân Laplace. Trang 70
Tính chất của hàm phân phối xác suất của phân phối chuẩn tắc Định lý 4.4. Giả sử biến ngẫu nhiên X có phân phối chuẩn tắc N(0, 1). Khi đó (i) ϕ(x) = P [X < x]. (ii) ϕ(−x) = 1 − ϕ(x). (iii) P [a ≤ X < b] = ϕ(b) − ϕ(a). Ví dụ 104. Cho biến ngẫu nhiên X ∼ N(0, 1). Tính a) ϕ(0, 23), ϕ(0, 15), ϕ(0, 5). b) ϕ(−1, 02), ϕ(−0, 8), ϕ(−1, 2). Giải. • Giả sử bảng tích phân Laplace có công thức z t2 1 Z − ϕ(z) = √ e 2 dt. 2π −∞ Để tính ϕ(0, 23) ta tra dòng 0, 2 và cột 0, 03, thu được kết quả là ϕ(0, 23) = 0, 5910. Bằng cách tương tự ϕ(0, 15) = 0, 5596, ϕ(0, 5) = 0, 6915. • Để tính ϕ(−1, 02) ta dùng tính chất (ii) của định lý (4.4), ϕ(−1, 02) = 1 − ϕ(1, 02) Tra bảng tích phân Laplace, dòng 1, 0, cột 0, 02, thu được kết quả là ϕ(1, 02) = 0, 8461. Thay vào công thức trên ta có ϕ(−1, 02) = 1 − 0, 8461 = 0, 1539. Trang 71
Bằng cách tương tự ϕ(−0, 8) = 0, 2119, ϕ(−1, 2) = 0, 1151. 5.3. Chuẩn hóa biến ngẫu nhiên có phân phối chuẩn Định lý 4.5. Giả sử biến ngẫu nhiên liên tục X có phân phối chuẩn N(µ, σ2). Khi đó X − µ Z = ∼ N(0, 1). (4.9) σ Định lý 4.6. Giả sử Z ∼ N(0, 1). Khi đó (i) P [Z ≥ a] = 1 − P [Z < a] = 1 − ϕ(a). (ii) P [|Z| ≤ a] = ϕ(a) − ϕ(−a) = 2ϕ(a) − 1. Ví dụ 105. Độ dài một chi tiết máy do một máy tiện làm ra là một biến ngẫu nhiên có phân phối chuẩn với trung bình µ = 50 và độ lệch chuẩn σ = 5. Hãy tính tỉ lệ các chi tiết máy do máy tiện trên làm ra có độ dài trong khoảng 47, 4 → 50, 1. Gọi X là độ dài chi tiết máy. Từ giả thiết X ∼ N(50; 52), µ = 50, σ = 5 suy ra Z = X − 50 X − µ ∼ N(0; 1). Từ công thức Z = và do các chi tiết máy có độ dài X thỏa 5 σ mãn 47, 4 ≤ X ≤ 50, 1 nên −0, 5 ≤ Z ≤ 0, 02. Suy ra P [47, 5 ≤ X ≤ 50, 1] = ϕ(0, 02) − ϕ(−0, 5) = 0, 5080 − 0, 3085 = 0, 1995. 5.4. Xấp xỉ phân phối nhị thức bằng phân phối chuẩn Trang 72
Định lý 4.7. Giả sử biến ngẫu nhiên rời rạc X ∼ B(n, p). Nếu n.p ≥ 5 và n.q ≥ 5, với q = 1 − p thì, X − np √ ∼ N(0, 1), khi n → ∞. (4.10) npq Chúng ta biết rằng đối với phân phối nhị thức P [X = k] > 0, tuy nhiên nếu dùng công k − np thức của phân phối chuẩn thì P Z = √ = 0. Để hạn chế sai số trong những npq trường hợp như trên, ta có thể dùng công thức sau để hiệu chỉnh k2 − µ − 0, 5 k1 − µ − 0, 5 P [k1 ≤ X < k2] = ϕ − ϕ (4.11) σ σ Các biến cố [a ≤ X ≤ b], [a < X < b], [a < X ≤ b] đều có thể đưa về dạng [a ≤ X < b]. Chẳng hạn [a < X ≤ b] = [a + 1 ≤ X < b + 1]. Ví dụ 106. Một khách sạn nhận đặt chỗ của 325 khách hàng cho 300 phòng vào ngày 31 tháng 12 vì theo kinh nghiệm của những năm trước cho thấy tỉ lệ khách đặt chỗ nhưng không đến là 10%. Hãy tính xác suất a) Có 300 khách đến để nhận phòng vào ngày trên. b) Tất cả khách đến vào ngày trên đều nhận được phòng. Gọi X là số khách đã đặt phòng và đến vào ngày 31 tháng 12. Đối với mỗi khách hàng đặt phòng, chỉ có 2 khả năng: "đến" và "không đến", với xác suất "đến" luôn không đổi là p = 0, 9, Vì vậy X ∼ B(n = 325; p = 0, 9). Áp dụng công thức xấp xỉ ta có X − np √ √ √ ∼ N(0, 1), với n.p = 292, 5, n.p.q = 29, 25. npq a) Nếu X = 300 thì xác suất P [X = 300] = P [300 ≤ X < 301]. Dựa theo công thức hiệu chỉnh (4.11), ta có 301 − µ − 0, 5 300 − µ − 0, 5 P [300 ≤ X < 301] = ϕ − ϕ σ σ = ϕ(1, 48) − ϕ(1, 29) = 0, 9306 − 0, 9015 = 0, 0291 Trang 73
b) Nếu tất cả các khách đến vào ngày 31 tháng 12 đều nhận được phòng thì xác suất cần tính là P [X ≤ 300]. Dựa theo công thức hiệu chỉnh (4.11) ta có P [X ≤ 300] = P [1 ≤ X 0.  n n + 1 Γ +∞ 1 2 R p−1 −x với c = √ n và Γ(p) = x e dx. πn Γ 0 2 6.1. Tính chất Định lý 4.8. Giả sử Z, Z1,Z2, , Zn ∼ N(0; 1). Khi đó Z T = n ∼ t(n). 1 P 2 Zi n i=1 Trang 74
6.2. Đồ thị Đồ thị của hàm mật độ phân phối Student cũng có dạng hình chuông như đồ thị hàm mật độ phân phối chuẩn tắc (nhưng có đỉnh thấp hơn và "phần đuôi" trải rộng hơn phân phối chuẩn). Ví dụ 108. 7. Phân phối χ2 (Khi bình phương) Biến ngẫu nhiên X gọi là có phân phối khi bình phương với n bậc tự do, kí hiệu X ∼ χ2(n), nếu hàm mật độ xác suất của nó có dạng   0, nếu x ≤ 0; f(x) = n x (4.13) −1 −  c.x 2 .e 2 , nếu x > 0. 1 với c = n . n 2 2 .Γ 2 7.1. Tính chất Định lý 4.9. Gả sử X1,X2, , Xn ∼ N(0; 1) và là các biến ngẫu nhiên độc lập. Khi đó 2 2 2 2 X1 + X2 + Xn ∼ χ (n). (4.14) 7.2. Đồ thị Đồ thị của hàm mật độ phân phối χ2 có dạng hình chuông lệch. Trang 75
Trang 76
Chương 5 Chọn mẫu và phân phối mẫu 5.1 Chọn mẫu từ một tổng thể 5.1.1 Tổng thể Tổng thể là tập hợp tất cả các đối tượng mà ta quan tâm nghiên cứu trong thực tiễn khi xử lý số liệu thống kê. Số phần tử của tổng thể được ký hiệu là N. - Nếu N là số hữu hạn ta có tổng thể hữu hạn - Nếu N là số vô hạn ta có tổng thể vô hạn Chẳng hạn, khi muốn xác định chiều cao trung bình của người Việt Nam thì tổng thể là toàn bộ thanh niên Việt Nam, còn khi muốn xác định thu nhập bình quân của một hộ dân ở Tp. Hồ Chí Minh thì tổng thể là toàn bộ các hộ dân ở Tp. Hồ Chí Minh,. . . Trong thực tế người ta không thực hiện cách lấy mẫu là tổng thể vì nhiều lý do như: tốn kém chi phí, việc thực hiện mất nhiều thời gian,. . . Do đó mà nhà phân tích sẽ chọn ra một mẫu gồm một số phần tử, tiến hành quan sát chúng, và sử dụng những quan sát này để rút các kết luận về đặc điểm của tổng thể mà mẫu phần tử làm đại diện. Quá trình này được gọi là lấy mẫu. 5.1.2 Mẫu Mẫu là tập hợp con của tổng thể và được trích ra từ một tổng thể theo một quy tắc xác định nào đó thì được gọi là mẫu. Số phần tử của mẫu ký hiệu là n (kích thước mẫu hay cỡ mẫu). Trang 77
Có thể có rất nhiều cách lấy mẫu: lấy mẫu ngẫu nhiên, lấy mẫu phán đoán, lấy mẫu chọn lọc, lấy mẫu có hoặc không có hoàn trả phần tử trở lại tổng thể, lấy mẫu phân tầng,. . . Trong giáo trình này, chúng tôi chỉ đề cập đến lấy mẫu ngẫu nhiên, là cách lấy mẫu thường dùng nhất. 5.2 Chọn mẫu ngẫu nhiên đơn giản n Đó là cách chọn n phần tử từ tập tổng thể gồm N phần tử sao cho mỗi tổ hợp trong CN tổ hợp đều có cùng khả năng được chọn như nhau. Kết quả của việc chọn này cho ta các mẫu ngẫu nhiên. Một mẫu ngẫu nhiên của các quan sát đối với một biến ngẫu nhiên X là một tập hợp của các biến ngẫu nhiên độc lập, được phân phối giống nhau X1,X2, ,Xn mỗi biến có cùng phân phối xác suất như phân phối của X. Ví dụ 109. Kết quả điểm môn Toán của một lớp gồm 100 sinh viên cho bởi bảng sau Điểm 3 4 5 6 7 Số sinh viên có điểm tương ứng 25 20 40 10 5 Gọi X là điểm môn Toán của một sinh viên được chọn ngẫu nhiên trong danh sách lớp thì X là biến ngẫu nhiên có bảng phân phối xác suất như sau X 3 4 5 6 7 P[X=x] 0.25 0.2 0.4 0.1 0.05 Chọn ngẫu nhiên 5 sinh viên trong danh sách lớp để xem điểm. Gọi Xi là điểm của sinh viên thứ i. Xi cũng là các biến ngẫu nhiên độc lập có bảng phân phối xác suất giống nhau. Khi đó ta có một mẫu ngẫu nhiên với kích thước là n=5, kí hiệu là (X1,X2,X3,X4,X5)X . Giả sử sinh viên thứ nhất là 4 điểm, sinh viên thứ hai là 3 điểm, sinh viên thứ ba là 6 điểm, thứ tư là 7 điểm và thứ năm là 5 điểm. Lúc này ta được một mẫu cụ thể (4, 3, 6, 7, 5)X . 5.2.1 Phân loại mẫu theo phương pháp chọn mẫu a) Mẫu không hoàn lại: Là mẫu được chọn bằng cách phần tử đã lấy ra quan sát thì loại khỏi tổng thể rồi mới lấy phần tử tiếp theo. Trang 78
b) Mẫu hoàn lại: Là mẫu được chọn bằng cách phần tử đã lấy ra quan sát được bỏ trở lại tổng thể rồi mới lấy phần tử tiếp theo. Ví dụ 110. Khi nghiên cứu về số cá trong một ao cá thì số cá trong ao là kích thước của tổng thể. Nếu từ ao ta bắt lên 5 con cá thì ta được một mẫu không hoàn lại, kích thước 5. Nếu từ ao ta bắt lên 1 con cá sau đó thả xuống ao mới bắt tiếp con khác, tiến hành như vậy 5 lần thì ta được một mẫu có hoàn lại, kích thước 5. 5.2.2 Phân loại mẫu theo mục đích nghiên cứu a) Mẫu định tính: Là mẫu mà ta chỉ quan tâm đến các phần tử của nó có một tính chất A nào đó không. Ví dụ 111. Sinh viên được gọi là sinh viên giỏi nếu điểm trung bình môn học là >= 8.0. m Tham số đặc trưng của mẫu định tính là: f = (gọi là tỷ lệ mẫu hay tần suất mẫu) n m: số phần tử có tính chất cần quan tâm n: tổng số các phần tử của mẫu b) Mẫu định lượng: Là mẫu mà ta quan tâm đến một hoặc một vài biến ngẫu nhiên gắn liền với từng phần tử của mẫu: X hoặc X, Y Ví dụ 112. Nghiên cứu điểm trung bình môn XSTK của toàn thể sinh viên Việt Nam: X Nghiên cứu về chiều cao và trọng lượng trung bình của sinh viên Việt Nam: X, Y Khi khảo sát đám đông X ta thu thập số liệu của mẫu có kích thước n là (x1, x2, . . . , xn) và thường lập bảng số liệu theo các dạng sau: Dạng 1: (Mẫu liệt kê) Liệt kê dưới dạng: x1, x2, . . . , xn trong đó mỗi số liệu có thể lặp lại nhiều lần. Ví dụ 113. Người ta đo ion Na+ trên một số người và ghi nhận lại được kết quả như sau: 129, 132, 140, 141, 138, 143, 133, 137, 140, 143, 138, 140 Trang 79
Dạng 2: (Mẫu lặp) Lập bảng có dạng X x1 x2 . . . xk Tổng ni n1 n2 . . . nk n Trong đó ni là tần số giá trị xi trong mẫu và n1 + + nk = n và x1 < x2 < . . . < xk ni: là tần số xuất hiện của giá trị xi. Ví dụ 114. Điều tra năng suất lúa trên diện tích 100 hecta trồng lúa của một vùng, ta thu được bảng số liệu sau Năng suất (tạ/ha) 41 44 45 46 48 52 54 Số ha có năng suất tương ứng 10 20 30 15 10 10 5 Tham số đặc trưng của mẫu định lượng là: Trung bình mẫu k 1 X x = nixi (5.1) n i=1 Phương sai mẫu k 2 1 X 2 2 s = nix − (x) . (5.2) b n i i=1 √ 2 Độ lệch chuẩn mẫu sb = sb Phương sai mẫu hiệu chỉnh s2 s2 = b . (5.3) n − 1 √ Độ lệch chuẩn mẫu hiệu chỉnh s = s2 Dạng 3: (Mẫu chia khoảng) X (a1a2](a2a3] (an−1ak] Tổng ni n1 n2 . . . nk n Trong đó ni là tần số giá trị rơi vào khoảng (ai, ai+1]vn1 + n2 + + nk = n ai + ai+1 Với xi = . 2 Trang 80
Ví dụ 115. Đo đường kính của 100 chi tiết do một nhà máy sản xuất kết quả cho ở bảng sau Đường kính (mm) Số chi tiết 19,80 - 19,85 3 19,85 - 19,90 5 19,90 - 19,95 16 19,95 - 20,00 28 20,00 - 20,05 23 20,05 - 20,10 14 20,10 - 20,15 7 20,15 - 20,20 4 Tính các tham số đặc trưng của mẫu: x, s,b s 5.3 Phân phối chọn mẫu 5.3.1 Thống kê Giả sử Ω là một tổng thể và (X1,X2, ,Xn) là một mẫu ngẫu nhiên có kích thước n. Một hàm xác định trên mẫu (X1,X2, ,Xn), kí hiệu là f(X1,X2, ,Xn), được gọi là một thống kê. Sau đây chúng ta sẽ xét các thống kê thường gặp. 5.3.2 Trung bình mẫu Giả sử Ω là một đám đông và (X1,X2, , Xn) là mẫu kích thước n. Khi đó trung bình mẫu là đại lượng n P Xi i=1 Xn = (5.4) n hay n P niXi i=1 Xn = (5.5) n nếu Xi lặp lại ni lần. Trang 81
Định lý 5.1. Nếu (X1,X2, ,Xn) là một mẫu ngẫu nhiên có hàm mật độ xác suất f(x) với σ2 EX = µ, V arX = σ2 thì EX = µ, V arX = n n n Nhận xét: i) Nếu X ∼ B(n, p) thì X ∼ B(n, p). ii) Nếu X ∼ P (λ) thì X ∼ P (λ). σ2 iii) Nếu X ∼ N(µ, σ2) thì X ∼ Nµ, . n iv) Nếu X ∼ χ2(n) thì X ∼ χ2(n). Ví dụ 116. Cho Y là biến ngẫu nhiên có phân phối nhị thức, Y ∼ B(n, p). Bởi vì biến ngẫu nhiên của phân phối nhị thức mô tả số lần thành công trong n lần của phép thử Bernoulli, n P nên ta có thể xem Y như là tổng của n biến ngẫu nhiên Bernoulli Xi,Y = Xi với mỗi biến i=1 ngẫu nhiên Xi có phân phối nhị thức, Xi ∼ B(1, p). Khi đó ta có EY = np, V arY = npq vì n P X i Y E(X ) = p và V ar(X ) = pq. Lúc này X = i=1 = là trung bình mẫu của phân phối nhị i i n n Y pq thức, ký hiệu là F = (thường được gọi là tỉ lệ mẫu) với E(F ) = p và V ar(F ) = n n n n n 5.3.3 Phương sai mẫu Phương sai mẫu là n P 2 Xi − Xn i=1 Sb2 = (5.6) n n Phương sai mẫu hiệu chỉnh là n P 2 Xi − Xn S2 = i=1 (5.7) n n − 1 Phương sai mẫu và phương sai mẫu hiệu chỉnh được liên hệ với nhau bởi công thức sau n S2 = .Sb2 (5.8) n n − 1 n Trong tính toán, ta thường dùng công thức 2 2 2 Sbn = Xn − Xn (5.9) Trang 82
trong đó n P 2 Xi X2 = i=1 (5.10) n n 2 2 n 2 2 Định lý 5.2. Nếu biến ngẫu nhiên X có phương sai V arX = σ thì E(Scn ) = σ ,E(S ) = n − 1 n σ2 Nhận xét: Giả sử một mẫu ngẫu nhiên (X1,X2, ,Xn) có kích thước n được xây dựng từ một biến ngẫu nhiên X có phân phối chuẩn với kỳ vọng EX = µ, phương sai V arX = σ2. Khi đó 2 n X − X nSb P i n 2 i) 2 = 2 ∼ χ (n − 1) σ i=1 σ n X − µ P i 2 ii) 2 ∼ χ (n) i=1 σ 5.3.4 Tỷ lệ mẫu Giả sử Ω là một đám đông và A là tính chất (hay dấu hiệu) cần quan sát trong mẫu. Khi đó đặt   1, nếu Xi có tính chất A Xi = , i = 1, 2, , n  0, trường hợp khác Tỉ lệ mẫu là n P Xi i=1 Fn = (5.11) n Ví dụ 117. Cân 45 con heo 3 tháng tuổi trong một trại chăn nuôi, người ta thu được kết quả sau Xi 35 37 39 41 43 45 47 ni 2 6 10 11 8 5 3 a) Hãy tính các giá trị trung bình, phương sai và phương sai hiệu chỉnh của mẫu trên. b) Giả sử heo có trọng lượng lớn hơn hay bằng 38kg là đạt chuẩn. Hãy tính tỉ lệ heo đạt chuẩn trong mẫu. Trang 83
Để tính toán các thông số đề bài yêu cầu chúng ta có bảng sau 2 Xi ni ni.Xi ni.Xi 35 2 70 2450 37 6 222 8214 39 10 390 15210 41 11 451 18491 43 8 344 14792 45 5 225 10125 47 3 141 6627 P 45 1843 75909 k k P P 2 n ni.Xi ni.Xi i=1 i=1 Ví dụ 118. Nghiên cứu trọng lượng của một giống vịt mới, người ta thu được kết quả sau Cân nặng (kg) 1,25 1,5 1,75 2 2,25 2,5 2,75 3 Số con 2 6 24 35 39 24 14 6 Hãy tính các đặc trưng của mẫu số liệu trên. Trong thực tế, nhiều khi dữ liệu được cho bởi bảng phân phối tần số ghép lớp. Khi đó chúng ta cần phải tìm phần tử đại diện cho lớp rồi mới tính các số đặc trưng của mẫu. Ví dụ 119. Đo chiều cao các nam sinh lớp 10 tại một trường THPT, người ta thu được kết quả sau Chiều cao (m) 1,5-1,55 1,55-1,6 1,6-1,65 1,65-1,7 Số học sinh 4 27 23 12 Hãy tính các số đặc trưng của mẫu trên. Để tính các số đặc trưng của mẫu trên, chúng ta lập bảng các phần tử đại diện cho lớp như sau Chiều cao (m) 1,525 1,575 1,625 1,675 Số học sinh 4 27 23 12 ai + bi Giá trị của phần tử đại diện xi = . 2 Nhận xét: pq Nếu tổng thể có tỉ lệ là p thì E(Fn) = p và V ar(Fn) = n Trang 84
5.4 Phân phối mẫu của trung bình mẫu Các mẫu đều có các đặc trưng thống kê của mẫu như trung bình mẫu X, phương sai 2 mẫu hiệu chỉnh Sn đối với mẫu định lượng và Fn đối với mẫu định tính. Phân phối xác suất của các đặc trưng thống kê của mẫu được gọi là phân phối mẫu. Ví dụ 120. Muốn ước lượng trung bình thật sự của tổng thể là µ, ta căn cứ trên trung bình của một mẫu ngẫu nhiên cỡ n. Nếu lấy hết tất cả các mẫu cỡ n có thể có được và tính trung bình của mỗi mẫu rồi đem phân phối các trung bình đó lên đồ thị ta có một phân phối mẫu của các trung bình mẫu. 5.4.1 Kỳ vọng của số trung bình mẫu Là giá trị kỳ vọng của tổng thể µ. Nói cách khác, phân phối mẫu của X có giá trị kỳ vọng là µ. E(X) = µ (5.12) N N P P Xi (Xi − µ) Với kỳ vọng tổng thể µ = i=1 và phương sai tổng thể σ2 = i=1 N N N: Số phần tử của tổng thể n P Xi Trung bình mẫu là X = i=1 n Ví dụ 121. Giả sử tổng thể gồm 5 học sinh có số tuổi là 2, 4, 6, 8 và 10. Khi đó tuổi trung bình của một học sinh là µ = 1/5(2 + 4 + 6 + 8 + 10) = 6. 2 Giả sử lấy mẫu ngẫu nhiên không hoàn lại với cỡ mẫu là 2. Ta có C5 = 10 mẫu khác nhau (với cỡ mẫu là 2). Và mỗi mẫu sẽ có số trung bình của mẫu X như sau: Mẫu 2,4 2,6 2,8 2,10, 4,6 4,8 4,10 6.8 6,10 8,10 X 3 4 5 6 5 6 7 7 8 9 Phân phối mẫu của số trung bình mẫu X là Mẫu 3 4 5 6 7 8 9 X 0,1 0,1 0,2 0,2 0,2 0,1 0,1 Kỳ vọng của X là E(X) = µ = 6 Trang 85
5.4.2 Phương sai của số trung bình mẫu a) Trường hợp tổng thể vô hạn X σ2 Phương sai của số trung bình mẫu được ký hiệu là X σ2 V ar(X) = σ2 = (n < N). (5.13) X n b) Trường hợp tổng thể hữu hạn Với σ2 là phương sai của tổng thể, n là cỡ mẫu. σ2 N − n V ar(X) = σ2 = (5.14) X n N − 1 Nhận xét: - σX < σ - Nếu n tăng thì σX giảm vì các trung bình X → µ Ví dụ 122. Tính phương sai của X trong Ví dụ 120 5.4.3 Độ lệch chuẩn của số trung bình mẫu Độ lệch chuẩn của X được ký hiệu (σX ) √ σ σ = σ 2 = √ Đối với tổng thể vô hạn X X n Hay σ rN − n σ = √ Đối với tổng thể hữu hạn X n N − 1 5.4.4 Lấy mẫu từ tổng thể theo phân phối chuẩn 5.4.4.1 Luật phân phối của số trung bình mẫu Nếu tổng thể của biến ngẫu nhiên X tuân theo phân phối chuẩn với kỳ vọng là µ và phương sai σ2 thì số trung bình mẫu X sẽ tuân theo phân phối chuẩn cũng với kỳ vọng là µ và phương sai σ2/n. σ2 X ∼ N(µ, σ2) thì X ∼ N(µ, ) n Trang 86
5.4.4.2 Chuẩn hóa số trung bình mẫu X − µ X µ σ2 Z = µ Nếu có kỳ vọng là và phương sai là X thì có kỳ vọng là 0 và phương σX sai là 1. X ∼ N(µ, σ2 ) Z ∼ N(0, 1) X thì Ví dụ 123. Chiều cao của 2000 sinh viên của một trường đại học có phân phối chuẩn với kỳ vọng là µ = 168cm và độ lệch chuẩn σ = 6cm. Hãy tính xác suất để trung bình của một mẫu ngẫu nhiên gồm 100 sinh viên có chiều cao lớn hơn 170 cm. Giải: Do cỡ mẫu n = 100 nhỏ hơn so với cỡ N = 2000 của tổng thể ta xem như việc chọn mẫu có hoàn lại. Vì chiều cao X của tổng thể có phân phối chuẩn N(168, 62) nên trung bình √ của mẫu X có phân phối chuẩn: X ∼ N(168, 6/ 100) = N(168, 0.6) Ta tính P (X > 170). X − µ Đổi biến: Z = = (X − 168)/0.6 = (170 − 168)/0.6 = 3.33 σX Vậy P (X > 170) = P (Z > 3.33) = 0.5 − 0.49957 = 0.00043 Ví dụ 124. Phòng tổ chức nhân sự của một xí nghiệp nghiên cứu về thời gian bị mất đi do sự vắng mặt của các nhân viên. Trong thời gian một năm nghiên cứu trên từng sinh viên, phòng tìm được thời gian bị mất trung bình là 21 ngày với độ lệch chuẩn là 10 ngày. Một nhóm nhân viên gồm 49 người được chọn làm ngẫu nhiên để thử nghiệm một cách làm việc theo lịch biểu linh động với hy vọng thời gian vắng mặt sẽ giảm (trong tương lai). 1. Tính xác suất để thời gian bị mất do vắng mặt của nhóm có trung bình lớn hơn 21 ngày. 2. Tính xác suất để trung bình của mẫu nằm trong khoảng từ 19 đến 23 ngày. 3. Tính các giá trị nằm cách đều thời gian trung bình bị mất chứa 95% các giá trị trung bình của mẫu. Ví dụ 125. Một công ty chế biến thực phẩm gói một loại sản phẩm được kiểm nghiệm thường xuyên. Cơ quan kiểm nghiệm qui định rằng mỗi sản phẩm không được chứa nhiều hơn 2.0g chất độc. Các số liệu đã qua, ghi nhận rằng các gói thực phẩm có trọng lượng chất độc trung bình là 1.25g mỗi gói và các trọng lượng chất độc được phân phối chuẩn xung quanh 1.25g và độ lệch chuẩn là 0.5g. 1. Tính tỷ lệ số gói thực phẩm vượt quá giới hạn cho phép. Trang 87
2. Tính xác suất để gói thực phẩm có độc chất từ 1.75 đến 2g. 3. Một nhóm nhân viên kiểm nghiệm chọn ngẫu nhiên một mẫu 25 gói. Nếu họ thấy trọng lượng trung bình của mẫu đó lớn hơn 1.6g thì họ sẽ đóng cửa nhà máy và kiểm tra chặt chẽ toàn bộ kho hàng của nhà máy. Tính xác suất để nhà máy bị đóng cửa. 5.4.5 Lấy mẫu từ tổng thể không theo phân phối chuẩn Định lý giới hạn trung tâm X − µ Khi n lớn thì Z = √ sẽ gần đúng phân phối chuẩn tắc hay X có phân phối chuẩn σ/ n với số trung bình là µ và phương sai là σ2/n σ2 Khi n lớn thì Z ∼ N(0, 1) hay X ∼ Nµ, n Ví dụ 126. Tại một cửa hàng, các hóa đơn được lưu trữ cho thấy rằng dữ liệu về doanh số của cửa hàng có dạng phân phối lệch phải với trung bình tổng thể là 12,5 triệu đồng/khách và độ lệch chuẩn là 5,5 triệu đồng/khách. Người quản lý cửa hàng đã chọn một mẫu ngẫu nhiên 100 hóa đơn bán hàng, người này muốn biết xác suất để trung bình của mẫu lấy được sẽ nằm trong phạm vi từ 12,25 đến 13 triệu đồng là bao nhiêu. 5.5 Phân phối mẫu của phương sai mẫu 5.5.1 Kỳ vọng của phương sai mẫu Phương sai mẫu ký hiệu là S2 n 2 1 X 2 S = (Xi − X) (5.15) n − 1 i=1 n P 2 2 Xi − nX Trong tính toán người ta thường viết S2 = i=1 n − 1 Kỳ vọng của phương sai mẫu E(S2) chính là phương sai của tổng thể σ2. Nói cách khác, phân phối mẫu của S2 có số trung bình là σ2.E(S2) = σ2 Điều kiện: n N Trang 88
5.5.2 Phương sai của phương sai mẫu Phương sai của phương sai mẫu được ký hiệu V ar(S2).V ar(S2) tùy thuộc vào quy luật phân phối của tổng thể. ! n − 3 µ − σ4 4 n − 1 V ar(S2) = , n > 1 (5.16) n Nếu tổng thể tuân theo phân phối chuẩn thì 2σ4 V ar(S2) = n − 1 Định lý 5.3. Nếu (X1,X2, ,Xn) là một ngẫu nhiên có hàm mật độ xác suất f(x) tuân theo phân phối chuẩn N(µ, σ2) thì i) X,Xi − X(i = 1 n) là độc lập ii) X,S2 là độc lập (n − 1)S2 iii) ∼ χ2(n − 1) σ2 Ví dụ 127. Một nhà sản xuất sữa hộp muốn trọng lượng trung bình của các hộp sữa sản xuất ra phải gần bằng trọng lượng đã được quảng cáo. Giả sử phân phối trọng lượng của tổng thể tuân theo phân phối chuẩn. Nếu lấy ngẫu nhiên 20 hộp đem đi kiểm tra. Tìm 2 số K1 và K2 sao cho: ! S2 a) P K = 0, 05 σ2 2 5.6 Phân phối mẫu của tỷ lệ mẫu 5.6.1 Tỷ lệ mẫu Gọi Fn là tỷ lệ mẫu ngẫu nhiên với n P Xi i=1 Fn = (5.17) n Trang 89
5.6.2 Kỳ vọng và phương sai của tỷ lệ mẫu Giả sử Fn là tỷ lệ mẫu ngẫu nhiên. Khi đó đặt   1, nếu Xi có tính chất A Xi =  0, trường hợp khác pq Nếu tổng thể có tỉ lệ là p thì E(Fn) = p và V ar(Fn) = n 5.6.3 Luật phân phối của tỷ lệ mẫu Phân phối mẫu của tỷ lệ mẫu có thể được xấp xỉ bởi phân phối chuẩn khi cỡ mẫu là đủ lớn * np ≥ 5 * n(1 − p) ≥ 5 Fn − p Biến ngẫu nhiên Z = thì Z có thể được xấp xỉ bởi phân phối chuẩn tắc N(0, 1) rpq n rpq Fn ∼ N(p, ) thì Z ∼ N(0, 1) n Ví dụ 128. Một cuộc thăm dò dư luận được tiến hành trong một cuộc bầu cử. Nếu trong một cuộc thăm dò một ứng viên được 55% số phiếu thì được tiên đoán đắc cử. Nếu chọn một mẫu ngẫu nhiên có 100 người. Hãy tính xác suất để ứng cử viên A được tiên đoán đắc cử, giả sử số phiếu thật sự của ông ta là 50.1%. Giải: Ta có p = 50.1% p Gọi f là tỷ lệ mẫu có phân phối chuẩn. f ∼ N(0, 501; 0, 501 ∗ (1 − 0, 501)/100) = N(0, 501; 0, 05). Ta phải tính P (f ≥ 0, 55) = P (Z ≥ (0, 55 − 0, 501)/0, 05 ≥ 0, 55) Trang 90
Suy óan c l ng, Ki m nh Mu Tng th (Bi t) (Ch a bi t) Ly m u Ch ơ ng 6 ƯỚC L ƯỢNG 6.1 Khái ni ệm Chúng ta bi t r ng i v i m t bi n ng u nhiên X, n u ta bi t hàm phân ph i xác su t c a X ta có th tìm c các tham s c tr ng c a X nh : µ, σ 2 ,p Ng c l i n u bi t n u bi t bi n ng u nhiên X có lo i phân ph i nào (ch ng h n nh phân ph i Poison, chu n, ) và m t vài s c tr ng (mà t gi v sau ta g i chung là θ=( µ , σ 2 ,p) ) nh : * Trong phân ph i nh th c: xx nx− f(x;)θ = Cp(1p)n − ⇒ θ =ρ , θ∈ [ 0,1 ] * Trong phân ph i Poison e−λ λx f(x;)θ = ⇒ θ=λ , λ> 0 x! * Trong phân ph i chu n (x−µ ) 2 − 1 2 f(x;)θ= e2σ , θ=µσ (,)2 2πσ 2 thì ta có th tìm hàm phân ph i xác su t c a X. Bài toán tìm hàm phân ph i xác su t c a bi n ng u nhiên X khi ch a bi t tham s θ=( µ , σ 2 ,p) c g i là bài toán c l ng tham s. Th c t trong th ng kê, vi c xác nh các tham s θ=( µ , σ 2 ,p) cho t ng th th ng khó kh n. Vì v y, thay vì tìm các tham s c a t ng th , ng i ta tìm các tham s m u ( th ng gi là (θ = X,S2 ,F ) ) d a vào các m u quan sát c th ta có th c l ng c các tham s c a t ng th . c l ng tham s θ=( µ , σ 2 ,p) c a tng th d a trên mu ng u nhiên c kí hi u là θ = θ ()X1 ,X 2 , , X n 6.2 Ước l ượng điểm 7
Vi m i kích th c m u ng u nhiên n nu tham s m u θ = θ ()X1 ,X 2 , , X n cung c p m t giá tr c th thì giá tr này c g i là c l ng im c a θ=( µ , σ 2 ,p) . c l ng im ca θ=( µ , σ 2 ,p) này là không duy nh t. 2 Th t v y, xét bi n ng u nhiên X~N(µ , σ ) và X1 ,X 2 , , X n là m u ng u nhiên ơ n gi n ca bi n ng u nhiên X. Khi ó v i n= 2 ,3 ta có X1+ X 2 θ1 = = X 2 2 X+ X + X θ =1 2 3 = X 23 3 u là các c l ng im c a giá tr trung bình µ c a X. Vì v y ánh giá các c l ng, ng i ta a ra các khái ni m ( tiêu chu n) sau. 6.2.1 Ước l ượng không ch ệch Định ngh ĩa 6.1 c l ng θ c g i là c l ng không ch ch c a tham s th ng kê θ nu và ch n u E(θ ) = θ Định lý 6.1 Cho m t m u ng u nhiên X1 ,X 2 , , X n độc l ập, phân ph ối xác su ất gi ống nhau và gi ng bi n ng u nhiên X~N(µ , σ 2 ) . Giá tr k v ng c a m u ng u nhiên, E(X) , là m t c l ng không ch ch c a µ. 2 Ví d 1: Xét bi n ng u nhiên X~N(µ , σ ) và X1 ,X 2 , , X n là m u ng u nhiên ơ n gi n ca bi n ng u nhiên X. Khi ó v i n= 2 ,3 ta có X1+ X 2 θ1 = = X 2 2 X+ X + X θ =1 2 3 = X 23 3 u là các c l ng không ch ch c a tham s µ . Trong Ví d trên c hai θ1, θ 2 u là các c l ng không ch ch c a µ. Tuy nhiên chúng ta không th so sánh c c l ng nào là t t h ơn. Mu n so sánh hai c l ng này chúng ta c n bi t ph ơ ng sai c a chúng. c l ng nào có ph ơ ng sai nh h ơn thì c lng ó t t h ơn. Bng cách dùng ph ơ ng sai, chúng ta suy ra c c l ng θ2 t t h ơn θ1 . Nh ận xét: G i θ là c l ng c a θ khi ó hi u s E(θ ) − θ c g i là độ ch ệch ca c l ng. i v i c l ng không ch ch thì hi u s này là 0. (V ẽ hình) 8