Giáo trình môn Xác suất thống kê

116 trang vanle 26940

Download

Bạn đang xem 20 trang mẫu của tài liệu "Giáo trình môn Xác suất thống kê", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

giao_trinh_mon_xac_suat_thong_ke.pdf

Nội dung text: Giáo trình môn Xác suất thống kê

Giáo trình XÁC SUẤT THỐNG KÊ
ĐẠI CƯƠNG VỀ GIẢI TÍCH TỔ HỢP 1. TẬP HỢP Tập hợp là một khái niệm nguyên thủy, không có định nghĩa. Sự gom góp một số đối tượng lại với nhau cho ta hình ảnh của tập hợp và các đối tượng được gom góp này trở thành phần tử của tập hợp. Người ta thường ký hiệu tập hợp bằng các ký tự in như A, B, C, , X, Y, và phần tử bằng các ký tự thường như a, b, c, , x, y. Nếu x là một phần tử của A, ta viết xA∈ . Ngược lại, nếu x không là phần tử của A, ta viết xA∉ . 1.1. Các phương pháp xác định tập hợp. Có ba phương pháp xác định tập hợp : Phương pháp liệt kê, phương pháp trưng tính và phương pháp dùng giản đồ Venn. Phương pháp liệt kê : Các phần tử của tập hợp được viết xuống giữa hai ngoặc nhọn, “{“ và “}”, phần tử khác nhau được phân cách bởi dấu phẩy và thỏa hai điều kiện : − Không chú ý thứ tự liệt kê, − Mỗi phần tử chỉ được liệt kê một lần, không lặp lại. Chẳng hạn, các tập hợp A = {a, b, c} và Bc,b,a= { } là như nhau do chúng chỉ khác nhau ở thứ tự liệt kê các phần tử; C1,0,1= { } không hợp lệ vì phần tử 1 được liệt kê hai lần. Phương pháp trưng tính : Đưa ra một tính chất mà chỉ có phần tử của tập hợp tương ứng được thỏa. Chẳng hạn, gọi A là tập các số nguyên chẵn. Tính chất 1 số nguyên chẵn là tính chất đặc trưng cho tập A. Khi đó, 2,2 ∉ A vì chúng không là số nguyên; 3, 5∉ A vì chúng là số nguyên nhưng không là số chẵn; 10,100∈ A vì chúng là số nguyên và là số chẵn. Tổng quát, người ta dùng một hàm mệnh đề p(x) theo một biến xX∈ , nghĩa là ứng với mỗi xX∈ , ta có một mệnh đề p(x). Tập A các phần tử xX∈ sao cho mệnh đề p(x) có chân trị đúng được ký hiệu là A =∈{xXp(x)} . Khi đó, ta có ∀∈xX,xA ∈ ⇔ p(x). Nói khác đi, x thuộc về A nếu và chỉ nếu p(x) là mệnh đề đúng. Chẳng hạn, tập A các số nguyên chẵn được viết lại là A =∈{x x chia hết cho 2} . 1
Phương pháp dùng giản đồ Venn : Người ta dùng một đường cong đơn khép kín, chia mặt phẳng ra làm hai miền, miền phía trong đường cong dành để liệt kê các phần tử của tập hợp, miền phía ngoài đường cong dành để liệt kê các phần tử không nằm trong tập hợp. Chẳng hạn, ta có x, a∈ A , y, b∉ A . y x b a 2. CÁC PHÉP TOÁN TẬP HỢP. Với hai tập hợp A và B, ta nói A là một tập con của B, ký hiệu A ⊂ B , khi mọi phần tử của A đều là phần tử của B, ∀x, x∈⇒∈ A x B . Tập tất cả các tập con của một tập X cho trước được ký hiệu là P (X) , P (X)=⊂{ A A X}. Hiển nhiên X ⊂ X và do đó X ∈P (X) . Ngoài ra, tập hợp không có phần tử nào cả được gọi là tập hợp rỗng, ký hiệu ∅ và ta quy ước tập hợp rỗng là tập con của mọi tập hợp, nghĩa là ∅⊂X hay ∅ ∈P (X), với mọi tập hợp X. Ví dụ, với A = {a, b, c,d} , Ba,b,c= { } và Cb,c,d= { } , ta có B, C⊂ A vì mọi phần tử của B cũng như của C đều là phần tử của A. Tuy nhiên BC⊂/ vì tồn tại phần tử aB∈ nhưng aC∉ và CB⊂/ vì tồn tại phần tử dC∈ nhưng dB∉ . Cho X là một tập hợp không rỗng và A, B là hai tập con bất kỳ của X, ta định nghĩa Phần giao của A và B, ký hiệu A ∩ B , là tập các phần tử vừa thuộc về A, vừa thuộc về B, A ∩ BxXxAxB=∈{ ∈∧∈} . Phần hội của A và B, ký hiệu A ∪ B , là tập các phần tử thuộc về A hay thuộc về B, A ∪ BxXxAxB=∈{ ∈∨∈} . Phần hiệu của A cho B, ký hiệu A \B, là tập các phần tử thuộc về A nhưng không thuộc về B, 2
A \B=∈{ x X x ∈∧∉ A x B} . Phần bù của A trong X, ký hiệu A , là tập các phần tử thuộc về X mà không thuộc về A, A =∈{xXxA ∉} . Phần giao, phần hội, phần hiệu của A và B cũng như phần bù của A trong X có thể biểu diễn bởi giản đồ Venn như sau X X A A B B A ∩ B A ∪ B X X A A B A \B A Với X là một tập hợp không rỗng, A, B, C là các tập con của X, ta có một số tính chất thường dùng sau : (i) A ∪∩()()BC= AB ∪∩∪( AC) , A ∩∪()()()BC= AB ∩∪∩ AC. (ii) A ∪∩BAB= , A ∩∪BAB= . (iii) AA∩ =∅, A ∪ AX= . Khi đó, ta nói A và A tạo thành một phân hoạch cho X và với một tập con B bất kỳ của X, ta có BBABA= ()∩∪∩(), ()BA∩∩∩() BA= ∅ , nghĩa là BA∩ , BA∩ tạo thành một phân hoạch cho B. A − B B A B A − A Tổng quát, với n tập con A1 , A2 , , An , của X sao cho Aij∩ A =∅ khi ij≠ , nghĩa là các tập con này đôi một không có phần tử chung, và 3
A12∪∪∪A A n= X , ta nói A1 , A2 , , An tạo thành một phân hoạch cho X. Khi đó, với một tập con bất kỳ B của X, ta có B= ()()() B∩∪∩∪∪∩ A12 B A B A n, (BA∩∩∩ij) ( BA) = ∅ khi ij≠ . Nói khác đi, BA∩ 1 , BA∩ 2 , BA∩ n tạo thành một phân hoạch cho B. X A A1 2 B B An B A1 An B A 2 3. QUY TẮC ĐẾM. Trong phần còn lại, ta chỉ khảo sát các tập hợp hữu hạn, nghĩa là các tập X mà phần tử của nó có thể liệt kê theo thứ tự là x1 , x2 , , xn , X = {x12 , x , , x n} . Ta nói X có n phần tử, ký hiệu X = n . Ta có Công thức cộng. Cho X và Y là hai tập hợp hữu hạn và không có phần tử chung, nghĩa là X ∩ Y =∅. Ta có X ∪ YXY=+. Nói khác đi, số phần tử của X ∪ Y chính là tổng số phần tử của X và của Y. Tổng quát, nếu k tập hợp X1 , X2 , , Xk đôi một không có phần tử chung, nghĩa là Xij∩ X = ∅ khi ij≠ , thì số phần tử của X12∪∪∪X X k chính là tổng số phần tử của các tập X1 , X2 , , Xk , X12∪∪∪X XX k=+++ 1 X X 2 k. Ngoài ra, với hai tập hợp X và Y, tập tất cả các bộ thứ tự ()x, y , với x∈ X và yY∈ được gọi là tập hợp tích của X và Y, ký hiệu X × Y , X ×=Yx,yxXyY{( ) ∈∧∈} . Khi đó, ta có Công thức nhân. Số phần tử của tập hợp tích X × Y chính là tích số các phần tử của X và của Y. X × YXY=⋅. 4
Tổng quát, với k tập hợp hữu hạn X1 , X2 , , Xk , tập hợp tích X12×××X X k xác định bởi X12×××=X X k{( x 12k112 , x , , x) x ∈∧∈∧∧∈ X x X 2 x k X k} có số phần tử chính là tích của số các phần tử của các tập X1 , X2 , , Xk , X12×××=X X k X 12 ⋅ X ⋅⋅ X k Từ các kết quả này, ta khái quát thành các quy tắc đếm như sau : Quy tắc cộng : Giả sử một công việc có thể thực hiện bằng một trong k phương pháp, trong đó phương pháp 1 có n1 cách thực hiện, phương pháp 2 có n2 cách thực hiện, , phương pháp k có nk cách thực hiện, và hai phương pháp khác nhau không có cách thực hiện chung. Khi đó, ta có n12+++ n n k cách thực hiện công việc. Quy tắc nhân : Giả sử một công việc được thực hiện tuần tự theo k bước, trong đó bước 1 có n1 cách thực hiện, bước 2 có n2 cách thực hiện, , bước k có nk cách thực hiện. Khi đó, ta có n12××× n n k cách thực hiện công việc. Chẳng hạn, nếu ta có 4 áo sơ mi ngắn tay và 5 áo sơ mi dài tay thì ta có cả thảy 459+= cách chọn áo. Nếu ta có 9 áo sơ mi và 8 quần tây thì ta có 98×= 72 cách chọn quần áo. 4. GIẢI TÍCH TỔ HỢP Cho X = {x12 , x , , x n} là một tập hợp có n phần tử. Từ X, lấy ra thứ tự k phần tử, a1 , a2 , , ak , ta được một bộ thứ tự các phần tử của X, k ()a12 , a , , a k∈≡××× X X X X , mà ta còn gọi là một chỉnh hợp n chập k. Ta k lần có hai trường hợp : - Trường hợp 1 : Từng phần tử sau khi lấy ra được hoàn lại vào X trước khi lấy phần tử kế tiếp. Khi đó, các phần tử lấy ra có thể trùng nhau, và chỉnh hợp tương ứng được gọi là chỉnh hợp lặp n chập k. - Trường hợp 2 : Các phần tử lấy ra không được hoàn lại, nghĩa là các phần tử lấy ra khác nhau từng đôi một, và chỉnh hợp tương ứng được gọi là chỉnh hợp không lặp n chập k. 5
Ngoài ra, nếu ta không chú ý tới thứ tự lấy ra các phần tử của X. Nói khác đi, từ X ta lấy ra k phần tử, ta được một tập con {a12 , a , , a k} của X mà ta còn gọi là một tổ hợp n chập k. Hiển nhiên là các phần tử của một tổ hợp phải khác nhau từng đôi một. Với các kết quả về phép đếm, ta được i) Số chỉnh hợp lặp n chập k là nk , ii) Số chỉnh hợp không lặp n chập k là n! Ak ==−+−+−()()()nk1nk2 n1n, n ()nk!− n! (iii) Số tổ hợp n chập k là Ck = . n k!() n− k ! Ví dụ 1. (a) Từ một nhóm gồm 10 ứng viên cho một ban cán sự lớp gồm 3 chức danh : Lớp trưởng, lớp phó học tập và lớp phó văn thể. Nếu ứng viên được phép kiêm nhiệm, nghĩa là một ứng viên có thể phụ trách cùng lúc nhiều chức danh, thì mỗi cách thành lập ban cán sự lớp là một chỉnh hợp lặp 10 chập 3 và do đó, có 103 = 1000 cách thực hiện. Nếu ta không chấp nhận kiêm nhiệm, thì mỗi cách thành lập ban cán sự lớp là một chỉnh hợp không lặp 10 chập 3 nên có cả thảy 10! A3 ==⋅⋅=8 9 10 720 cách chọn. 10 ()10− 3 ! (b) Từ nhóm sinh viên nêu trên, mỗi cách chọn ra 3 sinh viên để dự đại hội 10! 8⋅⋅ 9 10 đoàn là một tổ hợp 10 chập 3 nên ta có C3 === 120 cách 10 3!() 10−⋅⋅ 3 ! 1 2 3 chọn. Ví dụ 2. Một hộp đựng 10 viên bi trong đó có 4 bi trắng và 6 bi đen. Mỗi cách lấy ra 5 viên bi là một tổ hợp 10 chập 5 nên có 10! 6⋅⋅⋅⋅ 7 8 9 10 C5 == = 252 cách chọn. 10 5!() 10−⋅⋅⋅⋅ 5 ! 1 2 3 4 5 Để lấy ra 5 viên bi trong đó có 2 bi trắng, ta thực hiện tuần tự hai bước : 4! Bước 1 : Lấy 2 bi trắng trong 4 bi trắng. Có C62 = = cách thực 4 2!() 4− 2 ! hiện. 6! Bước 2 : Lấy 3 bi còn lại trong 6 bi đen. Có C203 == cách. 6 3!() 6− 3 ! Do đó, ta có cả thảy 6×= 20 120 cách thực hiện. 6
Bài tập. 1. Cho A = {1, 2, 3} và B= { 3,4,5,6} . a) Xác định A ∪ B , A ∩ B và A \B. b) Tìm tất cả các tập con của A. 2. Cho A và B là hai tập hợp hữu hạn. Chứng tỏ a) A =+A\B A∩ B. b) A ∪∩BABAB=+− . 3. Cho A, B và C là ba tập hợp hữu hạn. Chứng tỏ A ∪∪BCABCABACBC=++− ∩ − ∩ − ∩ + ABC∩∩ 4. Một khóa số gồm ba vòng khóa, mỗi vòng có mười chữ số : 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Hỏi có tất cả bao nhiêu mã khóa ? 5. Trong một lớp gồm 30 sinh viên, cần chọn ra ba sinh viên để làm lớp trưởng, lớp phó và thủ quỹ. Hỏi có tất cả bao nhiêu cách bầu chọn ? 6. Một hộp đựng 6 bi trắng và 4 bi đen. a) Có tất cả bao nhiêu cách lấy ra 5 bi ? b) Có bao nhiêu cách lấy ra 5 bi trong đó có 2 bi trắng ? 7. Trong một nhóm ứng viên gồm 7 nam và 3 nữ, a) có bao nhiêu cách thành lập một ủy ban gồm 3 người ? b) có bao nhiêu cách thành lập một ủy ban gồm 3 người trong đó có đúng 1 nữ ? c) có bao nhiêu cách thành lập một ủy ban gồm 3 người trong đó có ít nhất 1 nữ ? 7
Chương 1 ĐẠI CƯƠNG VỀ XÁC SUẤT 1. HIỆN TƯỢNG NGẪU NHIÊN Người ta chia các hiện tượng xảy ra trong đời sống hàng ngày thành hai loại : Hiện tượng ngẫu nhiên và hiện tượng tất định. Những hiện tượng mà khi được thực hiện trong cùng một điều kiện như nhau sẽ cho kết quả như nhau được gọi là những hiện tượng tất định. Chẳng hạn, đốt nóng một thanh kim loại trong điều kiện bình thường thì nó dài ra; đun nước đến 100o C trong điều kiện bình thường thì nó bốc hơi. Ngược lại, những hiện tượng mà dù được thực hiện trong cùng một điều kiện như nhau vẫn có thể cho nhiều kết quả khác nhau được gọi là những hiện tượng ngẫu nhiên. Chẳng hạn, tung một con xúc xắc, ta không thể chắc chắn rằng mặt nào sẽ xuất hiện; lấy ra một sản phẩm từ một lô hàng gồm cả hàng chính phẩm lẫn phế phẩm, ta không chắc chắn sẽ nhận được hàng chính phẩm hay phế phẩm. Hiện tượng ngẫu nhiên là đối tượng khảo sát của lý thuyết xác suất và để khảo sát các hiện tượng ngẫu nhiên, người ta cho các hiện tượng này xuất hiện nhiều lần để quan sát. Mỗi lần cho xuất hiện một hiện tượng ngẫu nhiên được gọi là thực hiện một phép thử. Khi đó, dù ta không thể dự đoán được kết quả nào sẽ xảy ra nhưng thường ta có thể liệt kê tất cả các kết quả có thể xảy ra. Tập hợp tất cả các kết quả có thể xảy ra của một phép thử được gọi là không gian mẫu của phép thử đó. Mỗi phần tử của không gian mẫu được gọi là một biến cố sơ cấp và mỗi một tập con của không gian mẫu được gọi là một biến cố. Ta thường ký hiệu τ cho phép thử, Ω cho không gian mẫu tương ứng, ω∈Ω chỉ các biến cố sơ cấp và các tập con A, B, C, của Ω để chỉ các biến cố. Ví dụ 1. Xét phép thử τ : "tung con xúc xắc” và quan sát các mặt xuất hiện. Ta có không gian mẫu Ω={1, 2, 3, 4, 5, 6} , trong đó ω=1, 2, là các biến cố sơ cấp chỉ việc nhận được mặt 1, 2, , tập con A = {2, 4, 6} của Ω chỉ biến cố : "nhận được mặt chẵn", Ví dụ 2. Lấy ngẫu nhiên một sản phẩm từ một lô hàng là một phép thử τ mà không gian mẫu chính là lô hàng đó. Các tập con CP các chính phẩm và PP các phế phẩm là các biến cố mà ta còn gọi là biến cố “nhận được chính phẩm” và “nhận được phế phẩm”. 8
Xét không gian mẫu Ω của một phép thử τ và A ⊂Ω là một biến cố. Sau khi thực hiện phép thử τ , ta nhận được biến cố sơ cấp ω . Nếu ω∈A , ta nói : "biến cố A xảy ra"; ngược lại, nếu ω ∉ A , ta nói : "biến cố A không xảy ra". Chẳng hạn, với phép thử τ : "tung con xúc xắc" và biến cố A : "nhận được mặt chẵn". Khi ta tung con xúc xắc, nếu nhận được mặt 4, ta nói biến cố A xảy ra, nếu nhận được mặt 1, ta nói A không xảy ra, Từ định nghĩa, xét không gian mẫu Ω tương ứng với phép thử τ . Ta luôn luôn có hai biến cố đặc biệt : - Biến cố chắc chắn A =Ω : là biến cố luôn luôn xảy ra khi thực hiện phép thử, - Biến cố không thể có A = ∅ : là biến cố không bao giờ xảy ra khi thực hiện phép thử. Chẳng hạn, xét phép thử "tung hai con xúc xắc", quan sát tổng số các nút xuất hiện, và xét các biến cố A : "tổng số nút ≤ 13”, B : "tổng số nút = 1". Ta có A là biến cố chắc chắn và B là biến cố không thể có. Ngoài ra, do mỗi một biến cố là một tập con của không gian mẫu Ω nên bằng các phép toán tập hợp, với hai biến cố A,B ⊂Ω, ta có thể thành lập các biến cố : CABAB=≡∩ chỉ biến cố "A và B cùng xảy ra". Khi AB =∅, ta nói A và B là hai biến cố xung khắc (A và B không bao giờ cùng xảy ra). CABAB=≡+∪ chỉ biến cố "A xảy ra hay B xảy ra". C\AA=Ω = chỉ biến cố đối lập của A : A xảy ra nếu và chỉ nếu A không xảy ra. Chẳng hạn, với không gian mẫu Ω={1, 2, 3, 4, 5, 6} của phép thử "tung xúc xắc" và các biến cố A = {2, 4, 6}, B1,3,5= { } , C4= { }, ta có : A + B là biến cố chắc chắn, AB là biến cố không thể có và do đó A, B là hai biến cố đối lập (và đương nhiên là hai biến cố xung khắc), B và C là hai biến cố xung khắc (nhưng không đối lập). 2. XÁC SUẤT. Quan sát các biến cố đối với một phép thử, mặc dù không thể khẳng định một biến cố có xảy ra hay không nhưng người ta có thể phỏng chừng cơ may xảy ra của các biến cố này là ít hay nhiều. Chẳng hạn, với phép thử "tung xúc xắc", biến cố "nhận được mặt 1" ít xảy ra hơn biến cố "nhận được mặt chẵn". Do đó, người ta tìm cách định lượng khả năng xuất hiện khách quan của một biến cố mà ta sẽ gọi là xác suất của biến cố đó. 9
Xác suất của một biến cố là một con số đặc trưng cho khả năng xảy ra khách quan của biến cố đó. Xác suất của biến cố A, ký hiệu là P(A), có thể được định nghĩa bằng nhiều cách. 2.1. Định nghĩa cổ điển. Xét một phép thử τ với n kết quả có thể xảy ra, nghĩa là không gian mẫu Ω có n biến cố sơ cấp, và biến cố A ⊂Ω có k phần tử. Nếu các biến cố sơ cấp có cùng khả năng xảy ra thì xác suất của A được định nghĩa là số phần tử của A k P(A) = = . số phần tử của Ω n Ví dụ 3. a) Xét phép thử "tung xúc xắc" với các biến cố A ≡ "nhận được mặt 6", B ≡ "nhận được mặt chẵn". 1 3 Ta có P(A) = 6 và P(B)==6 0.5 . b) Xét phép thử "lấy ngẫu nhiên một viên bi trong một hộp đựng 4 bi xanh và 6 bi đỏ" với các biến cố X ≡ "nhận được bi xanh", D ≡ "nhận được bi đỏ". 4 6 Ta có P(X)==10 0.4 và P(D)==10 0.6 . Lưu ý rằng, đối với định nghĩa cổ điển, ta cần hai điều kiện : − Số kết quả của phép thử là hữu hạn, − Các kết quả đồng khả năng xảy ra. Khi một trong hai điều kiện trên không xảy ra, ta không thể dùng định nghĩa cổ điển để xác định xác suất của một biến cố. Tuy nhiên, bằng cách viết lại định nghĩa cổ điển này, số trường hợp thuận lợi cho A P(A) = , số trường hợp xảy ra ta có thể định nghĩa xác suất bằng phương pháp thống kê như sau 2.2. Định nghĩa xác suất bằng tần suất. Giả sử phép thử τ có thể lập lại nhiều lần trong điều kiện giống nhau. Nếu k trong n lần thực hiện phép thử mà biến cố A xảy ra k lần thì tỷ số n được gọi là tần suất xuất hiện của A trong n phép thử. 10
Người ta chứng minh được rằng, khi n đủ lớn, tần suất của biến cố A sẽ dao động xung quanh một giá trị nào đó mà ta gọi là xác suất của A, ký hiệu P(A) . Trong thực tế, với n đủ lớn, người ta lấy tần suất của A làm giá trị gần đúng cho xác suất của biến cố A, k P(A) = . n Ví dụ 4. a) Thống kê trên 10.000 người dân thành phố cho thấy có 51 người bị bệnh cao huyết áp, ta nói xác suất của biến cố "bị bệnh cao huyết áp" là 51 ≈ 0.005 . 10000 b) Một nhà máy gồm ba phân xưởng A, B, C. Kiểm tra một lô hàng của nhà máy gồm 1000 sản phẩm, người ta thấy có 252 sản phẩm của phân xưởng A, 349 của phân xưởng B và 399 của phân xưởng C. Ta nói xác suất − 252 nhận được sản phẩm từ phân xưởng A là P(A)=≈1000 0.25 , 349 − nhận được sản phẩm từ phân xưởng B là P(B)=≈1000 0.35, và − 399 nhận được sản phẩm từ phân xưởng C là P(C)=≈1000 0.4 . Ta còn nói, các phân xưởng A, B, C tương ứng làm ra 25%, 35% và 40% tổng sản lượng nhà máy. Tương tự, để tìm xác suất làm ra sản phẩm hỏng của phân xưởng A, người ta thống kê trên một số sản phẩm của phân xưởng A và quan sát số sản phẩm hỏng. Chẳng hạn, nếu trong 400 sản phẩm của phân xưởng A nêu trên có 4 sản phẩm hỏng, ta nói xác suất làm ra một sản phẩm hỏng của phân xưởng A là 4 400 = 0.01. Ví dụ 5. Trong phép thử τ : “thảy đồng xu”, một cách trực giác, ta cho rằng các biến cố sơ cấp ω1 : “nhận được mặt sấp” và ω2 : “nhận được mặt ngửa” là đồng khả năng xảy ra, nên do định nghĩa cổ điển, PP0.5(ω=12) ( ω=) . Khi đó, người ta nói đồng xu này là “công bằng”, “đồng chất đẳng hướng”, Bằng thực nghiệm, một số nhà khoa học đã thảy một đồng xu nhiều lần và nhận được kết quả sau Người thực hiện Số lần thảy Số lần mặt ngửa Tần suất Buffon 4.040 2.048 0.5069 Pearson 12.000 6.019 0.5016 Pearson 24.000 12.012 0.5005 11
và khi đó, ta nói xác suất nhận được mặt ngửa ≈ 0.5 . Tổng quát hơn, độc lập với các quan sát chủ quan, ta có 2.3. Định nghĩa xác suất bằng tiên đề của Kolmogorov. Xác suất là hàm số xác định trên tập hợp các biến cố P ()Ω , P:P (Ω→ ) A P(A) thỏa các tính chất sau (i) P(Ω= ) 1, (ii) P(A)≥ 0, ∀∈A P () Ω, và (iii) PA()12∪∪∪ A A n=+++ PA( 1) PA( 2) PA( n) , với mọi dãy hữu hạn các biến cố A1 , A2 , , An xung khắc từng đôi, nghĩa là Aij∩ A =∅ khi ij≠ . Từ định nghĩa, dễ dàng suy ra thêm các tính chất sau (iv) P(∅= ) 0 , (v) Nếu A và B xung khắc, AB = ∅ , thì P(A+ B)=+ P(A) P(B), (vi) Công thức cộng : Với hai biến cố bất kỳ A và B, P() A∪ B=+− P(A) P(B) P(AB) (vii) PA()=− 1 P(A), nghĩa là tổng xác suất hai biến cố đối lập luôn luôn bằng 1. Ví dụ 6. Qua điều tra trong sinh viên, ta biết 40% học thêm ngoại ngữ, 55% học thêm tin học và 30% học thêm cả hai môn này. Chọn ngẫu nhiên 1 sinh viên và xét các biến cố A : “nhận được sinh viên học thêm ngoại ngữ”, B : “nhận được sinh viên học thêm tin học”. Khi đó, A ∩ B là biến cố “nhận được sinh viên học thêm cả hai môn ngoại ngữ và tin học”, và PA()= 0.4; PB( ) = 0.55; PA( ∩ B) = 0.3. Từ đó, ta có thể tính một số xác suất như PA()=− 1 PA() =− 1 0.40.6 = , nghĩa là có 60% sinh viên không học thêm ngoại ngữ, 12
PA( ∪∩ B) =+− PA( ) PB( ) PA( B) =+0.4 0.55 −= 0.3 0.65, nghĩa là có 65% sinh viên học thêm (ngoại ngữ hay tin học), P() A∪∪ B=− 1 P() A B =− 1 0.65 = 0.35 , nghĩa là có 35% sinh viên không học thêm môn nào cả. 3. XÁC SUẤT CÓ ĐIỀU KIỆN. Xét phép thử τ : "tung hai con xúc xắc" với không gian mẫu tương ứng Ω={(1,1) ,( 1, 2) , ,( 1, 6) ,( 2,1) ,( 2, 2) , ,( 6, 6)} (có 36 phần tử) và xét các biến cố A : "tổng số nút xuất hiện = 8 ", B : "số nút của xúc xắc thứ nhất là số chẵn". Ta có A = {()()()2, 6 , 3, 5 , 4, 4 ,( 5, 3) ,( 6, 2)} , B= {()()() 2,1 , 2, 2 , , 2, 6 ,( 4,1) , ,( 6, 6)}, nên từ định nghĩa cổ điển, A 5 B 18 1 P(A) == và P(B) = ==. Ω 36 Ω 36 2 Bây giờ, ta tung hai con xúc xắc và giả sử ta nhận được thông tin thêm là số nút của xúc xắc thứ nhất đã là số chẵn (nghĩa là biến cố B đã xảy ra). Khi đó, phép thử τ trở thành phép thử τ′ : "tung hai con xúc xắc khác nhau với số nút của xúc xắc thứ nhất là số chẵn". Do đó, không gian mẫu Ω bị thu hẹp lại là Ω=′ {(2,1) ,( 2, 2) , ,( 2, 6) ,( 4,1) , ,( 6, 6)} = B và hiện tượng biến cố A xảy ra khi biết biến cố B đã xảy ra trở thành hiện tượng biến cố A′ =={(2, 6) ,( 4, 4) ,( 6, 2)} AB xảy ra đối với phép thử τ′ và do đó có xác suất là A′ 31 PA()′ = ==. Ω′ 18 6 Ta ký hiệu A′ ≡ AB và PAB( ) ≡ PA( ′) được gọi là xác suất để biến cố A xảy ra khi biết biến cố B xảy ra. Từ nhận xét 1 PAB( ) PAB()== , 6P(B) 13
ta đưa ra định nghĩa tổng quát 3.1. Định nghĩa. Xét biến cố B với P(B)> 0. Xác suất của biến cố A, khi biết biến cố B xảy ra là PAB( ) PAB()= . P(B) Ví dụ 7. Với ví dụ 4 b), xét biến cố H : "nhận được một sản phẩm hỏng", thì xác suất nhận được sản phẩm hỏng khi biết sản phẩm đó của phân xưởng A là PHA( ) = 0.01 và xác suất của biến cố HA : "nhận được một sản phẩm hỏng từ phân xưởng A" là P(HA)==⋅= P( H A) P(A) 0.01 0.25 0.0025 . 3.2. Định lý (Quy tắc nhân xác suất). Với hai biến cố A và B bất kỳ, ta có PAB( ) = P(A)PBA( ) . Tổng quát, với n biến cố bất kỳ A1 , A2 , , An , ta có P( A12 A A n) = P( A 1) P() A 2 A 1 P( A 3 A 12 A) P( A n A 12 A A n) Ví dụ 8. Một thủ quỹ có một chùm chìa khóa gồm 9 chiếc chìa giống hệt nhau trong đó chỉ có 2 chìa có thể mở được tủ sắt. Anh ta thử ngẫu nhiên từng chìa (chìa không trúng được bỏ ra trong lần thử kế tiếp). Tìm xác suất để anh ta mở được tủ vào đúng lần thứ ba. Đặt Ai là biến cố "lần thứ i, mở được tủ". Với quy ước rằng khi biến cố Ai xảy ra thì các biến cố A1 , , Ai1− vẫn có thể đã xảy ra, biến cố "mở được tủ vào đúng lần thứ ba" là A123AA và do quy tắc nhân xác suất, ta có PAAA()123= PA( 1) PA( 2 A 1) PA( 3 AA 12) . Do 27 PA()11= 1−=−= PA() 1 , 99 26 PA A=− 1 PA A =− 1 = , ( 21) ( 21) 88 2 PA AA = , ()312 7 ta suy ra 762 1 PAAA()123= = . 987 6 14
Ví dụ 9. Hai sinh viên A và B chơi một trò chơi như sau : Cả hai luân phiên lấy mỗi lần 1 bi từ một hộp đựng 2 bi trắng và 4 bi đen (bi được rút ra không trả lại vào hộp). Người nào lấy ra được bi trắng trước thì thắng cuộc. Tính xác suất thắng cuộc của người lấy trước. Không mất tính tổng quát, giả sử A lấy trước. Xét các biến cố Ai : “A lấy được bi trắng ở lần lấy thứ i”, Bi : “B lấy được bi trắng ở lần lấy thứ i”. Nếu gọi C là biến cố “A thắng cuộc”, thì CA= 111211223∪∪ ABAABABA. 21 Do PA()1 ==63 và do công thức nhân xác suất PABA()11 2= PA() 1 PB() 1 A 1 PA( 2 AB 11) 432 1 =⋅⋅=, 654 5 PABABA( 11 22 3) =× PA( 1) PB( 1 A 1) PA( 2 AB 11) × PB()2112 ABA PA() 31122 ABAB 4321 1 =⋅⋅⋅⋅=1. 6543 15 Vì A1 , A11BA 2 và A11BABA 22 3 là các biến cố xung khắc từng đôi nên do công thức cộng, PC( ) = PA( 111211223) PABA( ) PABABA( ) 11 1 3 =++ =. 35155 3.3. Định lý (công thức xác suất toàn phần). Với hai biến cố A, B bất kỳ, ta có PA()=+ PABPB( ) () PABPB()( ) . Tổng quát, cho B1 , B2 , , Bn là một họ đầy đủ các biến cố, nghĩa là n i) ∪ Bi =Ω và i1= ii) BBij=∅ nếu ij≠ . thì với mọi biến cố A, ta có 15
n P(A)= ∑ P() A Bii P() B i1= =+++P() A B11 P() B P() A B 22 P() B P() A B nn P() B Chứng minh. Do AB và AB là hai biến cố xung khắc và A =+AB AB nên PA()=+ PAB( ) PAB( ) . =+PABPB()() PABPB()() Tổng quát, do các biến cố AB1 , AB2 , , ABn xung khắc từng đôi nên do công thức cộng xác suất ⎛⎞n n PA()== P⎜⎟ AB PAB ( ) ⎜⎟∪ ii∑ ⎝⎠i1= i1= và do công thức nhân xác suất, PAB( iii) = PAB( ) PB( ) với mọi i, ta suy ra n PA()= ∑ PAB()ii PB(). i1= Ví dụ 10. Một nhà máy có 3 phân xưởng A, B, C tương ứng làm ra 25%, 35% và 40% tổng sản phẩm của nhà máy. Giả sử xác suất làm ra một sản phẩm hỏng của các phân xưởng A, B và C lần lượt là 0,01; 0,02 và 0,025. Để tính xác suất làm ra một sản phẩm hỏng của nhà máy, ta xét phép thử τ : "Chọn ngẫu nhiên một sản phẩm của nhà máy" và xét các biến cố A : "nhận được sản phẩm của phân xưởng A", B : "nhận được sản phẩm của phân xưởng B", C : "nhận được sản phẩm của phân xưởng C", và H : "nhận được sản phẩm hỏng", thì A, B, C tạo thành họ đầy đủ các biến cố, với PA()= 0.25; PB( ) = 0.35; PC( ) = 0.4. Ngoài ra, PHA()= 0.01; PHB( ) = 0.02; P( H C) = 0.025 , nên do công thức xác suất toàn phần, 16
PH( ) =++ PHAPA()( ) PHBPB( ) ( ) PHCPC( ) ( ) =⋅+⋅+0.01 0.25 0.02 0.35 0.025 ⋅= 0.4 0.0195. 3.4. Định lý (Công thức Bayès). Cho B1 , B2 , , Bn là một họ đầy đủ các biến cố và xét biến cố A với PA()> 0. Với mỗi k= 1,2, ,n, ta có PAB( kk) PB( ) PB A = . ()k n ∑i1= PAB() i PB() i Chứng minh. Áp dụng công thức nhân xác suất PB()kkkk APA()== PBA( ) PAB( ) PB( ) và công thức xác suất toàn phần n PA()= ∑ PAB()ii PB(), i1= ta suy ra PAB()kk PB( ) PAB( kk) PB( ) PB A == . ()k n PA() ∑i1= PAB() i PB() i Ví dụ 11. Với các dữ kiện cho trong ví dụ 10. Giả sử lấy một sản phẩm và thấy rằng đó là sản phẩm hỏng. Ta có thể tính xác suất để sản phẩm đó do phân xưởng B sản xuất bằng công thức Bayès PHBPB( ) ( ) 0.02⋅ 0.35 7 PBH()===. P() H 0.195 195 Chú ý. Trong công thức Bayès, xác suất PB( 1 ) , PB( 2 ) , , PB()n để các biến cố B1 , B2 , , Bn xảy ra được biết trước nên thường được gọi là các xác suất tiên nghiệm. Sau khi thực hiện phép thử, thấy biến cố A xảy ra, xác suất để các biến cố B1 , B2 , , Bn xảy ra được tính lại với thông tin thêm này (nghĩa là các xác suất có điều kiện PB()1 A, PB( 2 A) , , PB( n A) ) nên được gọi là các xác suất hậu nghiệm. Hai biến cố A, B được gọi là độc lập nếu biến cố này xảy ra không ảnh hưởng đến việc xảy ra hay không xảy ra của biến cố kia. Cụ thể, ta có 3.5. Định nghĩa. Hai biến cố A, B được gọi là độc lập nếu xác suất để biến cố này xảy ra không phụ thuộc vào việc biến cố kia xảy ra, nghĩa là PAB()= PA( ) và do đó PAB( ) = PAPB( ) ( ) . 17
Tổng quát, n biến cố A1 , A2 , , An được gọi là độc lập nếu mỗi biến cố Ai , với i= 1, 2, , n , độc lập với tích bất kỳ các biến cố còn lại. Ví dụ 12. Thảy một đồng xu và một con xúc xắc, ta có không gian mẫu Ω={(S,1) ,( S, 2) , ,( S, 6) ,( N,1) ,( N, 2) , ,( N, 6)} . Xét các biến cố A : "nhận được mặt ngửa của đồng xu", và B : "nhận được nút chẵn của xúc xắc". Một cách trực giác, đồng xu xuất hiện mặt xấp hay ngửa không ảnh hưởng gì đến số nút xuất hiện trên con xúc xắc, nghĩa là A, B độc lập nhau. Cụ thể, ta có A = {()()()N,1 , N, 2 , N, 3 ,( N, 4) ,( N, 5) ,( N, 6)}, B= {()()() S,2 , S,4 , S,6 ,( N,2) ,( N,4) ,( N,6)} , và AB= {( N,2) ,( N,4) ,( N,6)}. Do đó, 61 61 31 PA()==, PB()= = , PAB()= = . 12 2 12 2 12 4 1 Vì PAB()== PAPB ()() nên A, B độc lập với nhau. 4 Do định nghĩa, nếu ba biến cố A, B, C là độc lập thì A độc lập với B, C và BC nên PAB()= PAPB ()(), PAC()= PAPC ()(), PABC( ()) = PAPBC()( ), và vì B, C cũng độc lập với nhau, nên PBC( ) = PBPC( ) ( ) và do đó PABC()= PAPBPC( ) ( ) ( ) . Tổng quát, n biến cố Ai , i= 1, 2, , n là độc lập nếu với bất kỳ k biến cố A , A , , A khác nhau, với kn≤ , i1 i2 ik ⎛⎞k k PA⎜⎟= PA. ⎜⎟∩ iijj∏ () ⎝⎠j1= j1= 18
Chú ý rằng, nếu từ n biến cố độc lập Ai , i= 1,2, ,n, ta thành lập họ biến cố Bi , i= 1,2, ,n, với BAii= hay BAii= , thì họ biến cố Bi , i= 1,2, ,n, cũng độc lập. Ví dụ 13. Từ một hộp đựng 10 viên bi trong đó có 4 bi trắng, lấy lần lượt ra 2 bi. Gọi Tk , với k1,2= , là biến cố "nhận được bi trắng ở lần lấy thứ k". Ta có hai trường hợp, tùy thuộc vào lần lấy thứ nhất có hoàn lại bi vào hộp hay không hoàn lại bi vào hộp : i) Trường hợp có hoàn lại : Khi đó, một cách trực giác, ta thấy T1 , T2 là hai biến cố độc lập. Chính xác hơn, ta có 4 PT()= , 1 10 PT()2211211=+ PT( T) PT() PT( T) PT( ) 44 46 4 =+=, 10 10 10 10 10 44 PTT()12=== PT() 2 T 1 PT() 1 PT()() 2 PT 1 . 10 10 ii) Trường hợp không hoàn lại : Trong trường hợp này, ta thấy T1 , T2 là hai biến cố không độc lập vì ta cảm giác rằng cơ may để lần thứ nhì được bi trắng tùy thuộc vào bi nhận được ở lần thứ nhất có là bi trắng hay không. Cụ thể, ta có 4 PT()= , 1 10 PT()2211211=+ PT( T) PT() PT( T) PT( ) 34 46 36 4 =+==. 9 10 9 10 90 10 nhưng 34 PTT()12== PT() 2 T 1 PT() 1 910 ≠ PT()()21 PT . Tổng quát, nếu ta lấy lần lượt ra n bi, với 1n10≤ ≤ , thì các Tk , 1kn≤≤ là một họ các biến cố độc lập khi mỗi lần lấy bi ra có hoàn lại, nhưng không là một họ các biến cố độc lập khi mỗi lần lấy bi ra không hoàn lại. Tuy nhiên, chú ý rằng trong cả hai trường hợp, ta đều có 4 PT()= , k 10 với mọi k. 19
Ví dụ 14. Ba xạ thủ cùng bắn vào một mục tiêu với xác suất bắn trúng mục tiêu của xạ thủ thứ 1, 2 và 3 lần lượt là 0.4; 0.5 và 0.8. Tính xác suất để a) có đúng một xạ thủ bắn trúng. b) có ít nhất một xạ thủ bắn trúng. Gọi Ai , với i= 1,2,3, là biến cố : “xạ thủ i bắn trúng”. Ta có PA()1 = 0.4, PA()2 = 0.5 và PA( 3 ) = 0.8. Khi đó, A = AAA123∪∪ AAA 123 AAA 123 là biến cố : “có đúng một xạ thủ bắn trúng”, và BA= 123∪∪ A A là biến cố : “có ít nhất một xạ thủ bắn trúng”. Do A123AA, A123AA, A123AA là họ các biến cố xung khắc từng đôi và đồng thời các biến cố Ai cũng như các biến cố đối Ai , với i= 1,2,3, là các biến cố độc lập nên từ công thức cộng và công thức nhân (cho các biến cố độc lập), ta có PA( ) =++ PAAA()123 PAAA() 123 PAAA( 123) =++PA() PA PA PA PA() PA 123()() () 123() + PA()123 PA() PA() =⋅⋅+⋅⋅+⋅⋅=0.4 0.5 0.2 0.6 0.5 0.2 0.6 0.5 0.8 0.34. PB()=++− PA (12312 ) PA ( ) PA( ) PAA( ) − −−+PAA()()(13 PAA 23 PAAA 123 ) =++−PA()1231213 PA () PA () PA ()() PA − PA ()() PA −+PA()()23 PA PA ()()() 123 PA PA nên P( B) = 0.4 ++−⋅−⋅−⋅+⋅⋅ 0.5 0.8 0.4 0.5 0.4 0.8 0.5 0.8 0.4 0.5 0.8 = 0.94. Chú ý rằng ta còn có thể dùng đẳng thức PB()=− 1 PB(), trong đó BAAA= 133 là biến cố : “cả ba xạ thủ đều không bắn trúng”, PB()=− 1 PAAA =− 1 PA PA PA ()123( 1) ( 2) ( 3) =−1 0.6 ⋅ 0.5 ⋅ 0.2 =− 1 0.06 = 0.94. 20
4. LƯỢC ĐỒ BERNOULLI. Để khảo sát một biến cố, chẳng hạn như trong định nghĩa xác suất bằng phương pháp thống kê, người ta phải thực hiện phép thử tương ứng nhiều lần một cách độc lập và quan sát số lần biến cố đó xảy ra để tính được tần suất của biến cố đó. Phương pháp khảo sát này được gọi là lược đồ Bernoulli. Xét một phép thử τ với không gian mẫu Ω và xét biến cố A ⊂Ω với xác suất PA( ) = p. Ta thực hiện phép thử này n lần một cách độc lập và quan sát số lần xảy ra biến cố A. Đặt Hk : "biến cố A xảy ra đúng k lần", với 0≤≤ k n . Ta có 4.1. Định lý (Công thức Bernoulli). kk nk− PH()kn=− Cp ( 1 p ). Chứng minh. Dùng quy nạp trên n. Hiển nhiên công thức đúng với n1= vì khi đó HA0 = và HA1 = . Do đó 00 10− PH()01=−= 1p Cp1p ( − ) và 11 11− PH()11== p Cp ( 1 − p ). Giả sử công thức đúng với n1≥ , nghĩa là khi thực hiện n lần phép thử τ một cách độc lập thì xác suất để biến cố A xảy ra đúng k lần là kk nk− PH()kn=− Cp ( 1 p ). Bây giờ, thực hiện phép thử τ thêm một lần nữa một cách độc lập và gọi X là biến cố : “A xảy ra trong lần thử thứ n1+ ” thì biến cố : “A xảy ra đúng k lần trong n1+ phép thử” là HAkk1+ H− A. Do các biến cố HAk và HAk1− là xung khắc, Hk và A cũng như Hk1− và A là các biến cố độc lập nên PHA()kk1k+= H−− A PHA() + PH( k1 A) =+PH()kk1 PA() PH()()− PA kknk−−+ k1k1−− nk1 =−−+−Cp1pnn()() 1p C p () 1p p kk1k− ()n1+− k =+()CCnn p1p() − kk ()n1+− k =−Cp1pn1+ () . 21
Ví dụ 15. Xác suất thành công một thí nghiệm sinh hóa là 40%. Một nhóm gồm 9 sinh viên cùng tiến hành thí nghiệm này độc lập với nhau. Tìm xác suất để a) có đúng 6 thí nghiệm thành công, b) có ít nhất một thí nghiệm thành công, c) có ít nhất 8 thí nghiệm thành công. Xét phép thử τ : "tiến hành thí nghiệm sinh hóa" và biến cố A : " thí nghiệm thành công". Ta có PA()= 0.4 và vì thí nghiệm được thực hiện 9 lần độc lập nhau nên nó thỏa lược đồ Bernoulli với n9= . Gọi Hk là biến cố "thí nghiệm thành công đúng k lần" và K k là biến cố "thí nghiệm không thành công đúng k lần", ta có a) Xác suất có đúng 6 thí nghiệm thành công là 6 696− P() H69=−= C ()( 0.4 1 0.4 ) 0.0743. b) Xác suất có ít nhất một thí nghiệm thành công là 0 090− P() K009=− 1 P() H =− 1 C()( 0.6 1 − 0.6 ) = 0.9899 . c) Xác suất có ít nhất 8 lần thành công là PH()()89+= H PH 8 + PH( 9) 89898999− − =−+−C99()( 0.4 1 0.4 ) C ()( 0.4 1 0.4 ) =+=0.00354 0.00026 0.0038. Ví dụ 16. Xác suất chữa khỏi bệnh A của một phương pháp điều trị là 95%. Với 10 người bị bệnh A được điều trị bằng phương pháp này, tính xác suất để a) có 8 người khỏi bệnh. b) có nhiều nhất 9 người khỏi bệnh. Do việc khỏi bệnh của người này và người khác là độc lập nhau nên số người khỏi bệnh trong 10 người điều trị thỏa lược đồ Bernoulli với n10= và p0.95= . Do đó, a) Xác suất để có 8 người khỏi bệnh là 8 8108− C10 ()( 0.95 1−= 0.95 ) 0.0746 . b) Biến cố : “có nhiều nhất 9 người khỏi bệnh” là biến cố đối của biến cố : “có 10 người khỏi bệnh” nên có xác suất là 10 10 10− 10 1−−=−= C10 ()( 0.95 1 0.95 ) 1 0.5987 0.4013 . 22
5. ĐẠI CƯƠNG VỀ BIẾN SỐ NGẪU NHIÊN VÀ PHƯƠNG PHÁP LẤY MẪU. Trở lại với lược đồ Bernoulli nhưng với phép thử Τ : "thực hiện phép thử τ đúng n lần". Gọi X là số lần biến cố A xảy ra trong n lần thực hiện phép thử τ . Bấy giờ, ứng với mỗi một biến cố sơ cấp của phép thử Τ , ta gán với một con số (chỉ số lần biến cố A xuất hiện). Khi đó, ta nói X là một biến số ngẫu nhiên (ứng với phép thử Τ ) và biến cố Hk : "biến cố A xảy ra đúng k lần" còn được ký hiệu là X = k . Chú ý rằng biến số ngẫu nhiên X chỉ lấy các giá trị là 0, 1, 2, , n và do định lý Bernoulli, kk nk− PX()()()=≡ k PHkn = Cp 1 − p . Bảng các giá trị của k với xác suất PX( = k) tương ứng, X 0 1 2 n P p0 p1 p2 pn trong đó pPXkk ==(), được gọi là bảng phân phối xác suất của X. Chẳng hạn, với ví dụ 15, ta có bảng phân phối xác suất cho biến số ngẫu nhiên X chỉ số lần thí nghiệm sinh hóa thành công X 0 1 2 3 4 5 6 7 8 9 P p0 p1 p2 p3 p4 p5 p6 p7 p8 p9 trong đó k k9k− pk9=− C()( 0.4 1 0.4 ), và khi đó, từ bảng phân phối xác suất của X, ta có viết lại - Xác suất có đúng 6 thí nghiệm thành công là PX( == 6) p6 , - Xác suất có ít nhất một thí nghiệm thành công là PX1ppppppppp( ≥=++++++++) 123456789 =−1p,0 9 do ∑ p1k = , và k0= - Xác suất có ít nhất 8 thí nghiệm thành công là 23
PX()≥= 8 PX( =+ 8) PX( = 9) . Ta xét một ví dụ khác : i) Một hộp gồm 10 bi trong đó có đúng 4 bi trắng. Thực hiện việc lấy lần lượt 9 bi từ hộp, mỗi lần lấy ra để quan sát rồi trả lại vào hộp. Gọi X là số bi trắng nhận được. Khi đó, biến cố nhận được bi trắng ở mỗi lần là độc lập nhau nên ta có thể dùng lược đồ Bernoulli và do đó X là biến ngẫu nhiên có bảng phân phối xác suất như trong ví dụ trên. Từ đó, ta có thể tính được xác suất để nhận được : đúng 6 bi trắng, ít nhất một bi trắng, ít nhất 8 bi trắng, ii) Cũng với hộp bi như trên nhưng ta lấy lần lượt ra 9 bi (nhưng không hoàn lại vào hộp sau mỗi lần lấy). Khi đó số bi trắng X nhận được cũng là một biến số ngẫu nhiên nhưng do mỗi lần lấy bi ra, ta không trả lại vào hộp nên biến cố nhận được bi trắng ở mỗi lần lấy là không độc lập với nhau. Để tính PX()= k, ta xét phép thử τ : "lấy 9 bi". Bấy giờ, mỗi phần tử của 9 không gian mẫu Ω chính là một tổ hợp 10 chập 9 nên số phần tử của Ω là C10 . Mặt khác, mỗi phần tử của biến cố X = k được tạo bởi phép chọn k phần tử từ 4 phần tử (bi trắng) và 9k− phần tử từ 6 phần tử (không là bi trắng) nên số phần tử của biến cố X = k là k9k− CC46⋅ . Do đó, CCk9k⋅ − PX== k 46. () 9 C10 Chú ý rằng các biến cố X = k , với k2≤ hay với k5≥ là các biến cố không thể có, nên ta có bảng phân phối xác suất X 0 1 2 3 4 5 6 7 8 9 P 0 0 0 p′3 p′4 0 0 0 0 0 trong đó CC393⋅ − 4 CC494⋅ − 6 p′ ==46 ; p′ ==46 . 3 9 4 9 C10 10 C10 10 Bài tập. 1. Cho A, B, C là ba biến cố. Chứng minh PA()++ B C = PA( ) + PB( ) + PC( ) − −−−+PAB() PAC () PBC () PABC. ( ) 24
1 1 3 2. Cho PA()= 3 , PB()= 2 và PA( + B) = 4 . Tính PAB,( ) PA.B( ) , PA()+ B, PA.B() và PA.B(). 3. Theo dõi dự báo thời tiết trên đài truyền hình (nắng, sương mù, mưa) và so sánh với thời tiết thực tế xảy ra, ta có bảng thống kê sau dự báo nắng sương mù mưa thực tế nắng 30 5 5 sương mù 4 20 2 mưa 10 4 20 nghĩa là có 30 lần dự báo nắng, trời nắng; 4 lần dự báo nắng, trời sương mù; 10 lần dự báo nắng, trời mưa, v.v a) Tính xác suất dự báo trời nắng của đài truyền hình. b) Tính xác suất dự báo của đài truyền hình là đúng với thực tế. c) Được tin dự báo là trời nắng. Tính xác suất để thực tế thì trời mưa ? trời sương mù ? trời nắng ? 4. Hai nhà máy X, Y cùng sản xuất một loại sản phẩm. Xác suất nhận được sản phẩm hỏng ở nhà máy X là p0.03X = và ở nhà máy Y là p0.05Y = . a) Một người mua 3 sản phẩm ở nhà máy X. Tính xác suất có ít nhất một sản phẩm hỏng. b) Nếu mua 3 sản phẩm ở nhà máy X và 2 sản phẩm ở nhà máy Y. Tính xác suất có ít nhất một sản phẩm hỏng. 5. a) Cho A, B là hai biến cố độc lập. Chứng minh rằng A , B ; A , B và A , B cũng là các cặp biến cố độc lập. b) Cho A1 , A2 , , An là n biến cố độc lập. Chứng minh rằng A1 , A2 , , An cũng là n biến cố độc lập. Suy ra rằng nếu xét n biến cố B1 , B2 , , Bn , với BAii= hay BAii= , thì B1 , B2 , , Bn cũng là n biến cố độc lập. 6. Một thiết bị gồm 3 cụm chi tiết, mỗi cụm bị hỏng không ảnh hưởng gì đến các cụm khác và chỉ cần một cụm bị hỏng thì thiết bị ngừng hoạt động. Xác suất để cụm thứ nhất bị hỏng trong ngày là 0.1, cụm thứ hai là 0.05 và cụm thứ ba là 0.15. Tìm xác suất để thiết bị không ngừng hoạt động trong ngày. 7. Tỷ lệ người mắc bệnh tim trong một vùng dân cư là 9%, mắc bệnh huyết áp là 12%, mắc cả hai bệnh này là 7%. Chọn ngẫu nhiên một người trong vùng. Tính xác suất để người đó a) bị bệnh tim hay bị bệnh huyết áp. b) không bị bệnh tim cũng không bị bệnh huyết áp. 25
c) không bị bệnh tim hay không bị bệnh huyết áp. d) bị bệnh tim nhưng không bị bệnh huyết áp. e) không bị bệnh tim nhưng bị bệnh huyết áp. 8. Một dây chuyền lắp ráp nhận các chi tiết từ hai nhà máy khác nhau. Tỷ lệ chi tiết do nhà máy thứ nhất cung cấp là 60%, của nhà máy thứ hai là 40%. Tỷ lệ chính phẩm của nhà máy thứ nhất là 90%, của nhà máy thứ hai là 85%. Lấy ngẫu nhiên một chi tiết trên dây chuyền và thấy rằng nó tốt. Tìm xác suất để chi tiết đó do nhà máy thứ nhất sản xuất. 9. Một người bắn bia với xác suất bắn trúng là p0.7= . a) Bắn liên tiếp 3 phát. Tính xác suất có ít nhất 1 lần trúng bia. b) Hỏi phải bắn ít nhất mấy lần để có xác suất ít nhất một lần trúng bia ≥ 0.9. 10. Một hộp đựng 10 phiếu trong đó chỉ có 2 phiếu có trúng thưởng. Có 10 người lần lượt rút thăm. Tính xác suất nhận được phần thưởng của mỗi người. 11. Có hai hộp đựng bi : - Hộp H1 đựng 20 bi trong đó có 5 bi đỏ và 15 bi trắng, - Hộp H2 đựng 15 bi trong đó có 6 bi đỏ và 9 bi trắng. Lấy một bi ở hộp H1 , bỏ vào H2 , trộn đều rồi lấy ra một bi. Tính xác suất nhận được bi đỏ ? bi trắng ? 12. Trong một lô thuốc (rất nhiều) với xác suất nhận được thuốc hỏng là p0.1= . Lấy ngẫu nhiên 3 lọ để kiểm tra. Tính xác suất để a) cả 3 lọ đều hỏng, b) có 2 lọ hỏng và 1 lọ tốt, c) có 1 lọ hỏng và 2 lọ tốt, d) cả 3 họ đều tốt. 13. Một bài thi trắc nghiệm gồm 12 câu hỏi, mỗi câu có 5 câu trả lời, trong đó chỉ có một câu đúng. Giả sử mỗi câu trả lời đúng, thí sinh được 4 điểm, mỗi câu trả lời sai, thì sinh bị trừ đi 1 điểm. Một thí sinh làm bài bằng cách chọn ngẫu nhiên các câu trả lời. Tìm xác suất để a) thí sinh được 13 điểm, b) thí sinh bị điểm âm. 14. Một cặp trẻ sinh đôi có thể do cùng một trứng (sinh đôi thật) hay do hai trứng khác nhau sinh ra (sinh đôi giả). Các cặp sinh đôi thật luôn luôn có cùng giới tính. Các cặp sinh đôi giả thì giới tính của mỗi đứa độc lập nhau và có xác 26
suất là 0.5. Thống kê cho thấy 34% cặp sinh đôi là trai; 30% cặp sinh đôi là gái và 36% cặp sinh đôi có giới tính khác nhau. a) Tính tỷ lệ cặp sinh đôi thật, b) Tìm tỷ lệ cặp sinh đôi thật trong số các cặp sinh đôi có cùng giới tính. 15. Một phân xưởng có 5 máy. Xác suất để trong một ca, mỗi máy bị hỏng là 0.1. Tìm xác suất để trong một ca, có đúng 2 máy bị hỏng. 16. Bạn quên mất số cuối cùng trong số điện thoại cần gọi (số điện thoại gồm 6 chữ số) và bạn chọn số cuối cùng này một cách ngẫu nhiên. Tính xác suất để bạn gọi đúng số điện thoại này mà không phải thử quá 3 lần. Nếu biết số cuối cùng là số lẻ thì xác suất này là bao nhiêu ? 17. Tính xác suất để gieo con xúc xắc 10 lần, mặt một nút xuất hiện không quá 3 lần. 18. Một người viết n lá thư và bỏ ngẫu nhiên n lá thư này vào trong n phong bì đã viết sẵn địa chỉ. Tìm xác suất sao cho có ít nhất một lá thư được bỏ vào đúng phong bì. 19. Tỷ lệ phế phẩm của một lô hàng (lớn) là 1%. Từ lô hàng này, lấy ra n sản phẩm. Hỏi n ít nhất phải là bao nhiêu để xác suất nhận được ít nhất một phế phẩm > 0.95 . 20. Một trung tâm chẩn đoán bệnh dùng một phép kiểm định T. Xác suất để một người đến trung tâm mà có bệnh là 0.8. Xác suất để người khám có bệnh khi phép kiểm định dương tính là 0.9 và xác suất để người khám không có bệnh khi phép kiểm định âm tính là 0.5. Tính các xác suất a) phép kiểm định là dương tính, b) phép kiểm định cho kết quả đúng. 21. Trong một vùng dân cư, cứ 100 người thì có 30 người hút thuốc lá. Biết rằng tỷ lệ người bị viêm họng trong số người hút thuốc lá là 60%, trong số người không hút thuốc lá là 30%. Khám ngẫu nhiên một người và thấy người đó bị viêm họng. Tìm xác suất để người đó hút thuốc lá. Nếu người đó không bị viêm họng thì xác suất để người đó hút thuốc lá là bao nhiêu ? 27
Chương 2 BIẾN SỐ NGẪU NHIÊN Xét phép thử τ với không gian mẫu Ω . Giả sử, ứng với mỗi biến số sơ cấp ω∈Ω, ta liên kết với một số thực X (ω) ∈ \ , thì X được gọi là một biến số ngẫu nhiên. Ví dụ 1. Với trò chơi sấp ngửa bằng cách thảy đồng xu, giả sử nếu xuất hiện mặt sấp, ta được 1 đồng; nếu xuất hiện mặt ngửa, ta mất 1 đồng. Khi đó, ta có Phép thử τ : "thảy đồng xu", Không gian mẫu Ω={S, N} , Biến số ngẫu nhiên X với X (S1) = và X (N1) = − . Tổng quát, biến số ngẫu nhiên X của một phép thử τ với không gian mẫu Ω là một ánh xạ X : Ω→ \ ω 6 X ()ω Khi X ()Ω là một tập hợp hữu hạn {x12 , x , , x k} hay là một dãy {x12 , x , , x n , }, ta nói X là một biến số ngẫu nhiên rời rạc. Khi X ()Ω là một khoảng của \ (hay cả \ ), ta nói X là một biến số ngẫu nhiên liên tục. Trong thực nghiệm, các biến số ngẫu nhiên thường là rời rạc. Tuy nhiên, khi biến số ngẫu nhiên khảo sát lấy giá trị tùy ý trên một khoảng của \ (hay cả \ ), ta coi nó như một biến số ngẫu nhiên liên tục. Chẳng hạn, biến số ngẫu nhiên trong ví dụ 1 là một biến số ngẫu nhiên rời rạc. Còn lấy ngẫu nhiên một sinh viên trong trường và đo chiều cao (phép thử τ : "lấy một sinh viên trong trường", không gian mẫu Ω là tập hợp tất cả các sinh viên và với sinh viên ω∈Ω thì X ()ω là chiều cao của ω ), ta được một biến số ngẫu nhiên rời rạc với các giá trị đủ nhiều trên \ nên ta coi nó là một biến số ngẫu nhiên liên tục. Thực chất, các biến ngẫu nhiên liên tục được dùng làm xấp xỉ cho các biến ngẫu nhiên rời rạc khi tập các giá trị của biến số ngẫu nhiên rời rạc đủ lớn. Do các biến số ngẫu nhiên X là các ánh xạ có giá trị trong \ nên với một hàm số u:\\→ , ta có thể thành lập biến số ngẫu nhiên uX( ) , với uX:() Ω→ \ ω 6 uX()()ω Chẳng hạn, với u(x)=−μ x , μ ∈ \ , ta có biến số ngẫu nhiên uX()=−μ X , với 28
()X − μω=( ) X ( ω−μ) với mọi ω∈Ω, và với u(x)=−μ() x 2 , ta có biến số ngẫu nhiên uX()=−μ ( X )2 , với 2 (XX− μω=ω−μ )()2 () () với mọi ω∈Ω. Hơn nữa, trên thực tế, khi nghiên cứu một đối tượng, người ta thường quan tâm đến nhiều tham số cùng một lúc. Nếu mỗi tham số khảo sát đều là một biến số ngẫu nhiên, ta nhận được một vectơ ngẫu nhiên. Chẳng hạn, khi nghiên cứu tầm vóc con người, người ta quan tâm đến chiều cao X và sức nặng Y. Do cả X lẫn Y đều là các biến số ngẫu nhiên, ta nhận được vectơ ngẫu nhiên (X,Y) . Tổng quát, với n biến số ngẫu nhiên Xk : Ω → \ , k= 1, 2, , n , ta nói n V=Ω→() X12 , X , , X n : \ , xác định bởi VX,X, ,X(ω=) ( 12( ω) ( ω) n( ω)) với mọi ω∈Ω, là một vectơ ngẫu nhiên. Các Xk , k= 1, 2, , n được gọi là các biến ngẫu nhiên thành phần của V. Vectơ ngẫu nhiên V được gọi là rời rạc (liên tục) nếu tất cả các biến số ngẫu nhiên thành phần là rời rạc (liên tục). Ngoài ra, với V = ()X12 , X , , X n là một vectơ ngẫu nhiên và với hàm n biến u: \\n → ()()x12 , x , , x n6 u x 12 , x , , x n ta có thể thành lập biến số ngẫu nhiên u( X12 ,X , ,X n) , với u( X12 , X , , X n) (ω) =ωω u( X 1( ) , X 2( ) , , X n( ω)) với mọi ω∈Ω. Chẳng hạn, với hai biến số ngẫu nhiên X, Y và hàm số ux,y()()()=−μ−λ x y , với ()x, y ∈ \2 và μ, λ∈\ , ta có biến số ngẫu nhiên uX,Y()()()=−μ−λ X Y , với ()()XY−μ −λ( ω) =( X( ω) −μ) ( Y( ω) −λ) với mọi ω∈Ω. 29
1. XÁC ĐỊNH BIẾN SỐ NGẪU NHIÊN Để xác định một biến số ngẫu nhiên rời rạc, người ta cần xác định các giá trị xi , i1,2, = có thể nhận được bởi biến ngẫu nhiên này và đồng thời cũng cần xác định xác suất để X nhận giá trị này là bao nhiêu, nghĩa là, cần xác định PX(){ωω=≡() xii} PXx() = , với i= 1, 2, . Ta có 1.1. Bảng phân phối xác suất Xét biến số ngẫu nhiên rời rạc X : Ω → \ , với X (Ω=) {x,x, 12 } . Giả sử x12<<<< x x n Bảng các bộ giá trị tương ứng X x1 x2 xn P p1 p2 pn với pPXxii==(), được gọi là bảng phân phối xác suất của X. Ví dụ 2. Thảy hai đồng xu, nếu được một sấp một ngửa thì được 10đ, nếu được hai mặt sấp thì mất 4đ, hai ngửa thì mất 5đ. Gọi X để chỉ số tiền được hay mất. Ta có X là biến ngẫu nhiên nhận các giá trị là −5 , −4 và 10 , với 1 P()() X=− 5 = P NN = = 0.25 , 4 1 PX()()=− 4 = PSS = = 0.25, 4 2 PX(){}== 10 P() SN,NS == 0.5, 4 và ta nhận được bảng phân phối xác suất của X X −5 −4 10 P 0.25 0.25 0.5 Ví dụ 3. Một cơ quan có 3 xe ôtô : 1 xe 4 chỗ; 1 xe 50 chỗ và 1 xe tải. Xác suất để trong một ngày làm việc, các xe được xử dụng là 0.8; 0.4 và 0.9. Hãy lập luật phân phối xác suất cho số xe được xử dụng trong một ngày của cơ quan. Gọi X là số xe được xử dụng trong một ngày của cơ quan. Ta có X ∈ {0,1, 2, 3} . Đặt A1 , A2 , A3 là biến cố “xe 4 chỗ; xe 50 chỗ; xe tải được xử dụng trong ngày”. Khi đó, A1 , A2 , A3 là các biến cố độc lập, PA()1 = 0.8; PA()2 = 0.4; PA()3 = 0.9 và p=== PX() 0 PAAA = PA PA PA 0123123( ) ( ) ( ) ( ) =⋅⋅=0.2 0.6 0.1 0.012 30
p1123123123=== PX() 1 PAAA() + AAA + AAA =++PAAA()123 PAAA() 123 PAAA() 123 =++PA()123 PA() PA() PA() 123 PA() PA() + PA()123 PA() PA() =⋅⋅+⋅⋅+⋅⋅=0.8 0.6 0.1 0.2 0.4 0.1 0.2 0.6 0.9 0.164 p2123123123=== PX() 2 PAAA() + AAA + AAA =++PAAA()123 PAAA() 123 PAAA() 123 =++PA()123 PA() PA() PA () 123 PA() PA() + PA()123 PA()() PA =⋅⋅+⋅⋅+⋅⋅=0.8 0.4 0.1 0.2 0.6 0.9 0.2 0.4 0.9 0.536 p=== PX( 3) PAAA( ) = PA( ) PA( ) PA( ) 3123123 =⋅⋅=0.8 0.4 0.9 0.288 Do đó, quy luật phân phối xác suất của X là X 0 1 2 3 P 0.012 0.164 0.536 0.288 Chú ý rằng ∑ pi =+++= 0.012 0.164 0.536 0.288 1 . Khi X là biến ngẫu nhiên liên tục thì X có thể lấy vô số giá trị x ∈ \ nên ta không thể lập bảng phân phối xác suất cho nó. Do đó, trong phần sau, ta sẽ khảo sát các hàm số xác định bởi một biến số ngẫu nhiên rời rạc và từ đó nới rộng cho các biến ngẫu nhiên liên tục : Hàm mật độ (xác suất) và hàm phân phối (tích lũy). A. Biến số ngẫu nhiên rời rạc Từ bảng phân phối xác suất của biến số ngẫu nhiên rời rạc X, X x1 x2 xn P p1 p2 pn ta định nghĩa 1.2. Hàm mật độ (xác suất) Hàm số f:\\→ xác định bởi ⎧pkhixxii= f(x) = ⎨ ⎩0khixx,i≠ i ∀ 31
được gọi là hàm mật độ xác suất, hay vắn tắt là hàm mật độ, của X. Từ tính chất của bảng phân phối xác suất, dễ thấy rằng (i) ∀∈x \ , f(x)≥ 0, và (ii) ∑ f(x)= 1. x Ví dụ 4. Tung đồng xu 3 lần. Gọi X là số mặt sấp nhận được. Ta có không gian mẫu Ω={SSS,SSN,SNS,SNN, NSS, NSN, NNS, NNN} và X ()Ω= {0, 1, 2, 3} , với 1 PX(){}== 0 P() NNN =, 8 3 P(){ X== 1 P() SNN, NSN, NNS } =, 8 3 P(){ X== 2 P() SSN,SNS, NSS } =, 8 1 P(){} X== 3 P() SSS = 8 và ta có bảng phân phối xác suất X 0 1 2 3 P 1 3 3 1 8 8 8 8 Từ đó, ta nhận được hàm mật độ xác suất của X ⎧1 khi x= 0 ⎪ 8 3 ⎪ 8 khi x= 1 ⎪ f(x) = 3 ⎨ 8 khi x= 2 ⎪1 ⎪ 8 khi x= 3 ⎪ ⎩0 khi x≠ 0,1,2,3 1.3. Hàm phân phối (tích lũy) Với f:\\→ là hàm mật độ của biến ngẫu nhiên rời rạc X, hàm số F:\\→ , xác định bởi F(x)=≤= P() X x∑ f () xi , xxi ≤ được gọi là hàm phân phối tích lũy, hay vắn tắt là hàm phân phối, của X. Bằng cách liệt kê các giá trị của X (Ω) theo thứ tự tăng dần, khi X chỉ lấy hữu hạn giá trị 32
x12< x<< x n ta có hàm phân phối ⎧0khixx< 1 ⎪ F(x)=+++⎨ fx()1 fx () 2 fx ( k1−− ) khix k1 ≤< x x k ⎪ ⎩1khixx≥ n và khi X lấy giá trị tạo thành một dãy x12< x<< x n < ta có hàm phân phối ⎧0khixx< 1 ⎪ F(x)=+++⎨ fx()1 fx () 2 fx ( n1−− ) khix n1 ≤< x x n ⎪ ⎩1khixx,n≥∀n Từ tính chất của hàm mật độ và định nghĩa của hàm phân phối, ta có (i) 0F(x)1≤≤, ∀∈x \ , (ii) lim F(x)= 0 và lim F(x)= 1 , x→−∞ x→+∞ (iii) F là hàm tăng, và (iv) F liên tục bên phải tại mọi x ∈ \ . Ví dụ 5. Với biến số ngẫu nhiên X cho bởi ví dụ 4, ta có hàm phân phối ⎧0khix< 0 ⎪1 khi 0≤ x< 1 ⎪ 8 ⎪ 4 F(x) = ⎨ 8 khi 1≤ x< 2 ⎪7 khi 2≤ x< 3 ⎪ 8 ⎩⎪1khi3x≤ Nhận xét. Tổng quát, khi ta tung đồng xu n lần và xét biến ngẫu nhiên X chỉ số mặt sấp nhận được thì ta có hàm mật độ f : \\→ , với Cx f(x) = n , 2n khi x= 0,1, 2, , n và bằng 0 khi x≠ 0,1, 2, , n . Hàm phân phối F:\\→ được xác định bởi ⎧0khix0< ⎪ ⎪ 1 ki F(x)= ⎨ n ∑≤<+=−i0= C n khi k x k 1, với k 0,1, , n 1 . ⎪2 ⎩⎪1khixn≥ 33
Khi đó, ta có thể xấp xỉ đồ thị của hàm mật độ f cũng như hàm phân phối F của X bằng một đường cong liên tục. Cụ thể hơn, biến số ngẫu nhiên rời rạc X được xấp xỉ bằng một biến số ngẫu nhiên liên tục sao cho các hàm mật độ cũng như hàm phân phối của nó xấp xỉ hàm mật độ cũng như hàm phân phối của X. Từ các định nghĩa 1.2, 1.3 và với nhận xét trên, ta xét các hàm mật độ và phân phối của biến ngẫu nhiên liên tục như sau B. Biến số ngẫu nhiên liên tục Đối với các biến số ngẫu nhiên liên tục X, nghĩa là X (Ω) là một khoảng của \ , ta có 1.4. Hàm mật độ (xác suất) Hàm số f:\\→ được gọi là hàm mật độ xác suất, hay vắn tắt là hàm mật độ, của biến số ngẫu nhiên liên tục X nếu b Pa()≤≤ X b ≡ P{} ω∈Ω≤ω≤= a X () b f(x)dx ( ) ∫a với mọi a, b ∈ \ , ab≤ . Từ định nghĩa, dễ dàng suy ra (i) ∀∈x \ , f(x)≥ 0, và +∞ (ii) f (x)dx= 1 . ∫−∞ và 1.5. Hàm phân phối (tích lũy) Hàm số F:\\→ được gọi là hàm phân phối tích lũy, hay vắn tắt là hàm phân phối, của biến số ngẫu nhiên liên tục X nếu F(x)=≤≡ω∈Ωω≤ P() X x P({ X () x}) với mọi x ∈ \ . Trực tiếp từ định nghĩa, ta được (i) 0F(x)1≤≤, ∀∈x \ , (ii) lim F(x)= 0 và lim F(x)= 1 , x→−∞ x→+∞ (iii) F là hàm tăng, và (iv) F liên tục bên phải tại mọi x ∈ \ . Hơn nữa, ta được sự liên hệ giữa hàm mật độ f và hàm phân phối F của biến số ngẫu nhiên liên tục X như sau 34
x F(x)= f (t)dt ∫−∞ với mọi x ∈ \ . Ví dụ 6. Cho X là biến số ngẫu nhiên liên tục có hàm mật độ xác suất ⎧0khix0≤ ⎪ ⎪xkhi0x1 Tìm các hằng số a, b. Do X là biến số ngẫu nhiên liên tục nên hàm phân phối xác suất liên tục bên phải tại mọi x ∈ \ . Đặc biệt, tại x= ± 1 , lim F(x)= F(− 1) cho x1→− + 35
2 ab( −=3 ) 0, (1) và lim F(x)= F(1) cho x1→ + 2 ab( +=3 ) 1. (2) 3 2 Từ (1) và (2), ta suy ra a = 4 và b = 3 . 2. THAM SỐ ĐẶC TRƯNG CỦA BIẾN NGẪU NHIÊN Trong phần này, ta định nghĩa một số tham số đặc trưng cho một biến số ngẫu nhiên mà quan trọng nhất là kỳ vọng và phương sai. 2.1. Định nghĩa. Cho X là biến ngẫu nhiên với hàm mật độ xác suất f(x) và uX() là một hàm theo biến số ngẫu nhiên X. Kỳ vọng của uX( ) được xác định là EuX( ()) = ∑ ux()()ii f x i khi X là biến ngẫu nhiên rời rạc, với X (Ω=) {x12 , x , , x n , } , và +∞ E() u() X= u(x)f(x)dx ∫−∞ khi X là biến ngẫu nhiên liên tục. Đặc biệt, khi uX()= X, thì EX( ) được gọi là trung bình của X, ký hiệu μX , hay vắn tắt là μ , nghĩa là μ=Xii∑ xf() x i khi X là biến số ngẫu nhiên rời rạc, và +∞ μ=X xf (x)dx ∫−∞ khi X là biến ngẫu nhiên liên tục. Ví dụ 8. Một hộp đựng 3 bi đỏ và 7 bi trắng. Mỗi lần lấy 1 bi (rồi trả lại vào hộp). Nếu được bi đỏ thì thưởng 5000đ, nếu được bi trắng thì phạt 2300đ. Xét xem có nên tham gia trò chơi này nhiều lần không ? Gọi X là số tiền nhận được sau mỗi lần lấy bi. X là biến ngẫu nhiên với bảng phân phối xác suất X −2300 5000 P 7 3 10 10 Trung bình của X là 73 μ=−X ()2300 ⋅10 + 5000 ⋅ 10 =− 110 . 36
Điều này có nghĩa là nếu ta chơi nhiều lần thì bình quân mỗi lần lấy một bi, ta bị lỗ 110đ. Để thấy rõ điều này, ta tưởng tượng rằng, nếu tham dự trò chơi 1000 lần, ta có cơ may lấy được bi đỏ 300 lần và được bi trắng 700 lần. Do đó, số tiền nhận được sau 1000 lần chơi là ()−⋅+⋅=−2300 700 5000 300 110.000 . Từ đó suy ra, trung bình mỗi lần chơi, ta được 110.000 =−110 . 1.000 Vậy, không nên chơi trò chơi này nhiều lần. 2.2. Định nghĩa. Cho X là một biến số ngẫu nhiên có hàm mật độ f(x) và trung 2 bình μX . Phương sai của X, ký hiệu σX , được định nghĩa là kỳ vọng của biến 2 ngẫu nhiên ()X −μX , nghĩa là 2 2 σ=XXEX(() −μ ) ⎧ 2 ∑ ()()xiX−μ f x i khi X là biến rời rạc, và ⎪ = ⎨ i ⎪ +∞ 2 ()x−μX f (x)dx khi X là biến liên tục, ⎩⎪∫−∞ 2 Vì ()X −μX chính là bình phương sai biệt giữa X (ω) và trung bình của nó, 2 μX , và vì phương sai σX chính là trung bình của các sai biệt này nên phương sai 2 của một biến ngẫu nhiên cho ta hình ảnh về sự phân tán của các số liệu : σX càng nhỏ, các số liệu càng tập trung xung quanh trung bình của chúng. Ngoài ra, vì đơn vị đo của phương sai được tính theo bình phương đơn vị đo của biến ngẫu nhiên, và do đó, σX có cùng đơn vị đo với biến ngẫu nhiên nên trong thực tế, người ta còn gọi σX là độ lệch chuẩn của X. Ví dụ 9. Xét hai biến ngẫu nhiên rời rạc X, Y với các giá trị cho bởi bảng sau X 4 4 5 6 4 6 8 7 6 5 Y 3 2 4 9 8 9 3 7 3 10 2 2 Ta có μ=μ=XY6 nhưng σ=X 1.9 nhỏ hơn khá nhiều so với σ=Y 8.2. Hai biến này có cùng trung bình nhưng rõ ràng X ít phân tán hơn Y. Ví dụ 10. Cho X là biến số ngẫu nhiên với hàm mật độ xác suất ⎧ 3 − 2 ≤ ⎪ 4 (1x) khix 1 f(x) = ⎨ ⎩⎪ 0khix1> 37
2 Tính μX và σX . Ta có +∞ 1 3x 2 μ=X xf (x)dx = 1 − x dx = 0 , ∫∫−∞ −1 4 ( ) +∞ 1 2 σ=22()xf(x)dx1xdx −μ2 =3x − XX∫∫4 ( ) −∞ −1 1 2 35 1 =−=−=3x2 3 xx 21xdx24435() . ∫0 ()()5 2.3. Mệnh đề. Cho X là biến số ngẫu nhiên với trung bình EX( ) =μX . Ta có 222 σXX=−μEX( ) . Chứng minh. Do E tuyến tính, nghĩa là EX()α+β=α Y EX( ) +β EY( ) , ta suy ra 2 2 σ=XXEX(() −μ ) 22 =−μ+μEX() 2XXX 22 =−μ+μEX() 2XX EX() 22 =−μEX() X Ví dụ 11. Với biến số ngẫu nhiên rời rạc X trong ví dụ 4, ta có bảng phân phối xác suất X 0 1 2 3 P 1 3 3 1 8 8 8 8 nên ta nhận được trung bình 13313 μ=xf (x) =⋅+⋅+⋅+⋅ 0 1 2 3 = X ∑ 88882 x và phương sai ⎛⎞ σ=2222EX −μ=⎜⎟ xf(x) −μ 2 XX() ⎜⎟∑ X ⎝⎠x 2 22221133 33 =⋅+⋅+⋅+⋅−0123888824() = . 38
2.4. Định lý (Bất đẳng thức Tchebyshev). Xét biến số ngẫu nhiên X với trung bình μ và phương sai σ2 . Ta có σ2 PX()−μ ≥ε ≤ , ε2 với mọi ε>0 . Chứng minh. Trường hợp 1 : X là biến số ngẫu nhiên rời rạc. Ta có σ=2 ∑ ()xf(x) −μ2 x =−μ+−μ∑∑()xf(x)xf(x)22() xx−μ <ε −μ ≥ε ≥−μ∑ ()xf(x)2 x−μ ≥ε ≥ε2 ∑ f(x) x−μ ≥ε =ε2PX() −μ ≥ε Trường hợp 2 : X là biến số ngẫu nhiên liên tục. Tương tự như trên, ta có +∞ σ=2 ()xf(x)dx −μ2 ∫−∞ =−μ+−μ()xf(x)dxxf(x)dx22() ∫∫xx−μ <ε −μ ≥ε ≥−μ()xf(x)dx2 ∫x−μ ≥ε ≥ε2 f(x)dx ∫x−μ ≥ε =ε2PX() −μ ≥ε Tóm lại, ta luôn có σ2 PX()−μ ≥ε ≤ . ε2 Bằng cách viết σ2 PX()−μ <ε = 1 − PX() −μ ≥ε ≥ 1 − , ε2 ta nói rằng Với mọi số dương ε cho trước, xác suất để X lấy giá trị trong khoảng 2 ()μ−ε, μ+ε ít nhất phải bằng 1 − σ . ε2 39
2.5. Định nghĩa. Cho X là biến số ngẫu nhiên với hàm mật độ f(x). Hàm số M(t)= E() etX được gọi là hàm đặc trưng của X. Từ định nghĩa, ta có M(t)= ∑ etx f (x) x khi X là biến số ngẫu nhiên rời rạc, và +∞ M(t)= etx f (x)dx ∫−∞ khi X là biến ngẫu nhiên liên tục. Khác với các đại lượng trung bình và phương sai, hàm đặc trưng không mang ý nghĩa cụ thể liên quan đến biến số ngẫu nhiên mà chỉ là một công cụ toán học để giải quyết các bài toán liên quan đến hàm mật độ của các biến ngẫu nhiên. Để tính trung bình và phương sai của X, ta lấy đạo hàm hàm đặc trưng M(t) theo t, M(t)′ = E( XetX ) và cho t0= , ta được M(0)′ = E( X) =μ và với đạo hàm bậc hai M(t)′′ = E( X2tX e ) và cho t0= , ta được M(0)′′ = E( X2 ) . Suy ra σ=222E( X) −μ= M′′ (0) −() M ′ (0) 2 . Ta được 2.6. Mệnh đề. Cho X là biến ngẫu nhiên với trung bình μ , phương sai σ2 và hàm đặc trưng M(t) . Ta có μ = M(0)′ , σ=2 M′′ (0) −() M ′ (0) 2 . Ngoài những tham số đặc trưng cho biến số ngẫu nhiên nêu trên, người ta còn có một số tham số khác như sau : Mốt : Mốt của đại lượng ngẫu nhiên rời rạc X, ký hiệu Mod() X , là giá trị x0 của X mà PX()= x0 là lớn nhất. Người ta còn nói rằng Mod() X là giá trị tin 40
chắc nhất của X. Trong trường hợp X là biến số ngẫu nhiên liên tục với hàm mật độ f(x)X , thì Mod( X) là giá trị x0 của X sao cho fX0( x) là lớn nhất. Trung vị : Trung vị của đại lượng ngẫu nhiên (rời rạc hay liên tục), ký hiệu Me() X , là giá trị x0 của X sao cho PX( ≤= x00) PX( ≥ x) . Chú ý rằng Mốt cũng như trung vị của một đại lượng ngẫu nhiên thì không duy nhất. Ví dụ 12. Xét biến số ngẫu nhiên rời rạc X trong ví dụ 3, với bảng phân phối xác suất X 0 1 2 3 P 1 3 3 1 8 8 8 8 Ta có Mod() X= 1 hay = 2 và 1MeX2 2) , μX , σX , Mod() X và Me() X . +∞ Từ điều kiện cho hàm mật độ xác suất : f(x)≥ 0, ∀x ∈ \ , và f(x)dx= 1, ∫−∞ ta được A ≥ 0 và 3 9A 1Ax3xdx=−=() ∫0 2 2 cho A = 9 . +∞ 3 7 PX()>= 2 f(x)dx =2 x3() − xdx = , ∫∫229 27 +∞ 3 2 2 3 μ=X xf (x)dx = x() 3 − x dx =, ∫∫−∞ 0 9 2 +∞ 3 27 22==−=2 3 EX() xf(x)dx9 x() 3 xdx , ∫∫−∞ 0 10 và do đó 2 222 27 3 9 σ=XXEX −μ() = −() = . () 10 2 20 Để tìm Mod( X) , ta lập bảng biến thiên cho hàm mật độ bằng cách xét dấu 3 đạo hàm của nó. Từ đó suy ra Mod(X) = 2 . Trung vị aMed(X)= được xác định từ điều kiện PX( ≤ a)(=≥ PX a ). Ta suy ra a0,3∈ [ ] , và 41
121a =−=−+2 x3() xdx a32 a. 2273∫0 9 3 Từ các điều kiện trên, ta được Med(X) = 2 . Ngoài ra, người ta còn có một số tham số liên quan đến hình dáng của hàm mật độ như sau : Với X là biến số ngẫu nhiên với trung bình μX và phương sai 2 σX , giá trị 3 EX(()−μX ) γ=X 1 () 3 σX được gọi là hệ số đối xứng của X và giá trị 4 EX(()−μX ) γ=X 2 () 4 σX được gọi là hệ số nhọn của X. Nếu γ=1 ()X 0 thì phân phối của X là đối xứng; lệch phải khi γ>1 ()X 0 và lệch trái khi γ<1 ()X 0 . Ngoài ra giá trị γ2 (X) càng lớn thì phân phối của X càng nhọn. k Cuối cùng, với X là biến số ngẫu nhiên có trung bình μX , kỳ vọng của X được gọi là mômen gốc cấp k của X, ký hiệu mk , k mEXk = ( ) , k và kỳ vọng của ()X −μX được gọi là mômen quy tâm cấp k của X, ký hiệu tk , k tEXkX=−μ(()) . 2 Chú ý rằng m1X=μ và t2X= σ . Ví dụ 14. Đo đường kính một chi tiết máy (đơn vị mm). Ta có các số liệu : 201; 203; 209; 204; 202; 206; 200; 207; 207. Ta được độ dài trung bình chi tiết máy 1 μ=()201 + 203 + 209 + + 207 + 207 = 204 , X 9 phương sai 1 σ=2 ()()201 − 20422 + + 207 − 204 = 9.5 , X 9 ( ) hệ số đối xứng 1 201−++− 20433 207 204 9 (()()) γ=1 (X)3 = 0.058, ()9.5 2 và hệ số nhọn 42
1 201−++− 20444 207 204 9 (()()) γ=2 (X) =− 1.33 . ()9.5 2 3. VECTƠ NGẪU NHIÊN Trong phần này, ta chỉ xét vectơ ngẫu nhiên có hai thành phần và hơn nữa, các thành phần của vectơ ngẫu nhiên này phải cùng loại, nghĩa là cùng là biến số ngẫu nhiên rời rạc hay liên tục. Ta phân biệt hai trường hợp A. Vectơ ngẫu nhiên rời rạc Xét vectơ ngẫu nhiên V = (X, Y) . Giả sử X, Y lần lượt lấy các giá trị X = x,x,x, 123 Y = y123 , y , y , Đặt pPVx,yPXx;Yyij==()( i j) ≡==( i j ) . Ta có bảng phân phối xác suất Y y1 y2 y3 PX X x1 p11 p12 p13 p1. x2 p21 p22 p23 p2. x3 p31 p32 p33 p3. PY p.1 p.2 p.3 1 3.1. Mật độ đồng thời. Hàm số ⎧ ⎪pkhix,yx,yij()= ( i j ) f(x,y) = ⎨ ⎩⎪0khix,yx,y,i,j()≠ ()ij∀ được gọi là hàm mật độ đồng thời, hay vắn tắt là hàm mật độ, của V = ()X, Y . Từ định nghĩa, ta có (i) f(x,y)≥ 0, ∀ ()x, y , và (ii) ∑ f(x,y)= 1. x,y 3.2. Mật độ thành phần. Từ bảng phân phối xác suất của V = (X, Y) , ta có thể suy ra được các bảng phân phối xác suất cho X và Y. Cụ thể, do 43
P( X== xkk123) P( X = x ; Y = y , y , y , ) ==PX()() x;Yk1 =+= y PX x;Y k2 =+ y +=P() X xk3 ; Y =+ y =+++pk1 p k2 p k3 =≡∑ ppkj k. j nên ta có bảng phân phối xác suất cho X X x1 x2 x3 P p1. p2. p3. và hàm mật độ của X f(x)X ≡ ∑ f(x,y) y được gọi là hàm mật độ thành phần X của V. Tương tự, P( Y== yk123k) P( X = x , x , x , ; Y = y ) =+++p1k p 2k p 3k =≡∑ ppik .k i nên ta có bảng phân phối xác suất cho Y Y y1 y2 y3 P p.1 p.2 p.3 và hàm mật độ của Y fY (y)≡ ∑ f(x, y) x được gọi là hàm mật độ thành phần Y của V. 3.3. Mật độ có điều kiện. Để khảo sát biến số ngẫu nhiên X khi biết Y xảy ra, ta cần tính xác suất có điều kiện PXY( ) . Cụ thể, PX( == x;Yij y) pij PX()=== xij Y y = PY()= yj p.j và ta có bảng phân phối xác suất của X (Yy= j ) x x x X ()Yy= j 1 2 3 P p1j p2j p3j p.j p.j p.j Tổng quát 44
PX( == x;Y y) f(x,y) PX()=== xY y = PY()= y f(y)Y và hàm số f(x,y) f(x)XY = f(y)Y được gọi là hàm mật độ có điều kiện của X, khi biết Y = y . Tương tự, hàm số f(x,y) f(y)YX = f(x)X được gọi là hàm mật độ có điều kiện của Y, khi biết X = x . 3.4. Biến số ngẫu nhiên độc lập. Với hai biến số ngẫu nhiên X, Y, ta nói X độc lập với Y nếu hàm mật độ có điều kiện của X, khi biết Y = y , không phụ thuộc vào y, nghĩa là f(x)f(x)XY = X , và do đó, f(x, y)= fXY (x)f (y) . Từ đó suy ra f(x,y) f(y)Y == fYX (y) f(x)X và do đó, Y cũng độc lập với X. Ví dụ 15. Cho vectơ ngẫu nhiên V = (X, Y) với bảng phân phối xác suất Y 0 1 X 0 0.3 0.35 1 0.15 0.2 Tập các giá trị của V là {(0, 0) ,( 0, 1) ,( 1, 0) ,( 1, 1)} và hàm ⎧=0.3 khi( x, y) ( 0, 0) ⎪ 0.35 khi()() x, y= 0,1 ⎪ f(x,y) = ⎨0.15 khi()() x, y= 1, 0 ⎪0.2 khi x, y= 1,1 ⎪ ()() ⎩⎪0 các trường hợp khác là hàm mật độ đồng thời của V. Ngoài ra, do 45
P( X== 0) P( X = 0;Y =+ 0) P( X = 0;Y = 1) =+0.3 0.35 = 0.65 P( X== 1) P( X = 1;Y =+ 0) P( X = 1;Y = 1) =+=0.15 0.2 0.35 nên ta nhận được bảng phân phối xác suất cho X, X 0 1 P 0.65 0.35 và hàm mật độ thành phần fX của biến số ngẫu nhiên X, ⎧0.65 khi x= 0 ⎪ fX (x)==⎨ 0.35 khi x 1 ⎪ ⎩0khix0,1≠ Tương tự, ta có bảng phân phối xác suất cho Y và hàm mật độ thành phần fY , Y 0 1 P 0.45 0.55 ⎧0.45 khi y= 0 ⎪ f(y)Y ==⎨ 0.55khiy 1 ⎪ ⎩0khiy0,1≠ Do f(x, y)≠ fXY (x)f (y) nên hai biến số ngẫu nhiên X và Y không độc lập với nhau. B. Vectơ ngẫu nhiên liên tục Mở rộng các khái niệm của vectơ ngẫu nhiên rời rạc cho vectơ ngẫu nhiên liên tục V = ()X, Y , ta có 3.5. Mật độ đồng thời. Hàm số f(x,y) được gọi là hàm mật độ đồng thời, hay vắn tắt là hàm mật độ, của V = ()X, Y , nếu với mọi a, b, c,d ∈ \ , ab≤ , cd≤ , ta có db P() a≤≤ X b; c ≤≤ Y d = f (x, y)dxdy . ∫∫ca Từ định nghĩa, ta có (i) f(x,y)≥ 0, ∀ ()x, y , và ∞∞ (ii) f(x,y)dxdy= 1. ∫∫−∞ −∞ 46
3.6. Mật độ thành phần. Hàm mật độ thành phần X và Y của V được lần lượt xác định theo hàm mật độ đồng thời f(x,y) của V bởi ∞ f(x)X = f(x,y)dy, ∫−∞ ∞ fY (y)= f(x, y)dx . ∫−∞ 3.3. Mật độ có điều kiện. Hàm mật độ có điều kiện của X, khi biết Y = y và hàm mật độ có điều kiện của Y, khi biết X = x lần lượt cho bởi f(x,y) f(x)XY = , f(y)Y f(x,y) f(y)YX = . f(x)X 3.7. Biến số ngẫu nhiên độc lập. Với hai biến số ngẫu nhiên X, Y, ta nói X độc lập với Y nếu hàm mật độ có điều kiện của X, khi biết Y = y , không phụ thuộc vào y, nghĩa là fXY (x)= fX (x) và do đó, f(x, y)= fXY (x)f (y) Từ đó suy ra f(x,y) f(y)Y == fYX (y) f(x)X và do đó, Y cũng độc lập với X. 4. THAM SỐ ĐẶC TRƯNG VECTƠ NGẪU NHIÊN Xét vectơ ngẫu nhiên V = (X, Y) với hàm mật độ xác suất f(x,y) và uX,Y() là một hàm theo vectơ ngẫu nhiên V = (X, Y) . Kỳ vọng của uX,Y() được xác định là E() u() X, Y= ∑ u(x, y)f(x, y) x,y khi X, Y là các biến ngẫu nhiên rời rạc, và +∞ +∞ E() u() X, Y= u(x, y)f(x, y)dxdy ∫∫−∞ −∞ 47
khi X là biến ngẫu nhiên liên tục. Ta có 4.1. Trung bình thành phần. Để tính trung bình của X hay Y, ta có thể sử dụng các công thức cho biến số ngẫu nhiên bằng cách dùng các hàm mật độ thành phần f(x)X và f(y)Y . Ngoài ra, ta cũng có thể tính trung bình của X hay Y từ hàm mật độ đồng thời f(x,y) bằng cách lấy uX,Y()= X và uX,Y( ) = Y, nghĩa là μ=X ∑ xf (x, y) x,y khi X là biến rời rạc, và +∞ +∞ μ=X xf (x, y)dxdy ∫∫−∞ −∞ khi X là biến liên tục. Tương tự cho μY . 4.2. Phương sai thành phần. Tương tự như trên, để tính phương sai của X hay Y, ta có thể sử dụng các công thức cho biến số ngẫu nhiên bằng cách dùng các hàm mật độ thành phần f(x)X và f(y)Y . Ngoài ra, ta cũng có thể tính từ hàm mật độ đồng thời f(x,y) 2 2 bằng cách lấy uX,Y()(=−μ X X ) và uX,Y()(=−μ Y Y ), nghĩa là 2 2 σ=XX∑ ()xf(x,y) −μ x,y khi X là biến rời rạc, và +∞ +∞ 2 2 σ=XX()xf(x,y)dxdy −μ ∫∫−∞ −∞ 2 khi X là biến liên tục. Tương tự cho σY . Quan trọng hơn, ta còn có đại lượng đánh giá sự thay đổi phụ thuộc tuyến tính vào nhau giữa các biến số ngẫu nhiên thành phần của một vectơ ngẫu nhiên mà ta gọi là hệ số tương quan như sau Cho V = (X, Y) là một vectơ ngẫu nhiên với μX , μY lần lượt là trung bình của X, Y. Kỳ vọng của uX,Y()= ( X−μXY) ( Y −μ ) được gọi là moment tương quan hay hiệp phương sai của ()X,Y , ký hiệu cov( X, Y) . Ta có cov() X, Y≡−μ−μ=−μ−μ E() ( XXY )() Y∑ ()() x XY y f (x, y) x,y khi X, Y rời rạc, và 48
+∞ +∞ cov() X, Y=−μ−μ ( xXY )() y f (x, y)dxdy ∫∫−∞ −∞ khi X, Y liên tục. Ta có kết quả sau 4.3. Mệnh đề. cov( X, Y) = E( XY) −μXY μ . Chứng minh. Ta có cov() X, Y=−μ−μ E(( XXY) ( Y )) =EXYYX() −μ−μ+μμ XYXY =EXY() −μ−μ+μμXYXY EY () EX () =−μμEXY()XY Hệ số tương quan của ()X,Y , ký hiệu ρ (X,Y) , được định nghĩa là cov( X, Y) ρ=()X, Y . σσXY Ví dụ 16. Với vectơ ngẫu nhiên V = (X, Y) cho bởi bảng phân phối xác suất Y 1 −1 0 PX X 0 0.1 0.3 0.1 0.5 1 0 0.2 0.3 0.5 PY 0.1 0.5 0.4 1 ta có μ=XX∑ xf (x) =⋅ 0 0.5 +⋅ 1 0.5 = 0.5 , x 22 222 2 σ=XXX∑ x f (x) −μ= 0 ⋅ 0.5 + 1 ⋅ 0.5 − 0.5 = 0.25 , x μ=−⋅Y ()1 0.1 +⋅ 0 0.5 +⋅ 1 0.4 = 0.3 , 22222 σ=−X ()1 ⋅ 0.1 + 0 ⋅ 0.5 + 1 ⋅ 0.4 − ( 0.3 ) = 0.41 , cov() X, Y==−μμ=∑ xyfXXY (x, y) 0.15 , x,y cov( X, Y) 0.15 ρ=()X,Y = = 0.47. σσXY 0.25⋅ 0.41 49
4.4. Định nghĩa. Hàm số hai biến M(s, t)= E( esX+ tY ) được gọi là hàm đặc trưng của vectơ ngẫu nhiên V = ()X, Y . Từ định nghĩa, ta có M(s, t)= ∑ esx+ ty f (x, y) x,y khi X, Y rời rạc, và +∞ +∞ M(s, t)= esx+ ty f (x, y)dxdy ∫∫−∞ −∞ khi X, Y liên tục. 4.5. Định lý. Xét vectơ ngẫu nhiên V = (X, Y) , uX( ) và vY( ) lần lượt là hai hàm theo X và Y. Nếu X, Y độc lập, ta có EuXvY( ( ) ( )) = EuX( ( )) EvY( ( )) . Chứng minh. Khi X, Y rời rạc, ta có E( u()() X v Y) = ∑ u(x)v(y)f(x, y) x,y = ∑ u(x)v(y)fXY (x)f (y) x,y = ∑∑u(x)fXY (x) v(y)f (y) xy = EuX()() EvY()() Tương tự cho trường hợp X, Y liên tục. 4.6. Định lý. Xét vectơ ngẫu nhiên V = (X, Y) . Nếu X, Y độc lập và ZXY=+ thì MZXY (t)= M (t)M (t) . Chứng minh. Ta có tZtX()+ Y tX tY M(t)Z == Ee( ) Ee( ) = Ee( e ) tX tX ==E()() e E e MXY (t)M (t) Bài tập. 1. Có hai thùng thuốc A và B, trong đó : − thùng A có 20 lọ gồm 2 lọ hỏng và 18 lọ tốt, − thùng B có 20 lọ gồm 3 lọ hỏng và 17 lọ tốt, a) Lấy ở mỗi thùng 1 lọ. Gọi X là số lọ hỏng trong 2 lọ lấy ra. Tìm hàm mật độ của X. 50
b) Lấy ở thùng B ra 3 lọ. Gọi Y là số lọ hỏng trong 3 lọ lấy ra. Tìm hàm mật độ của Y. 2. Một xạ thủ bắn bia với xác suất bắn trúng bia là p0.6= . Có 5 viên đạn được bắn lần lượt và xạ thủ sẽ dừng bắn khi hết đạn hay ngay khi có một viên đạn trúng bia. Gọi X là số lần bắn. Tìm hàm mật độ của X. Tính trung bình μ và phương sai σ2 . 3. Một thùng đựng 10 lọ thuốc trong đó có 1 lọ hỏng. Ta kiểm tra từng lọ (không hoàn lại) cho đến khi phát hiện được lọ hỏng thì dừng. Gọi X là số lần kiểm tra. Tìm hàm mật độ của X. Tính trung bình μ và phương sai σ2 . 4. Gọi X là tuổi thọ của con người. Một công trình nghiên cứu cho biết hàm mật độ của X là ⎪⎧cx2 () 100−≤≤ x2 khi 0 x 100 f(x) = ⎨ ⎩⎪0 khi x<> 0 hay x 100 a) Xác định hằng số c, b) Tính trung bình và phương sai của X, c) Tính xác suất của một người có tuổi thọ ≥ 60, d) Tính xác suất một người có tuổi thọ ≥ 60 , biết rằng người đó hiện nay đã 50 tuổi. 5. Cho vectơ ngẫu nhiên có bảng phân phối xác suất Y 1 2 3 X 0 0.1 0.2 0.1 1 0.2 0.2 0.2 a) Tìm các hàm mật độ thành phần f(x)X , f(y)Y , 2 2 b) Tìm các trung bình μX , μY , các phương sai σX , σY và hệ số tương quan ρ ()X,Y . 6. Cho vectơ ngẫu nhiên có hàm mật độ 2 ⎪⎧cx()+∈× y khi () x,y[][] 0,1 0,1 f(x,y) = ⎨ ⎩⎪0khix,y0,10,1()∉×[][] a) Tìm các hàm mật độ thành phần f(x)X , f(y)Y , 2 2 b) Tìm các trung bình μX , μY , các phương sai σX , σY và hệ số tương quan ρ ()X,Y . 51
7. Cho vectơ ngẫu nhiên V = ()X, Y , với X, Y độc lập. Giả sử X, Y có trung bình 2 2 lần lượt là μX , μY và phương sai σX , σY . Đặt ZXY= α+β. Chứng minh rằng a) μ=αμ+βμZXY, 22222 b) σ=ασ+βσZZZ 8. Cho vectơ ngẫu nhiên V = ()X, Y . Đặt Z= X+ Y . Chứng minh rằng 22 2 μ=μ+μZXY và σ=σ+ρZX2X,Y() σσ+σ XYY Suy ra rằng, nếu X và Y không tương quan, nghĩa là ρ (X,Y) = 0, thì 222 σZXY=σ +σ . 9. Cho vectơ ngẫu nhiên V = ()X, Y có bảng phân phối xác suất Y 0 1 X 1 −1 3 0 1 0 0 3 1 1 3 0 a) Tính trung bình và phương sai của X và Y, b) Tính hệ số tương quan ρ ()X,Y , c) X và Y có độc lập không ? 10. Chứng minh rằng nếu vectơ ngẫu nhiên V = (X, Y) có X, Y độc lập thì ρ=()X,Y 0. 11. Chứng minh rằng với mọi vectơ ngẫu nhiên V = (X, Y) , ta có hệ số tương quan ρ ()X,Y thỏa −1X,Y1≤ρ( ) ≤ . 52
Chương 3 PHÂN PHỐI XÁC SUẤT Trong chương này, chúng ta lần lượt khảo sát các phân phối xác suất thông dụng của biến số ngẫu nhiên. Trước hết, xuất phát từ lược đồ Bernoulli khi ta thực hiện nhiều lần một phép thử τ một cách độc lập và xét X là số lần xuất hiện một biến cố A với PA()> 0 trong n lần thực hiện phép thử τ . Trường hợp n1= , ta có X = 0,1 và ta có bảng phân phối xác suất X 0 1 P 1p− p Do đó, ta có hàm mật độ ⎧1pkhix−= 0 ⎪ f(x)==⎨ p khi x 1 ⎪ ⎩0khix0,1≠ ⎪⎧p1px ()−=1x− khix0,1 = ⎨ ⎩⎪0khix0,1≠ và ta nói X tuân theo luật phân phối Bernoulli, ký hiệu X ∼ B1;p( ) . Ta suy ra Trung bình : μX =−+⋅=01() p 1 p p, 22 2 2 Phương sai : σX =−+⋅−=−01p() 1 pp p1p (), Hàm đặc trưng : M(t)=−+ 1 p pet . Tổng quát, ta có 1. PHÂN PHỐI NHỊ THỨC Bn;p( ) Trong lược đồ Bernoulli, khi ta thực hiện phép thử τ một cách độc lập n lần và xét X là số lần xuất hiện của biến cố A, với PA( ) > 0, thì X = 0,1, 2, , n và do Định lý Bernoulli, kk nk− PX()== k Cpn () 1 − p , với k= 0,1,2, ,n, và do đó, hàm mật độ xác suất của X là − ⎪⎧Cxx p() 1−= pnx khi x 0,1, 2, , n f(x) = ⎨ n ⎩⎪0 khi x≠ 0,1, 2, , n và ta có 1.1. Định nghĩa. Biến số ngẫu nhiên X gọi là có phân phối theo luật nhị thức, ký hiệu X ∼ Bn;p(), nếu hàm mật độ của X có dạng 53
− ⎪⎧Cxx p() 1−= pnx khi x 0,1, 2, , n f(x) = ⎨ n ⎩⎪0 khi x≠ 0,1, 2, , n Ví dụ 1. Trong một vùng dân cư có 65% gia đình có máy giặt, chọn ngẫu nhiên 12 gia đình. Gọi X là số gia đình có máy giặt trong số 12 gia đình này. Ta có X ∼ B( 12; 0.65) và ta có thể tính một số xác suất trên X như : Xác suất để nhận được đúng 5 gia đình có máy giặt là 5 5125− P() X== 5 C12 ()() 0.65 1 − 0.65 ≈ 0.0591 , và xác suất để có ít nhất 2 gia đình có máy giặt là PX( ≥=−⎡=+ 2) 1⎣⎦ PX( 0) PX( =⎤ 1) =−1⎡⎤ 0.3512 + 12 0.65 0.35 11 ≈ 0.999. ⎣⎦() ()() 1.2. Mệnh đề. Cho biến số ngẫu nhiên X ∼ Bn;p( ) . Với q1p= − , ta có i) trung bình : μ=X np , 2 ii) phương sai : σ=X npq , iii) giá trị tin chắc nhất : Mod( X) = k0 , với k0 là số nguyên thỏa bất phương trình np− q≤≤−+ k0 np q 1. Chứng minh. Ta có hàm đặc trưng của X là nn tx x xnx− x t x nx− M(t)=−=−∑∑ e Cnn p() 1 p C() pe() 1 p x0== x0 n =−+()1ppet Lấy đạo hàm, ta có n1− M(t)′ =−+ n( 1 p pett) pe và cho t0= , ta được μ=EX( ) = M(0)np′ = . Lấy đạo hàm bậc hai, n2−− 2 n1 M(t)′′ =−−+ n() n 1() 1 p pett( pe) +−+ n( 1 p pe tt) pe và do đó, σ=2 M′′ (0) −() M ′ (0) 2 =−+−=−⎡⎤222 ⎣⎦n() n 1 p np () np np np =−np(1 p). Ví dụ 2. Một nhân viên tiếp thị bán hàng ở 5 chỗ khác nhau trong ngày. Xác suất bán được hàng ở mỗi nơi đều là 0.4. 54
a) Tìm xác suất để nhân viên này bán được hàng trong ngày. b) Mỗi năm nhân viên này đi bán hàng 330 ngày. Gọi Y là số ngày bán được hàng trong năm. Tìm giá trị tin chắc nhất của Y, nghĩa là tìm số ngày bán được hàng nhiều khả năng nhất trong một năm. Gọi X là tổng số nơi bán được hàng trong ngày. Ta có X ∼ B5;0.4(). Do đó, xác suất để bán được hàng trong ngày là 0 050− P() X≥=− 1 1 P () X ==− 0 1 C5 ()() 0.4 1 − 0.4 ≈ 0.92224. Ta có Y ∼ B( 330; 0.92224) và do đó, số ngày bán được hàng nhiều khả năng nhất là kModY0 = ( ) , với k0 ∈ thỏa 330⋅ 0.92224−≤≤⋅−+ 0.07776 k0 330 0.92224 0.07776 1. Từ đó, suy ra k3050 = . Vậy số ngày bán được hàng có nhiều khả năng trong một năm là 305. Ví dụ 3. Một lô thuốc gồm 10 lọ trong đó có 2 lọ thuốc hỏng. Lấy ngẫu nhiên 5 lọ từ lô thuốc, có hoàn lại. Gọi X là số lọ hỏng trong 5 lọ lấy ra. Tìm hàm mật độ của X. Xét phép thử τ : “lấy một lọ từ lô thuốc” và biến cố A : “nhận được lọ 2 hỏng”. Ta có pPA===( ) 10 0.2. Việc lấy 5 lọ có hoàn lại từ lô thuốc cũng chính là việc thực hiện phép thử τ năm lần độc lập nhau và X là số lần biến cố A xuất hiện trong 5 lần thực hiện phép thử. Do đó X ∼ B5;0.2( ) và ta được hàm mật độ của X − ⎪⎧Cx ()() 0.2x5x 0.8 khi x= 0,1,2,3,4,5 f(x) = ⎨ 5 ⎩⎪0 khi x≠ 0,1,2,3,4,5 Chú ý rằng trong ví dụ trên, nếu ta lấy 5 lọ thuốc từ lô thuốc nhưng không hoàn lại thì X không thỏa phân phối nhị thức. Bằng cách xét phép thử τ : “lấy 5 lọ thuốc từ lô thuốc” với không gian mẫu Ω và xét biến cố Ak : “nhận được đúng k lọ hỏng”, ta có X = 0, 1, 2, 3, 4, 5 và PX( == k) PA( k ) . Khi k3,4,5= , Ak =∅ 5 k5k− và khi k0,1,2= thì do Ω có C10 phần tử và Ak có CC28 phần tử (xem ví dụ 2 chương 0 và ví dụ 13 chương 1), ta có CCk5k− PX== k PA =28 ()()k 5 C10 và do đó, ta nhận được hàm mật độ xác suất của X là x5x− ⎧CC28 ⎪ 2 khi x= 0,1, 2 f(x) = ⎨ C10 ⎩⎪0khix0,1,2≠ Tổng quát, nếu ta lấy n phần tử từ một tập hợp có N phần tử, trong đó có K phần tử mang tính chất Τ và gọi X là số phần tử mang tính chất Τ nhận được trong n phần tử lấy ra, thì X chỉ có thể lấy các giá trị từ 0 đến n và 55
CCknk− PX== k KNK− . () n CN Hơn nữa, chú ý rằng khi kK> hay knNK< −+ thì biến cố X = k là không thể có. Do đó, ta có hàm mật độ cho X, CCxnx− f(x) = KNK− n CN khi xmax0,nNK≥−+() và xminn,K≤ ( ) , và f(x)= 0 trong các trường hợp còn lại. Từ đó, ta có 2. PHÂN PHỐI SIÊU BỘI H( N,K,n) 2.1. Định nghĩa. Biến số ngẫu nhiên X gọi là có phân phối theo luật siêu bội, ký hiệu X ∼ H() N,K,n , nếu hàm mật độ của X có dạng CCxnx− f(x) = KNK− n CN khi xmax0,nNK≥−+() và xminn,K≤ ( ) , và f(x)= 0 trong các trường hợp còn lại. Ta có một số tính chất sau : CCxnx− (i) KNK− ===PX x 1, ∑∑n () xxCN xnx− x−−−− 1 (n 1) (x 1) CC K CC− (ii) knKNK− = K1 (N− 1)−− (K 1) , n(n1)N − CCN (N− 1) xnx− x−−−− 2 (n 2) (x 2) CC K(K−− 1)n(n 1) CC− (iii) k(k−= 1) KNK− K2 (N−− 2) (K − 2) . n(n2)N(N− 1) − CCN (N− 2) Từ đó, ta chứng minh được K 2.2. Mệnh đề. Cho biến số ngẫu nhiên X ∼ HN,K,n( ) . Với p = và q1p=−, N ta có i) trung bình : μ=X np , Nn− ii) phương sai : σ=2 npq . X N1− 56
Ví dụ 4. Từ một hộp đựng 15 quả cam trong đó có 5 quả hư, lấy ra 3 quả. Gọi X là số quả hư trong 3 quả lấy ra. Ta có X ∼ H( 15, 5, 3) . Xác suất để cả 3 quả đều hư là CC30 P X== 3510 ≈ 0.021978 . ()3 C15 5 Ngoài ra, trung bình (kỳ vọng) và phương sai của X là μ=⋅X 3115 = và 2 55153− 12 σ=⋅X 3115 ⋅() − 15 15− 1 = 21 . K Hơn nữa, nếu tỷ lệ p = không đổi và N →∞ (khi đó, ta cũng có K →∞) N thì quy luật phân phối siêu bội tiến về quy luật phân phối nhị thức, nghĩa là nếu X ∼ H() N,K,n , thì kk nk− PX()=→ k Cpn () 1 − p , khi N →∞, với mọi k= 0,1, , n . Nói khác đi, nếu X ∼ H() N,K,n và n khá nhỏ so với N, thì để tính xác suất K PX()= k, ta có thể xấp xỉ nó bằng phân phối nhị thức X ∼ Bn;p( ) , với p = . N Ví dụ 5. Một lô thuốc lớn có tỷ lệ thuốc hỏng là p0.2= , lấy ngẫu nhiên 5 lọ. Gọi X là số lọ hỏng trong 5 lọ lấy ra. Tìm hàm mật độ xác suất của X. Ta có X ∼ HN,K,5( ) , với N là số lọ trong lô thuốc và K là số lọ hỏng. Do N K ∼ lớn và N = 0.2 nên ta có thế xấp xỉ bằng phân phối nhị thức, X B5;0.2(), với hàm mật độ ⎪⎧Cx ()() 0.2x5x 0.8− khi x= 0,1, ,5 f(x) = ⎨ 5 ⎩⎪0 khi x≠ 0,1, ,5 và bảng phân phối xác suất X 0 1 2 3 4 5 P 0.328 0.409 0.205 0.051 0.007 0.000 Việc xấp xỉ phân phối siêu bội bằng phân phối nhị thức nêu trên còn có thể phát biểu lại như sau : Cho một tổng thể Ω có N phần tử, trong đó có K phần tử mang tính chất Τ nào đó. Xét phép thử τ : “lấy một phần tử của tổng thể” và biến cố A : “nhận K được phần tử có tính chất Τ ”, ta có PA( ) = N ≡ p. Lấy n phần tử từ Ω và gọi X là số phần tử mang tính chất Τ trong n phần tử lấy ra, ta có : Nếu ta lấy mẫu có hoàn lại, thì X ∼ Bn;p( ) ; 57
Nếu ta lấy mẫu không hoàn lại, thì X ∼ H( N,K,n) . Tuy nhiên, nếu cỡ mẫu n khá nhỏ so với kích thước tổng thể N thì ta có thể xấp xỉ phân phối xác suất ∼ K của X bằng phân phối nhị thức, X Bn;p( ) , với PA( ) = N ≡ p. Nói khác đi, Khi cỡ mẫu khá nhỏ so với kích thước tổng thể thì việc lấy mẫu có hoàn lại hay không hoàn lại là như nhau. Ngay cả với phân phối nhị thức, X ∼ Bn;p( ) . Khi cỡ mẫu n lớn, việc tính toán các xác suất kk nk− PX()== k Cpn () 1 − p , với k= 0,1, , n , không đơn giản do ta phải tính các giai thừa m! và các lũy thừa pm , qm , với m lớn. Do đó, khi cỡ mẫu n lớn, người ta lại xấp xỉ X bằng phân phối Poisson hay phân phối chuẩn tùy theo giá trị của n và p. Trước hết, ta có 3. PHÂN PHỐI POISSON 3.1. Định nghĩa. Biến số ngẫu nhiên X gọi là có phân phối Poisson, ký hiệu X ∼ P ()μ , nếu hàm mật độ xác suất của X có dạng x ⎪⎧e−μ μ khi x= 0,1, , n, f(x) = ⎨ x! ⎩⎪0 khi x≠ 0,1, , n, Bằng cách viết nk−−n( n−−+ 1) ( n k 1) nk Cpkk() 1−= p p k() 1 − p n k! 1 n()( n−−+ 1 n k 1 )knk− =−()np pk ( 1 p ) k! nk và với np =μ không đổi, khi n →∞, ta có p0→ và nn( −−+ 1 n) ( k 1) lim= 1 , n→∞ nk nk−−μ k lim() 1−=−= p lim () 1 pp e−μ . np0→∞ → Từ đó, suy ra μk Cpkk() 1−≈ pnk− e−μ n k! khi n khá lớn. Nói cách khác, nếu X ∼ Bn;p( ) , trong đó p đủ nhỏ và n đủ lớn, thì X được xem như có phân phối Poisson P (μ) , với μ = np . 58
Ví dụ 6. Tỷ lệ thuốc hỏng trong một lô thuốc lớn là p0.05= . Lấy ngẫu nhiên 20 lọ. Gọi X là số lọ hỏng nhận được. Tìm hàm mật độ của X và so sánh với giá trị xấp xỉ bởi phân phối Poisson. Do X ∼ B20;0.05() nên nó có hàm mật độ ⎪⎧Cx ()( 0.05x20x 1−= 0.05 )− khi x 0,1, , 20 f(x) = ⎨ 20 ⎩⎪0 khi x≠ 0,1, , 20 Nếu ta xấp xỉ bởi phân phối Poisson, nghĩa là X ∼ P (μ) , với μ=np = 20 ⋅ 0.05 = 1 , thì hàm mật độ trở thành x ⎧⎪e−1 1 khi x= 0,1, , 20 f(x) = ⎨ x! ⎩⎪0 khi x≠ 0,1, , 20 và ta có bảng so sánh các phân phối xác suất BB20;0.05≡ ( ) và PP1≡ ( ) như sau X 0 1 2 3 4 5 6 7 B 0.358 0.378 0.189 0.059 0.013 0.003 0.000 0.000 P 0.368 0.369 0.184 0.061 0.015 0.003 0.001 0.000 Kết quả cho thấy các sai số khá bé khi ta xấp xỉ phân phối nhị thức Bn;p() bởi phân phối Poisson Pnp(). Trong ứng dụng, khi X ∼ Bn;p( ) , trong đó n50> , p0.01< và np< 5 , thì ta có thể dùng xấp xỉ X ∼ Pnp( ) . Đặc biệt khi n≥ 100 , p0.01≤ và np< 5 thì hàm mật độ của Bn;p() và Pnp() coi như trùng nhau. Bây giờ, với X ∼ Bn;p(), ta có 2 μ=X np =μ và σX =−np() 1 p 2 nên khi n →∞ ( p0→ và np =μ) thì σX →μ và ta nhận được 3.2. Mệnh đề. Cho X ∼ P (μ) . Ta có 2 μXX=σ =μ. Ví dụ 7. Một máy dệt có 5000 ống sợi. Xác suất để trong 1 phút, một ống sợi bị đứt là 0.0002. Tìm xác suất để trong 1 phút, có không quá 2 ống sợi bị đứt. 59
Gọi X là biến số ngẫu nhiên chỉ số ống sợi bị đứt trong 1 phút. Ta có X ∼ B() 5000; 0.0002 và do đó, có thể xấp xỉ bằng phân phối Poisson P()() 5000⋅≡ 0.0002 P 1 . Khi đó, xác suất để trong 1 phút, có không quá 2 ống sợi bị đứt là P() 0≤≤ X 2 = P(0) + P(1) + P(2) 111012 =++eee−111−− 0! 1! 2! ≈ 0.920 Ví dụ 8. Tại một đại lý bưu điện, các cuộc gọi đến xuất hiện ngẫu nhiên, độc lập với nhau và có tốc độ trung bình 2 cuộc gọi trong 1 phút. Biết rằng số cuộc gọi trong một khoảng thời gian cố định có phân phối Poisson. Tìm xác suất để a) có đúng 5 cuộc gọi trong 2 phút. b) không có cuộc gọi nào trong khoảng thời gian 30 giây. c) có ít nhất một cuộc gọi trong khoảng thời gian 10 giây. Gọi X là số cuộc gọi xuất hiện trong khoảng thời gian 2 phút. Ta có 5 ∼ −4 4 X P4() và do đó P() X== 5 e5! ≈ 0.156 . Gọi Y là số cuộc gọi xuất hiện trong khoảng thời gian 30 giây. Ta có 0 ∼ −1 1 Y P1() và do đó PY()== 0 e0! ≈ 0.3679. Gọi Z là số cuộc gọi xuất hiện trong khoảng thời gian 10 giây. Ta có ∼ 1 ZP()3 và do đó 0 − 1 1 3 ()3 PZ()≥=− 1 1 PZ () ==− 0 1 e0! ≈ 0.2835. Với các nhận xét và ví dụ nêu trên, ta có thể nói rằng khi cỡ mẫu n lớn, phân phối Poisson dùng để xấp xỉ phân phối nhị thức đối với các hiện tượng hiếm, nghĩa là khi p và tích np nhỏ. Đối với các hiện tượng bình thường, nghĩa là khi p cũng như tích np không nhỏ, người ta dùng công thức Stirling để xấp xỉ các giai thừa, m!=π⋅ 2 m mmm e− eθm , 1 trong đó θ≤m 12m . Từ đó, người ta có thể xấp xỉ phân phối nhị thức cho các hiện tượng bình thường bằng phân phối chuẩn như sau 60
4. PHÂN PHỐI CHUẨN Trước hết, ta có 4.1. Định nghĩa. Biến số ngẫu nhiên X gọi là có phân phối Gauss, ký hiệu X ∼ N0;1(), nếu hàm mật độ xác suất của X là 2 1 − x f(x)= e 2 , −∞<x <∞. 2π Từ định nghĩa, ta có 4.2. Mệnh đề. Cho biến số ngẫu nhiên X ∼ N0;1( ) . Ta có i) trung bình μ=X 0 , 2 ii) phương sai σ=X 1. Chứng minh. Ta có hàm đặc trưng của X, t2 M(t)= e 2 . Do đó t2 M(t)′ = te2 , tt22 M(t)′′ =+ e22 te2 . Từ đó suy ra μ=X M(0)′ = 0 2 2 σ=X M′′ (0) −() M ′ (0) = 1 Tổng quát, ta có 4.3. Định nghĩa. Biến số ngẫu nhiên X gọi là có phân phối chuẩn, ký hiệu XN;∼ (μσ2 ) , nếu hàm mật độ xác suất của X là ()x−μ 2 − 1 2 f(x)= e 2σ , −∞<x <∞. σπ2 4.4. Mệnh đề. Cho XN;∼ (μσ2 ) . Ta có i) trung bình μ=μX , 22 ii) phương sai σ=σX . Chứng minh. Ta có hàm đặc trưng của X, 22 μ+t σ t M(t)= e 2 . 61
Do đó, 22 μ+t σ t M(t)′ =μ+σ()2 t e 2 σ22t ⎛⎞222 μ+t M(t)′′ =σ+μ+σ⎜⎟ t e 2 ⎝⎠() Suy ra μ=X M(0)′ =μ 222222 σ=X M′′ (0) −() M ′ (0) =σ+μ−μ=σ() Phân phối chuẩn và phân phối Gauss liên hệ với nhau qua kết quả sau 4.5. Mệnh đề. ∼ μσ2 = X−μ ∼ Nếu XN;( ) và Y σ , thì Y N0;1( ) . Chứng minh. Ta có hàm đặc trưng cho Y, Xt−μt − μ tY ⎛⎞⎛tXσσσ ⎞ M(t)EeY ==() Ee⎜⎟⎜ = Ee e ⎟ ⎝⎠⎝ ⎠ 2 − μt t σ t 2 ==eMX ()σ e Do đó, Y ∼ N0;1(). Ví dụ 9. Giả sử rằng chiều cao người ta có phân phối chuẩn X ∼ N( 160(cm);100(cm2 )) . Tính tỷ lệ số người có chiều cao trong khoảng từ 150cm đến 170cm. ∼ 2 = X− 160 ∼ Do X N160;10() nên Y 10 N(0, 1) . Vậy P() 150≤≤ X 170 = P( 150−− 160 ≤≤ Y 170 160 ) 10 10 =−≤≤=P() 1 Y 1 0.6826 nghĩa là có khoảng 68% số người có chiều cao trong khoảng từ 150cm đến 170cm. Phân phối nhị thức cho biến số ngẫu nhiên, X ∼ Bn;p( ) , được xấp xỉ bằng phân phối chuẩn thông qua các kết quả sau mà người ta gọi là các định lý Moivre-Laplace. 4.6. Định lý giới hạn địa phương Moivre-Laplace. Với k= 0,1, , n bất kỳ và x = knp− , npq npqP( X= k) lim2 = 1. n→∞ − x 1 e 2 2π 62
4.7. Định lý giới hạn tích phân Moivre-Laplace. Với mọi a, b ∈ , ab< , bnp− 2 1 − x lim P() a≤≤ X b = npq e2 dx . n→∞ ∫anp− 2π npq Các định lý Moivre-Laplace trên cho thấy, khi X ∼ Bn;p( ) với n đủ lớn và Y =≡Xnp− X−μX , npq σX ()k−μ 2 − X k−μ 1 2σ2 PX()== k PY =X ≈ e X . ()σX σπX 2 2 Suy ra Y ∼ N0,1() và do đó XN∼ (μXX ;σ ) . Tương tự, với a, b ∈ , ab< , b−μX x2 ab−μ −μ 1 σ − Pa()≤≤ X b = PXX ≤≤ Y ≈ X e2 dx, ()σσXX∫a−μX 2π σX 2 và do đó Y ∼ N0,1(). Từ đó suy ra XN∼ (μXX ;σ ) . Tóm lại, với X ∼ Bn;p() và n đủ lớn thì ta có thể xấp xỉ phân phối nhị thức 2 bằng phân phối chuẩn XN∼ (μσXX ; ) . Ví dụ 10. Trong 10.000 sản phẩm trên một dây chuyền sản xuất, có 2.000 sản phẩm không được kiểm tra chất lượng. Tìm xác suất để trong 400 sản phẩm sản xuất ra − có 80 sản phẩm không được kiểm tra, − có từ 70 đến 100 sản phẩm không được kiểm tra. Xét biến số ngẫu nhiên X chỉ số sản phẩm không được kiểm tra trong số 400 sản phẩm lấy ra. Ta có X ∼ H( 10.000, 2.000, 400) và vì cỡ mẫu nhỏ so với tổng thể nên ta có thể xấp xỉ bằng phân phối nhị thức, X ∼ B400;0,2(). Từ đó suy ra 80 80 320 PX(== 80 ) C400 ()() 0.2 0.8 và P() 70≤≤ X 100 = P( X = 70) + P( X = 71) ++ P( X = 100) 70 70 330 =++C400 ()() 0.2 0.8 7171 329 100 100 300 C0.20.8C0.20.8400()()+ 400 ()() Tuy nhiên, thay vì tính công thức phức tạp này, ta dùng các định lý Moivre- Laplace để xấp xỉ X bởi phân phối chuẩn N;(μ σ2 ) , với μ=np = 80 và X80− ∼ σ=npq = 8 . Từ đó, suy ra Y = 8 N0;1( ) và ta được P()( X=≡ 80 P 79.5 ≤≤ X 80.5 ) =−P() 0.0625 ≤≤ Y 0.0625 ≈ 0.0478 63
P()() 70≤≤ X 100 = P − 1.25 ≤≤ Y 2.5 ≈ 0.8882 . Chú ý. Cho biến số ngẫu nhiên X ∼ Bn;p( ) . Nếu đồ thị của hàm mật độ f của nó tương đối đối xứng qua đường thẳng xnp= thì X được xấp xỉ bởi phân phối chuẩn N;()μσ2 , với μ=np và σ2 ==npq np() 1 − p . Trong ứng dụng, xấp xỉ trên có hiệu quả khi np≥ 5 và nq≥ 5 . Khi np , ta xấp xỉ X bằng phân phối Poisson P (μ) , với μ = np khi μ = ,0, nếu hàm mật độ xác suất của X là x ⎧ α−1 − ⎪ 1 xeβ khix0> f(x) = ⎨ Γαβ()α ⎩⎪0khix0≤ Khi đó, hàm đặc trưng của X là 1 M(t) = α ()1t−β và ta được 5.2. Mệnh đề. Cho biến ngẫu nhiên X ∼ Γ (αβ; ) . Ta có i) trung bình : μ=αβX , 22 ii) phương sai : σ=αβX . 5.3. Định nghĩa. Biến số ngẫu nhiên X gọi là có phân phối χ2 , ký hiệu χ2 ()r , nếu hàm mật độ xác suất của X là 64
rx− ⎧ 1 re22 khix> 0 ⎪ r Γ r 22 f(x) = ⎨ ()2 ⎪ ⎩0khix0≤ ∼ r nghĩa là X Γ ()2 ;2 . Khi đó, ta có hàm đặc trưng của X 1 M(t) = r ()12t− 2 và ta được 5.4. Mệnh đề. Cho biến số ngẫu nhiên X ∼ χ2 ()r . Ta có i) trung bình : μ=X r , 2 ii) phương sai : σ=X 2r . Các kết quả sau cho thấy nguồn gốc của phân phối χ2 : nó xuất phát từ các biến số ngẫu nhiên có phân phối Gauss, và cũng là từ các biến số ngẫu nhiên có phân phối chuẩn. 5.5. Định lý. Nếu biến số ngẫu nhiên X có phân phối chuẩn, X ∼ N0;1(), thì biến số ngẫu nhiên Y ≡ X2 có phân phối χ2 , Y ∼ χ2 ()1 . Chứng minh. Ta có +∞ tY tX22 tx MY (t)== Ee Ee = e f(x)dx ( ) ( ) ∫−∞ 2 11+∞ − x ==tx2 e2 dx ∫ 1 2π −∞ ()12t− 2 Vậy Y ∼ χ2 ()1 . Hơn nữa, xét vectơ ngẫu nhiên V = (X, Y) , với X, Y là các biến số ngẫu nhiên độc lập. Bằng cách áp dụng định lý 4.6, chương 2, ta có sự liên quan giữa các hàm đặc trưng của X, Y và ZXY=+, MZXY (t)= M (t)M (t) . Do đó, từ luật phân phối của X và Y, ta có thể tìm được các hàm đặc trưng M(t)X , M(t)Y . Từ đó, ta suy ra hàm đặc trưng của Z≡ X+ Y và luật phân phối của Z. 65
Ví dụ 11. Xét vectơ ngẫu nhiên V = (X, Y) , với X, Y độc lập. Giả sử X ∼ Bn;p(), Y ∼ Bm;p(). Đặt ZXY= + . a) Tính PZ()= k. Suy ra luật phân phối của Z. b) Tìm lại kết quả trên bằng hàm đặc trưng. a) Ta có, với q1p=−, PZ()(== k PX += Y k ) ===+==−++==PX() 0;Y k PX( 1;Y k 1) PX( k;Y 0) 00n0k−− kmk 11n1k1k1 −−−mk1−−( ) =+Cpqnm C pq Cpq nm C p q ++ kknk0−− 0m0 + Cpqnm C pq 0k 1k1−+−+− k0 knmk k knmk =+()CCnm CC nm ++ CC nm pq = C nm+ pq Do đó X ∼ Bn( + m;p) . b. Dùng hàm đặc trưng, ta được MZXY (t)= M (t)M (t) nm =−+()()1ppe1ppett −+ nm+ =−+()1ppet Do đó X ∼ Bn( + m;p) . Tổng quát, với hai biến số ngẫu nhiên độc lập X, Y và với ZXY=+, ta có một số kết quả quan trọng sau 5.6. Định lý. (i) Nếu X ∼ P ()μ1 , Y ∼ P (μ2 ) thì ZP∼ (μ12+μ ) , (ii) Nếu X ∼ χ2 ()r , Y ∼ χ2 ()s thì Zrs∼ χ2 ()+ , 2 2 (iii) Nếu XN∼ ()μσ11 ; , YN∼ ()μ22 ;σ thì 22 ZN∼ ()μ+μσ+σ1212 ; . 6. NGUYÊN LÝ XÁC SUẤT LỚN VÀ NHỎ Trong những bài toán thực tế, ta thường gặp những biến cố có xác suất rất nhỏ (gần bằng 0) hay có xác suất rất lớn (gần bằng 1). Chẳng hạn, nếu ta thảy đồng xu n lần và xét biến số ngẫu nhiên X chỉ số lần mặt sấp nhận được, thì X ∼ Bn;0.5() và − Khi n5= , ta có PX()=≈ 3 0.312, 66
− Khi n10= , ta có PX()=≈ 3 0.117, − Khi n20= , ta có P() X=≈ 3 0.001, và ta có thể nói rằng xác suất để thảy đồng xu 20 lần mà chỉ nhận được đúng 3 lần mặt sấp là nhỏ. Tất nhiên, ta không thể kết luận rằng biến cố có xác suất nhỏ không thể xảy ra cũng như biến cố có xác suất lớn chắc chắn xảy ra. Tuy nhiên, trong thực tế, người ta quy định một mức xác suất mà qua đó, biến cố nào có xác suất nhỏ hơn mức này được coi như không xảy ra; tương tự, ta cũng có mức xác suất mà biến cố có xác suất lớn hơn mức này coi như chắc chắn xảy ra. Mức cho xác suất nhỏ thường được chọn là α = 0.1 , 0.05 hay 0.01 và mức cho xác suất lớn tương ứng là γ=10.9 −α= , 0.95 và 0.99 . Chẳng hạn, ta có thể kết luận rằng không thể thảy đồng xu 20 lần mà chỉ nhận được đúng 3 lần mặt sấp. Dĩ nhiên, có thể một lần nào đó, ta thảy đồng xu 20 lần và nhận được đúng 3 lần mặt sấp. Khi đó, ta nói ta bị sai lầm loại 1 (xem chương "Kiểm Định Giả Thuyết"). Tuy nhiên, nguy cơ sai lầm này không quá α=0.001, nghĩa là, cứ trung bình 1000 lần thảy đồng xu 20 lần thì có 1 lần nhận được đúng 3 mặt sấp. Việc quy định các mức xác suất nhỏ và lớn tùy thuộc vào từng bài toán cụ thể. Chẳng hạn, xác suất để máy bay bị rơi là 0.01 (nghĩa là cứ 100 lần bay có 1 lần rơi) thì không thể coi là nhỏ nhưng xác suất để máy bay hạ cánh trễ giờ là 0.01 có thể coi là nhỏ. Xét biến số ngẫu nhiên X. Ứng với mỗi mức xác suất nhỏ α , nếu ta có các giá trị a, b ∈ sao cho ab≤ và Pa( ≤ X≤≥−α b) 1 thì ta nói Biến cố A ≡ "X lấy giá trị trong khoảng [a, b] " chắc chắn xảy ra, và Biến cố A ≡ "X không lấy giá trị trong khoảng [a, b] " không thể xảy ra. với mức sai lầm không quá α . Lúc đó, ta nói [a, b] là một khoảng tin cậy của X với xác suất sai lầm (nguy cơ sai lầm) α , hay với độ tin cậy γ=1 −α. Cụ thể, ta có 67
6.1. Trường hợp X ∼ N0;1() Trong trường hợp này, do đồ thị của hàm mật độ đối xứng qua trục tung nên người ta thường chọn khoảng tin cậy đối xứng [−C, C] , với α PX()()≤ −= C PX ≥ C =. 2 Giá trị C ứng với mức xác suất α nêu trên thường được ký hiệu là zzγ ≡ 1−α 2 2 ( γ=1 −α) và được tìm thấy trong bảng phân phối Gauss. Các giá trị thông dụng của α và z1−α tương ứng được cho bởi bảng sau 2 α z1−α 2 0.1 1.64 0.05 1.96 0.01 2.58 6.2. Trường hợp X ∼ χ2 ()n Do đồ thị của hàm mật độ không đối xứng nên với mức xác suất α cho trước, ta chọn ab≤ sao cho α PX()()≤ a=≥= PX b . 2 Ứng với mỗi độ tự do n, các giá trị a, b này thay đổi theo α , thường được ký 2 2 hiệu là a ≡χ1− α , b ≡χα và được lập thành bảng. Ngoài ra, theo lý thuyết kiểm 2 2 định, để đơn giản, khoảng tin cậy còn được chọn dưới dạng [0, C] , với PX( ≥=α C) 2 và giá trị C ≡χα này cũng được tra trong bảng. Bài tập. 1 1. Giả sử tỷ lệ sinh trai gái là bằng nhau và bằng 2 . Một gia đình có 4 người con. Tính xác suất để 4 đứa con đó gồm a) 2 trai và 2 gái, b) 1 trai và 3 gái, c) 4 trai. 68