Tài liệu Phân tích tương quan hồi qui

pdf 93 trang vanle 1870
Bạn đang xem 20 trang mẫu của tài liệu "Tài liệu Phân tích tương quan hồi qui", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdftai_lieu_phan_tich_tuong_quan_hoi_qui.pdf

Nội dung text: Tài liệu Phân tích tương quan hồi qui

  1. Ch ươ ng 1: CÁC D NG SAI S TRONG HÓA PHÂN TÍCH 1.1. Sai s và cách bi u di n sai s Sai s (error) là s sai khác gi a các giá tr th c nghi m thu ñưc so v i giá tr mong mu n. T t c các s li u phân tích thu ñưc t th c nghi m ñ u m c sai s . Sai s phép ño d n ñ n ñ không ch c ch n ( ñ không ñ m b o ño) c a s li u phân tích. Có hai lo i sai s ñưc bi u di n ch y u trong Hóa phân tích là sai s tuy t ñ i và sai s t ươ ng ñi. 1.1.1.Sai s tuy t ñ i (E A) (Absolute error) Là s sai khác gi a giá tr ño ñưc (x i) v i giá tr th t hay giá tr qui chi u ñưc ch p nh n (kí hi u là µ). EA = x i - µ Sai s tuy t ñ i có giá tr âm ho c d ươ ng, cùng th nguyên v i ñ i l ưng ño và không cho bi t ñ chính xác c a ph ươ ng pháp. * Giá tr qui chi u ñưc ch p nh n: (accepted refrence value) : là giá tr ñưc ch p nh n làm m c ñ so sánh, nh n ñưc t : a) giá tr lý thuy t ho c giá tr ñưc thi t l p trên c ơ s các nguyên lý khoa h c; b) giá tr ñưc n ñ nh ho c ch ng nh n trên c ơ s thí nghi m c a m t s t chc qu c gia ho c qu c t ; c) giá tr tho thu n ho c ñưc ch ng nh n trên c ơ s thí nghi m ph i h p d ưi s b o tr c a m t nhóm các nhà khoa h c ho c k thu t; d) k ỳ v ng c a ñ i l ưng ( ño ñưc), ngh ĩa là trung bình c a m t t p h p nh t ñnh các phép ño khi ch ưa có a), b) và c). 1.1.2. Sai s t ươ ng ñi ( ER) (Relative error) Là t s gi a sai s tuy t ñ i và giá tr th t hay giá tr ñã bi t tr ưc, ñưc ch p nh n. x − µ E E = i hay E % = A . 100% R µ R µ * Sai s t ươ ng ñi c ũng có th bi u di n d ưi d ng ph n nghìn (parts per thousand-ppt) E A E R = µ . 1000 (ppt) • Sai s t ươ ng ñi c ũng có giá tr âm ho c d ươ ng và không có th nguyên, ñưc dùng ñ bi u di n ñ chính xác c a ph ươ ng pháp phân tích. 1
  2. Thí d 1.1 : K t qu xác ñ nh hàm l ưng aspirin trong m t m u chu n ñưc bi u di n hình 1.1. Hàm l ưng ñúng c a aspirin trong m u chu n là 200 mg. Nh ư v y, phép ño m c sai s tuy t ñ i t -4mg ñn +10mg và sai s t ươ ng ñi t -2% ñn +5% (hay 20ppt ñn 50ppt). 195 200 205 210 Sai s tuy t ñ i (E A : mg) -5 0 5 10 Sai s t ươ ng ñi (E r : % ) -2,5 0 2,5 5 Hình 1.1: Sai s tuy t ñ i và sai s t ươ ng ñi khi phân tích aspirin trong m u chu n. 1.2. Phân lo i sai s 1.2.1. Sai s h th ng hay sai s xác ñ nh ( Systematic or determinate error ): Là lo i sai s do nh ng nguyên nhân c ñ nh gây ra, làm cho k t qu phân tích cao h ơn giá tr th c (sai s h th ng d ươ ng -positive bias) ho c th p h ơn giá tr th t (sai s h th ng âm–negative bias) . Sai s h th ng g m: - Sai s h th ng không ñ i (constant determinate error) : lo i sai s này không ph thu c vào kích th ưc m u (l ưng m u nhi u hay ít). Do ñó, khi kích th ưc m u t ăng thì nh h ưng c a sai s này h u nh ư không ñáng k và ñưc lo i tr b ng thí nghi m vi m u tr ng ( blank sample) . - Sai s h th ng bi n ñ i (proportional determinate error) : lo i sai s này t l vi kích th ưc m u phân tích, kho ng cách gi a các tr ño luôn bi n ñ i theo hàm lưng (n ng ñ ), do ñó r t khó phát hi n. Sai s h th ng bi n ñ i r t khó phát hi n tr khi bi t rõ thành ph n hoá h c c a m u và có cách lo i tr ion c n. Sai s h th ng không ñ i và bi n ñ i ñưc bi u di n trên hình 1.2. 2
  3. Sai s h Sai s h th ng không th ng bi n ñi ñi Kh i lưng ch t Giá tr ñúng phân tích (mg) Kh i l ưng m u (g) Hình 1.2: Bi u di n sai s h th ng không ñi và bi n ñi Sai s h th ng ph n ánh ñ chính xác c a ph ươ ng pháp phân tích. H u h t các sai s h th ng có th nh n bi t ñưc và ñưc lo i tr b ng s hi u ch nh nh phân tích m u chu n hay lo i tr nguyên nhân gây ra sai s . Các nguyên nhân gây sai s h th ng có th g m: - Sai s do ph ươ ng pháp hay quy trình phân tích nh ư: Ph n ng hoá h c không hoàn toàn, ch th ñ i màu ch ưa ñn ñim t ươ ng ñươ ng, do ion c n tr phép xác ñnh - Sai s do d ng c nh ư: d ng c chưa ñưc chu n hoá, thi t b phân tích sai, môi tr ưng phòng thí nghi m không s ch . - Sai s do ng ưi phân tích nh ư: m t nhìn không chính xác, c u th trong th c nghi m, thi u hi u bi t, s d ng kho ng n ng ñ phân tích không phù h p, cách l y mu phi n din, dùng dung d ch chu n sai, hoá ch t không tinh khi t, do ñ nh ki n cá nhân (nh ư phân tích k t qu sau d a trên k t qu tr ưc) * Cách lo i tr sai s h th ng: - Ti n hành thí nghi m v i m u tr ng: M u tr ng là m u không có ch t phân tích nh ưng có thành ph n n n gi ng nh ư dung d ch m u phân tích. - Phân tích theo ph ươ ng pháp thêm chu n ñ lo i tr nh h ưng c a các ch t c n tr . - Phân tích m u chu n (hay m u chu n ñưc ch ng nh n- m u CRM: M u chu n là m u th c có hàm l ưng ch t c n phân tích ñã bit tr ưc, ñưc dùng ñ ñánh giá ñ chính xác c a ph ươ ng pháp. 3
  4. - Phân tích ñc l p: khi không có m u chu n thì ph i g i m u phân tích ñ n phòng thí nghi m (PTN) khác, ti n hành phân tích ñc l p ñ lo i nh ng sai s do ng ưi phân tích và thi t b phân tích, ñôi khi c ph ươ ng pháp gây nên. - Thay ñi kích th ưc m u: ñ phát hi n sai s h th ng không ñ i và bi n ñ i. 1.2.2. Sai s ng u nhiên hay sai s không xác ñ nh (random error or indeterminate) : Là nh ng sai s gây nên b i nh ng nguyên nhân không c ñnh, không bi t tr ưc. Sai s ng u nhiên th ưng gây ra do: Khách quan: nhi t ñ t ăng ñ t ng t, thay ñ i khí quy n, ñ i l ưng ño có ñ chính xác gi i h n Ch quan: thao tác thí nghi m không chu n xác (có th gây ra giá tr b t th ưng); thành ph n ch t nghiên c u không ñ ng nh t Do sai s ng u nhiên không th bi t tr ưc ñưc nên ñ lo i tr nó c n ph i làm nhi u thí nghi m và ti n hành x lý th ng kê s li u phân tích. Sai s ng u nhiên làm cho k t qu phân tích không ch c ch n, còn sai s h th ng làm cho k t qu phân tích sai. 1.2.3. Giá tr b t th ưng (outliers) : Giá tr b t th ưng là nh ng giá tr thu ñưc th ưng r t cao ho c r t th p so v i giá tr trung bình. Giá tr b t th ưng d n ñ n nh ng k t qu thu ñưc sai khác nhi u so v i tt c các s li u l p l i c a t p s li u. Giá tr b t th ưng do nh ng nguyên nhân b t th ưng x y ra trong quá trình phân tích gây nên. Do ñó, tr ưc khi x lý s li u c n ph i lo i tr giá tr b t th ưng. 1.2.4. Sai s tích lu (accumulated error): Trong m t ph ươ ng pháp phân tích, sai s c a s li u phân tích thu ñưc th ưng bao g m sai s do các giai ñon trong quá trình phân tích ñóng góp nên. ð sai s chung là nh thì khi phân tích c n ph i tìm ñiu ki n t i ưu theo ñnh lu t lan truy n sai s . Sai s tích lu hay s lan truy n sai s h th ng ñưc x lý t ươ ng t nh ư sai s h th ng. Vì sai s h th ng có d u (+) hay (-) nên s d n ñ n s tri t tiêu sai s và trong mt s tr ưng h p sai s tích lu có th b ng không. Khi ch có k t h p tuy n tính c a phép ño ng u nhiên ( k t qu cu i cùng c a phép cng và tr ) thì sai s xác ñ nh tuy t ñ i E T là t ng các sai s tuy t ñ i c a phép ño riêng r . Nu m= A+B +C thì E m = E A +E B + E C - Khi bi u di n nguyên nhân các k t qu ( k t qu cu i cùng là phép nhân ho c chia), ng ưi ta dùng sai s xác ñ nh t ươ ng ñi E TR E E E ERm RA RB RC Nu m= A.B/C thì = + + m A B C Thí d 1.2: 4
  5. a) Khi cân m u trên cân phân tích có ñ chính xác ± 0,0002 gam ñưc k t qu nh ư sau: m chén +m u= (21,1184± 0,0002) gam ; m chén = (15,8465± 0,0002) gam vy kh i l ưng m u s là mmu= (21,1184± 0,002) - (15,8465± 0,002) = (5,2719± 0,004) gam b) Kh i l ưng dung d ch ñưc tính theo công th c m=V.d= (3,43±0,01).(5,66±0,01)=? Ta có: ERV = 0,01/3,43 ; E Rd = 0,01/5,66; E Rm = (0,01/3,43)+(0,01/5,66) Do ñó m=(3,43.5,66)± [(0,01/3,43)+(0,01/5,66)]. (3,43.5,66)= 19,4138±0,0909 Nên m= (19,41± 0,09) 1.3. ð l p l i, ñ trùng, ñ h i t , ñ phân tán * ð l p l i (repeatability): Trong phân tích, khi th c hi n các phép th nghi m th c hi n trên nh ng v t li u và trong nh ng tình hu ng ñưc xem là y h t nhau th ưng không cho các k t qu gi ng nhau. ðiu này do các sai s ng u nhiên không th tránh ñưc v n có trong m i quy trình phân tích gây ra vì không th ki m soát ñưc hoàn toàn t t c các y u t nh h ưng ñn ñ u ra c a m t phép ño. Khi báo cáo các d li u ño, cn xem xét ñ n nguyên nhân và k t qu s thay ñ i này. Nhi u y u t khác nhau (không k s thay ñ i gi a các m u th ñưc xem là gi ng nhau) có th ñóng góp vào s thay ñ i các k t qu c a m t ph ươ ng pháp ño, bao g m: a) ng ưi thao tác; b) thi t b ñưc s d ng; c) vi c hi u chu n thi t b ; d) môi tr ưng (nhi t ñ , ñ m, s ô nhi m c a không khí ); e) kho ng th i gian gi a các phép ño S thay ñ i gi a các phép ño do ñưc th c hi n b i nh ng ng ưi thao tác khác nhau và/ho c v i các thi t b khác nhau s th ưng l n h ơn s thay ñ i gi a các phép ño do cùng m t ng ưi th c hi n v i các thi t b nh ư nhau trong kho ng th i gian ng n. * ð trùng (reproducibility): ñc tr ưng cho m c ñ g n nhau gi a giá tr riêng l xi c a cùng m t m u phân tích, ñưc ti n hành b ng m t ph ươ ng pháp phân tích, trong ñiu ki n thí nghi m khác nhau (khác ng ưi phân tích, trang thi t b , phòng thí nghi m, th i gian) (between laboratory precision) . Vi cùng m t ph ươ ng pháp phân tích, th ưng xét ñ n ñ l p l i h ơn là ñ trùng. * ð h i t (convergence) : ch s phân b s li u th c nghi m xung quanh gi tr trung bình. N u ñ l p l i t t thì ñ h i t t t. 5
  6. * ð phân tán (dispersion) : ch m c ñ phân tán c a k t qu thí nghi m sau nhi u ln ño l p l i. ð phân tán là ngh ch ñ o c a ñ l p l i. N u k t qu có ñ l p l i cao tc là ñ phân tán các giá tr xung quanh giá tr trung b nh th p. 1.4. ð ch m và ñ chính xác * ð ch m (precision) : dùng ñ ch m c ñ g n nhau c a các giá tr riêng l x i ca các phép ño l p l i. Nói cách khác, ñ ch m ñưc dùng ñ ch s sai khác gi a các giá tr x i so v i giá tr trung bình x . Ba khái ni m th ng kê ñưc dùng ñ mô t ñ ch m c a mt t p s li u là ñ l ch chu n, ph ươ ng sai và h s bi n thiên (s xét sau). T t c các khái ni m này có liên − quan ñn ñ l ch c a s li u phân tích kh i giá tr trung bình: d i = xi x *ð ñúng (trurness) : ch m c ñ g n nhau gi a giá tr trung bình c a dãy l n các kt qu thí nghi m và giá tr qui chi u ñưc ch p nh n. Do ñó, th ưc ño ñ ñúng th ưng ký hi u b ng ñ ch ch. * ð chính xác (accuracy) : là m c ñ g n nhau c a giá tr phân tích (th ưng là giá tr trung bình x ) v i giá tr th c hay giá tr ñã ñưc ch p nh n x t hay µ . Khi không có sai s h th ng thì giá tr trung bình ti n t i giá tr th c n u s phép ño r t l n ( N →∞). Vì v y, có th nói ñ chính xác tu ỳ thu c vào s phép ño. ð chính xác ñưc bi u di n d ưi d ng sai s tuy t ñ i ho c sai s t ươ ng ñi. Trong Hoá phân tích, ñ ñánh giá ñ chính xác ng ưi ta pha các m u t t o (synthetic sample) ñã bi t tr ưc hàm l ưng (t c là có giá tr bi t tr ưc µ) và làm thí nghi m ñ tìm ra giá tr trung bình sau ñó ki m tra xem có s sai khác có ý ngh ĩa th ng kê gi a giá tr trung bình và giá tr th c hay không. V n ñ này s ñưc xét ch ươ ng 4. ð ch m và ñ chính xác là nh ng ch tiêu quan tr ng ñ ñánh giá ch t l ưng ca s li u phân tích. Thông th ưng, c n ñánh giá ñ ch m tr ưc vì n u ph ươ ng pháp phân tích m c sai s h th ng thì ch ñưc dùng ñ ñ nh l ưng khi sai s ng u nhiên nh . 6
  7. Ch ươ ng 2 CÁC ðI L ƯNG TH NG KÊ (Descriptive statistics) 2.1. Các ñi l ưng trung bình * Trung bình s h c ( x ) ( mean, arithmetic mean, average ) là ñi l ưng dùng ñ ch giá tr ñ t ñưc khi chia t ng các k t qu thí nghi m l p l i cho s thí nghi m lp l i. Gi s có t p s li u thí nghi m l p l i x 1, x 2, , x N thì giá tr trung bình s h c ca t p s li u g m N thí nghi m l p l i là: N ∑ xi x + x + + x x = 1 2 n = i=1 (2.1) N N Giá tr trung bình có tính ch t sau: Tng ñ l ch gi a các giá tr riêng r và giá tr trung bình b ng không. − = ∑(xi x) 0 Tng các bình ph ươ ng ñ l ch nh h ơn t ng bình ph ươ ng c a b t c ñ l ch nào gi a giá tr ñơn l và giá tr a nào ñó không ph i giá tr trung bình. − 2 − 2 ≠ ∑(xi x) < ∑(xi a) ( v i a x ) * Trung bình bình ph ươ ng ( x bp ): v i t p s li u g m N s li u l p l i x 1, x2, ,x n ta có: 2 + 2 + + 2 x1 x2 xn x bp = (2.2) N * Trung bình hình h c hay trung bình nhân (geometric average) v i các phép ño có hàm l ưng c n tìm d ưi dng logarit thì: 1 lg x hh = (lg x + lg x + + lg x ) N 1 2 Nn N Do ñó x hh = x1.x2 xN ( 2.3) * Trung v (median) : N u s p x p N giá tr l p l i trong t p s li u theo th t tăng ñn ho c gi m d n t x 1, x 2, , x N thì s n m gi a t p s li u ñưc g i là trung v. - N u N l thì trung v chính là s gi a dãy s . - N u N ch n thì trung v là trung bình c ng ca 2 giá tr n m gi a dãy s . Chú ý : Giá tr trung bình hay trung v c a t p s li u ñưc g i là các giá tr trung tâm c a t p s li u. Các t p s li u khác nhau có cùng giá tr trung bình có th r t khác nhau v gía tr riêng l và s thí nghi m. Vì v y, trung bình và trung v không cho ta cái nhìn t ng quát v s phân b các s trong t p s li u. Trong tr ưng h p ñó c n xét ñn ñ phân tán ( ñ l ch kh i gía tr trung bình). * ðim t phân v (quartile) : N u s p x p các s li u trong t p s li u t nh ñn ln thì m i t p s li u có 3 ñim t phân v : 25 % các s trong t p s li u ñã s p x p 7
  8. có giá tr nh h ơn ho c b ng ñim t phân v th nh t, 75 % các s trong t p s li u ñã sp x p có giá tr nh h ơn ho c b ng ñim t phân v th ba, 50% các s trong t p s li u ñã s p x p có giá tr nh h ơn ho c b ng trung v ( ñim t phân v th hai). Kho ng gi a ñim t phân v ( interquartile ) bi u th s khác nhau gi a ñim t phân v th nh t và th ba. Có th hình dung ñim t phân v theo s ơ ñ sau: Trung v giá tr 0% 25% 50% 75% 100% giá tr cao th p ñim t phân v th nh t ñim t phân v th ba. * S trôi (mode) : là s có t n s xu t hi n là l n nh t trong t p s li u l p l i. Chú ý: Giá tr b t th ưng có nh h ưng ñáng k t i giá tr trung bình nh ưng không nh h ưng ñ n s trung v . Do v y, v i nh ng t p s li u r t nh , (th ưng N<10) nh ư ch phân tích l p 2 ho c 3 l n thì nên s d ng giá tr trung v thay cho giá tr trung bình vì s tránh ñưc giá tr b t th ưng. 2.2. Các ñi l ưng ñ c tr ưng cho ñ l p l i * Kho ng bi n thiên hay quy mô bi n thiên R ( spread, range ): là hi u s gi a giá tr l n nh t và giá tr nh nh t trong m t t p s li u. R = x max - x min (2.4) ð l n c a R ph thu c vào kích th ưc m u. V i cùng sai s ng u nhiên, khi s phép ño t ăng R s t ăng. Do ñó, kho ng bi n thiên ñưc dùng ñ ñ c tr ưng cho ñ phân tán c a t p s li u khi s phép ño nh . * Ph ươ ng sai ( variance) ( σ2 và S 2): là giá tr trung bình c a t ng bình ph ươ ng s sai khác gi a các giá tr riêng r trong t p s li u so v i giá tr trung bình. Ph ươ ng sai không cùng th nguyên v i các ñ i l ưng ño. N ( − )2 ∑ xi x Nu t p s li u l n thì σ 2 = i=1 N 2 N   N   ( − )2   x   ∑ xi x N ∑ i = 1   =   Nu t p s li u nh thì S 2 = i 1 = x2 − i 1 (2.5) − − ∑ i  N 1 N 1 i=1 N      vi N-1=f là s b c t do. Khi có m t p s li u, m i t p s li u làm k thí nghi m l p l i ñ i v i cùng m t mu nh ư: x11 , x 12 , x 13 , , x 1k x 21 , x 22 , x 23 , , x 2k xj1 , x j2 , x j3 , , x jk x m1 , x m2 , x m3 , ., x mk 8
  9. m k ( − )2 ∑∑ xij xi thì S 2 = j=1i = 1 (2.5) N − k vi N là t ng t t c các thí nghi m N=m.k (Khái ni m này ít dùng trong hoá h c) Nu ph ươ ng sai càng l n thì ñ t n m n c a các giá tr ño l p l i càng l n hay ñ l p kém. * ð l ch chu n ( Standard deviation) - M u th ng kê và m u t ng th (statistical sample and population). Trong th ng kê, m t s xác ñ nh các quan sát th c nghi m (hay k t qu phép ño các m u phân tích riêng r ) ñưc g i là m u th ng kê. G p t t c nh ng m u th ng kê ñó g i là m u t ng th . Nh ư v y có th xem phân tích m u t ng th là nh ng phép ño có th có và vô cùng l n (N →∞). Thí d : C n ñiu tra m c ñ thi u iot trong h c sinh ti u h c thành ph A. Ti n hành ly m u n ưc ti u h c sinh m t s tr ưng ti u h c trong thành ph ñ phân tích hàm l ưng iôt. Nh ư v y n ưc ti u c a m t s h c sinh ti u h c m i tr ưng ñưc l y m u là các m u th ng kê. M u t ng th ñây s là m u n ưc ti u c a h c sinh ti u h c thành ph A nói chung. - Trung bình m u x và trung bình t ng th µµµ . + Trung bình m u ( sampling fluctuation) ( x ) là giá tr trung bình c a m t m u th ng kê gi i h n ñưc rút ra t t p h p các s li u và ñưc xác ñ nh theo công th c: N ∑ xi x = i=1 . N + Trung bình t ng th (population average) ( µ) là giá tr trung bình c a t p h p các s li u, c ũng ñưc xác ñnh theo ph ươ ng trình (2.1) nh ưng v i N r t l n, g n ñ t ti ∞. Khi không có sai s h th ng thì trung bình t ng th c ũng là giá tr th t c a phép ño. N ∑ xi µ = i=1 khi N →∞. Thông th ưng khi N > 30 có th xem nh ư x ≅ µ N - ð l ch chu n t ng th ( Population standard deviation) : ( σ) ñc tr ưng cho ñ phân tán các s li u trong t p h p v i giá tr trung bình và ñưc xác ñ nh theo ph ươ ng trình: N ()− 2 ∑ xi x σ = i=1 hay σ = σ 2 (2.6) N v i N là s thí nghi m l p l i c a t p h p, th c t th ưng xem các t p s li u có N>30 là t p h p. - ð l ch chu n m u ưc ñoán (Sample estimate standard deviation): (S) 9
  10. N ()− 2 ∑ xi x S = i=1 hay S = S 2 (2.7) N −1 v i N là s thí nghi m trong m u th ng kê ñưc rút ra t t p h p. S b c t do trong tr ưng h p này là f =N-1. (B c t do có th coi là s phép ño ki m tra c n thi t ñ có th xác ñnh ñưc kt qu trong m t t p s li u. M t cách khác b c t do ñưc hi u là s các quan sát trong m t m u th ng kê có th t do thay ñ i do ñó b ng t ng kích th ưc m u tr ñi 1 bc t do cho m i trung bình. Thu t ng b c t do còn ñưc dùng ñ ch s ñ l ch − ( xi x) ) ñc l p dùng trong phép tính ñ l ch chu n) Nh ư v y, khi N →∞ thì x → µ và S → σ . Nói cách khác khi N>30 có th xem S ≅ σ . So v i ph ươ ng sai, ñ l ch chu n th ưng ñưc dùng ñ ño ñ l p l i h ơn do có cùng th nguyên v i ñ i l ưng ño. Khi tính toán chú ý không làm tròn s li u c a ñ l ch chu n cho ñ n khi k t thúc phép tính toán và ch ghi giá tr cu i cùng d ưi d ng s có ngh ĩa. Nu tr ưng h p có m m u th ng kê, m i m u làm n thí nghi m song song thì: m n ()− 2 ∑∑ xij x S = 1 1 m.n − m b c t do f=m(n-1) (gi thi t S j khác nhau không ñáng k ). ði v i t p s li u nh ( N<10) thì ñ l ch chu n th ưng ñưc tính b ng cách nhân kho ng bi n thiên v i h s k (k factor). S R =R.K R Giá tr K R tu ỳ thu c vào s thí nghi m l p l i N, ñưc tính theo b ng 2.1. Bng 2.1: Giá tr k (theo s thí nghi m) dùng ñ tính nhanh ñ l ch chu n . N 2 3 4 5 6 7 8 9 10 K 0,89 0,59 0,49 0,43 0,39 0,37 0,35 0,34 0,32 * ðô l ch chu n h p nh t (hay ñ l ch chu n g p) (Pooled standard deviaton) N1N 2N 3 ()− 2 + ()− 2 + ()− 2 ∑xi1 x1 ∑x2 j x2 ∑ x3k x3 = = = S = i 1j 1k 1 pooled + + + − N1 N 2 N3 N5 Vi N 1 là s các s li u trong t p s li u th nh t, N 2 là s các s li u trong t p s li u th hai , N * là s các t p s li u ñưc h p nh t. * ð sai chu n ( ñ l ch chu n trung bình) (standard deviation of a mean standard error) : 10
  11. Nu có nhi u dãy s li u l p l i (nhi u m u th ng kê), m i dãy có N s li u ñưc l y ng u nhiên t t p h p s li u thì s phân tán c a trung bình m u ñưc ñ c tr ưng b ng ñ sai chu n σm thay cho ñ l ch chu n trong t p h p. S phân tán này gi m khi N t ăng. σm là ñ l ch chu n trung bình hay ñ sai chu n và ñưc tính nh ư sau : σ σm= N Dùng ñ sai chu n σm ñ ñ c tr ưng cho sai s ng u nhiên cu ph ươ ng pháp phân tích. Tuy nhiên, ñi v i t p s li u h u h n (N<30) ch thu ñưc s ưc l ưng Sx thay cho σm. N 2 ()− ∑ xi x S 2 S S = = = i=1 x N N N()N −1 ð sai chu n th ưng ñưc dùng ñ ñ c tr ưng cho ñ b t n c a giá tr trung bình. Tuy nhiên, ñ ñ sai chu n ñ c tr ưng cho sai s ng u nhiên c a ph ươ ng pháp phân tích cn: + Ti n hành các phép xác ñnh song song, không ph thu c nhau (nh ư th i gian phân tích khác nhau ). + Dùng k t qu phân tích không làm tròn (v i 1 ch s cu i cùng là s không có ngh ĩa). + S ph thu c tr s giá tr ño và thành ph n m u. * ð l ch chu n t ươ ng ñi ( Relative standard devition ) (RSD) và h s bi n thiên (coefficient variation) (CV). RSD là t s gi a ñ l ch chu n và giá tr trung bình. Nó th ưng ñưc bi u th bng ph n nghìn (nhân v i 1000 ppt) hay ph n tr ăm (nhân v i 100%). S S RSD(%)= .100 % hay RSD= .1000 ppt x x RSD(%) còn ñưc g i là h s bi n thiên (CV). ði l ưng này ñưc dùng ñ ño ñ chính xác t ươ ng ñi c a phép phân tích. Ng ưi ta th ưng s d ng ñ l ch chu n t ươ ng ñi (RSD) h ơn là ñ l ch chu n (S) do có th ñánh giá ñưc ñ l ch chu n chi m bao nhiêu ph n tr ăm giá tr trung bình. *ð l ch (skewness) : là ñi l ưng dùng ñ ch tính b t ñ i x ng v t n su t c a các s li u trong t p h p. Nu giá tr này g n b ng không thì t p s li u có tính ch t ñ i x ng. N u giá tr này nh h ơn không thì phân b l ch trái âm. N u giá tr này l n h ơn không thì phân b lch ph i d ươ ng. * ð nh n (kurtosis) : giá tr này ñưc dùng ñ bi u th ñ nh n c a s phân b các s li u trong t p h p. N u giá tr ñ nh n b ng 0 thì t p s li u tuân theo phân ph i chu n. N u giá tr ñ nh n nh h ơn không thì phân ph i này nh n h ơn phân ph i chu n. 11
  12. Thí d 2.1 :Cho k t qu phân tích l p l i 35 l n hàm l ưng nitrat ( µg/ml) nh ư sau : 0.51 0.51 0.49 0.51 0.51 0.51 0.52 0.48 0.51 0.50 0.51 0.53 0.46 0.51 0.50 0.50 0.48 0.49 0.48 0.53 0.51 0.49 0.49 0.50 0.52 0.49 0.50 0.50 0.50 0.53 0.49 0.49 0.51 0.50 0.49 Sv t tính các ñi l ưng th ng kê theo công th c và so sánh v i k t qu tính theo ph n mm MINITAB d ưi ñây, gi i thích ý ngh ĩa các k t qu ñó. Phan bo cac gia tri thuc nghiem theo tan suat Descriptive Statistics for nitrate concentration Total Count : 35 Mean: 0.50413 SE Mean: 0.00260 StDev : 0.01537 Variance : 0.000236 CoefVar : 3.06 Sum of Squares: 8.80810 Minimum: 0.46 Q1: 0.49 Median : 0.50 Q3 : 0.51 0.46 0.47 0.48 0.49 0.50 0.51 0.52 0.53 Maximum : 0.53 ham luong nitrat ( micogam/ml) Range: 0.07 Skewness : -0.20 Do thi khoi cac gia tri thuc nghiem Kurtosis: 0.50 0.53 Bieu do phan bo tan xuat ham luong nitrat 0.52 10 0.51 8 0.50 6 0.49 xuat tan 4 0.48 2 ham luong nitrat ( microgam/ml) luong ham 0.47 0 0.46 0.46 0.47 0.48 0.49 0.50 0.51 0.52 0.53 ham luong nitrat ( microgam/ml) 2.3. Báo cáo k t qu phân tích 2.3.1 . S có ngh ĩa và cách l y giá tr g n ñúng M t giá tr s h c dùng bi u di n k t qu phân tích s không có ngh ĩa n u không bi t ñ chính xác c a nó. Do v y, khi bi u di n c n ph i ghi rõ ñ tin c y c a s li u và các s li u c n ñưc làm tròn ñ ch m c ñ không ch c ch n c a nó (uncertanty). Nói cách khác, s li u ch ñưc ch a các s có ý ngh ĩa. 2.3.1.1. Khái ni m s có ngh ĩa S có ngh ĩa trong m t dãy s là t t c các s ch c ch n ñúng và s không ch c ch n ñúng ñ u tiên. Thí d 2.2 : Khi ñc th tích dung d ch ñ ng trong buret 50 ml, chúng ta có th th y v ch ch t l ng v trí l n h ơn 30,2 ml và nh h ơn 30,3 ml. N u có th ưc ñoán v trí v ch ch t l ng c p ñ chia kho ng + 0,02 ml thì có th báo cáo th tích là 12
  13. 30,24 ml (4 s có ngh ĩa). Trong thí d này 3 con s ñ u tiên là s ch c ch n ñúng, s cu i cùng là s không ch c ch n ñúng. Nh ư v y có th vi t 30,24 ml ho c 0,03024 lit (4 s có ngh ĩa). S có ngh ĩa ñưc qui ưc nh ư sau : + G m các ch s t nhiên 1,2, . 9 + S “không” có th là s có ngh ĩa ho c không ph i là s có ngh ĩa tu ỳ thu c vào v trí ca nó trong dãy s . Nu s “không” n m gi a các s khác là s có ngh ĩa. Nu s “không” n m cu i dãy s thì ch là s có ngh ĩa n u ñ ng sau d u ph y. Nu s “không” n m tr ưc d u th p phân thì không ph i là s có ngh ĩa. * Làm tròn s : là lo i b các s không có ngh ĩa trong k t qu . N u b các s 6,7,8,9, thì t ăng gía tr tr ưc nó lên 1 ñơ n v . N u lo i b các s 1,2,3,4, thì không thay ñi con s ñ ng tr ưc nó. N u lo i b s 5 thì làm tròn s tr ưc ñó v s ch n g n nh t. Ví d : 2,25 làm tròn thành 2,2; 2,35 thành 2,4. Thí d 2.3 : 25,24 có 4 s có ngh ĩa 0,15 có 2 s có ngh ĩa 15,00 có 4 s có ngh ĩa 1,36 có 3 s có ngh ĩa 0,0241 có 3 s có ngh ĩa 150,00 có 5 s có ngh ĩa Khi l y V=5,00 ml có ngh ĩa là khi tính n ng ñ ph i l y 3 s có ngh ĩa. (Nh ư v y có th ghi giá tr n ng ñ là 0,0215; 2,15.10 -2 ho c 21,5.10 -3 ho c 215.10 -4M) N u ghi th tích bình là V= 2,0 lit thì khi chuy n sang ñơn v ml không th ghi là 2000 ml (vì ñây ch ghi 1 s có ngh ĩa) mà ph i ghi là 2,0.10 3ml. 2.3.1.2. Cách l y giá tr g n ñúng * ði l ưng ño tr c ti p: giá tr ño ñưc ph i ñ c ho c ño, ñm ñưc. S li u thí nghi m ñưc ghi theo nguyên t c s cu i cùng là s g n ñúng và s tr ưc s cu i cùng là s chính xác. * ði l ưng ño gián ti p. - Phép tính c ng và tr : làm tròn s thành s chính xác và ghi s có ngh ĩa theo gí tr nào có ít s có ngh ĩa nh t. - Phép nhân và chia : k t qu c a phép nhân và phép chia ñưc làm tròn s sao cho nó ch a s có ngh ĩa nh ư giá tr có ít s có ngh ĩa nh t. (Khi tính ñ b t n tuy t ñ i khôgn tính ñn d u th p phân) - Phép tính logrit và ng ưc logrit: + logrit: l y các ch s sau d u ph y b ng t ng các s có ngh ĩa trong s ban ñ u + ng ưc logarit: l y các s có ngh ĩa b ng s các ch s sau d u ph y. Thí d 2.4: a) 3,4+0,020+7,31=10,73=10,7 ñây vì 3,4 là s ch có 1 s có ngh ĩa sau d u ph y nên trong k t qu ch ghi 1 s có ngh ĩa sau d u ph y. 13
  14. 35 ,63 ,0. 5481 .0. 05300 b) .100 % = 88 ,5470578 % ,11689 Trong dãy s trên, ñ không ch c ch n c a m i s là 1/3563; 1/5481; 1/5300 và 111689/ Nh ư v y ñ không ch c ch n c a s th nh t l n h ơn so v i ñ không ch c ch n c a s th hai và th ba. Do ñó, giá tr có ít s có ngh ĩa nh t là 35,63 nên k t qu cu i cùng ph i ñưc ghi là 88,55% c) log(9,57.10 4)=4- log 9,57= 4,981 (giá tr 4 có 1 s có ngh ĩa; giá tr 9,57 có 3 s có ngh ĩa ) log(4,000.10 -5)=5- log4,000=-4,397940=-4,3479 Antilog(12,5)=3,162277.10 12 =3.10 12 2.4. Quy lu t lan truy n sai s ng u nhiên - ð l ch chu n c a ñ i l ưng ño gián ti p Tt c các k t qu phân tích ñ nh l ưng thu ñưc t th c nghi m ñ u có ch a sai s ng u nhiên. Vì v y, các giá tr ñưc báo cáo th ưng là giá tr trung bình vi t ñúng s có ngh ĩa kèm theo sai s ng u nhiên c a giá tr ñó. Thông th ưng chúng ñưc vi t là x ± S , v i S là ñ l ch chu n. Thí d : Trong t p s li u th tích dung d ch chu n dùng cho quá trình chu n ñ , các giá tr th tích thu ñưc là 10,09; 10,11; 10,09; 10,10; 10,12 ml. Nh ư v y, th tích dung d ch chu n ñã dùng s là x ± S = 10,10+0,01 (v i N=5 thí nghi m l p l i). Ngoài ra, khi s thí nghi m l p l i l n, k t qu phân tích còn ñưc trình bày t.S dưi d ng x ± và s ñưc xét ñ n trong ch ươ ng 3. N Tuy nhiên, k t qu ñ nh l ưng thu ñưc t th c nghi m trong r t nhi u phép ño không ph i là k t qu c a phép ño tr c ti p mà có th ñưc tính toán t m t hay nhi u phép ño tr c ti p. M t khác, m i s li u thu ñưc trong các phép tính ñ u có ñ l ch chu n riêng, vì v y ph i xét ñ n lan truy n sai s gây ra cho k t qu cu i cùng. Gi s các k t qu th c nghi m a, b, c, là các s li u thu ñưc t các phép ño tr c ti p M 1, M 2 , M 3 . G i x là giá tr cu i cùng tính toán ñưc t các k t qu riêng r a, b, c Khi ñó x là hàm ph thu c vào các tham s a, b, c σ σ σ Gi a , b , c là ñ l ch chu n c a các phép ño tr c ti p xác ñ nh a, b, c và gi thi t là sai s trong các phép ño này ñc l p l n nhau thì ñ l ch chu n c a ñ i lưng x là : σ  2 σ 2 σ = [ x  σ 2 +  x  σ 2 + ] 2/1 (theo ñnh lu t lan truy n sai s , bi u th c x σ  a σ  b  a   b  này ñúng khi x là hàm tuy n tính c a các phép ño a, b,c ). Cách tính ñ l ch chu n c a ñ i l ưng x này tu ỳ thu c vào d ng công th c tính ñem s d ng. * ð l ch chu n c a t ng và hi u: x = a 1. a( ± Sa) + b 1.b( ± Sb) – c 1 .c( ± Sc) v i a 1,b 1, c 1 là các h ng s thì ñ l ch chu n c a x là 14
  15. = 2 2 + 2 2 + 2 2 + S x a1 .S a b1 .Sb c1 .Sc * ð l ch chu n c a phép nhân và chia: 2 2 2 a1 b1 S  S     S  a .b x = 2 a + 2 Sb + 2 c + x = thì a1 .  b1 .  c1 .  c c1 x  a   b   c  a a1 .b b1 Khi ñó, k t qu s ñưc bi u di n d ưi d ng x = ± Sx . c c1 * ð l ch chu n c a phép tính logarit:  S a  x= k.lna thì S x= k.   a  k  S a  x= k.loga thì S x= .  2,30  a  Các giá tr ñ l ch chu n trong phép ño trên ñưc g i là sai s tuy t ñ i c a phép  S  ño. ði l ưng  a  g i là sai s t ươ ng ñi.  a  Thí d 2.5 : a) Tính giá tr bi u th c: (65,06±0,07) +(16,13±0,01)-(22,68±0,02)= 58,51±? = 2 + 2 + 2 = ± ta có S x 0,07 0,01 0,02 ,0 073 Và bi u di n x = 58,51 0,07 ± 0,07 ð lch chu n t ươ ng ñi c a phép ño là .100 % = ± 1,0 % 58 ,51 a (13,67 ± 0,02).( 120 4, ± )2,0 b) x = = = 356 0, ± ? b.c ,4 623 ± ,0 006 2 2 2 S  0,02   2,0   ,0 006  ta có x =   +   +   =0,0026 do v y x 13 ,67  120 4,   ,4 623  Sx=356,0.0,0026=0,93 kt qu cu i cùng s là x = 356,0±0,9 Thí d 2.6 : Tính ñ l ch chu n s mmol Cl - trong 250,0 ml dung d ch m u, n u l y 25,00 ml dung d ch m u này chu n ñ b ng dung d ch chu n AgNO 3 có n ng ñ ( 0,1167±0,0002) M. Th tích dung d ch AgNO 3 tiêu t n sau 3 l n ño l p l i là 36,78; 36,82 và 36,75 ml. HD gi i : - th tích dung d ch chu n AgNO 3 trung bình là: 36,78 ml áp d ng công th c tính ñ l ch chu n th tích chu n ñ ta có S= 0,035 Vy V = 36 ,78 ± 0,04 (ml) AgNO 3 - S mmol Cl ñã ñưc chu n ñ trong 250 ml m u : X= (0,1167±0,0002).((36,78±0,04).10= 42,92± ? 15
  16. 2 2 S  ,0 0002   0,04  Ta có : x =   +   .102 = ,0 019 x  ,0 1167   36 ,78  Do ñó S x= 42,92.0,019=0,082 Kt qu s mmol Cl - trong 250 ml m u là (42,92±0,08) mmol Chú ý: Trong quá trình tính toán vì có s lan truy n sai s nên c n tránh làm tròn s khi vi c tính toán ch ưa k t thúc. 16
  17. Ch ươ ng 3 HÀM PHÂN B VÀ CHU N PHÂN B 3.1. Bi u di n s li u ñ nh l ưng Trong phân tích ñnh l ưng, s li u th c nghi m là các s li u thu ñưc khi ti n hành các phép phân tích ñnh l ưng. ð h th ng hoá nh ng s li u này nh m thu ñưc cái nhìn t ng quát h ơn ho c ph c v cho nh ng nghiên c u ti p theo, ng ưi ta bi u di n chúng d ưi d ng bi u ñ ho c ñ th . Các d ng bi u ñ th ưng g p là bi u ñ c t hay bi u ñ hình ch nh t ( bar chart ), bi u ñ hình qu t ( pie chart ), bi u ñ t n su t ( historgram ) hay bi u ñ ñưng g p khúc ( pylogon ). N u c n bi u di n giá tr th c nghi m c a các t p s li u khác nhau, thì s d ng ñ l n c a các s li u. Trong tr ưng h p c n bi u di n các s li u trong cùng t p s li u thì th ưng dùng t n su t ca giá tr ñó trong t p s li u. Trong ph n trình bày d ưi ñây ch xét ñ n bi u ñ bi u di n t n s xu t hi n c a giá tr trong t p s li u d ưi hai d ng bi u ñ t n su t và bi u ñ ñưng g p khúc . Cách ti n hành: Các giá tr trong t p s li u ñưc chia thành các nhóm khác nhau (category ) và ki m tra t n su t c a giá tr ñó ñ bi u di n k t qu ño d ưi d ng ñim riêng bi t trên tr c s ( ñưc chia tuy n tính 1 chi u) và nh n ñ nh v m t ñ các ñim (tr ưng h p này g i là phân b 1 chi u) ho c bi u di n d ng b c thang (c t) b ng cách t p h p các giá tr riêng r thành k c p có b r ng d (5 < k < 20) (k ≈ c ăn b c hai tng các giá tr ño ñưc). ThÝdô3.1 :Ng−êitax¸c®Þnh®ångthêiAltrongmétmÉuthÐpë12phßngthÝnghiÖm (PTN).MçiPTNcho5gi¸trÞph©ntÝchthu®−îctrongnh÷ngngykh¸cnhau.C¸cgi¸trÞ ny®−îchÖthènghãanh−ëb ¶ng3.1: M B¶ng3.1:KÕtqu¶ph©ntÝchhml−îngAl(%) M trongmÉuthÐp M L STT PTN X1 X2 X3 X4 X5 M L 1 A 0,016 0,015 0,017 0,016 0,019 M L L I L K 2 B 0,017 0,016 0,016 0,016 0,018 H I K 3 C 0,015 0,014 0,014 0,014 0,015 H I K H I I 4 D 0,011 0,007 0,008 0,010 0,009 G H F 5 E 0,011 0,011 0,013 0,012 0,012 G H C G F C 6 F 0,012 0,014 0,013 0,013 0,015 F F B 7 G 0,011 0,009 0,012 0,010 0,012 E F B K G E E B K 8 H 0,011 0,011 0,012 0,014 0,013 G E C A B 9 I 0,012 0,014 0,015 0,013 0,014 D D E C A B D D D C A A A 10 K 0,015 0,018 0,016 0,017 0,016 11 L 0,015 0,014 0,013 0,014 0,014 Giíih¹n 8 101214161820.10 3% 12 M 0,012 0,014 0,012 0,013 0,012 trªncñacÊp cña H×nh3.1:Ph©nphèitÇnsuÊtkhix¸c®Þnh®ång thêihml−îngAltrongmÉuthÐpt¹i12 PTN. 17
  18. Nh−vËycãtÊtc¶N=60gi¸trÞ.Gi¸trÞthÊpnhÊtlcñaPTNDcã X =0,007%. D2 X Gi¸trÞcaonhÊtcñaPTNAl A5 =0,019%.SaukhitËphîpc¸csèliÖuthnhk=7 cÊpvíi®éréngcñacÊpld=0,002%Altacãk ≈ N .CÊpthønhÊtgåmc¸cgi¸trÞ 0,007v0,008%Al,cÊpthøhail0,009v0,010%Al Nh−vËytacãph©nbètÇn suÊtthùcnghiÖm®−îctr×nhbyëh×nh3.1vbiÓu®åtÇnsuÊtphÇntr¨mëh×nh3.2. 35 30 25 20 15 Tan xuat (%) 10 5 0 8 10 12 14 16 18 20 H×nh3.2.BiÓu®åphÇntr¨mtÇnsuÊthml−îngAltrongkÕtqu¶ph©ntÝchc¸cPTN T d ng phân b t n su t có th th y ñưc ñ nh tính v s xu t hi n sai s ng u nhiên. Khi sai s ng u nhiên l n thì phân b r ng, sai s ng u nhiên nh thì phân b hp và nh n, nh ưng trong tr ưng h p này không cho bi t v sai s h th ng vì sai s h th ng không làm thay ñi d ng phân b . 3.2. Phân b lý thuy t Khi h th ng hoá các giá tr ño và bi u di n chúng trên ñ th b ng cách v t n su t c a giá tr nào ñó v i m t tr c là giá tr ñó, ta luôn thu ñưc các phân b d ng c t nh ư trên, ñc bi t khi ch có sai s ng u nhiên. Do ñó, cho phép gi thi t có nh ng qui lu t toán h c làm c ơ s c a nh ng phân b ñó. 3.2.1. Phân b chu n (Phân b Gauss) Gi s ti n hành r t nhi u thí nghi m l p l i và thu ñưc r t nhi u các giá tr (N → ∞) trong ñó có m t s y u t ng u nhiên nh h ưng ñ n các giá tr này và các nguyên nhân gây nh h ưng có tính c ng tính, nh h ơn giá tr ño. Khi ñ r ng c a l p nh (d → 0) thì phân b t n su t ñưc bi u di n b ng hàm 1 x−µ 1 − ( )2 y(x) = e 2 σ mt ñ xác su t sau: σ 2π (3.1) trong ñó : π ≈ 3,1416 e ≈2,7183; σ là tham s và là ñ l ch chu n, ñ c tr ưng cho ñ phân tán c a phép ño (measure of dispersion); µ là tham s và là giá tr 18
  19. th t ho c giá tr trung bình, ñc tr ưng cho phép ño v trí phân b (measure of location) ; x là to ñ ho c giá tr trên tr c hoành; Y: tung d , chi u cao c a ñưng bi u di n tu ơng ng v i giá tr x. V trí và d ng ñưng cong ñưc xác ñ nh b i µ và σ . C c ñ i c a ñưng cong ti y' = 0, t c là ñim x= µ. Các ñim u n là x 1= µ- σ và x 2 = µ+ σ. N u cho µ. σ thì y = f(x). Khi y = 0 thì x = ± ∞. Tuy nhiên, trên th c t có th b qua các giá tr c a tr c tung khi x ngoài kho ng µ ±3 σ. mËt®éx¸csuÊt ®élÖchchuÈn Hình 3.5: Phân b chu n v i các giá tr Hình 3.6 : Bi u di n hình h c c a ñ l ch trung bình c ng khác nhau. chu n x − µ Nu ký hi u Z = thì Z là m t bi n ng u nhiên và hàm phân b có d ng σ 1 1 − .Z 2 Y(z) = e 2 σ µ σ 2π (3.2) khi ñó Z=1 và z=0 Hàm phân b Z này ñưc g i là phân b chu n hay phân b Gauss. Ph ươ ng trình (3.2) mô t m t ñ xác su t c a phân b , ñó là t ng di n tích gi a ñưng cong và tr c x là 1 ñơ n v . ðưng bi u di n còn ñưc g i là ñưng cong sai s (error curve) . N u l y tích phân c a hàm phân b chu n t -∞ ñn + ∞ thì toàn b ph n di n tích gi i h n b i ñưng cong biu di n xác su t xu t hi n các giá tr x i. Giá tr xác su t này g n li n v i ñ tin c y th ng kê P. Nói cách khác, ph n di n tích gi i h n b i ñưng cong là ñ tin c y th ng kê ñ xu t hi n x i trong kho ng tích phân. ði v i các t p s li u có cùng giá tr th c µ s có cùng di n tích ñưng cong Gauss nh ưng n u σ càng nh thì ñưng cong càng h p và càng nh n, ñ chính xác càng l n. Xác su t ñ giá tr ño n m ngoài gi i h n trên c a tích phân là α=1-P. Ph n di n tích P c ũng ñưc bi u di n theo % so v i t ng di n tích và g i là ñ tin c y th ng kê. Trong kho ng µ ± σ thì m t ñ xác su t chi m 68 % di n tích c a ñưng cong. Trong kho ng µ ±2σ thì m t ñ xác su t chi m 95 % di n tích ñưng cong. Có ngh ĩa là có 95 % giá tr trung bình m u n m trong kho ng: 19
  20. σ σ µ - 1,96( ) trung v >trung bình). Khi giá tr skewed ti n t i không thì phân b l ch tr thành phân b chu n. Nh ng d ng phân b l ch này có th ñ t ñưc g n phân b chu n n u chuy n các k t qu sang d ng logarit r i tính giá tr trung bình và ñ l ch chu n . Phân ph i này g i là phân b log-chu n (log-normal distribution). 3.2.2. Phân b Poiison: Trong m t s ph ươ ng pháp phân tích hi n ñ i, k t qu phép ño là các ñi l ưng nguyên r i r c, nh ư ñm xung vi phân trong Hoá phóng x , ñ m l ưng t trong phân tích ph R ơn ghen S li u th c nghi m trong các ph ươ ng pháp này có ñc ñim nh ư sau: - K t qu trong t p s li u là nh ng s ñ m các s ki n x y ra trong m t kho ng th i gian. - Xác su t x y ra s ki n trong m t ñơn v th i gian là nh ư nhau v i các kho ng th i gian khác nhau. - S s ki n x y ra trong kho ng th i gian này ñc l p v i kho ng th i gian khác. Nu l p l i nhi u l n cùng m t thí nghi m thì m i quan h gi a giá tr ño và t n xu t ñưc bi u di n b ng hàm phân b xác su t nh ư sau: λ x .e − λ y = . λ x! v i x= 0,1, 2, 3 và là trung bình c a s các s ki n trong kho ng th i gian xét. Phân b này ñưc g i là phân b Poisson, các ñ i l ưng ñ c tr ưng th ng kê là: - Giá tr trung bình µ = λ. 20
  21. - Ph ươ ng sai σ2 = λ Gi÷a µv σcãquanhÖ: σ= µ1/2 víi µlsèthùcv µ>0 Hình 3.6. Phân b Poisson v i các giá tr khác nhau c a trung bình c ng. Phân b Poisson là phân b r i r c. Khi µ nh thì phân b có d ng b t ñ i x ng. S b t ñ i x ng gi m nhanh khi t ăng µ và d ng ñưng phân b ti n t i phân b chu n. Th c t khi n > 15 thì có th coi nh ư x p x phân b chu n. ng v i b ng phân b chu n s có 68,3 % các giá tr trong gi i h n µ - µ1/2 và µ + µ1/2 . 3.2.3. Các phân b ñ c bi t. 3.2.3.1. Phân b Student (t) Phân b chu n xét trên ch thích h p v i tr ưng h p s phép ño l n (N →∞). Khi s phép ño nh , m t ñ phân b có th l ch kh i qui lu t c a phân b chu n, do ñó cn lo i tr ñ không tin c y b ng phân b ñ i x ng bi n d ng g i là phân b student (t). Hàm c a phân b t có d ng: + t 2 − f 1 Y t,( f ) = B 1( + ) 2 v i B là h ng s và f là b c t do. f Hàm phân b này ph thu c bi n t m t cách ng u nhiên. ð th c a hàm t có d ng c a hàm phân b chu n và có ñy ñ tính ch t nh ư hàm phân b chu n nh ưng ñ nh n c a ñ th hàm phân b t ph thu c vào b c t do (hình 3.7). 21
  22. Ph©nphèichuÈn PPchuÈn H×nh3.7:Ph©nbèStudentvíif=1;f=3,f=5,f=100vph©nphèichuÈn. ChiÒucaov®éréngcñac¸c®−êngcongcñaph©nbèt®chuÈnho¸phôthuéc vobËctùdofcña®élÖchchuÈn.BËctùdofcngnháth×®−êngcongcngtï.Khi N→∞th×S →σvph©nbètchuyÓnthnhph©nbèchuÈnZ(thùctÕchØcÇnxÐtvíi N>30).C¸cgiíih¹ntÝchph©ncñaph©nbètphôthuécvox¸csuÊtPvbËctùdof ®−îcchotrongphôlôc2.KhibiÕthaigi¸trÞfvPcãthÓtrab¶ngt®Ót×mgi¸trÞtÝch ph©ncñaph©nbèt.Hailo¹ib¶ngtragi¸trÞtt−¬ngøngvíiph©nbètmétphÝahoÆc haiphÝa(h×nh3.8). ChuÈnt (Studenttest)®−îcdïng®ÓtÝnhkho¶ngtincËycñasèliÖuthùcnghiÖm, sos¸nhgi¸trÞtrungb×nhthùcnghiÖmvgi¸trÞthËt,sos¸nh2gi¸trÞtrungb×nhhoÆc tÝnh ñkh ông ñmb o ñocña®élÖchchuÈnmÉukhisèmÉunhá. x¸csuÊtP α α/2 α/2 H×nh3.8:Ph©nbèStudent1phÝa(1sided)vhaiphÝa(2sided). 3.2.3.2.Ph©nbèFisher(F) 2 Gi¶söcã2tËpsèliÖuvíikÝchth−ícmÉuN 1vN 2,ph−¬ngsait−¬ngønglS 1 2 vS 2 víic¸cbËctùdof 1=N11vf 2=N 21vlËptûsè: 22
  23. S 2 = 1 F 2 (F>1) S 2 − f1 2 2 = x Y( x, f , f ) A + Th×hmmËt®éx¸csuÊtcãd¹ng: 1 2 f f1 f 2 1( + 1 ) 2 f 2 ≤ ≤ ∞ trong®ã,xlbiÕnngÉunhiªnvAlh»ngsèphôthuécf 1vf 2;0 x + . §−êngcongthu®−îcmang®ÆctÝnhcñamétphÝa,®−îcvÏtronggãcphÇnt−thó nhÊtgi÷ax=0vx= ∞(h×nh3.9). 1 2 3 4 H×nh3.9.Ph©nbèFvíihaibËctùdof 1vf 2. ∞ NÕulÊytÝchph©nhmph©nbètronggiíih¹n0 F p(F p< )tacã PphÇncña 2 = s1 tængdiÖntÝchd−íi®−êngcong,nãbiÓuthÞx¸csuÊt®Ógi¸trÞt×m®−îc F 2 s 2 n»mgi÷a0vF p.C¸cgiíih¹ncñaphÐptÝchph©nF( P,f 1,f 2)víi P=0,95v P=0,99 theof 1,f 2®−îcchoëphôlôc. 3.2.4.Ph©nbè χχχ2(chisquaredistribution) Cho®¹il−îngngÉunhiªnx 1,x 2 x n.NÕucãph©nbèchuÈnth×cãthÓthu®−îc ®¹il−îngngÉunhiªnvíisèbËcdof=n1 n x − x s 2 ( i ) 2 = (n − )1 = χ 2 ∑ σ σ 2 1 χ − f − 2 Hmph©nbè χ2cãd¹ng: Y (χ 2 , f ) = Ce 2 (χ 2 ) 0< χ<+ ∞ 2 23
  24. Hmph©nbèvíi χ2n»mtronggãcphÇnt−thønhÊttrongmiÒntõ χ2=0 ®Õn χ2=∞ cãd¹ngphôthuécvobËctùdof(h×nh3.10). f=2 f=10 H×nh3.10:Ph©nbè χ2víifbËctùdo. NÕufnhá,®−êngcongbÊt®èixøng,nÕuft¨ngsùbÊt®èixønggi¶mvf →∞ tacã®−êngcongGaussvíi µ>0.LÊytÝchph©nhmph©nbètronggiíih¹ntõ0®Õn χ2 χ2 ∞ χ2 P( P 15 x −µ Ph©nphèiPoisson P=µ e /x! 24
  25. 3.4.Kho¶ngtincËy,giíih¹ntincËyv®ékh«ng®¶mb¶ocña®¹il−îng®o Kho¶ngtincËy( confidenceintervalCI )cña®¹il−îng®olgi¸trÞthùcbiÓuthÞ kho¶ngtånt¹igi¸trÞtrungb×nhhaycßngäilkho¶ngbÊtæncñasèliÖuthùcnghiÖm trungb×nh. Giíih¹ntincËy( CL:confidencelimit )lgi¸trÞlínnhÊtvnhánhÊtcñakho¶ng tincËy. ViÖctÝnhto¸nkho¶ngtincËycñagi¸trÞtrungb×nhchØ®−îcthùchiÖnkhisaisè hÖthèngxuÊthiÖnkh«ng®¸ngkÓ. VíiméttËpsèliÖutu©ntheoph©nbèchuÈn,khibiÕt®élÖchchuÈn σ,th×sùsai kh¸cgi÷agi¸trÞthùc µvgi¸trÞtrungb×nh x kh«nglính¬nZlÇn®ésaichuÈncña tËphîp.Nãic¸chkh¸c σ µ − x 30vtu©n theoph©nbèchuÈn. §èivíic¸ctËpsèliÖunhá(tøclc¸cmÉuthèngkªcãN<30),ng−êitasödôngS (®élÖchchuÈnø¬c®o¸n)thaycho σ(®élÖchchuÈn)vgi¸trÞchuÈnstudent(t)thay chochuÈnGaussZ. S CL ( µ ) = x ± t Khi®ã,giíih¹ntincËy®−îctÝnhl: N Gi¸trÞt®−îctratrongb¶ngph©nbèthaiphÝa(phÇnphôlôc)víi®étincËythèng kª95%(hayvbËctùdof=N1. NhËnxÐt:Kho¶ngtincËytûlÖnghÞchvíi N ,dovËysèthÝnghiÖmcnglín th×kho¶ngtincËycnghÑpvgi¸trÞtrungb×nhcnggÇnvíigi¸trÞthùc. MøcýnghÜacngcaoth×kho¶ngtincËycnglínv×c¶Zvt®Òut¨ng.Víi møcx¸csuÊtl100%th×kho¶ngtincËyl ±∞. Chóý:VíitËpsèliÖurÊtnháN<10nh−chØph©ntÝchlÆpl¹i23lÇnth×giíih¹n tincËy®−îctÝnhtõkho¶ngbiÕnthiªnRnh−sau: 25
  26. = + CL x R.tR Gi¸trÞt Rtraë®étincËythèngkªP=0,95vP=0,99nh−ëb¶ng3.2. B¶ng3.2.Gi¸trÞttratheokho¶ngbiÕnthiªnRë®étincËythèngkª95%v99% N 2 3 4 5 6 7 8 9 10 ∞ tR0,95 6,4 1,3 0,72 0,51 0,40 0,33 0,29 0,26 0,23 0,00 tR0,99 31,83 3,01 1,32 0,84 0,63 0,51 0,43 0,37 0,33 0,00 3.5.Métsèbito¸nliªnquan®Õnkho¶ngtincËy 3.5.1.XölýsèliÖuthùcnghiÖmt×mkho¶ngtincËycñagi¸trÞthùc Khich−abiÕt®élÖchchuÈnShaykho¶ngbiÕnthiªnCV Gi¶söcãtËpsèliÖuthùcnghiÖm:x 1,x 2, x N.Tõdysènytat×m®−îcgi¸trÞtrung b×nh,ph−¬ngsaiS 2v®élÖchchuÈnS. Nh−vËy,víi®étincËyP=0,95,trab¶ngtacãt(P,f)vx¸c®Þnh®−îcgi¸trÞcÇnt×m S n»mtrongkho¶ng ( µ ) = x ± t N ThÝdô3.2 :KÕtqu¶ph©ntÝchhml−îngi«ttrongmétmÉun−ícbiÓnëThanhHo¸ theo ph−¬ng ph¸p®énghäcxóc t¸ctr¾c quang lÇn l−ît l: 24,75; 25,12; 24,76; 26,28;25,15 µg/l.T×mkho¶ngx¸c®Þnhcñahml−îngthùci«ttrongmÉun−ícny. (SVtùgi¶i) KhibiÕt®élÖchchuÈnShaykho¶ngbiÕnthiªnCV Gi¶söcãtËpsèliÖuthùcnghiÖm:x 1,x 2, x N. *NÕuN 30:cãthÓxemnh−tËpsèliÖucñamÉuthèngkªltËphîpvtËp sè liÖu tu©n theo ph©n phèi chuÈn. Do vËy, ë ñétincËythèngkª95%tacã Z=1,96,nªnkho¶ngtincËysÏl: S ( µ ) = x ± 1 , 96 N 26
  27. 3.5.2.X¸c®ÞnhsèthÝnghiÖmcÇntiÕnhnh®Óthu®−îc®échÝnhx¸c mongmuèn: µ = ± S Theoc«ngthøc: ( ) x t N S Gi¸trÞ µ x = ± t ®−îcgäil®ékh«ngch¾cch¾n,hayñkhông ñm N bo ñocñakÕtqu¶thùcnghiÖm.KhisèthÝnghiÖm®ñlínth×gi¸trÞnygi¶m ®−îc®ÕnbÊtkúgi¸trÞnomongmuèn®Ó x ≅µ.métmøchml−îngchÊtcÇn ph©ntÝchcôthÓ,gi¸trÞ µ x v®élÖchchuÈnS®−îcchotr−íc(theoISO),tõ S ®ãtasÏtÝnh®−îc®¹il−îng t .Trab¶ngvíit (P=0,95;n →∞)=1,96sÏt×m®−îcN N ®ÓkÕtqu¶thùcnghiÖmcã®étincËychotr−íc. 3.5.3.Chänph−¬ngph¸pph©ntÝchthÝchhîp®Ócãsaisènháh¬ngiíi h¹nchotr−íc. Mçiph−¬ngph¸p®biÕt®Òum¾csaisèt−¬ng®èichotr−íc.Bito¸n®Æt ralcÇnchänph−¬ngph¸pno®ÓsauNlÇnthÝnghiÖmth×®¹t®échÝnhx¸c CV(%)mongmuèn. S Theoc«ngthøc ε= t nÕu®biÕtεvN,sÏtÝnh®−îcSsau®ã,thay N voc«ngthøctrªnxemcãtho¶mn®iÒukiÖnCV ≤a%chotr−íchaykh«ng. TheoISO,víic¸cmÉucãnÒnphøct¹p,quanhÖgi÷aCV(%)vnång®é chÊtph©ntÝch®−îcchoëb¶ng3.3. B¶ng3.3:QuanhÖgi÷anång®échÊtph©ntÝchvCVchophÐp Hm 100 10 1 100 10 1 100 10 1 0,1 l−îng g/kg g/kg g/kg mg/kg mg/kg mg/kg µg/kg µg/kg µg/kg µg/kg CV(%) 2 3 4 5 7 11 15 21 30 43 Còng theo ISO, sai sè t−¬ng ®èi ®−îc ®¸nh gi¸ qua ®é chính xác cña ph−¬ngph¸pl: ≤1ppbsaisèt−¬ng®èichophÐptõ50%®Õn+30% >1ppb®Õn10ppb,saisèt−¬ng®èichophÐp30%®Õn+10% >10ppb,saisèt−¬ng®èichophÐp20%®Õn+10%. 27
  28. Ch ươ ng 4: CÁC PH ƯƠ NG PHÁP KI M TRA TH NG KÊ 4.1. Nguyên t c phép ki m tra th ng kê (significant tests) Mc ñích c a các phép ki m tra th ng kê là làm cho k t qu phân tích ñưc di n gi i m t cách khách quan nh m gi i ñáp câu h i có s khác nhau gi a các kt qu thu ñưc hay không. Nói cách khác, c n ki m tra xem gi thi t th ng kê các k t qu ño cùng t p h p là ñúng hay sai? Trong th c t phân tích , nhà hoá h c th ưng ñ t ra gi thi t và phân tích th ng kê s li u ñ ñưa ra xác su t v gi thi t ñó. Nói cách khác ta gi thi t là ñúng (gi thi t ño- null hypothesis ) và tính ra xác su t là gi thi t ñó ñúng. Cách ti n hành: T k t qu c n ki m tra c a m u, tính giá tr c a m t ñ i l ưng cn ki m tra λ, xác ñnh mi n Λ trong ñó t n t i λ v i xác su t P ñ nh tr ưc. N u λ nm ngoài mi n Λ thì gi thi t ñã ch n (hai ñi l ưng gi ng nhau) b bác b và s khác nhau gi a các ñ i l ưng thu ñưc g i là s khác nhau có ngh ĩa. Khi k t lu n ng ưi ta tuân theo 3 qui t c sau: - Gi thi t c n ki m tra b bác b n u sai l m lo i m t (b cái ñúng) xu t hi n ít hơn 100 α (1% t ng tr ưng h p) (P ≥ 0,99 hay tr s P t c là P value 0,05) thì k t lu n s khác nhau không có ngh ĩa, tc là ñưc xem nh ư gi ng nhau m c tin c y 5%. - N u sai l m lo i m t n m trong kho ng 5% và 1% (0,95 < P < 0,99 hay 0,01<P value <0,05) thì xem là ñang nghi v n. Khi ñó ph i làm thêm phép ño. Tuy nhiên trong th c t phân tích, ch c n xét k t lu n th ng kê ñ tin c y 95%. 4.2. Xác ñnh giá tr b t th ưng Có 3 cách ñ lo i b giá tr b t th ưng: Cách 1: Quan sát m t cách khách quan ñ tìm nguyên nhân gây giá tr b t th ưng và lo i giá tr b t th ưng. Cách 2: Gi l i k t qu th c nghi m khi ñã t i thi u hoá nh h ưng c a các y u t khách quan và ch quan b ng cách dùng giá tr trung v . Cách 3: S d ng chu n th ng kê ñ lo i b s li u b t th ưng. Trong 3 cách trên, cách 1 và 2 th ưng ñưc dùng n u không có ñ nh ki n cá nhân. Thí d khi quan sát các s li u th c nghi m n u th y xu t hi n d u hi u b t th ưng thì lo i ngay (nh ư màu s c c a dung d ch phân tích khác màu th ưng ño ). Tuy nhiên, trong ña s tr ưng h p chúng ta không phát hin ra ñiu b t th ưng và v n ti n hành ño,và vn thu ñưc k t qu . Do ñó, cách khác quan là x lý th ng kê theo ba tiêu chu n th ng kê sau ñây. * Tiêu chu n 1 : chu n Dixon ( Q-test) 28
  29. Nguyên t c: S p x p các s li u thu ñưc theo chi u t ăng ho c gi m d n và dùng Q-test ñánh giá k t qu nghi ng khác xa bao nhiêu so v i s còn l i trong t p s li u. Tính giá tr Q theo bi u th c (1) và so sánh v i giá tr Q chu n trong b ng 4.1: x − − x − Q = nghi ngo lan can tÝnh − xmax xmin Sos¸nhQ tÝnhvQ chuÈn(P=0,90;N) .Gi¸trÞnghingêsÏchÝnhlgi¸trÞbÊtth−êng nÕuQ tÝnh >Q chuÈn (P,N). B¶ng4.1:Gi¸trÞchuÈnQdïng®Ólo¹ibági¸trÞbÊtth−êng. N MøctincËy 90% 95% 99% 3 0,89 0,94 0,99 4 0,68 0,77 0,89 5 0,56 0,64 0,76 6 0,48 0,56 0,70 7 0,43 0,51 0,64 8 0,47 9 0,44 10 0,41 Chóý:NÕusèphÐp®olín(N>10)th×c¸chph¸thiÖntheochuÈnQkh«ng®ñ nh¹y,dotrongphÐpkiÓmtranychØcãgi¸trÞnghingêvhaigi¸trÞkh¸ccñaphÐp®o ®−îcsödông.Khi®ã,®ÓkiÓmtrasùtånt¹icñagi¸trÞbÊtth−êng,ng−êitadïngtiªu chuÈn2. ThÝdô4.1:KÕtqu¶x¸c®Þnhhml−îngCaCO 3(%)trongmétmÉu®olomitthu ®−îcnh−sau:54,31;54,36;54,40;54,44;54,59%. HykiÓmtraxemgi¸trÞnghingê54,99cãph¶il gi¸trÞbÊtth−êng kh«ng? Gi¶i:SègÇnnhÊtcña54,99l54,44. 54 ,99 − 54 ,44 Tacã:Q= = 8,0 54 ,99 − 54 ,31 Víi5lVãi5lÇnthÝnghiÖmvP=0,90trab¶ngchuÈnQta®−îcQ chuÈn =0,56.vËyQ thùcnghiÖm >Q chuÈn haygÝatrÞ54,59l gi¸trÞbÊtth−êng. *TiªuchuÈn2:(¸pdôngchotËpsèliÖucãN>10) Dùatrªnkho¶nggiíih¹ntincËy: x ±2 σchøa95%sèliÖu®o®−îcvíi x lgi¸ trÞtrungb×nhcñatËpsèliÖu(®lo¹ibásèliÖunghingê)v σl®élÖchchuÈntËphîp. Nh÷nggi¸trÞnongoikho¶ngtrªnsÏ®−îclo¹ibá. *TiªuchuÈn3 :Gi¶sötËpsèliÖuthùcnghiÖm®−îcs¾pxÕptheothøtùt¨ngdÇn xL,x 2, ,x H.TÝnhgi¸trÞtrungb×nh x v®élÖchchuÈnSvkiÓmtrac¸cgi¸trÞnghi ngêtheoc¸chsau: x − x Tr−íctiªntÝnh T = H ®èivíigi¸trÞcaonghingê. S 29
  30. x − x V T = L víic¸cgi¸trÞthÊpnghingê. S Sau®ãsos¸nhgi¸trÞTtÝnhd−îcvíigi¸trÞT chuÈn (sèphÐp®o:N)trongb¶ng4.2 ëmøcýnghÜa5%v1%: NÕu T tÝnh >T chuÈn th× x L v x Hlsaisèth«cÇnlo¹ibáëmøcýnghÜathèngkª ®cho. B¶ng4.2:Gi¸trÞTchuÈnë5%v1%cñasèkh«ngphïhîpvíigi¸trÞbÊtth−êngtrongmÉu chuÈn. SèphÐp®o(N) Gi¸trÞchuÈnSèphÐp®o(N) Gi¸trÞchuÈn 5% 1% 5% 1% 3 1,15 1,15 15 2,41 2,71 4 1,46 1,49 16 2,44 2,75 5 1,67 1,75 18 2,50 2,82 6 1,82 1,94 20 2,56 2,88 7 1,94 2,10 30 2,74 3,10 8 2,03 2,22 40 2,87 3,24 9 2,11 2,32 50 2,96 3,34 10 2,18 2,41 60 3,03 3,41 12 2,29 2,55 100 3,21 3,60 14 2,37 2,66 120 3,27 3,66 Ngoira,c¸cgi¸trÞbÊtth−êngcãthÓ®−îcnhËnbiÕtb»ngc¸chdïng®åthÞ boxplottrongphÇnmÒmthèngkªMINITAB. 4.3. S d ng chu n th ng kê trong các phép so sánh 4.3.1.Sos¸nhtrongméttËpsèliÖu (1 sample) 4.3.1.1.KiÓmtrasùtu©ntheoph©nbèchuÈn TrongrÊtnhiÒuphÐptÝnhthèngkª,tËpsèliÖucÇnph¶itho¶mn®iÒukiÖntu©n theoph©nphèichuÈn,tøclph¶itho¶mnc¸c®iÒukiÖncñaph©nphèichuÈn®Ætra. ViÖcsödôngc¸cph nmÒmthèngkªchophÐp®¬ngi¶nh¬nthñtôctÝnhto¸nb»ng c¸chxÐtgÝatrÞ®élÖch(skewness)trongthèngkªm«t¶hoÆcdïngc¸cchuÈnthèngkª nh−KolmononovSmirnov. 30
  31. ThÝdô4.2 .KÕtqu¶ph©ntÝchhml−îngNi(mg/kg)trongmÉu®Êtnh−sau:22 15182521122320204222312213833122312163036151728 262616232615171714141812353015131414141374359 2537 7108132141119512191115215319112633271312 2026161522610.HykiÓmtraxemc¸csèliÖutrongtËps«liÖutrªncãtu©n theoph©nphèichuÈnkh«ng. Gi¶i :SödôngphÇnmÒmMinitab14®ÓtÝnhc¸c®¹il−îngthèngkªtrongthèng kªm«t¶.KkÕtqu¶thu®−îcnh−sau: VariableMeanStDevCoefVarMinimumMedianMaximumSkewnessKurtosis Ni18.999.9152.172.0016.0059.001.222.51 BiÓu®åtÇnsuÊtxuÊthiÖnc¸cgi¸trÞtrongtËpsèliÖucãd¹ng: Histogram (with Normal Curve) of Ni 25 Mean 18.99 StDev 9.907 N 80 20 15 Frequency 10 5 0 0 12 24 36 48 60 Ni Gi¸trÞskewnesskh¸nhá,®−êngbiªudiÔntÇnsuÊtgÇnvíiph©nphèichuÈn. NÕusödôngthuËtto¸nkiÓmtraph©nphèichuÈn(Normality test) víi chuÈn KolmogorovSmirnovtacãc¸cgi¸trÞ:KS=0,119,Pvalue 0hay µ < 0ëmøctincËyth ngkªchotr−íc. QuyÕt®ÞnhmøcýnghÜa α,thay®æib¸cbánÕunã®óng. 31
  32. QuyÕt®ÞnhdùatrªnmøctincËythèngkªsödôngtrongtr−ênghîpph©n (x − µ ) phèichuÈn: z = 0 N σ T×mph©nphèimÉucñagi¸trÞthèngkªnÕukh¼ng®Þnhnã®óng. (x − µ ) 뮩yph¶igi¶®Þnhr»ng z = 0 N cãph©nphèichuÈnvíigi¸trÞtrung σ b×nhb»ng"kh«ng"vph−¬ngsaib»ng"mét". TÝnhgi¸trÞZvsos¸nhvíigݸtrÞZ chuÈn trongb¶ng4.3. B¶ng4.3:Gi¸trÞZëc¸cmøctincËythèngkªkh¸cnhau. MøctincËy(%) 50 68 90 95 99 99,9 Z(2sided 0,67 1,000 1,645 1,960 2,576 3,29 Z(1sided) 0,0 0,407 1,282 1,645 2,326 3,08 NÕuZ 1,96th×lo¹ibági¶thiÕt®¶o(víi α=0,05).NÕuchän α= 0,01th×xÐtkho¶ng2,58®Õn+2,58. Ph−¬ngph¸pnychظpdôngchotËpsèliÖutu©ntheoph©nphèichuÈn.NÕuZ 20hoÆckhibiÕt®élÖchchuÈntËphîpth× µ − x ≤ N t.S VíitËpsèliÖucãN<20th× µ − x ≤ N t.S Nh− vËy nÕu µ − x ≤ ± th× xem nh− µ ≅ x ( chÊp nhËn gi¶ thiÕt ®¶o víi N P=0,95%) 32
  33. µ µ − Métc¸chkh¸c,®Ósos¸nh v x ng−êitatÝnhgi¸trÞt thùcnghiÖm = x. N /S sau®ãsos¸nhvíigi¸trÞt chuÈn (P,f)(trachuÈnStudent2®u«i. NÕut thùcnghiÑm >t chuÈn hoÆcP value ≤P αth×gi¶thiÕt®¶obÞb¸cbátøclkh«ngcãsù kh¸cnhaucãýnghÜathèngkªgi÷agi¸trÞtrungb×nhvgi¸trÞthùc. Ph−¬ngph¸pnycòng®−îcdïng®Ó®¸nhgi¸saisèhÖthèngcñaph−¬ngph¸p ph©ntÝchb»ngc¸chtiÕnhnhph©ntÝchlÆpl¹iNthÝnghiÖmtõmÉuchuÈn(®cãgi¸ trÞthùchoÆcgi¸trÞ®−îcchÊpnhËn µ)v®¸nhgi¸sùsaikh¸cgi÷agi¸trÞ x víigi¸trÞ thùc µ. x − µ TÝnhgi¸trÞttheobiÓuthøc t = N vsos¸nhvíit(P,f)víif=N1 S µ NÕut tÝnh t b¶ng th×ph−¬ngph¸pph©ntÝchm¾csaisèhÖthèng. C¸chsos¸nhnycßn®−îc¸pdông®Ó: Sos¸nhph−¬ngph¸pnghiªncøuvíiph−¬ngph¸pchuÈnb»ngc¸chsos¸nhgi¸ trÞtrungb×nhcñatËpsèliÖutrongph−¬ngph¸pnghiªncøuvíikÕtqu¶®−îcph©ntÝch b»ngph−¬ngph¸pchuÈn. XÐt¶nhh−ëngcñanguyªntèl¹(sos¸nhkhicãnguyªntèl¹vkhikh«ngcã nguyªntèl¹) §¸nhgi¸¶nhh−ëngcñadungm«ichuÈnkhithªm1dungm«ikh¸c. ThÝdô4.3:Khinghiªncøuph−¬ngph¸ptr¾cquangx¸c®ÞnhAs(III)b»ngvíi thuècthöb¹c®ietyl®ithiocacbamatsaukhihy®ruaho¸b»ngküthuËtkhö®iÖnho¸, c¸ct¸cgi¶®ph©ntÝchAs(III)trongmÉutùt¹o(cãmÆtAs(V)sau5lÇnlÆpl¹i.KÕt qu¶thu®−îc(trungb×nh± ®élÖchchuÈn)nh−sau: MÉuAsthªmvo( µg)As(III)t×mthÊy( µg) As(III)As(V) N−ícm¸y10509,6 ±0,4 205019,7 ±0,3 N−ícbiÓnnh©nt¹o105010,2 ±0,4 205020 ±0,3 HykiÓmtraxemph−¬ngph¸pnghiªncøucãm¾csaisèhÖthènghaykh«ngv cãnªn¸pdông®Óph©ntÝchasentrongn−ícbiÓnkh«ng? Nguån:M .H. Arbab Za var , M. Hashemi :Talanta52(2000)1007–1014. 4.3.2.Sos¸nhhaitËpsèliÖu (2samples) 4.3.2.1.Sos¸nhph−¬ngsaicñahaitËpsèliÖu –(chuÈnFisher:2 σ2) ChuÈnFisher®−îcdïng®Ósos¸nh®échôm(precision) cñahaitËpsèliÖuho¨c haiph−¬ngph¸pkh¸cnhau.Gi¶söcãhaitËphîpkÕtqu¶ph©ntÝchthu®−îctõhai 33
  34. ng−êiph©ntÝch,haiPTNph©ntÝchhoÆchaiph−¬ngph¸pvíihaigi¸trÞph−¬ngsai σ 2 σ 2 σ 2 σ 2 l 1 v 2 ,bËctùdot−¬ngøngf 1vf 2.Nh−vËy,cÇngi¶i®¸pc©uhái 1 v 2 cãph¶ilph−¬ngsaicñacïngtËphîpkh«ng? σ 2 = σ 2 = σ 2 VËygi¶thiÕtthèngkªtrongtr−ênghîpnyl 1 2 . Víic¸ctËpsèliÖucñamÉuthèngkªcãsèthÝnghiÖmx¸c®Þnhvkh«nglínth× 2 2 bito¸ntrëthnhsos¸nhhaigi¸trÞ S1 v S2 . 2 S1 NÕu"gi¶thiÕt®¶o"tho¶mnth×tûsè 2 ph¶itu©ntheoph©nphèichuÈnFisher S2 víic¸cbËctùdolf 1vf 2 vgi¸trÞFd−îctÝnhtheoc«ngthøc: 2 S1 FtÝnh = 2 >1 S2 Khi®ã,sÏb¸cbági¶thiÕtkiÓmtranÕuF tÝnh >F b¶ng (P,f1,f 2)(chuÈn2®u«i:2 2 2 tailedtest)hoÆcP>P α.Nãic¸chkh¸c,haiph−¬ngsai S1 v S 2 cãsùkh¸cnhaucã nghÜa hay ®é chÝnh x¸c c¸c sè liÖu thùc nghiÖm gi÷a hai mÉu thèng kª (hoÆc hai ph−¬ngph¸p)lkh¸cnhau. NÕu®élÆpl¹ihaiph−¬ngph¸pkh¸cnhauth×cãthÓkiÓmtraxemph−¬ngph¸p AchÝnhx¸ch¬nhaykÐmchÝnhx¸ch¬nph−¬ngph¸pB(kiÓmtrachuÈn1®u«i:one tailedtest). NÕu F thùcnghiÖm > F chuÈn (P,f 1, f 2)th×cãthÓkÕtluËnph−¬ngph¸pAkÐm chÝnhx¸ch¬nph−¬ngph¸pB. ThÝdô4.5:§Ónghiªncøuph−¬ngph¸p,cÇnsos¸nh®élÆpl¹icñahaiphÐp®o khix¸c®ÞnhNatheoph−¬ngph¸pquangphæph¸tx¹ngänlöa.C¸cgÝatrÞ®élÖch chuÈnthu®−îc(tÝnhtheophÇntr¨mt−¬ng®èi)nh−sau: Ph−¬ngph¸p1:S 1=3%;f 1=12 Ph−¬ngph¸p2:S 2=2,1%;f 2=12 S 2 2 1 = 3,4 = TacãF= 2 2 4,19 S2 1,2 Trab¶ngchuÈnFtacãF(0,95;12;12)=2,79 F(0,95;12;12)=4,16 VËyF=4,19>4,16nªncãthÓkÕtluËnr»ng®élÆpl¹icñahaiphÐp®okh¸c nhaucãnghÜa,hay®élÆpl¹icñahaiph−¬ngph¸pkh«nggièngnhau. Khi®ãcÇnsos¸nh®échÝnhx¸ccñaph−¬ngph¸pnghiªncøucãlính¬ncã nghÜasovíiph−¬ngph¸ptiªuchuÈnkh«ng? 2 ThÝdô4.6 :§Ó®¸nhgi¸métph−¬ngph¸pmíi®−îc®ÒxuÊt®Óx¸c®ÞnhSO 4 trongn−ícth¶ic«ngnghiÖp,ng−êitasos¸nh®écñaph−¬ngph¸pnyvíiph−¬ng ph¸ptiªuchuÈnquathÝnghiÖmsau: Ph−¬ngph¸p Gi¸ trÞ Sè thÝ nghiÖm BËctùdo §é lÖch trungb×nh lÆpl¹i chuÈn(mg/)l Ph−¬ngph¸ptiªuchuÈn 72 8 7 3,38 34
  35. Ph−¬ngph¸p®ÒxuÊt 70 8 7 1,50 Háicãsùkh¸cnhauvÒ®é®óngcñahaiph−¬ngph¸phaykh«ng. (SVtùgi¶i) 4.3.22.Sos¸nh2gi¸trÞtrungb×nhthùcnghiÖm (ChuÈnStudent:2t). Gi¶söcãhaigi¸trÞtrungb×nh x A v xB thu®−îctõhaidyphÐp®ovíisèthÝ nghiÖmlÆpl¹iln Avn B®éclËpnhau.Gi¶thiÕt®¶ocÇnkiÓmtral x A v xB gièng nhauhaysùkh¸cnhaugi÷a x A v xB cãph¶idosaisèngÉunhiªnhaykh«ng?§iÒu®ã cãnghÜalcÇnkiÓmtraxemcãsùkh¸cnhaucãnghÜagi÷ahiÖu( x A xB )vgi¸trÞ0 haykh«ng. C¸chlm: 2 2 B−íc1 :KiÓmtraxem®élÆpl¹icñahaitËpsèliÖu(quaph−¬ngsai S A v S B ) cã®ångnhÊtkh«nghaycãkh¸cnhaucãýnghÜathèngkªhaykh«ng?(chuÈnF). 2 2 NÕu S A v S B ®ångnhÊt(kh¸cnhaukh«ngcãnghÜa)th×tÝnhS pooled theob−íc 2. NÕuhaiph−¬ngsaikh«ng®ångnhÊtth×tiÕnhnhb−íc3,södôngph−¬ngsai cñaAvB. 2 2 B−íc2 :NÕu S A v S B ®ångnhÊt TÝnh®élÖchchuÈnhîpnhÊtS pooled cñahiÖu2gi¸trÞtrungb×nh x A v xB víisèthÝ nghiÖmn A vn B t chuÈn (P,f)(trachuÈnt2phÝa)th×sùkh¸cnhaugi÷a x A v xB lcã ýnghÜathèngkª. NÕut thùcnghiÖm >t chuÈn (P,f)(trachuÈnt1phÝa)th×sùkh¸cnhaugi÷a x A > xB lcã ýnghÜathèngkª.HoÆcP value <0,05th×sùkh¸cnhaugi÷a x A v xB lcãýnghÜathèng kª. 2 2 B−íc3:NÕu S A v S B kh«ng®ångnhÊt TÝnhgi¸trÞt thùcnghiÖm theoc«ngthøcsau: 35
  36. x1 − x2 = tcalc 2 2 s1 +s2 n1 n2 Sos¸nhvíigÝatrÞt chu¶ntrab¶ngvíiP=0,95vbËctùdoftÝnhtheoc«ngthøc    2    s2 s 2   1 + 2     n1 n2   f =   − 2  2 2  2 2  s1 s2         n1   n2   +  + +  n1 1 n2 1  Trongmétsètr−ênghîp,ph−¬ngph¸ptrªnkh«ngthÝchhîp®Ósos¸nhhaigi¸trÞ trungb×nhthùcnghiÖmv×sèmÉuh¹nchÕ,mçiph−¬ngph¸psos¸nhchØph©ntÝchmét møchml−îng,lmlÆpl¹inlÇn,do®ãkh«ngthÝchhîpchotonbévïngnång®é kh¶os¸t.ViÖcsos¸nh®Ó®¸nhgi¸ph−¬ngph¸pph©ntÝchsÏ®−îctr×nhbytrongphÇn 4.4. ThÝ dô 4.6 :§Ósos¸nh2ph−¬ngph¸p x¸c ®Þnh hi®rocacbon®a vßng th¬m (ph−¬ngph¸phuúnhquangvph−¬ngph¸pUV)trong®Êt,ng−êitatiÕnhnhc¸c phÐpph©ntÝchvíi10thÝnghiÖmcñamçiph−¬ngph¸p.Gi¸trÞtrungb×nhthu®−îc cñaph−¬ngph¸phuúnhquangl28,00mg/kg,®élÖchchuÈnS=0,30mg/kg;cña ph−¬ng ph¸p UV l 26,25 mg/kg; S= 0,23 mg/kg. Hái gi¸ trÞ trung b×nh cña hai ph−¬ngph¸pcãkh¸cnhaucãnghÜahaykh«ng?. (Svtùgi¶i) 4.3.2.4.HÖsèt−¬ngquan (coefficientofcorelation: COR) C«ng thøc tÝnh hÖ sè t−¬ng quan tuyÕn tÝnh Pearson sÏ ®−îc tr×nh by trong ch−¬ng6. Trong®asètr−ênghîp,hÖsèt−¬ngquanPearson(R)gi÷atõngcÆpbiÕnth−êng ®−îcdïng.§¹il−îngny®Æctr−ngchomøc®équanhÖtuyÕntÝnhgi÷ahaibiÕn. Rn»mtrongkho¶ngtõ1®Õn+1.NÕuR>0th×haibiÕncãt−¬ngquan®ångbiÕn cßnR<oth×haibiÕncãt−¬ngquannghÞchbiÕn.Gi¸trÞRcnglínth×møc®ét−¬ng quantuyÕntÝnhcngcao. Gi¶thiÕtthèngkªcÇnkiÓmtralhaibiÕnkh«ngcãt−¬ngquan, ρ=0. NÕutÝnh®−îcgi¸trÞP value th×cãthÓsos¸nhvíiP α(th−êngl0,01hoÆc0,05). NÕuP valuie <P αth×møc®ét−¬ngquancñahaibiÕnlkh¸ckh«ngcãnghÜatøclcã®ñ b»ngchøng®ÓkÕtluËnchóngcãt−¬ngquantuyÕntÝnh. 4.3.2.5.§ångph−¬ngsai(hiÖpph−¬ngsai) (coefficientofvariance:COV) §©ylthuËtto¸ngióptÝnh®ångph−¬ngsaigi÷ac¸ctËpsèliÖu,lb−íctrung giantrongqu¸tr×nhph©ntÝch®abiÕnvsÏxÐttronggi¸otr×nhkh¸c. 36
  37. 4.4. So sánh 2 ph ươ ng pháp Gi¶söchóngtanghiªncøuph−¬ngph¸pA®Óph©ntÝchchÊtch−abiÕtno®ã. Saukhit×m®−îcc¸c®iÒukiÖntèi−uchophÐpx¸c®ÞnhcÇntiÕnhnh®¸nhgi¸ph−¬ng ph¸pph©ntÝchvíiph−¬ngph¸ptiªuchuÈn.NÕusödôngph−¬ngph¸psos¸nhhaigi¸ trÞtrungb×nhsÏkh«ngthÝchhîpv×kÕtqu¶phôthuécvo¶nhh−ëngcñal−îngchÊt nÒnkh¸cnhaucãtrongmÉuph©ntÝch.Khi®ã,cÇntiÕnhnhthÝnghiÖmtheotõngcÆp. VíimçimÉuph©ntÝchcÇnlm®ångthêihaiph−¬ngph¸p:Ph−¬ngph¸p®angnghiªn cøuvph−¬ngph¸ptiªuchuÈnvtiÕnhnhvíic¸ckÝchth−ícmÉukh¸cnhau.C¸c gi¸trÞthu®−îclÇnl−îtlx 1A ,x 1B ;x 2A ,x 2B x iA vx iB. .C¸ckÕtqu¶thu®−îccãthÓ sos¸nhtheoph−¬ngph¸ptõngcÆphoÆcph−¬ngph¸p®åthÞ. 4.4.1.Sos¸nhtõngcÆp §Ó®¸nhgi¸ph−¬ngph¸pph©ntÝch®angnghiªncøuvíiph−¬ngphÊpchuÈn,cÇn ph¶isos¸nhtõngcÆpkÕtqu¶(mçikÕtqu¶cñamçiph−¬ngph¸pëmétmøcnång®é nhÊt®Þnh)vsödôngchuÈnt®Ósos¸nhtõngcÆp (apairedttest) . Gi¶thiÕt®¶otrongtr−ênghîpnylkh«ngcãsùkh¸cnhaucãnghÜavÒkÕtqu¶ ph©ntÝchcïnghml−îngchÊtph©ntÝchtrongcïngmÉucñahaiph−¬ngph¸p.Nãi c¸chkh¸c,cÇnsos¸nhhiÖusètrungb×nhcñahaitËpsèliÖucãkh¸ckh«ngcãnghÜa haykh«ng. − x . S ∑(x A xB ) d d = i i = − Gi¸trÞt®−îctÝnhtheoc«ngthøc:t= ;Víi xd x A x B N N xd ltrungb×nhsùsaikh¸cgi÷ac¸ccÆpgi¸trÞ. VS d®élÖchchuÈn−íc®o¸ncñasùsaikh¸c. gi¸trÞt chuÈn ®−îctratrongb¶ngchuÈnvíimøcýnghÜaP=0,95v(n1)bËctùdo. NÕut tinh P α=0,05th×gi¶thiÕt"kh«ng"®−îcchÊpnhËn,cãnghÜa lhaiph−¬ng ph¸pkh«ngcãsùkh¸cnhau cã nghÜa. Ph−¬ng ph¸p ny cßn gäi l ph−¬ngph¸phiÖusè. 4.4.2.Ph−¬ngph¸p®åthÞ VÏsèliÖutrªn®åthÞhaichiÒuméttrôclph−¬ngph¸pph©ntÝch (gi¶ söl ph−¬ngph¸pM)vméttrôclph−¬ngph¸pchuÈn(gi¶söph−¬ngph¸pN) Ph−¬ng ph¸p A M ∆ M ∆ N B Ph−¬ngph¸pN ∆ σ Gi¶sötheoph−¬ngph¸pMsùsaikh¸cl M vsaisètuyÖt®èil M cßntheo ∆ σ ph−¬ngph¸pNsùsaikh¸cl N ,saisètuyÖt®èil N . 37
  38. ∆ ∆ Muènsos¸nhhaiph−¬ngph¸png−êitasos¸nhhaitûsè M v N b»ngc¸ch σ σ M N lÊytûsèhai®¹il−îngny(haychÝnhl®édèccu¶®−êngbiÓudiÔn). ∆ /σ ∆ / ∆ tg α M M = M N = ∆ σ σ σ σ σ N / N M / N M / N KÕtqu¶nycnglín(cnggÇn1)th×sùchÝnhx¸ccñaph−¬ngph¸pM®ang nghiªncøucngcao.§−êngbiÓudiÔnkhi®ãsÏtiÕntíi®−êngth¼ng.ChóngtasÏxÐt gi¸trÞnyd−íid¹nghÖsèt−¬ngquancñaph−¬ngtr×nhhåiquituyÕntÝnhbËcmét (R →1)ëch−¬ng6. ThÝdô4.8:KÕtqñaph©ntÝchHg( µg/l)trongmÉun−ícbätb»ngph−¬ngph¸pFIA (Ph−¬ngph¸pA)vph−¬ngph¸pth«ngth−êng(Ph−¬ngph¸pB)trong20mÉuthu ®−îcnh−sau: STT 1 2 3 4 5 6 7 8 9 10 PPA 47,5 29,5 74,4 5,5 30,9 9,8 25,5 2,9 8,6 23,8 PPB 51,8 27,4 71,6 6,0 29,2 8,0 23,2 3,2 8,8 23,5 STT 11 12 13 14 15 16 17 18 19 20 PPA 84,4 147,0 30,6 19,9 33,9 25,0 107,6 18,0 125,3 84,9 PPB 87,9 150,5 29,8 19,8 29,0 25,3 107,5 15,1 134,6 81,4 (Nguån: T.Gao, J. Baasner, M.gradl, A. Kistner, Analytical Chimica Acta, 320, (1996),171176.) Hydïngph−¬ngph¸psos¸nhtõngcÆpxemc¸ckÕtqu¶x¸c®Þnhcñahaiph−¬ng ph¸pcãtrïngnhaukh«ng? (Sinhviªntùgi¶i) (ChokÕtqu¶tÝnhtheophÇnmÒmMINITAB14.0nh−sau: NTrungb×nh§élÖchchuÈn§ésaichuÈn ppA2046.750042.28959.4562 ppB2046.680043.99539.8376 Kh¸cnhau:200.0700003.2358360.723555 95%CIformeandifference:(1.444418,1.584418) TTestofmeandifference=0(vsnot=0):TValue=0.10PValue=0.924 Hy®¸nhgÝakÕtqu¶trªnv®−arakÕtluËnvÒsùgiènghaykh¸cnhaugÜ−ahai ph−¬ngph¸p. 38
  39. Ch ươ ng 5: PHÂN TÍCH PH ƯƠ NG SAI Trong ch ươ ng tr ưc chúng ta ñã xét bài toán so sánh giá tr trung bình c a hai t p s li u trong t p h p b ng cách dùng chu n t. Vi c so sánh s chính xác h ơn n u càng nhi u t p s li u trong t p h p ñưc xét ñ n n u. Tuy nhiên, n u c n so sánh nhi u hơn hai giá tr trung bình thì chu n t không còn phù h p. Do v y c n xét ñ n nh hưng c a y u t trong nhóm và gi u các nhóm qua ñánh giá ph ươ ng sai. Ph ươ ng pháp này th ưng ñưc g i là phân tích ph ươ ng sai (analysis of variance- ANOVA) hơn là thu t ng phân tích trung bình ña nhóm (multi-group means analysis). Nh ư v y, có th nói, phân tích ph ươ ng sai là phân tích tác ñng c a m t hay nhi u y u t ñ n k t qu thí nghi m qua tham s ph ươ ng sai. ðó có th là nh h ưng ca m t hay nhi u y u t hay nh h ưng t ươ ng h c a nh ng y u t ñó. Ngoài vi c dùng ñ so sánh nhi u gía tr trung bình, ANOVA còn ñưc dùng ñ ñánh giá nh hưng c a nh ng ngu n sai s khác nhau ñ n dãy k t qu thí nghi m t ñó ñánh giá ñưc nh h ưng c a các ngu n sai s ñ n s phân b m u . Ngu n sai s ñưc chia thành hai d ng: - nh h ưng ng u nhiên c a y u t thêm vào. - nh h ưng c ñ nh hay ñã ñưc ki m soát c a thí nghi m. Nói cách khác, phân tích ph ươ ng sai là làm thí nghi m theo qui ho ch ñ nh tr ưc nh m kh o sát nh h ưng có ngh ĩa c a các y u t ñ n k t qu thí nghi m qua vi c ñánh giá ph ươ ng sai theo chu n Fisher. Nu ch so sánh hai giá tr trung bình thì phân tích ph ươ ng sai tr thành phép so sánh s d ng chu n t. Các bài toán v phân tích ph ươ ng sai có 3 d ng ch y u: - So sánh nhi u gía tr trung bình: th c ch t là bài toán m t y u t , k m c thí nghi m, m i m c nghiên c u l p l i n l n (one way ANOVA or one - factor ANOVA). - Bài toán hai y u t A và B, y u t A có k m c thí nghi m, y u t B có m m c thí nghi m, m i m c c a A và B làm l p l i n l n (two-way ANOVA). - Bài toán 3 yu t tr lên (Latin squares) . 5.1. So sánh m t s giá tr trung bình Gi s c n so sánh s khác nhau có ý ngh ĩa th ng kê hay không c a các giá tr trung bình m u x1 , x2 , x3 , xk , trong cùng t p h p. Các trung bình m u này thu ñưc t n thí nghi m trong m i m u th ng kê. Mu th ng kê 1: x 11 , x 12 , ., x 1n và có giá tr trung bình là x1 Mu th ng kê 2: x 21 , x 22 , ., x 2n và có gía tr trung bình là x2 Mu th ng kê th i : x i1 , x i2 , ., x ij và có gía tr trung bình là xi 39
  40. Mu th ng kê k : x k1 , x k2 , , x kn và có gía tr trung bình là xk Gi¶thiÕt®¶otrongtr−ênghîpnylc¸cmÉu®−îclÊytõcïngtËphîpcãtrung b×nhmÉul µvph−¬ngsaitËphîpl σ 2 .Nãic¸chkh¸ccÇnkiÓmtragi¶thiÕt®¶ol µ = x1 = x2 = = xk .Khic¸cmÉuthèngkªthuéccïngtËphîpth×ph−¬ng saitrong m«Ü mÉu (withinsample) ph¶ichÝnhlph−¬ngsaigi÷ac¸cmÉu (between sample) . ViÖcsos¸nhny®−îcthùchiÖnquachuÈnFb»ngc¸chtÝnhtûsèhaiph−¬ngsaigi÷a c¸cmÉuthèngkªvtrongcïngmÉuthèngkªråisos¸nhvíigi¸trÞtrongb¶ngF α (hoÆcsos¸nhgÝatrÞP value víi )®Ó®−arakÕtluËnthèngkª. *Ph−¬ngsaitrongcïngmÉuthèngkª: n n n − 2 − 2 − 2 ∑(x1j x1) ∑(xkj xk ) ∑(xij xi ) 2 j=1 j=1 j=1 S = S 2 = S 2 = 1 n −1 k n −1 i1 n −1 MçimÉucãnthÝnghiÖmlÆpl¹i,do®ãcãn1bËctùdo.TængsèmÉuthèngkªl kmÉu.VËybËctùdo®¹idiÖnchotÊtc¸cc¸cmÉulf 0=k(n1). Do vËy, ph−¬ng sai trong cïng mÉu ( withinsample estimation of variance/ withinsamplemeansquare) sÏl: k k n 2 2 − i ∑ Si ∑∑ (xij x ) = i=1j = 1 MS = i 1 = within k k(n − )1 *Ph−¬ngsaigi÷ac¸cmÉu: (betweensampleestimationofvariance) k ∑ x i = Trungb×nhtËphîp: X = i 1 k ph−¬ngsaigi÷ac¸cmÉu: k − 2 k∑ (xi X ) i=1 MS = bËctùdof =k1 between k − 1 1 NÕugi¶thiÕt®¶ol®óngth×haiph−¬ngsaiph¶ikh«ngkh¸cnhauhaynh−nhau. CßnnÕugØathiÕt®¶olsaith×ph−¬ngsaigi÷ac¸cmÉuph¶ilính¬nph−¬ngsaitrong cïngmÉuthèngkª. Nãic¸chkh¸ctatÝnhbiªñthøc: MS F = between calculate vsos¸nhvíigÝatrÞF b¶ng (P=0,95;f 1=k1;f 0=k(n1) MS wwithin Nh−vËynÕuF tÝnh >F b¶ng th×gi¶thiÕt®¶obÞlo¹ibátøclc¸cgÝatrÞtrungb×nh cñac¸cmÉuthèngkªlkh¸cnhaucãnghÜa.§iÒunycãthÓdocãmétgi¸trÞtrung b×nhkh¸cvíic¸cgi¸trÞtrungb×nhkh¸c,hoÆcc¸cgi¸trÞtrungb×nhkh¸clÉnnhau hoÆcc¸cgi¸trÞtrungb×nhph©nthnhhainhãmriªngbiÖt.Métc¸ch®¬ngi¶n®Ót×m 40
  41. ranguyªnnh©nsùkh¸cnhaugi÷ac¸cgi¸trÞtrungb×nhls¾pxÕpc¸cgÝatrÞtrung b×nhtheothøtùt¨ngdÇnvsos¸nhsùkh¸cnhaucñahaigi¸trÞtrungb×nhc¹nhnhau víi®¹il−îngbiÓuthÞsùkh¸cnhaucãnghÜatèithiÓu(A).NÕuhiÖuhaigÝatrÞtrung b×nhc¹nhnhaulính¬nAth×cãnghÜachóngg©yrasùkh¸cnhautrongtËphîp. §¹il−îngA®−îctÝnhtheoc«ngthøcsau: 2 A = S .t k ( p, f ) Víi S l ®é lÖch chuÈn −íc ®o¸n trong c¸c mÉu = S MS within tlgi¸tÞchuÈn student trab¶ngvíi®étincËythèngkªP=0,95vbËctùdof= k(n1). ThÝdônÕucã4gi¸trÞtrungb×nhcu¶4mÉuA,B,C,DlÇnl−îtl92,97,99v 102.tÝnhto¸nëtrªnchothÊychóngkh¸cnhaucãnghÜa.SèthÝnghiÖmlÆpl¹itrong mèimÉul3vS=3th×gi¸trÞA=3,26. HiÖucñahaigÝatrÞtrungb×nhgi÷ahaimÉuAvBl5>3,26.VËynguyªnnh©n c¸cgi¸trÞtrungb×nhmÉunykh¸cnhauldohaimÉuAvBkh¸cnhaucãnghÜag©y ra. Sos¸nhc¸cgÝatrÞtrungb×nhcòngcãthÓ¸pdôngchobito¸ncãhaiyÕutèv ®¸nhgÝa®−îc¶nhh−ëngt−ënghçcñahaiyÕutèny. ThÝdô5.1 :MétPTNAcÇnchÕt¹omÉuchuÈnxim¨ng®Óx¸c®Þnhhml−îngc¸c kimlo¹itheoph−¬ngph¸phuúnhquangtiaX(XRF).MÉuchuÈn®−îclÊyngÉunhiªn tõc¸cbaoxim¨ng,sau®ãnghiÒnnhávtrénthËt®Òuråigöi®iph©ntÝchëc¸cPTN. §Ó®¸nhgi¸®é®ång®ÒucñamÉung−êitachiamÉuchuÈnban®Çu(®−îcxemnh− tËphîp)thnh8mÉunhá(mÉuthèngkª).TiÕnhnhph©ntÝchhml−îngAl(tÝnhtheo phÇntr¨mAl 2O3)trongmçi,lmlÆpl¹i6lÇn.KÕtqu¶thu®−îcnh−sau: Hydïngph−¬ngph¸pANOVA®ÓkiÓmtraxemgi¸trÞtrungb×nhgi÷ac¸cmÉucã gièngnhaukh«ngvkÕtluËnthnhphÇnmÉuc㮸pøngyªucÇu®ångnhÊtkh«ng. PTN/M 1 2 3 4 5 6 laps 1 4,5 3,9 4,9 5,3 5,1 4,9 2 5,3 5,1 4,8 5,0 4,6 4,9 3 5,5 5,2 5,0 4,7 4,6 5,2 4 4,9 5,2 5,2 4,7 4,3 4,5 5 5,3 5,6 5,7 5,1 4,9 5,1 6 4,9 4,6 5,1 5,3 4,8 5,0 7 5,2 4,7 4,9 5,1 5,7 5,3 41
  42. 8 4,9 5,0 5,2 5,4 5,6 5,7 Gi¶i:NhËpsèliÖuvophÇnmÒmMINITAB14d−íid¹ngcétl%Al 2O3vyÕu tèlc¸cmÉutõ1®Õn8. VoStat>ANOVA>AnalysisofMeans,nhËpresponsel%Al 2O3.Trong DistributionofdatachänNormal,factor1lcétchøaMÉu,alphalevell0.05,v tickvoOK.KÕtqu¶thu®−îcnh−sau: One-Way ANOM for Al2O3(%) by mau Alpha = 0.05 5.50 5.393 5.25 5.025 5.00 Mean 4.75 4.657 4.50 1 2 3 4 5 6 7 8 mau Trong®åthÞtrªn,®−êngtrungt©mchÝnhltrungb×nhchung(grandmean),hai ®−êngphÝangoilgiíih¹nquyÕt®Þnh(decisionlimit). NÕu c¸c ®iÓm chØ gi¸ trÞ trungb×nhcñac¸cmÉun»mtronggiíih¹nquyÕt®Þnhth×kÕtlu©nlkh«ngcã®ñ b»ngchøng®Ónãir»ngc¸cgi¸trÞtrungb×nhmÉulkh¸cnhau.Nãic¸chkh¸cc¸c mÉuny®ÒuthuéccïngtËphîphaymÉuchuÈntho¶mntÝnh®ångnhÊt. SinhviªntùkiÓmtrab»ngc¸chtÝnhto¸ntheoc«ngthøc. 5.2. Phân tích ph ươ ng sai m t y u t (one-way ANOVA) Gi s vi c thay ñ i y u t A (có th là n ng ñ ion c n, phòng thí nghi m trong sn xu t, ñiu ki n t nhiên ) có nh h ưng ñ n k t qu th c nghi m (nh ư ñ h p th quang, chi u cao pic, ñ b n s n ph m, n ng ñ ). M c thí nghi m có th là các mc n ng ñ , các phòng s n xu t khác nhau, các công ñon khác nhau ). ð nghiên c u nh h ưng c a y u t A, ng ưi ta ti n hành k m c thí nghi m, mi m c nghiên c u l p l i n l n, k t qu thí nghi m là các giá tr y ij ( v i i=1 →k và j= 1 → n nh ư b ng 5.1. B¶ng5.1:Quiho¹chthùcnghiÖmph©ntÝchph−¬ngsai1yÕutèkmøcthÝnghiÖm, mçimøcthÝnghiÖmlÆpl¹inlÇn. Møc a1 a2 a3 ai ak 42
  43. SèlÇnTN 1 y11 y21 y31 yi1 yk1 2 y12 y22 y32 yi2 yk2 3 y13 y23 y33 yi3 yk3 j y1j y2j y3j yij ykj N y1n y2n y3n yin ykn n n Tængcét ∑ y 2 j n n n ∑ y kj j=1 j = 1 ∑ y2 j ∑ y3 j ∑ yij = = j 1 j=1 j 1 §Ósos¸nhsùsaikh¸cgi÷ac¸ckÕtqu¶khithay®æic¸cmøccñaA,ng−êitaso s¸nhph−¬ngsaidosùthay®æic¸cmøcnghiªncøug©ynªnvíiph−¬ngsaichungcña thÝnghiÖmxemchóngcãkh¸cnhau®¸ngtincËyhaykh«ng.NÕusùkh¸cnhaukh«ng ®¸ngtincËyth×cãthÓkÕtluËnyÕutèAs϶nhkh«ng®¸ngkÓ®ÕnkÕtqu¶thÝnghiÖm vng−îcl¹i. ViÖcsos¸nhph−¬ngsai®−îcthùchiÖnquachuÈnF. S 2 = A Ftinh 2 >1vsos¸nhvíiF chuÈn (P,f A, fTN ) STN 2 trong®ãS A lph−¬ngsaicñathÝnghiÖmkhithay®æic¸cmøckh¸cnhaucña yÕutèA. 2 STN :lph−¬ngsaichungcñathÝnghiÖmv×lmthÝnghiÖmbaogiêcòngm¾csai sè. fA:bËctùdocñac¸cmøcnghiªncøucñayÕutèA®lm;f=k1 fTN :bËctùdocñasènghiªncøu®tiÕnhnhtrongquiho¹chnghiªncøu:f 2= k(n1) 2≡ 2 2 ≠ 2 Gi¶thiÕtthèngkªl:H 0:S A STN vH a:S A STN V×F>1nªn: 2 2 NÕuF tinh F b¶ng th×F tÝnh ®¸ngtincËy,tøclS A vS TN kh¸cnhaucãnghÜahay yÕutèAcã¶nhh−ëng®ÕnkÕtqu¶nghiªncøu. TrongphÇnmÒmthèngkªcãthÓsödôngtrÞsèP(Pvalue )®Ósos¸nhvíiP α.nÕu Pvalue <P α=0,05th×kh¼ng®Þnhr»ngkh«ngph¶itÊtc¶c¸cgi¸trÞtrungb×nhëc¸cmøc thÝnghiÖmkh¸cnhau®Òugièngnhau.Nãic¸chkh¸clyÕutèAcã¶nhh−ëng®ÕnkÕt qu¶thÝnghiÖm 43
  44. Trongqu¸tr×nhtÝnhto¸n®Ótr¸nhnhÇmlÉn,ng−êitalËpb¶ngc¸cc«ng®o¹ntÝnh ph−¬ngsai®Ósos¸nhchobito¸nmétyÕutè,kmøcnghiªncøuvnlÇnlÆpl¹inh− sau: B¶ng5.2:B¶ngtÝnhph−¬ngsaikhinghiªncøu¶nhh−ëngcñayÕutèA. Nguån biÕn thiªn BËctùdo Tængc¸cb×nhph−¬ng Trung b×nh b×nh (Source of ph−¬ng ( Degree of ( Sum of squares) variation) freedom)f (meanofsquare) − 2 ∑(xi x) S2 A k1 SS A=SS 2SS 3 SS 2 = A S A k −1 SaisèthÝnghiÖm k(n1) SS TN =SS 1SS 3 SS S 2 = TN (residueerror) TN k(n− )1 Total kn1 SS total =SS 1SS 3 C¸ckýhiÖuëtrªn®−îctÝnhnh−sau: = Ai n∑ yij (tængc¸cgÝatrÞtrongmétcét). j=1 ∑ Ai A = (trungb×nhcét) i n n = 1 Y ∑Ai (trungb×nhchung)(overallaverage) k i=1 k k = 2 = 1 2 SS 2 ∑Ai SS 3 (∑Ai ) (SS:Sumofsquares); i=1 n i=1 (S 2:meanofsquares) k n n = 2 = SS 1 ∑∑(yij ) víi Ai ∑yij (tængc¸cgi¸trÞtrongmétcét) i=1j = 1 j=1 2 S A Ftinh = 2 S TN Sos¸nhF tinh víiF bang (P,f 1,f 2)víiP=0,95;f 1=k1;f 2=k(n1). NÕuF tinh <F bang th×kÕtluËnr»ngyÕutèAg©y¶nhh−ëngkh«ng®¸ngkÓ®ÕnkÕt qu¶thÝnghiÖmvng−îcl¹i. 44
  45. ThÝdô5.2:KÕtqu¶ph©ntÝchtænghml−îngHg( µg/g)b»ngph−¬ngph¸pHPLCtrong3 loi®éngvËtth©nmÒm(Rap.,Nev.,Sca.)ë8®iÓmvenbêbiÓnBohaiTrungQuècthu ®−îcnh−sau: §Þa®iÓm 1 2 3 4 5 6 7 8 Loi Rap. 0.042 0.063 0.059 0.038 0.053 0.199 0.060 0.038 Nev. 0.033 0.062 0.096 0.027 0.044 0.077 0.039 0.031 Sca. 0.005 0.044 0.068 0.016 0.014 0.099 0.021 0.026 Hydïngph−¬ngph¸pph©ntÝchph−¬ngsaimétyÕutè®Ó®¸nhgi¸xemloiv®Þa®iÓm cã¶nhh−ëng®ÕnsùtÝchluüHgtrong®éngvËtth©nmÒmhaykh«ng. Nguån:W.Yaweietal./EnvironmentalPollution135(2005)457467 (NÕusödôngphÇnmÒmMINITAB14th×kÕtqu¶v¾nt¾tthu®−îcnh−sau: Nguånph−¬ngsaiDFSSMSFP Loi(gi÷ac¸cloi)30.004760.001590.760.524 Saisè(trongmétloi)280.058160.00208 Tæng310.06292 S=0.04558RSq=7.57%RSq(adj)=0.00% Individual95%CIsForMeanBasedon PooledStDev LevelNMeanStDev++++ 180.069000.05348(*) 280.051130.02483(*) 380.036630.03212(*) 480.042630.06164(*) ++++ 0.0250.0500.0750.100 PooledStDev=0.04558 Fisher95%IndividualConfidenceIntervals AllPairwiseComparisonsamongLevelsofMuc Simultaneousconfidencelevel=80.51% 45
  46. Hygi¶ithÝchkÕtqu¶trªn 5.3. Phân tích ph ươ ng sai hai y u t (two-way ANOVA) Gi¶söcãhaiyÕutè¶nhh−ëng®ÕnkÕtqu¶thÝnghiÖmAvB.YÕutèAcãk møcnghiªnc−ó,yÕutèBcãmmøcnghiªncøu,mçimøcthÝnghiÖmlÆpl¹inlÇn.LËp b¶ngquiho¹chnghiªncøut¸c®éngcñahaiyÕutè®ÐnkÕtqu¶thÝnghiÖmnh−b¶ng 5.3: B¶ng 5.3. Qui ho¹ch thùc nghiÖm ph©n tÝch ph−¬ng sai 2, yÕu tè A cã k møc thÝ nghiÖm,yÕutèBcãmmøc;mçimøcthÝnghiÖmlÆpl¹inlÇn. YÕutè A a1 a2 ai ak b1 y111 ,y 112 , ,y 11n y211 ,y 212 , y 21n yi11 ,y i12 , y i1n yk11 ,y k12 , y k1n b2 y121 ,y 122 , y 12n y221 ,y 222 , y 22n yi21 ,y i22 , y i2n yk21 ,y k22 , y k2n B bj y1j1 ,y 1j2 , y 1jn y2j1 ,y 2j2 , y 2jn yÞj1 ,y ij2 , y ijn ykj1 ,y kj2 , y kjn bm y1m1 ,y 1m2 , y 1mn y2m1 ,y 2m2 , y 2mn yim1 ,y im2 , y imn ykm1 ,y km2 , y kmn Tængcét A1 A2 Ai Ak C¸cb−íctÝnhph−¬ngsaitheob¶ngtrªnlÇnl−îtnh−sau: n n = 2 Yij ∑yiju = 2 (tængc¸ckÕtqu¶nghiªncøutrong1«) Yij (∑ yiju ) u=1 u=1 m n m = = Ai ∑∑yiju ∑Yij (tængc¸ckÕtqu¶nghiªncøutrong1cét) j=1u = 1 j=1 k n n = = Bj ∑∑yiju ∑Yij (tængc¸ckÕtqu¶nghiªncøutrongméthng) i=1u = 1 i=1 k m n k m = = = Yiju ∑∑∑yiju ∑Ai ∑Bj (tængc¸ccét=tængc¸chng) i=1j = 1u = 1 i=1j = 1 46
  47. k m n k m = 2 = 1 2 = 1 2 SS 1 ∑∑∑yiju SS 2 ∑ Ai SS 3 ∑Bj i=1j = 1u = 1 m.n i=1 k.n j=1 k m n k m = 1 2 = 1 2 = 1 2 SS 4 (∑∑∑yiju ) (∑Ai) ( ∑Bj ) km n i=1j = 1u = 1 km n i=1 km n j=1 MÉukÕtqu¶tÝnhto¸nANOVA®−îctr×nhbytrongb¶ng5.4 B¶ng5.4:B¶ngph©ntÝchph−¬ngsaihaiyÕutè NguånbiÕnthiªn BËctùdo Tængc¸cb×nhph−¬ng Trung b×nh b×nh (Source of (Degrees of (Sumofsquares) ph−¬ng variation) freedom) (Meanofsquare) − 2 ∑(xi x) f S 2 A k1 SS =SS SS SS A 2 4 S 2 = A A k −1 B m1 SS B=SS 3SS 4 SS S 2 = B B m−1 AB (k1).(m1) SS AB =SS total SS ASS BSS e SS 2 = AB SAB SS AB =SS 1SS 2SS 3+SS 4 (k−1)(m− )1 SaisèthÝnghiÖm mk(n1) SS e=SS total SS ASS B 2 = SS e Se k m mk (n − )1 (Residueerror) 1 2 SS e=SS 1 ∑∑Yij n i=1j = 1 Tæng mk(n1) SS total =SS 1SS 4 Trong®ã: 2 2 SA vS B :ph−¬ngsai®Æctr−ngcho¶nhh−ëngcñayÕutèAvB®ÕnkÕtqu¶thÝ nghiÖm. 2 2 2 = SA = SB = SAB FA 2 ;FB 2 ;FAB 2 S S S e e e 2 SAB :ph−¬ngsai®Æctr−ngcho¶nhh−ëngt−¬nghçcñac¶haiyÕutèAvB®Õn kÕtqu¶thÝnghiÖm. 2 S e :ph−¬ngsai®Æctr−ngchosaisèthÝnghiÖm. BËctùdo: fA=k1:f B=m1;f AB =(k1).(m1);f e=m.k.(n1) 47
  48. Sos¸nhF A,F B,F AB víigi¸trÞF bang víiP=0,95;f 1=f AhoÆcf BhoÆcf AB vf 2=f ev kÕtluËnvÒmøc®é¶nhh−ëngcñatõngyÕutè®ÕnkÕtqu¶thÝnghiÖmnh−phÇn5.1. ThÝdô5.3 :TrongthùcnghiÖmsos¸nhkh¶n¨ngt¸chlo¹iCu 2+ trongn−íccña nhùavßngcng(%Cu 2+ )métng−êiph©ntÝchlmthÝnghiÖmph©ntÝchph−¬ngsai2 yÕutèl5ngylmthÝnghiÖmv4lo¹inhùa.MçithÝnghiÖmlmlÆpl¹ihailÇn.KÕt qu¶thu®−îcëb¶ngd−íi®©y. Hy®¸nhgi¸xemcãsùkh¸cnhaucãnghÜacñac¸clo¹inhùatheothêigianhay kh«ngcòngnh−cãsùt−¬ngt¸cc¶uhaiyÕutènghiªncøuhaykh«ng.BiÓudiÔnkÕt qu¶tÝnh®−îcvob¶ngANOVA.LÊyP=0,95. Lo¹i1 Lo¹i2 Lo¹i3 Lo¹i4 1 20,2 6,8 45,5 20,1 20,2 7,2 47,0 20,9 Ngy 2 28,1 22,6 15,5 7,5 29,6 23,5 16,0 8,6 3 8,7 38,7 6,7 52,7 9,0 38,2 7,1 53,0 4 30,4 50,6 18,9 60,4 30,9 51,1 17,6 61,2 5 50,7 18,8 30,5 67,6 50,5 18,5 30,9 67,2 Nguån: (Sinhviªntùgi¶itheoc«ngthøctÝnhto¸n®nªu). H−íngdÉn:SödôngphÇnmÒmMINITAB,sèliÖu®−îcnhËpvod¹ngsau: CétthønhÊtlkÕtqu¶%Cutõtrªnxuèngd−íitheothøtùtõngngyvtõng lo¹i Cétthøhailngyph©ntÝchtheothøtô8sèliÖul1(ngythø1)sau®ã®Õn8 sèliÖul2(ngythøhai) Cétthøballo¹inhËptheothøtù1,1;2,2;3,3;4,4; 5,5, lÇnl−îttõngy1®Õnngy5. VoStat>ANOVA>2way. Chänresponsel%Cu Rowfactorlngy Columnfactorllo¹i V®¸nhdÊuvodislaymean KÕtqu¶thu®−îcnh−sau: SourceDFSSMSFP Ngay43359.0839.7613205.200.000 48
  49. Loai31922.9640.9622446.420.000 Interaction128267.9688.9922629.740.000 Error(within)205.20.262 Total3913555.1 S=0.5119RSq=99.96%RSq(adj)=99.92% Individual95%CIsForMeanBasedon PooledStDev NgayMean++++ 123.4875*) 218.8500*) 326.7625(* 440.1375(*) 541.8375(* ++++ 24.030.036.042.0 Individual95%CIsForMeanBasedon PooledStDev LoaiMean++++ 127.83(* 227.60*) 323.57(*) 441.86(* ++++ 25.030.035.040.0 KÕtqu¶trªnchothÊytÊtc¶c¸ctrÞsèPcñangy,lo¹iv¶nhh−ëngt−¬nghç cñachóng(interaction)®Òub»ng0.000tøclnháh¬n α=0,05chøngtácã¶nhh−ëng cãnghÜa®Õnkh¶n¨nglo¹iCutrongn−íc.Sùph©nbègi¸trÞtrungb×nhcña%Cu theongyvtheolo¹inhùa®ÒuchothÊycngt¨ngthêigianth×kh¶n¨nghÊpthôCu cnglínvtètnhÊtëlo¹inhùathø5. 49
  50. 5.4.Bito¸nph©ntÝchph−¬ngsai3yÕutètrëlªnph−¬ngph¸p «vu«ngLatinh Trongtr−ênghîpcÇnnghiªncøu¶nhh−ëngcña3yÕutètrëlªn,®Óx©ydùng b¶ngquiho¹chthùcnghiÖm,ng−êitasödôngph−¬ngph¸p«vu«ngLatinh (Latin square) . Nguyªnt¾c: kh«ng®Ómét®iÒukiÖnnghiªncøux¸c®ÞnhlÆpl¹itrongméthng haymétcét.Nãic¸chkh¸ctrongb¶ngquiho¹chthùcnghiÖmkh«ngcãhai«gièng nhau. Gi¶thiÕtcã3yÕutèA,B,C,mçiyÕutècã4møcnghiªncøu.Mçi«m«t¶mét ®iÒukiÖnnghiªncøultæhîpc¸cmøcnghiªncøucña3yÕutè.ThÝdô:«sè1khilm thÝnghiÖmlÊymøca 1,b 1vc 1. Tacãb¶ngquiho¹chthùcnghiÖmnh−sau: B¶ng5.5:Quiho¹chthùcnghiÖmph©ntÝchph−¬ngsai3yÕutè,mçiyÕutè4møcthÝ nghiÖm. b1 b2 b3 b4 Tæng hng a1 c1 c2 c3 c4 A1 y1111 ;y 1112 ;y 1113 y2121 ;y 2122 ;y 2123 y3131 y 3132 ;y 3133 ; y 4141 y 4132 ;y 4143 a2 c2 c3 c4 c1 A2 y1221 ;y 1222 ;y 1223 y2231 ;y 2232 ;y 2233 y3241 ;y 3242 ;y 3243 y4211 ;y 4212 ;y 4213 a3 c3 c4 c1 c2 A3 y1331 ;y 1332 ;y 1333 y2341 ;y 2342 ;y 2343 y3311 ;y 3312 ;y 3313 y4321 ;y 4322 ;y 4323 a4 c4 c1 c2 c3 A4 y1441 ;y 1442 ;y 1443 y2411 ;y 2412 ;y 2413 y3421 ;y 3422 ;y 3423 y4431 ;y 4432 ;y 4433 * Tæng B1 B2 B3 B4 Y cét C¸chtÝnhc¸cgi¸trÞtrongb¶ngtrªnnh−sau: A1=y 111 +y 122 +y 133 +y 144 A1:tængc¸cgi¸trÞy(ylgi¸trÞtrungb×nhcña3lÇnthÝnghiÖmlÆpl¹icñacïng 1«trongcïng®iÒukiÖn),cãmøca 1(tøcltængtrungb×nhcñac¸ckÕtqu¶cñac¸c« tronghnga 1). T−¬ngtùtacãc¸cgi¸trÞkh¸c: A2,A 3,A 4ltængc¸ckÕtqu¶cãmøca 2,a 3,a 4. B1 B 4ltængc¸ckÕtqu¶cãmøcb 1,b 2,b 3,b 4. 50
  51. C1 C 4ltængc¸ckÕtqu¶cãmøcc 1,c 2,c 3,c 4. * Y =A 1+A 2+A 3+A 4 =B 1+B 2+B 3+B 4 =C 1+C 2+C 3+C 4 n n = 2 SS 1 ∑∑ yij (tængb×nhph−¬ngc¸cgÝatrÞcãmÆttrongb¶ng). j=1i = 1 1 n SS = A 2 2 ∑ i 2 n = i 1 = S A n FA 2 1 2 S e SS = B 3 ∑ j 2 n j=1 S F = B n B 2 1 2 S e SS = C 4 ∑ q 2 n q=1 S F = C n n n C 2 = 1 2 = 1 2 = 1 2 S e SS 5 2 (∑ Ai ) 2 (∑ B j ) 2 (∑Cq ) n i=1 n j=1 n qi =1 B¶ngph©ntÝchph−¬ngsaitrongtr−ênghîpnycãd¹ngsau: B¶ng5.5:B¶ngph©ntÝchph−¬ngsaibayÕutè NguånbiÕnthiªn BËctùdo Tængc¸cb×nhph−¬ng Trungb×nhb×nhph−¬ng (Sourceofvariation) (Degreesof (Sumofsquares) (Meanofsquare) freedom) f − 2 S 2 ∑(xi x) 2 SS A A n1 SS A=SS 2SS 5S = A n −1 2 SS B B n1 SS B=SS 3SS 5S = B n −1 2 SS C C n1 SS C=SS 4SS 5S = C n −1 SaisèthÝnghiÖm (n1)(n2) SS =SS SS SS SS 2 SS e total A B c S = e e − − (Residueerror) (n 1)(n )2 2 Tæng n 1 SS total =SS 1SS 5 Sos¸nhc¸cgi¸trÞtÝnhto¸nvíigi¸trÞtrab¶ngF bang (P,f 1,f 2)víiP=0,95;f 1=n1vf 2= (n1)(n2) sau ®ã kÕt luËn vÒ møc ®é ¶nh h−ëng cña tõng yÕu tè ®Õn kÕt qu¶ thÝ nghiÖmnh−phÇn5.1 Ph−¬ngph¸pny®−îcsödông®Ónghiªncøu¶nhh−ëngcñanhiÒuyÕutètrong n«ngnghiÖp,yhäcsinhhäc,xhéihäc ThÝdô5.4:§Ókh¶os¸t¶nhh−ëngcñanång®éthuècthöophenantrolin(A),pH dungdÞch(B)vnhiÖt®é(C)®Õn®éhÊpthôquangcñadungdÞchphøcmuFe(II) ophenantrolin,ng−êitatiÕnhnhthÝnghiÖmtheoph−¬ngph¸p«vu«nglatinhvíi3 yÕutè¶nhh−ëng,4møcthÝnghiÖm.KÕtqu¶trungb×nh(sau3lÇnlmlÆpl¹i)nh− 51
  52. sau: b1 b2 b3 b4 a1 c1 C2 c3 c4 0,351 0,522 0,245 0,248 a2 c2 C3 c4 c1 0,356 0,258 0,452 0,526 a3 c3 C4 c1 c2 0,211 0,356 0,456 0,521 a4 c4 C1 c2 c3 0,169 0,254 0,255 0,452 Hy®¸nhgi¸xemcã¶nhh−ëngcãnghÜacñac¸cyÕutè®Õn®éhÊpthôquang cñadungdÞchphøcmuhaykh«ng?BiÓudiÔnkÕtqu¶tÝnh®−îcvob¶ngANOVA. LÊyP=0,95. H−íngdÉn :NhËpc¸csèliÖutrongb¶ngtrªnvoch−¬ngtr×nhMINITAB14.Cét kÕtqu¶®−îcvotheothøtùtõtr¸isangph¶ivtõtrªnxuèngd−íitrongb¶ngtrªn. BacétkÌmtheolc¸cbiÕnA,B,C.Trong®ãcétA®−îcnhËpc¸csè1,23,4,thay choa 1 a4,t−¬ngtùchoc¸ccétBvC.SèliÖusaukhinhËpvoMINITABcãd¹ng: Abs A B C 0.351 1 1 1 0.522 1 2 2 0.245 1 3 3 0.248 1 4 4 0.356 2 1 2 0.258 2 2 3 0.452 2 3 4 0.526 2 4 1 0.211 3 1 3 0.350 3 2 4 0.456 3 3 1 0.521 3 4 2 52
  53. 0.169 4 1 4 0.254 4 2 1 0.255 4 3 2 0.452 4 4 3 V×c¸c sèliÖukh«ng ph¶i lmatrËnc©n b»ng do vËy kh«ng dïng balanced ANOVAmph¶idïngd¹ngGenerallinearModel VoSTAT>ANOVA>GenerallinearModel.NhËpresponselcét®éhÊpthô quang,ModellcétA,B,C,randomfactorchänA,B.Trongresultschän:Inaddition, coefficientforcovariatetermantableofunusalobservation.VbÊmvoOK.KÕtqu¶ thu®−îcnh−sau: GeneralLinearModel:DohapthuquangversusA,B,C FactorTypeLevelsValues Arandom41,2,3,4 Brandom41,2,3,4 Cfixed41,2,3,4 AnalysisofVarianceforDohapthuquang,usingAdjustedSSforTests SourceDFSeqSSAdjSSAdjMSFP A30.032450.032450.010820.740.568 B30.054630.054630.018211.240.375 C30.046710.046710.015571.060.434 Error60.088270.088270.01471 Total150.22206 S=0.121289RSq=60.25%RSq(adj)=0.63% KÕtqu¶tÝnhto¸nchothÊyc¶3yÕutèA,B,C®Òucãgi¸trÞP>0,05tøclc¶33 yÕutèkh«ng¶nhh−ëngcãnghÜa®ÕnkÕtqu¶thÝnghiÖm. (Sinhviªntùgi¶ib»ngc¸chtÝnhto¸ntheoc«ngthøc). 53