Lâm sinh - Thống kê và tin học trong lâm nghiệp

79 trang vanle 4210

Download

Bạn đang xem 20 trang mẫu của tài liệu "Lâm sinh - Thống kê và tin học trong lâm nghiệp", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

lam_sinh_thong_ke_va_tin_hoc_trong_lam_nghiep.pdf

Nội dung text: Lâm sinh - Thống kê và tin học trong lâm nghiệp

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC TÂY NGUYÊN PGS.TS. BẢO HUY THỐNG KÊ VÀ TIN HỌC TRONG LÂM NGHIỆP (Dùng cho Cao học Lâm nghiệp) Tháng 3 năm 2008
Mục lục 1 TỔNG QUÁT VỀ CHỨC NĂNG XỬ LÝ THỐNG KÊ CỦA EXCEL VÀ STATGRAPHICS PLUS 4 1.1 Tổng quát về phần xử lý thống kê trong Excel 4 1.2 Tổng quát về phần mềm xử lý thống kê Statgraphics Plus 5 2 TÍNH TOÁN CÁC ĐẶC TRƯNG THỐNG KÊ CỦA MỘT MẪU QUAN SÁT VÀ ƯỚC LƯỢNG KHOẢNG 6 3 SO SÁNH TRUNG BÌNH 02 MẪU QUAN SÁT BẰNG TIÊU CHUẨN T CỦA STUDENT 10 4 NGHIÊN CỨU MỐI QUAN HỆ SINH THÁI LOÀI TRONG RỪNG MƯA NHIỆT ĐỚI DỰA VÀO TIÊU CHUẨN χ2 (Bảo Huy, 1997) 13 5 PHÂN TÍCH PHƯƠNG SAI 19 5.1. Phân tích phương sai 1 nhân tố với các thí nghiệm ngẫu nhiên hoàn toàn 19 5.2. Phân tích phương sai 2 nhân tố 22 5.2.1. Phân tích phương sai 2 nhân tố với 1 lần lặp lại: (Bố trí thí nghiệm theo khối ngẫu nhiên đầy đủ (Randomized Complete Blocks) (RCB): 22 5.2.2. Phân tích phương sai 2 nhân tố m lần lặp 28 6. PHÂN TÍCH TƯƠNG QUAN - HỒI QUY 32 6.1. Hồi quy tuyến tính 1 lớp 32 6.2. Dạng phi tuyến đưa về tuyến tính 1 lớp 34 6.2.1. Lập mô hình hàm mũ trong Excel: 34 6.2.2. Lập mô hình hàm mũ và Schumacher trong Statgraphics Plus: 36 6.3. Hồi quy tuyến tính nhiều lớp 41 6.4. Hồi quy phi tuyến tính nhiều lớp, tổ hợp biến 44 6.4.1. Lập mô hình phi tuyến nhiều lớp chuyển về tuyến tính nhiều lớp trong Excel 44 6.4.2. Lập mô hình phi tuyến nhiều lớp chuyển về tuyến tính trong Statgraphics Plus 46 7. ƯỚC LƯỢNG CÁC DẠNG HỒI QUY MỘT BIẾN TRÊN ĐỒ THỊ 50 8. SẮP XẾP VÀ VẼ BIỂU ĐỒ PHÂN BỐ TẦN SỐ XUẤT HIỆN THEO CẤP, CỠ, HẠNG . 54 9. KIỂM TRA THUẦN NHẤT K MẪU QUAN SÁT ĐỨT QUẢNG - ỨNG DỤNG: KIỂM TRA SỰ THUẦN NHẤT CỦA CÁC DÃY PHÂN BỐ N/D, N/H Ở CÁC Ô TIÊU CHUẨN 56 10. MÔ HÌNH HOÁ QUY LUẬT PHÂN BỐ 57 10.1. Mô hình hoá phân bố giảm theo hàm Mayer 58 10.2. Mô phỏng phân bố thực nghiệm theo phân bố khoảng cách-hình học: 62 10.3. Mô phỏng phân bố thực nghiệm theo phân bố Weibull: 64 11. PHƯƠNG PHÁP NGHIÊN CỨU CẤU TRÚC MẶT BẰNG RỪNG (Bảo Huy, 1993) . 66 12. PHÂN TÍCH, PHÁT HIỆN CÁC NGUYÊN NHÂN, NHÂN TỐ ĐỊNH TÍNH, ĐỊNH LƯỢNG ẢNH HƯỞNG ĐẾN BIẾN PHỤ THUỘC (HẬU QUẢ, VẤN ĐỀ) (Bảo Huy, 2006) 68 2
LỜI NÓI ĐẦU Tài liệu này được biên soạn phục vụ cho việc giảng dạy môn học “Thống kê và Tin học trong lâm nghiệp” cho lớp Cao học Lâm nghiệp ở trường Đại học Tây Nguyên. Môn học này giúp cho người học phân tích, xử lý số liệu thống kê trên máy vi tính trong quá trình học tập, làm đề tài nghiên cứu cũng như ứng dụng vào thực tiễn. Có rất nhiều phần mềm ứng dụng để xử lý thống kê như SPSS, Statgraphics Plus, Excel Microsoft Excel được mọi người biết đến khi nói đến công cụ bảng tính, tính tóan , nhưng những chức năng chuyên sâu về ứng dụng thống kê trong sinh học, nông lâm nghiệp, quản lý tài nguyên thiên nhiên, môi trường lại ít được đề cập đến. Mục đích của môn học này là khai thác chức năng xử lý thống kê hết sức phong phú và mạnh của phần mềm Excel để ứng dụng trong phân tích các kết quả thí nghiệm, đánh giá các kết quả điều tra khảo sát trong lâm nghiệp, nghiên cứu về quản lý tài nguyên thiên nhiên. Trong đó bao gồm các xử lý thống kế phổ biến như: Phân tích các đặc trưng mẫu, so sánh các mẫu thí nghiệm, phân tích phương sai, tương quan hồi quy, dự báo do đó phần mềm Excel được chọn lựa để giới thiệu. Các phần mềm thống kê chuyên dụng và phổ biến trên thế giới là Statgrahics Plus, SPSS, . Đây là các phần mềm thống kê được ứng dụng rộng trong hầu hết các lĩnh vực nghiên cứu, phân tích dữ liệu của nhiều ngành khác nhau về xã hội, tự nhiên. Ứng dụng mạnh của các phần mềm này là phân tích các mô hình hồi quy đa biến dạng tuyến tính hay phi tuyến tính với các cách phân tích đa dạng như hồi quy lọc, hồi quy từng bước, tổ hợp biến, mã hóa tự động các biến định tính, Do đó phần mềm Statgraphics Plus cũng được giới thiệu để người học có thể tiếp cận với công cụ phân tích thống kê này. Tài liệu này sẽ không đi sâu vào lý thuyết xác suất thống kê, mà thiên về hướng ứng dụng đơn giản, dễ hiểu, kèm theo các ví dụ để người đọc có thể thực hành các chức năng xử lý, phân tích dữ liệu bằng Excel, Statgraphics Plus một cách nhanh chóng, thuận tiện trong hoạt động quản lý và nghiên cứu lâm nghiệp, quản lý tài nguyên thiên nhiên, môi trường. 3
1 TỔNG QUÁT VỀ CHỨC NĂNG XỬ LÝ THỐNG KÊ CỦA EXCEL VÀ STATGRAPHICS PLUS 1.1 Tổng quát về phần xử lý thống kê trong Excel Excel thiết kế sẵn một số chương trình để xử lý số liệu và phân tích thống kê cơ bản ứng dụng trong nhiều lĩnh vực: - Chức năng xử lý số liệu, tạo bảng tổng hợp dữ liệu: Sắp xếp, tính toán nhanh các bảng tổng hợp từ số liệu thô, - Chức năng của các hàm: Cung cấp hàng loạt các hàm về kỹ thuật, thống kê, kinh tế tài chính, hàm tra các chỉ tiêu thống kê như t, F, χ2 - Chức năng Data Analysis: Dùng để phân tích thống kê như phân tích các đặc trưng mẫu, tiêu chuNn t để so sánh sự sai khác, phân tích phương sai, AN OVA, ước lượng các tương quan hồi quy - Phân tích mô hình tưong quan hoặc hồi quy để dự báo các thay đổi theo thời gian ngay trên đồ thị. - Lưu ý: Về việc cài đặt chương trinh phân tích dữ liệu (Data Analysis) trong Excel: o Khi cài đặt phần mềm Excel phải thực hiện trong chế độ chọn lựa cài đặt, sau đó phải chọn mục: Add-Ins và Analysis Toolpak. o Khi chạy Excel lần đầu cần mở chế độ phân tích dữ liệu bằng cách: Menu Tools/Add-Ins và chọn Analysis Toolpak-OK. 4
N hư vậy trong thực tế quản lý dữ liệu nông lâm nghiệp nói riêng, việc khai thác hết tiềm năng ứng dụng của Excel cũng mang lại hiệu quả tốt mà không nhất thiết phải tìm kiếm thêm một phần mềm chuyên dụng nào khác. Vấn đề đặt ra là xác định chiến lược ứng dụng và khai thác đúng và sâu các công cụ chức năng thống kê sẵn có ở một phần mềm phổ biến trong bất kỳ một máy vi tính cá nhân nào. Trước hết cần lưu ý sử dụng các hàm, các tiêu chuNn thống kê thông dụng trong Excel như sau: Một số hàm thông dụng trong thống kê: o Tính tổng: =Sum(dãy đs) o Tổng bình phương: =Sumq(dãy đs) o Trung bình: =Average(dãy đs) o Lấy giá trị tuyệt đối: =Abs(đs) o Trị lớn nhất, nhỏ nhất: =Max(dãy đs), Min(dãy đs) o Các hàm lượng giác: =Cos(đs), =Sin(đs), =tan(đs) o Hàm mũ, log: =Exp(đs), =Ln(đs), =Log(đs) o Căn bậc 2: =Sqrt(đs) o Sai tiêu chuNn mẫu chưa hiệu đính: =Stdevp(dãy đs); đã hiệu đính =Stdev(dãy đs) o Phương sai mẫu chưa hiệu đính: =Varp(dãy đs); đã hiệu đính =Var(dãy đs). o Giai thừa: =Fact(n) o Số Pi: =Pi() Tra các giá trị T, F, χ2: Trong phân tích thống kê, khi áp dụng một tiêu chuNn nào đó, cần thiết phải so sánh với giá trị tra bảng ở mức độ tin cậy nhất định để đánh giá và kết luận. Trong Excel đã lập và tính sẵn các hàm để tra các giá trị này. Chọn 1 ô lấy giá trị tra. Kích nút fx trên thanh công cụ chuNn. Trong hộp thoại Function Category, chọn Statistical. Trong mục Function name, chọn 1 trong các hàm: Hàm Tinv: để tra T. Hàm Chiinv: để tra χ2. Hàm Finv: để tra F. Bấm N ext. Trong hộp thoại tiếp theo: Function Wizard chọn: o Probability (fx): Gõ vào mức ý nghĩa α=0.05 ; 0.01 hay 0.001. o Degrees Freedom (fx): Gõ vào bậc tự do. Đối với tiêu chuNn F cần đua vào 2 độ tự do. o Finish. 1.2 Tổng quát về phần mềm xử lý thống kê Statgraphics Plus Đây là một phần mềm chuyên dụng trong xử lý thống kê, bao gồm các chức năng: - Tạo lập cơ sở dữ liệu dưới dạng bảng tính - Tính toán các đặc trưng mẫu, vẽ sơ đồ, đồ thị quan hệ - So sánh hai hay nhiều mẫu bằng các tiêu chuNn thống kê t, U, F và nhiều tiêu chuNn phi tham số khác. - Thiết lập các mô hình hồi quy tuyến tính hay phi tuyến tính từ một cho đến nhiều lớp, tổ hợp biến. Với cách xử lý đa dạng để chọn lựa được biến ảnh hưởng đến một hậu qủa (biến phụ thuộc). 5
Để giao tiếp trong Statgraphics, số liệu đầu vào có thể được nhập trực tiếp trong file bảng tính và cơ sở dữ liệu của nó; song với các làm này đôi khi không thuận tiện trong các bước xử lý số liệu thô như đổi biến số, tính các biến trung gian, mã hóa biến số. Do đó thông thường nên tạo lập cơ sở dữ liệu trong bảng tính Excel để có thể sử dụng những chức năng bảng tính mạnh của nó trong xử lý dữ liệu thô, tạo lập cơ sở dữ liệu; sau đó sẽ nhập vào Statgraphics Plus để tính toán, thiết lập mô hình, Cơ sở dữ liệu lập trong Excel cần lưu dưới dạng phiên bản của Excel 5.0 trở về trước, vì Statgraphics Plus chưa nhận được các phiên bản sau này như Excel 97 – 2003, 2007. 2 TÍNH TOÁN CÁC ĐẶC TRƯNG THỐNG KÊ CỦA MỘT MẪU QUAN SÁT VÀ ƯỚC LƯỢNG KHOẢNG Để có những thông số đặc trưng về một đối tượng quan sát như sinh trưởng của một lô rừng, sự đa dạng loài của lô rừng, sự ảnh hưởng của cháy rừng đến mật độ, chất lượng tái sinh, biến động trữ lượng, mật độ của một lô rừng trồng, trạng thái rừng cần tiến thành thu thập dữ liệu theo một nhân tố chủ đạo và sau đó ước lượng, tính toán các đặc trưng cơ bản. Đây là các thông tin cơ bản về một đối tượng quan sát, theo một chỉ tiêu, nhân tố quan tâm. Các đặc trưng mẫu bao gồm tính các chỉ tiêu: Số trung bình, số trung vị, phương sai, sai tiêu chuNn, độ lệch, độ nhọn của dãy số liệu quan sát, phạm vi biến động của nó với một mức sai số cho phép đặt trước. Ví dụ: Khảo sát các đặc trưng cơ bản về sinh trưởng đường kính của rừng trồng tếch. 2 Số liệu đo D1,3 rừng trồng Tếch 14 tuổi trong ô tiêu chuNn 500m . 6
Các đặc trưng mẫu có thể tính đồng thời trong Excel theo các bước: N hập số liệu theo cột hoặc hàng. Menu Tools/Data Analyisis/Descriptive Statistics/OK. Có hộp thoại, trong đó cần xác định: o Input range: Khai báo khối dữ liệu. o Grouped by: Chọn dữ liệu nhập theo cột (Columns) hoặc hàng (Rows). o Label in first row: N ếu đưa vào cả hàng tiêu đề thì đánh dấu. o Output range: Đánh vào địa chỉ ô trên trái nơi đưa ra kết quả. o Summary Statistics: Thông tin tóm lược các đặc trưng thống kê (đánh dấu). o Kích nút OK Bảng nhập dữ liệu đường kính D1.3 của Tếch 7
Sử dụng chức năng phân tích đặc trưng mẫu của Excel Kết quả tính đặc trưng mẫu D1,3 (cm) Mean 18,98 Standard Error 0,442 Median 19,1 Mode 19,42 Standard Deviation 3,16 Sample Variance 9,986 Kurtosis 0,852 Skewness -0,227 Range 17,19 Minimum 9,868 Maximum 27,06 Sum 968 Count 51 Confidence Level (95,0%) 0,889 8
Giải thích: o Mean: Số trung bình. o Standard Error: Sai số của số trung bình mẫu. o Median: Trung vị mẫu. o Mode: Trị số ứng với tần số phân bố tập trung nhất. o Standard deviation: Sai tiêu chuNn mẫu. o Sample variance: Phương sai mẫu. o Kurtosis: Độ nhọn của phân bố Ku = 0 phân bố thực nghiệm tiệm cận chuNn. Ku > 0 đường cong có dạng bẹt hơn so với phân bố chuNn. Ku 0 đỉnh đường cong lệch trái so với số trung bình. Sk 0 thì giá trị quan sát có xu hướng phân tán xa số trung bình, ngược lại Ku 0 thì số liệu quan sát có xu hướng nghiêng về các giá trị nhỏ hơn trung bình, nếu là số liệu sinh trưởng rừng, thì cây rừng đang ở giai đoạn non; ngược lại Sk < 0, giá trị quan sát thiên về các giá trị lớn hơn trung bình, nếu quan sát sinh truởng rừng, thì đây là các khu rừng đã đi vào thành thục. N ếu Sk = 0 thì độ lệch tiệm cận chuNn. Khi một mẫu có Ku = 0 và Sk = 0 thì nó có phân bố chuNn. Giá trị Confidence Level (95%) cho phép ước lượng phạm vi biến động của số trung bình với độ tin cậy 95%: P(mean – t.S/ n ≤ µ ≤ mean + t.S/ n ) = 0.95 trong đó t.S/ n = Confidence Level (95%) Vì vậy giá trị biến động trung bình của tổng thể được ước lượng: µ = mean ± Confidence Level (95%) Tùy theo yêu cầu của cuộc điều tra đánh giá, thí nghiệm mà chọn mức độ tin cậy khác nhau: 90%, 95%, 99%. 9
3 SO SÁNH TRUNG BÌNH 02 MẪU QUAN SÁT BẰNG TIÊU CHUẨN T CỦA STUDENT Trong các thí nghiệm thường người ta cần so sánh kết quả của 2 công thức, ví dụ: Bón phân hay không bón, che bóng hay không che, sinh trưởng, tái sinh của cây rừng nơi được chăm sóc và nơi không, sinh trưởng cây rừng nơi cháy và không cháy Việc kiểm tra tiến hành theo 2 mẫu trên cơ sở so sánh 2 số trung bình bằng các tiêu chuNn t. Công thức tính giá trị kiểm tra t: XX12− t = 22 ()nn11−+− ( 21 ) 1 1 SS12()+ nn122+− n1 n2 Với: X1, X2: Trung bình của mẫu 1 và 2. 2 2 S1 , S2 : Phương sai mẫu 1 và 2. n1, n2: dung lượng 2 mẫu 1 và 2. N ếu t tính lớn hơn t bảng với α=0.05 và độ tự do K=n1+n2-2 thì bác bỏ giả thuyết Ho, có nghĩa trung bình 2 mẫu sai khác có ý nghĩa, và người ta sẽ chọn mẫu có trung bình cao. Trước khi sử dụng tiêu chuẩn t, cần kiểm tra 2 điều kiện: o Hai mẫu có phân bố chuNn. o Phương sai của hai mẫu có bằng nhau hay không Hai mẫu có phân bố chuẩn: Có thể vẽ biểu đồ phân bố tần số từng mẫu, hoặc dựa vào độ lệch và độ nhọn để xem xét có tiệm cận chuNn hay không. Trong nhiều trừong hợp thống kê về xã hội lẫn tự nhiên, người ta phải rút mẫu đủ lớn để bảo đảm tiêu chí này. Khi dung lượng mỗi mẫu >30 thì có thể xem là tiệm cận chuNn. Kiểm tra bằng nhau của 2 phương sai của 2 mẫu bằng tiêu chuẩn F. Trước khi chọn lựa tiêu chuNn t để so sánh trung bình 2 mẫu, cần kiểm tra sự sai khác phương sai của chúng bằng tiêu chuNn F. Ví dụ: Kiểm tra sinh trưởng chiều cao H của 2 phương pháp trồng thông 3 lá Pinus kesiya bằng cây con và rễ trần tại trạm thực nghiệm Lang Hanh-Lâm Đồng: Mỗi công thức được rút mẫu theo ô tiêu chuNn 1000m2, đo đếm chiều cao: - Dung lượng quan sát mỗi mẫu >90cây, nên chấp nhận giả thuyết phân bố N - H của từng mẫu tiệm cận chuNn. - Kiểm tra bằng nhau của 2 phương sai bằng tiêu chuNn F: Bảng tóm tắt số liệu sinh trưởng H của hai mẫu A B 1 H (cây con) H (rễ trần) 2 13,6 13 3 14 13,5 13,8 12 13 13,5 10
A B 1 H (cây con) H (rễ trần) 11 15 12 14 93 12,5 10 94 9 Tính F: Một trong 2 cách: C1: Kích nút fx, có hộp thoại: Chọn: Statistical (trong Function Category) và Ftest-N ext (trong Function name): Xuất hiện hội thoại tiếp theo: Array 1: Đưa vào dãy 1: A2:A93 Array 2: Đưa vào dãy 2: B2:B94 Finish. C2: Đưa đến ô kết quả: =Ftest(A2:A93,B2:b94) Enter. Nếu giá trị xác suất P > 0.05, kết luận hai phương sai bằng nhau, nếu ngược lại thì bác bỏ. Kết quả ví dụ trên có P=0.40>0.05, kết luận phương sai hai mẫu bằng nhau (chưa có sai dị rõ). • Dùng tiêu chuẩn t để kiểm tra giả thuyết Ho theo trình tự: Trong menu Tools/Data Analysis: Chọn trong hộp thoại một trong hai trưòng hợp tuỳ theo phương sai hai mẫu có bằng nhau hay không qua kiểm tra bằng F ở bước trước o t-Test: Two sample assuming equal variance (Trường hợp phương sai bằng nhau). o t-Test: Two sample assuming unequal variance (Trường hợp phương sai không bằng nhau). 11
Trong Hộp thoại: Xác định: o Variable 1 range: Khối dữ liệu mẫu 1 (A1:A93) o Variable 2 range: Khối dữ liệu mẫu 2 (B1:B94) N ên đưa cả tiêu đề. o Hypothesized mean diference: Đưa vào 0 (Có nghĩa giả thuyết Ho=0). Có thể thay đổi giả thuyết này theo yêu cầu đánh giá thí nghiệm. Ví dụ nếu muốn kiểm tra xem hai trung bình của hai mẫu có thực sự sai khác nhau không, giả thuyết Ho sẽ là: Ho: Mean1 = Mean2 hay nói khác Mean1 – Mean 2 = 0, lúc này giải thuyết Ho được đặt giá trị là 0. o Label: N ếu có đưa hàng tiêu đề vào thì cần đánh dấu vào label o Output range: Đưa địa chỉ ô trên trái nơi xuất kết quả. o OK. N ếu: P(T t Critical two tail (t hai chiều), bác bỏ Ho, hai mẫu sai dị rõ, ngược lại thì sai khác là ngẫu nhiên. t-Test: Two-Sample Assuming Equal Variances H (cây con) H (rễ trần) Mean 11,60434783 13,40322581 Variance 2,559761108 2,148141655 Observations 92 93 Pooled Variance 2,352826738 Hypothesized Mean 0 Difference df 183 t Stat -7,975469453 P(T<=t) one-tail 7,98781E-14 t Critical one-tail 1,653222625 P(T<=t) two-tail 1,59756E-13 t Critical two-tail 1,973012331 Từ kết quả trên cho thấy sinh trưởng của P.kesiya trồng bằng 2 phương pháp khác nhau sai dị rõ. Chiều cao bình quân cây trồng bằng rễ trần hơn hẵn trồng bằng cây con, do vậy phương pháp trồng thông 3 lá bằng rễ trần cần được ứng dụng trong thực tiễn. 12
4 NGHIÊN CỨU MỐI QUAN HỆ SINH THÁI LOÀI TRONG RỪNG MƯA NHIỆT ĐỚI DỰA VÀO TIÊU CHUẨN χ2 (Bảo Huy, 1997) Rừng hỗn loài nhiệt đới bao gồm nhiều loài cây cùng tồn tại, thời gian cùng tồn tại của một số loài trong đó phụ thuộc vào mức độ phù hợp hay đối kháng giữa chúng với nhau trong quá trình lợi dụng những yếu tố môi trường. Có thể phân ra làm 3 trường hợp: • Liên kết dương: Là trường hợp những loài cây có thể cùng tồn tại suốt quá trình sinh trưởng, giũa chúng không có sự cạnh tranh về ánh sáng, về các chất dinh dưỡng trong đất và không làm hại nhau thông qua các chất hoặc sinh vật trung gian khác. • Liên kết âm: Là trường hợp những loài cây không thể tồn tại lâu dài bên cạnh nhau được do có những đối kháng quyết liệt trong quá trình lợi dụng các yếu tố môi trường (ánh sáng, chất dinh dưỡng trong đất, nước ), có khi loại trừ lẫn nhau thông qua nhiều yếu tố như: độc tố lá cây, các tinh dầu hoặc sinh vật trung gian • Quan hệ ngẫu nhiên: Là trường hợp những loài cây tồn tại tương đối độc lập với nhau. Việc nghiên cứu mối quan hệ giữa các loài là nhằm mục đích: • Phục vụ việc “đơn giản hóa tổ thành”, xác định việc nên giữ lại và đào thải loài cây nào trong thiết kế nuôi dưỡng, khai thác rừng tự nhiên. • Định hướng trong việc lựa chọn nhóm loài cây hỗn giao trong trồng rừng, làm giàu rừng. Tuy nhiên, nghiên cứu đầy đủ mối quan hệ giữa các loài cây trong rừng tự nhiên là một vấn đề phức tạp, đòi hỏi căn cứ trên nhiều yếu tố. Trong thống kê sinh học, phương pháp dự báo được sử dụng để xác định mối quan hệ giữa các loài, làm cơ sở cho việc định hướng lựa chọn mô hình trồng rừng hỗn giao, điều chỉnh tổ thành trong công tác lâm sinh. Phương pháp nghiên cứu gồm có các bước chính: • Xác định diện tích biểu hiện loài • Dự báo mối quan hệ giữa các loài i) Xác định diện tích biểu hiện loài Để nghiên cứu mối quan hệ sinh thái giữa các loài, cần phải rút mẫu theo ô tiêu chuNn để tính toán xác suất xuất hiện các loài, vấn đề đặt ra là kích thước ô tiêu chuNn bao nhiêu để bảo đảm đại diện, đó chính là xác định diện tích biểu hiện loài. N guyên tắc nghiên cứu trong trường hợp này là xác định một diện tích ô mẫu nhỏ nhát nhưng bảo đảm xuất hiện các loài ưu thế sinh thái. Thu thập số loài theo ô tiêu chuNn diện tích thay đổi (Theo từng loại: Cây gỗ, cây tái sinh), diện tích ô bắt đầu là 100m2 và tăng dần đến khoảng 1 – 2ha. 13
Số loài theo kích thước ô mẫu tăng dần Stt Diện tích ô tiêu chuẩn Số loài Tên loài (m2) 1 100 5 a, d, hg 2 100 4 3 100 6 4 ,,,, ,,,, ,,,, 5 200 6 6 200 8 7 ,,, ,,,, ,,, 8 400 10 9 400 11 10 ,,, ,,, 11 600 n 2500 18 Có thể biểu thị việc xác định diện tích biểu hiện loài bằng đồ thị sau: Số loài Ổn định loài Diện tích ôtc (S) Diện tích biểu hiện loài Xác định diện tích biểu hiện loài Mô phỏng quan hệ: N (số loài) = f(S=diện tích ô tiêu chuNn), dạng quan hệ sau có thể được sử dụng: − −b.S m N = a.e − −b.S m Lim N = a.e = a Khi S → + ∞ Ví dụ: Tiến hành điều tra thử nghiệm 53 ô có diên tích từ 100m2 đến 10.000m2 ở rừng khộp vùn Ea Soup, trên mỗi ô xác định số loài thuộc tầng cây gỗ (có đường kính ngang ngực lớn 10cm) xuất hiện. Tiến hành mô phỏng quy luật biến đổi số loài (N ) theo diện tích ô (S) bằng một dạng hàm mũ cơ số e. Kết quả đã ước lượng các tham số: − −6.900.S 0.246 N = 16.810.e Với n=53 R=0.907 Fr=722.58 α<0.01 Phương trình đạt hệ số tương quan cao chứng tỏ có mối liên hệ chặt chẽ giữa N và S, và dạng hàm này mô tả tốt chiều hướng biến thiên. 14
Khảo sát hàm này cho thấy khi tăng diện tích lên vô hạn thì số loài xuất hiện tiệm cận với giá trị của tham số a = 16.810. N hư vậy có nghĩa là đối với rừng khộp tại Ea Soup, số lượng loài thuộc tầng cây gỗ không nhiều, chỉ đạt đến 17 loài. Đặc biệt một số loài có hệ số tổ thành gần như tuyệt đối. Các loài phổ biến của rừng khộp: Cà chắc (Shorea obtusa); CNm liên (Pentacme siamensis), Dầu đồng (Dipteocarpus tuberculatus), Dầu trà beng (Dipterocarpus obtusifolius), Chiêu liêu (Terminalia mycrocarpa) và một số loài thuộc loài khác có tỷ lệ thấp hơn trong tổ thành. N hư vậy số loài phổ biến trên một đơn vị diện tích rừng khộp chỉ khoảng 5-6 loài. Từ phương trình, thế giá trị N =6 vào suy được diện tích biểu hiện, đây cũng chính là diện tích cần có của một ô tiêu chuNn trong rút mẫu điều tra nghiên cứu quan hệ sinh thái loài. Diện tích biểu hiện trong trường hợp này là S = 2.500m2. Vậỵ có thể chọn ô hình vuông với kích thước 50x50m. ii) Dự báo mối quan hệ sinh thái giữa các loài Trên cơ sở đã xác định dược diện tích ô biểu hiện sinh thái loài; tiếp tục xác định dung lượng mẫu (số ô tiêu chuNn) cho từng sinh cảnh theo công thức: t 2 .V % 2 N ≥ Trong đó: t = 1,96 khi độ tin cậy là 95% ct Δ% 2 V%: hệ số biến động về số loài, được tính theo công thức: 2 ⎛ ()x ⎞ ⎜ x 2 − ∑ ⎟ ⎜∑ ⎟ S n V % = ×100 S = ⎝ ⎠ − X n 1 S: sai tiêu chuNn mẫu n: số ô rút mẫu thử (thường chọn n ≥ 30) x: số loài trên mỗi ô Δ%: sai số cho phép từ 5% - 10%. Thường rút thử 30 ô để điều tra, nếu số liệu ghi nhận không đảm bảo dung lượng mẫu cần thiết theo công thức trên thì cần phải tiến hành điều tra bổ sung, ngược lại thì việc điều tra bổ sung không còn cần thiết. Sau khi xác định số lượng ô tiêu chuNn rút mẫu thử, tiến hành xác định cự ly giữa các tuyến và cự ly giữa các ô trên tuyến để bảo đảm các ô mẫu được rải đều trên diện tích khảo sát. Tiến hành thu thập dữ liệu trên ô có diên tích biểu hiện, trong đó tập trung xác định tên loài xuất hiện Từ số liệu quan sát, xác định số loài ưu thế để nghiên cứu mối quan hệ giữa chúng. Trên quan điểm sinh thái, loài ưu thế được chọn thường phải có IV% >% hoặc tần suất F%>5%. Ví dụ: Từ 32 ô tiêu chuNn được rút mẫu ngẫu nhiên trong rừng thường xanh khu vực Dăk RLắp, thống kê được tần suất xuất hiện của các loài chủ yếu: 15
Tần suất xuất hiện các loài Stt Loài Tần số Tần xuất hiện suất (F%) Tên Việt Nam Tên Khoa Học % 1 Dẻ Lithocarpus sp 30 13.0 2 Bằng lăng Lagerstroemia calyculata 27 11.7 3 Xương cá Canthium didynum 23 10.0 4 Xoan Mộc Toona sureni 19 8.2 5 Bời lời Litsea glutinosa 18 7.8 6 Bồ hòn Sapindus mukorossi 16 6.9 7 Chò xót Schima superba 15 6.5 8 Vạng trứng Endospermum chinnese 14 6.1 9 Trâm Eugenia sp. 14 6.1 10 Bứa Garcinia loureiri 11 4.8 11 Phay sừng Duabanga sonneratioides 8 3.5 12 Cám Parinari anamense 6 2.6 13 Dâu da đất Baccaurea sapida 6 2.6 14 Thừng mực Wrightia annamensis 6 2.6 15 Máu chó Knema conferta 4 1.7 16 Chua khét Dysoxylum acutangulum 4 1.7 17 Trám Canarium copaliferum 3 1.3 18 Gạo Gossampinus malabaria 2 0.9 19 Sầu đâu Azadirachta indica 2 0.9 20 Chò chỉ Parashorea chinensis 2 0.9 21 Gòn Bombax anceps 1 0.4 Từ biểu trên cho thấy trong các loài chủ yếu, có 9 loài có tần suất > 5%. Trong rừng hỗn loài, các loài có tần suất > 5% được xem là loài đóng vai trò quan trọng trong hình thành sinh thái rừng, do đó chọn 9 loài này để xem xét quan hệ giữa chúng với nhau. Từ ô tiêu chuNn có diện tích biểu hiện được rút mẫu ngẫu nhiên, tiến hành kiểm tra quan hệ cho từng cặp loài theo tiêu chuNn ρ và ℵ2. Sử dụng các tiêu chuNn thống kê sau để đánh giá quan hệ theo từng cặp loài: ρ: Hệ số tương quan giữa 2 loài A và B. P(AB) − P(A).P(B) ρ = P(A).(1− P(A)).P(B).(1− P(B)) Trong đó: 16
ρ = 0 : 2 loài A và B độc lập nhau. 0 0: 2 loài liên kết dương và |ρ| càng lớn thì mức độ hổ trợ nhau càng cao. Trong trường hợp |ρ| xấp xỉ = 0, thì chưa thể biết giữa 2 loài có thực sự quan hệ với nhau hay không? Lúc này cần sử dụng thêm phương pháp kiểm tra tính độc lập bằng mẫu biểu 2x2: Việc kiểm tra mối quan hệ giữa 2 loài A và B được thực hiện bằng tiêu chuNn ℵ2: ( ad − bc − 0.5).2 n ℵ2 = (a + b).(c + d).(a + c).(b + d) Trong đó: a = nAB ; b = nB; c = nA; d: số ô không chứa cả 2 loài a và B. 2 2 2 ℵ t tính được ở công thức trên được so sánh với ℵ 0.05 ứng với bậc tự do K=1 ℵ 0.05, K=1 = 3.84 2 2 N ếu ℵ t ≤ ℵ 0.05 = 3.84 thì mối quan hệ giữa 2 loài là ngẫu nhiên. 2 2 N ếu ℵ t > ℵ 0.05 = 3.84 thì giữa 2 loài có quan hệ với nhau. Tóm lại để xem xét mối quan hệ theo từng cặp loài, sử dụng đồng thời 2 tiêu chuNn ρ và ℵ2: ℵ2: để kiểm tra mối quan hệ từng cặp loài. ρ: trong trường hợp kiểm tra bằng ℵ2 cho thấy có quan hệ, thì ρ sẽ cho biết chiều hướng mối quan hệ đó theo dấu của ρ (- hay +) và mức độ quan hệ qua giá trị |ρ|. 17
Kiểm tra quan hệ theo từng cặp loài Stt Loài A Loài B nA(c) nB(b) nAB(a) nAB- P(A) P(B) P(AB) ρ ℵ2 Quan hệ (d) 1 Xoan Mộc Bằng Lăng 5 13 14 0 0.594 0.844 0.438 -0.356 3.99 Có quan hệ âm 2 Xoan Mộc Dẻ 0 11 19 2 0.5940.938 0.594 0.312 3.04 Ngầu nhiên 3 Xoan Mộc Bời Lời 7 6 12 7 0.5940.563 0.375 0.168 0.89 Ngầu nhiên 4 Xoan Mộc Vạng Trứng 10 5 9 8 0.594 0.438 0.281 0.088 0.24 Ngầu nhiên 5 Xoan Mộc Trâm 10 5 9 8 0.594 0.438 0.281 0.088 0.24 Ngầu nhiên 6 Xoan Mộc Xương cá 5 9 14 4 0.5940.719 0.438 0.049 0.07 Ngầu nhiên 7 Xoan Mộc Bồ hòn 10 7 9 6 0.594 0.500 0.281 -0.064 0.12 Ngầu nhiên 8 Xoan Mộc Chò xót 12 8 7 5 0.594 0.469 0.219 -0.243 1.86 Ngầu nhiên 9 Bằng Lăng Dẻ 2 5 25 0 0.8440.938 0.781 -0.111 0.36 Ngầu nhiên 10 Bằng Lăng Bời Lời 13 4 14 2 0.8440.563 0.438 -0.206 0.40 Ngầu nhiên 11 Bằng Lăng Vạng Trứng 16 3 11 2 0.844 0.438 0.344 -0.141 0.61 Ngầu nhiên 12 Bằng Lăng Trâm 14 1 13 4 0.844 0.438 0.406 0.206 1.32 Ngầu nhiên 13 Bằng Lăng Xương cá 9 5 18 0 0.8440.719 0.563 -0.269 2.27 Ngầu nhiên 14 Bằng Lăng Bồ hòn 13 2 14 3 0.844 0.500 0.438 0.086 0.22 Ngầu nhiên 15 Bằng Lăng Chò xót 13 1 14 4 0.844 0.469 0.438 0.232 1.68 Ngầu nhiên 16 Dẻ Bời Lời 14 2 16 0 0.9380.563 0.500 -0.228 1.60 Ngầu nhiên 17 Dẻ Vạng Trứng 18 2 12 0 0.938 0.438 0.375 -0.293 2.67 Ngầu nhiên 18 Dẻ Trâm 17 1 13 1 0.9380.438 0.406 -0.033 0.03 Ngầu nhiên 19 Dẻ Xương cá 7 0 23 2 0.938 0.719 0.719 0.413 5.33 Có quan hệ dương 20 Dẻ Bồ hòn 14 0 16 2 0.938 0.500 0.500 0.258 2.07 Ngầu nhiên 21 Dẻ Chò xót 16 1 14 1 0.9380.469 0.438 -0.016 0.00 Ngầu nhiên 22 Bời lời Vạng Trứng 11 7 7 7 0.563 0.438 0.219 -0.111 0.38 Ngầu nhiên 23 Bời lời Trâm 7 3 11 11 0.563 0.438 0.344 0.397 4.99 Có quan hệ dương 24 Bời lời Xương cá 5 10 13 4 0.5630.719 0.406 0.009 0.00 Ngầu nhiên 25 Bời lời Bồ hòn 11 9 7 5 0.563 0.500 0.219 -0.252 2.00 Ngầu nhiên 26 Bời lời Chò xót 13 10 5 4 0.563 0.469 0.156 -0.434 5.97 Có quan hệ âm 27 Vạng trứng Trâm 9 9 5 9 0.438 0.438 0.156 -0.143 0.64 Ngầu nhiên 28 Vạng trứng Xương cá 5 14 9 4 0.438 0.719 0.281 -0.149 0.69 Ngầu nhiên 29 Vạng trứng Bồ hòn 5 7 9 11 0.438 0.500 0.281 0.252 2.00 Ngầu nhiên 30 Vạng trứng Chò xót 7 8 7 10 0.438 0.469 0.219 0.055 0.09 Ngầu nhiên 31 Trâm Xương cá 3 12 11 6 0.4380.719 0.344 0.131 0.53 Ngầu nhiên 32 Trâm Bồ hòn 6 8 8 10 0.438 0.500 0.250 0.126 0.49 Ngầu nhiên 33 Trâm Chò xót 11 12 3 6 0.438 0.469 0.094 -0.450 6.42 Có quan hệ dương 34 Xương cá Bồ hòn 9 2 14 7 0.719 0.500 0.438 0.348 3.82 Ngầu nhiên 35 Xương cá Chò xót 16 8 7 1 0.719 0.469 0.219 -0.527 8.80 Có quan hệ âm 36 Bồ hòn Chò xót 9 8 7 8 0.500 0.469 0.219 -0.063 0.12 Ngầu nhiên Từ kết quả này có thể xác định được: 2 2 - Các loài có quan hệ dương: ℵ t > ℵ 0.05 = 3.84 và ρ > 0: Các loài này nên được lựa chọn để trồng hỗn giao, hoặc làm giàu rừng 2 2 - Các loài có quan hệ âm: ℵ t > ℵ 0.05 = 3.84 và ρ < 0: Các loài này không nên được lựa chọn để trồng hỗn giao, hoặc làm giàu rừng; và cần loài trừ bớt sự cạnh tranh giữa chúng 2 2 - Các loài có quan hệ ngẫu nhiên: ℵ t ≤ ℵ 0.05 = 3.84: Các loài này có thể tồn tại khá độc lập, do vậy lựa chọn chúng hỗn giao hay loại trừ cũng không ảnh hưởng đến quan hệ sinh thái loài. 18
5 PHÂN TÍCH PHƯƠNG SAI Phân tích phương sai là một trong những phương pháp phân tích thống kê quan trọng, đặc biệt là trong các thí nghiệm giống, thí nghiệm các nhân tố tác động đến hiệu quả, chất lượng của cây trồng, vật nuôi, gieo uơm, kiểm nghiệm xuất xứ cây trồng. Chủ yếu đánh giá ảnh hưởng của các công thức, nhân tố đến kết quả thí nghiệm, làm cơ sở cho việc lựa chọn công thức, phương pháp tối ưu trong nông lâm nghiệp. Điều kiện để phân tích phương sai là: Các giá trị quan sát trong từng ô thí nghiệm có phân bố chuẩn: o Kiểm tra bằng đặc trưng mẫu, sơ đồ. o N ếu dung lượng quan sát đủ lớn (n>30) thì chấp nhận giả thuyết phân bố chuNn. Các phương sai của từng nhân tố bằng nhau: Kiểm tra bằng tiêu chuNn Cochran (nếu số lần lặp lại bằng nhau), bằng tiêu chuNn Bartlett (nếu số lần lặp của các công thức không bằng nhau). 5.1. Phân tích phương sai 1 nhân tố với các thí nghiệm ngẫu nhiên hoàn toàn Phân tích này có một nhân tố như xuất xứ cây trồng, mật độ trồng khác nhau, chế độ chăm sóc khác nhau, Có nghĩa trong đó đó có a công thức, mỗi công thức được lập lại m lần, số lần lặp của mỗi công thức có thể bằng hoặc không bằng nhau. Trong trường hợp này có thể sử dụng chương trình phân tích phương sai một nhân tố để kiểm tra ảnh hưởng của các công thức đến kết quả thí nghiệm. Cách bố trí thí nghiệm trên hiện trường để phân tích phương sai 1 nhân tố Các công Số lần lặp lại thức của 1 1 2 3 m nhân tố 1 11 12 13 1m 2 21 22 a a1 a2 am Ví dụ: Đánh giá kết quả khảo nghiệm xuất xứ Pinus caribeae tại Lang Hanh-Lâm Đồng. Theo dự kiến sẽ có 10 xuất xứ P.caribeae được trồng khảo nghiệm tại trạm thực nghiệm Lang Hanh năm 1991. Việc bố trí thí nghiệm ban đầu đã dự kiến tiến hành theo khối ngẫu nhiên đầy đủ RCB (Randomized Complete Blocks), bao gồm 10 công thức chỉ thị 10 xuất xứ và được lặp lại ở 4 khối. N hưng trong quá trình triển khai trồng thực nghiệm, chỉ còn lại 7 xuất xứ và chỉ có 5 xuất xứ lặp lại đủ 4 lần, còn 2 xuất xứ chỉ được lặp lại 2 lần. 7 xuất xứ P.caribeae được trồng thực tế, được đánh số và lặp lại như sau: 1: Xuất xứ P.alamicamba (N IC) lặp lại 4 lần. 2: P.poptun (Guat) “ 4 “ 3: P.guanaja (N onduras) “ 4 “ 4: P.linures (N onduras) “ 4 “ 5: P.R482 (Australia) “ 2 “ 6: P.T473 (Australia) “ 4 “ 8: P.little asaco (Bahamas) 2 “ 19
o Mỗi xuất xứ ứng với 1 lần lặp được trồng 25 cây, với cự ly 3x2m, tổng diện tích bố trí thí nghiệm là 1ha. o Các điều kiện đất đai, vi khí hậu, đia hình, chăm sóc đều được đồng nhất, nhân tố thay đổi để khảo sát chỉ còn lại là các xuất xứ khác nhau. o Tại thời điểm điều tra (1996), cây trồng trong các ô thí nghiệm có tuổi là 5. Tiến hành đo đếm toàn diện các chỉ tiêu D1,3, H, Dt, phNm chất, tỉa cành, hình thân. Sử dụng 2 chỉ tiêu D1,3 và H để đánh giá sinh trưởng của các xuất xứ thử nghiệm. Dùng phân tích phương sai để đánh giá sự sai khác về sinh trưởng ở các xuất xứ Trước hết đã kiểm tra 2 điều kiện để phân tích phương sai: o Điều kiện phân bố chuNn: Các giá trị quan sát ở từng ô thí nghiệm qua kiểm tra bằng biểu đồ đều có dạng tiệm cận chuNn nên chấp nhận giả thuyết phân bố chuNn. o Phương sai bằng nhau: Do dung lượng mẫu ở các xuất xứ không bằng nhau nên dùng tiêu chuNn Bartlett để kiểm tra, kết quả tính được: X2 = 3,73 < X2 (0,05; 6) = 12,59 Do đó chấp nhận giả thuyết bằng nhau của các phương sai mẫu. N hư vậy 2 điều kiện trên là thỏa mãn để tiến hành phân tích phương sai. Dùng phân tích phương sai 1 nhân tố để kiểm tra. Trong đó nhân tố là Xuất xứ với 7 công thức: Giá trị D1,3 (cm) bình quân ứng với từng ô thí nghiệm của các Xuất xứ theo khối (lần lặp lại) A B C D E 1 Xuất xứ Lặp 1 Lặp 2 Lặp 3 Lặp 4 2 1 10.8 11.2 10.4 9.9 3 2 12.3 11.5 9.5 10.0 4 3 9.4 10.5 11.0 9.5 5 4 9.0 10.8 11.5 8.7 6 5 14.2 12.9 7 6 12.3 12.5 12.4 10.8 8 87.09.8 Phân tích phương sai 1 nhân tố: Vào menu Tools/Data Analysis/Anova: Chọn Single Factor có được Hộp thoại: o Input range: N hập địa chỉ khối dữ liệu. Vd: A2:E8. (Có cột đầu chứa số hiệu công thúc, nhưng bỏ hàng đầu). o Grouped by: Chọn Columns hoặc Rows. o Đánh dấu vào Label in first colum (row). o Output range: Đưa địa chỉ ô trên trái nơi xuất kết quả. o Kích OK. 20
Kết quả phân tích phương sai 1 nhân tố Anova: Single Factor SUMMARY Groups Count Sum Average Variance 1 4 42.3 10.6 0.299523 2 4 43.2 10.8 1.703825 3 4 40.3 10.1 0.616404 4 4 40.0 10.0 1.780196 5 2 27.1 13.5 0.797116 6 4 48.1 12.0 0.673895 8 2 16.7 8.4 3.903367 21
AN OVA Source of Variation SS df MS F P-value F crit Between Groups 37.53507 6 6.255846 5.338286 0.002925 2.698656 Within Groups 19.92201 17 1.171883 Total 57.45708 23 Từ bảng AN OVA nhận được: Đối với các xuất xứ khác nhau: F = 5,33 > F(0,05) = 2,69. Kết luận: Các xuất xứ khác nhau có sự sai khác về sinh trưởng đường kính. N ếu ngược lại thì kết luận rằng giữa các xuất xứ chưa có sự sai khác về sinh trưởng Sinh trưởng bình quân đường kính các xuất xứ theo thứ tự từ cao đến thấp ở bảng sau: Thứ tự sinh trưởng đường kính từ tốt đến xấu Xuất xứ ni D1,3 tb (cm) 52 13.5 64 12.0 24 10.8 14 10.6 34 10.1 44 10.0 82 8.4 Tiếp theo dùng tiêu chuNn t để so sánh sinh trưởng đường kính lớn nhất của xuất xứ 5 với các xuất xứ có đường kính lần lượt nhỏ hơn: So sánh D bình quân giữa xuất xứ 5 với 6: t = 1,61 t(0,05 ; k=17)=2,11. Kết luận: Sinh trưởng D giũa xuất xứ 5 và 2 có sai khác rõ rệt. N hư vậy, xét theo chỉ tiêu đường kính, xuất xứ tối ưu trong 7 xuất xứ khảo nghiệm là 5 và 6, hai xuất xứ này có chỉ tiêu D lớn nhất, chưa có sai dị với nhau và có sai khác rõ rệt với các xuất xứ còn lại. Đó là 2 xuất xứ: P.R482 (Australia) và P.T473 (Australia). 5.2. Phân tích phương sai 2 nhân tố Trong các thí nghiệm người ta thường so sánh và phân tích tác động đồng thời 2 nhân tố lên kết quả thí nghiệm như: năng suất, sinh khối Phân tích phương sai lúc này chia 2 trường hợp: Hai nhân tố với một lần lặp và Hai nhân tố với nhiều lần lặp lại. 5.2.1. Phân tích phương sai 2 nhân tố với 1 lần lặp lại: (Bố trí thí nghiệm theo khối ngẫu nhiên đầy đủ (Randomized Complete Blocks) (RCB): Kiểu bố trí thí nghiệm RCB thường được sử dụng, nhân tố A chia làm a cấp và nhân tố B được chia b cấp (khối), tổ hợp 2 nhân tố chỉ có 1 lần lặp (1 ô thí nghiệm). 22
Bố trí thí nghiệm trên hiện trường Nhân tố B1 Nhân tố B2 Nhân tố B3 Nhân tố Bb A1 Aa A2 A2 A2 A4 A3 A3 A3 A3 Aa A1 A4 A2 A4 A4 Aa A1 A1 Aa N hân tố B được chia thành b khối, ở mỗi khối bố trí a công thức của nhân tố A một cách ngẫu nhiên. Ví dụ: Đánh giá kết quả khảo nghiệm 16 xuất xứ Pinus kesiya tại Lang Hanh-Lâm Đồng: 16 xuất xứ P.kesiya đã được trồng khảo nghiệm tại trạm thực nghiệm Lang Hanh năm 1991. Việc bố trí thí nghiệm đã được tiến hành theo khối ngẫu nhiên đầy đủ RCB (Randomized Complete Blocks), bao gồm 16 công thức chỉ thị 16 xuất xứ và được lặp lại ở 4 cấp đất (khối) 16 xuất xứ P.kesiya được đánh số như sau: 1: Xuất xứ Bengliet. 2: Faplac. 3: Xuân Thọ. 4: Thác Prenn. 5: Lang Hanh. 6: N ong Kiating. 7: Doisupthep. 8: Doiinthranon. 9: Phu Kradung. 10: N am nouv. 11: Cotomines. 12: Simao. 13: Watchan. 14: Zo khua. 15: Aung ban. 16: Jingdury. o Mỗi công thức ứng với 1 lần lặp được trồng 25 cây, với cự ly 3x2m, tổng diện tích bố trí thí nghiệm là 1,5ha. o Các khí hậu, địa hình, chăm sóc đều được đồng nhất, nhân tố thay đổi để khảo sát chỉ còn lại là các xuất xứ và cấp đất khác nhau. o Tại thời điểm điều tra (1996), cây trồng trong các ô thí nghiệm có tuổi là 5. Tiến hành đo đếm toàn diện các chỉ tiêu D1,3, H, Dt, phNm chất, tỉa cành, hình thân. Sử dụng 2 chỉ tiêu D1,3 và H để đánh giá sinh trưởng của các xuất xứ thử nghiệm. Dùng phân tích phương sai để đánh giá sự sai khác về sinh trưởng, cụ thể cho từng chỉ tiêu sinh trưởng như sau: Trước hết đã kiểm tra 2 điều kiện để phân tích phương sai: Điều kiện phân bố chuNn: Các giá trị quan sát ở từng ô thí nghiệm qua kiểm tra bằng biểu đồ đều có dạng tiệm cận chuNn nên chấp nhận giả thuyết phân bố chuNn. Phương sai bằng nhau: Dùng tiêu chuNn Cochran, kết quả tính được: Gmax = 0,11 < Gmax (0,05 ; 16 ; 3) = 0,28 Do đó chấp nhận giả thuyết bằng nhau của các phương sai mẫu. N hư vậy 2 điều kiện trên là thỏa mãn để tiến hành phân tích phương sai. 23
Dùng phân tích phương sai 2 nhân tố 1 lần lặp để kiểm tra: Với nhân tố thứ nhất là 16 xuất xứ, nhân tố thứ 2 là cấp đất với 4 cấp. Ứng với 1 tổ hợp Xuất xứ - Cấp đất chỉ có 1 ô thí nghiệm (lặp lại 1 lần). Bảng dữ liệu phân tích phương sai 2 nhân tố 1 lần lặp Giá trị D1,3 (cm) bình quân ứng với từng ô thí nghiệm theo 2 nhân tố 1 lần lặp A B C D E 1 Xuất xú Cấp đất 1 Cấp đất 2 Cấp đất 3 Cấp đất 4 2 1 11.4 11.3 10.8 13.3 3 2 11.4 11.6 10.9 10.9 4 3 11.7 12.6 11.7 12.6 5 4 13.7 12.1 11.6 11.7 6 5 14.1 13.6 13.7 13.7 7 6 13.5 11.4 12.2 11.3 8 7 13.8 12.3 12.6 11.4 9 8 14.1 13.3 15.2 13.0 10 9 13.8 11.8 11.9 12.1 11 10 11.3 11.8 12.1 11.8 12 11 12.6 12.6 13.3 10.9 13 12 11.3 12.4 10.5 12.0 14 13 12.7 13.4 12.1 10.7 15 14 10.1 9.5 9.8 8.0 16 15 10.5 9.4 9.1 10.9 17 16 10.2 11.0 10.8 11.9 Phân tích phương sai 2 nhân tố 1 lần lặp: o Tools/Data Analysis/Anova: Two Factor Without Replication - OK. o Hộp thoại: Input range: Địa chỉ khối dữ liệu (N ên quét cả hàng, cột đầu làm nhãn). Vd: A1:E17 Đánh dấu vào Labels. Output range: Địa chỉ ô trên trái nơi xuất kết quả OK 24
Kết quả phân tích phương sai 2 nhân tố 1 lần lặp lại Anova: Two-Factor Without Replication SUMMARY Count Sum Average Variance 1 4 46.9 11.7 1.253512 2 4 44.8 11.2 0.156318 3 4 48.6 12.2 0.268337 4 4 49.1 12.3 0.933224 5 4 55.1 13.8 0.049285 6 4 48.5 12.1 1.064903 7 4 50.0 12.5 0.975826 8 4 55.7 13.9 0.926688 9 4 49.7 12.4 0.817143 10 4 47.0 11.7 0.107475 11 4 49.3 12.3 1.054463 12 4 46.1 11.5 0.664541 13 4 48.9 12.2 1.255351 14 4 37.4 9.3 0.85117 15 4 39.9 10.0 0.763403 16 4 43.9 11.0 0.514494 Cấp đất 1 16 196.1 12.3 2.077919 Cấp đất 2 16 190.2 11.9 1.470334 25
Cấp đất 3 16 188.3 11.8 2.263297 Cấp đất 4 16 186.3 11.6 1.767392 AN OVA Source of Variation SS df MS F P-value F crit Rows 82.11826 155.474551 7.804468 3.58E-08 1.894875 Columns 3.402532 31.134177 1.616873 0.198718 2.811547 Error 31.56586 450.701464 Total 117.0867 63 Từ bảng AN OVA nhận được: Đối với các xuất xứ khác nhau (Hàng - Rows): F = 7,80 > F(0,05) = 1,89. Kết luận: Các xuất xứ khác nhau có sự sai khác về sinh trưởng đường kính. Đối với các cấp đất (Cột – Collumns): F = 1,62 < F(0,05) = 2,81. Kết luận: Các cấp đất khác nhau chưa có ảnh hưởng đến sinh trưởng. N hư vậy 16 xuất xứ khi trồng ở Lang Hanh đã có sinh trưởng khác nhau, do việc cấp đất không ảnh hưởng rệt, nên để đánh giá chính xác hơn chỉ cần phân tích phương sai 1 nhân tố (xuất xứ). Phân tích phương sai 1 nhân tố Anova: Single Factor SUMMARY Groups Count Sum Average Variance 1 4 46.9 11.7 1.253512 2 4 44.8 11.2 0.156318 3 4 48.6 12.2 0.268337 4 4 49.1 12.3 0.933224 5 4 55.1 13.8 0.049285 6 4 48.5 12.1 1.064903 7 4 50.0 12.5 0.975826 8 4 55.7 13.9 0.926688 9 4 49.7 12.4 0.817143 10 4 47.0 11.7 0.107475 11 4 49.3 12.3 1.054463 12 4 46.1 11.5 0.664541 13 4 48.9 12.2 1.255351 14 4 37.4 9.3 0.85117 15 4 39.9 10.0 0.763403 26
16 4 43.9 11.0 0.514494 AN OVA Source of Variation SS df MS F P-value F crit Between Groups 82.11826 15 5.474551 7.514741 3.59E-08 1.880174 Within Groups 34.9684 48 0.728508 Total 117.0867 63 Kết quả từ bảng AN OVA cho thấy F = 7,51 > F(0,05) = 1,88. Kết luận: Sinh trưởng đường kính của 16 xuất xứ là khác nhau khi trồng ở Lang Hanh. Sinh trưởng bình quân đường kính các xuất xứ theo thứ tự từ cao đến thấp ở bảng sau: Thứ tự sinh trưởng đường kính từ tốt đến xấu Xuất xứ D1,3 tb(cm) 813.9 513.8 712.5 912.4 11 12.3 412.3 13 12.2 312.2 612.1 10 11.7 111.7 12 11.5 211.2 16 11.0 15 10.0 14 9.3 Kết quả dùng tiêu chuNn t để so sánh sinh trưởng đường kính lớn nhất của xuất xứ 8 với các xuất xứ có đường kính lần lượt nhỏ hơn: So sánh D bình quân giữa xuất xứ 8 với 5: t = 0,26 t(0,05 ; k=48)=2,01. Kết luận: Sinh trưởng D giũa xuất xứ 8 và 7 có sai khác rõ rệt. N hư vậy, xét theo chỉ tiêu đường kính, xuất xứ tối ưu trong 16 xuất xứ khảo nghiệm là 8 và 5, hai xuất xứ này có chỉ tiêu D lớn nhất, chưa có sai dị với nhau và có sai khác rõ rệt với các xuất xứ còn lại. Đó là 2 xuất xứ: Doiinthranon và Lang Hanh. 27
5.2.2. Phân tích phương sai 2 nhân tố m lần lặp Trường hợp phân tích phương sau 2 nhân tố m lần lặp: N hân tố A có a công thức và nhân tố B có b công thức; và này mỗi tổ hợp nhân tố A và B được lặp lại m lần một cách ngẫu nhiên. Lúc này ngoài việc đánh giá ảnh hưởng của từng nhân tố A, B ta còn phải tính ảnh hưởng qua lại của chúng đến kết quả thí nghiệm. Ví dụ: N ghiên cứu ảnh hưởng của hai nhân tố thí nghiệm là mật độ và bón phân đến năng suất của bông. o N hân tố A: Mật độ chia làm 3 cấp. o N hân tố B: Phân bón được chia làm 4 mức o Mỗi tổ hợp được thí nghiệm lập lại ngẫu nhiên 4 lần. Bố trí thí nghiệm 2 nhân tố m lần lặp Lặp 1 Lặp 2 Lặp 3 Lặp 4 B1 B2 B1 B2 B1 B2 B1 B2 A1 A2 A1 A1 B3 B4 B3 B4 B4 B3 B3 B4 B3 B1 B1 B2 B1 B2 B1 B2 A2 A1 A2 A2 B2 B4 B4 B3 B3 B4 B4 B3 B1 A3 B2 B1 A3 B2 B1 B2 B1 B2 A3 A3 B4 B3 B4 B3 B4 B3 B3 B4 28
Bảng số liệu sản lượng bông theo tổ hợp 2 nhân tố và lặp lại 4 lần ở một tổ hợp (Đ/v: Tạ/ha) A B C D 1 B\A A1 A2 A3 2 B1 16 17 18 3 14 15 18 4 21 17 19 5 16 19 17 6 B2 19 19 20 7 20 18 23 8 23 18 21 9 19 20 21 10 B3 19 21 22 11 21 21 18 12 22 22 21 13 20 23 21 14 B4 20 20 25 15 24 20 22 16 21 22 21 17 17 19 23 Phân tích phương sai 2 nhân tố m lần lặp: o Tools/Data Analysis/Anova: Two Factor With Replication- OK. o Hộp thoại: Xác định: Input range: N hập khối dữ liệu kể cả hàng cột tiêu đề. Vd: A1:D17. Rows per sample: N hập số lần lặp. Vd: 4. Output range: N hập địa chỉ ô trên trái nơi xuất kết quả. OK. 29
Kết quả phân tích phương sai 2 nhân tố m lần lặp Anova: Two-Factor With Replication SUMMARY 1 2 3 Total 1 Count 4 44 12 Sum 67 6872 207 Average 16,75 17 18 17,25 Variance 8,916667 2,666667 0,666667 3,659091 2 Count 4 44 12 Sum 81 7585 241 Average 20,25 18,75 21,25 20,08333 Variance 3,583333 0,916667 1,583333 2,810606 3 Count 4 44 12 Sum 82 8782 251 Average 20,5 21,75 20,5 20,91667 Variance 1,666667 0,916667 3 1,901515 4 Count 4 44 12 Sum 82 8191 254 30
Average 20,5 20,25 22,75 21,16667 Variance 8,333333 1,583333 2,916667 4,878788 Total Count 16 1616 Sum 312 311 330 Average 19,5 19,4375 20,625 Variance 7,2 4,529167 4,783333 AN OVA Source of Variation SS df MS F P-value F crit Sample 116,2292 338,74306 12,65079 8,45E-06 2,866265 Columns 14,29167 27,145833 2,333333 0,111468 3,259444 Interaction 21,20833 6 3,534722 1,154195 0,352014 2,363748 Within 110,25 363,0625 Total 261,9792 47 • Bảng Summary: Cho kết quả tính toán từng tổ hợp nhân tố A/B và chung cho từng nhân tố B, nhân tố A, gồm các chỉ tiêu: Dung lượng (Count), Tổng (Sum), Trung bình (Average), Phương sai (Variance). • Bảng AN OVA: Cột đầu tiên là các nguồn biến động: o Sample: Biến động do nhân tố B tạo nên (do được xếp theo hàng). o Columns: Biến động do nhân tố A tạo nên (do được xếp theo cột). o Interaction: Tác động qua lại. o Within: Biến động ngẫu nhiên. o Total: Biến động chinh của n giá trị quan sát. Từ kết quả này cho thấy: FB = 12.65 > F0.05 = 2.87. Kl: Phân bón có tác động rõ rệt đến năng suất bông. FA = 2.33 < F0.05 = 3.26. Kl: Mật độ ảnh hưởng không rõ đến năng suất bông. FAB = 1.15 < F0.05 = 3.36. Kl: Đồng thời thay đổi mật độ và phân bón ảnh hưởng không rõ đến năng suất. Lúc này chỉ còn việc lựa chọn công thức bón phân tối ưu. Qua số trung bình năng suất theo từng công thức bón phân cho thấy công thức 4 có năng suất cao nhất là 21.16 tạ/ha. Có thể dùng tiêu chuNn t để kiểm tra lại xem công thức 4 có sai khác với công thức nào còn lại để lựa chọn công thức có hiệu quả nhất. Lưu ý trong phân tích phương sai 2 nhân tố m lần lặp, nếu kiểm tra Interaction (tương tác giữa 2 nhân tố) có ảnh hưởng đến chỉ tiêu quan sát, thì lúc này cần chọn tổ hợp công thức có giá trị bình quân tốt nhất; đồng thời có thể so sánh nó với tổ hợp đứng thứ 2, 3 để tìm tổ hợp công thức tối ưu. 31
6. PHÂN TÍCH TƯƠNG QUAN - HỒI QUY Trong thực tế người ta cần lập các mô hình tương quan hồi quy vì các mục đích: o Để ước lượng một nhân tố khó đo đếm (gọi là biến phụ thuộc y) thông qua một hay nhiều biến dễ quan sát, đo đếm (gọi là biến độc lập x) và tất nhiên là phải có mối liên hệ giữa y và x. Từ đây có thể lập các biểu điều tra phục vụ cho việc giảm nhẹ các quan sát đo đếm một số nhân tố phức tạp o Để dự báo một nhân tố trong tương lai (gọi là biến dự báo y) với một số biến độc lập, đầu vào (gọi là là biến độc lập x) o Để nghiên cứu tác động, ảnh hưởng của một hoặc nhiều nhân tố đến một yếu tố cần quan tâm như sinh trưởng, sản lượng, chất lượng rừng, xói mòn đất, dòng chảy lưu vực. Trên cơ sở đó có giải pháp kỹ thuật thích hợp hoặc các biện pháp thích hợp Sử dụng chương trình Excel hoặc Statgraphics Plus để thiết lập các mô hình tương quan/hồi quy tuyến tính từ một cho đến nhiều biến số độc lập. Trong chương trình này, các tham số được ước lượng bằng phương pháp bình phương tối thiểu. Riêng các dạng phi tuyến khi ứng dụng chương trình này cần đổi biến số để quy về dạng tuyến tính. 6.1. Hồi quy tuyến tính 1 lớp Hồi quy tuyến tính một lớp có nghĩa là có một biến số độc lập x được nghiên cứu ảnh hưởng đến biến phụ thuộc y, dạng quan hệ được xác định là đường thẳng. Có nghĩa là khi x tăng hoặc giảm thì y cũng tăng hoặc giảm đều theo dạng được thẳng. Dạng phương trình tổng quát: Y = A + B.X. Vd: Lập mô hình tương quan giữa chiều cao dưới cành (Hdc) với chiều cao cả cây (H) rừng Tếch dạng đường thẳng: Hdc = A + B.H. Vì Hdc là chỉ tiêu khó đo đếm hơn H, nên dùng quan hệ này để xác định Hdc thông qua H. Nhập số liệu theo bảng: Các cặp số liệu Hdc - H A B 1 Hdc(m) H(m) 2 22,0 23,0 3 21,8 23,0 4 21,5 22,3 40 9,7 10,9 41 9,8 11,1 Ước lượng tương quan hồi quy đường thẳng: o Tools/Data Analysis/Regression. OK. o Hộp thoại: Input Y range: N hập địa chỉ cột biến Y (Có thể nhập cả nhãn). Vd: A1:A41. Input X range: N hập địa chỉ cột biến X (Có thể nhập cả nhãn). Vd: B1:B41. Label: Đánh dấu nếu đã nhập cả hàng đầu làm nhãn. Output range: N hập địa chỉ ô trên trái nơi xuất kết quả. OK. 32
Kết quả ước lượng hồi quy tuyến tính 1 lớp SUMMARY OUTPUT Regression Statistics Multiple R 0,998189546 R Square 0,99638237 Adjusted R Square 0,996287169 Standard Error 0,318271114 Observations 40 AN OVA df SS MS F Significance F Regression 1 1060,180842 1060,181 10466,12 5,24804E-48 Residual 38 3,84926708 0,101297 Total 39 1064,030109 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept -0,715306008 0,127254043 -5,62109 1,88E-06 -0,972918358 -0,457693658 Hgo(m) 0,994341123 0,009719471 102,304 5,25E-48 0,974665081 1,014017165 33
Phương trình tương quan: Hdc = - 0.715 + 0.994.H Với N = 40 R = 0.998 Fr = 10466.12 với α<0.0000 Từ phương trình hồi quy, có thể xác định Hdc gián tiếp qua H. 6.2. Dạng phi tuyến đưa về tuyến tính 1 lớp Trong thực tế biến y có thể không có dạng quan hệ đường thẳng với x, do đó cần sử dụng mô hình phi tuyến. Trường hợp các hàm phi tuyến, để ước lượng cần biến đổi thành dạng tuyến tính để ước lượng trong các phần mềm Excel, Statgraphics Plus. Một số hàm phi tuyến phổ biến như: y = a.xb tuyến tính hóa: ln(y) = ln(a) + b.ln(x) y = a.ebx tuyến tính hóa: ln(y) = ln(a) + b.x 6.2.1. Lập mô hình hàm mũ trong Excel: Ví dụ: Lập mô hình tương quan H/D rừng trồng Tếch dạng hàm mũ: H = a.Db Tuyến tính hóa: Logarit neper 2 vế: Ln(H) = Ln(a) + b.Ln(D) Đặt Y = Ln(H) X = Ln(D) A = Ln(a) B = b. Vậy Y = A + B.X Nhập số liệu và đổi biến số: o Cột A: Số liệu D. o Cột B: Số liệu H. o Cột C: Ln(D). Tại ô C2: =Ln(A2), copy cho cả cột. o Cột D: Ln(H). Tại ô D2: =Ln(B2), copy cho cả cột. Số liệu H/D và đổi biến số A B C D 1 D(cm) H(m) Ln(D) Ln(H) 2 31,3 22,0 3,443863 3,091042 3 32,0 21,8 3,466237 3,08191 40 12,6 9,7 2,536373 2,270804 41 13,9 9,8 2,629481 2,277972 Ước lượng tương quan hồi quy đường thẳng trong Excel: o Tools/Data Analysis/Regression. OK. o Hộp thoại: Input Y range: N hập địa chỉ cột biến Y (Có thể nhập cả nhãn). Vd: D1:D41. Input X range: N hập địa chỉ cột biến X (Có thể nhập cả nhãn). Vd: C1:C41. Label: Đánh dấu nếu đã nhập cả hàng đầu làm nhãn. Output range: N hập địa chỉ ô trên trái nơi xuất kết quả. Kích OK. 34
Kết quả ước lượng hồi quy tuyến tính SUMMARY OUTPUT Regression Statistics Multiple R 0.940546 R Square 0.884627 Adjusted R Square 0.881591 Standard Error 0.167161 Observations 40 ANOVA Significance df SS MS F F Regression 1 8.141566 8.14156 291.366 2.062E-19 Residual 38 1.061823 0.02794 Total 39 9.203388 Standard Coefficients Error t Stat P-value Lower 95% Upper 95% 9.88E- Intercept -0.80087 0.18412 -4.34972 05 -1.173600 -0.428137967 2.06E- ln(D) 1.157937 0.067837 17.0694 19 1.020609 1.295265915 35
Phương trình tương quan: Ln(H) = -0.800 + 1.157.Ln(D) Với N = 40 R = 0.940 Fr = 291.36 với α<0.0000 Đưa về dạng nguyên thủy: Tính a = exp(A) = exp(-0.800) = 0.449 Vậy: H = 0.449.D1.157 Từ mô hình này có thể ước lượng H thông qua D mà không phải đo đếm 6.2.2. Lập mô hình hàm mũ và Schumacher trong Statgraphics Plus: Trong Statgraphics Plus, việc tính toán mô hình đơn giản hơn vì không cần tạo thêm các cột đổi biến số, biến số được đổi trực tiếp trong hộp thoại khi thiết lập mô hình. i) Lập mô hình hàm mũ trong Statgraphics Plus Ví dụ lập hàm mũ quan hệ H/D dạng: H = a.Db Đầu tiên nhập dữ liệu trong Excel với hai cột y và x, ví dụ là D và H như sau File dữ liệu Excel cần được lưu với version 5.0 về trước, vì Statgraphics Plus chưa nhận được kiểu file sau này của Microsoft Excel như Excel 97-2003 hoặc 2007 Sau đó mở file dữ liệu này trong Statgraphics Plus: Vào Menu File/Open/Open Datat File 36
Chạy phần xử lý hàm tương quan một lớp: Relate/Simple Regression: Vào Menu Relate/Simple Regression Trong hộp thoại chọn biến y và x và đổi biến số ngay trong hộp thoại: log(H) và log(D). Kích OK để có kết quả. (Lưu ý ký hiệu log trong Statgraphics là logarit neper) 37
Kết quả xử lý trong Statgraphics như sau Kết quả cho ra hàm trực tiếp viết dưới dạng tuyến tính đã đổi biến số: log(H) = - 0.800 + 1.157.log(D) Các kết quả kiểm tra hệ số tương quan R và các biến số được hiểu giống như trong Excel Việc lưu giữ kết quả có thể làm bàng nhiều cách trong đó đơn gian là quét chuột phần kết quả và paste vào trong Word. ii) Lập mô hình hàm Schumacher trong Statgraphics Plus Trong lâm nghiệp hàm Schumacher được sử dụng phổ biến để mô phỏng quá trình sinh trưởng cây rừng và lâm phần. Dạng hàm Schumacher: − −b.x m y = a.e , trong đó a, b và m là tham số; y là giá trị sinh trưởng D, H, V, G, M và x là tuổi (T). Khi ước lượng hàm này, tham số m thường chạy từ 0.1; 0.2; 1.9; 2.0. Từ đó chọn hàm tối ưu với m cho hệ sso tương quan R cao nhất. Để ước lượng hàm này, tuyến tính hóa: ln(y) = ln(a) – b.x-m. 39
Ví dụ sử dụng Statgraphics Plus để ước lượng sinh trưởng V theo tuổi (T) của loài bằng lăng theo hàm Schumacher. Nhập dữ liệu V/T trong Excel Đổi biến số với m chạy trong Statgrahics 40
Kết quả ước lượng hàm Schumacher log(V) = 2.12522 - 17.117*T^-0.5 Với R = -0.994 và P < 0.000 Kết quả trên là với m = 0.5; lần lượt thay m khác nhau để tìm hàm tối ưu với R max. Từ đây suy ra hàm nguyên thủy: a = exp(2.12522) = 8.374; b = 17.117 V = 8.374.exp( - 17.117. T -0.5) 6.3. Hồi quy tuyến tính nhiều lớp Trong thực tế biến phụ thuộc Y bị chi phối bởi nhiều biến số độc lập Xi. Ví dụ như trữ lượng rừng được đóng góp bởi nhiều nhân tố như mật độ, tiết diện ngang, chiều cao, cấp đất; hoặc biến đổi dòng chảy, mức độ xung yếu của lưu vực bị chi phối bởi nhiều nhân tố như lượng mưa, độ dốc, địa hình, loài đất, che phủ thảm thực vật; hoặc tái sinh tự nhiên phụ thuộc vào nhiều nhân tố như ánh sáng, hạt giống, lửa rừng, đất, thực bì, Tuy nhiên biến nào là chủ đạo thì chúng ta chưa biết, do vậy với phương pháp mô hình hóa với nhiều thử nghiệm khác 41
nhau giúp chúng ta dự báo được nhân tố ảnh hưởng quan trọng, trên cơ sở đó sẽ điều tiết các nhân tố này đáp ứng được mục tiêu mong đợi Trong trưòng hợp này để ước lượng biến phụ thuộc Y người ta cần lập mô hình hồi quy nhiều biến số để có thể phản ảnh chính xác giá trị ước lượng, dự báo Y. Dạng phương trình tổng quát: Y = ao + b1X1 + b2X2 + + bnXn Ví dụ: Thiết lập mô hình dự đoán trữ lượng rừng (M) Tếch theo 2 biến số mật độ (N ) và chiều cao bình quân (H) theo dạng hàm mũ: M = a + b1 N + b2 H Đây là dạng tuyến tính 2 lớp Y = a + b1X1 + b2X2 Dùng phương pháp bình phương tối thiểu ước lượng phương trình • Nhập số liệu Bảng số liệu M/N/H A B C 1 N(c/ha) H(m) M(m3/ha) 2 180 23,0 163,452 3 170 23,0 160,154 4 220 22,3 184,167 40 570 10,9 43,846 41 570 11,1 53,212 Ước lượng tương quan tuyến tính nhiều lớp: o Tools/Data Analysis/Regression.OK. o Hộp thoại: Input Y range: N hập địa chỉ cột biến Y (Có thể nhập cả nhãn). Vd: C1:C41. Input X range: N hập địa chỉ khối các biến X (Có thể nhập cả nhãn). Vd: A1:B41. Label: Đánh dấu nếu đã nhập cả hàng đầu làm nhãn. Output range: N hập địa chỉ ô trên trái nơi xuất kết quả. OK. 42
Kết quả ước lượng mô hình hồi quy tuyến tính 2 lớp SUMMARY OUTPUT Regression Statistics Multiple R 0.9256776 R Square 0.856879 Adjusted R Square 0.8491427 Standard Error 28.140919 Observations 40 AN OVA df SS MS F Significance F Regression 2 175426.2 87713.1 110.7613 2.40166E-16 Residual 37 29300.72 791.9113 Total 39 204726.9 Standard Coefficients Error t Stat P-value Lower 95% Upper 95% Intercept -154.77144 22.13662 -6.99165 2.91E-08 -199.6244851 -109.918392 N (c/ha) 0.1095484 0.016994 6.446152 1.57E-07 0.075114494 0.143982284 H (m) 14.52156 0.97677 14.86692 3.49E-17 12.54243676 16.50068344 43
Phương trình tương quan hồi quy: M = - 154.771 + 0.109 N + 14.521 H Với N = 40 R = 0.926 Fr = 110.76 với α<0.00 tb1 = 6.44 tb2 = 14.86 với α<0.00 Từ mô hình này có thể ước lượng, dư báo trữ lượng rừng thông qua 2 biến số mật độ (N /ha) và chiều cao bình quân (H). 6.4. Hồi quy phi tuyến tính nhiều lớp, tổ hợp biến Trong trường hợp nhiều biến số xi ảnh hưởng đến y không theo dạng tuyến tính mà có dạng quan hệ phi tuyến, trường hợp này cần đổi biến số để trở về dạng tuyến tính, hoặc lập mô hình tổ hợp biến. Một số dạng phi tuyến nhiều lớp phổ biến và cách quy về tuyến tính hoặc tổ hợp biến: y = a.x1b1 x2b2 xnbn tuyến tính hóa: ln(y) = ln(a) + b1.ln(x1) + b2ln(x2) + + bnln(xn) y = a.eb1x1+b2x2+ +bnxn tuyến tính hóa: ln(y) = ln(a) + b1x1 + b2x2 + + bnxn 6.4.1. Lập mô hình phi tuyến nhiều lớp chuyển về tuyến tính nhiều lớp trong Excel Hàm phi tuyến nhiều lớp trong Excel được ước lượng bằng cách tuyến tính hóa, có nghĩa là cần tạo thêm các trường/cột biến số mới. Ví dụ lập quan hệ giữa M = f(N . H) dạng hàm mũ: M = a.N b1Hb2. Tuyến tính hóa bằng cách lấy log 2 vế: ln(M) = ln(a) + b1ln(N ) +b2ln(H) N hư vậy phải tạo thêm 3 cột log để đổi biến số Bảng dữ liệu đổi biến số để lập mô hình phi tuyến nhiều lớp N (c/ha) H (m) M (m3/ha) Ln(M) Ln(N) Ln(H) 180 23.0 163.452 5.096519 5.192957 3.135494 170 23.0 160.154 5.076136 5.135798 3.135494 220 22.3 184.167 5.215843 5.393628 3.104587 210 22.1 145.436 4.979736 5.347108 3.095578 650 6.9 24.177 3.185402 6.476972 1.931521 620 7.0 23.400 3.152736 6.429719 1.945910 690 6.7 22.027 3.092269 6.536692 1.902108 650 6.4 19.696 2.980416 6.476972 1.856298 650 6.8 20.778 3.033895 6.476972 1.916923 630 6.8 22.634 3.119453 6.445720 1.916923 660 7.9 69.476 4.240981 6.492240 2.066863 690 8.0 69.463 4.240794 6.536692 2.079442 980 7.5 35.867 3.579818 6.887553 2.014903 980 7.5 36.937 3.609214 6.887553 2.014903 970 12.3 130.740 4.873211 6.877296 2.509599 960 12.3 125.725 4.834097 6.866933 2.509599 960 4.3 11.327 2.427189 6.866933 1.458615 1000 4.2 12.320 2.511224 6.907755 1.435085 960 9.0 57.145 4.045592 6.866933 2.197225 970 8.9 58.715 4.072695 6.877296 2.186051 950 12.5 127.868 4.850998 6.856462 2.525729 44
N (c/ha) H (m) M (m3/ha) Ln(M) Ln(N) Ln(H) 970 12.5 127.934 4.851515 6.877296 2.525729 1090 7.1 39.355 3.672623 6.993933 1.960095 1140 7.2 41.830 3.733614 7.038784 1.974081 890 12.8 158.216 5.063961 6.791221 2.549445 960 13.0 178.428 5.184185 6.866933 2.564949 1050 16.3 227.649 5.427805 6.956545 2.791165 1020 15.8 231.610 5.445055 6.927558 2.760010 1110 16.8 233.835 5.454616 7.012115 2.821379 1060 17.0 203.820 5.317237 6.966024 2.833213 940 16.6 186.508 5.228474 6.845880 2.809403 730 16.0 145.706 4.981591 6.593045 2.772589 1440 10.5 139.988 4.941557 7.272398 2.351375 1240 10.1 123.668 4.817601 7.122867 2.312535 740 12.8 111.255 4.711825 6.606650 2.549445 710 13.3 82.429 4.411937 6.565265 2.587764 360 17.9 227.702 5.428038 5.886104 2.884801 390 17.7 191.751 5.256198 5.966147 2.873565 570 10.9 43.846 3.780683 6.345636 2.388763 570 11.1 53.212 3.974284 6.345636 2.406945 Từ đây chạy phần Regression trong Excel để thiết lập mô hình như là mô hình tuyến tính nhiều lớp đã trình bày ở mục trên. 45
Kết quả ước lượng mô hình phi tuyến đổi về tuyến tính 2 lớp SUMMARY OUTPUT Regression Statistics Multiple R 0.967567 R Square 0.936185 Adjusted R Square 0.932736 Standard Error 0.235045 Observations 40 ANOVA df SS MS F Significance F Regression 2 29.98797 14.99398 271.4024864 7.78065E-23 Residual 37 2.0441130.055246 Total 39 32.03208 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept -5.143280 0.681084-7.551614 0.000000 -6.523287 -3.763274 Ln(N) 0.641785 0.0818587.840245 0.000000 0.475926 0.807645 Ln(H) 2.205407 0.09599122.975155 0.000000 2.010911 2.399903 Mô hình có dạng: ln(M) = -5.143 + 0.642ln(N ) + 2.205ln(H) Với N = 40 R = 0.968 Fr = 271.40 với α<0.00 tb1 = 7.84 tb2 = 22.98 với α<0.00 Từ mô hình này có thể dự báo M thông qua N và H 6.4.2. Lập mô hình phi tuyến nhiều lớp chuyển về tuyến tính trong Statgraphics Plus Trong Statgraphics Plus, việc tính toán mô hình phi tuyến nhiều lớp đơn giản hơn vì không cần tạo thêm các cột đổi biến số, biến số được đổi trực tiếp trong hộp thoại khi thiết lập mô hình. Đầu tiên nhập dữ liệu trong Excel với biến y và các biến xi, mỗi biến một cột dữ liệu 46
Sau đó mở file dữ liệu này trong Statgraphics Plus, vào chương trình chạy hàm nhiều lớp Đổi biến số ngay trong hộp thoại 47
Kết quả chạy hàm phi tuyến nhiều lớp quy về tuyến tính Trong Statgrahics Plus còn cho phép tạo tổ hợp biến ngay trong hộp thoại, ví dụ có thể lập hàm dạng: ln(M) = a + b1.N*H, trong đó N .ln(H) là tổ hợp biến. Trong hộp thoại tạo tổ hợp biến như sau 48
Kết quả có hàm theo quan hệ nhiều biến dưới dạng tổ hợp biến 49
7. ƯỚC LƯỢNG CÁC DẠNG HỒI QUY MỘT BIẾN TRÊN ĐỒ THN Trong thực tế trực quan các mối quan hệ, người ta thường dùng đồ thị để biểu diễn, và để dễ dàng trong việc xem xét các dự báo, Excel hỗ trợ chương trình xác định mô hình hồi quy một biến ngay trên đồ thị. Excel lập sẵn 5 dạng hàm phổ biến trong phần này. Ví dụ: Lập mô hình hồi quy H/D cho rừng trồng Tếch ngay trên đồ thị quan hệ Nhập số liệu: Số liệu về quan hệ H/D A B 1 D(cm) H(m) 2 6,7 3,5 3 6,8 3,6 4 9,5 5,7 5 9,5 6,1 40 31,3 22,0 41 32,0 21,8 Vẽ đồ thị: Tiến hành các bước vẽ đồ thị quan hệ H/D. (N ên vẽ dạng đám mây điểm). Tính toán mô hình quan hệ dựa vào đồ thị: o Kích hoạt đồ thị: Kích chuột trái. o Chọn đám mây điểm trên đồ thị: Kích chuột phải vào đám mây đểm này. o Chọn Add Trendline 50
Chọn mục Type: Ở đây chọn dạng liên hệ thích hợp, có các dạng sau: Linear: y = mx + b Logarithmic: y = clnx + b 2 6 Polynomial: y = b + c1x + c2x + c6x Có thể chọn 1 đến 6 bậc trong ô Order: Xác định số bậc. Power: y = cxb Exponential: y = c.ebx Chọn mục Option: Xác định: Forecast: Foward: Xác định độ dài dự đoán tiếp theo. Backward: Xác định độ dài dự đoán lùi. Set intercept (0): N ếu đánh dấu thì tham số b=0 trong các hàm đường thẳng Display Equation on Chart: Đánh dấu để đưa hàm lên đồ thị. 51
Display R-squared Value on Chart: Đánh dấu nếu muốn tính hệ số tương quan bình phương. Cuối cùng là OK. Kết quả như sau: Quan he H/D rung tech 25.0 20.0 15.0 y = 12.386Ln(x) - 22.023 H (m) 10.0 R2 = 0.8781 5.0 0.0 5.0 10.0 15.0 20.0 25.0 30.0 35.0 40.0 D (cm) 52
Ví dụ khác: Dự báo tỷ lệ che phủ của rừng trong thời gian đến Ví dụ khác: Lượng carbon được lưu trữ trong các kiểu rừng khác nhau được mô phỏng bằng dạng hàm phi tuyến trên đồ thị. Trong đó không cần mã hóa biến số x (kiểu rừng), lúc này sử dụng sơ đồ cột để vẽ và chạy phương trình thích hợp. Lúc này máy tính đã tự động mà hóa các kiểu rừng là 1, 2, 3, 4 Lượng carbon trên và dưới mặt đất ở các kiểu sử dụng đất rừng Các vùng rừng ở Brazil, Cameroon và Indonesia Lượng carbon Các kiểu rừng (tấn/ha) Dưới mặt Trong thực đất vật Rừng nguyên sinh 48 310 Rừng đã khai thác chọn 48 230 Rừng bỏ hoá sau nương rẫy 48 75 Đất N ông Lâm kết hợp 45 50 Cây trồng ngắn ngày 25 5 Đồng cỏ chăn thả gia súc 20 2 53
Lượng C trong các kiểu rừng Rừng nguyên 350 sinh y = -188.62Ln(x) + 318.83 300 2 Rừng đã khai R = 0.9538 n/ha) thác chọn ấ 250 t (t ậ 200 c v ự 150 Rừng bỏ hoá sau 100 nương rẫy Đất Nông Lâm kết hợp 50 Cây trồng ngĐồắnng cỏ chăn thả ngày gia súc Carbon trong th trong Carbon 0 -50 Các kiểu sử dụng rừng 8. SẮP XẾP VÀ VẼ BIỂU ĐỒ PHÂN BỐ TẦN SỐ XUẤT HIỆN THEO CẤP, CỠ, HẠNG Đây là chức năng sắp xếp bảng phân bố tần số theo một nhân tố theo từng cấp, hạng, và vẽ đồ thị phân bố. Trong nghiên cứu xã hội, người ta cần nghiên cứu tần số phân bố số người theo cấp tuổi để biết sự phân bổ con người theo các thế hệ để có chiến lược quản lý nguồn nhân lực. Trong quản lý tài nguyên thiên nhiên, thường cần nghiên cứu sự phân bố cá thể loài theo cấp tuổi, cấp kích thước để biết được quy luật biến đổi cá thể theo thế hệ, theo kích thước, chất lượng, là cơ sở quản lý, bảo tồn và định hướng khai thác sử dụng bền vững. Trong lâm nghiệp thường cần sắp xếp phân bố số cây theo cỡ kính (N /D), số cây theo cỡ chiều cao (N /H), số cây theo cấp thể tích (N /V), số cây theo loài cây theo các tầng rừng, thế hệ. Ví dụ cũng từ số liệu quan sát rừng trồng Tếch 10 tuổi, tiến hành sắp xếp phân bố thực nghiệm N /H và vẽ biểu đồ (cấp H là 2m): N ạp số liệu vào bảng tính theo cột. Vd: A9:A52. Lập một cột giới hạn trên cỡ kính. Vd: cỡ 2m. 54
Bảng tóm tắt dữ liệu Menu Tools/Data Analysis/Histogram/OK. Xuất hiện hộp thoại, xác định: + Input range: Khai báo khối dữ liệu + Bin range: Khai báo khối chứa cự ly tổ (với giá trị lớn nhất của mỗi tổ) + Output range: Khai địa chỉ ô trên trái nơi đưa ra kết quả. + Cumulative percentage: Tính phần trăm tần số tích lũy.(Đánh dấu). + Chart output: Vẽ biểu đồ. (Đánh dấu chọn). + OK. 55
Kết quả sắp xếp tần số cho được một dãy dữ liệu theo cấp và biểu đồ phân bố. N ó phản ảnh cụ thể hơn đặc trưng mẫu và cho thấy hình ảnh của kiểu dạng phân bố theo cấp, thế hệ; từ đó giúp cho việc phân tích quần thể và đưa ra quyết định quản lý, sử dụng bền vững. Ví dụ trong biểu đồ trên, số cây phân hóa khá mạnh theo cấp chiều cao, một số cây sinh trưởng kém ở cấp chiều cao nhỏ 8 – 12m, một số cây vượt tán có cấp H trên 22m; giải pháp đề nghị ở đây là tỉa thưa loại bỏ bớt cây sinh trưởng kém có H 22m để lợi dụng trung gian, lúc này cá thể sẽ có kích thước tập trung trong phạm vi 14 – 22m và có đủ không gian dinh dưỡng để phát triển. Công cụ sắp xếp tần số, tần suất phân bố là một công cụ mạnh và hữu ích trong lâm nghiệp, vì thông thường từ số liệu đo đếm, điều tra, cần phải sắp xếp theo tổ, nhóm, cấp. Ví dụ sắp xếp N /D, N /H, số cây theo cấp tuổi rừng trồng, 9. KIỂM TRA THUẦN NHẤT K MẪU QUAN SÁT ĐỨT QUẢNG - ỨNG DỤNG: KIỂM TRA SỰ THUẦN NHẤT CỦA CÁC DÃY PHÂN BỐ N/D, N/H Ở CÁC Ô TIÊU CHUẨN Trong thực tế, để điều tra đánh giá, nghiên cứu một đối tượng rừng, một trạng thái; chúng ta thường rút mẫu theo ô tiêu chuNn, sau đó gộp chung để tính toán. Tuy nhiên có khả năng một số ô mẫu không nằm trong một trạng thái đó, do đó nếu gộp chung để tính toán trung bình, mô phỏng cấu trúc chung sẽ gặp sai số rất lớn và không phản ảnh đúng đối tượng, trạng thái nghiên cứu. Do vậy cần có sự kiểm tra sự thuần nhất của các số liệu này ở các ô mẫu trước khi gộp chung để tính toán như một tổng thể. Trong trường hợp này cần ứng dụng tiêu chuNn thống kê χ2 để kiểm tra K mẫu quan sát đứt quảng, cụ thể là ứng dụng để kiểm tra các dãy phân bố N /D ở các ô mẫu để đánh giá chúng có cùng một tổng thể, một trạng thái hay không. Trong đó: Dãy phân bố N của các ô được sắp xếp lần lượt i = 1,2, k (k ô) và được phân bố theo các cỡ kính được sắp xếp theo thứ tự j = 1, 2, m (m cỡ kính) 56
Phân bố N của các ô i mẫu theo các cỡ kính j Tần số fij (i=1 k) (N/ha) Cỡ D1.3 (j= 1 m) ô 1 ô 2 ô 3 ô 4 = k Tổng fj 8 12 11 9 8 40 f1 12 134 125 150 145 554 f2 16 97 80 97 88 362 20 56 56 41 54 207 24 45 34 31 31 141 28 33 31 25 31 120 32 21 21 21 21 84 36 15 11 15 15 56 fj 40 11 11 11 9 42 44 9 7 15 5 36 48 664622 52 333110 56 1111 4 fm Tổng 443 397 423 415 1678 ni n1 n2 ni nk n Gọi fij là tần số (số cây) theo ô i và cấp kính j; fi là tổng tần số của ô i và fj là tổng tần số cấp kính j. Giả thuyết Ho: F1 = F2 = = Fk (Cho mọi i và j). Hay nói khác là các dãy phân bố N /D là thuần nhất ở các ô mẫu khác nhau, hay cung trạng thái rừng; ngược lại chúng ở các trạng thái khác nhau và không thuần nhất. Kiểm tra sự thuần nhất bằng tiêu chuNn χ2 như sau: k m − 2 χ 2 = ( fij fj.ni / n) ∑∑ i==11j fj.ni / n 2 2 2 So sánh với χ (0.05; df = (m-1)(k-1). N ếu χ t Chấp nhận giải thuyết Ho, có nghĩa là các ô mẫu thu thập nằm trong cùng một trạng thái, hệ thống và có thể gộp chung để ước lượng đặc trưng mẫu, mô phỏng phân bố N /N chung 2 2 Trong ví dụ trên χ t = 20.42 < χ (0.05; df=36) = 51.00. Do đó có thể xem các dãy N /D của 4 ô mẫu là thuần nhất hoặc nằm trong cùng một trạng thái, có thể gộp để mô phỏng N /D chung. 10. MÔ HÌNH HOÁ QUY LUẬT PHÂN BỐ Trong nghiên cứu các lâm phần, người ta thường khái quát quy luật phân bố số cây theo cỡ kính, chiều cao để làm cơ sở cho việc điều tra rừng và xác định các giải pháp lâm sinh thích hợp để dẫn dắt rừng. Hoặc nghiên cứu phân bố số cá thể theo tuổi, thê hệ; phân bố số loài theo tầng thứ, phân bố vi sinh vật đất theo các lớp đất, để hiểu rõ quy luật sinh học, sinh thái học làm cơ sở quản lý tài nguyên thiên nhiên bền vững. 57
10.1. Mô hình hoá phân bố giảm theo hàm Mayer β Hàm Mayer có dạng: y = α.e- .x. Kiểu dạng này thích hợp cho mô tả mô phỏng phân bố số cây theo cỡ kính (N /D) rừng chặt chọn có dạng giảm, hoặc mô phỏng sự giảm của số loài theo tầng, theo cỡ kính, .,,,,, Trong Excel có chương trình lập sẵn tính quan hệ tuyến tính, vì vậy để xác định các tham số cần tuyến tính hóa. β Ví dụ mô phỏng phân bố N /D theo dạng Mayer: N = α.e- .D Tuyến tính hoá: Ln(N ) = Lnα - βD. Đặt Y = Ln(N ) ; A = Ln(α) ; B = -β; X = D Có hàm tuyến tính: Y = A + BX Trình tự tính toán trong Excel: Nhập số liệu: o Cột A là giá trị giữa cỡ kính (D). o Cột B là tần số thực nghiệm (N ). o Cột C: Ln(N ). Đầu tiên tính cho ô đầu tiên (C2): =Ln(b2), sau đó copy xuống cho các ô còn lại. Bảng dữ liệu đổi biến số để ước lượng hàm Mayer A B C 1 C D1,3 (cm) N (c/ha) Ln(N) 2 15 125 4,828314 3 25 89 4,488636 4 35 56 4,025352 5 45 31 3,433987 6 55 19 2,944439 7 65 8 2,079442 8 75 10 2,302585 9 85 5 1,609438 10 95 3 1,098612 11 105 2 0,693147 12 115 1 0 Ước lượng hàm tuyến tính 1 lớp: Menu Tools/Analysis/Regression/OK- Hộp thoại: o Input X Range: Khai khối dữ kiệu X. (A2:A12) o Input Y range: Khai khối dữ liệu Y. (C2:C12) o Output range: N hập địa chỉ ô trên ra nơi ra kết quả (E1). o OK. 58
Kết quả ước lượng hàm tuyến tính E F G H SUMMARY OUTPUT Regression Statistics Multiple R 0,993975878 R Square 0,987988046 Adjusted R Square 0,986653385 Standard Error 0,183611852 Observations 11 AN OVA df SS MS F Significance F Regression 1 24,95640165 24,95640165 740,2536312 5,9318E-10 Residual 9 0,303419808 0,033713312 Total 10 25,25982146 Coefficients Standard Error t Stat P-value Lower 95% Upper 95% Intercept 5,596409498 0,126545736 44,2244021 7,72246E-12 5,310142937 5,882676058 X Variable 1 -0,047631542 0,00175067 -27,20760245 5,9318E-10 -0,051591836 -0,043671248 a= 5,596 Alpha= 269,457 b=-0,048 Beta= 0,048 o Quy về tham số nguyên thuỷ của Mayer: Tham số α = ea = e5.596 = 269.457; β = -(-0.048) = 0.048. o Kết quả phương trình: N = 269.457.exp(-0.048.D). o Kiểm tra sự phù hợp của phương trình bằng tiêu chuNn χ2: Công thức tính χ2 = (N lt – N t)2/N lt + Cột E: Giá trị χ2: Tại ô E2: =(D2-B2)^2/D2. Copy cho các ô dưới. Chú ý các ô có N lt <5 cần gộp lại. Tổng cột E có χ2 = 4.00. + Tra χ2 bảng với α=0.05 và K= l-r-1= 9-2-1=6: =Chiinv(0.05;6)=12,59 + χ2 tính < χ2 bảng. Kl: Hàm Mayer mô phỏng tốt cấu trúc N -D thực nghiệm. 59
Kết quả kiểm tra sự phù hợp của hàm Mayer bằng tiêu chuẩn χ2 A B C D E 1 Cỡ D1,3 (cm) N (c/ha) Ln(N) Nlt (c/ha) X2 2 15 125 4,828314 131 0,29 3 25 89 4,488636 81 0,76 4 35 56 4,025352 50 0,67 5 45 31 3,433987 31 0,00 6 55 19 2,944439 19 0,00 7 65 8 2,079442 12 1,28 8 75 10 2,302585 7 0,94 9 85 5 1,609438 5 0,06 10 95 3 1,098612 3 0.00 11 105 2 0,693147 2 12 115 1 0 1 13 Tổng 349 342 4,00 Phân bố Mayer còn có thể sử dụng để xem xét phân bố số lượng cá thể của một loài theo các giai đoạn tuổi. Kiểu dạng cấu trúc số cây theo tuổi (N /A) rừng nhiệt đới nhìn chung có dạng giảm, tuổi càng cao thì số cá thể càng ít, bảo đảm cho sự kế tục các thế hệ cây rừng và ổn định quần thể thực vật rừng theo thời gian. Với đặc trưng cấu trúc dạng giảm theo thế hệ, tuổi như vậy nên phương thức khai thác chính của rừng tự nhiên là chặt chọn theo cấp kính. Khai thác lớp cây thành thục và nuôi dưỡng rừng trong một luân kỳ để rừng phục hồi trạng thái ban đầu và tiếp tục khai thác lần 2. Việc xác định được cấu trúc N /A của lâm phần và N /A theo từng loài/nhóm loài chính sẽ rất thuận tiện cho việc xác định kỹ thuật lâm sinh như tuổi, đường kính khai thác, luân kỳ, Tuy nhiên trong thực tế việc xác định A là rất khó khăn, do đó thông thường được thay bằng đường kính, và kiểu cấu trúc phổ biến được nghiên cứu là số cây theo cỡ kính N /D để phục vụ cho điều tra, xác định chỉ tiêu kỹ thuật nuôi dưỡng, khai thác rừng. Mô hình hoá cấu trúc N /A thường được biểu diễn tốt bằng hàm Mayer với hệ số tương quan R2 rất cao. 60
90 80 -0.2862A 70 N = 102.71e R2 = 0.9843 60 50 N/ha 40 30 20 10 0 5 15 25 35 45 55 65 75 85 95 105 115 125 135 145 155 Cấp A (năm) Ví dụ mô hình cấu trúc N/A rừng hỗn loài khác tuổi theo hàm Mayer Rừng mưa nhiệt đới có khu hệ thực vật đa dạng với thành loài phong phú, phân bố ở nhiều thế hệ, cấp tuổi khác nhau. Trên 01 ha rừng có thể phát hiện trên 60 loài cây thân gỗ, ngoài ra rừng mưa rất phong phú các loài dây leo, song mây, rêu, dương xỉ, phong lan. Các loài cây nói chung là ưa sáng, cố gắng vươn lên cạnh tranh ánh sáng, tuy vậy cũng có loài chịu được ở tầng dưới và hình thành sự phân bố loài theo tầng, theo cấp tuổi, cấp kính khá rõ rệt. Trong thực tế việc xác định tuổi cây rừng là khó khăn, do đó thường nghiên cứu cấu trúc số loài theo cấp kính (N loài/D) 25 y = 30.511e-0.3491x 20 R2 = 0.987 15 N loài/ha Expon. (N loài/ha) N loài /ha 10 5 0 15 25 35 45 55 65 75 85 95 105 Cấp kính D1.3 (cm) Cấu trúc số loài theo cấp kính rừng nửa rụng lá ưu hợp bằng lăng – căm xe ở Dăk Lăk Cấu trúc N loài/D của kiểu rừng nửa rụng ưu hợp bằng lăng –căm xe ở Dăk Lak có kiểu dạng phân bố là dạng giảm liên tục, có nghĩa khi lên tầng cao, cấp kính lớn, số loài chiếm tỷ lệ thấp, đây là các loài ưu thế sinh thái. Với kiểu rừng này, số loài trên ha là 70 loài thân gỗ, và với cỡ kính thành thục từ 55cm trở lên thì số loài còn khoảng 5 loài. Kiểu dạng cấu trúc này cũng có thể mô phỏng tốt bằng dạng hàm Mayer. Mô hình Mayer ngoài việc đổi biến số và tính toán, trong Excel co thể ước lượng nhanh ngay trên đồ thị 61
Mo hinh quan he N/D theo y = 269.4eMayer-0.04x 140 R² = 0.988 120 100 80 N (c/ha) 60 Expon. (N (c/ha)) 40 20 0 0 50 100 150 10.2. Mô phỏng phân bố thực nghiệm theo phân bố khoảng cách- hình học: i) Dạng phân bố khoảng cách: ϒ x=0 P(x) = (1-α).(1-ϒ).αx-1 x>=1 Với x là mã số các cỡ kính từ nhỏ đến lớn 0,1,2,3 Khi: ϒ (1-ϒ)(1-α) Phân bố giảm. Ước lượng 2 tham số bằng phương pháp cực đại hợp lý: ϒ = N0/N r ∑ Ni α − i=1 = 1 r ∑ Ni. xi i=1 Trình tự tính trong Excel: Vd: Mô phỏng phân bố N/D có dạng 1 đỉnh: Cột A: Mã số x Cột B: Giá trị giữa cỡ D. Cột C: Số cây theo cỡ kính. Tổng tại ô C13=sum(c2:c12) Cột D: N i.xi. Tại ô D2:=A2*C2; copy cho các ô dưới. Tổng tại ô D13 Tính 2 tham số: ϒ = C2/Sum(c2:c12) α = 1- Sum(c3:c12)/sum(d2:d12) Cột E:Xác suất từng cỡ kính P(xi): Ô E2: Pxo=ϒ; ô E3: Px1 = (1-ϒ)(1-α)α^(a3-1); copy cho các ô dưới. Cột F: Tần số lý thuyết: N lti: Ô F2: =$C$13*E2; copy cho các ô dưới 62
Cột G: Tính χ2 từng cỡ và tổng. Ô G2: = (f2-c2)^2/f2, copy cho các ô dưới, cộng tổng. Ô G14: Tra χ2 bảng (α=0,05 ; K = 8-2-1=5): =Chiinv(0.05,5) Kết quả χ2 tính < χ2 bảng . Kl: Phân bố Khoảng cách mô phỏng tốt phân bố thực nghiệm N /D. Kết quả mô phỏng phân bố N/D theo phân bố khoảng cách A B C D E F G 1 x Cỡ D1,3 (cm) N (c/ha) Nixi Px Nlt (c/ha) X2 2 0 15 70 0 0,212121 70 0,00 3 1 25 125 125 0,345444 114 1,06 4 2 35 56 112 0,193985 64 1,00 5 3 45 31 93 0,108932 36 0,68 6 4 55 19 76 0,061171 20 0,07 7 5 65 8 40 0,034351 11 0,98 8 6 75 10 60 0,01929 6 2,08 9 7 85 5 35 0,010832 4 1,82 10 8 95 3 24 0,006083 2 11 9 105 2 18 0,003416 1 12 10 115 1 10 0,001918 1 13 Tổng 330 593 0,997543 329 7,70 14 Gamma= 0,212121 X2 bảng= 11,07 15 Alpha= 0,561551 K=8-2-1=5 ii) Phân bố hình học: P(x) = αx. (1-α) x=0,1,2,3 r Ước lượng α bằng phương pháp cực đại hợp lý: x α = x + 1 1 r x = ∑ Ni. xi N i=1 Phân bố hình học dùng mô tả các phân bố thực nghiệm dạng giảm Trình tự tính trong Excel: Vd: Mô phỏng phân bố N/D có dạng giảm: Cột A: Mã số x Cột B: Giá trị giữa cỡ D. Cột C: Số cây theo cỡ kính. Tổng tại ô C13=sum(c2:c12) Cột D: N i.xi. Tại ô D2:=A2*C2; copy cho các ô dưới. Tổng tại ô D13 Tính tham số α: x = D13/c13 α = x/(x+1) Cột E:Xác suất từng cỡ kính P(xi): Ô E2: Pxo = (1-α)α^a3; copy cho các ô dưới. Cột F: Tần số lý thuyết: N lti: Ô F2: =$C$13*E2; copy cho các ô dưới 63
Cột G: Tính χ2 từng cỡ và tổng. Ô G2: = (f2-c2)^2/f2, copy cho các ô dưới, cộng tổng. Ô G14: Tra χ2 bảng (α=0,05 ; K = 8-1-1=6): =Chiinv(0.05,6) Kết quả χ2 tính 3: Phân bố lệch phải. Ước lượng 2 tham số α và λ: 64
Tham số α thường được thăm dò trong một khoảng thích hợp dựa trên các đặc trưng mẫu, cho chạy α để tính λ. Sau đó kiểm tra sự phù hợp của phân bố lý thuyết bằng tiêu chuNn χ2, chọn cặp tham số có χ2 bé nhất và nhỏ thua χ2 bảng. Tham số λ được ước lượng bằng phương pháp cực đại hợp lý: r α λ = N / ∑ N i.(xi - xmin) i=1 N : Tổng dung lượng quan sát. N i: Tần số tổ i. Tính xác xuất cho từng tổ: α + Tổ 1: P(x1)=F(x1) = 1 - exp(-λ(x1 + A - xmin) ) α α + Tổ 2: P(x2)=F(x2) - F(x1) = exp(-λ(x1 + A - xmin) ) - exp(-λ(x2 + A - xmin) ) α α + Tổ 3: P(x3)=F(x3) - F(x2) = exp(-λ(x2 + A - xmin) ) - exp(-λ(x3 + A - xmin) ) α α + Tổ r: P(xr)=F(xr) - F(xr-1) = exp(-λ(xr-1 + A - xmin) ) - exp(-λ(xr + A - xmin) ) Với A: giá trị 1/2 cự ly tổ. * Tần số lý thuyết Nlt cho từng tổ: N lti = N .P(xi). * Kiểm tra sự phù hợp bằng tiêu chuẩn χ2. Kết quả mô phỏng phân bố N/D theo hàm Weibull A B C D E F G H 1 Cỡ D1,3 N (c/ha) Alpha N(x-xmin)^alpha Lamda P(x) Nlt (c/ha) X2 (cm) 2 15 125 1 625,0 0,047710 0,379420 132 0,42 3 25 89 1335,0 0,235460 82 0,57 4 35 56 1400,0 0,146121 51 0,49 5 45 31 1085,0 0,090680 32 0,01 6 55 19 855,0 0,056274 20 0,02 7 65 8 440,0 0,034922 12 1,44 8 75 10 650,0 0,021672 8 0,78 9 85 5 375,0 0,013449 5 0,02 10 95 3 255,0 0,008346 3 0,00 11 105 2 190,0 0,005179 2 12 115 1 105,0 0,003214 1 13 Tổng 349 7315,0 1,0 347 3,76 14 X2 bảng= 14,07 15 K=9-1-1=7 Cột A: Giá trị giữa cỡ kính 15, 25, 115 với cự ly cỡ 10 cm. Cột B: Số cây từng cỡ N i. Ô B13: tổng N = Sum(b2:b12) Ô C2: Đưa tham số α thăm dò. α Cột D: Giá trị: N i(xi - 10) . Với xmin=10. Tính tại ô d2: =B2*(A2-10)^$C$2, sau đó copy cho các ô dưới. Ô D13 tính tổng =Sum(d2:d12). 65
Ô E2: Tính tham số λ: = B13/Sum(d2:d12). Cột F: Tính xác suất P(x) từng tổ: Tính theo công thức địa chỉ ô. Cột G: N lt từng tổ: Ô G2: =$B$13*F2, sau đó copy xuống và tính tổng. Cột H: Tính χ2 từng tổ và tổng χ2=3.76 Ô H14: Tra χ2(0.05,7) =Chiinv(0.05,7)=14.07 KL: Phân bố Weibull mô phỏng tốt phân bố thực nghiệm. Chú ý: Để chọn được α tối ưu, lần lượt thay giá trị ở ô C2, bảng tính sẽ tự động tính lại, sau đó chọn một α với χ2 bé nhất. 11. PHƯƠNG PHÁP NGHIÊN CỨU CẤU TRÚC MẶT BẰNG RỪNG (Bảo Huy, 1993) Cấu trúc mặt bằng thể hiện sự phân bố và sử dụng không gian dinh dưỡng trên mặt đất rừng, kiểu dạng phân bố thường được chia thành ba kiểu: ngẫu nhiên, cụm hoặc đều; trong đó kiểu phân bố cụm thể hiện rừng chưa lợi dụng tốt không gian trên mặt đất. Cho nên chặt nuôi dưỡng phải bảo đảm sao cho phân bố cây trên mặt đất rừng đồng đều hơn, tạo ra phân bố cách đều hoặc ngẫu nhiên, tránh để rừng ở trạng thái phân bố cụm, ảnh hưởng xấu đến quá trình tái sinh, sinh trưởng và phục hồi rừng. Tóm lại nghiên cứu phân bố cây trên mặt đất nhằm phục vụ cho việc đề xuất giải pháp kỹ thuật trong chặt nuôi dưỡng, tỉa thưa, khai thác để điều tiết mật độ trên bề mặt đất rừng. Phương pháp áp dụng là phân bố khoảng cách từ một cây chọn ngẫu nhiên đến cây gần nhất, với dung lượng mẫu n > 30 (số khoảng cách đo) tính theo tiêu chuNn U _ ( x λ − 0 , 5 ) × n U = 0 , 26136 Trong đó: x : Khoảng cách bình quân giữa các cây (Lấy tổng khoảng cách chia cho số lần đo là n) λ : Số cây trên một m2 diện tích đất rừng N ếu : U ≤ 1 , 96 cây rừng phân bố ngẫu nhiên trên mặt đất rừng U > 1 , 96 cây rừng phân bố cách đều trên mặt đất rừng U < − 1 , 96 cây rừng phân bố cụm trên mặt đất rừng Ví dụ: Đánh giá phân bố cây trên mặt đất rừng: Với mẫu quan sát n = 285 (số khoảng cách đo) trên 5 ô điều tra nên dùng tiêu chuNn U của Klark và Evans để đánh giá phân bố trên bề mặt đất rừng : Kết quả tính toán theo tiêu chuNn U như sau : Tham số : λ = 0,095 (Tổng số cây điều tra trong các ô / tổng diện tích các ô tiêu chuNn); với: n = 285; cự ly bình quân giữa 285 cây quan sát ngẫu nhiên là x = 2,158 m; Tính toán được giá trị : U = 10,667 Kết luận: Cây phân bố trên mặt bằng của lâm phần là phân bố cách đều. Tuy nhiên với đánh giá trên mới chỉ xem xét phân bố trên mặt bằng của tất cả các cây ở các thế hệ, cấp kính khác nhau; điều này chưa thể làm cơ sở để điều tiết cấu trúc mặt bằng. Cự ly tối ưu giữa các cây cần được thiết lập cho từng thế hệ hoặc cấp kính. Do vậy trước khi đi vào xây dựng cấu trúc mặt bằng, cần thiết lập mô hình N /D định hướng (chuNn, ổn định) để làm cơ sở 66
xác định mật độ tối ưu cho từng cấp kính và chung lâm phần. Sau đó tìm khoảng cách tối ưu giữa các cây theo từng cấp kính. Phương pháp tìm x: cự ly bình quân tối ưu để cây rừng có phân bố đồng đều trên mặt đất rừng chung và theo cấp kính. Từ công thức tính U, giả định rừng có phân bố đều thì U=2, và rừng đạt mật độ chuNn N opt (số cây tối ưu/ha tính được từ mô hình N /D định hướng đã xây dựng), suy ra cự ly giữa cây rừng tối ưu: ⎛ 2 × 0 , 26136 ⎞ ⎜ + 0 , 5 ⎟ ⎜ Nopt ⎟ x = ⎝ ⎠ λ Với λ = N opt/10.000 Ví dụ: Với N opt = 889 cây/ha (số cây mẫu từ phân bố N /D đã xây dựng) Suy ra : λ = N opt / 10.000 = 0.0889 Từ đây tính được cự ly bình quân tối ưu giữa 2 cây gần nhất trong lâm phần : x = 1.73m Để đạt được hiệu quả cao hơn trong điều tiết cấu trúc mặt bằng, cần điều tiết cự ly này theo từng cỡ kính có nghĩa là nếu trong một cỡ kính đã đạt được số cây tối ưu N opti nào đó theo cấu trúc N /D, nhưng phân bố chưa đều thì rừng cũng có năng suất thấp. Với lý do đó cần tiếp tục xác định cự ly bình quân tối ưu cho từng cỡ kính (xi), phương pháp xác định như trên, nhưng chỉ khác là mật độ tối ưu ở đây được tính theo từng cỡ kính (N opti) theo mô hình N /D định hướng, suy ra tham số λi = N opti/10.000. Từ đây ta tính được cự ly bình quân tối ưu (xi) cho từng cỡ kính như ví dụ ở bảng sau Mô hình cự ly bình quân tối ưu giữa các cây rừng theo cỡ kính Cự ly bình quân Cấp kính D1.3 tối ưu (cm) Nopt (c/ha) λ Xi (m) U 15 377 0.037667 2.72 2 20 208 0.020814 3.72 2 25 115 0.011502 5.12 2 30 64 0.006356 7.09 2 35 35 0.003512 9.93 2 40 19 0.001941 14.04 2 45 11 0.001072 20.14 2 50 6 0.000593 29.36 2 55 3 0.000327 43.59 2 60 2 0.000181 66.05 2 65 1 0.000100 102.27 2 Tổng 889 Qua bảng trên cho thấy đối với cấp kính càng lớn thì cự ly tối ưu để rừng có phân bố đều giữa 2 cây càng lớn, trong thực tế để áp dụng cần đo khoảng cách từ một cây đến cây gần nhất nằm trong cùng một cấp kính từ đó có thể có giải pháp lựa chọn trong tỉa thưa, nuôi dưỡng, khai 67
thác chọn rừng, với định hướng đưa rừng về N opti và có cự ly bảo đảm cây rừng có phân bố đều, lợi dụng tốt nhất không gian dinh dưỡng. 12. PHÂN TÍCH, PHÁT HIỆN CÁC NGUYÊN NHÂN, NHÂN TỐ ĐNNH TÍNH, ĐNNH LƯỢNG ẢNH HƯỞNG ĐẾN BIẾN PHỤ THUỘC (HẬU QUẢ, VẤN ĐỀ) (Bảo Huy, 2006) Trong thực thế chúng ta cần phát hiện các nhân tố chủ đạo ảnh hưởng đến một vấn đề, hậu quả. Ví dụ các nhân tố nào ảnh hưởng đến mức độ xung yếu của lưu vực, từ đây giúp cho việc quy hoạch lưu vực; hoặc tìm kiếm các nhân tố chủ đạo ảnh hưởng đến sinh trưởng sản lượng của một loài cây trồng, làm cơ sở quy hoạch, chọn vùng trồng thích hợp, Mô hình hồi quy đa biến dạng tuyến tính hoặc phi tuyến hoặc tổ hợp biến sẽ là một công cụ mạnh giúp cho việc phát hiện các nhân tố ảnh hưởng rõ rệt cả về tự nhiên lẫn nhân tố xã hội. Tuy nhiên các nhân tố tác động, ảnh hưởng có thể là nhân tố định lượng được như: lượng mưa, độ dốc, độ cao, hoặc là định tính như vị trí địa hình, mức độ tác động, mức độ lửa rừng, nhân tác, Trong trường hợp nhân tố là định tính thì cần phải mã hóa để có thể thiết lập mô hình hồi quy. Có hai phương án mã hóa: i. Mã hóa hệ thống: Các mức độ, cấp của của nhân tố được mã hóa hệ thống 1, 2, 3, Ví dụ mã hóa nhân tố vị trí địa hình: Bằng = 1; chân = 2; sườn = 3 và đỉnh = 4 ii. Mã hóa theo chiều biến thiên: Các mức độ, cấp được mã hóa theo chiều biến thiên của nhân tố phụ thuộc. Săp xếp nhân tố phụ thuộc theo một chiều nào đó (tăng hoặc giảm), sau đó các nhân tố được mã hóa theo cùng một vector như vậy. Ví dụ: Mã hóa biến số theo chiều biến thiên sinh trưởng Sinh trưởng 10 15 20 25 30 cây rừng H (m) Vị trí địa hình Đỉnh Đỉnh Chân Sườn Bằng Mã số vị trí 1 2 3 4 5 Và việc mã hóa khác nhau sẽ dẫn đến việc lựa chọn mô hình hồi quy có mức độ phức tạp khác nhau Hai phương án mã hóa biến định tính khác nhau sẽ dẫn đến việc chọn lựa mô hình hồi quy khác nhau Kiểu dạng hàm mô phỏng Phương pháp mã hóa biến định tính Hệ thống Theo chiều biến thiên, vector của biến phụ thuộc (Mã hóa đơn giản) (Mã hóa phức tạp) Tuyến tính hoặc phi tuyến Không thực hiện được hoặc nhưng theo 1 chiều (tăng hoặc sai quy luật giảm) Thực hiện được (Xây dựng hàm đơn giản) Phi tuyến dạng tăng giảm phức Thực hiện được nhưng không tạp, hoặc tổ hợp biến cần thiết Thực hiện được (Xây dựng hàm phức tạp) 68
Ví dụ nghiên cứu phát hiện các nhân tố sinh thái, nhân tác ảnh hưởng đến sự thay đổi mật độ tái sinh rừng khộp thông qua mã hóa và thiết lập mô hình hồi quy đa biến: Cách tiến hành bao gồm: • Thu thập dữ liệu về biến số phụ thuộc y là mật độ tái sinh (N ts), cùng với nó là các nhân tố sinh thái, nhân tác ảnh hưởng (có thể định tính hay định lượng) • Phân tích hồi quy đa biến bao gồm: • Mã hóa các biến số sinh thái, nhân tác theo kiểu hệ thống và lâp cơ sở dữ liệu trong Excel • Thiết lập các mô hình đa biến với nhiều trường hợp: Hàm với các biến đơn độc lập, hoặc tổ hợp biến, hoặc đổi biến số. Mô hình bảo đảm độ tin cậy của các nhân tố ảnh hưởng với xác suất P<0.05 hoặc 0.10. Các mô hình này được xử lý trong các phần mềm thống kê chuyên nghiệp như SPSS hoặc Statgraphic. • Phân tích kết quả mô hình hồi quy đa biến để đánh giá chiều hướng tác động của các biến số sinh thái, nhân tác đến tài nguyên, loài làm cơ sở quy hoạch, phối trí không gian cảnh quan. Công việc này có thể tiến hành có hiệu quả thông qua chồng ghép các bản đồ chuyên đề trong hệ thống GIS. Bảng mã hoá các nhân tố liên quan đến Nts rừng khộp Phân cấp và mã hoá các biến số theo cấp Nhân tố Ký hiệu Cấp 1 = 1 Cấp 2 = 2 Cấp 3 = 3 Độ che phủ thực bì (%) Cphu tbi Không phân cấp, lấy theo đo đếm Vị trí địa hình Vi tri Đỉnh Sườn Chân Độ dốc (Độ) Do doc Không phân cấp, lấy theo đo đếm Độ cao (m) Do cao Không phân cấp, lấy theo đo đếm Độ dày đất (Cm) Do day dat Không phân cấp, lấy theo đo đếm Kết von (%) Ket von Không phân cấp, lấy theo đo đếm Đá nổi (%) Da noi Không phân cấp, lấy theo đo đếm pH đất pH Không phân cấp, lấy theo đo đếm Lượng mưa (mm) Luong mua Không phân cấp, lấy theo đo đếm Khai thác Muc do khai thac Sau nương rẫy Chặt chọn Không có Lửa rừng Muc do lua rung Hàng năm Thỉnh thoảng Không có Các nhân tố sinh thái, nhân tác được đưa vào nghiên cứu ảnh hưởng đến chỉ tiêu N ts: Độ che phủ của thực bì (%), Vị trí địa hình, độ dốc (độ), độ cao vo với mặt biển (m), độ dày đất (cm), kết von (%), đá nổi (%), pH đất, lượng mưa (mm), mức độ khai thác, mức độ lửa rừng. Các nhân tố này được kiểm tra có hay không quan hệ N ts bằng mô hình hồi quy đa biến. Giữa các nhân tố sinh thái, nhân tác có sự ảnh hưởng qua lại rất phức tạp và chúng cũng có ảnh hưởng tổng hợp đến các nhân tố N ts, do đó khi kiểm tra mối quan hệ ở mô hình hồi quy đa biến, chấp nhận mức sai là <10% (P < 0.10). 69
Biểu tổng hợp mã hóa các nhân tố và Nts rừng khộp Nts Cphu Vi Do Do Do Ket Da pH Luong Muc do Muc do tbi tri doc cao day von noi mua khai Lua dat thac rung 567 15 3 7 222 20 1 1 7 1231 1 2 700 5 3 4 230 20 1 1 7 1231 2 2 1133 5 3 12 238 20 1 15 6.8 1231 2 2 1100 12 3 7 244 7 10 20 7 1231 2 2 600 10 3 3 258 20 10 30 6.6 1231 3 3 3267 10 3 1 214 20 1 1 6.8 1231 2 2 3900 10 2 12 232 7 1 25 6.8 1231 2 2 300 55 3 1 233 12 1 30 6.4 1500 3 2 1 75 3 1 236 12 20 20 6.4 1500 3 2 1 5 1 19 235 12 10 40 7 1500 3 3 33 60 3 1 226 13 30 60 6.6 1500 3 3 233 65 2 13 234 14 40 35 6.4 1500 3 1 33 80 3 14 228 15 30 15 6.2 1500 3 1 433 40 3 1 215 27 10 1 6.2 1500 3 3 967 55 3 1 215 12 30 30 6.4 1500 3 2 1500 45 3 1 216 10 1 15 6.6 1500 3 2 200 60 3 1 213 7 30 20 6.6 1500 3 2 600 75 3 1 236 17 1 1 6.6 1500 3 2 933 65 3 1 192 8 5 25 6.6 1500 3 2 Từ file dữ liệu mã hóa trong Excel, tiến hành nhập vào Statgraphics Plus để phát hiện các nhân tố ảnh hưởng và xây dựng mô hình hồi quy dự báo N ts Dữ liệu được nhập vào Statgraphics Plus như sau: File/Open/Open Data file Chọn thư mục và kiểu file Excel để mở file trong Statgraphics Plus. Cơ sở dữ liệu từ Excel được nhập vào trong Statgraphics Plus
Trong Statgraphics chạy chương trình hồi quy đa biến: Relative/Multiple Regression Sau đó trong hộp thoại biến số, có thể đổi biến số phụ thuộc, độc lập với nhiều dạng: exp, log, mũ, căn bậc 2; hoặc tổ hợp các biến số độc lập có liên quan dạng tích, thương, hiệu, tổng, Hàm được lựa chọn phải thỏa mãn các điều kiện: • Biến độc lập hoặc tổ hợp biến phải tồn tại ở mức P 0.5 Đổi biến số, tổ hợp biến, để thiết lập mô hình hồi quy đa biến trong Statgraphics Plus 71
Kết quả chọn lựa mô hình hồi quy đa biến và phát hiện nhân tố ảnh hưởng đến tái sinh Nts = 5425.56 - 2.97094*Luong mua - 241.31*log(Ket von) R = 0.628 với các P của các biến số độc lập < 0.1 Với việc thử nghiệm với nhiều nhân tố ảnh hưởng, kết quả cho thấy mật độ tái sinh cây họ dầu giảm khi ở vùng có lượng mưa tăng, có nghĩa có nhiều loài cây thường xanh sẽ xen vào trong quần thể, lúc này rừng chuyển dần sang dạng chuyển tiếp; và kết von gia tăng (liên quan đến lửa rừng, xói mòn, độ chua tăng) làm khả năng tái sinh cây họ dầu suy giảm. Kết quả này sẽ hỗ trợ cho giải pháp lâm sinh xúc tiến tái sinh rừng khộp nghèo kiệt. Một ví dụ khác về nghiên cứu phát hiện các nhân tố chủ đạo ảnh hưởng đến mức độ xói mòn đất và dòng chảy mặt trong một lưu vực ở Vườn quốc gia Bi Đúp N úi Bà tỉnh Lâm Đồng. Trên thực địa thu nhập nhân tố phụ thuộc y là xói mòn, dòng chảy mặt và các nhân tố ảnh hưởng như thảm thực vật rừng, đất đai, địa hình, lương mưa, nhân tác. Sau đó mã hóa các nhân tố định tính theo phương pháp hệ thống. 72
Mẫu phiếu nghiên cứu các nhân tố tác động đến môi trường rừng (Xói mòn đất, dòng chảy trong lưu vực) Điểm khảo sát: Lô: Địa điểm: Tọa độ UTM: X: Y: Ngày khảo sát: Người khảo sát: Các nhân tố Giá trị, hoặc mô tả Giải thích Nhân tố phụ thuộc, bị tác Mã hóa từ 1 – 5: động (y) 1: An toàn - Xói mòn đất 2: Ít nguy cơ - Dòng chảy mặt 3: Nguy cơ trung bình 4: Nguy cơ 5: Nguy cơ cao Các nhân tố ảnh hưởng (xi) 1. Nhóm nhân tố thảm thực vật - Kiểu rừng TX: 1, HG: 2; Thông: 3; Le tre: 4 - Trạng thái Giàu (TT): 1; TB (TN): 2; Nghèo (Sào): 3, Non: 4; Tcỏ: 5 - Ưu hợp Tên 2-3 loài cây gỗ ưu thế. Mã số ngẫu nhiên: 1,2,3,4, - Độ tàn che (1/10) - Tổng G (m2/ha) Dùng thước Bitterlich - Cấu trúc tầng tán Số tầng rừng (1- 5 tầng) - Mức độ đồng đều của cây 1: Đồng đều rừng trên mặt đất 2: Ngẫu nhiên 3: Cụm - Loài le tre Mã số ngẫu nhiên - % che phủ của le tre - Loài thảm thực bì Tên 1-2 loài chính Mã số ngẫu nhiên - % che phủ của thực bì 2. Nhóm nhân tố địa hình - Độ cao so với mặt biển (m) Dùng GPS - Vị trí 0: Khe suoi 1: Chân 2: Sườn 3: Đỉnh - Độ dốc (o) Cấp: 1: 40 - Chiều dài dốc (m) Thước dây 30m - Hướng phơi Địa bàn 3 Nhóm nhân tố đất đai - Loại đất - Màu sắc đất Mã số ngẫu nhiên - Độ dày tầng đất (cm) 73
Các nhân tố Giá trị, hoặc mô tả Giải thích - Độ xốp đất 1: Tơi xốp 2: Chặt 3: Bí chặt - Độ ẩm đất (%) Dụng cụ đo - pH đất nt - Nhiệt độ đất (oC) nt - % kết von - % đá nổi - % ụ đất do giun đất tạo nên 4. Nhóm nhân tố khí hậu thủy văn - Lượng mưa trung bình năm Số liệu thứ cấp (mm) - Độ ẩm không khí (%) Dụng cụ đo - Nhiệt độ không khí (oC) nt - Lux nt - Cự ly đến sông suối gần nhất Bản đồ địa hình + GPS (m) 5. Nhóm nhân tố nhân tác Mức độ lửa rừng 0: Không có 1: Ít có 2: Vài năm 3: Hàng năm Mức động tác động đến thảm 0: Nguyên sinh thực vật rừng 1: Khai thác chọn 2: Bỏ hóa sau nương rẫy 3: Chặt trắng để trồng cây nông nghiệp 74
Bảng tổng hợp số liệu mã hóa các nhân tố liên quan đến xói mòn, dòng chảy mặt trong lưu vực Bi Đúp – Núi Bà – Lâm Đồng Muc do Do tan Gha So tang Do Ty le Vi tri Do doc Phan tram xoi che tan dong che da noi mon va rung deu phu dong cua cay thuc bi chay rung mat 2 0.7 20 5 1 60 2 45 0 2 0.610 527012 80 3 0.812 427223 0 2 0.3 10 1 16 1 9 0 1 0.0 0 1 1 95 0 9 0 1 0.833 515350 2 2 0.834 515380 0 2 0.634 529214 0 2 0.7 23 5 1 70 2 30 0 2 0.722 416230 0 2 0.725 515020 20 2 0.8 32 5 1 60 2 30 0 1 0.831 516340 0 1 0.830 420215 0 1 0.731 527120 0 1 0.720 522220 0 1 0.734 525230 0 1 0.732 525270 0 1 0.710 527140 2 1 0.615 425246 0 1 0.733 320215 0 1 0.3 26 5 2 90 2 18 0 1 0.3 20 4 3 90 2 18 0 1 0.68 520015 0 1 0.5 27 5 2 20 2 15 0 1 0.7 32 5 2 50 0 5 0 1 0.522 42030 0 2 0.628 410210 0 2 0.3 4 5 3 30 2 8 0 2 0.5 12 4 3 30 2 15 0 2 0.0 0 2 2 90 2 20 0 1 0.2 18 2 3 60 3 0 0 3 0.1 5 1 70 2 5 0 1 0.3 35 5 3 70 1 5 0 1 0.0 0 0 70 1 3 0 1 0.6 20 4 2 40 2 12 0 1 0.7 27 4 2 50 3 0 0 1 0.726 32030 0 1 0.326 52029 0 1 0.6 22 5 2 50 3 0 1 0.6 26 4 2 50 2 2 0 1 0.7 21 5 2 20 0 14 0 1 0.6 33 5 2 50 3 0 0 3 0.0 0 0 80 2 15 0 3 0.7 35 4 2 30 2 40 15 2 0.7 24 4 2 30 2 15 0 2 0.845 525220 0 1 0.636 32035 0 1 0.7 27 5 2 10 3 0 0 3 0.0 0 0 90 2 22 15 1 0.5 37 1 2 40 2 5 0 1 0.824 410218 0 75
Muc do Do tan Gha So tang Do Ty le Vi tri Do doc Phan tram xoi che tan dong che da noi mon va rung deu phu dong cua cay thuc bi chay rung mat 2 0.737 410310 0 2 0.832 515312 0 2 0.7 36 5 2 10 2 40 0 2 0.7 26 4 1 25 2 25 0 3 0.8 23 4 1 30 2 18 0 2 0.0 0 1 90 1 0 0 2 0.5 22 4 2 30 3 17 0 2 0.813 310362 0 1 0.4 19 3 2 60 1 22 0 3 0.3 21 3 2 40 2 20 0 3 0.9 14 4 2 20 2 54 20 2 0.0 0 2 80 1 0 0 2 0.9 22 3 1 30 1 12 0 2 0.9 19 4 1 30 1 22 0 2 0.8 16 4 2 80 1 6 0 2 0.2 18 2 3 95 2 15 0 2 0.9 25 4 1 35 2 25 0 2 0.8 21 4 1 30 2 19 0 4 0.6 4 4 3 30 0 16 0 3 0.0 0 1 1 85 1 0 0 4 0.3 21 2 3 80 2 25 2 3 0.3 20 4 3 90 1 0 10 3 0.8 38 4 1 25 1 40 0 3 0.0 0 1 90 1 0 0 3 0.3 22 2 2 90 3 45 5 3 0.5 30 3 4 20 2 37 1 2 0.5 13 2 1 95 1 0 0 2 0.3 17 4 1 60 1 0 0 2 0.913 31030 0 2 0.8 32 4 1 15 2 45 0 2 0.6 26 3 1 35 1 40 0 2 0.6 20 4 2 40 0 25 3 2 0.1 1 2 3 95 0 0 0 2 0.6 32 5 2 30 2 42 0 2 0.8 28 4 1 30 3 0 0 1 0.6 48 3 2 40 3 0 0 1 0.9 18 4 1 20 1 0 0 1 0.9 30 4 1 10 3 0 0 1 0.8 28 4 1 15 2 32 0 1 0.6 45 4 2 45 2 35 2 1 0.3 18 3 2 78 3 0 0 76
Xử lý trong Statgraphics Plus để tìm nhân tố ảnh hưởng chủ đạo đến xói mòn và dòng chảy.
Kết quả thiết lập mô hình quan hệ xói mòn với các nhân tố chủ đạo Muc do xoi mon va dong chay mat = 3.01414 + 0.332178*log(Do doc) - 0.434949*log(Gha) - 0.632207*log(So tang tan rung) Với R = 0.5 và các giá trị P kiểm tra các nhân tố ảnh hưởng đều < 0.1 Mô hình này phản ảnh mức độ xói mòn gia tăng theo cấp độ dốc, do đó phân cấp độ dốc là một lớp nhân tố trong phân cấp xung yếu phòng hộ đầu nguồn; bên cạnh đó nếu thảm phủ rừng có G và số tầng tán gia tăng thì làm giảm nguy cơ xói mòn, giảm dòng chảy mặt. Vì vậy lớp thảm phủ rừng cần xác định các nhân tố G và số tầng tán làm chủ đạo trong phân cấp xung yếu đầu nguồn. 78
Mục đích xử lý thống kê, Công cụ Kết quả phân ứng dụng tin thống kê, tin tích học trong lâm học nghiệp Phản ảnh đối tượng: Mô tả một mẫu: Trạng thái -Số trung bình rừng, lô rừng, ô thí nghiệm, -Phương sai, biến động Phân tích các đặc trưng -Kiểu phân bố: Lệch (Sk), nhọn vườn ươm của một mẫu quan sát (Ku) -Uớc lượng khoảng biến động theo độ tin cậy ?% So sánh các thí nghiệm: Trong Chọn lựa được công phòng, hiện trường: - So sánh 2 công thức, 2 mẫu -Tiêu chuẩn t thức tối ưu: Loài, - So sánh tác động 1 – 2 nhân tố - ANOVA 1 -2 nhân tố biện pháp kỹ thuật, giống, - Điều tra nhân tố Phát hiện và ứng dụng mối Phân tích hồi quy: khó đo đếm quan hệ giữa các nhân tố -Tuyến tính – Phi tuyến (điều tra, sinh thái) -1 lớp – n lớp - Phát hiện các mối -Tương quan trên đồ thị quan hệ, dự báo Phát hiện các yếu tố ảnh hưởng đến một vấn đề: Các nhân tố sinh - Mã hóa biến định tính - Phát hiện các nhân tố thái, nhân tác ảnh hưởng đến sinh - Phân tích hồi quy đa chủ đạo về sinh thái, trưởng, đất. nước, lưư vực biến, lọc biến, tổ hợp sinh trưởng, lưu vực biến - Quy hoạch, đề xuất biện pháp kỹ thuật -Tiêu chuẩn U để đánh Mô phỏng quy luật câu trúc 3 chiều giá phân bố -Tổ chức điểu chế Quan hệ sinh thái giữa các loài -Sắp xếp tần số - Mô phỏng cấu trúc: rừng tự nhiên Mayer, Weibull, Tóm tắt ứng dụng thống kê và tin học trong lâm nghiệp 79