Nguyên lý thống kê - Chương 2: Thu thập và trình bày dữ liệu

pdf 13 trang Đức Chiến 03/01/2024 3040
Bạn đang xem tài liệu "Nguyên lý thống kê - Chương 2: Thu thập và trình bày dữ liệu", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfnguyen_ly_thong_ke_chuong_2_thu_thap_va_trinh_bay_du_lieu.pdf

Nội dung text: Nguyên lý thống kê - Chương 2: Thu thập và trình bày dữ liệu

  1. Chương 2. THU THẬP VÀ TRÌNH BÀY DỮ LIỆU Lê Phương Bộ môn Toán kinh tế Đại học Ngân hàng TP. Hồ Chí Minh Homepage:
  2. Nội dung 1 Thu thập dữ liệu Nguồn dữ liệu Điều tra thống kê 2 Phân tổ thống kê Khái niệm Tiến hành phân tổ thống kê 3 Trình bày dữ liệu định lượng Bảng phân phối Đồ thị và biểu đồ
  3. Nguồn dữ liệu Vấn đề đầu tiên của công việc thu thập dữ liệu là xác định rõ những dữ liệu nào cần thu thập, thứ tự ưu tiên của các dữ liệu này. Nguồn dữ liệu • Dữ liệu thứ cấp là dữ liệu thu thập từ những nguồn có sẵn, đó chính là những dữ liệu đã qua tổng hợp, xử lý từ các cơ quan như: tổng cục thống kê, cơ quan chính phủ, tạp chí chuyên ngành, báo cáo tài chính • Dữ liệu sơ cấp là dữ liệu thu thập trực tiếp, ban đầu từ đối tượng nghiên cứu, để thu thập dữ liệu sơ cấp người ta tổ chức các cuộc điều tra thống kê.
  4. Điều tra thống kê Các loại điều tra thống kê Căn cứ vào tính liên tục của việc thu thập tài liệu: 1 Điều tra thường xuyên. 2 Điều tra không thường xuyên. Căn cứ vào phạm vi đối tượng điều tra: 1 Điều tra toàn bộ. 2 Điều tra không toàn bộ: 1 Điều tra chọn mẫu. 2 Điều tra trọng điểm. 3 Điều tra chuyên đề. Các phương pháp thu thập dữ liệu ban đầu 1 Thu thập trực tiếp: quan sát, phỏng vấn trực tiếp. 2 Thu thập gián tiếp: nhân viên điều tra thu thập tài liệu qua trao đổi bằng điện thoại hoặc thư gửi qua bưu điện với đơn vị điều tra.
  5. Phân tổ thống kê Khái niệm Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó, tiến hành sắp xếp các đơn vị quan sát của hiện tượng nghiên cứu vào các tổ có tính chất khác nhau nhưng các đơn vị trong cùng một tổ sẽ có tính chất giống nhau hoặc gần giống nhau. Tần số và tần suất Số đơn vị của từng tổ fi được gọi là tần số của tổ đó. Tỉ lệ của số đơn vị của tổ và số đơn vị của tổng thể (fi /n) được gọi là tần suất của tổ đó.
  6. Các bước tiến hành phân tổ thống kê Để tiến hành phân tổ ta thường theo các bước sau: 1 Lựa chọn tiêu thức phân tổ. 2 Xác định số tổ cần thiết và phạm vi biến thiên của từng tổ. 3 Sắp xếp các đơn vị vào các tổ. Lựa chọn tiêu thức phân tổ Để lựa chọn tiêu thức phân tổ một cách chính xác, cần phải dựa trên 2 nguyên tắc cơ bản sau: 1 Phân tích lý luận để chọn ra tiêu thức bản chất nhất, phù hợp với mục đích nghiên cứu. 2 Phải dựa vào điều kiện lịch sử cụ thể của hiện tượng nghiên cứu để chọn ra tiêu thức phân tổ thích hợp.
  7. Các bước tiến hành phân tổ thống kê Xác định số tổ cần thiết Trường hợp phân tổ theo tiêu thức thuộc tính (dữ liệu định tính) • nếu tổng thể bao gồm ít loại hình thì mỗi loại hình ta nhóm thành 1 tổ. • nếu tổng thể bao gồm rất nhiều loại hình, người ta giải quyết bằng cách ghép nhiều tổ nhỏ lại với nhau theo nguyên tắc: các tổ ghép lại với nhau phải giống nhau hoặc gần giống nhau về tính chất, giá trị sử dụng Ví dụ Phân tổ cho một tổng thể gồm 1000 người tham gia một tour du lịch theo các tiêu thức: giới tính, trình độ văn hóa, tỉnh thành.
  8. Các bước tiến hành phân tổ thống kê Xác định số tổ cần thiết Trường hợp phân tổ theo tiêu thức số lượng (dữ liệu định lượng) • Nếu lượng biến của tiêu thức thay đổi ít, thì thường là mỗi lượng biến hình thành 1 tổ. Ví dụ: bậc thợ công nhân, số nhân khẩu trong hộ gia đình. . . • Nếu lượng biến của tiêu thức thay đổi rất nhiều, ta xét xem lượng biến tích lũy đến mức độ nào thì chất của lượng biến mới thay đổi làm nảy sinh tổ khác.
  9. Các bước tiến hành phân tổ thống kê Mỗi tổ có giới hạn dưới và giới hạn trên, chênh lệch giữa giới hạn trên và giới hạn dưới của tổ gọi là trị số khoảng cách tổ h. Cách xác định trị số khoảng cách tổ Khi phân tổ có khoảng cách tổ đều nhau thành k tổ, trị số khoảng cách tổ được xác định • Trường hợp lượng biến liên tục: x − x h = max min k • Trường hợp lượng biến rời rạc (số nguyên): x − x − (k − 1) h = max min k Số tổ k thường được xác định từ công thức thực nghiệm √ k ≈ 3 2n.
  10. Các bước tiến hành phân tổ thống kê Ví dụ Phân tổ cho dữ liệu chiều cao (cm) ghi nhận của mẫu 50 học sinh lớp 12 của một trường trung học như sau: 154 160 162 164 169 155 161 162 168 163 160 161 163 173 172 173 172 163 165 162 170 165 162 175 164 170 163 177 164 160 175 166 167 176 164 174 166 164 176 172 158 162 167 170 171 161 166 178 168 169 Giải. • Tiêu thức phân tổ: chiều cao mỗi học sinh. • Loại lượng biến: liên tục. • n = 50 x = 178 x = 154 Tổng thể: √ , max , min . • Số tổ: k ≈ 3 2 × 50 hay k = 5. 178 − 154 • Trị số khoảng cách tổ: h = = 4, 8. 5 Lưu ý. Để đơn giản khi tính toán, trong một số trường hợp ta có thể làm tròn giá trị của h (với ví dụ trên h = 5).
  11. Trình bày dữ liệu bằng bảng phân phối Bảng phân phối Phân tổ Tần số Tần suất Tần số tích lũy Tần suất tích lũy x1 f1 f1/n f1 f1/n x2 f2 f2/n f1 + f2 (f1 + f2)/n x3 f3 f3/n f1 + f2 + f3 (f1 + f2 + f3)/n . . . . . . . . . . xk fk fk /n f1 + f2 + ··· + fk (f1 + f2 + ··· + fk )/n Tổng n 1 Lưu ý: cột thứ nhất là các tổ được phân theo tiêu thức, không nhất thiết là các giá trị của một lượng biến.
  12. Trình bày dữ liệu bằng bảng phân phối Ví dụ Lập bảng phân phối cho dữ liệu chiều cao của 45 học sinh đã phân tổ trong ví dụ trước. Tính tần suất và tần số tích lũy. Chiều cao Tần số Tần suất Tần số tích lũy [154; 158, 8) [158, 8; 163, 3) [163, 3; 168, 4) [168, 4; 173, 2) [173, 2; 178]
  13. Trình bày dữ liệu bằng đồ thị và biểu đồ Khái niệm Biểu đồ và đồ thị là các hình vẽ, đường nét hình học dùng để mô tả có tính quy ước các số liệu thống kê. Một số loại đồ thị và biểu đồ trong thống kê Giả sử dữ liệu được phân vào các tổ [x1, x2), [x2, x3), [x3, x4),. . . , [xk , xk+1] với các tần số tương ứng f1, f2, , fk và các các tần suất tương ứng f1/n, f2/n, , fk /n. • Đồ thị: đường gấp khúc trên mặt phẳng tọa độ tạo thành bởi các đoạn nối liên tiếp các điểm (xi , fi ) hoặc (xi , fi /n). • Biểu đồ hình cột: gồm các hình chữ nhật với 2 đỉnh là (xi , fi ) và (xi+1, fi ) và đáy còn lại nằm trên trục hoành. • Biểu đồ hình tròn: hình tròn được chia thành k hình quạt, tỉ lệ diện tích của hình quạt thứ i là fi /n. Ví dụ Vẽ biểu đồ hình cột và biểu đồ hình tròn cho dữ liệu chiều cao của 50 học sinh đã phân tổ trong ví dụ trước.