Quản trị kinh doanh - Thống kê trong kinh doanh

pdf 112 trang vanle 2500
Bạn đang xem 20 trang mẫu của tài liệu "Quản trị kinh doanh - Thống kê trong kinh doanh", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdfquan_tri_kinh_doanh_thong_ke_trong_kinh_doanh.pdf

Nội dung text: Quản trị kinh doanh - Thống kê trong kinh doanh

  1. MBA THỐNG KÊ TRONG KINH DOANH Ch−¬ng tr×nh §μo t¹o Th¹c sÜ Qu¶n trÞ Kinh doanh Quèc tÕ TÀI LIỆU THAM KHẢO - LƯU HÀNH NỘI BỘ 8/2009
  2. Môc lôc Trang CHƯƠNG 1 GIỚI THIỆU CHUNG VÀ THU THẬP DỮ LIỆU 3 CHƯƠNG 2 TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ ĐỒ THỊ 49 CHƯƠNG 3 MÔ TẢ DỮ LIỆU ĐỊNH LƯỢNG 70 CHƯƠNG 4 ƯỚC LƯỢNG 106 CHƯƠNG 5 KIỂM ĐỊNH 113 CHƯƠNG 6 KIỂM SOÁT QUÁ TRÌNH BẰNG THỐNG KÊ 146 CHƯƠNG 7 HỒI QUY VÀ TƯƠNG QUAN 157 CHƯƠNG 8 PHÂN TÍCH DÃY SỐ THỜI GIAN 170
  3. CHƯƠNG 1 GIỚI THIỆU CHUNG VÀ THU THẬP DỮ LIỆU 1. Thống kê và hoạt động quản trị Để quản trị hoạt động của doanh nghiệp vấn đề đầu tiên và hết sức quan trọng là phải có đầy đủ thông tin về mọi mặt kể cả thông tin sơ cấp và thứ cấp. Để hoạt động của doanh nghiệp ngày càng tốt hơn cần quan tâm đến ba yếu tố có mối liên hệ chặt chẽ với nhau, đó là: lý luận quản lý, phương pháp thống kê và các biện pháp hành động. Xuất phát từ những nhiệm vụ trong quản lý và đặc điểm tình hình cụ thể của doanh nghiệp cần xác định nhiệm vụ quản lý cụ thể là gì, nhằm vào mục tiêu nào Trên cơ sở đó xác định thông tin cần thu thập, các biện pháp thu thập dữ liệu, xử lý và phân tích các dữ liệu đó. Trên cơ sở các phân tích định lượng đó rút ra kết luận về sự tồn tại thực tế của hiện tượng, bản chất và tính quy luật đang tồn tại, từ đó đưa ra các biện pháp quản lý thích hợp với từng hiện tượng trong từng giai đoạn cụ thể Trước hết hãy làm quen với một số khái niệm thường dùng trong thống kê: • Tổng thể thống kê (population): là hiện tượng kinh tế xã hội số lớn, bao gồm các đơn vị (hoặc phần tử, hiện tượng) cần được quan sát và phân tích. Xác định tổng thể nhằm đưa ra giới hạn về phạm vi nghiên cứu cho người nghiên cứu. Căn cứ vào sự nhận biết các đơn vị trong tổng thể có thể phân biệt hai loại: tổng thể bộc lộ và tiềm ẩn. Tổng thể bộc lộ là tổng thể có ranh giới rõ ràng, có thể nhận biết hết các đơn vị trong tổng thể (chẳng hạn khi nghiên cứu tình hình sản xuất công nghiệp trên địa bàn Hà Nội ta có tổng thể các doanh nghiệp sản xuất công nghiệp trên địa bàn Hà Nội và đó là tổng thể bộc lộ). Tổng thể tiềm ẩn là tổng thể có ranh giới không rõ ràng, hay không thể nhận biết hết các đơn vị trong tổng thể (chẳng hạn tổng thể những người ưa dùng một loại sản phẩm nào đó, hoặc tổng thể những người sẽ sử dụng dịch vụ của Hãng hàng không quốc gia Việt Nam trong năm tới). Căn cứ vào mục đích nghiên cứu người ta phân biệt hai loại: tổng thể đồng chất và không đồng chất. Tổng thể đồng chất bao gồm các đơn vị giống nhau (hoặc gần giống nhau) về một số đặc điểm chủ yếu có liên quan đến mục đích nghiên cứu. Tổng thể không đồng chất bao gồm các đơn vị có những đặc điểm chủ yếu khác nhau. Căn cứ vào phạm vi nghiên cứu có thể phân biệt hai loại: Tổng thể chung (bao gồm tất cả các đơn vị thuộc đối tượng nghiên cứu) và tổng thể bộ phận (là một phần của tổng thể chung). • Đơn vị tổng thể: là các đơn vị (hoặc phần tử) cấu thành nên tổng thể. đơn vị tổng thể là xuất phất điểm của việc nghiên cứu, bởi vì mặt lượng của đơn vị tổng thể là các dữ liệu mà người nghiên cứu cần thu thập. 3 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  4. • Tổng thể mẫu (Sample): là tổng thể bao gồm một số đơn vị nhất định được chọn ra từ tổng thể chung để tiến hành điều tra thực tế. Các đơn vị này được chọn theo một phương pháp lấy mẫu nào đó. • Quan sát (Observation): là cơ sở để thu thập dữ liệu nghiên cứu. Thí dụ trong điều tra chọn mẫu, mỗi đơn vị thuộc mẫu được tiến hành thu thập thông tin được gọi là một quan sát • Tiêu thức thống kê: là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên cứu tuỳ theo mục đích nghiên cứu khác nhau. Có thể phân biệt các loại tiêu thức sau : Tiêu thức thực thể : Là loại tiêu thức phản ánh đặc điểm về nội dung của đơn vị tổng thể. Tùy theo cách biểu hiện mà có 3 loại: - Tiêu thức thuộc tính là tiêu thức phản ánh các thuộc tính của đơn vị tổng thể và không có các biểu hiện trực tiếp bằng con số. Thí dụ: tiêu thức giới tính, nghề nghiệp, dân tộc, thành phần kinh tế - Tiêu thức số lượng là tiêu thức phản ánh các đặc điểm về lượng của đơn vị tổng thể và có các biểu hiện trực tiếp bằng con số, các biểu hiện con số của tiêu thức số lượng được gọi là các lượng biến. Thí dụ: Số nhân khẩu trong gia đình, tiền lương tháng của mỗi người lao động, Năng suất lao động Các lượng biến là cơ sở để thực hiện các phép tính thống kê, như: cộng, trừ, nhân, chia, trung bình, tỷ lệ - Tiêu thức chỉ có hai biểu hiện không trùng nhau trên một đơn vị tổng thể được gọi là tiêu thức thay phiên. Thí dụ: tiêu thức giới tính chỉ có hai biểu hiện không trùng nhau là nam và nữ được gọi là tiêu thức thay phiên. Loại tiêu thức này có đặc điểm quan trọng là nếu một đơn vị tổng thể nào đó đã nhận biểu hiện này thì không nhận biểu hiện kia. Đây là loại tiêu thức có nhiều ứng dụng trong thực tế. • Chỉ tiêu thống kê: phản ánh đặc điểm của toàn bộ tổng thể trong điều kiện thời gian và địa điểm cụ thể. Chỉ tiêu thống kê là tổng hợp biểu hiện mặt lượng của nhiều đơn vị, hiện tượng cá biệt. Do đó, chỉ tiêu phản ánh những mối quan hệ chung, đặc điểm của số lớn các đơn vị hoặc của tất cả các đơn vị tổng thể. Chỉ tiêu thống kê bao gồm 2 mặt : khái niệm và mức độ của chỉ tiêu. Mặt khái niệm của chỉ tiêu bao gồm các định nghĩa và giới hạn về thực thể, thời gian và không gian; Mức độ của chỉ tiêu là các trị số với các đơn vị tính phù hợp. Có hai loại chỉ tiêu thống kê: chỉ tiêu khối lượng : biểu hiện quy mô, khối lượng của hiện tượng nghiên cứu và chỉ tiêu chất lượng : biểu hiện trình độ phổ biến và mối quan hệ trong tổng thể. 2. Phương pháp thống kê. Các phương pháp thống kê gồm: Thống kê mô tả và thống kê suy luận (phân tích thống kê). 4 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  5. • Thống kê mô tả: Bao gồm thu thập và mô tả dữ liệu. Cụ thể: i. Thu thập dữ liệu qua điều tra. ii. Biểu diễn dữ liệu bằng bảng và đồ thị thống kê. iii. Tính toán các đặc trưng của dữ liệu như trung bình, trung vị Đặc trưng của tổng thể chung gọi là tham số; đặc trưng của tổng thể mẫu gọi là thống kê. • Thống kê suy luận: bao gồm các phương pháp ước lượng, kiểm định giả thiết thống kê Tiêu thức số lượng có từ đó đưa ra các quyết định về tổng thể chung trên cơ sở kết quả từ mẫu điều tra. 3. Các loại dữ liệu và nguồn dữ liệu. • Có hai loại dữ liệu: - Dữ liệu định tính: Là dữ liệu về các tiêu thức thuộc tính (có thể có biểu hiện trực tiếp hoặc gián tiếp). - Dữ liệu định lượng: Là dữ liệu về các tiêu thức số lượng. Trong đó các lượng biến có thể là rời rạc (biểu hiện bằng các số nguyên) hoặc liên tục (biểu hiện bằng số thập phân). • Nguồn dữ liệu: Có hai nguồn dữ liệu chính - Nguồn thứ cấp: là những tài liệu đã được thu thập từ trước. Nguồn này bao gồm các tài liệu đã xuất bản (tạp chí, sách báo, kỷ yếu hội thảo, thông tin từ Internet Nguồn số liệu thứ cấp có thể có do các cơ quan của chính phủ thu thập (Tổng cục thống kê, các bộ ) hoặc từ các nguồn do các tổ chức tư nhân, các tổ chức phi chính phủ thu thập. Một nguồn số liệu thứ cấp nữa chưa phổ biến ở Việt nam là nguồn thông tin do các công ty chuyên nghiên cứu thị trường thu thập và bán. - Nguồn sơ cấp: là nguồn dữ liệu được thu thập lần đầu tiên phục vụ cho mục đích nghiên cứu. Nguồn này bao gồm các tài liệu được thu thập từ các cuộc điều tra, các quan sát, các nghiên cứu hiện trường (thực nghiệm). 4. Các phương pháp chọn mẫu. Thông thường có hai loại phương pháp chọn mẫu: Chọn mẫu xác xuất (các đơn vị được chọn theo xác suất đã biết) và chọn mẫu phi xác xuất (chọn mẫu có chủ đích, chọn mẫu định mức, chọn mẫu đoạn). Trên thực tế thường sử dụng phương pháp chọn mẫu xác suất với các phương pháp chọn cụ thể như sau: - Mẫu ngẫu nhiên đơn giản: mỗi đơn vị có cơ hội được chọn vào mẫu như nhau (như gieo con xúc sắc, bắt thăm, quay số). Có thể chọn hoàn lại hoặc không hoàn lại. Chọn hoàn lại là một đơn vị được chọn rồi sau khi nghiên cứu lại trả về tổng thể chung và có cơ hội được chọn lại; chọn không hoàn lại là một đơn vị được chọn rồi sau khi nghiên cứu không được trả về tổng thể chung và không có khả năng được chọn lại. NgoàI ra còn có thể sử dụng bảng số ngẫu nhiên để chọn mẫu. 5 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  6. - Mẫu hệ thống: Trước hết cần sắp xếp các đơn vị của tổng thể chung theo một thứ tự nào đó, như sắp xếp theo thứ tự vần A,B,C của tên gọi , theo thứ tự địa dư , theo quy mô từ nhỏ đến lớn v.v Các đơn vị được lựa chọn từ tổng thể chung theo khoảng cách bằng nhau (k). Khoảng cách k này được tính bằng cách chia số đơn vị của tổng thể chung cho số đơn vị của tổng thể mẫu, (hay nói cách khác tổng thể chung được chia thành k nhóm). Chọn một cách ngẫu nhiên một đơn vị từ nhóm thứ nhất, sau đó cứ mỗi khoảng cách k lại chọn một đơn vị. Thí dụ: Tổng thể chung N= 80 đơn vị, chọn mẫu n=8 đơn vị, vậy k = 80/8 = 10. Nếu trong nhóm đầu tiên ta chọn đơn vị thứ 3 thì các đơn vị được chọn tiếp theo sẽ là đơn vị thứ 13, 23, 33, 43, 53 - Mẫu phân loại: Tổng thể chung được phân chia thành hai hoặc nhiều nhóm trên cơ sở một số đặc đIểm chung (các tổ có độ thuần nhất cao). Sau đó chọn các đơn vị đại diện cho từng tổ theo cách chọn ngẫu nhiên đơn giản hoặc máy móc. Số đơn vị được chọn từ mỗi tổ có thể tương ứng với tỷ trọng của tổ đó trong tổng thể chung - gọi là chọn phân loại theo tỷ lệ - hoặc có thể không tương ứng với tỷ trọng đó - gọi là chọn phân loại không theo tỷ lệ. Nếu chọn mẫu phân loại theo tỷ lệ ta được mẫu có kết cấu gần giống với kết cấu của tổng thể chung nên tính đại biểu cao, muốn tính đại biểu của mẫu cao hơn nữa có thể lấy mẫu tối ưu tức là số đơn vị chọn ra ở mỗi tổ không chỉ tỷ lệ với tỷ trọng của tổ đó chiếm trong tổng thể mà còn tương ứng với độ biến thiên ở mỗi tổ theo tiêu thức nghiên cứu. - Mẫu chùm (cluster): Tổng thể chung được chia thành các chùm, mỗi chùm đều đại diện cho tổng thể chung. Sau đó ở mỗi chùm có thể chọn ra một số đơn vị theo cách chọn ngẫu nhiên đơn giản để hợp thành một mẫu. Hoặc có thể tiến hành chọn cả một hoặc một vài chùm nào đó một cách ngẫu ngẫu nhiên nếu số chùm lớn. 5. Phương pháp điều tra. 5.1. Thang đo 5.1.1. Các loại thang đo • Thang đo định danh: - Là đánh số các biểu hiện cùng loại của tiêu thức. - Thường dùng với các tiêu thức thuộc tính mà các biểu hiện của nó là một hệ thống các loại khác nhau không theo một trật tự xác định nào như: Giới tính, khu vực địa lý, nghề nghiệp, tôn giáo Thí dụ: Với tiêu thức giới tính chỉ có hai loại nam và nữ và không có trật tự nào giữa hai loại này; vì vậy có thể đánh số các biểu hiện Nam là 1 và nữ là 2 hoặc ngược lại. - Đặc điểm: Các con số không có quan hệ hơn kém, và không được thực hiện tất cả các phép tính, chỉ dùng để mã hóa và đếm tần số. • Thang đo thứ bậc: 6 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  7. - Là thang đo định danh nhưng giữa các biểu hiện của tiêu thức có quan hệ hơn kém. Thí dụ với tiêu thức tầng lớp xã hội, thang đo thứ bậc đơn giản nhất có 3 nấc: "thượng lưu", "trung lưu", "hạ lưu", những loại này lần lượt được đánh số từ 1 đến 3; những số này thể hiện trật tự của các tầng lớp xã hội nhưng nó không phản ánh được khoảng cách giữa các con số. Nhưng cũng có thể dùng thang đo 9 nấc phức tạp hơn để đo bằng cách chia nhỏ mỗi loại trên thành 3 loại: "Thượng lưu bậc cao - Thượng lưu - Thượng lưu bậc thấp" Tóm lại, một tiêu thức có bao nhiêu biểu hiện phụ thuộc vào mức độ thay đổi mà chúng ta hy vọng có thể tìm ra trong quá trình điều tra và mức độ chi tiết theo yêu cầu nghiên cứu. Chú ý: trong một số trường hợp thang đo thứ bậc có thể kết hợp với thang đo định danh để hiểu rõ được khái niệm hơn. Chẳng hạn, để đánh số các biểu hiện của tiêu thức tôn giáo có thể dùng thang đo định danh (1- phật giáo, 2 - thiên chúa giáo, 3 - hồi giáo, 4 - Đạo hin đu, 5 - Đạo cao đài ). Nhưng để biểu hiện hành vi tôn giáo thì có thể dùng thang đo thứ bậc. Chẳng hạn, bạn có dự hoạt động tôn giáo không: 1- hàng ngày, 2- hàng tuần, 3- một vài tuần trong một tháng, 4- hàng tháng, 5- một vài lần trong năm, 6- hàng năm, 7- không bao giờ. - Thường dùng để đo các tiêu thức thuộc tính mà các biểu hiện có quan hệ thứ tự như đo thái độ đối với một hành vi nào đó (hoàn toàn đồng ý, đồng ý, chưa quyết định, hoàn toàn không đồng ý) hoặc thứ tự chất lượng sản phẩm, huân chương, bậc thợ - Đặc điểm: sự chênh lệch giữa các biểu hiện của tiêu thức không nhất thiết phải bằng nhau. - Hạn chế: Chưa biết được khoảng cách giữa các số thự tự đó gần hay xa bao nhiêu vì vậy không thực hiện được các phép tính cộng trừ nhân chia mà chỉ nói lên đặc trưng chung của tổng thể một cách tương đối căn cứ trên sự giải thích "lớn hơn" hay "nhỏ hơn" mà thôi. • Thang đo khoảng: - Là thang đo thứ bậc có các khoảng cách đều nhau nhưng không có điểm gốc là 0. Thí dụ: Sau khi hỏi ý kiến của Ban giám khảo về việc xếp loại các đội trong cuộc thi , có thể tiếp tục hỏi thêm đội này hơn đội kia bao nhiêu điểm. Như vậy khoảng cách giữa các thứ tự đã được lượng hoá và có thể giải thích được. - Đặc điểm: Thang đo này có thể thực hiện các phép tính cộng, trừ, tính được các tham số đặc trưng như trung bình, phương sai, tỷ lệ. - Hạn chế: Là thang đo có khoảng cách hơn kém nhưng chưa có điểm gốc là số 0, nên không so sánh được tỷ lệ giữa các trị số đo. • Thang đo tỉ lệ : 7 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  8. - Là thang đo khoảng với một điểm 0 tuyệt đối (điểm gốc) để có thể so sánh được tỷ lệ giữa các trị số đo. Thí dụ; các đơn vị đo lường vật lý thông thường (kg, mét ), thu nhập, tuổi, số con - Đặc điểm: Thang đo này cho phép thực hiện được tất cả các phép tính với trị số đo. Theo tuần tự, thang đo sau có chất lượng đo lường cao hơn thang đo trước, đồng thời việc xây dựng thang đo cũng phức tạp hơn. Song không phải lúc nào cũng có thể sử dụng được thang đo hoàn hảo mà phải tuỳ thuộc vào đặc điểm của hiện tượng và tiêu thức nghiên cứu mà sử dụng thang đo cho thích hợp. 5.1.2. Một số cách đặt thang điểm cơ bản 5.1.2.1. Thang điểm điều mục: Đây là loại thang điểm đơn giản và phù hợp với nhiều hoàn cảnh khác nhau. Loại này đòi hỏi người được phỏng vấn cho biết thái độ của họ và điều mục đánh giá mà họ lựa chọn. Các mục được sắp xếp theo một thứ tự nào đó. Loại thang đo này còn được gọi là thang đo Likert. Ví dụ: Với câu hỏi “Bạn có thoả mãn với công việc mà bạn đang làm hiện nay không” có thể đặt các thang điểm sau: - Rất thoả mãn. - Tương đối thoả mãn. - Không quan tâm. - Không được thoả mãn lắm. - Rất khó chịu. Tuy thang điểm này đơn giản nhưng cần phải quan tâm đến một số vấn đề sau: + Số lượng điều mục: Cần có sự quyết định số mục lựa chọn tượng trưng cho thái độ của người được phỏng vấn. Chẳng hạn, thang mục chỉ có 2 mục đối nhau (đồng ý hay không đồng ý) mang tính chất của thang đo định danh rất khó cho công việc phân tích nhưng có thể thích hợp khi bảng câu hỏi dài hoặc khi trình độ văn hoá của người được hỏi có giới hạn. Mặt khác có thể sử dụng nhiều điều mục để giúp cho người được hỏi có nhiều sự lựa chọn rộng rãi và cho phép đo độ nhạy bén hơn.(một số nhà nghiên cứu cho rằng câu hỏi có 5 hoặc 6 mục trả lời là phù hợp hơn cả) + Số điều mục trả lời không nên lẻ để tránh dẫn đến việc người trả lời có thái độ trung dung với cách chọn câu trả lời ở giữa, và dễ đưa đến câu trả lời không đúng sự thật. Số điều mục chẵn thì người được hỏi bắt buộc phải biểu lộ thái độ của mình. + Không nên đặt câu trả lời lệch về một phía này hay phía kia làm cho người trả lời khó chọn. Ví dụ: với câu hỏi “đề nghị bạn cho biết tốc độ mau lẹ trong cung cách phục vụ khách hàng” mà sử dụng các điều mục : tuyệt, rất tốt, tốt, trên trung bình, trung bình thì sẽ rất không thích hợp cho người không thích cung cách phục vụ ấy. 8 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  9. 5.1.2.2. Thang điểm đánh giá qua hình vẽ: Thang điểm này sử dụng các hình vẽ để thể hiện thái độ của người được phỏng vấn về một vấn đề nào đó. Người ta thường sử dụng các loại thang điểm như: thang "hình nhiệt kế" hoặc là các “vẻ mặt” khác nhau nói lên thái độ đồng tình hay không đồng tình về một vấn đề nào đó. Với loại thang điểm này có thể phân chia nhiều mức khác nhau tuỳ thuộc nội dung và quy mô hiện tượng nghiên cứu. 5.1.2.3. Thang điểm xếp hạng theo thứ tự : Loại thang điểm này cho phép so sánh các điều mục trả lời trong khi 2 thang điểm trước không thể so sánh được vì ở hai loại thang điểm trên người được hỏi xét đoán không dựa vào căn cứ cụ thể nào cả. Đối với loại thang điểm xếp hạng theo thứ tự, người được hỏi sắp xếp hạng các mục trả lời theo thứ tự mà họ đánh giá. Ví dụ: Để nâng cao chất lượng học tập của sinh viên, nhà trường đã sử dụng các biện pháp sau đây: - Điểm danh thường xuyên ở lớp. - Kiểm tra bài thường xuyên. - Quy chế thi nghiêm túc. - Học bổng có nhiều mức theo theo kết quả thi từng học kỳ. - Cho nhiều chuyên đề nghiên cứu và bài tập lớn. - Nộp chi phí cao khi phải thi lại. Hãy xếp thứ tự các biện pháp trên từ phương pháp hiệu quả nhất theo thứ tự từ 1 đến 6. Loại thang điểm này tuy đơn giản, dễ trả lời song cũng có những nhược điểm là: - Khó liệt kê được đầy đủ các trường hợp nên dữ liệu thu thập thiếu chính xác. - Vì nhấn mạnh vào việc xếp thứ tự nên có thể ảnh hưởng đến câu trả lời, đặc biệt là mục thứ nhất và mục chót thường được quan tâm nhiều hơn. - Khi hỏi để xếp hạng những mục hoàn toàn nằm ngoài ý thích của người được hỏi thì những câu trả lời sẽ không có ý nghĩa - Thang điểm này không giúp ta xác định được khoảng cách xa gần giữa các mục là bao nhiêu theo sự nhận định của người được hỏi, hoặc là tại sao các mục lại được sắp xếp như vậy. 5.1.2.4. Thang điểm có tổng không đổi: Thang điểm có tổng không đổi cung cấp một sự nhận thức tổng quát tốt hơn về khoảng cách giữa các điểm trên giải thang điểm. Đối với thang điểm này, người được hỏi cần chia hoặc xác định một số điểm có tổng không đổi (thường là 100) để biểu thị sự quan trọng tương đối của những đặc điểm được 9 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  10. nghiên cứu. Số điểm được chia cho mỗi điều mục chỉ rõ hạng bậc của nó và đồng thời cũng chỉ rõ số khác biệt giữa các điều mục với nhau. Ví dụ: Cũng vẫn với ví dụ trên, chia 100 điểm cho các biện pháp theo tầm quan trọng của mỗi biện pháp. Thang điểm này còn một số tồn tại sau: - Không thể chắc chắn là liệu những kết quả có biểu thị đúng với khoảng cách và tỷ lệ hay không. - Nếu có quá nhiều đặc điểm thì việc chia điểm cũng gặp khó khăn 5.1.2.5. Thang điểm có ý nghĩa đối nghịch nhau: Thang điểm này yêu cầu người được hỏi cho biết cảm nghĩ về vấn đề cần được nghiên cứu bằng cách ghi ý kiến trả lời trên một chuỗi tính từ tạo thành từng cặp đối nghịch nhau về ý nghĩa. Ví dụ: Để hỏi ý kiến đánh giá về một loại bia ta dùng thang điểm 7 vị trí có ý nghĩa đối nghịch nhau như sau: Cực X Cực Y (nặng) 1 2 3 4 5 6 7 (nhẹ) Rất Khá Hơi T/Bình Hơi Khá Rất Có nhiều ý kiến khác nhau về số hạng mục đánh giá nên để chẵn hay lẻ. Nếu để lẻ dễ dẫn đếnviệc chọn vị trí giữa vì "vô thưởng vô phạt". Có thể để thang điểm có số hạng mục chẵn. Cực X Cực Y (tốt) 1 2 3 4 5 6 (kém) Rất Khá ít ít Khá Rất Ngoài các thang điểm cơ bản trên còn có nhiều cách đặt thang điểm nữa, tuỳ theo kỹ thuật của các nhà nghiên cứu. Tuy vậy mỗi thang điểm đều có ưu nhược điểm riêng. Vì vậy, người nghiên cứu phải biết lựa chọn loại thang điểm nào thích hợp nhất, có khả năng đáp ứng tốt nhất những nhu cầu thông tin với chi phí thấp nhất, phương pháp truyền đạt dễ dàng, dễ hiểu, dễ trả lời. 5.2. Các phương pháp điều tra 5.2.1. Phương pháp phỏng vấn Là phương pháp được sử dụng nhiều nhất trong thu thập thông tin. Căn cứ vào nội dung điều kiện thực tế, người nghiên cứu quyết định dùng phương pháp nào để tiếp xúc với người được phỏng vấn. Có các phương pháp phỏng vấn như sau: 5.2.1.1. Phương pháp Anket: Phương pháp anket là phương pháp phỏng vấn viết (người hỏi vắng mặt), trong đó sự tiếp xúc thông qua bảng hỏi, người trả lời tự điền câu trả lời vào bảng hỏi. Vì vậy những vấn đề tâm lý trong khi đặt câu hỏi và nguyên tắc tâm lý trong sắp xếp bảng hỏi là để hướng vào 10 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  11. người trả lời. Để thực hiện phương pháp này cần lưu ý đến 2 vấn đề quan trọng nhất là: Thiết kế bảng hỏi và cách phân phát bảng hỏi. Hai vấn đề đó sẽ ảnh hưởng đến chất lượng thông tin, tỷ lệ trả lời và gửi lại bảng hỏi, những yêu cầu quan trọng trong phương pháp anket. 5.2.1.2. Phỏng vấn trực diện Phương pháp phỏng vấn trực diện thông thường được hiểu là phỏng vấn miệng, còn gọi là "cuộc nói chuyện riêng" hay "trò chuyện có chủ định". Nói chuyện thông thường là cơ sở của phỏng vấn, nó khác với cuộc nói chuyện thông thường ở hai điểm sau đây: - Mục đích cuộc nói chuyện do chương trình nghiên cứu quy định từ trước. - Vai trò của người nói chuyện được quy định, thậm chí được "chuẩn hoá" Cũng vì vậy mà người ta gọi nó là "cuộc tiếp xúc giả tạo" do nguyên nhân từ bên ngoài. Kết quả của phỏng vấn, chất lượng thông tin thu được phần lớn phụ thuộc vào tính chất của việc tiếp xúc, sự giao tiếp chặt chẽ và hiểu biết lẫn nhau giữa người phỏng vấn và người trả lời hay nói cách khác nó mang dấu vết của cuộc tiếp xúc đó. *) Ưu điểm của phỏng vấn trực diện. + Việc tiếp xúc trực tiếp tạo ra những điều kiện đặc biệt để hiểu đối tượng sâu sắc hơn. Đây là ưu điểm mà phương pháp anket không thể có được. + Do tiếp xúc trực tiếp nên đã đồng thời kết hợp việc phỏng vấn với việc quan sát (từ dáng vẻ bề ngoài, đến những cử chỉ biểu lộ tình cảm, thái độ ). + Có thể phát hiện những sai sót và uốn nắn kịp thời ngay. *) Nhược điểm: + Tốn kém hơn so với phương pháp anket: tốn hơn về thời gian, chi phí, số cán bộ điều tra. + Tổ chức khó khăn hơn: đòi hỏi phải có sự chuẩn bị kỹ càng về điều tra viên, địa điểm, nghi thức gặp gỡ + Không cẩn thận câu trả lời sẽ bị ảnh hưởng bởi thiên kiến của điều tra viên. *)Tính chất của cuộc phỏng vấn trực diện: + Tính một chiều: Đó là quá trình giao tiếp một chiều do người phỏng vấn điều khiển. Người phỏng vấn phải làm chủ cả quá trình phỏng vấn từ khi mở đầu đến lúc kết thúc. Do tính một chiều và làm chủ đó đòi hỏi người phỏng vấn phải tạo được không khí cởi mở, dễ dàng thổ lộ cho người trả lời. + Tính quy định: Nội dung và các khả năng xử sự trong cuộc nói chuyện được quy định sẵn trong bảng câu hỏi và kế hoạch phỏng vấn. + Tính giả định: Nhiều đề tài đặt ra các yêu cầu và tình huống giả định để thu lại những phản ứng khác nhau của người được phỏng vấn. 11 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  12. + Tính phi hậu quả: Cuộc phỏng vấn phải đảm bảo không gây hậu quả cho người được phỏng vấn. Mức phi hậu quả bắt nguồn từ hai lý do: Thứ nhất là tính giả định của cuộc phỏng vấn. Khi tình huống khác đi, việc nói lại là không nên hoặc không có nghĩa. Thứ hai là nguyên tắc nặc danh. Yêu cầu giữ bí mật cho người được phỏng vấn, tránh những phiền toái, truy cứu những người trả lới ý này hay ý nọ. *) Các loại phỏng vấn trực diện: Tuỳ theo mức độ nghiêm ngặt của cách thức tiến hành, có thể chia thành hai loại: Theo nội dung trình tự tiến hành: + Phỏng vấn tiêu chuẩn hoá: là cuộc phỏng vấn diễn ra theo trình tự với nội dung được vạch sẵn cho mọi người dựa vào một bảng hỏi. Người phỏng vấn không được thay đổi trình tự các câu hỏi, không có quyền đưa thêm câu hỏi bổ sung hoặc gợi ý thêm các phương án trả lời đã có sẵn trong bảng hỏi. Có thể nói phỏng vấn tiêu chuẩn hoá là phương pháp phỏng vấn theo anket. Hình thức này có ưu điểm là số liệu có thể so sánh trực tiếp được với nhau, phục vụ việc tổng hợp dễ dàng, phù hợp với việc kiểm định giả thuyết. + Phỏng vấn bán tiêu chuẩn: là hình thức trung gian giữa phỏng vấn tiêu chuẩn hoá và phỏng vấn tự do. Cụ thể là ở đây các câu hỏi quyết định được tiêu chuẩn hoá, còn các câu hỏi khác thì có thể phát biểu tuỳ tình hình thực tế. Như vậy sẽ tận dụng được ưu điểm và hạn chế được nhược điểm của mỗi loại. + Phỏng vấn tự do: là cuộc phỏng vấn không có những câu hỏi đã định trước và cũng không theo kế hoạch đã định trước, chỉ đưa ra đề tài, người phỏng vấn hoàn toàn tự do tiến hành như một cuộc nói chuyện tự do. Ưu điểm của phương pháp này là người trả lời được tự do tư tưởng, thoải mái trình bày ý kiến quan điểm của mình sâu rộng tuỳ ý, người phỏng vấn chủ động thực hiện mục đích của mình, không bị gò bó. Khó khăn là người phỏng vấn phải có trình độ cao, biết duy trì, dẫn dắt câu chuyện đến đích. + Phỏng vấn sâu (indepth-interview): Khác với phỏng vấn tự do ở chỗ là ngoài những đề tài nói chuyện chung người ta còn đặt ra trước một số câu hỏi hoặc vấn đề nhất định mà cần phải được trả lời. Đặc điểm của phỏng vấn sâu là không cần nhiều đối tượng điều tra, thậm chí có khi chỉ cần một số ít người để hỏi về những vấn đề sâu kín, tiềm ẩn mà không phải ai trong họ cũng có thể cảm nhận hoặc nói ra. Khó khăn ở đây cũng là đòi hỏi người phỏng vấn có trình độ cao, có phương pháp tâm lý và biết cách phân tích tâm lý. + Phỏng vấn định hướng: là cuộc phỏng vấn dặt mục đích nghiên cứu rõ ràng, những ý kiến về tình hình đã được nêu ra một cách cụ thể; nói cách khác là phỏng vấn tập trung vào một mục tiêu (focused interview). Theo đối tượng tiếp xúc: + Phỏng vấn cá nhân: có thể là tất cả các loại phỏng vấn tiêu chuẩn, bán tiêu chuẩn, tự do, phỏng vấn sâu, phỏng vấn định hướng. 12 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  13. + Phỏng vấn nhóm: chỉ thường áp dụng phỏng vấn nhóm tiêu chuẩn (cơ cấu tiêu chuẩn, đồng nhất) và phỏng vấn nhóm tự do (không đồng nhất) trong khi vẫn tuân thủ nội dung phỏng vấn tiêu chuẩn hoặc tự do đã nói trên. Trên đây là các loại phỏng vấn trực diện khác nhau, việc lựa chọn loại hình nào là tuỳ thuộc mục đích điều tra, số lượng người cần điều tra, số lượng và chất lượng người phỏng vấn, khả năng tài chính cho phép 5.2.1.3. Phỏng vấn qua điện thoại Phỏng vấn qua điện thoại chỉ là phỏng vấn miệng với cá nhân, nhưng người phỏng vấn và người được phỏng vấn không gặp mặt trực tiếp mà thông qua điện thoại. *) Ưu điểm của phỏng vấn qua điện thoại: ngày nay người ta áp dụng phổ biến với những chủ đề rộng rãi hơn và cũng thường là kết hợp với các phương pháp khác. + Tiết kiệm chi phí hơn: Phỏng vấn qua điện thoại rẻ hơn nhiều so với các cuộc phỏng vấn trực diện (Trong một nghiên cứu so sánh kỹ càng của Trung tâm điều tra khảo sát thuộc trường đại học tổng hợp Michigan cho thấy: một cuộc điều tra 1500 cá nhân, theo cách phỏng vấn trực diện tốn khoảng 84000 USD, theo cách phỏng vấn qua điện thoại tốn 38000 USD. Điều này có nghĩa là mỗi cuộc phỏng vấn trực diện tốn khoảng 55 USD trong khi phỏng vấn qua điện thoại là 23 USD). Đào tạo, tập huấn chuẩn bị cho nhân viên điều tra trong điều tra trực diện đắt gấp 2 lần so với điều tra qua điện thoại. Giá cho việc đi lại của nhân viên điều tra chiếm gần 20% trong nghiên cứu trực diện trong khi đó không mất phí tổn này trong điều tra qua điện thoại. + Tiết kiệm thời gian: Ngồi trong văn phòng gọi điện thoại cho người được phỏng vấn tiết kiệm thời gian và công sức hơn phải ra ngoài phỏng vấn trực diện. + Điều tra qua điện thoại khách quan hơn: Vì người phỏng vấn không thể thấy người trả lời nên người trả lời có thể sẵn lòng tiết lộ các thông tin riêng tư hơn là phỏng vấn trực diện. *) Nhược điểm của phỏng vấn qua điện thoại: có 3 điều bất lợi đối với phỏng vấn qua điện thoại. + Mất nhiều công sức chọn số điện thoại: trong số những số điện thoại được chọn ngẫu nhiên chỉ có một số là thành công trong việc vì nhiều lý do khác nhau ( không đúng đối tượng, không gặp, không trả lời ) + Giảm hứng thú khi phỏng vấn qua điện thoại: Khi phỏng vấn qua điện thoại, người trả lời dễ dàng trả lời cuộc phỏng vấn hơn so với khi người phỏng vấn đang đứng hay ngồi cạnh họ. Nhưng vì không nhìn thấy nhau nên người phỏng vấn khó định lượng mức độ quan tâm của người trả lời hơn. Do vậy người phỏng vấn cần phải cố giữ cuộc nói chuyện qua điện thoại trôi chảy sao cho người trả lời không có thời gian cân nhắc xem liệu họ có bận quá hay chán quá. Điều này có nghĩa là thu được những thông tin sâu từ câu hỏi mở trong một điều tra qua điện thoại là rất khó. 13 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  14. + Việc đưa ra các gợi ý hay hỗ trợ thêm bằng quan sát là khó có thể thực hiện được. Chẳng hạn, không thể gợi ý bằng cách đưa ra một danh sách để lựa chọn hay khi cần những phản ứng đối với hình ảnh 5.2.1.4. Phỏng vấn qua thư (kể cả thư điện tử) Đây là 1 trường hợp đặc biệt của phương pháp anket, trong đó bảng hỏi không được phân phát tận nơi người trả lời mà gửi qua bưu điện hoặc theo dạng thư ngỏ trên mang internet. Phương pháp này đỡ tốn kém hơn nhưng tỷ lệ trả lời rất thấp. Nếu dùng hình thức gửi thư qua bưu điện, Cơ quan bưu điện có thể giao được bảng câu hỏi đến mọi chỗ có địa chỉ rõ ràng - khả năng nhận được của người trả lời cao. Người trả lời có thể trả lời thoải mái, có suy nghĩ với những câu hỏi dứt khoát hoặc họ cũng trả lời tốt với những câu hỏi cần xem thêm những lưu trữ (của họ) cho thêm chính xác. Việc nặc danh, làm cho người trả lời có thể thổ lộ những vấn đề riêng tư không bao giờ nói với người phỏng vấn. Phí tổn chỉ phải chi trả cho việc ghi địa chỉ, in ấn, cước phí và điều hành. Nhưng phương pháp này cũng có những hạn chế đáng kể, nhất là những bảng trả lời được gửi về nhỏ giọt và nhiều địa chỉ không còn đúng nữa . 5.2.2. Phương pháp quan sát Là phương pháp thu thập thông tin được chuẩn bị một cách khoa học theo những mục đích đã vạch ra dựa trên việc quan sát đối tượng điều tra. Các phương pháp quan sát : • Quan sát lộ diện: người điều tra trực tiếp tham gia vào quá trình hoạt động của đối tượng được quan sát. Người quan sát có thể đóng vai trò là trung lập, đứng ngoài cuộc để quan sát hoặc có thể chủ động tham gia tích cực cùng với người được quan sát. • Quan sát giấu mặt: thông qua camera, máy ghi âm • Quan sát có kết cấu: việc quan sát được tiến hành dựa trên các tiêu thức được chuẩn bị từ trước. • Quan sát không có kết cấu: là quan sát một cách tự do và người quan sát ghi chép lại tất cả những điều quan sát được. 5.2.3. Phương pháp thực nghiệm • Được sử dụng nhằm kiểm tra một số nhận định sơ bộ nào đó. Là phương pháp thu thập thông tin được chuẩn bị một cách khoa học theo những mục đích đã vạch ra, có cách quan sát riêng về từng đối tượng và có sự chọn lọc thông tin. • Nội dung: người điều tra tạo ra một tình huống gần giống với tình huống thực tế rồi quan sát cách ứng xử của những người được điều tra • Ưu điểm : cho phép ta xác định được hành động của người được quan sát. 14 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  15. • Nhược điểm: Chỉ thấy biểu hiện của hành động mà khó xác định được mục đích, nguyên nhân dẫn đến hành động đó là gì, có nghĩa là khó đi sâu vào bản chất của nó nếu không sử dụng các phương pháp khác. 5.2.4. Phương pháp phân tích thông tin sẵn có - Là phương pháp thu thập thông tin gián tiếp qua việc phân tích các tài liệu đã có sẵn (các tài liệu của các cơ quan lưu trữ, từ các cuộc nghiên cứu trước, từ các phương tiện thông tin đại chúng ). Thực chất của phương pháp này chỉ đơn thuần là một phương tiện để có một phân tích mới về các dữ liệu được thu thập cho các mục đích khác. - Ưu điểm : Tiết kiệm về chi phí và nhân công - Nhược điểm: Các tài liệu này thường ít được phân chia theo các tiêu thức cần nghiên cứu, vì vậy khó có thể tìm được nguyên nhân và các mối liên hệ qua lại giữa các tiêu thức. Hơn nữa các cơ quan thống kê thường chỉ lưu trữ số liệu về các hiện tượng kinh tế, còn các số liệu về các hiện tượng và quá trình xã hội ít được lưu trữ hơn. 5.3. Các loại câu hỏi *) Theo công dụng của câu hỏi chia thành hai nhóm: theo nội dung và theo chức năng kỹ thuật. - Theo nội dung, chia thành các loại : + Câu hỏi sự kiện. + Câu hỏi về tri thức + Câu hỏi về quan điểm, thái độ, động cơ. - Theo chức năng kỹ, chia thành các loại: + Câu hỏi tâm lý + Câu hỏi lọc + Câu hỏi kiểm tra *) Theo biểu hiện của câu hỏi và câu trả lời - Theo biểu hiện của câu trả lời: + Câu hỏi đóng + Câu hỏi mở + Câu hỏi nửa đóng - Theo biểu hiện của câu hỏi + Câu hỏi trực tiếp + Câu hỏi gián tiếp 6. Thiết kế phương án điều tra. 15 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  16. Để tổ chức tốt một cuộc điều tra, đòi hỏi phải xây dựng được phương án điều tra thật chi tiết, tỷ mỉ, cụ thể và toàn diện. Đây chính là tài liệu hướng dẫn thực hiện cuộc điều tra, trong đó xác định rõ những bước tiến hành, những vấn đề cần phải giải quyết, cần được hiểu thống nhất trong suốt quá trình thực hiện. Đối với các cuộc điều tra lớn, có liên quan đến nhiều cấp, nhiều ngành, như Tổng điều tra dân số, việc xây dựng phương án điều tra cần có sự phối hợp, bàn bạc thống nhất giữa cơ quan thống kê và các ngành có liên quan và phải được cấp trên có thẩm quyền phê duyệt. Trong điều kiện nền kinh tế thị trường, phương án điều tra thường được được xây dựng dưới dạng “đề xuất kỹ thuật” và “đề xuất tài chính” cho cuộc nghiên cứu. Đây chính là căn cứ để cơ quan có thẩm quyền phê duyệt hoặc là căn cứ để cơ quan chủ quản tiến hành xét chọn thầu theo quy định chung của nhà nước. Phương án của mỗi cuộc điều tra có thể khác nhau, tùy thuộc điều kiện cụ thể của nó. Nhưng nhìn chung, mỗi phương án điều tra thường gồm những nội dung chủ yếu sau: - Xác định mục đích điều tra. - Xác định phạm vi, đối tượng và đơn vị điều tra. - Xác định nội dung điều tra và thiết lập phiếu điều tra. - Chọn thời điểm, thời kỳ và thời hạn điều tra. - Lựa chọn phương pháp điều tra, tổng hợp số liệu và phương pháp tính các chỉ tiêu điều tra. - Xây dựng phương án tài chính cho cuộc điều tra. - Lập kế hoạch tổ chức và tiến hành điều tra. 6.1. Xác định mục đích điều tra Bất kỳ một hiện tượng kinh tế xã hội nào cũng đều có thể được quan sát, xem xét, nghiên cứu trên nhiều mặt, nhiều khía cạnh, nhiều góc độ khác nhau. Nghiên cứu trên mỗi mặt, mỗi khía cạnh khác nhau sẽ cho ta đưa những kết luận khác nhau về hiện tượng và phục vụ những yêu cầu nghiên cứu cũng khác nhau. Vì vậy, trước khi tiến hành điều tra, cần xác định rõ xem cuộc điều tra này nhằm tìm hiểu vấn đề gì, phục vụ cho yêu cầu nghiên cứu nào. Đó chính mục đích của cuộc điều tra. Mục đích điều tra còn là một trong những căn cứ quan trọng để xác định đối tượng, đơn vị điều tra, xây dựng kế hoạch và nội dung điều tra. Vì vậy, việc xác định đúng, rõ ràng mục đích điều tra sẽ là cơ sở quan trọng cho việc thu thập số liệu ban đầu đầy đủ, hợp lý, đáp ứng yêu cầu nghiên cứu đặt ra. Căn cứ để xác định mục đích điều tra thường là những nhu cầu thực tế cuộc sống, hoặc những nhu cầu hoàn chỉnh lý luận Những nhu cầu này được biểu hiện trực tiếp bằng các yêu cầu, đề nghị, mong muốn của cơ quan chủ quản (người sử dụng thông tin). 6.2. Xác định phạm vi, đối tượng và đơn vị điều tra 16 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  17. Xác định đối tượng điều tra là xác định xem những đơn vị tổng thể nào thuộc phạm vi điều tra, cần được thu thập thông tin. Như vậy, khi các đối tượng điều tra được chỉ rõ, cũng có nghĩa là phạm vi nghiên cứu đã được xác định, ranh giới giữa hiện tượng nghiên cứu với các tổng thể khác, hiện tượng khác cũng được phân biệt rõ ràng, tránh được tình trạng trùng lặp hay bỏ xót khi tiến hành điều tra. Muốn xác định chính xác đối tượng điều tra, một mặt phải dựa vào sự phân tích lý luận, nêu lên những tiêu chuẩn cơ bản phân biệt hiện tượng nghiên cứu với các hiện tượng liên quan, phân biệt đơn vị tổng thể này với các đơn vị tổng thể khác, đồng thời cũng còn phải căn cứ vào vào mục đích nghiên cứu. Trong cuộc Tổng điều tra dân số ngày 1/4/1999 ở nước ta, đối tượng điều tra được xác định là “nhân khẩu thường trú”. Điều này, vừa giúp thực hiện tốt các mục đích điều tra đã được nêu rõ trong mục trên, vừa giúp cho quá trình điều tra không bị trùng hay bỏ xót bất kỳ một nhân khẩu nào của nước ta. Tuy nhiên, trong phương án điều tra cũng cần phải có những quy định cụ thể về tiêu chuẩn xác định xác định “nhân khẩu thường trú” để tránh nhầm lẫn. Đơn vị điều tra là đơn vị thuộc đối tượng điều tra và được điều tra thực tế. Đơn vị điều tra chính là nơi phát sinh các tài liệu ban đầu, điều tra viên cần đến đó để thu thập trong mỗi cuộc điều tra. Như vậy, nếu việc xác định đối tượng điều tra là trả lời câu hỏi “điều tra ai?”, thì việc xác định đơn vị điều tra là trả lời câu hỏi “điều tra ở đâu?”. Trong một số trường hợp, đơn vị điều tra và đối tượng điều tra có thể trùng nhau. Ví dụ trong cuộc điều tra nghiên cứu tình hình phát triển của các doanh nghiệp công nghiệp nhà nước thành phố Hà Nội, thì cả đối tượng và đơn vị điều tra đều là các doanh nghiệp công nghiệp nhà nước của thành phố. Nhưng cũng có nhiều trường hợp, chúng lại khác nhau. Ví dụ trong Tổng điều tra dân số ở nước ta ngày 1/4/1999, đối tượng điều tra là “nhân khẩu thường trú”, còn đơn vị điều tra lại được xác định là các “hộ gia đình” và các “hộ tập thể”. Trong các cuộc điều tra chọn mẫu, đơn vị điều tra chỉ bao gồm những đối tượng được chọn vào mẫu. Cần phân biệt đơn vị điều tra và đơn vị tổng thể. Đơn vị tổng thể là các phần tử, các đơn vị cấu thành hiện tượng, mà qua đó ta có thể xác định được quy mô tổng thể. Việc xác định số đơn vị tổng thể liên quan đến việc lập phương án điều tra, chọn phương pháp điều tra, ước lượng kinh phí điều tra còn việc xác định số đơn vị điều tra lại liên quan đến việc tổ chức ghi chép, đăng ký tài liệu, phân bổ cán bộ 6.3. Xác định nội dung điều tra và thiết lập phiếu điều tra Xác định nội dung điều tra là việc trả lời câu hỏi “điều tra cái gì?”. Nội dung điều tra là toàn bộ các đặc điểm cơ bản của từng đối tượng, từng đơn vị điều tra, mà ta cần thu được thông tin. Trong thực tế, các đơn vị của hiện tượng nghiên cứu thường có rất nhiều đặc điểm khác nhau. Tuy nhiên, không thể và cũng không cần thiết phải thu thập toàn bộ các tiêu thức đó, mà chỉ cần những tiêu thức có liên quan đến mục đích nghiên cứu, phục vụ được cho việc nghiên cứu . Vì vậy, bất kỳ cuộc điều tra nào cũng cần phải xác định rõ, cụ thể nội dung điều tra. Việc xác định nội dung điều tra, cần căn cứ vào các yếu tố sau: 17 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  18. - Mục đích điều tra: Mục đích điều tra chỉ rõ cần thu thập những thông tin nào để đáp ứng yêu cầu của nó. Mục đích điều tra khác nhau, nhu cầu thông tin cũng khác nhau. Mục đích càng nhiều, nội dung điều tra càng phải rộng, càng phải phong phú. - Đặc điểm của hiện tượng nghiên cứu: Tất cả những hiện tượng mà thống kê nghiên cứu đều tồn tại trong những điều kiện cụ thể về thời gian và không gian. Khi điều kiện này thay đổi, đặc điểm của hiện tượng cũng thay đổi. Khi đó, các biểu hiện của chúng cũng khác nhau. Vì vậy, việc lựa chọn tiêu thức nghiên cứu cũng phải khác nhau. - Năng lực, trình độ thực tế của đơn vị, của người tổ chức điều tra. Điều này biểu hiện ở khả năng về tài chính, về thời gian, về kinh nghiệm và trình độ tổ chức điều tra. Nếu tất cả các yếu tố này được đảm bảo tốt, có thể mở rộng nội dung điều tra, nhưng vẫn đảm bảo chất lượng của các thông tin thu được. Trường hợp ngược lại, cần kiên quyết loại bỏ những nội dung chưa thực sự cần thiết Ngoài ra, nội dung điều tra cũng chỉ nên bao gồm những tiêu thức có liên hệ chặt chẽ với nhau, để có thể kiểm tra tính chính xác của những thông tin thu được. Để có thể thu được những thông tin một cách chính xác và đầy đủ, nội dung của mỗi cuộc điều tra phải được diễn đạt thành những câu hỏi ngắn gọn, rõ ràng, dễ hiểu và mọi người đều hiểu theo một nghĩa thống nhất. Về mặt hình thức, các câu hỏi này có thể được diễn đạt theo hai cách: câu hỏi đóng là các câu hỏi đã có sẵn các phương án trả lời (thang điểm) có thể, người trả lời chỉ cần chọn 1 trong những cách trả lời đã được đưa ra; Câu hỏi mở không có trước những phương án trả lời, người được hỏi tự diễn đạt câu trả lời. Các cuộc điều tra thống kê ít sử dụng loại câu hỏi thứ hai này. Phiếu điều tra (hay còn gọi là biểu điều tra hay bảng hỏi) là tập hợp các câu hỏi của nội dung điều tra, được sắp xếp theo một trật tự logic nhất định. Tùy theo yêu cầu, nội dung và đối tượng, mỗi cuộc điều tra có thể phải xây dựng nhiều loại phiếu khác nhau. Phiếu điều tra là công cụ để thực hiện cuộc điều tra, nên nó phải phản ánh đầy đủ nội dung điều tra. Việc thiết kế phiếu phải đảm bảo các yêu cầu về mỹ thuật, tiết kiệm và tiện dụng. Về mặt mỹ thuật, phiếu phải được thiết kế đẹp, dễ đọc, có khả năng lôi kéo, duy trì sự quan tâm của người trả lời. Việc sắp xếp các hàng, các cột, bố trí khổ giấy sao cho phải đảm bảo yêu cầu tiết kiệm, nhưng lại thuận lợi cho việc ghi chép, mã hóa, nhập số liệu và kiểm tra lại sau này. Thông thường, trong các tài liệu của cuộc điều tra, người ta còn soạn thảo bản giải thích cách ghi phiếu điều tra. Bản giải thích này thường đi kèm theo phiếu điều tra nhằm giúp cho điều tra viên và người trả lời nhận thức thống nhất các câu hỏi được đặt ra, cách thu thập và ghi chép số liệu. Đối với những câu hỏi phức tạp, khó trả lời người ta còn đặt ra những ví dụ cụ thể và những quy định về các trường hợp ngoại lệ 6.4. Chọn thời điểm, thời kỳ và quyết định thời hạn điều tra. 18 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  19. Các hiện tượng nghiên cứu luôn thay đổi theo thời gian và không gian. Muốn thu thập được chính xác các thông tin về chúng, cần có quy định thống nhất về thời điểm, thời kỳ và thời hạn điều tra. Thời điểm điều tra là mốc thời gian được quy định thống nhất mà cuộc điều tra phải thu thập thông tin về hiện tượng tồn tại đúng thời điểm đó. Nếu cuộc điều tra được tiến hành vào thời điểm sau đó, thì người trả lời phải hồi tưởng lại để “miêu tả trạng thái của hiện tượng” vào đúng thời điểm điều tra. Thời kỳ điều tra là khoảng thời gian (tuần, tháng, năm ) được quy định để thu thập số liệu về lượng của hiện tượng được tích lũy trong cả thời ký đó. Thời hạn điều tra là khoảng thời gian dành cho việc thực hiện nhiệm vụ thu thập số liệu. Thời hạn dài hay ngắn phụ thuộc vào quy mô, tính phức tạp của hiện tượng nghiên cứu và nội dung điều tra, vào khả năng, kinh nghiệm của điều tra viên. Nhìn chung, thời hạn điều tra không nên quá dài, cách quá xa thời điểm điều tra vì có thể làm mất thông tin do người trả lời không nhớ đầy đủ các sự kiện đã xảy ra. 6.5. Lập kế hoạch tổ chức và tiến hành điều tra. Lập kế hoạch tổ chức và tiến hành điều tra là một vấn đề trọng yếu của điều tra thống kê. Kế hoạch này quy định cụ thể từng bước công việc phải tiến hành trong quá trình từ khâu tổ chức đến triển khai điều tra thực tế. Vì vậy, nó được xây dựng càng chi tiết, tỷ mỉ, rõ ràng, cụ thể thì càng dễ thực thi, chất lượng của cuộc điều tra càng được nâng cao. Tuy nhiên, đây là một công việc phức tạp, đòi hỏi người lập kế hoạch phải có kinh nghiệm và am hiểu tình hình thực tế. Một kế hoạch tổ chức và tiến hành điều tra gồm rất nhiều khâu công việc. Thông thường, nó có thể gồm một số khâu chủ yếu là: - Thành lập Ban chỉ đạo điều tra và quy định nhiệm vụ cụ thể cho cơ quan điều tra các cấp. - Chuẩn bị lực lượng cán bộ điều tra, phân công trách nhiệm, địa bàn cho từng cán bộ và tiến hành tập huấn nghiệp vụ cho họ. - Lựa chọn phương pháp điều tra thích hợp. - Định các bước tiến hành điều tra. - Phân chia khu vực và địa bàn điều tra. - Tổ chức các cuộc hội nghị chuẩn bị. - Tiến hành điều tra thử để rút kinh nghiệm, nâng cao trình độ nghiệp vụ cho cán bộ điều tra và hoàn thiện phương án điều tra, phiếu điều tra. - Xây dựng phương án tài chính và chuẩn bị các phương tiện vật chất khác. - Tuyên truyền mục đích, ý nghĩa của cuộc điều tra. 19 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  20. 7. Các loại sai số trong điều tra. Các cuộc điều tra thống kê, dù có cố gắng làm thật tốt vẫn thường gặp những trường hợp mà số liệu điều tra không trùng khớp với số liệu thực tế của hiện tượng nghiên cứu. Người ta gọi là sai số. Sai số trong điều tra thống kê là chênh lệch giữa trị số thực của hiện tượng nghiên cứu so với trị số của nó mà điều tra thống kê thu được. Sai số này làm giảm chất lượng của các cuộc điều tra, ảnh hưởng đến kết quả của tổng hợp và phân tích. Do đó, ảnh hưởng đến chất lượng của toàn bộ quá trình nghiên cứu thống kê. Trong các cuộc điều tra thống kê, người ta phải cố gắng áp dụng nhiều biện pháp để hạn chế sai số này. Tuỳ theo các nguyên nhân dẫn đến sai số mà chia thành các loại sai số sau: - Sai số do đăng ký xảy ra đối với mọi cuộc điều tra thống kê. Nó phát sinh do việc đăng ký số liệu ban đầu không chính xác. Nguyên nhân gây ra loại sai số này rất đa dạng, có thể do cân đong, đo, đếm sai, tính toán sai, ghi chép sai, do dụng cụ đo lường không chuẩn xác Nếu phân chia chi tiết hơn, ta có thể chia loại sai số này thành sai số ngẫu nhiên và sai số có hệ thống, do cố ý, có chủ định của người điều tra và người trả lời. Sai số ngẫu nhiên là những sai số phát sinh một cách tình cờ, không có chủ định, không có bất kỳ một sự sắp đặt trước nào của người điều tra. Nó xảy ra hoàn toàn ngẫu nhiên. Loại sai số này chịu sự chi phối của quy luật số lớn, tức là nếu ta điều tra càng nhiều đơn vị, các sai lệch ngẫu nhiên sẽ có khả năng bù trừ, triệt tiêu nhau làm cho sai số chung càng nhỏ. Sai số có hệ thống, có chủ định thường xảy ra do chủ định của người điều tra, người trả lời hoặc sai số một cách có hệ thống do lỗi của hệ thống đo lường, hệ thống thang đo được thiết kế không chuẩn xác Loại sai số này không chịu sự chi phối của quy luật số lớn, nên điều tra càng nhiều, khả năng xảy ra sai số sẽ càng lớn. - Sai số do tính chất đại biểu của số đơn vị được chọn trong điều tra chọn mẫu. Các đơn vị được chọn không đảm bảo đại diện cho toàn bộ tổng thể sẽ phát sinh sai số khi suy luận kết quả của mẫu cho tổng thể chung. Nguyên nhân dẫn đến sai số này là do: cỡ mẫu không đủ lớn, cố tình vi phạm nguyên tắc chọn mẫu, và do bản thân nguyên tắc chọn mẫu ngẫu nhiên gây nên. - Sai số do đo lường là sai số do sử dụng thước đo không tốt mà nguyên nhân trực tiếp là do câu hỏi tồi (sử dụng thang đo, triển khai thang điểm không phù hợp ) Để đảm bảo các kết quả điều tra đạt độ chính xác cao, cần áp dụng một số biện pháp để hạn chế sai số : - Làm tốt công tác chuẩn bị điều tra: thông thường, trong các cuộc điều tra thống kê, công tác chuẩn bị chiếm vị trí rất quan trọng, nó đòi hỏi một sự đầu tư chất xám khá lớn. Công tác chuẩn bị càng chu đáo, tỷ mỉ, thận trọng và chi tiết, đặc biệt là trong việc thiết lập phương án điều tra, xây dựng phiếu điều tra, lựa chọn và tập huấn cán bộ điều tra càng làm tốt, sai số điều tra càng giảm. - Tiến hành kiểm tra có hệ thống toàn bộ cuộc điều tra: kiểm tra là biện pháp có hiệu quả để sửa chữa, uốn nắn kịp thời các sai lầm có thể mắc phải trong quá trình điều tra. Việc 20 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  21. kiểm tra có thể được tiến hành theo nhiều giai đoạn khác nhau. Trước hết, cần tiến hành kiểm tra ngay từ giai đoạn chuẩn bị xem các khâu cần chuẩn bị đã được đầy đủ, chu đáo chưa. Việc kiểm tra trong giai đoạn thu thập thông tin, việc ghi chép số liệu ban đầu nhằm nâng cao ý thức trách nhiệm của nhân viên điều tra cũng có ý nghĩa quan trọng. Nghiệm thu phiếu điều tra là một khâu kiểm tra có ý nghĩa quyết định. Trong giai đoạn này, người ta cần kiểm tra xem các phiếu điều tra có đầy đủ không; Các câu trả lời, các con số được ghi chép trong từng phiếu có được tính toán đúng, đủ không, có hợp logic không, có mâu thuẫn với nhau không Nhìn chung, việc kiểm tra, nghiệm thu phiếu điều tra có tác dụng rất lớn, nhưng nó đòi hỏi người kiểm tra phải có trình độ, kinh nghiệm, hiểu biết thực tế và rất nhạy cảm. Tiếp theo, việc nhập số liệu vào máy cũng cần được kiểm tra thật kỹ lưỡng. Thực tế cho thấy đây cũng là một khâu dễ làm phát sinh sai số. Nhiều cuộc điều tra, người ta yêu cầu nhập hai lần độc lập nhau, để khắc phục những sai sót có thể xảy ra trong quá trình nhập số liệu. Ngoài ra, trong các cuộc điều tra không toàn bộ, người ta còn tiến hành kiểm tra tính đại diện của các đơn vị được chọn để điều tra. 21 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  22. BÀI TẬP 1.1 Thảo luận và so sánh các khái niệm: Tiêu thức thống kê, chỉ tiêu thống kê, tiêu chí thống kê. Cho thí dụ minh hoạ. 1.2 Phân biệt thống kê mô tả và thống kê suy luận (phân tích) 1.3 Thảo luận và so sánh các thang đo khác nhau 1.4 Năm mùi vị kem được xếp hạng theo sở thích. Cần sử dụng thang đo nào? 1.5 Thang đo đối với màu sắc đai lưng trong môn Karate là gì? 1.6 Một phiếu đăng kí hoàn thuế cá nhân, bên cạnh những nội dung khác, hỏi về các thông tin sau: thu nhập, số nhân khẩu ăn theo, đang sống độc thân hay sống cùng vợ/chồng, các khoản giảm trừ có được phân loại hay không, tiền thuế nộp. Hãy mô tả thước đo của từng biến số, và nêu rõ biến số là biến định tính hay định lượng. 1.7 Một công ty điện lực thực hiện một cuộc điều tra với các câu hỏi về các nội dung sau: 1. Tuổi của chủ hộ gia đình 2. Giới tính của chủ hộ 3. Số lượng nhân khẩu 4. Việc sử dụng điện năng để tạo ra nhiệt lượng (Có hoặc Không) 5. Số lượng thiết bị lớn được sử dụng hằng ngày 6. Thiết bị sưởi trong mùa đông 7. Số giờ đốt nóng bình quân 8. Số ngày đốt nóng bình quân 9. Thu nhập của hộ gia đình 10. Chi phí tiền điện bình quân hằng tháng theo hoá đơn 11. Thứ hạng của công ty điện lực này trong mối quan hệ so sánh với 2 nhà cung cấp điện năng trước đó Hãy xác định các biến số ẩn dưới 11 nội dung trên như là biến số định lượng hay định tính, và mô tả các thang đo. 1.8 Một thị trấn có 15 gia đình. Nếu bạn phỏng vấn tất cả mọi người trong một gia đình riêng biệt, bạn đang phỏng vấn tổng thể hay một mẫu từ thị trấn đó? Đây có phải là mẫu ngẫu nhiên hay không? Nếu bạn có danh sách tất cả mọi người sống trong thị trấn, và bạn lựa chọn ngẫu nhiên 100 người từ tất cả các gia đình, đây có phải là mẫu ngẫu nhiên không? 1.9 Thiết kế một nghiên cứu trên giác độ thống kê về một vấn đề mà anh/chị quan tâm. 22 THỐNG KÊ TRONG KINH DOANH Chương 1 – Giới thiệu chung và thu thập dữ liệu
  23. CHƯƠNG 2 TRÌNH BÀY DỮ LIỆU BẰNG BẢNG VÀ ĐỒ THỊ Như bài 1 đã trình bày, dữ liệu thu thập được qua điều tra thống kê gồm 2 loại: dữ liệu định tính và dữ liệu định lượng. Dữ liệu định tính có biểu hiện là các thuộc tính, dữ liệu định lượng được biểu hiện thông qua các con số. Dữ liệu định lượng gồm 2 loại: rời rạc và liên tục. Việc trình bày các loại dữ liệu trên cần phải lựa chọn các phương pháp thích hợp. 1. Trình bày dữ liệu định lượng. Các bước trình bày dữ liệu định lượng Dữ liệu định lượng 41, 24, 32, 26, 27, 27, 30, 24, 38, 21 Tổ chức dữ liệu Phân tổ thống kê (Phân bố tần số) Sắp xếp theo thứ tự 21, 24, 24, 26, 27, 27, 30, 32, 38, 41 Bảng Đồ thị thống kê 2 1 4 4 6 7 7 3 0 2 8 4 1 Biểu đồ thân - lá Histograms Ogive 7 6 5 4 3 2 Polygons 1 0 10 20 30 40 50 60 Ogive 120 100 80 60 40 20 0 10 20 30 40 50 60 1.1. Tổ chức dữ liệu định lượng: - Sắp xếp số liệu theo thứ tự từ nhỏ đến lớn: bước đầu cho thấy đặc điểm về lượng của hiện tượng (lượng biến lớn nhất, nhỏ nhất, lượng biến phổ biến nhất ), là cơ sở cho việc lập bảng thống kê. - Biểu hiện dữ liệu bằng biểu đồ thân lá (Stem and leaf): bước đầu cho thấy đặc trưng phân phối của tập hợp dữ liệu. Nội dung cơ bản của phương pháp này là mỗi trị số trong tập hợp dữ liệu được chia thành hai phần: phần thân và phần lá. Tùy theo số chữ số của mỗi trị số trong tập hợp dữ liệu mà chia một hoặc một số chữ số bên trái là phần thân và một hoặc một số chữ số bên phải là phần lá. Để minh họa hãy theo dõi thí dụ dưới đây : THỐNG KÊ TRONG KINH DOANH 23 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  24. Thí dụ 1: Chẳng hạn có tập hợp dữ liệu: 26, 27, 13, 12, 58, 17, 53, 46, 21, 24, 44, 24, 41, 43, 35, 27, 38, 30, 37, 32 Đây là dữ liệu thô có được qua điều tra, chúng ta chưa thể đưa ra nhận xét gì về đặc điểm của tập hợp dữ liệu này. Trước hết sắp xếp tập hợp dữ liệu trên theo thứ tự tăng dần và có kết quả sau: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Rất dễ nhận thấy ngay các giá trị nhỏ nhất và lớn nhất trong tập hợp dữ liệu là 12 và 58, có 2 trị số được lặp lại 2 lần là 24 và 27. Để thấy được đặc điểm phân phối của tập hợp dữ liệu này hãy tiến hành thiết kế biểu đồ thân lá. Chúng ta bắt đầu từ việc xác định thân và lá. Mỗi trị số chỉ có hai chữ số, nên việc xác định đơn giản chỉ là chữ số hàng chục là thân và chữ số hàng đơn vị là lá. Như vậy phần thân sẽ gồm 1, 2, 3, 4, 5 và sắp xếp như sau: Thân Lá 1 2 3 4 5 Sau đó lần lượt sắp xếp các trị số của tập hợp dữ liệu vào các bộ phận của phần thân này. Chẳng hạn, số 12 ghi ở phần lá chữ số 2 tương ứng với phần thân là 1 Tuần tự tiến hành như vậy sẽ có biểu đồ thân lá như sau: Thân Lá 1 2 3 7 2 1 4 4 6 7 7 3 0 2 5 7 8 4 1 3 4 6 5 3 8 Chú ý: trên thực tế khi phần thân ít và phần lá ở mỗi thân quá nhiều chúng ta có thể tách thành hai phần dưới và trên: phần thân dưới sẽ có các lá là các chữ số từ 0 đến 4, phần thân trên sẽ có các lá là các chữ số từ 5 đến 9. Để thấy rõ ý nghĩa ứng dụng của biểu đồ thân lá, hãy xét một tình huống cụ thể như sau: Thí dụ 2: Giám đốc 1 công ty tin học dự định trả mức lương 1.900.000 VNĐ/ tháng cho một lập trình viên làm tại công ty với 3 năm kinh nghiệm. Để biết mức lương này đã là thỏa đáng hay chưa, ông ta tổ chức một cuộc điều tra 30 lập trình viên làm cho các công ty cạnh tranh với 3 năm kinh nghiệm. Kết quả điều tra như sau (đơn vị tính: nghìn đồng/tháng): THỐNG KÊ TRONG KINH DOANH 24 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  25. 1.500 1.700 1.600 2.100 1.700 1.800 1.650 1.550 1.900 1.850 1.650 1.700 1.500 1.800 1.600 1.600 1.400 1.850 1.800 1.900 1.500 1.700 1.800 1.750 1.800 1.800 2.100 2.200 2.050 1.800 Số liệu đã sắp xếp: 1.400 1.600 1.700 1.800 1.900 1.500 1.600 1.700 1.800 1.900 1.500 1.650 1.750 1.800 2.050 1.500 1.650 1.800 1.800 2.100 1.550 1.700 1.800 1.850 2.100 1.600 1.700 1.800 1.850 2.200 Qua dữ liệu đã sắp xếp cho thấy mức tiền lương thấp nhất là 1400 ng.đ, mức cao nhất là 2200 ng.đ và mức tiền lương có nhiều người nhất (phổ biến nhất) là 1800 ng.đ. Để có nhận xét đầy đủ hơn về đặc điểm phân phối của các mức tiền lương có thể lập biểu đồ thân lá như sau: Thân Lá (mỗi lá tương ứng với 2 chữ số) 14 00 15 00 00 00 50 16 00 00 00 50 50 17 00 00 00 00 50 18 00 00 00 00 00 00 00 50 50 19 00 00 20 50 21 00 00 22 00 Biểu đồ thân lá cho thấy mức lương phổ biến nhất là từ 1800 đến dưới 1900 ng.đ; số người có mức lương dưới 1900 ng.đ chiếm đa số và chỉ có 4 người trên mức lương này. Điều đó khẳng định rằng ông giám đốc dự định trả mức lương 1900 ng.đ là mức lương rất thỏa đáng. Với mức lương đó không những đã làm cho các lập trình viên ở Công ty của ông yên tâm và tích cực làm việc mà còn có thể thu hút lao động và cạnh tranh với các Công ty khác. Như vậy chỉ bằng việc tổ chức dữ liệu hợp lý đã có thể có những kết luận đáng tin cậy làm cơ sở cho việc ra quyết định quản lý. Qua các thí dụ trên cho thấy biểu đồ thân lá cũng gần giống biểu đồ phân phối (Histograms), ở đây mỗi trị số của phần thân tương ứng với một cột trong biểu đồ phân phối, số lượng lá tương ứng với chiều cao của các cột đó. Tuy nhiên các lá trong biểu đồ thân lá không chỉ cho thấy chiều cao của cột (hay tần số trong phân phối ) lớn hay nhỏ mà còn giúp ta quan sát chi tiết từng trị số cụ thể nhằm phân tích sâu sắc và đầy đủ hơn phân phối của cả THỐNG KÊ TRONG KINH DOANH 25 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  26. tổng thể nói chung và từng bộ phận nói riêng. Điều đó làm cho biểu đồ thân lá có lợi thế hơn khi tóm tắt và trình bày dữ liệu, nhưng chỉ trong trường hợp tập hợp dữ liệu không lớn. Khi quy mô của bộ dữ liệu lên tới hàng trăm, hàng nghìn hoặc nhiều hơn nữa thì sẽ rối mắt và biểu đồ thân lá không còn phù hợp. Lúc này bảng phân bố tần số sẽ thích hợp hơn. 1.2. Lý thuyết phân tổ thống kê. 1.2.1. Một số vấn đề chung về phân tổ thống kê 1.2.1.1. Khái niệm về phân tổ thống kê. Ta đã biết, hiện tượng và quá trình kinh tế xã hội mà thống kê học nghiên cứu thường rất phức tạp, vì chúng tồn tại và phát triển dưới nhiều loại hình có quy mô và đặc điểm khác nhau. Trong kết cấu nội bộ của hiện tượng nghiên cứu thường bao gồm nhiều tổ, nhiều bộ phận có tính chất khác nhau. Muốn phản ánh được bản chất và quy luật phát triển của hiện tượng, nếu chỉ dựa vào những con số tổng cộng chung chung thì không thể nêu được vấn đề một cách sâu sắc. Phải tìm cách nêu lên được đặc trưng của từng loại hình, của từng bộ phận cấu thành hiện tượng phức tạp, đánh giá tầm quan trọng của mỗi bộ phận, nêu lên mối liên hệ giữa các bộ phận, rồi từ đó nhận thức được các đặc trưng chung của toàn bộ. Yêu cầu nói trên chỉ có thể giải quyết được bằng phương pháp phân tổ thống kê. Phân tổ thống kê là căn cứ vào một (hay một số) tiêu thức nào đó để tiến hành phân chia các đơn vị của hiện tượng nghiên cứu thành các tổ (và các tiểu tổ) có tính chất khác nhau. Chẳng hạn, khi nghiên cứu tình hình nhân khẩu, căn cứ vào tiêu thức “giới tính” để chia tổng số nhân khẩu thành hai tổ: nam và nữ; còn căn cứ vào tiêu thức “tuổi” để chia số nhân khẩu này thành nhiều tổ có độ tuổi khác nhau. Hay khi nghiên cứu tình hình sản xuất của các doanh nghiệp công nghiệp, có thể chia tổng số doanh nghiệp thành các nhóm theo các tiêu thức như: thành phần kinh tế, ngành sản xuất, số lượng lao động, giá trị sản xuất công nghiệp Khi phân tổ thống kê, trước hết ta thực hiện được việc nghiên cứu cái chung và cái riêng một cách kết hợp. Các đơn vị tổng thể được tập hợp lại thành một số tổ (và tiểu tổ): giữa các tổ đều có sự khác nhau rõ rệt về tính chất, còn trong phạm vi mỗi tổ các đơn vị đều có sự giống nhau (hay gần giống nhau) về tính chất theo tiêu thức được dùng làm căn cứ phân tổ. Phân tổ thống kê là phương pháp cơ bản để tiến hành tổng hợp thống kê, vì ta sẽ không thể tiến hành hệ thống hoá một cách khoa học các tài liệu thu được qua điều tra, nếu không áp đụng phương pháp này. Tính chất phức tạp của hiện tượng nghiên cứu đòi hỏi phải tổng hợp theo từng tổ, từng bộ phận. Vì vậy, khi tổng hợp thống kê, trước hết, người ta thường sắp xếp các đơn vị vào từng tổ, từng bộ phận, tính toán các đặc điểm của mỗi tổ hoặc bộ phận, rồi sau đó mới tính các đặc điểm chung của cả tổng thể. THỐNG KÊ TRONG KINH DOANH 26 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  27. Phân tổ thống kê là một trong các phương pháp quan trọng của phân tích thống kê, đồng thời là cơ sở để vận dụng các phương pháp phân tích thống kê khác. Chỉ sau khi đã phân chia tổng thể nghiên cứu thành các tổ có quy mô và đặc điểm khác nhau, việc tính các chỉ tiêu phản ánh mức độ, tình hình biến động, mối liên hệ giữa các hiện tượng mới có ý nghĩa đúng đắn. Nếu việc phân tổ không chính xác, tổng thể được chia thành những bộ phận không đúng với thực tế, thì mọi chỉ tiêu tính ra cũng không giúp ta rút ra được những kết luận đúng đắn. Phương pháp phân tổ được vận dụng phổ biến nhất trong mọi trường hợp nghiên cứu kinh tế, vì không những phương pháp này đơn giản, dễ hiểu mà lại có tác dụng phân tích sâu sắc. Các phương pháp phân tích thống kê khác như: phương pháp số tương đối, phương pháp số bình quân, phương pháp chỉ số, phương pháp bảng cân đối, phương pháp tương quan thường cũng phải dựa trên các kết quả phân tổ thống kê chính xác. Phân tổ thống kê còn được vận dụng ngay trong giai đoạn điều tra thống kê, nhằm phân tổ đối tượng diều tra thành những bộ phận có đặc điểm tính chất khác nhau từ đó chọn các đơn vị điều điều tra sao cho có tính đại biểu cho tổng thể chung. Phân tổ thống kê giải quyết những nhiệm vụ nghiên cứu cơ bản sau đây: Thứ nhất, phân tổ thực hiện việc phân chia các loại hình kinh tế xã hội của hiện tượng nghiên cứu. Hiện tượng kinh tế xã hội mà thống kê học nghiên cứu thường không phải là tổng thể đồng chất, mà là tổng thể bao gồm nhiều đơn vị thuộc các loại hình rất khác nhau, phát triển theo những xu hướng không giống nhau. Vì vậy phương pháp nghiên cứu khoa học là phải nêu lên các đặc trưng riêng biệt của từng loại hình và mối quan hệ giữa các loại hình đó với nhau. Muốn vậy, trước hết phải dựa trên lý luận kinh tế chính trị xã hội để phân biệt các bộ phận khác nhau về tính chất đang tồn tại khách quan trong nội bộ hiện tượng. Thứ hai, phân tổ có nhiệm vụ biểu hiện kết cấu của hiện tượng nghiên cứu. Ta biết rằng một hiện tượng kinh tế xã hội do nhiều bộ phận, nhiều nhóm đơn vị có tính chất khác nhau hợp thành. Các bộ phận hay nhóm này chiếm những tỷ trọng khác nhau trong tổng thể và nói lên tầm quan trọng của mình trong tổng thể đó. Mặt khác, tỷ trọng của các bộ phận còn nói lên kết cấu của tổng thể theo một tiêu thức nào đó. Muốn nghiên cứu được kết cấu của tổng thể, phải dựa trên cơ sở phân tổ thống kê. Thứ ba, phân tổ được dùng để biểu hiện mối liên hệ giữa các tiêu thức. Hiện tượng kinh tế xã hội phát sinh và biến động không phải một cách ngẫu nhiên, tách rời với các hiện tượng xung quanh, mà chúng có liên hệ và phụ thuộc lẫn nhau theo những quy luật nhất định. Giữa các tiêu thức mà thống kê nghiên cứu cũng thường có mối liên hệ với nhau: sự thay đổi của tiêu thức này sẽ đưa đến sự thay đổi của tiêu thức kia theo một quy luật nhất định. Tìm hiểu tính chất và trình độ của mối liên hệ giữa các hiện tượng nói chung và giữa các tiêu thức nói riêng là một trong các nhiệm vụ quan trọng của nghiên cứu thống kê. Phân tổ thống kê là một trong các phương pháp có thể giúp ta thực hiện nhiệm vụ nghiên cứu này. 1.2.1.2. Các loại phân tổ thống kê. Trong thống kê thường có các cách phân loại phân tổ thống kê như sau: THỐNG KÊ TRONG KINH DOANH 27 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  28. a) Căn cứ vào nhiệm vụ của phân tổ thống kê Tương ứng với ba nhiệm vụ nói trên của phân tổ thống kê, có ba loại phân tổ : Phân tổ phân loại; phân tổ kết cấu và phân tổ liên hệ *) Phân tổ phân loại: Phân tổ phân loại giúp ta nghiên cứu một cách có phân biệt các loại hình kinh tế xã hội, nêu lên đặc trưng và mối quan hệ giữa chúng với nhau. Từ việc nghiên cứu riêng biệt mỗi loại hình đó, tiến thêm một bước nghiên cứu các đặc trưng của toàn bộ hiện tượng phức tạp, giải thích một cách sâu sắc bản chất và xu hướng phát triển của hiện tượng trong điều kiện thời gian và địa điểm cụ thể. Tuỳ theo mục đích nghiên cứu, có thể phân loại các đơn vị theo nhiều tiêu thức khác nhau. Chẳng hạn, các doanh nghiệp công nghiệp nước ta có thể được phân loại theo thành phần kinh tế, theo cấp quản lý, theo nhóm, theo ngành, theo quy mô *) Phân tổ kết cấu: Trong công tác nghiên cứu thống kê, các bảng phân tổ kết cấu được sử dụng rất phổ biến, nhằm mục đích nêu lên bản chất của hiện tượng trong điều kiện nhất định và để nghiên cứu xu hướng phát triển của hiện tượng qua thời gian. Kết cấu của tổng thể phản ánh một trong các đặc trưng cơ bản của hiện tượng trong điều kiện thời gian và địa điểm cụ thể. Sự thay đổi kết cấu của tổng thể qua thời gian có thể giúp ta thấy được xu hướng phát triển của hiện tượng. Chẳng hạn sự thay đổi kết cấu về tổng sản phẩm trong nước phân theo nhóm ngành (khu vực kinh tế) phản ánh sự chuyển dịch cơ cấu ngành kinh tế trong quá trình phát triển của Việt Nam như sau: Bảng 2.1. Cơ cấu tổng sản phẩm trong nước theo nhóm ngành giai đoạn 2000 - 2004 Đơn vị: % Tổng sản phẩm trong nước phân 2000 2001 2002 2003 2004 theo nhóm ngành Nông, lâm nghiệp và thuỷ sản 24,53 23,24 23,03 22,54 21,76 Công nghiệp và xây dựng 36,73 38,13 38,49 39,47 40,09 Dịch vụ 38,74 38,63 38,48 37,99 38,15 Cộng 100,00 100,00 100,00 100,00 100,00 (Nguồn: Niên giám Thống kê 2004 trang 71) Qua bảng phân tổ kết cấu trên, sự thay đổi về tỷ trọng của 3 nhóm ngành đã nói lên một phần quá trình chuyển dịch cơ cấu ngành ở Việt Nam, cụ thể nhóm ngành công nghiệp và xây dựng chiếm tỷ trọng lớn và đang có xu hướng tăng, nhóm ngành nông, lâm và thuỷ sản chiếm tỷ trọng nhỏ lại đang có xu hướng giảm THỐNG KÊ TRONG KINH DOANH 28 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  29. Phân tổ kết cấu giúp ta có thể so sánh được bản chất của các hiện tượng cùng loại trong điều kiện không gian khác nhau. Ví dụ, có thể so sánh cơ cấu công nhân của hai nhà máy, cơ cấu giống lúa của hai hợp tác xã. Phân tổ kết cấu còn được vận dụng trong phân tích thực hiện kế hoạch để thấy rõ tỷ trọng các bộ phận chưa hoàn thành, hoàn thành và hoàn thành vượt mức kế hoạch. Từ đó có thể đánh giá việc thực hiện kế hoạch; xem xét lại việc đặt kế hoạch như vậy có hợp lý không và có thể tính được khả năng tiềm tàng vượt mức kế hoạch, trên cơ sở kết hợp với các giả thiết khác. Trong nhiều trường hợp nghiên cứu, phân tổ kết cấu có thể được xác định ngay trên cơ sở phân tổ phân loại, như vậy là hai loại phân tổ này thường kết hợp chặt chẽ với nhau. Mặt khác, ngay cả đối với một tổng thể đồng chất cũng vẫn thường bao gồm các bộ phận khác nhau do nhiều nguyên nhân cụ thể, cho nên vẫn cần phân tổ kết cấu. Như tổng thể công nhân thuộc cùng một nghề trong cùng một doanh nghiệp, số công nhân này vẫn khác nhau về giới tính, về tuổi nghề, về bậc thợ và về nhiều đặc điểm khác. Như vậy là phân tổ kết cấu rất cần thiết đối với bất kỳ công tác nghiên cứu thống kê nào. *) Phân tổ liên hệ. Khi tiến hành phân tổ liên hệ, các tiêu thức có liên hệ với nhau được phân biệt thành hai loại: tiêu thức nguyên nhân và tiêu thức kết quả. Tiêu thức nguyên nhân là tiêu thức gây ảnh hưởng; sự biến động của tiêu thức này sẽ dẫn đến sự thay đổi (tăng hoặc giảm) của tiêu thức phụ thuộc mà ta gọi là tiêu thức kết quả - một cách có hệ thống. Như vậy, các đơn vị tổng thể trước hết được phân tổ theo một tiêu thức (thường là tiêu thức nguyên nhân), sau đó trong mỗi tổ tiếp tục tính các trị số bình quân của tiêu thức còn lại (thường là tiêu thức kết quả). Quan sát sự biến thiên của hai tiêu thức này có thể giúp ta kết luận về tính chất của mối liên hệ giữa hai tiêu thức. Như trong nhiều doanh nghiệp công nghiệp, ta thường nhận thấy có mối liên hệ giữa năng suất lao động và giá thành đơn vị sản phẩm: năng suất lao động càng tăng thì giá thành đơn vị sản phẩm càng có điều kiện giảm. Nếu ta phân tổ các doanh nghiệp trong cùng một ngành theo năng suất lao động, sau đó từ mỗi tổ tính ra giá thành bình quân đơn vị sản phẩm, thì các kết quả tính toán sẽ cho thấy rõ mối liên hệ giữa năng suất lao động (trong trường hợp này là tiêu thức nguyên nhân) và giá thành đơn vị sản phẩm (trong trường hợp này là tiêu thức kết quả). Phân tổ liên hệ còn có thể được vận dụng để nghiên cứu mối liên hệ giữa nhiều tiêu thức. Có thể nghiên cứu mối liên hệ giữa năng suất lúa với lượng phân bón, lượng nước tưới, mật độ cấy ; hoặc nghiên cứu mối liên hệ giữa năng suất lao động của công nhân với tuổi nghề, bậc thợ, trình độ trang bị kỹ thuật Khi phân tổ liên hệ giữa nhiều tiêu thức (ví dụ, 3 tiêu thức) trước hết tổng thể được phân tổ theo một tiêu thức nguyên nhân, sau đó mỗi tổ lại được chia thành các tiểu tổ theo tiêu thức nguyên nhân thứ hai, cuối cùng tính trị số tổng hoặc bình quân của tiêu thức kết quả cho từng tổ và tiểu tổ đó. Sau đây là thí dụ về mối liên hệ giữa năng suất lao động với trình độ kỹ thuật và tuổi nghề của công nhân trong một doanh nghiệp, được trình bày thành bảng phân tổ kết hợp như sau: THỐNG KÊ TRONG KINH DOANH 29 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  30. Bảng 2.2. Mối liên hệ giữa năng suất lao động với trình độ kỹ thuật và tuổi nghề Phân tổ công nhân Số công Sản lượng cả năm Năng suất lao động Theo trình độ kỹ Theo tuổi nghề nhân (tấn) bình quân năm thuật (năm) (tấn) Đã được đào tạo Dưới 5 15 1125 75 kỹ thuật 5 – 10 40 3750 94 10 – 15 40 4200 105 15 – 20 15 1725 115 20 trở lên 10 1200 120 Cả tổ - 120 12000 100 Chưa được đào Dưới 5 10 510 51 tạo kỹ thuật 5 – 10 30 2140 71 10 – 15 20 1580 79 15 – 20 10 860 86 20 trở lên 10 910 91 Cả tổ - 80 6000 75 Chung cho cả doanh nghiệp - 200 18000 90 b) Căn cứ vào số lượng tiêu thức của phân tổ. Theo định nghĩa phân tổ thống kê, chúng ta có thể căn cứ vào một hay một số tiêu thức để tiến hành phân tổ. Vì vậy, có thể phân thành hai loại: phân tổ theo một tiêu thức và phân tổ theo nhiều tiêu thức. *) Phân tổ theo một tiêu thức: Là tiến hành phân chia các đơn vị thuộc hiện tượng nghiên cứu thành các tổ có tính chất khác nhau trên cơ sở một tiêu thức thống kê hay còn gọi là phân tổ giản đơn. Chẳng hạn, theo tiêu thức giới tính, tổng thể dân số được chia thành 2 tổ: Nam và Nữ; hoặc theo tiêu thức thành phần kinh tế, Tổng sản phẩm được chia thành 5 tổ tương ứng với 5 thành phần kinh tế hiện nay *) Phân tổ theo nhiều tiêu thức: Là tiến hành phân chia các đơn vị thuộc hiện tượng nghiên cứu thành các tổ và các tiểu tổ có tính chất khác nhau trên cơ sở nhiều tiêu thức thống kê (từ hai tiêu thức trở lên). Tuỳ thuộc vào mục đích nghiên cứu, đặc điểm của hiện tượng và các tiêu thức phân tổ mà phân tổ theo nhiều tiêu thức được chia thành hai loại: Phân tổ kết hợp và phân tổ nhiều chiều Phân tổ kết hợp là tiến hành phân tổ lần lượt theo từng tiêu thức một. Các tiêu thức được sắp xếp theo thứ tự phù hợp với mục đích nghiên và đặc điểm của hiện tượng. Thông thường người ta hay phân tổ theo tiêu thức liên quan trực tiếp đến mục đích nghiên cứu và có ít biểu hiện trước. Chẳng hạn, tổng thể Dân số trước hết được phân tổ theo tiêu thức giới tính, sau đó theo tiêu thức độ tuổi và đó là cơ sở để xây dựng tháp dân số, hoặc phân tổ tổng THỐNG KÊ TRONG KINH DOANH 30 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  31. thể một loại lao động nào đó của một doanh nghiệp theo mức lương và số năm kinh nghiệm Tuy nhiên theo cách này số tiêu thức phân tổ không nên quá nhiều (thường 2 hoặc 3) vì nếu không sẽ chia tổng thể thành quá nhiều bộ phận nhỏ có thể gây khó khăn cho việc phân tích. Phân tổ nhiều chiều là cùng một lúc phân tổ theo nhiều tiêu thức khác nhau nhưng có vai trò như nhau trong việc đánh giá hiện tượng. Chẳng hạn, để phản ánh quy mô của một doanh nghiệp có thể biểu hiện qua các tiêu thức: doanh thu, số lượng lao động, tổng vốn Các tiêu thức này khác nhau về số lượng và đơn vị tính nhưng đều biểu hiện quy mô của doanh nghiệp và việc sắp xếp thứ tự trước sau các tiêu thức này trong phân tổ các doanh nghiệp trong một ngành là không có ý nghĩa. Vì vậy phải cùng một lúc phân tổ theo tất cả các tiêu thức bằng cách đưa các tiêu thức này về một tiêu thức tổng hợp chung gọi là phân tổ nhiều chiều. 1.2.1.3. Tiêu thức phân tổ và chỉ tiêu giải thích. a) Tiêu thức phân tổ Tiêu thức phân tổ là tiêu thức được chọn làm căn cứ để tiến hành phân tổ thống kê. Lựa chọn tiêu thức phân tổ là vấn đề quan trọng đầu tiên phải đề ra và giải quyết chính xác. Tuy các đơn vị tổng thể có rất nhiều tiêu thức khác nhau, nhưng chúng ta không thể tuỳ tiện chọn bất kỳ tiêu thức nào làm căn cứ phân tổ. Tiêu thức phân tổ khác nhau sẽ nói lên những mặt khác nhau của hiện tượng. Có tiêu thức phân tổ nói rõ được bản chất của hiện tượng, nhưng cũng có tiêu thức, nếu được chọn làm căn cứ phân tổ, sẽ không đáp ứng mục đích nghiên cứu, thậm chí còn làm cho ta hiểu sai lệch bản chất của hiện tượng. Bởi vì cũng những tài liệu như nhau mà cách sắp xếp khác nhau, lại đưa đến những kết luận trái ngược hẳn với nhau. Như vậy, việc phân tổ chính xác và khoa học trước hết phụ thuộc vào việc lựa chọn tiêu thức phân tổ. b) Các chỉ tiêu giải thích Trong phân tổ thống kê, sau khi đã lựa chọn được tiêu thức phân tổ, xác định số tổ cần thiết và khoảng cách tổ, còn phải xác định các chỉ tiêu giải thích để nói rõ đặc trưng của các tổ cũng như của toàn bộ tổng thể. Chẳng hạn, sau khi phân tổ các doanh nghiệp công nghiệp theo khu vực và thành phần kinh tế, có thể đưa ra một số chỉ tiêu giải thích như sau: Bảng 2.3 Bảng phân tổ các doanh nghiệp công nghiệp theo khu vực và thành phần kinh tế năm 2003 Phân tổ các doanh nghiệp theo Số Số Doanh thu DT thuần thành phần kinh tế doanh lao động thuần b/quân 1 lđ nghiệp (người) (tỷ đồng) (tr.đ/người) 1. Khu vực DN Nhà nước 4.845 2.264.942 678.735 300 Trong đó: THỐNG KÊ TRONG KINH DOANH 31 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  32. - DN Nhà nước trung ương 1.898 1.463.954 513.509 351 - DN Nhà nước địa phương 2.947 800.988 165.226 206 2. Khu vực DN ngoài Nhà nước 64.526 2.049.891 485.104 237 Trong đó: - DN tập thể 4.150 160.949 12.705 79 - DN tư nhân 25.653 378.087 104.043 275 - Công ty hợp danh 18 655 10.409 15.892 - Công ty TNHH tư nhân 30.164 1.143.055 270.993 237 - CTy cổ phần có vốn Nhà nước 669 160.879 43.298 269 - CTy cổ phần không có vốn Nhà 3.872 206.266 43.656 212 nước 3. Khu vực có vốn đầu tư nước ngoài. 2.641 860.259 292.932 341 Trong đó: - DN 100% vốn nước ngoài - DN liên doanh với nước ngoài 1.869 687.725 131.158 191 772 172.534 161.774 938 Chung 72.012 5.175.092 1.456.771 281 (Nguồn: Thực trạng doanh nghiệp qua kết quả điều tra năm 2002, 2003, 2004 - Nhà xuất bản Thống kê) Mỗi chỉ tiêu giải thích có ý nghĩa quan trọng riêng giúp ta thấy rõ các đặc trưng số lượng của từng tổ cũng như của toàn bộ tổng thể, làm căn cứ để so sánh các tổ với nhau và để tính ra hàng loạt chỉ tiêu phân tích khác. Tuy nhiên, cũng không nên đề ra quá nhiều chỉ tiêu, mà phải lựa chọn một số chỉ tiêu nào thích hợp nhất đối với mục đích nghiên cứu. Muốn xác định các chỉ tiêu giải thích, chủ yếu phải căn cứ vào mục đích nghiên cứu và nhiệm vụ của phân tổ để chọn ra các chỉ tiêu có liên hệ với nhau và bổ sung cho nhau. Mục đích nghiên cứu có thể tiếp cận từ nhiều khía cạnh khác nhau nên chỉ tiêu giải thích chọn ra phải hợp lý mới thoả mãn được mục đích nghiên cứu. Phải chọn các chỉ tiêu giải thích có liên hệ với nhau và bổ sung cho nhau, vì một chỉ tiêu chỉ có thể nói lên biểu hiện số lượng về một mặt nào đó của hiện tượng nghiên cứu, cho nên cần có các chỉ tiêu giải thích bổ sung cho nhau mới giúp cho việc nghiên cứu được sâu sắc. Cũng cần chú ý tới mối quan hệ nhất định giữa tiêu thức phân tổ với các chỉ tiêu giải thích. Chẳng hạn, khi phân tổ các xí nghiệp theo quy mô, thì các chỉ tiêu giải thích như: số lượng lao động, giá trị tài sản cố định, giá trị sản xuất là những chỉ tiêu giúp ta hiểu rõ thêm về quy mô của xí nghiệp. Trái lại, nếu chọn các chỉ tiêu giải thích như: mức độ hoàn thành kế hoạch, tiền lương bình quân thì các chỉ tiêu này thường không trực tiếp chịu ảnh hưởng bởi quy mô của xí nghiệp. Các chỉ tiêu giải thích có ý nghĩa quan trọng trong việc so sánh với nhau cần được bố trí gần nhau. Chẳng hạn, nên bố trí chỉ tiêu thực hiện gần chỉ tiêu kế hoạch, chỉ tiêu tương đối gần chỉ tiêu tuyệt đối có liên quan THỐNG KÊ TRONG KINH DOANH 32 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  33. 1.2.2. Các bước phân tổ thống kê 1.2.2.1 Lựa chọn tiêu thức phân tổ Lựa chọn tiêu thức phân tổ là bước đầu tiên làm cơ sở để tiến hành phân tổ. Lựa chọn tiêu thức chính xác, phù hợp với mục đích nghiên cứu thì kết quả phân tổ mới thực sự có ích cho việc phân tích đặc điểm và bản chất của hiện tượng. Có thể nêu ra những yêu cầu sau đây về lựa chọn tiêu thức phân tổ: Thứ nhất, phải dựa trên cơ sở phân tích lý luận một cách sâu sắc để chọn ra tiêu thức bản chất nhất, phù hợp với mục đích nghiên cứu. Tiêu thức bản chất là tiêu thức nói lên được bản chất của hiện tượng nghiên cứu, phản ánh đặc trưng cơ bản của hiện tượng trong điều kiện thời gian và địa điểm cụ thể. Bản chất của mỗi hiện tượng có thể được phản ánh qua nhiều tiêu thức khác nhau, cho nên phải tuỳ theo mục đích nghiên cứu mà dùng lý luận để chọn ra tiêu thức bản chất nhất. Chẳng hạn, muốn phân tổ các doanh nghiệp sản xuất công nghiệp để biểu hiện quy mô lớn nhỏ, ta phải căn cứ vào thực tế của các doanh nghiệp đó, để xét xem tiêu thức nào có khả năng phản ánh quy mô của chúng như: số lượng lao động, giá trị sản xuất, giá trị thiết bị chủ yếu, diện tích doanh nghiệp Đối với những doanh nghiệp mà quá trình sản xuất chủ yếu còn dựa vào sức lao động thì có thể chọn tiêu thức “số lượng lao động” để tiến hành phân tổ, vì số lượng lao động nhiều hay ít sẽ nói lên quy mô của doanh nghiệp lớn hay nhỏ. Nhưng đối với doanh nghiệp mà quá trình sản xuất đã được cơ giới hoá hoặc tự động hoá cao, thì muốn biểu hiện quy mô của chúng phải phân tổ theo các tiêu thức như: giá trị sản xuất, giá trị thiết bị sản xuất chủ yếu Đó là các tiêu thức bản chất nhất, có thể đáp ứng được mục đích nghiên cứu. Thứ hai, phải căn cứ vào điều kiện lịch sử cụ thể của hiện tượng nghiên cứu để chọn ra tiêu thức phân tổ thích hợp. Cùng một loại hiện tượng nghiên cứu, nhưng phát sinh trong những điều kiện thời gian và địa điểm khác nhau, thì bản chất có thể thay đổi khác nhau. Vì vậy, tiêu thức phân tổ cũng mang ý nghĩa khác nhau. Nếu chỉ dùng một tiêu thức phân tổ chung cho mọi trường hợp, thì tiêu thức đó trong điều kiện này có thể giúp ta nghiên cứu chính xác, nhưng trong điều kiện khác lại không có tác dụng gì cả. Thứ ba, phải tuỳ theo mục đích nghiên cứu và điều kiện tài liệu thực tế mà quyết định phân tổ hiện tượng theo một hay nhiều tiêu thức. Nói chung, hiện tượng nghiên cứu thường phức tạp, cho nên việc phân tổ theo một tiêu thức, dù là tiêu thức bản chất nhất cũng chỉ phản ánh được một mặt nào đó của hiện tượng. Nếu phân tổ kết hợp theo nhiều tiêu thức, sẽ phản ánh được nhiều mặt khác nhau của hiện tượng, các mặt này có thể bổ sung cho nhau và giúp cho việc nghiên cứu thêm sâu sắc. Trong nhiều trường hợp phân tổ kết hợp giúp ta nghiên cứu mối liên hệ giữa các tiêu thức. Ví dụ, có thể phân tổ nhân khẩu theo giới tính và theo độ tuổi (kết hợp hai tiêu thức), phân tổ các doanh nghiệp theo nhóm, theo ngành, và theo thành phần kinh tế (kết hợp ba tiêu thức). Tuy nhiên, cũng cần chú ý là không nên phân tổ kết hợp theo quá nhiều tiêu thức (trên ba THỐNG KÊ TRONG KINH DOANH 33 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  34. tiêu thức) vì làm như vậy số tổ và tiểu tổ sẽ tăng lên nhiều, tổng thể bị chia nhỏ nhiều quá sẽ trở ngại cho việc nghiên cứu. Thường người ta chỉ phân tổ kết hợp theo hai hay ba tiêu thức và nếu thấy cần thiết, có thể lập nhiều bảng phân tổ kết hợp khác nhau. 1.2.2.2 Xác định số tổ và khoảng cách tổ Sau khi đã chọn được tiêu thức phân tổ thích hợp, vấn đề tiếp theo là xét xem cần phân chia hiện tượng nghiên cứu thành bao nhiêu tổ và căn cứ vào đâu để xác định số tổ cần thiết đó. Số tổ cần thiết thường được xác định tuỳ theo tiêu thức phân tổ là tiêu thức thuộc tính hay tiêu thức số lượng. Đối với mỗi loại tiêu thức này, vấn đề xác định số tổ cần thiết được giải quyết khác nhau. a. Phân tổ theo tiêu thức thuộc tính: Khi phân tổ theo tiêu thức thuộc tính, các tổ được hình thành không phải do sự khác nhau về lượng biến của tiêu thức mà thường do các loại hình khác nhau, tuy nhiên không nhất thiết lúc nào mỗi loại hình cũng phải hình thành nên một tổ. Trường hợp các loại hình tương đối ít thì mỗi loại hình có thể hình thành nên 1 tổ, như khi phân tổ tổng thể nhân khẩu theo giới tính thì sẽ chia tổng thể đó thành 2 tổ là Nam và Nữ; hoặc phân tổ các doanh nghiệp theo thành phần kinh tế Trường hợp số loại hình thực tế nhiều, nếu coi mỗi loại hình là một tổ thì số tổ sẽ quá nhiều, không thể khái quát chung được và cũng không nêu rõ được sự khác nhau giữa các tổ, nên cần ghép những loại hình giống nhau hoặc gần giống nhau vào cùng một tổ. Chẳng hạn khi phân tổ tổng thể nhân khẩu theo nghề nghiệp, phân tổ các loại sản phẩm công, nông nghiệp, phân tổ các mặt hàng theo giá trị sử dụng, phân tổ các ngành kinh tế quốc dân , số tổ thực tế có thể rất nhiều, có khi tới hàng nghìn, hàng vạn, nếu cứ phân chia tổng thể theo số tổ thực tế đó thì việc phân tổ gặp rất nhiều khó khăn và có thể không giúp gì được cho phân tích thống kê. Trong những trường hợp này phải giải quyết bằng cách ghép nhiều tổ nhỏ lại thành một số tổ lớn, theo nguyên tắc các tổ nhỏ ghép lại với nhau phải giống nhau (hoặc gần giống nhau) về tính chất, về giá trị sử dụng, về loại hình Yêu cầu của việc ghép nhiều tổ nhỏ thành một số tổ lớn nhằm rút bớt số tổ thực tế quá nhiều, tạo điều kiện cho việc phân tổ được gọn và hợp lý. Trên thực tế, người ta thường tiến hành sắp xếp và trình bày trong những văn bản gọi là bảng phân loại hay bảng danh mục do Nhà nước quy định thống nhất và cố định trong một thời gian tương đối dài, nhằm bảo đảm tính chất so sánh được của tài liệu thống kê. b. Phân tổ theo tiêu thức số lượng: Khi phân tổ theo tiêu thức số lượng tuỳ theo lượng biến của tiêu thức thay đổi nhiều hay ít mà cách phân tổ được giải quyết khác nhau. Mặt khác, cũng cần chú ý đến số lượng đơn vị tổng thể nhiều hay ít mà xác định số tổ thích hợp. THỐNG KÊ TRONG KINH DOANH 34 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  35. - Trường hợp lượng biến của tiêu thức thay đổi ít, tức là sự biến thiên về mặt lượng giữa các đơn vị không chênh lệch nhiều lắm, biến động rời rạc và số lượng các lượng biến ít, như số người trong gia đình, số máy do một công nhân phụ trách thì ở đây, số tổ có một giới hạn nhất định và thường cứ mỗi lượng biến là cơ sở để hình thành một tổ. Ví dụ: phân tổ công nhân trong một nhà máy dệt theo số máy do mỗi người phụ trách như sau: Bảng 2.4 Phân tổ công nhân theo số máy do mỗi người phụ trách Số máy dệt mỗi công nhân phụ trách (máy) Số công nhân (người) 11 3 12 7 13 20 14 50 15 35 16 15 Cộng 130 Việc phân tổ trên đây rất đơn giản, vì lượng biến của tiêu thức phân tổ (số máy dệt) chỉ thay đổi trong phạm vi từ 11 đến 16 máy. Khi người công nhân đứng thêm được một máy, biểu hiện chất lượng công tác của họ đã thay đổi. Vì vậy, có thể căn cứ vào mỗi lượng biến để thành lập một tổ. Việc phân tổ như trên gọi là phân tổ không có khoảng cách tổ. - Trường hợp lượng biến của tiêu thức biến thiên rất lớn, ta không thể áp dụng cách phân tổ nói trên được, nghĩa là không thể căn cứ vào mỗi lượng biến lập nên một tổ vì làm như vậy số tổ sẽ quá nhiều và không nói rõ sự khác nhau về chất giữa các tổ. Trong trường hợp này ta cần chú ý mối liên hệ giữa lượng và chất trong phân tổ, xét cụ thể xem lượng biến tích luỹ đến một mức độ nào đó thì chất của hiện tượng mới thay đổi và làm nảy sinh ra một tổ khác. Như vậy, mỗi tổ sẽ bao gồm một phạm vi lượng biến, với hai giới hạn: giới han dưới là lượng biến nhỏ nhất để làm cho tổ đó được hình thành, và giới hạn trên là lượng biến lớn nhất của tổ đó, nếu vượt quá giới hạn đó thì chất của tổ thay đổi và chuyển thành tổ khác. Trị số chênh lệch giữa giới hạn trên và giới hạn dưới của mỗi tổ gọi là khoảng cách tổ. Việc phân tổ theo các giới hạn như vậy gọi là phân tổ có khoảng cách tổ. Các khoảng cách tổ có thể đều nhau hoặc không đều nhau. Chẳng hạn, theo tiêu thức “tiền lương” với đơn vị tính nghìn đồng của cán bộ công nhân viên trong một doanh nghiệp, có thể chia thành các tổ có khoảng cách tổ là : < 500 Từ 500 đến dưới 1.000 Từ 1.000 đến dưới 1.500 Từ 1.500 đến dưới 2.000 Từ 2.000 đến dưới 2.500 THỐNG KÊ TRONG KINH DOANH 35 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  36. Từ 2.500 đến dưới 3.000 Từ 3.000 trở lên Trong trường hợp trên, lượng biến của tiêu thức tiền lương được sắp xếp thành 7 tổ, các tổ có khoảng cách tổ đều nhau là 500 nghìn đồng, tổ đầu tiên và tổ cuối cùng gọi là tổ có khoảng cách tổ mở. Hoặc có tiêu thức “số lượng lao động” của 1 doanh nghiệp, có thể chia thành các tổ có khoảng cách tổ là: 1 – 100 101 – 200 201 – 500 501 – 1000 1001 – 3000 Trong trường hợp trên, các tổ có khoảng cách tổ không đều nhau. Như vậy, cần phân biệt khi nào phân tổ theo khoảng cách tổ đều nhau và khi nào dùng khoảng cách tổ không đều nhau? Nói chung, việc xác định khoảng cách tổ đều nhau hay không đều nhau là phải căn cứ vào đặc điểm của hiện tượng nghiên cứu. Phải bảo đảm các đơn vị được phân phối vào mỗi tổ đều có cùng một tính chất và sự khác nhau về chất giữa các tổ đó. Trong thực tế, sự thay đổi về lượng của các bộ phận trong hiện tượng xã hội thường không diễn biến một cách đều đặn, bởi vì sự khác nhau về chất của chúng cũng không đều nhau, do vậy có nhiều trường hợp nghiên cứu, phải phân tổ theo khoảng cách tổ không đều nhau. Riêng đối với các hiện tượng tương đối đồng nhất về mặt loại hình kinh tế xã hội và lượng biến trên các đơn vị thay đổi một cách tương đối đều đặn, có thể áp dụng việc phân tổ theo khoảng cách tổ đều nhau. Cách phân tổ này tạo điều kiện dễ dàng cho việc vận dụng các công thức toán học và để trình bày số liệu trên các đồ thị thống kê. Việc phân tổ theo khoảng cách tổ đều nhau tương đối đơn giản và trị số khoảng cách tổ được xác định theo công thức: xmax− x min h = n Trong đó: d – trị số khoảng cách tổ xmax – lượng biến lớn nhất của tiêu thức phân tổ xmin – lượng biến nhỏ nhất của tiêu thức phân tổ n – số tổ định chia Chẳng hạn, năng suất lao động trong một tháng của một doanh nghiệp cao nhất là 300 sản phẩm, thấp nhất là 200 sản phẩm. Chênh lệch là 300 - 200 = 100 sản phẩm. Dự kiến chia tổng thể lao động của doanh nghiệp thành 5 tổ, thì khoảng cách tổ sẽ bằng 100 : 5 = 20 sản phẩm. THỐNG KÊ TRONG KINH DOANH 36 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  37. Trên đây là lý luận về xác định số tổ cần thiết và khoảng cách tổ đối với các trường hợp phân tổ. Nói chung, khi tiến hành phân tổ cần chú ý sắp xếp làm sao cho số tổ đặt ra không quá nhiều hay quá ít, gây khó khăn cho việc nghiên cứu. Nếu số tổ quá nhiều, tổng thể bị xé lẻ, số đơn vị tổng thể bị phân tán vào nhiều tổ có tính chất giống nhau hoặc gần giống nhau; ngược lại, nếu số tổ quá ít thì các đơn vị có tính chất khác nhau sẽ được phân phối vào cùng một tổ, điều đó làm cho mọi kết luận rút ra sẽ kém chính xác. Mặt khác, cũng cần bảo đảm phân phối cho mỗi tổ một số lượng đơn vị cần thiết. Có như vậy, việc phân tích đặc trưng và mối liên hệ giữa các loại hình mới có ý nghĩa. Tuy nhiên, cũng không nên loại trừ những trường hợp đặc biệt, khi cần phân tổ để vạch rõ những đơn vị điển hình tiên tiến. Các đơn vị này khi mới phát sinh tuy chỉ chiếm một bộ phận nhỏ trong toàn bộ, nhưng lại có ý nghĩa rất lớn đối với việc động viên, thúc đẩy phong trào chung. 1.2.2.3 Phân phối các đơn vị vào từng tổ Sau khi xác định số tổ và khoảng cách tổ, bước cuối cùng là phân phối các đơn vị vào từng tổ và tính toán trị số của các chỉ tiêu giải thích (nếu có). Việc phân phối các đơn vị vào từng tổ căn cứ vào lượng biến của từng đơn vị tổng thể, vào số tổ và khoảng cách tổ đã xác định ở trên. Số lượng đơn vị của từng tổ nhiều hay ít, phân phối theo dạng nào là cơ sở để biểu hiện và phân tích đặc điểm cơ bản của hiện tượng cũng như tính toán các chỉ tiêu giải thích có liên quan hoặc các chỉ tiêu phản ánh bản chất của hiện tượng. Các chỉ tiêu giải thích được tính toán cho từng tổ và chung trên cơ sở số lượng các đơn vị trong từng tổ. Tuỳ theo các chỉ tiêu đó là chỉ tiêu tuyệt đối, tương đối hay bình quân mà xác định phương pháp tổng hợp hay tính toán cho phù hợp. 1.2.3. Phân bố tần số và tần số tích lũy 1.2.3.1 Bảng phân bố tần số và tần số tích lũy Sau khi phân tổ tổng thể theo một tiêu thức số lượng nào đó, các đơn vị tổng thể được phân phối vào trong các tổ và ta sẽ có một phân bố thống kê theo tiêu thức đó và được biểu diễn thành bảng phân bố tần số và tần số tích lũy. Bảng phân bố tần số và tần số tích lũy có nhiều tác dụng trong nghiên cứu thống kê. Người ta thường đùng các bảng phân bố này để khảo sát tình hình phân phối các đơn vị tổng thể theo một tiêu thức nghiên cứu, qua đó thấy được kết cấu của tổng thể và sự biến động kết cấu đó. Thí dụ: để khảo sát đặc điểm phân phối một tổng thể lao động theo mức lương người ta xây dựng một bảng phân bố tần số cho số lao động theo tiêu thức tiền lương Bảng phân bố tần số còn được dùng để tính ra nhiều chỉ tiêu nêu lên các đặc trưng của từng tổ và của tổng thể, biểu hiện mối liên hệ giữa các bộ phận hoặc giữa các tiêu thức. Một bảng phân bố tần số và tần số tích lũy gồm các thành phần chủ yếu sau: - Thành phần thứ nhất là lượng biến: Lượng biến là các trị số nói lên biểu hiện cụ thể của tiêu thức số lượng, thường được ký hiệu là xi . THỐNG KÊ TRONG KINH DOANH 37 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  38. Khi phân tổ theo tiêu thức số lượng có lượng biến rời rạc (là lượng biến chỉ có các biểu hiện bằng số nguyên, như: lượng biến của tiêu thức độ tuổi, số học sinh trong một lớp học, số lao động trong 1 doanh nghiệp ) thì bảng phân bố tần số có thể có khoảng cách tổ hoặc không có khoảng cách tổ. Nếu lượng biến của tiêu thức nghiên cứu biến thiên ít và chỉ có một vài trị số (như số nhân khẩu trong một gia đình, số máy dệt do mỗi công nhân phụ trách ) thì dãy số lượng biến không cần có khoảng cách tổ. Nếu lượng biến của dãy số này biến thiên trong phạm vi lớn (như số lao động của các xí nghiệp, số học sinh của các trường học ) thì bảng tần số cần phải có khoảng cách tổ. Trong trường hợp này giới hạn trên của tổ đứng trước và giới hạn dưới của tổ kế tiếp sau có thể khác nhau, chẳng hạn như khi phân tổ các doanh nghiệp theo số lượng lao động, giả sử có các tổ: từ 1 đến 100, từ 101 đến 500, từ 501 đến 1000, từ 1001 đến 2000 người Ở đây giới hạn trên của tổ đứng trước và giới hạn dưới của tổ đứng liền sau không giống nhau về trị số. Khi phân tổ theo tiêu thức số lượng có lượng biến liên tục (là lượng biến có thể được biểu hiện bằng những trị số bất kỳ cả số nguyên và số thập phân, như: lượng biến của tiêu thức năng suất thu hoạch lúa (đơn vị tính tạ/ha), tỷ lệ % hoàn thành kế hoạch ) thì bảng phân bố tần số theo tiêu thức nghiên cứu phải có khoảng cách tổ, bởi vì không thể căn cứ vào mỗi lượng biến bất kỳ để xác định một tổ, mà cần phải có một phạm vi lượng biến nhất định. Chẳng hạn như khi phân tổ lao động trong một doanh nghiệp theo mức lương, phân tổ các đơn vị sản xuất theo tỷ lệ % hoàn thành kế hoạch, phân tổ các hợp tác xã theo năng suất thu hoạch Ở đây, các lượng biến liên tục cho nên phải phân tổ có khoảng cách tổ. Trong trường hợp này, giới hạn trên của tổ đứng trước và giới hạn dưới của tổ kế tiếp có thể giống nhau về trị số. Chẳng hạn, khi phân tổ các doanh nghiệp theo tỷ lệ % hoàn thành kế hoạch, giả sử có các tổ: dưới 80%, từ 80% đến 90%, từ 90% đến 100%, từ 100% đến 110%, từ 110% đến 120% thì ở đây ta thấy một lượng biến nào đó có thể vừa là giới hạn trên của tổ này, lại vừa có thể là hạn dưới của tổ khác (như trong tổ thứ ba và tổ thứ tư, lượng biến 100% là giới hạn chung của cả 2 tổ). Vấn đề đặt ra là: nếu có một xí nghiệp hoàn thành đúng 100% kế hoạch, thì nên xếp vào tổ thứ ba hay tổ thứ tư? Ta thấy rằng trong một dãy số phân phối có lượng biến liên tục, việc sắp xếp của tổ có giới hạn trùng nhau như trên là hợp lý và cần thiết vì nó bảo đảm không còn một chỗ trống nào giữa các tổ. Mặt khác, cách sắp xếp như trên nói lên rằng mỗi tổ phải bao gồm giới hạn dưới của khoảng cách tổ, là lượng biến tối thiểu để cho tổ đó được hình thành. Như vậy, có nghĩa là doanh nghiệp nào hoàn thành đúng 100% kế hoạch phải được xếp vào tổ thứ tư (từ 100% đến 110%), là tổ bao gồm các doanh nghiệp hoàn thành và hoàn thành vượt mức kế hoạch. Đây chỉ là vấn đề có tính chất quy ước, phù hợp với tính chất của hiện tượng nghiên cứu. Để quy ước thống nhất cho mọi đối tượng sử dụng tài liệu có thể dùng khoảng cách tổ mở để biểu diễn ý nghĩa đó, khi đó cần lưu ý rằng dấu "=" chỉ nằm ở một cận dưới hoặc trên tuỳ theo đặc điểm của hiện tượng ý tưởng của người nghiên cứu. - Thành phần thứ hai của dãy số lượng biến là tần số. Tần số là số đơn vị được phân phối vào trong mỗi tổ, tức là số lần một lượng biến nhận một trị số nhất định trong một tổng thể. Tần số thường được ký hiệu bằng fi và ∑fi là tổng tần số hay tổng số đơn vị của tổng thể. THỐNG KÊ TRONG KINH DOANH 38 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  39. Khi tần số được biểu hiện bằng số tương đối gọi là tần suất, với đơn vị tính là lần hoặc % và ký hiệu bằng di (di = fi / ∑fi). Tần suất biểu hiện tỷ trọng của từng tổ trong tổng thể, vì vậy tổng tần suất (∑di ) sẽ bằng 1 nếu tính theo đơn vị lần và bằng 100 nếu tính theo đơn vị %. Trong phân tích thống kê, tần suất cho phép phân tích đặc điểm cấu thành của tổng thể nghiên cứu và quan sát sự biến động tần suất qua thời gian cho thấy xu hướng biến động về kết cấu của hiện tượng theo tiêu thức đang nghiên cứu. Với tác dụng đó nó thường được sử dụng trong việc phân tích chuyển dịch cơ cấu như phân tích chuyển dịch cơ cấu kinh tế, cơ cấu sản phẩm Ngoài hai thành phần trên, người ta thường tính tần số (hoặc tần suất) tích lũy tức là cộng dồn tần số (hoặc tần suất). Tần số tích luỹ (ký hiệu là Si) cho biết số đơn vị có lượng biến lớn hơn hoặc nhỏ hơn một lượng biến cụ thể nào đó và là cơ sở để xác định một đơn vị đứng ở vị trí nào đó trong dãy số có lượng biến là bao nhiêu. Trường hợp bảng phân bố tần số có các khoảng cách tổ không bằng nhau thì tần số của các tổ không thể so sánh được với nhau vì các trị số đó phụ thuộc vào trị số khoảng cách tổ. Khi đó người ta thường tính mật độ phân phối - là tỷ số giữa tần số và trị số khoảng cách tổ - và ký hiệu là mi (mi = fi / hi ). Tóm lại, có thể biểu diễn các thành phần của bảng phân bố tần số như sau: Lượng biến Tần số Tần suất Tần số tích luỹ (xi) (fi) (di ) ( Si ) x1 f1 d1 f1 x2 f2 d2 f1 + f2 x3 f3 d3 f1 + f2 + f3 . xn-1 fn-1 dn-1 f1 + f2 + + fn-1 xn fn dn f1 + f2 + + fn-1 + fn Cộng ∑fi ∑di = 1 hoặc 100% 1.2.3.2. Thí dụ về phân tổ và bảng phân bố tần số Trở lại thí dụ 2 ở mục 1.1 về mức lương của 30 lập trình viên, có thể phân tổ số người theo theo tiêu thức tiền lương bằng hai cách sau: - Phân tổ không có khoảng cách tổ : Là liệt kê tất cả các mức lương và số người có ở từng mức lương đó. Kết quả như sau: Mức lương Số người Mức lương Số người 1400 1 1800 7 THỐNG KÊ TRONG KINH DOANH 39 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  40. 1500 3 1850 2 1550 1 1900 2 1600 3 2050 1 1650 2 2100 2 1700 4 2200 1 1750 1 Với tổng thể nghiên cứu chỉ có 30 đơn vị mà có tới 13 mức lương khác nhau tương ứng với 13 tổ, vì vậy kết quả phân tổ trên chỉ dừng lại ở việc nhận xét mức lương nào là phổ biến nhất chứ chưa nêu lên đặc điểm phân phối của số lao động theo mức lương. - Phân tổ có khoảng cách tổ: Với số đơn vị nghiên cứu không nhiều (30), căn cứ vào biểu đồ thân lá đã xây dựng ở trên, có thể chia thành 4 tổ bằng cách ghép 2 trị số của phần thân vào thành một tổ. Cụ thể: Tổ thứ nhất sẽ gồm 2 trị số của phần thân là 14 và 15, tạo nên một tổ có khoảng cách tổ là từ 1400 đến dưới 1600 ng.đ, và tần số người có ở mức lương đó (tương ứng là số lá ở 2 phần thân đó) . Kết quả có bảng phân bố tần số như sau: Bảng 2.5 Phân tổ số lao động theo tiêu thức tiền lương Tiền lương Trị số giữa Tần số Tần suất (ng.đ) (ng.đ) (Số người) (%) Từ 1400 đến dưới 1600 1500 5 16,67 Từ 1600 đến dưới 1800 1700 10 33,33 Từ 1800 đến dưới 2000 1900 11 33,67 Từ 2000 đến dưới 2200 2100 4 13,33 Cộng 30 100,00 Qua bảng phân bố tần số và tần số tích lũy cho thấy: có tới 21/30 người (chiếm 79% trong tổng số) có mức lương nằm trong khoảng từ 1600 ng.đ đến 2000 ng.đ, sự phân bố rất tập trung ở khoảng giữa trong đó phần chiếm tỷ trọng lớn nhất là số người có mức lương từ 1800 ng.đ đến 2000 ng.đ (33,67%). Trên cơ sở bảng phân bố tần số này còn có thể vận dụng các phương pháp thống kê khác. Cũng với lý thuyết trên còn có thể phân tổ theo hai, ba tiêu thức để biểu diễn mối liên hệ giữa các tiêu thức. Hãy xét thí dụ sau: Thí dụ 3: Phân tổ theo hai tiêu thức với tình huống sau: Ông Giám đốc muốn biết là thực tế lương có được trả theo thâm niên công tác không. Ông ta tổ chức một cuộc điều tra 30 lập trình viên làm cho các công ty cạnh tranh có từ 1 năm đến 10 năm kinh nghiệm. Kết quả điều tra như sau: (Đơn vị tính: nghìn đồng/tháng) Mức lương Năm kinh Mức lương Năm kinh Mức lương Năm kinh nghiệm nghiệm nghiệm 1500 2 2700 4 1800 2 THỐNG KÊ TRONG KINH DOANH 40 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  41. 1800 2 2100 3 1800 2 7650 7 1600 2 1750 1 4600 5 1200 2 2050 3 1500 1 5500 4 1700 1 3800 6 2850 3 1850 2 2700 4 1800 2 1600 2 3650 5 2200 2 1900 3 5700 7 3100 4 1800 2 2400 3 2900 3 7800 8 Theo dữ liệu trên, chúng ta phân tổ 30 người theo hai tiêu thức là mức lương và số năm kinh nghiệm. Việc phân tổ được tiến hành lần lượt theo từng tiêu thức năm kinh nghiệm và mức lương, trong đó số năm kinh nghiệm chia thành 4 tổ và mức lương chia thành 7 tổ . Kết quả phân tổ như sau: Bảng 2.6 Phân tổ lao động theo số năm kinh nghiệm và mức lương Năm KN Mức lương 1-2 3-4 5-6 ≥ 7 Cộng 1000 - 2000 13 1 14 2000 - 3000 1 7 8 3000 - 4000 1 2 3 4000 - 5000 1 1 5000 - 6000 1 1 2 6000 - 7000 7000 - 8000 2 2 Cộng 14 10 3 3 30 Qua bảng phân tổ trên có thể nhận thấy tần số phân bố tập trung vào đường chéo của bảng và có thể nhận xét: khi số năm kinh nghiệm tăng thì tiền lương có xu hướng tăng theo hay nói cách khác tiền lương được trả có phụ thuộc vào số năm kinh nghiệm. 1.2.3.3. Đồ thị biểu diễn phân bố tần số và tần số tích lũy Để biểu diễn phân bố tần số người ta thường dùng biểu đồ tần hình cột (Histogram) và biểu đồ tần số đa giác (Polygon). Đây là 2 cách biểu diễn khác nhau của cùng một dữ liệu. Đặc điểm của Histogram là giữa các cột không có khoảng cách mà là giới hạn giữa 2 tổ, độ cao thấp của các cột biểu thị tần số của mỗi tổ và độ rộng của cột là khoảng cách tổ. trục hoành ghi trị số giữa của các tổ, trục tung biểu diễn tần số của các tổ. Biểu đồ đa giác là một đường gấp khúc nối các điểm giữa đỉnh các cột của histogram. Đồ thị tần số tích luỹ (Ogive) là đồ thị biểu diễn tần số (hoặc tần suất) cộng dồn của các tổ, đây cũng là một trong các dạng biểu diễn đặc điểm phân phối của dữ liệu và có thể THỐNG KÊ TRONG KINH DOANH 41 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  42. giúp ta ước lượng số đơn vị (hoặc tỷ lệ % số đơn vị) có lượng biến nhỏ hơn hay lớn hơn một lượng biến cụ thể nào đó. Trở lại thí dụ 1(mục 1.1 ở trên), dữ liệu đã được sắp xếp theo thứ tự: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Trên cơ sở biểu đồ thân lá, bảng phân bố tần số và tần suất như sau: Các tổ Trị số giữa Tần số Tần suất (lần) Tỷ lệ % 10 - 20 15 3 0,15 15 20 - 30 25 6 0,30 30 30 - 40 35 5 0,25 25 40 - 50 45 4 0,20 20 50 - 60 55 2 0,10 10 Cộng 20 1 100 Biểu diện bảng phân bố tần số và tần số tích lũy trên bằng các đồ thị như sau: Hình 1: Biểu đồ tần hình cột Histogram 7 6 6 5 5 4 4 3 3 2 Frequency 2 1 0 0 0 5 1525364555More Hình 2: Biểu đồ tần số đa giác Polygon 7 6 5 4 3 2 1 42 0 THỐNG KÊ TRONG KINH DOANH Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị 5 1525364555More
  43. Hình 3: Đồ thị tần số tích lũy Ogive 120 100 80 60 40 20 0 10 20 30 40 50 60 1.3. Phân tổ lại. 1.3.1. Khái niệm, ý nghĩa của phân tổ lại. Trong nghiên cứu thống kê, đôi khi phải tiến hành phân tổ lại các tài liệu thống kê đã được phân tổ. Phân tổ lại là lập ra một số tổ mới trên cơ sở các tổ cũ đã có sẵn từ trước, nhằm đáp ứng một mục đích nghiên cứu nào đó. Phân tổ lại được áp dụng trong các trường hợp sau đây: - Các tài liệu trước được phân tổ không thống nhất với nhau về số tổ và khoảng cách tổ, làm cho việc so sánh gặp khó khăn. - Các tài liệu trước được phân thành nhiều tổ nhỏ, mà các tổ này chưa phản ánh rõ được các loại hình kinh tế xã hội. Cần phân tổ lại bằng cách kết hợp nhiều tổ nhỏ ban đầu nhằm nêu rõ các loại hình. - Các tài liệu phân tổ cũ chưa hợp lý, không phản ánh đúng đắn tình hình thực tế. Khi tiến hành phân tổ lại, thường vẫn sử dụng tiêu thức phân tổ cũ. Nếu muốn so sánh đối chiếu một vài phân tổ cũ, có thể lấy một trong những phân tổ cũ làm chuẩn, tức là giữ nguyên không thay đổi, còn các phân tổ khác phải được phân tổ lại cho phù hợp. Cũng có trường hợp các phân tổ cũ đều không thoả mãn mục đích nghiên cứu và đều phải được phân tổ lại theo mẫu thống nhất. 1.3.2. Phương pháp phân tổ lại. Có hai phương pháp phân tổ lại: THỐNG KÊ TRONG KINH DOANH 43 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị
  44. 1.3.2.1. Lập các tổ mới bằng cách thay đổi các khoảng cách tổ của phân tổ cũ Với phương pháp này việc thay đổi các khoảng cách tổ dược thực hiện bằng cách mở rộng hoặc thu hẹp các khoảng cách tổ cũ. Ta hãy xét thí dụ về tài liệu phân tổ lao động theo thâm niên công tác của hai doanh nghiệp thuộc cùng một ngành sản xuất trong năm 2005, biểu hiện ở bảng sau: Bảng 2.7 Phân tổ lao động theo thâm niên năm 2005 Doanh nghiệp A Doanh nghiệp B Phân tổ lao động Tỷ lệ % trong tổng số về Phân tổ lao động Tỷ lệ % trong tổng số về theo thâm niên theo thâm niên Lao động Tiền lương Lao động Tiền lương (năm) (năm) Dưới 2 15 10 Dưới 1 8 5 2 – 5 20 16 1 – 2 10 8 5 – 10 30 30 2 – 5 22 22 10 – 15 20 24 5 – 7 26 27 15 – 20 10 12 7 – 10 20 20 20 trở lên 5 8 10 – 15 8 10 15 – 20 4 5 20 trở lên 2 3 Tổng cộng 100 100 Tổng cộng 100 100 Muốn so sánh kết cấu lao động theo thâm niên công tác của hai doanh nghiệp trên đây, cần phải phân tổ lại cho thống nhất. Theo phương pháp thứ nhất, có thể thay đổi các khoảng cách tổ của hai phân tổ nói trên cho phù hợp với mục đích nghiên cứu. Giả sử định phân tổ hai tổng thể lao động trên đây thành 5 tổ có khoảng cách tổ đều nhau: dưới 5 năm, 5 đến 10 năm, 10 đến 15 năm, 15 đến 20 năm, và 20 năm trở lên. Như vậy, đối với doanh nghiệp A chỉ cần kết hợp 2 tổ đầu tiên vào với nhau. Còn đối với doanh nghiệp B, phải kết hợp 3 tổ đầu tiên vào với nhau (dưới 5 năm). Các tổ thứ 4 và thứ 5 cũng được kết hợp với nhau (5 đến 10 năm). Các chỉ tiêu về tỷ lệ phần trăm công nhân và tiền lương của hai xí nghiệp cũng được tính theo cách kết hợp nói trên. Ta có bảng phân tổ lại như sau: Bảng 2.8 Phân tổ lao động theo thâm niên năm 2005 Phân tổ công Doanh nghiệp A Doanh nghiệp B nhân theo thâm Tỷ lệ % trong tổng số về Tỷ lệ % trong tổng số về niên (năm) Công nhân Tiền lương Công nhân Tiền lương Dưới 5 35 26 40 35 THỐNG KÊ TRONG KINH DOANH 44 Chương 2 – Trình bày dữ liệu bằng bảng và đồ thị