Luận án Ứng dụng phương pháp hồi quy phân vị phân tích chênh lệch tiền lương ở Việt Nam

277 trang vanle 2070

Download

Bạn đang xem 20 trang mẫu của tài liệu "Luận án Ứng dụng phương pháp hồi quy phân vị phân tích chênh lệch tiền lương ở Việt Nam", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

luan_an_ung_dung_phuong_phap_hoi_quy_phan_vi_phan_tich_chenh.pdf

Nội dung text: Luận án Ứng dụng phương pháp hồi quy phân vị phân tích chênh lệch tiền lương ở Việt Nam

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH TRẦN THỊ TUẤN ANH ỨNG DỤNG PHƯƠNG PHÁP HỒI QUY PHÂN VỊ PHÂN TÍCH CHÊNH LỆCH TIỀN LƯƠNG Ở VIỆT NAM LUẬN ÁN TIẾN SĨ KINH TẾ NĂM 2015
BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH TRẦN THỊ TUẤN ANH ỨNG DỤNG PHƯƠNG PHÁP HỒI QUY PHÂN VỊ PHÂN TÍCH CHÊNH LỆCH TIỀN LƯƠNG Ở VIỆT NAM Chuyên ngành : Lý thuyết xác suất và thống kê toán học Mã số : 62.46.01.06 LUẬN ÁN TIẾN SĨ KINH TẾ NGƯỜI HƯỚNG DẪN KHOA HỌC 1. PGS. TS LÊ VĂN PHI 2. TS BÙI PHÚC TRUNG NĂM 2015 iii
i LỜI CAM ĐOAN Tôi xin cam đoan luận án tiến sĩ với đề tài “ Ứng dụng phương pháp hồi quy phân vị phân tích chênh lệch tiền lương ở Việt Nam” là công trình nghiên cứu khoa học độc lập của riêng tôi. Các số liệu trong luận án là trung thực, có nguồn gốc rõ ràng. Các kết quả nghiên cứu của luận án chưa từng được ai ngoài tác giả công bố trong bất kỳ công trình nghiên cứu nào khác. Nghiên cứu sinh Trần Thị Tuấn Anh
MỤC LỤC LỜI CAM ĐOAN i MỤC LỤC iii DANH MỤC CÁC BẢNG BIỂU vii DANH MỤC CÁC HÌNH VẼ viii DANH MỤC CÁC TỪ VIẾT TẮT xv PHẦN MỞ ĐẦU 1 1. Lý do chọn đề tài 1 2. Mục tiêu nghiên cứu 2 3. Đối tượng – phạm vi nghiên cứu 3 4. Ý nghĩa khoa học và ý nghĩa thực tiễn 3 CHƯƠNG 1 CƠ SỞ LÝ THUYẾT VỀ HÀM TIỀN LƯƠNG VÀ VẤN ĐỀ PHÂN TÍCH CHÊNH LỆCH TIỀN LƯƠNG BẰNG HỒI QUY PHÂN VỊ 5 1.1. Hàm tiền lương mincer (1974) và các nghiên cứu mở rộng 5 1.2. Phương pháp hồi quy phân vị 8 a. Giới thiệu phương pháp hồi quy phân vị 9 b. Tính chất của phương pháp hồi quy phân vị 15 c. Kiểm định giả thuyết thống kê với hồi quy phân vị 23 d. Ưu điểm và nhược điểm của hồi quy phân vị 24 1.2.1. Tính chệch của ước lượng do chọn mẫu khi xây dựng hàm tiền lương và phương pháp hiệu chỉnh tính chệch do chọn mẫu 26 a. Tính chệch do chọn mẫu (Sample selection bias) 27 b. Hiệu chỉnh tính chệch do chọn mẫu - Thủ tục Heckman hai bước 29 1.2.2. Vấn đề nội sinh và phương pháp hồi quy phân vị hai bước (double - stage quantile regression) 32 1.3. Phương pháp phân rã chênh lệch bằng hồi quy phân vị 34 1.4. Sự phù hợp của hồi quy phân vị với các nghiên cứu về chênh lệch tiền lương 37 CHƯƠNG 2 TỔNG QUAN CÁC NGHIÊN CỨU VỀ CHÊNH LỆCH TIỀN LƯƠNG 39 2.1. Tổng quan các nghiên cứu về chênh lệch tiền lương trên thế giới 39 iii
2.1.1. Những nghiên cứu về chênh lệch tiền lương trước khi hồi quy phân vị được áp dụng vào phân tích tiền lương 39 2.1.2. Những nghiên cứu về chênh lệch tiền lương áp dụng hồi quy phân vị được áp dụng vào hồi quy hàm tiền lương 44 2.2. Tổng quan các nghiên cứu ở Việt Nam 58 2.2.1. Các nghiên cứu định lượng về chênh lệch tiền lương không áp dụng hồi quy phân vị 58 2.2.2. Các nghiên cứu áp dụng hồi quy phân vị trong phân tích chênh lệch tiền lương. 61 2.3. Những hạn chế trong các nghiên cứu định lượng về đề tài chênh lệch tiền lương ở việt nam 64 CHƯƠNG 3 PHƯƠNG PHÁP NGHIÊN CỨU 67 3.1. Số liệu sử dụng trong đề tài 67 3.1.1. Nguồn số liệu sử dụng 67 3.1.2. Thống kê mô tả mẫu số liệu 69 3.1.3. Mô tả hàm mật độ kernel của biến log – tiền lương trên mẫu số liệu 72 3.2. Phương pháp nghiên cứu của đề tài 78 3.2.1. Dạng hàm tiền lương 78 3.2.2. Phương pháp ước lượng hàm tiền lương và phân rã chênh lệch tiền lương 80 3.2.2.1. Ước lượng hàm tiền lương bằng phương pháp hồi quy phân vị 80 3.2.2.2. Hiệu chỉnh tính chệch do chọn mẫu 81 3.2.2.3. Phương pháp phân rã sự chênh lệch tiền lương 82 CHƯƠNG 4 KẾT QUẢ NGHIÊN CỨU 85 4.1. Áp dụng phương pháp hồi quy phân vị để ước lượng hàm tiền lương ở việt nam 85 4.1.1. Hồi quy và so sánh hàm hồi quy phân vị hàm tiền lương của nhóm lao động nam và nhóm lao động nữ 86 4.1.1.1. Hồi quy và so sánh hệ số hồi quy theo bằng cấp ở nhóm lao động nam và nhóm lao động nữ trong năm 2002 86 4.1.1.2. Hồi quy và so sánh hệ số hồi quy theo bằng cấp ở nhóm lao động nam và nhóm lao động nữ trong năm 2012 91 4.1.1.3. So sánh hệ số hồi quy theo bằng cấp ở nhóm lao động nam giữa năm 2002 và năm 2012 95 4.1.1.4. So sánh hệ số hồi quy theo bằng cấp ở nhóm lao động nữ giữa năm 2002 và năm 2012 98 iv
4.1.2. Hồi quy phân vị tiền lương theo khu vực thành thị - nông thôn. 100 4.1.2.1. Hồi quy và so sánh hệ số hồi quy theo bằng cấp ở nhóm lao động thành thị và nhóm lao động nông thôn trong năm 2002 101 4.1.2.2. Hồi quy và so sánh hệ số hồi quy theo bằng cấp ở nhóm lao động thành thị và nhóm lao động nông thôn trong năm 2012 104 4.1.2.3. So sánh hệ số hồi quy theo bằng cấp ở nhóm lao động thành thị giữa năm 2002 và năm 2012 108 4.1.2.4. So sánh hệ số hồi quy theo bằng cấp ở nhóm lao động nông thôn giữa năm 2002 và năm 2012 110 4.2. Kết quả phân rã chênh lệch tiền lương 113 4.2.1. Phân rã chênh lệch tiền lương theo giới tính 114 4.2.1.1. Phân rã chênh lệch tiền lương theo giới tính năm 2002 114 4.2.1.2. Phân rã chênh lệch tiền lương theo giới tính năm 2012 117 4.2.1.3. So sánh kết quả chênh lệch tiền lương theo giới tính ở khu vực thành thị và nông thôn 119 4.2.1.4. So sánh kết quả phân rã chênh lệch tiền lương theo giới tính giữa năm 2002 và 2012 120 4.2.2. Phân rã chênh lệch tiền lương giữa thành thị và nông thôn 122 4.2.2.1. Phân rã chênh lệch tiền lương giữa thành thị và nông thôn năm 2002 122 4.2.2.2. Phân rã chênh lệch tiền lương giữa thành thị và nông thôn năm 2012 126 4.2.2.3. So sánh chênh lệch tiền lương giữa thành thị và nông thôn theo từng nhóm giới tính 128 4.2.2.4. So sánh chênh lệch tiền lương giữa thành thị và nông thôn năm 2002 và 2012 129 4.2.3. Phân rã chênh lệch tiền lương giữa năm 2002 và 2012 132 4.3. Kết luận về kết quả nghiên cứu. 136 4.3.1. Về sự thay đổi hàm hồi quy tiền lương 136 4.3.1.1. Sự thay đổi hàm hồi quy tiền lương theo giới tính 136 4.3.1.2. Sự thay đổi hàm hồi quy tiền lương theo khu vực 136 4.3.1.3. Sự thay đổi hàm hồi quy tiền lương theo thời gian 137 4.3.1.4.So sánh kết quả hồi quy hàm tiền lương ở Việt Nam với các nghiên cứu trước đó 139 4.3.2. Về kết quả phân rã chênh lệch tiền lương 141 v
4.3.2.1. Kết quả phân rã chênh lệch tiền lương theo giới tính 141 4.3.2.2. Kết quả phân rã chênh lệch tiền lương theo khu vực 143 4.3.2.3. Kết quả phân rã chênh lệch tiền lương theo thời gian 144 4.3.3. So sánh kết quả phân rã chênh lệch tiền lương của luận án với các nghiên cứu trước 145 CHƯƠNG 5: KẾT LUẬN VÀ ĐỀ XUẤT GIẢI PHÁP 149 5.1. Kết luận 149 5.2. Đề xuất gợi ý một số chính sách về lao động tiền lương 153 5.2.1. Nhóm giải pháp tăng tiền lương của người lao động 154 5.2.2. Nhóm giải pháp giảm bất bình đẳng tiền lương giữa các nhóm lao động 155 5.2.2.1. Đối với vấn đề chênh lệch tiền lương theo giới tính 156 5.2.2.2. Đối với vấn đề chênh lệch tiền lương theo thành thị - nông thôn 158 5.3. Các kết quả chính của luận án 159 5.3.1. Về mặt lý thuyết 159 5.3.2. Về mặt thực tiễn 160 5.4. Những hạn chế của luận án 161 PHỤ LỤC A: THỐNG KÊ MÔ TẢ 180 PHỤ LỤC B : KẾT QUẢ HỒI QUY PHÂN VỊ 188 PHỤ LỤC C: KẾT QUẢ PHÂN RÃ CHÊNH LỆCH TIỀN LƯƠNG 205 PHỤ LỤC D: DANH MỤC HÌNH VẼ CHƯƠNG 3 209 PHỤ LỤC E: DANH MỤC HÌNH VẼ CHƯƠNG 4 218 vi
DANH MỤC CÁC BẢNG BIỂU Bảng 1. 3: Tóm tắt một số nghiên cứu trên thế giới về chênh lệch tiền lương 55 Bảng 1. 4: Bảng tóm tắt một số nghiên cứu về chênh lệch tiền lương ở Việt Nam 65 Bảng A 1: Danh sách các biến 180 Bảng A 2: Thống kê mô tả giá trị trung bình các biến - năm 2002 182 Bảng A 3: Thống kê mô tả giá trị trung bình các biến - năm 2012 183 Bảng A 4: Bảng thống kê số quan sát trong mẫu theo giới tính ở thành thị và nông thôn 184 Bảng A 5: Thống kê số quan sát ở từng nhóm lao động theo nhóm tuổi - năm 2002 184 Bảng A 6: Thống kê số quan sát ở từng nhóm lao động theo nhóm tuổi - năm 2012 185 Bảng A 7: Thống kê số quan sát ở từng nhóm lao động theo bằng cấp năm 2002 và 2012 185 Bảng A 8: Thống kê mô tả biến log - tiền lương thực tế theo từng nhóm tuổi 186 Bảng A 9: Thống kê mô tả biến log - tiền lương theo từng nhóm lao động 187 Bảng A 10: Thống kê mô tả biến log - tiền lương theo từng nhóm bằng cấp 188 Bảng B 1: Kết quả hồi quy hàm tiền lương ở lao động nam giới và nữ giới năm 2002 189 Bảng B 2: Kết quả hồi quy hàm tiền lương ở lao động nam giới và nữ giới năm 2012 191 Bảng B 3: Kết quả hồi quy hàm tiền lương ở lao động thành thị và nông thôn năm 2002 193 Bảng B 4: Kết quả hồi quy hàm tiền lương ở lao động thành thị và nông thôn năm 2012 195 Bảng B 5: Kết quả hồi quy hàm tiền lương ở lao động nam – nữ ở thành thị năm 2002 197 Bảng B 6: Kết quả hồi quy hàm tiền lương ở lao động nam - nữ ở thành thị năm 2012 199 Bảng B 7: Kết quả hồi quy hàm tiền lương ở lao động nam - nữ ở nông thôn năm 2002 201 Bảng B 8: Kết quả hồi quy hàm tiền lương ở lao động nam - nữ ở nông thôn năm 2012 203 Bảng C. 1: Kết quả phân rã chênh lệch tiền lương giữa lao động nam và nữ 205 Bảng C. 2: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn 206 Bảng C. 3: Kết quả phân rã chênh lệch tiền lương giữa năm 2002 và 2012 207 vii
DANH MỤC CÁC HÌNH VẼ Hình 1. 1: Đồ thị biểu diễn các kết quả hồi quy phân vị của Y theo X 14 Hình 1. 2: Đường hồi quy phân vị 2 biến đi qua ít nhất 2 quan sát của mẫu 18 Hình 1. 3: Giá trị hồi quy tăng dần khi phân vị tăng dần tại X trung bình 20 Hình 1. 4: Trích nghiên cứu của Buchinsky (1994) 45 Hình 1. 5: Trích nghiên cứu của Fortin (1996) 47 Hình 1. 6: Trích nghiên cứu của Machado & Mata (2005) 49 Hình 1. 7: Trích nghiên cứu của Asplund và các cộng sự (2011) 53 Hình 1. 8: Trích nghiên cứu của Binh T.N và các cộng sự (2007) 61 Hình 3. 1 Kích thước mẫu theo từng nhóm giới tính năm 2002 209 Hình 3. 2 Kích thước mẫu theo từng nhóm giới tính năm 2012 209 Hình 3. 3 Tỷ lệ các nhóm tuổi trong mẫu số liệu 210 Hình 3. 4 Tỷ lệ các nhóm bằng cấp theo giới tính năm 2002 210 Hình 3. 5 Tỷ lệ các nhóm bằng cấp năm 2012 theo giới tính 211 Hình 3. 6 Tỷ lệ các nhóm bằng cấp theo khu vực năm 2002 211 Hình 3. 7 Tỷ lệ các nhóm bằng cấp theo khu vực năm 2012 212 Hình 3. 8 Hàm mật độ tiền lương thực tế 212 Hình 3. 9 Hàm mật độ tiền lương theo giới tính 213 Hình 3. 10 Hàm mật độ tiền lương theo thành thị - nông thôn 214 Hình 3. 11 Hàm mật độ tiền lương thực tế theo từng nhóm lao động 215 Hình 3. 12 Hàm mật độ tiền lương thực tế từng nhóm lao động theo giới tính 216 Hình 3. 13 Hàm mật độ tiền lương thực tế khu vực thành thị - nông thôn 217 Hình 4. 1: Hệ số hồi quy theo bằng cấp của nhóm lao động nam - năm 2002 218 Hình 4. 2: Hệ số hồi quy theo bằng cấp của nhóm lao động nữ - năm 2002 218 Hình 4. 3: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" năm 2002 219 viii
Hình 4. 4: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở" năm 2002 219 Hình 4. 5: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" năm 2002 220 Hình 4. 6: So sánh hệ số hồi quy biến bằng cấp "Học nghề" năm 2002 220 Hình 4. 7: So sánh hệ số hồi quy biến bằng cấp "Cao đẳng - Đại học" năm 2002 221 Hình 4. 8: Hệ số hồi quy theo bằng cấp của nhóm lao động nam - năm 2012 221 Hình 4. 9: Hệ số hồi quy theo bằng cấp của nhóm lao động nữ - năm 2012 222 Hình 4. 10: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" năm 2012 222 Hình 4. 11: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở" năm 2012 223 Hình 4. 12: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" năm 2012 223 Hình 4. 13: So sánh hệ số hồi quy biến bằng cấp "Học nghề" năm 2012 224 Hình 4. 14: So sánh hệ số hồi quy biến bằng cấp "Cao đẳng/Đại học" năm 2012 224 Hình 4. 15: So sánh hệ số hồi quy biến bằng cấp "Sau đại học" năm 2012 225 Hình 4. 16: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" giữa năm 2002 và 2012 ở nhóm lao động nam 225 Hình 4. 17: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở" giữa năm 2002 và 2012 ở nhóm lao động nam 226 Hình 4. 18: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" giữa năm 2002 và 2012 ở nhóm lao động nam 226 Hình 4. 19: So sánh hệ số hồi quy biến bằng cấp "Học nghề" giữa năm 2002 và 2012 ở nhóm lao động nam 227 Hình 4. 20: So sánh hệ số hồi quy biến "Cao đẳng - Đại học" giữa năm 2002 và 2012 ở nhóm lao động nam 227 Hình 4. 21: So sánh hệ số hồi quy biến bằng cấp "Sau đại học" giữa năm 2002 và 2012 ở nhóm lao động nam 228 Hình 4. 22: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" giữa năm 2002 và 2012 ở nhóm lao động nữ 228 Hình 4. 23: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở" giữa năm 2002 và 2012 ở nhóm lao động nữ 229 ix
Hình 4. 24: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" giữa năm 2002 và 2012 ở nhóm lao động nữ 229 Hình 4. 25: So sánh hệ số hồi quy biến bằng cấp "Học nghề" giữa năm 2002 và 2012 ở nhóm lao động nữ. 230 Hình 4. 26: So sánh hệ số hồi quy biến bằng cấp "Cao đẳng - Đại học" giữa năm 2002 và 2012 ở nhóm lao động nữ 230 Hình 4. 27: So sánh hệ số hồi quy biến bằng cấp "Sau đại học" giữa năm 2002 và 2012 ở nhóm lao động nữ 231 Hình 4. 28: Hệ số hồi quy theo bằng cấp của nhóm lao động ở thành thị - năm 2002 231 Hình 4. 29: Hệ số hồi quy theo bằng cấp của nhóm lao động ở nông thôn - năm 2002 . 232 Hình 4. 30: So sánh hệ số hồi quy biến bằng cấp "Tiểu học " ở nhóm lao động thành thị và nông thôn năm 2002 232 Hình 4. 31: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở " ở nhóm lao động thành thị và nông thôn năm 2002 233 Hình 4. 32: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" ở nhóm lao động thành thị và nông thôn năm 2002 233 Hình 4. 33: So sánh hệ số hồi quy biến bằng cấp "Học nghề" ở nhóm lao động thành thị và nông thôn năm 2002 234 Hình 4. 34: So sánh hệ số hồi quy biến bằng cấp "Cao đẳng / Đại học" ở nhóm lao động thành thị và nông thôn năm 2002 234 Hình 4. 35: Hệ số hồi quy theo bằng cấp của nhóm lao động ở thành thị - năm 2012 235 Hình 4. 36: Hệ số hồi quy theo bằng cấp của nhóm lao động ở nông thôn - năm 2012 . 235 Hình 4. 37: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" ở nhóm lao động thành thị và nông thôn năm 2012 236 Hình 4. 38: So sánh hệ số hồi quy biến "Trung học cơ sở " ở nhóm lao động thành thị và nông thôn năm 2012 236 Hình 4. 39: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông " ở nhóm lao động thành thị và nông thôn năm 2012 237 Hình 4. 40: So sánh hệ số hồi quy biến bằng cấp "Học nghề" ở nhóm lao động thành thị và nông thôn năm 2012 237 x
Hình 4. 41: So sánh hệ số hồi quy biến bằng cấp "Cao đẳng - Đại học" ở nhóm lao động thành thị và nông thôn năm 2012 238 Hình 4. 42: So sánh hệ số hồi quy biến bằng cấp "Sau đại học" ở nhóm lao động thành thị và nông thôn năm 2012 238 Hình 4. 43: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" ở nhóm lao động thành thị giữa năm 2002 với 2012 239 Hình 4. 44: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở" ở nhóm lao động thành thị giữa năm 2002 với 2012 239 Hình 4. 45: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" ở nhóm lao động thành thị giữa năm 2002 với 2012 240 Hình 4. 46: So sánh hệ số hồi quy biến bằng cấp "Học nghề" ở nhóm lao động thành thị giữa năm 2002 với 2012 240 Hình 4. 47: So sánh hệ số hồi quy biến bằng cấp “Cao đẳng – Đại học” ở nhóm lao động thành thị giữa năm 2002 với 2012 241 Hình 4. 48: So sánh hệ số hồi quy biến bằng cấp "Sau đại học" ở nhóm lao động thành thị giữa năm 2002 với 2012 241 Hình 4. 49: So sánh hệ số hồi quy biến bằng cấp "Tiểu học" ở nhóm lao động nông thôn giữa năm 2002 với 2012 242 Hình 4. 50: So sánh hệ số hồi quy biến bằng cấp "Trung học cơ sở" ở nhóm lao động nông thôn giữa năm 2002 với 2012 242 Hình 4. 51: So sánh hệ số hồi quy biến bằng cấp "Trung học phổ thông" ở nhóm lao động nông thôn giữa năm 2002 với 2012 243 Hình 4. 52: So sánh hệ số hồi quy biến bằng cấp "Học nghề" ở nhóm lao động nông thôn giữa năm 2002 với 2012 243 Hình 4. 53: So sánh hệ số hồi quy biến bằng cấp "Cao đẳng - Đại học" ở nhóm lao động nông thôn giữa năm 2002 với 2012 244 Hình 4. 54: Kết quả phân rã chênh lệch tiền lương theo giới tính năm 2002 244 Hình 4. 55: Kết quả phân rã chênh lệch tiền lương theo giới tính ở thành thị năm 2002 245 Hình 4. 56: Kết quả phân rã chênh lệch tiền lương theo giới tính ở nông thôn năm 2002 245 Hình 4. 57: Kết quả phân rã chênh lệch tiền lương theo giới tính năm 2012 246 xi
Hình 4. 58: Kết quả phân rã chênh lệch tiền lương theo giới tính ở thành thị năm 2012 246 Hình 4. 59: Kết quả phân rã chênh lệch tiền lương theo giới tính ở nông thôn năm 2012 247 Hình 4. 60: So sánh kết quả phân rã chênh lệch theo giới tính ờ thành thị và nông thôn năm 2012 247 Hình 4. 61: So sánh kết quả phân rã chênh lệch theo giới tính năm 2002 và 2012 248 Hình 4. 62: So sánh kết quả phân rã chênh lệch theo giới tính ở thành thị năm 2002 và 2012 248 Hình 4. 63: So sánh kết quả phân rã chênh lệch theo giới tính ở nông thôn năm 2002 và 2012 249 Hình 4. 64: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn năm 2002 249 Hình 4. 65: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn ở nam giới năm 2002 250 Hình 4. 66: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn ở nữ giới năm 2002 250 Hình 4. 67: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn năm 2012 251 Hình 4. 68: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn ở nam giới năm 2012 251 Hình 4. 69: Kết quả phân rã chênh lệch tiền lương giữa lao động thành thị và nông thôn ở nữ giới năm 2012 252 Hình 4. 70: So sánh kết quả phân rã chênh lệch tiền lương giữa thành thị và nông thôn ở nhóm lao động nam và nữ năm 2002 252 Hình 4. 71: So sánh kết quả phân rã chênh lệch tiền lương giữa thành thị và nông thôn ở nhóm lao động nam và nữ năm 2012 253 Hình 4. 72: So sánh kết quả phân rã chênh lệch tiền lương giữa thành thị và nông thôn năm 2002 và 2012 253 Hình 4. 73: So sánh kết quả phân rã chênh lệch tiền lương giữa thành thị và nông thôn ở nhóm ở nhóm lao động nam năm 2002 và 2012 254 xii
Hình 4. 74: So sánh kết quả phân rã chênh lệch tiền lương giữa thành thị và nông thôn ở nhóm lao động nữ năm 2002 và 2012 254 Hình 4. 75: Kết quả phân rã chênh lệch tiền lương giữa năm 2002 và 2012 255 Hình 4. 76: Kết quả phân rã chênh lệch tiền lương giữa năm 2002 và 2012 ở nhóm lao động nam 255 Hình 4. 77: Kết quả phân rã chênh lệch tiền lương giữa năm 2002 và 2012 ở nhóm lao động nữ 256 Hình 4. 78: Kết quả phân rã chênh lệch tiền lương giữa năm 2002 và 2012 ở nhóm lao động nông thôn 257 xiii
DANH MỤC CÁC TỪ VIẾT TẮT 2SLS : Phương pháp bình phương nhỏ nhất hai bước (Two-Stage Least Squares) 2SQR : Hồi quy phân vị hai bước (Two-Stage Quantile Regression)) đ.l.n.n : đại lượng ngẫu nhiên HQPV : Hồi quy phân vị OLS : Phương pháp bình phương nhỏ nhất (Ordinary Least Squares) QR : Phương pháp hồi quy phân vị (Quantile Regression) TPHCM : Thành phố Hồ Chí Minh UNDP : Chương Trình Phát Triển Liên Hiệp Quốc (United Nations Development Programme) VHLSS : Khảo sát mức sống hộ gia đình (VietNam Household Living Standard Survey) xv
PHẦN MỞ ĐẦU GIỚI THIỆU VẤN ĐỀ NGHIÊN CỨU 1. Lý do chọn đề tài Tiền lương là một trong những yếu tố tạo động lực quan trọng nhất trong lao động. Có rất nhiều các yếu tố tác động đến tiền lương của người lao động như thị trường lao động, môi trường làm việc, tính chất công việc và đặc điểm của người lao động. Mỗi sự khác nhau ở các yếu tố này có thể sẽ dẫn đến kết quả trả lương khác nhau. Điều này tạo sự chênh lệch về tiền lương. Bên cạnh đó, chênh lệch tiền lương còn là hệ quả của việc phân công lao động. Tiền lương sẽ khác nhau khi mà mỗi người lao động được phân công đảm trách những công đoạn, công việc khác nhau trong cùng một quy trình sản xuất. Như vậy, sự tồn tại của chênh lệch tiền lương là tất yếu. Tuy nhiên, các nhà kinh tế học như Becker (1971), Cain (1986) phân biệt hai cách giải thích cho vấn đề chênh lệch tiền lương: đó là chênh lệch tiền lương do phân biệt đối xử và chênh lệch tiền lương do chênh lệch về vốn con người và/hoặc năng suất lao động. Sự chênh lệch tiền lương do chênh lệch về vốn con người và/hoặc do chênh lệch về năng suất lao động có thể xem là những chênh lệch “tích cực” tạo ra động lực để phát triển. Sự chênh lệch tiền lương do trình độ học vấn sẽ khiến người ta cố gắng học hỏi để đạt trình độ cao. Hay sự chênh lệch về tiền công do chênh lệch về năng suất lao động, về hiệu quả công việc, về khả năng ngoại ngữ, về việc tích luỹ kinh nghiệm, về khả năng sáng tạo v.v sẽ tạo ra động lực để người lao động phấn đấu hoàn thiện chính mình, từ đó kích thích sự phát triển chung của xã hội. Những chênh lệch tiền lương “tiêu cực” thể hiện ở các bất bình đẳng nảy sinh trong xã hội mà chúng ta cần phải điều chỉnh. Ví dụ như sự chênh lệch tiền lương do kỳ thị lao động nữ giới, ưu ái lao động nam giới, chênh lệch tiền lương dẫn đến chênh lệch giàu nghèo, chênh lệch mức sống giữa thành thị - nông thôn, v.v Do vậy, có thể phân chia các nguyên nhân của chênh lệch tiền lương thành hai nhóm. Nhóm thứ nhất có thể kể đến đó là 1
do sự thay đổi của thị trường lao động, sự khác nhau hoặc sự thay đổi của môi trường lao động tại nơi làm việc, do sự khác nhau về tính chất của công việc hoặc do sự khác nhau về đặc điểm của bản thân người lao động. Nhóm thứ hai là do sự kỳ thị hoặc là do sự phân biệt đối xử trong xã hội và/hoặc của người sử dụng lao động đối với người lao động. Nhóm nguyên nhân này dẫn đến sự bất bình đẳng trong xã hội. Do vậy, nhằm (1) xác định mức độ chênh lệch tiền lương tại Việt Nam, (2) xác định các yếu tố thực sự tác động đến tiền lương và (3) phân rã khoảng chênh lệch tiền lương để làm rõ phần chênh lệch giải thích theo nhóm nguyên nhân thứ nhất và phần thể hiện bất bình đẳng theo nhóm nguyên nhân thứ hai nói trên, đề tài “Ứng dụng phương pháp hồi quy phân vị phân tích chênh lệch tiền lương ở Việt Nam” được chọn làm đề tài cho luận án tiến sĩ của tác giả tại trường Đại học Kinh tế TPHCM. 2. Mục tiêu nghiên cứu Để thực hiện các mục đích trên, đề tài hướng đến việc hoàn thành các mục tiêu sau đây: 1) Giới thiệu một cách có hệ thống về cơ sở lý thuyết và khả năng ứng dụng phương pháp hồi quy phân vị, cũng như phương pháp phân rã chênh lệch tiền lương dựa trên hồi quy phân vị. 2) Thực hiện hồi quy phân vị hàm tiền lương thực tế ở Việt Nam với biến phụ thuộc là logarit tiền lương thực tế theo giờ của người lao động. Hệ số của hàm tiền lương thực tế này được ước lượng bằng phương pháp hồi quy phân vị có hiệu chỉnh tính chệch do chọn mẫu và khắc phục nội sinh. 3) Xác định khoảng chênh lệch tiền lương theo giới tính (nam – nữ, nam - nữ ở thành thị, nam – nữ ở nông thôn) và phân rã các khoảng chênh lệch tiền lương này để làm rõ phần chênh lệch được giải thích bởi các biến độc lập và phần chênh lệch chưa được giải thích gây ra bởi chênh lệch về hệ số hồi quy. Đồng thời so sánh kết quả phân tích chênh lệch tiền lương theo giới tính năm 2002 và 2012 để làm rõ sự thay đổi theo thời gian. 2
4) Xác định khoảng chênh lệch tiền lương theo khu vực (thành thị - nông thôn, thành thị - nông thôn ở nam giới, thành thị - nông thôn ở nữ giới). Phân rã các khoảng chênh lệch tiền lương này để làm rõ phần chênh lệch được giải thích bởi các biến độc lập và phần chênh lệch chưa được giải thích gây ra bởi chênh lệch về hệ số hồi quy. Đồng thời so sánh kết quả phân tích chênh lệch tiền lương theo khu vực năm 2002 và 2012 để làm rõ sự thay đổi theo thời gian. 5) Xác định mức tăng lương theo thời gian từ năm 2002 đến năm 2012. Phân rã sự tăng lương này thành hai phần: phần tăng lương là do thay đổi về đặc điểm lao động và phần tăng lương là do thay đổi hệ số hồi quy. 3. Đối tượng – phạm vi nghiên cứu Đề tài này được thực hiện đựa trên bộ số liệu khảo sát mức sống hộ gia đình (VHLSS) năm 2002 và 2012 do Tổng cục Thống kê công bố. Đối tượng nghiên cứu của đề tài cũng chính là đối tượng được khảo sát về tiền lương và các yếu tố có liên quan trong các cuộc khảo sát này. Phạm vi nghiên cứu của đề tài là nghiên cứu tiền lương thực tế theo giờ của các đối tượng trong độ tuổi trên lãnh thổ Việt Nam. 4. Ý nghĩa khoa học và ý nghĩa thực tiễn Với mục tiêu nghiên cứu và phương pháp nghiên cứu được lựa chọn, đề tài của luận án mang lại các ý nghĩa khoa học và thực tiễn sau đây: (a) Đề tài áp dụng phương pháp hồi quy phân vị, một kỹ thuật hồi quy được giới thiệu bởi Koenker & Bassett (1978) và đã được dùng rất rộng rãi trên thế giới nhưng chưa phổ biến ở Việt Nam. Rất ít các đề tài nghiên cứu ở Việt Nam áp dụng kỹ thuật hồi quy phân vị, đặc biệt là áp dụng trong nghiên cứu hàm tiền lương và phân rã chênh lệch tiền lương. (b) Đề tài trình bày một cách ngắn gọn, đầy đủ và có hệ thống về lý thuyết của phương pháp hồi quy phân vị. Đây là điều mà cho đến nay chưa có tác giả ở Việt Nam nào thực hiện. (c) Hàm tiền lương của các nhóm lao động được ước lượng bằng phương pháp hồi quy phân vị có hiệu chỉnh tính chệch do chọn mẫu và có xử lý 3
hiện tượng nội sinh trong mô hình, đem lại ước lượng vững và đáng tin cậy. (d) Đề tài xây dựng và ước lượng hàm tiền lương ở Việt Nam bằng phương pháp hồi quy phân vị cho từng nhóm lao động cụ thể: lao động nam và lao động nữ, lao động thành thị và lao động nông thôn, lao động nam ở thành thị và lao động nữ ở thành thị, lao động nam ở nông thôn và lao động nữ ở nông thôn. (e) Đề tài xác định mức chênh lệch tiền lương theo giới tính ở Việt Nam (trên toàn bộ mẫu số liệu cũng như ở từng khu vực thành thị - nông thôn). Đồng thời đề tài nghiên cứu sự thay đổi các mức chênh lệch này theo thời gian bằng cách so sánh kết quả tính toán giữa năm 2002 với 2012. (f) Đề tài phân rã khoảng chênh lệch tiền lương theo giới tính để xác định phần chênh lệch tiền lương thể hiện qua phần chênh lệch về đặc điểm lao động và phần chênh lệch thể hiện qua sự khác nhau về hệ số hồi quy (được xem như là dấu hiệu của phân biệt đối xử tiền lương giữa nam và nữ) (g) Đề tài xác định mức chênh lệch tiền lương giữa hai khu vực thành thị và nông thôn ở Việt Nam và nghiên cứu sự thay đổi của mức chênh lệch này theo thời gian bằng cách so sánh kết quả tính toán giữa hai hai thời điểm nghiên cứu là năm 2002 và 2012. (h) Đề tài phân rã khoảng chênh lệch tiền lương giữa hai khu vực thành thị và nông thôn nhằm xác định phần chênh lệch thể hiện qua khác nhau về đặc điểm lao động và phần chênh lệch thể hiện thông qua khác nhau về hệ số hồi quy (được xem như là dấu hiệu của sự khác nhau trong chính sách đãi ngộ của khu vực thành thị - nông thôn) 4
CHƯƠNG 1 CƠ SỞ LÝ THUYẾT VỀ HÀM TIỀN LƯƠNG VÀ VẤN ĐỀ PHÂN TÍCH CHÊNH LỆCH TIỀN LƯƠNG BẰNG HỒI QUY PHÂN VỊ Nhằm thực hiện các mục tiêu nghiên cứu đã nêu, đề tài áp dụng phương pháp hồi quy phân vị có hiệu chỉnh tính chệch do vấn đề chọn mẫu và có xử lý nội sinh để ước lượng hàm tiền lương dạng Mincer (1974) mở rộng. Biến phụ thuộc được lựa chọn là logarit tiền lương thực tế dựa trên số liệu của VHLSS 2002 và VHLSS 2012. Sau đó, phương pháp Machado - Mata (2005) được áp dụng để tiến hành phân rã chênh lệch tiền lương và xác định các thành phần của khoảng chênh lệch này. Do vậy, chương 1 sẽ bao gồm các nội dung sau đây: - Trình bày hàm tiền lương do Mincer (1974) đề xuất và một số các mở rộng. - Trình bày phương pháp hồi quy phân vị do Koenker & Bassett (1978) đề xuất và các đặc điểm của hồi quy phân vị. - Tính chệch của ước lượng do vấn đề chọn mẫu và hiệu chỉnh ước lượng chệch do chọn mẫu đối với hồi quy phân vị - Phương pháp phân rã chênh lệch do Machado - Mata(2005) đề xuất 1.1. HÀM TIỀN LƯƠNG MINCER (1974) VÀ CÁC NGHIÊN CỨU MỞ RỘNG Mincer (1974) đã giới thiệu phương trình tiền lương thể hiện mối quan hệ giữa logarit tiền lương (hoặc tiền công/thu nhập) với các yếu tố như số năm đi học, kinh nghiệm làm việc và bình phương của biến kinh nghiệm dựa trên lập luận rằng 5
số tiền công được trả cho một người trong hiện tại phụ thuộc vào mức đầu tư vào vốn con người (human capital) của bản thân họ trước đó. Ký hiệu mức tiền lương nhận được tại thời điểm t là Et . Mincer giả sử rằng đầu tư của một cá nhân vào vốn con người của bản thân ở kỳ t là kt , hiệu quả tương ứng cùng kỳ mang lại cho mỗi đơn vị đầu tư là rt . Khi đó, mức tiền lương nhận được ở thời điểm t được thể hiện như sau: EErktttt 111(1) t 0 ,1,2 . . . Lần lượt thay thế Et bằng các kỳ trước đó theo công thức truy hồi, ta được t 1 Et (1 r j k j ) E0 . j 0 Lấy logarit nepe hai vế, ta được t 1 lnlnln(1).EErtjj k 0  j 0 Giả sử rằng - Số năm đi học (s) là số năm được dành toàn thời gian cho việc học của người lao động (trong thời gian đi học kkk011 1 s (năm)). - Hiệu quả mang lại của số năm đi học đối với tiền lương tiềm năng là không đổi theo thời gian ( rrr011 s  ). - Hiệu quả mang lại của việc đầu tư cho đi học sau khi tốt nghiệp đối với tiền lương tiềm năng là không đổi theo thời gian ( rrst 1  ). Khi đó phương trình tiền lương được viết lại như sau t 1 lnEtj ln E0 s ln(1  )  ln(1 k ). js Ta có ln(1) x và x là hai vô cùng bé tương đương khi (0)x Do đó, khi giá trị của , khá nhỏ, ta được t 1 lnEtj ln E0  s  k js 6
Để xây dựng mối quan hệ giữa tiền lương tiềm năng và thâm niên công tác, Mincer giả sử rằng đầu tư vào học vấn sau tốt nghiệp giảm dần theo thời gian với dạng hàm số như sau: z ksz  1 trong đó z t s 0; (0,1) và T là số năm làm việc cuối cùng T được xét. Thay tất cả vào hàm tiền lương đã tính toán ở trên, ta được  2 lnln.EEszzt 0  22TT Khi đó, tiền lương thuần thu được do chi phí đầu tư vào học vấn sau khi tốt nghiệp là: z  2 ln1ln.EEszzt    0 TTTT 22   Hoặc có thể viết lại theo một cách khác: z 2 ln1.Eszzt   T lnE0   .   Với   . 2TT   . 2T Cuối cùng, giả sử tiền lương thực tế ghi nhận được bằng với tiền lương tiềm năng thuần tại bất kỳ thời điểm t, nghĩa là z lnln1.wEtt  T Khi đó, phương trình tiền lương của Mincer sẽ có dạng 2 ln wt  s  z  z với zts . 7
Đây là phương trình tiền lương Mincer dạng tĩnh, được sử dụng rất nhiều trong các công trình nghiên cứu về tiền lương và phân tích sự chênh lệch tiền lương. Một trong những công trình nghiên cứu xuất sắc, kế thừa phương trình tiền lương của Mincer (1974) được phát triển bởi Card (1994). Công trình này tập trung nghiên cứu tác động trung bình của số năm đi học đến tiền lương, thông qua kỹ thuật hồi quy theo phương pháp bình phương nhỏ nhất và phương pháp hồi quy với biến công cụ. Dạng hàm tiền lương được mở rộng thành dạng ln.wszzXu  2 (1.1) t Trong đó, s : số năm đi học z : Số năm kinh nghiệm tính đến thời điểm t với z t s X : Các biến độc lập khác có tác động đến tiền lương như giới tính, công việc, ngành nghề . Sau công trình nghiên cứu của Card (1994), rất nhiều các nghiên cứu khác đã mở rộng phương trình tiền lương của Mincer. Các công trình này không phải chỉ nghiên cứu tiền lương trung bình và phân tích chênh lệch tiền lương trung bình, như nghiên cứu của Oaxaca-Blinder (1973), mà còn mở rộng ra nghiên cứu các tham số thống kê khác của hàm phân phối có điều kiện của tiền lương. Trong số đó, Buchinsky (1994) thực hiện hồi quy phân vị trên hàm tiền lương của Mincer. Tiếp theo đó là hàng loạt các nghiên cứu khác về tiền lương và chênh lệch tiền lương dựa trên phương trình tiền lương của Mincer đã được công bố. Những nghiên cứu khác nhau sử dụng những biến độc lập khác nhau trong hàm tiền lương Mincer (1974) mở rộng. 1.2. PHƯƠNG PHÁP HỒI QUY PHÂN VỊ Phương pháp hồi quy phân vị được Koenker & Bassett giới thiệu lần đầu tiên năm 1978. Thay vì ước lượng các tham số của hàm hồi quy trung bình bằng phương pháp OLS, Koenker & Bassett (1978) đề xuất việc ước lượng tham số hồi quy trên từng phân vị của biến phụ thuộc để sao cho tổng chênh lệch tuyệt đối của hàm hồi quy tại phân vị τ của biến phụ thuộc là nhỏ nhất. Nói một cách khác, thay vì xác định 8
tác động biên của biến độc lập đến giá trị trung bình của biến phụ thuộc, hồi quy phân vị sẽ giúp xác định tác động biên của biến độc lập đến biến phụ thuộc trên từng phân vị của biến phụ thuộc đó. Trong Mục 1.1.2, đề tài giới thiệu đầy đủ các định nghĩa, tính chất của hồi quy phân vị. Đồng thời đề tài so sánh phương pháp hồi quy phân vị với phương pháp OLS của hồi quy cổ điển để cho thấy ưu điểm của hồi quy phân vị và sự phù hợp của hồi quy phân vị trong những nghiên cứu về chênh lệch tiền lương, cũng như trong các nghiên cứu về bất bình đẳng trong xã hội. a. Giới thiệu phương pháp hồi quy phân vị Định nghĩa về phân vị: Cho Y là một đ.l.n.n với hàm phân phối FY . Với  (0 ,1) thì giá trị phân vị τ của Y là giá trị Q sao cho Pr()Pr().YQYQ  (1.2)  Hoặc có thể viết lại QyFy inf:(). Y  (1.3) Nếu Y là một đ.l.n.n liên tục, thì: Pr()Pr()()YyYyFy Y . Vì vậy: FQY ().  (1.4) 1 Nếu F liên tục và tăng chặt thì QF Y (). Điều này có nghĩa là 1 0 0 % số quan sát của Y có giá trị không vượt quá giá trị phân vị Q và 100(1)%  số quan sát của Y có giá trị không thấp hơn . Giá trị phân vị, cũng như giá trị kỳ vọng của một đ.l.n.n, luôn là lời giải của một bài toán cực trị liên quan đến đ.l.n.n đó. Cụ thể, giá trị kỳ vọng E(Y) của đ.l.n.n Y là lời giải cho bài toán tìm  R sao cho ()()ydFy  2 đạt cực tiểu. (1.5) Y  R Trong khi giá trị trung bình của Y lời giải bài toán tìm cực tiểu (1.5) thì giá trị phân vị Q của Y là lời giải của bài toán tìm cực tiểu hàm mục tiêu sau L()  | y  | dF ()(1)| y  y  | dF (). y (1.6) YY yy  9
Hay QydFyydFy arg min()()(1)||(). (1.7)  YY  R yy  Dạng rời rạc của (1.7) là 1 QYY arg min()(1)(). ii (1.8)  R n i|| Ziii Z Nếu ta ký hiệu .ukhiu 0,  ().()uuI {0}u (1) u<0,ukhi với I(u<0) là hàm chỉ (index function) 0khi u 0, I{u 0} (1.9) 1khi u 0. Ta có thể viết ngắn gọn công thức (1.8) thành 1 n QY arg min(). i (1.10)  R n i 1 Định nghĩa về xác suất có điều kiện và phân vị có điều kiện Hàm phân phối xác suất đồng thời của hai biến ngẫu nhiên X và Y, ký hiệu là F x( ,y ) , được định nghĩa như sau: FxyXx(,)Pr(,). Yy x y Trong trường hợp liên tục, Fxyfs(,)(,) tdt ds , với f x( y , ) là hàm mật độ đồng thời thỏa mãn 0 f ( x , y ) và fxydy(,)1 dx x y Trong trường hợp rời rạc, F( x , yf )( s , t ) , st với là hàm mật độ đồng thời thỏa mãn và  f( x , y ) 1 xy Nếu X và Y có hàm mật độ đồng thời là . Khi đó hàm mật độ xác suất biên (marginal density function) của Y được xác định bởi 10
f()(,) y f x y dx Y nếu Y là liên tục, hoặc fyfxyY ()(,)  nếu Y là rời rạc. x Tương tự, hàm mật độ xác suất biên (marginal density function) của X là fxfxydy()(,) X nếu X là liên tục, hoặc fxfxyX ()(,)  nếu X là rời rạc. y Hàm mật độ xác suất có điều kiện của Y tại X=x được định nghĩa là fxy(,) fyx (|). fx( ) 0 YX| fx() X X nếu Hàm mật độ xác suất có điều kiện của X tại Y=y là f(,) x y f( x | y ) fy()0 YX| fy() Y Y nếu Hàm phân phối xác suất có điều kiện của Y tại Xx là: Fyxfyxdy(|)(|) nếu Y liên tục, YX| y và FyxfyxYX| (|)(|)  nếu Y rời rạc. y Kỳ vọng có điều kiện của Y tại X = x là E(|).(|) YXxy fyx dy YX| nếu Y liên tục, E(|).(|) YXxy fyx  YX| nếu Y rời rạc. y Phân vị có điều kiện tại phân vị  của Y tại X = x được xác định như sau Q ( Y |) Xxy inf:( Fy | x )). YX|  (1.11) Nếu FyxYX| (|) là liên tục thì FYX| Q ( Y | X x ) | X x  . 1 Nếu FYX| ( y | x ) là liên tục và tăng chặt thì Q (|)( YXFX |). YX|  (1.12) 11
Khi  gần 0, Q Y( X | ) x thể hiện phần đuôi trái của hàm phân phối có điều kiện FYX| ( y | x ) . Khi gần 1, Q Y( X | ) thể hiện phần đuôi phải của hàm phân phối có điều kiện FYX y| x( | ) . Trong kinh tế lượng, việc mở rộng bài toán (1.3) với trường hợp Y có dạng hàm số Y h X u( , )  để tìm ra hàm kỳ vọng có điều kiện EYXhX(|)(,)  được gọi là phương pháp hồi qui y theo x. Tương tự, Koenker & Bassett (1978) cũng đề xuất dạng mở rộng của bài toán (1.10) để tìm ra hàm phân vị có điều kiện QYX ( | ). Phương pháp này gọi là phương pháp hồi quy phân vị. Để mở rộng bài toán (1.10), giả sử ta có mẫu số liệu với các quan sát YXii, , in 1, với X i là vectơ k 1. Biến phụ thuộc Y có dạng YhXuiii (,)  trong đó ui là sai số của quan sát thứ i khi xét tại phân vị τ thỏa QuX(|)0ii . Khi đó, ta cần tìm hàm phân vị có điều kiện QYXhX(|)(,)iii  để hàm số n ((,)YhX đạt giá trị nhỏ nhất. Tuy nhiên, việc tìm hàm phân vị QYX(|)  ii  ii i 1 cũng chính là tìm hệ số hồi quy  . Bài toán trở thành tìm để cực tiểu biểu thức  . Khi xét bài toán này trên một mẫu số liệu cụ thể sẽ thu được ước lượng của ký hiệu ˆ ,  , n ˆ 1 Nghĩa là   arg min((,)). Yhii X k  R n i 1 Nếu hX(,)i  là hàm tuyến tính, tức là h(,), XXii 1 n ˆ thì   arg min(). YXii (1.13) k  R n i 1 1 n Đặt VYX( )   (ii   ). n i 1 12
ˆ Khi đó, phương trình (1.13) trở thành  arg min().V k  R và QYXhX(|)(,) ˆ trở thành hàm hồi quy phân vị ở phân vị  iii . Tương tự, hàm hồi quy phân vị tuyến tính ở phân vị có dạng QYXX(i | i ) i  . Và hàm hồi quy phân vị tuyến tính mẫu ở phân vị  sẽ là QYXX( | ) ˆ hay Y X ˆ u với Q( u | X ) 0. (1.14) i i i i i i ii ˆ Giá trị  trong (1.14) tìm được bằng cách chọn tham số hồi quy phân vị sao cho n 1 hàm mục tiêu VYX()()   ii đạt giá trị nhỏ nhất. Khi đó, ước lượng đạt n i 1 được khi xét trên một mẫu số liệu, cụ thể là ˆ  arg min(),V (1.15) k  R 1 n với VYX()().   ii (1.16) n i 1 Hàm mục tiêu V () có thể có nhiều cách biểu diễn khác nhau. 1 n VIYX(). (1.17)  YXii  0 ii n i 1 Hàm mục tiêu (1.17) có thể biểu diễn lại một cách tương đương 1 VYXYX(, ).(1)   iiii (1.18) n {i |}{ Yi |} Xi ii YX i Cách viết này cho thấy việc ước lượng tham số trong hàm hồi quy ứng với phân vị  là dựa trên toàn bộ mẫu số liệu. Mỗi quan sát được gán trọng số tương ứng. Cụ thể, những quan sát nằm phía trên đường hồi quy phân vị được gán trọng số và những quan sát nằm phía dưới được gán trọng số 1  . Công thức V () ở (1.18) còn có thể viết dưới dạng khác như sau 11n 1 VY( )sgn XY  X iiii (1.19) n i 1 22 trong đó sgn(.) là hàm dấu, với sgn(zI ) 1 2 {z 0} với I(.) là hàm chỉ đã định nghĩa ở (1.9). 13
1 Nếu  , hồi quy phân vị sẽ cho kết quả hàm hồi quy trung vị có điều kiện 2 QYXX0,50,5(|)iii  . Đây cũng chính là lời giải của bài toán hồi quy theo phương pháp LAD (Least Absolute Deviation – Độ lệch tuyệt đối nhỏ nhất) rất phổ biến trong kinh tế lượng cổ điển n ˆ LADii arg min.  YX (1.20) k 0,5 R i 1 Trong hồi quy phân vị, ứng với mỗi phân vị  (0 ,1), ta có thể ước lượng được một hàm hồi quy. Hình 1.1 là một hình vẽ minh họa cho trường hợp hồi quy được thực hiện trên các phân vị 0,1 – 0,25 – 0,5 – 0,75 và 0,9. 20 q90 q75 18 OLS q50 q25 16 q10 14 12 6 8 10 12 14 x y q10 q25 q50 q75 q90 OLS Nguồn: tác giả tính toán từ số liệu mô phỏng trên Stata Hình 1. 1: Đồ thị biểu diễn các kết quả hồi quy phân vị của Y theo X Hồi quy bằng phương pháp OLS chỉ thu được một đường hồi quy duy nhất thể hiện giá trị trung bình có điều kiện của biến phụ thuộc Y theo các giá trị của biến độc lập X. Trong khi đó, hồi quy phân vị cho thấy được nhiều hàm hồi quy ứng với từng phân vị của biến phụ thuộc. 14
b. Tính chất của phương pháp hồi quy phân vị Theo Koenker (2005) và Hao & Naiman (2007), hồi quy phân vị có những tính chất quan trọng thể hiện ưu điểm của phương pháp hồi quy này so với phương bình phương nhỏ nhất. b.1. Tính đẳng biến (Equivariance) Giá trị phân vị có tính đẳng biến khi biến đổi qua hàm số đơn điệu: với h(.) là một hàm số bất kỳ không giảm và Y là một đ.l.n.n liên tục, thì ta có P( Y a ) P ( h ( Y ) h ( a )) . Vì vậyQ h()() Y h Q Y . Từ đó, Koenker (2005) chứng các tính chất đẳng biến quan trọng của hồi quy phân vị 1. - Hồi quy phân vị có tính đẳng biến khi thay đổi quy mô (scale equivariance) * * * Cho YYii . và  là tham số của hàm hồi quy phân vị Yi theo X i . Khi đó, + nếu  0 thì * . (1.22)  + nếu  0 thì * . 1  (1.23) ˆˆ* + Trường hợp đặc biệt, khi  0 ,5 thì 0,50,5 . - Hàm hồi quy phân vị còn có tính chất đẳng biến khi thay đổi vị trí. Nghĩa là, * * * nếu yyXiii  và  là tham số của hồi quy phân vị của yi theo X i thì ˆˆ*  . (1.24) - Một tính chất khác của hồi quy phân vị là đẳng biến khi thay đổi dạng biến * ˆˆ*1 số. Cụ thể, nếu XXA . với A là ma trận không suy biến, thì  A . Tính đẳng biến của hồi quy phân vị đặc biệt hữu ích trong các tính toán biến đổi để ước lượng tham số khi dùng phương pháp quy hoạch tuyến tính. b.2. Tính ổn định (robustness) 1 Xem trang 38 của Koenker (2005) 15
Với hồi quy cổ điển, các ước lượng của phương pháp bình phương nhỏ nhất thay đổi ngay khi Yi thay đổi. Mỗi sự thay đổi trong sẽ dẫn đến sự thay đổi của các ước lượng hồi quy OLS. Điều này làm cho ảnh hưởng của các quan sát bất thường (extreme value) đến ước lượng của OLS là rất lớn. Trong khi đó, đối với hồi ˆ quy phân vị, khi thay đổi nhưng chưa làm biến đổi dấu của YXii  thì các tham số ước lượng của hồi quy phân vị không thay đổi. Nói khác đi, người ta có thể thay đổi giá trị của một quan sát ở một phía bất kỳ của đường hồi quy phân vị mà không làm ảnh hưởng đến kết quả hồi quy, nếu sự thay đổi đó không làm thay đổi phía của quan sát so với đường hồi quy phân vị. Do đó, cho dù nếu có thay thế một quan sát ban đầu bằng một quan sát bất thường thì giá trị của tham số ước lượng trên hồi quy vẫn không thay đổi nếu quan sát bất thường này nằm cùng phía với quan sát ban đầu so với hàm hồi quy. Vì vậy ước lượng bằng phương pháp hồi quy phân vị được xem là có tính ổn định hơn so với ước lượng OLS2. b.3. Hàm hồi quy phân vị k biến luôn đi qua ít nhất k quan sát của mẫu nghiên cứu Xét hàm mục tiêu được viết dưới dạng công thức (1.17): 1 n VIYX() (1.25)  YXii  0 ii n i 1 Hàm mục tiêu này liên tục và khả vi tại YXii  . Tại những điểm YXii  , 3 đạo hàm có hướng của V () theo hướng vecto đơn vị w là d V( , w ) V ( X wt | dt it 0 1 d n Y X  X wt I  i i i Yi X i  X i wt 0 n dt i 1 t 0 2 Xem trang 47 tài liệu Hao & Naiman (2007) 3 Xem trang 32 của Koenker (2005) 16
1 n X w khi( Y X ) 0 n  i i i  i 1 1 n (1  ) Xi w khi ( Y i X i  ) 0 n i 1 1 n ( I ) X w khi ( Y X ) 0  ( Xi w 0) i i i  n i 1 n * (,)YXXwXwiiii (1.26) i 1  I khi u 0 * u 0 Với  (,)uv  I khi u 0 v 0 * Một điểm  sẽ được gọi là cực tiểu của V () nếu tất cả các đạo hàm theo * * p hướng của V () tại  đều không âm, nghĩa là  Vw( , ) 0 với mọi wR có ˆ w 1. Ký hiệu  là điểm cực tiểu của hàmV () . Khi đó, phần dư của hàm hồi ˆ quy phân vị tương ứng là: eYXiii  . n Xét trường hợp n = k và bR sao cho Yii X b i1, k thì b sẽ làm cho V () đạt cực tiểu, vì các đạo hàm có hướng tại là 1 k ()0 IX ww  Xwi 0 i k i 1 Phương án này xảy ra ở k quan sát đầu tiên và phương án này cũng được coi là nghiệm cơ bản của (1.19). Ký hiệu  là tập con gồm có k phần tử của 1,2, ,n và  là tập hợp tất cả các tập . Đồng thời, gọi X () là ma trận cấp kk với các dòng tương ứng là Xii ,  (Nghĩa là từ n dòng của ma trận X chọn ra k dòng với các dòng có chỉ số thuộc tập ) và y() là vectơ cột cấp k 1 với các phần tử tương ứng 1 là Yii ,  . Khi đó hệ nghiệm cơ bản là bXy()(). () với  . Mỗi phương án thỏa mãn miền ràng buộc đều chứa k trong số n quan sát của mẫu nghiên cứu, 17
phương án b được nêu ra trước đó cũng là một trong số các phương án b() với trường hợp  1,. . . ,k ứng với k quan sát đầu tiên. 16 q75 14 q25 12 10 8 9 10 11 12 x y q75 q25 Hình 1. 2: Đường hồi quy phân vị 2 biến đi qua ít nhất 2 quan sát của mẫu Nguồn: tác giả tính toán từ số liệu mô phỏng Như vậy, phương án tối ưu của bài toán quy hoạch tuyến tính trong hồi quy phân vị là một trong số các phương án nên chắc chắc cũng sẽ đi qua ít nhất quan sát của mẫu. Hay nói cách khác, có ít nhất quan sát có phần dư bằng 0 trong hàm hồi quy phân vị của mẫu. Hình 1. 2 là một ví dụ minh họa bằng hình ảnh của tính chất trên đối với một hàm hồi quy phân vị hai biến. Nhìn trên đồ thị, mỗi dấu chấm là biểu diễn của một quan sát trong mẫu, ta nhận thấy mỗi hàm hồi quy phân vị trên hình đi qua ít nhất hai quan sát của mẫu số liệu có được. b.4. Số quan sát có phần dư âm của hàm hồi quy phân vị ứng với phân vị τ có thể đạt tỷ lệ cao nhất là τ 18
ˆ Xét phần dư e Yiii X  của hàm hồi quy phân vị có chứa hệ số tự do. Ký hiệu P là số quan sát có phần dư dương; N là số quan sát có phần dư âm và Z là số quan sát có phần dư bằng 0. Khi đó N n  N Z (1.27) P n(1  ) P Z (1.28) Từ tính chất này có thể suy ra rằng với mỗi hàm hồi quy ứng với phân vị  thì sẽ có không quá . 1 0 0 % số quan sát của mẫu nằm phía dưới đường hồi quy phân vị (có phần dư ui âm) và không quá ( 1 ) .100% số quan sát nằm phía trên (có phần dư 4 ui không âm) hàm hồi quy phân vị đang xét. b.5. Tính tăng dần của các hàm hồi quy phân vị 5tại giá trị trung bình của X 1 n Ký hiệu XX  i là giá trị trung bình của X. Gọi hàm hồi quy phân vị ở phân n i 1 ˆ vị  là QYXX(|)  . Giả sử xét tại hai phân vị 12, sao cho 12 thì ta luôn có ()0XX ˆˆ 21 (1.29) ˆ Công thức (1.29) hàm ý rằng, khi cùng xét tại X , giá trị ước lượng QYX (|)ii ứng với phân vị cao hơn sẽ luôn lớn hơn giá trị ước lượng tại phân vị thấp hơn. Tuy nhiên, tính chất này chưa chắc đúng khi xét tại những giá trị X bất kỳ khác. Tính chất này được minh họa trên Hình 1. 3. 4 Xem trang 56 của tài liệu Koenker (2005) 5 Xem trang 56 của tài liệu Koenker (2005) 19
X trung binh = 9,9524 20 q90 q75 18 q50 y q25 16 q10 14 12 6 8 10 12 14 y q10 q25 q50 q75 q90 X trung binh Hình 1. 3: Giá trị hồi quy tăng dần khi phân vị tăng dần tại X trung bình Nguồn: tác giả tính toán từ số liệu mô phỏng b.6. Ước lượng của hồi quy phân vị là ước lượng M-estimator Ước lượng M-estimator được đề cập lần đầu tiên trong kết quả nghiên cứu của Gouriéroux và Monfort (2008). Giả sử xét một mô hình tham số hoặc bán tham số với tham số   và các quan sát (,)Xyiiin 1, , , một ước lượng được gọi là M- estimator của một hàm g() nếu ước lượng đó là lời giải của bài toán cực trị n min(,,)  yXgii . Một M-estimator của một hàm được chứng minh là luôn hội tụ gg () i 1 về giá trị đúng của hàm số đó nếu thỏa mãn các điều kiện chính quy (regularity conditions) + Các cặp quan sát (,)Xyiilà i.i.d (identical independent distribution- độc lập và có cùng phân phối). + g() là một tập mở 20
+  là một hàm liên tục theo g , kỳ vọng có điều kiện của theo các giá trị thực của ( ,Xy ) luôn tồn tại với mọi 1 n + ( ,y , )iiX g là hội tụ hầu chắc theo trên g() về E EXoii y X g( , , ) n i 1 0 + Lời giải duy nhất của bài toán cực trị là gg ()0 trong đó 0 là tham số của hàm phân phối “đúng” ˆ Trong bài toán hồi quy phân vị, ước lượng  là lời giải bài toán cực tiểu (1.17), vì thế có thể coi là một M-estimator và khi mô hình hồi quy phân vị thỏa mãn các điều kiện chính quy thì nó cũng hội tụ về giá trị đúng của tham số hồi quy cần tìm. b.7. Ước lượng của hồi quy phân vị có thể xem là xấp xỉ của ước lượng GMM (General Method of Moment) Theo Buchinsky (1998b), ước lượng thu được từ (1.13) của hồi quy phân vị có thể xem là xấp xỉ của một ước lượng GMM. Điều này có thế được từ điều kiện cần (F.O.C – first order condition) để hàm số V () đạt cực trị: 1 n XI 0.  i YXii  0 n i 1 (1.30) Biểu thức (1.30) có dạng của một hàm moment phù hợp với một ước lượng GMM. Điều này cho thấy các ước lượng tính được bằng phương pháp hồi quy phân vị cũng ˆ có thể xem là ước lượng GMM. Vì vậy, các ước lượng  tính được bằng phương pháp hồi quy phân vị cũng có những tính chất mà một ước lượng GMM có, đó là tính vững, tính tiệm cận chuẩn. Riêng tính hiệu quả của có thể cải thiện bằng cách chọn ma trận trọng số xác định dương phù hợp. Xét hàm moment m(,,) Y X X I (1.31)  i i i YXii  0 Hàm kỳ vọng của (1.31) có dạng 21
E m(,,) yi X i E X i I YXii  0 EXEIXii | YXii  0 EXFX  ( ) i Y| X i Khi phân vị hồi quy được thực hiện tại phân vị  , tham số  nhận giá trị cụ thể là  , thì FXYXi| ()  phải bằng  sao cho EmyX (,,)0 ii Khi đó, các ước lượng tham số của hàm hồi quy phân vị tại phân vị  có thể được xác định bằng phương pháp GMM với hàm kỳ vọng E[ m ( , y , X )] 0  ii (1.32) Theo Buchinsky (1998), với hàm moment như trên, ta có nN()(0,)ˆ  d  11 Ma trận phương sai hiệp phương sai   (1) DD (1.33) Trong đó  DEXFX iY  Xi | ()  | EX XiiYii fXX  (1.34) 0 | EX X fX iii i  E m(,,)(,,) Yi X i m Y i X i  EXIXI ii YXYXi i 00 i i  2 EXXIii  YXii  0 Ta có I có phân phối Bernoulli với trung bình là  và phương sai (1) . YXii  0 Do vậy  (1) EXX  ii (1.35) Như vậy, (1.33) có thể được viết đầy đủ, nN()(0,)ˆ  d  11  (1) EXXf (0|) X EXX [ ] EXXf (0|) X (1.36)  i i  i i i i i  i 22
Nếu không có hiện tượng phương sai thay đổi, hàm mật độ của sai số i độc lập với X , và do đó f(0 | X ) f (0) thì công thức (1.46) được viết lại thành i i (1) 1  EXX[] (1.37)  f 2 (0) ii  1 n Trong thực tế tính toán với số liệu mẫu, E[] X Xii được ước lượng bằng  XXii n i 1 Hendricks & Koenker (1991) ước lượng fX(0 | ) và D bằng các công thức:  i  ˆ 2h fi (1.38) X ˆˆ ihh ()() 1 n ˆ DfXX  iii. (1.39) n i 1 Kết quả này cho thấy, khi mật độ của các quan sát càng dày đặc thì phương sai của phân vị càng nhỏ, giá trị phân vị càng ít biến động. Khi mật độ quan sát càng thưa thớt thì phương sai của phân vị càng lớn, giá trị phân vị càng biến động nhiều. b.8. Tính vững (consistency) Dựa vào (1.32) cho thấy ước lượng của hồi quy phân vị xấp xỉ một ước lượng GMM nên mang tính vững - vốn đã được chứng minh luôn xảy ra với các ước lượng của GMM (theo Green (2011)). c. Kiểm định giả thuyết thống kê với hồi quy phân vị Trong tài liệu về hồi quy phân vị của Koenker (2005), những suy diễn thống kê liên quan đến kiểm định hệ số hồi quy của hồi quy phân vị cũng được chứng minh và áp dụng giống như phương pháp OLS. Những kiểm định được Koenker (2005) đề xuất gồm kiểm định Wald6 và kiểm định Likelihood ratio7 c.1. Kiểm định Wald Kiểm định H0 : R r với R là ma trận cấp qK và r cấp q 1 n ˆ   d N0,  (1  ) D 11  D     6 Trang 75 sách “Quantile Regression” của Koenker (2005) 7 Trang 92 sách “Quantile Regression” của Koenker (2005) 23
Dưới giả thiết H0 ˆˆd nRnRrN()(())(0,(1)())   11 Trong đó  () RDDR ˆˆ ˆ 1 nRrRr()()()  Wq()()  d 2 n (1) ˆˆ 11 11ˆ 11   R D D R , với DD là một ước lượng vững của DD c.2. Kiểm định Likelihood ratio Koenker & Machado (1999) cũng đã chứng minh được rằng giả thuyết H0 : R r cũng có thể được kiểm định bằng phương pháp Likelihood ratio như trong hồi quy với giá trị trung bình thông thường. ˆ Cho  và  là ước lượng của  lần lượt trong hai trường hợp có ràng buộc và ˆ ˆ không có ràng buộc. VV () và VV () là các hàm mục tiêu tương ứng.  () Cho hàm mật độ Laplace bất đối xứng fe ()(1) . Hàm hợp lý log- likelihood trong trường hợp này là n LnyXnii()log(1)()    i 1 Khi đó 2 lần của tỷ lệ log – likelihood ratio là 2(,)(,)2 LLVVˆ ˆ nn Theo Koenker & Machado (1999) 2 VV ˆ  d 2 LR 1   () q (1 ) f (0)  d. Ưu điểm và nhược điểm của hồi quy phân vị Sau khi Koenker và Bassett (1978) giới thiệu mô hình hồi quy phân vị đầu tiên, rất nhiều các nghiên cứu được thực hiện sau đó nhằm khắc phục các nhược điểm, 24
đồng thời mở rộng hồi quy phân vị. Ngày càng có nhiều các bài nghiên cứu ứng dụng hồi quy được thực hiện và công bố, cho thấy hồi quy phân vị đang ngày càng được hoàn thiện và ngày càng trở thành công cụ đắc lực trong nghiên cứu kinh tế. Theo Koenker (2005) và Hao & Naiman (2007), hồi quy phân vị có những ưu điểm như sau. Ưu điểm - Thứ nhất, phương pháp hồi quy phân vị cho phép thể hiện một cách chi tiết về mối quan hệ giữa biến phụ thuộc và các biến độc lập trên từng phân vị của biến phụ thuộc, không phải chỉ xét mối quan hệ này trên giá trị trung bình như hồi quy OLS. Ưu điểm này thể hiện rõ trong Hình 1. 1. Trong đó, Hình 1. 1 thể hiện nhiều hàm hồi quy cho nhiều phân vị, cho thấy tác động khác nhau của biến độc lập X ứng với nhiều phân vị của biến phụ thuộc Y. - Thứ hai, mặc dù các tính toán thực hiện trong hồi quy phân vị là phức tạp và khối lượng tính toán nhiều hơn trong OLS, nhưng với sự phát triển của toán học, thống kê học cộng với sự hỗ trợ của công nghệ thông tin thì những tính toán như quy hoạch tuyến tính, bootstrap, được thực hiện rất dễ dàng và nhanh chóng. - Thứ ba, trong hồi quy OLS, các quan sát bất thường (outliers) thường được loại bỏ để ước lượng OLS không bị chệch. Trong khi đó, hồi quy phân vị có tính ổn định (robustness), không bị ảnh hưởng bởi sự hiện diện của các quan sát bất thường đó. - Thứ tư, các kiểm định về tham số của hồi quy phân vị không dựa vào tính chuẩn của sai số. Hơn nữa, các kiểm định này không dựa trên bất kỳ một giả định nào về dạng phân phối của sai số hồi quy. - Thứ năm, hồi quy phân vị đặc biệt phù hợp khi phân tích trên mô hình hồi quy có sự hiện diện của phương sai thay đổi hoặc trong mẫu số liệu mà hàm phân phối của biến phụ thuộc bất đối xứng quanh giá trị trung bình. Khi đó, hàm hồi quy phân vị trên các phân vị khác nhau sẽ có sự khác biệt rõ rệt, cho thấy tác 25
động không giống nhau của biến độc lập đến biến phụ thuộc ở những phân vị khác nhau. Nhược điểm của hồi quy phân vị Bên cạnh các ưu điểm đã được nêu trên, hồi quy phân vị vẫn còn một số nhược điểm như sau: - Một là, các tính toán trong hồi quy phân vị phức tạp hơn so với OLS. Ví dụ như trong OLS, muốn tìm ước lượng tham số hồi quy sao cho tổng bình phương sai số là nhỏ nhất thì có thể áp dụng các công thức tìm cực trị của giải tích toán học như lấy đạo hàm riêng và giải hệ phương trình ứng với điều kiện cần của cực trị. Trong khi đó, ước lượng tham số của hồi quy phân vị thực hiện thông qua việc giải bài toán quy hoạch tuyến tính. Việc này sẽ khó khăn nếu không có sự hỗ trợ của máy tính. - Hai là, phải thực hiện nhiều hàm hồi quy trên nhiều phân vị mới cho thấy được toàn diện sự tác động của biến độc lập đến biến phụ thuộc thay vì chỉ có một hàm hồi quy trung bình có điều kiện trong OLS. - Ba là, việc áp dụng hồi quy phân vị cho các dạng hàm phi tuyến còn khá hạn chế. Các lý thuyết để xử lý tự tương quan hoặc nội sinh trong hồi quy phân vị còn chưa được phát triển hoàn thiện. 1.2.1. Tính chệch của ước lượng do chọn mẫu khi xây dựng hàm tiền lương và phương pháp hiệu chỉnh tính chệch do chọn mẫu Sau khi hồi quy phân vị được Koenker & Bassett giới thiệu năm 1978, rất nhiều nghiên cứu đã ứng dụng hồi quy phân vị trong xây dựng hàm tiền lương cho các quốc gia trên thế giới. Tuy nhiên, vấn đề xây dựng hàm tiền lương bằng hồi quy có thể đối mặt với khó khăn về vấn đề chọn mẫu do ước lượng. Các hàm tiền lương xây dựng bằng hồi quy phân vị cũng không tránh khỏi những khó khăn này. 26
a. Tính chệch do chọn mẫu (Sample selection bias) Heckman (1979) trong một bài báo nổi tiếng của mình đã chỉ ra rằng, việc ước lượng hàm tiền lương dựa trên việc chọn mẫu chỉ lấy số liệu ở những người có việc làm và được nhận lương mà bỏ qua những người lao động không tham gia làm việc sẽ làm cho ước lượng bình phương nhỏ nhất thu được bị chệch (biased) và không vững (inconsistent). Heckman gọi đó là tính chệch do vấn đề chọn mẫu (Sample selection bias). Giả sử hàm tiền lương cần ước lượng có dạng tuyến tính Y X* u  (1.40) iii * Trong đó, gọi Yi ký hiệu cho biến tiền lương tiềm năng (potential wage). Đây là mức tiền lương tối thiểu mà người lao động thứ i mong muốn để làm một công việc nào đó. Với những mức lương nhỏ hơn mức lương tiềm năng này, người lao động sẽ chấp nhận thất nghiệp thay vì đi làm. Việc một người quyết định nhận một công việc hay thất nghiệp có thể được xây dựng thành một hàm lựa chọn như sau: * DZiii  * 1 khi 0Di Di 0 khi 0D* i (1.41) Việc lựa chọn này phụ thuộc vào các yếu tố thể hiện trong Zi . được giả định là chứa tất cả các biến trong Xi và thêm một vài yếu tố khác. εi là sai số của hàm lựa chọn. Số liệu của (vì vậy, của Xi) là thu thập được, không phân biệt là người đó có công việc hay không. Chúng ta không thể quan sát được mức lương tiềm năng , chúng ta chỉ có thể biết được rằng khi người lao động quyết định đi làm, tức Di = 1, thì mức lương tiềm năng được thể hiện ra chính là mức lương thực tế Yi mà người lao động nhận được. YDii khi 0, Khi đó, Yi * 0 khi Di 0. Heckman chỉ ra nguyên nhân gây ra tính chệch của ước lượng bằng mô hình Heckman sau. 27
2 Gọi uN~ (0 , )  u , 2 2 ~N (0, ) với   1, phân phối đồng thời F(u,ε) cũng là phân phối chuẩn, u , độc lập với XZ,. Hệ số tương quan giữa và là u , và khi đó, hiệp phương sai giữa và là uu , tức là Cov(,)(). u E ui  i u  u (1.42) Trong các nghiên cứu thông thường, mẫu chỉ được chọn ứng với Di 1. Lấy kỳ vọng có điều kiện ở cả hai vế của phương trình (1.40), ta có EYDXXEuDX(|1,)(|1,).iiiiiii  (1.43) * Kết hợp với phương trình (1.41), Di 1 => Di 0 => Zii  0=> ii Z . Suy ra E(|1,)(|,). YDXXEiiiiiiii uZX  (1.44) Vì , độc lập với XZ, nên phương trình (1.44) có thể được viết lại E(|1,)(|). YDXXE uZ  iiiiiii (1.45) Nếu u và  không tương quan ( u 0 ) thì EuZ(|)0iii  , và do đó ước lượng thu được bằng OLS của phương trình (1.40) vẫn là ước lượng không chệch và vững. Tuy nhiên, do và có thể tương quan với nhau ( u 0 ) nên EuZ(|)0iii  , khi đó ước lượng sẽ bị chệch và không còn là ước lượng vững nữa. Sự chệch này là do vấn đề chọn mẫu gây ra, gọi là hiện tượng ước lượng bị chệch do chọn mẫu. Nếu chỉ thu thập số liệu ở những người lao động có đi làm và được nhận lương thì hàm tiền lương ước lượng được không phản ánh đúng hàm tiền lương của tổng thể. Vì trong tổng thể có cả những người lao động không đi làm và không nhận * lương. Họ không làm việc vì họ được trả lương thấp hơn mức lương tiềm năng Yi . Họ vẫn có đầy đủ các đặc điểm lao động được nghiên cứu trong X. Nếu họ đi làm, 28
thậm chí họ có thể đạt được mức lương cao hơn những lao động quan sát được trong mẫu có cùng giá trị các biến độc lập như họ. Việc bỏ qua nhóm lao động này sẽ làm cho ước lượng tham số hồi quy thu được từ mẫu bị chệch và phản ánh sai mức độ tác động các yếu tố trong X i đến tiền lương Yi . b. Hiệu chỉnh tính chệch do chọn mẫu - Thủ tục Heckman hai bước Từ các phân tích như trên, Heckman (1979) xem sự xuất hiện của E u( | Z)iii  trong phương trình (1.45) gây ra tình trạng ước lượng chệch và không vững. Sự xuất hiện của thành phần này làm cho hàm hồi quy tiền lương ban đầu giống như đã bỏ sót một yếu tố quan trọng. Sự bỏ sót biến này gây ra hiện tượng nội sinh cho mô hình. Do vậy, ước lượng thu được nếu chỉ hồi quy trên số liệu những quan sát có tiền lương sẽ bị chệch. Để khắc phục trường hợp này, Heckman (1979) đề xuất khắc phục bằng cách lượng hóa yếu tố bị bỏ sót và đưa biến này vào mô hình. Theo Green (2011), 8 EuZ(|)iii  có thể được ước lượng thông qua tỷ lệ Mills nghịch đảo . Tỷ lệ Mills nghịch đảo, được đặt theo tên của John P. Mills, cho biết tỷ lệ giữa hàm mật độ xác suất so với hàm phân phối tích lũy của một đ.l.n.n; tỷ lệ này được xây dựng dựa trên tính chất sau đây của hàm phân phối chuẩn:   2  u Nếu uN~(,) u thì E( u | u  )   , (1.46) u  1   u :Mills ratio trong đó ( . ) là hàm mật độ xác suất Gauss, (.) là hàm phân phối của phân phối Gauss.    Tỷ lệ u trong công thức trên được gọi là tỷ lệ Mills và ký hiệu là λ.  1   u 8 Xem trang 854 của Green (2011) 29
Áp dụng (1.46) để tính EZ( | ) iii , với i ~ (N 0 ,1) và  ii Z ta được   ZZii EZZZ(|)01.()().   iiiiiii (1.47) 1  ZZii Kết hợp với CovuEu(,)()  iiuu  ở (1.42), ta được E( ui | i Z i ) u  u  i ( Z i )   i ( Z i ). (1.48)  Phương trình hồi quy (1.45) trở thành EYDXZ(|1)(),iiii   hay WXZiiii   (), (1.49)  i thỏa mãn các giả thiết hồi quy cổ điển. Trong phương trình (1.49), số hạng  () Zi đóng vai trò như là biến bị bỏ sót, được bổ sung vào mô hình. Vì biến bỏ sót đã được đưa vào mô hình tiền lương nên ước lượng β thu được khi hồi quy theo (1.49) sẽ là ước lượng không chệch. Từ các bước lập luận như trên, Heckman(1979) đề xuất thủ tục hồi quy hiệu chỉnh chệch do chọn mẫu theo hai bước theo đề xuất của Heckman được thực hiện như sau: - Bước 1: Ước lượng hồi quy probit với biến phụ thuộc Di được định nghĩa ở phương trình (1.41) để thu được ước lượng ˆ của . Với mỗi ˆ ˆ  ()Zi quan sát trong mẫu, tính tỷ lệ Mills với công thức i ()Zi ˆ ˆ - Bước 2: Hồi quy Y i theo X và  theo phương trình (1.49) bằng OLS để thu được ước lượng không chệch của  . Với việc phát hiện tính chệch của ước lượng do vấn đề chọn mẫu và đề xuất thủ tục hiệu chỉnh tính chệch này, Heckman đã được trao giải Nobel về kinh tế năm 2000. Tuy nhiên, Cosslett(1991), Gallant & Nychka (1987), Powell (1987), Klein & Spady(1993) và Newey (1991) chỉ ra rằng, thủ tục hai bước của Heckman sẽ cho ước lượng không vững nếu các sai số ui, εi hoặc phân phối đồng thời giữa chúng không 30
có phân phối chuẩn và từ đó để xuất phương pháp ước lượng bán tham số (semiparametric) trong khắc phục tính chệch do chọn mẫu. Bên cạnh đó, Donald (1995) chỉ ra rằng hiện tượng phương sai thay đổi nếu hiện diện trong hàm tiền lương cũng ảnh hưởng đến kết quả thu được từ thủ tục Heckman và đề xuất thủ tục hiệu chỉnh tính chệch do chọn mẫu trong điều kiện có phương sai thay đổi, nhưng Donald lại giữ nguyên giả định về phân phối chuẩn của ui, εi. Chen & Khan (2003) đề xuất thủ tục hiệu chỉnh tính chệch trong trường hợp giả thuyết về tính chuẩn không được đảm bảo và có hiện tượng phương sai thay đổi Phương pháp hiệu chỉnh sai số theo Buchinsky (1998) trong hồi quy phân vị Buchinsky (1998a và 2001) là người đầu tiên đề xuất việc hiệu chỉnh tính chệch do chọn mẫu đối với phương pháp hồi quy phân vị cũng bằng một thủ tục gồm hai bước. Phương pháp này cũng dựa trên những ý tưởng của Heckman (1979) nhưng có hai điểm khác biệt lớn. Thứ nhất, thay vì chỉ hiệu chỉnh tính chệch cho hàm tiền lương trung bình với phương pháp OLS như Heckman đề xuất, phương pháp của Buchinsky hiệu chỉnh tính chệch cho ước lượng hồi quy theo phương pháp hồi quy phân vị. Thứ hai, thủ tục do Buchinsky đề xuất không có giả thiết về phương sai không đổi. Hai bước trong phương pháp của Buchinsky như sau: - Bước 1: Buchinsky thực hiện ước lượng hàm lựa chọn (1.41) bằng hàm probit theo phương pháp do Ichimura (1993) đề xuất - Bước 2, Xây dựng số hạng dùng để hiệu chỉnh tính chệch do chọn mẫu, ước lượng và xây dựng phương pháp ước lượng hiệu chỉnh tính chệch đối với hàm hồi quy trên từng phân vị. Buchinsky xây dựng số hạng hiệu chỉnh chênh lệch trong hàm tiền lương, P Zi , dưới dạng một đa thức và đưa số hạng này vào hàm hồi quy phân vị Q( Yiiiii |,1). X DXP (). Z  Phương pháp của Buchinsky (1998a) vẫn còn phụ thuộc vào giả định tính chuẩn của sai số. Để cải tiến phương pháp của Buchinsky (1998a), trong việc nới lỏng giả 31
thiết về tính chuẩn của sai số, Coelho et al (2007), Huber & Melly(2011) sử dụng phương pháp ước lượng bán tham số của Klein & Spady (1993) trong bước 1 để hồi quy hàm lựa chọn, tìm được ước lượng tham số trong hàm lựa chọn và đưa vào tính toán hệ số hồi quy hiệu chỉnh sai số ở bước 2. 1.2.2. Vấn đề nội sinh và phương pháp hồi quy phân vị hai bước (two - stage quantile regression) Vấn đề nội sinh là một vấn đề quan trọng trong hồi quy vì nó liên quan đến tính vững của hệ số hồi quy nhận được ước lượng. Ameniya (1982) là người đầu tiên xem xét đến hiện tượng nội sinh đối với hồi quy phân vị. Tuy nhiên, Ameniya chỉ mới xét đến hiện tượng nội sinh hàm hồi quy trung vị, tức là hàm hồi quy ứng với phân vị τ = 0,5. Những nghiên cứu tiếp theo của Powell (1983) và Chen & Portnoy(1996) cũng mở rộng hướng tiếp cận của Ameniya (1982). Powell (1983) đề xuất phương pháp trị tuyệt đối nhỏ nhất hai giai đoạn (DSLAD – Double stage least absolute deviations) để ước lượng hàm hồi quy phân vị 0,5 trong trường hợp biến độc lập bị nội sinh. Powell (1983) đề xuất phương pháp hồi quy phân vị hai giai đoạn (DSQR – Double Stage Quantile Regression), không phải chỉ xét trên phân vị 0,5 mà mở rộng ra trên tất cả các phân vị của biến phụ thuộc. Mở rộng phương pháp của Powell (1983), Kim T. & Muller C. (2004) đề xuất khắc phục nội sinh của hồi quy phân vị bằng cách dùng hồi quy phân vị hai giai đoạn với cả hai giai đoạn đều được ước lượng bằng phương pháp hồi quy phân vị. Giả sử hàm hồi quy có dạng Y X1  0 X 2 0 u, trong đó X1 là ma trận cấp ng gồm số liệu của g biến độc lập nội sinh trong mô hình hồi quy; X2 là ma trận cấp nk 1 , gồm số liệu của k1 biến ngoại sinh. Giả sử tìm được k2 biến công cụ, số liệu của các biến công cụ này được thể hiện trong ma trận Z có cấp nk 2 . Hiện tượng nội sinh xảy ra trong mô hình làm cho Q( u | X1 ) Q ( u ) . Bất đẳng thức này được Kim T. & Muller C dùng làm định nghĩa cho hiện tượng nội sinh trong hồi quy phân vị. Hơn nữa, các tác giả giả định rằng các 32
biến nội sinh trong X1 có thể được biểu diễn quan các biến công cụ và các biến ngoại sinh như sau * XZV10  , * trong đó ZX [ Z]2 là ma trận cấp nk với k k k 12, 0 là ma trận cấp kg các tham số hồi quy của các biến nội sinh trong X1 theo X, V là ma trận cấp ng các sai số khi hồi quy các biến nội sinh trong X1 theo X. * Khi đó, dạng thu gọn của biến phụ thuộc Y sẽ là YZ 0 với I k1 và  uV . 00000   H() 0 0 Xét một ánh xạ  :,(0,1)RR và ()()aaa trong đó  ()1a (0)a . Các tham số ước lượng được của phương pháp hồi quy phân vị hai giai đoạn là lời giải của bài toán tìm giá trị cực tiểu của hàm mục tiêu: n ˆˆ min(   ,SqqYqniii , ,  ˆˆ ZZ, )(1)( H ).   i 1 * Trong đó Yi và Z i là số liệu của biến phụ thuộc và các biến độc lập cũng như biến công cụ ở quan sát thứ i; q là hằng số dương được chọn bởi người nghiên cứu; ˆ và ˆ  j là các ước lượng thu thập được từ giai đoạn 1 của hồi quy phân vị hai giai đoạn. Các ước lượng của giai đoạn 1 này cũng được ước lượng bằng phương pháp hồi quy phân vị, nghĩa là, và cũng là lời giải của các bài toán cực trị n n * * min()  YZii và min  (Yji Z i  j ),( j 1,2, , g ).    i 1 j i 1 33
* Việc viết lại công thức của biến phụ thuộc y dưới dạng q Yii q Z( 1 ) ˆ đã được Ameniya (1982) sử dụng như là một tính chất của 2SLS và là một trong các hướng cải thiện tính hiệu quả của ước lượng. Kim T. & Muller C. (2004) cũng dùng phương pháp mô phỏng Monte Carlo để khảo sát tính chất của các ước lượng thu được từ DSQR. Kết quả kiểm định cho thấy các tính chất tiệm cận chuẩn, tính tiệm cận vững và tính ổn định của ước lượng DSQR với bước 1 thực hiện bằng QR luôn được đảm bảo Năm 2009, mở rộng nghiên cứu của Kim T. & Muller C, một nhóm các tác giả khác là Chevapatrakul và các cộng sự (2009) cũng đề xuất phương pháp 2SQR (two-stage quantile regression) để xử lý nội sinh đối với hồi quy phân vị. Theo phương pháp của Chevapatrakul, ở bước 1, biến độc lập nội sinh được hồi quy theo các biến công cụ bằng phương pháp bình phương nhỏ nhất rồi tính ra giá trị ước lượng cho các biến nội sinh này. Trong bước 2, biến phụ thuộc được hồi quy theo các biến độc lập ngoại sinh và giá trị ước lượng của các biến nội sinh đã tính toán ở bước 1. 1.3. Phương pháp phân rã chênh lệch bằng hồi quy phân vị Phương pháp phân rã chênh lệch bằng hồi quy phân vị được Machado - Mata (2005) phát triển từ phương pháp phân rã của Oaxaca – Blinder (1973). Theo Oaxaca – Blinder (1973), sự chênh lệch tiền lương giữa hai nhóm lao động nam và nữ có thể được phân tích thành hai phần chênh lệch: chênh lệch gây ra do sự khác biệt về các biến độc lập và chênh lệch gây ra do khác biệt về hệ số hồi quy giữa hai nhóm. Để mô hình hóa hai phần chênh lệch này, Oaxaca – Blinder (1973) xây dựng hàm hồi quy như sau. Gọi T : số quan sát trong mẫu nghiên cứu, k : số tham số, Y : tiền lương của người lao động, Y : tiền lương trung bình, 34
X : ma trận nk bao gồm giá trị cụ thể của các yếu tố tác động đến tiền lương, X : Ma trận k 1 các giá trị trung bình của các yếu tố trong , XXXiiki (1 ), 2  : Vectơ các tham số hồi quy, ˆ : Vectơ là ước lượng của . Giả sử hàm hồi quy tiền lương tuyến tính Y X u  . Khi đó, hàm hồi quy mẫu có dạng Y X e ˆ . Hàm hồi quy tuyến tính tại giá trị trung bình YX ˆ. Giả sử cần phân tích chênh lệch tiền lương giữa nhóm lao động nam (m) và nhóm lao động nữ (f). Khi đó hàm hồi quy tiền lương trung bình giữa 2 nhóm như sau: ˆ Nhóm nam: YXmmm  . (1.50) ˆ Nhóm nữ: YXfff  . (1.51) Lấy (1.50) – (1.51) ta được chênh lệch tiền lương trung bình giữa nhóm nam và nữ, ta được ˆˆ YYXXmfmmff , (1.52) ˆˆˆˆ hay YYXXXXmfmmfmfmff  . ˆˆˆ Suy ra YYXXXmfmfmfmf ()().  (1.53) Giả sử rằng hàm tiền lương của nhóm lao động nam được chọn làm chuẩn để so ˆ sánh. Trong phương trình (1.53), thành phần ()XXmfm  biểu diễn cho phần chênh lệch tiền lương đã được giải thích bởi sự chênh lệch trung bình của các biến độc lập ˆˆ tham gia trong mô hình. Trong khi đó, thành phần X f() m f cho biết phần chênh lệch tiền lương chưa được giải thích, gây ra bởi chênh lệch về hệ số hồi quy giữa hai nhóm. Trong các nghiên cứu của Oaxaca (1973), Dalton (1977), Dunn (1986) và một số nghiên cứu khác thì phần chênh lệch chưa được giải thích này được xem như là thước đo cho sự bất bình đẳng hoặc sự phân biệt đối xử trong xã hội. 35
0 ˆ Xét hàm hồi quy YXffm  . (1.54) Hàm (1.54) được gọi là hàm hồi quy tiền lương trung bình khi không có sự phân biệt đối xử đối với nữ giới. Vì trong hàm hồi quy này lao động nữ được trả công như lao động nam, thể hiện qua việc sử dụng hàm hồi quy với đặc điểm lao động trung bình của nữ ( X f ) nhưng được trả lương với hệ số hồi quy của lao động ˆ nam ( m ). Tương tự công thức (1.53), thay vì dùng hàm tiền lương trung bình của lao động 0 ˆ nam làm chuẩn, nếu sử dụng hàm tiền lương trung bình của nữ YYXffff  làm chuẩn so sánh, thì chênh lệch tiền lương trung bình giữa nam và nữ có thể viết lại như sau: YYXXX ()(). ˆˆˆ (1.55) mfmffmmf ˆ Lúc này, số hạng ()XXmff  cho biết phần chênh lệch tiền lương được giải ˆˆ thích và số hạng X mmf () thể hiện phần chênh lệch tiền lương chưa được giải 0 ˆ thích. Hoặc chúng ta có thể xem YXmmf  như là phần so sánh, thể hiện hàm tiền lương khi không có tình trạng phân biệt đối xử tiền lương đối với nam, nghĩa là với ˆ đặc điểm lao động của nam X m nhưng được trả lương giống như lao động nữ  f . Machado & Mata (2005) áp dụng kỹ thuật tương tự cho hàm hồi quy phân vị của tiền lương. Giả sử hàm hồi quy phân vị phân vị ở phân vị  ở nhóm lao động nam như sau YXmmmm  và đặt Q(|) YXXmmmm  và QuX(|)0.mm (1.56) Hàm hồi quy phân vị tương ứng của nhóm lao động nữ là Yf X f f u f trong đó QYXX(f | f ) f f và QuX(|)0.ff (1.57) Gọi QYXX(f | m ) m  f là hàm hồi quy phân vị tiền lương đối chứng được xây dựng trong trường hợp giả định lao động nữ có đặc điểm lao động giống như lao động 36
nam. Khi đó, khoảng cách tiền lương giữa hai nhóm sẽ được Machado & Mata (2005) phân rã thành hai nhóm như sau QYXQYXQYXQYXQYXQYX(|)(|)(|)(|)(|)(|)mmffmmfmfmff . Số hạng QYXQYX(|)(|)mmfm trong ngoặc vuông thứ nhất ở vế phải cho biết phần chênh lệch tiền lương gây ra bởi sự chênh lệch trong hệ số hồi quy phân vị, trong khi số hạng thứ hai QYXQYX(|)(|)fmff cho biết phần chênh lệch tiền lương ở phân vị đang xét gây ra bởi chênh lệch về đặc điểm giữa hai nhóm lao động. 1.4. Sự phù hợp của hồi quy phân vị với các nghiên cứu về chênh lệch tiền lương Theo Hao & Naiman (2007), hồi quy phân vị đặc biệt phù hợp với việc nghiên cứu chênh lệch tiền lương9, vì những lý do như sau: Một là, trong nội dung nghiên cứu về chênh lệch tiền lương, ngoài yêu cầu phân tích chênh lệch tiền lương trung bình, các nhà nghiên cứu còn cần chú ý phân tích chênh lệch tiền lương trung bình ở nhóm tiền lương thấp, nhóm tiền lương cao và các nhóm khác từ thấp đến cao. Do đó, có thể vận dụng hồi quy phân vị ứng với các phân vị khác nhau để cho thấy mức độ chênh lệch theo từng nhóm tiền lương. Hai là, hàm phân phối của biến tiền lương thường là hàm phân phối bất cân xứng, có dạng phân phối nặng đuôi (heavy – tailed), là điển hình của mẫu số liệu bị hiện tượng phương sai thay đổi. Phương pháp hồi quy phân vị thích hợp với các mẫu số liệu có hiện diện hiện tượng phương sai thay đổi vì phương pháp này không những cho thấy tác động theo vị trí mà còn phân tích tác động theo quy mô của hàm phân phối. Ba là, phương pháp hồi quy phân vị có thể thực hiện tại một mức phân vị bất kỳ  (0,1) Vì vậy, nếu có một nghiên cứu kinh tế hay một lý thuyết kinh tế nào đó công bố thông tin về bất bình đẳng tại một phân vị cụ thể nào đó, thì nhà nghiên cứu 9 Xem trang 4 của Hao & Naiman (2007) 37
có thể thực hiện hồi quy tại phân vị tương ứng để phân tích. Ví dụ, trong nghiên cứu về tình trạng đói nghèo tại Việt Nam cho thấy tỷ lệ hộ nghèo ở Việt Nam năm 2010 là 9,45% (theo Tổng cục Thống kê), khi thực hiện hồi quy phân vị có thể tiến hành hồi quy theo phân vị tương ứng với tỷ lệ này để có những kết luận phù hợp. Đây là điều không thể thực hiện được nếu dùng OLS. Bốn là, phương pháp hồi quy phân vị về tiền lương có thể được thực hiện đối với nhiều phân vị (cách nhau 5% hoặc 1%). Do đó, có thể thấy được tác động của các yếu tố đến tiền lương ở từng phân vị khác nhau sẽ khác nhau như thế nào. Ứng với mỗi nhóm phân vị khác nhau có thể có những yếu tố tác động khác nhau. Từ đó, nhà nghiêu cứu có thể đề xuất các chính sách, các giải pháp cho phù hợp. Năm là, các nghiên cứu về chênh lệch tiền lương, chênh lệch thu nhập, chênh lệch mức sống cũng như các nghiên cứu về tình trạng bất bình đẳng trong xã hội thường ít dựa trên các mô hình mà dựa trên các chỉ tiêu đo lường sự bất bình đẳng như đường cong Lorenz, hệ số Gini, chỉ số Theil Với các ưu điểm nêu trên, hồi quy phân vị được bổ sung vào kho công cụ để nghiên cứu sự bất bình đẳng như là một công cụ nghiên cứu thuận tiện và hiệu quả. 38
CHƯƠNG 2 TỔNG QUAN CÁC NGHIÊN CỨU VỀ CHÊNH LỆCH TIỀN LƯƠNG 2.1. TỔNG QUAN CÁC NGHIÊN CỨU VỀ CHÊNH LỆCH TIỀN LƯƠNG TRÊN THẾ GIỚI 2.1.1. Những nghiên cứu về chênh lệch tiền lương trước khi hồi quy phân vị được áp dụng vào phân tích tiền lương Các nghiên cứu về sự chênh lệch tiền lương trên thế giới được bắt đầu từ những năm hai mươi của thế kỷ trước, thông qua công trình nghiên cứu của Edgewort (1922). Tuy nhiên, chủ đề này thực sự được quan tâm từ sau những nghiên cứu được công bố vào những năm 1950, đặc biệt là sau nghiên cứu của Becker (1957). Vào thời điểm này, những nghiên cứu đầu tiên về sự chênh lệch tiền lương giữa các ngành công nghiệp được công bố bởi rất nhiều nhà kinh tế học hàn lâm. Một trong những bài nghiên cứu đầu tiên của Dunlop (1957) đã xác định sự tồn tại của chênh lệch tiền lương giữa các ngành. Ông cũng đã minh chứng bằng sự chênh lệch rất lớn trong tiền lương trung bình (theo giờ) của những người công nhân lái xe tải với mức chênh lệch cao nhất là 2,25USD và thấp nhất là 1,25USD tùy theo từng ngành công nghiệp. Những nghiên cứu sơ khởi này không những chỉ ra sự tồn tại của vấn đề chênh lệch tiền lương mà còn cung cấp một mô hình nghiên cứu chênh lệch tiền lương ở những dạng sơ khai. Slichter (1950) tìm thấy mối tương quan cao giữa nghề nghiệp và sự chênh lệch tiền lương, đã tồn tại ổn định nhiều năm trong nền kinh tế Hoa Kỳ. Sự ổn định trong cấu trúc tiền lương của Hoa Kỳ cũng tiếp tục được nghiên cứu bởi Cullen (1956). Những nghiên cứu giai đoạn đầu này chú trọng xem xét hàm cầu trên thị trường lao động và tập trung vào việc phân tích ảnh hưởng của những đặc thù ngành công nghiệp đến cấu trúc tiền lương. Các nghiên cứu về chênh lệch 39
tiền lương trong suốt những năm 60 và đầu những năm 70 cũng được thực hiện theo cùng hướng như vậy. Nghiên cứu của Thomas và các cộng sự (1967) tập trung vào ước lượng tác động của các đặc thù ngành (như lợi nhuận, mức độ chiếm lĩnh thị trường, tỷ lệ tham gia công đoàn, quy mô công ty ) đến sự chênh lệch trong mức tiền lương trung bình. Trong suốt những năm 70, sự phát triển của các mô hình về vốn con người làm cho các nghiên cứu trở nên hướng về khía cạnh hàm cung. Vô số các nghiên cứu phân tích tầm quan trọng của kỹ năng nghề nghiệp cá nhân, kinh nghiệm và các biến số về vốn con người trong việc xác định tiền lương. Sự phát triển của các mô hình về vốn con người và sự phát triển của các công cụ phân tích số liệu làm sản sinh ra một loạt các nghiên cứu mới về sự khác biệt tiền lương trong suốt những năm 70 và 80. Những nghiên cứu này sử dụng tiền lương làm biến phụ thuộc, kiểm định mức ý nghĩa của hệ số góc của các biến độc lập trong phương trình tiền lương bao gồm cả sự khác nhau về những đặc điểm cá nhân của người lao động. Ví dụ, Dalton & Ford (1977) và Long & Link (1983) phát hiện ra rằng sức mạnh thị trường (được đo lường bằng biến mức độ chiếm lĩnh thị trường) là tương quan dương với mức tiền lương trung bình tại doanh nghiệp. Freeman và Medoff (1981) đã tìm ra rằng quy mô trung bình của công ty làm tăng tiền lương trung bình của cả hai nhóm công nhân có tham gia và không tham gia công đoàn. Dunn (1986) cũng khẳng định sự tương quan dương giữa quy mô công ty và tiền lương trung bình. Tuy nhiên, các nghiên cứu tập trung vào mối quan hệ giữa sự khác biệt tiền lương và các đặc trưng ngành đã không đưa ra được các mô hình nghiên cứu để giải thích kết quả một cách thuyết phục và rõ ràng. Mặc dù vậy, ở một mức độ nào đó, các nhà nghiên cứu cũng đã nêu được mối quan hệ giữa tiền lương và những đặc trưng của ngành. Nói tóm lại, những nghiên cứu này chứng tỏ rằng, trong nền kinh tế Hoa Kỳ, công nhân làm việc trong những hãng lớn có xu hướng nhận được mức tiền lương cao hơn. Đồng thời, năng lực tài chính của doanh nghiệp cũng tác động làm tăng đến sự chênh lệch tiền lương. Ngoài ra, tỷ lệ gia nhập công đoàn cũng cho thấy một tác động nhất định đến tiền lương trung bình. Trong một vài nghiên cứu khác, Dickens & Katz (1987) lại cho thấy tỷ lệ 40
vốn trên lao động cũng tác động cùng chiều với tiền lương. Tuy nhiên, do hầu hết các nghiên cứu này còn phụ thuộc nhiều vào phương trình tiền lương được chính người nghiên cứu đưa ra nên còn mang tính chủ quan, hạn chế khả năng tổng quát hóa các kết quả nghiên cứu đã đạt được. Những chủ đề nghiên cứu xuất hiện sau đó về sự chênh lệch tiền lương được chú trọng hơn với các nghiên cứu của Krueger & Summers (1988) và Groshen (1991). Những nghiên cứu thực nghiệm được thực hiện trong giai đoạn sau này mang tính khác biệt so với các nghiên cứu trước đó, cả về phương pháp luận lẫn cơ sở lý thuyết. Về mặt phương pháp luận, nhiều kiểm định mới được đề xuất để kiểm tra sự tồn tại của vấn đề chênh lệch tiền lương nội bộ ngành và liên ngành. Các mô hình và kiểm định này đã sử dụng các công cụ kinh tế lượng hiệu quả để kiểm soát sự tác động của các yếu tố tham gia vào phương trình tiền lương. Mặc khác, các vấn đề thuộc về cơ sở lý luận (như hàm tiền lương, mô hình tiền lương được xác định) tạo điều kiện cho các nghiên cứu khác biệt tiền lương đạt kết quả tốt hơn. Ferber & Green (1982); Lindley, Fish và Jackson (1992) sử dụng số liệu chéo của một trường đại học như các nghiên cứu chênh lệch tiền lương của nhóm các học giả. Blackaby, Booth và Frank (2005) sử dụng số liệu được các nhà kinh tế học thu thập từ Hội Kinh tế học Hoàng gia cũng để nghiên cứu mảng đề tài này. Kết quả chung của các nghiên cứu kinh tế này là đều xác nhận rằng sự chênh lệch tiền lương là rất thấp ở nhóm học giả. Chênh lệch tiền lương nam và nữ ở nhóm các học giả này thấp hơn rất nhiều so với chênh lệch tiền lương chung của toàn xã hội. Sự khác nhau về các đặc điểm nhân khẩu học cũng như năng lực cá nhân chỉ có thể giải thích một phần sự chênh lệch tiền lương theo giới tính giữa nam và nữ. Phần còn lại là phần chênh lệch chưa được giải thích. Phần chênh lệch này có thể xem như là hiện thân của tình trạng phân biệt đối xử giữa nam và nữ. Một số nghiên cứu khác sau này ở Hoa Kỳ thường sử dụng số liệu dạng bảng như Ginther và Hayes (2003), McDowell, Singell & Ziliak (1999), sử dụng số liệu khảo sát từ các thành viên của Hiệp hội Kinh tế học Hoa Kỳ(American Economic Association) để nghiên cứu chênh lệch tiền lương. Các kết quả nghiên cứu này cũng 41
phù hợp với những nghiên cứu trước đó, cho thấy sự chênh lệch về tiền lương hầu hết được giải thích bởi sự khác nhau về cấp bậc, chức vụ; và nữ giới nhận được sự đãi ngộ cũng như cơ hội thăng tiến ít hơn nam giới. Groshen (1991) sử dụng số liệu của 6 ngành sản xuất công nghiệp lớn thu thập được từ cuộc khảo sát tiền lương trong ngành công nghiệp của BLS (Bureau of Labor Statistics) để nghiên cứu sự khác biệt tiền lương. Groshen cũng nghiên cứu, phân tích sự chênh lệch tiền lương thành các thành phần khác nhau. Kết quả nghiên cứu của Groshen cho thấy sự chênh lệch tiền lương rất khác nhau giữa các ngành nghề công nghiệp khác nhau. Cụ thể, chênh lệch tiền lương thấp nhất là 12% ở ngành công nghiệp dệt, mức chênh lệch cao nhất là 58% ở ngành công nghiệp hóa chất. Phương pháp nghiên cứu của Groshen được lặp lại trong các nghiên cứu của các tác giả sau đó, trong đó có nghiên cứu của Bronars và Famulari (1997). Bronars và Famulari sử dụng số liệu của 241 bảng trả lời khảo sát từ các công nhân cổ trắng (white –collar worker). Kết quả nghiên cứu của hai ông cho thấy 18% sự biến động của tiền lương cá nhân được gây ra bởi các khác biệt trong chính sách tiền lương. Mở rộng nghiên cứu và so sánh với thực trạng khác biệt tiền lương ở Mỹ và Đan Mạch, Bronars & Bingley (1999) trong nghiên cứu của mình cho thấy rằng 20% sự chênh lệch tiền lương ở Đan Mạch trong giới công nhân cổ trắng và 36% chênh lệch tiền lương ở giới công nhân cổ xanh xuất phát từ sự khác biệt trong chính sách tiền lương. Sử dụng số liệu của 50000 các nhân viên làm quản lý ở 39 công ty, O’Shaughnessy, Levine và Capelli (2001) khám phá rằng khoảng 8 đến 9% sự biến động tiền lương cá nhân là do chênh lệch tiền lương cơ bản của các công ty. Kết quả nghiên cứu tương tự ở Brazin và Chile của Mizala & Romaguera (1998) cũng kết luận một khoảng tương ứng từ 6% đến 18% sự biến động tiền lương gây ra bởi sự chênh lệch tiền lương trung bình của các hãng. Bender và Elliot (1999) sử dụng số liệu của BHPS (British Household Panel Survey) để nghiên cứu mức chênh lệch trong tiền lương giữa khu vực kinh tế công và tư nhân. Sử dụng phương pháp kinh tế lượng trong phân tích sự chênh lệch, các tác 42
giả đã phân rã chênh lệch tiền lương của hai khu vực kinh tế này theo những đặc điểm ngành nghề của từng khu vực. Burgess và Metcalfe (1999) sử dụng bộ số liệu WIR90 (Workplace Industrial Relations Survey 1990) để khám phá hệ thống kích thích kinh tế giữa hai khu vực kinh tế công và tư. Xem xét yếu tố ngành nghề, nhóm tác giả phát hiện rằng hệ thống kích thích kinh tế tốt hơn nhiều ở khu vực kinh tế công đối vối nhóm nghề nghiệp đòi hỏi kỹ năng cao. Yu và các cộng sự (2005) sử dụng số liệu của BHPS (British Household Panel Survey) suốt những năm 1990 để nghiên cứu sự khác biệt tiền lương ở khu vực kinh tế công và tư. Họ nghiên cứu sự khác biệt tiền lương gây ra bởi các yếu tố số năm đi học, kinh nghiệm làm việc và một biến giả để chỉ khu vực kinh tế đang xét là công hay tư. Kết quả nghiên cứu của họ cho thấy ở khu vực tư nhân, nhân viên được trả lương cao hơn hẳn so với khu vực công. Tiếp theo đó, Meurs & Edon (2007) cũng so sánh tiền lương của hai khu vực kinh tế này ở các nước Anh, Pháp và Ý dựa trên số liệu điều tra LFS (Labour Force Survey) năm 1998 và kết luận rằng khoảng cách tiền lương là cao nhất ở nhóm đối tượng thu nhập thấp trong khu vực kinh tế công và sự chênh lệch tiền lương do nhóm đặc điểm chưa quan sát đươc cũng cao nhất trong nhóm này. Những nghiên cứu về chênh lệch tiền lương ở Mỹ và Canada cũng cho thấy chênh lệch tiền lương giữa nam và nữ có xu hướng giảm trong thời gian từ thập niên 80 đến đầu thập niên 90, không đổi vào giữa và cuối thập niên 90 (Fortin & Huberman, 2002; Blau & Kahn, 2000). Khoảng cách chênh lệch tiền lương này thấp hơn ở nhóm những công nhân trẻ và cao hơn ở nhóm những công nhân lớn tuổi. Nếu xét theo từng lứa tuổi tăng dần thì khoảng cách tiền lương giữa nam và nữ công nhân cũng tăng theo Một phần của khoảng chênh lệch tiền lương là do sự khác nhau về học vấn, số giờ làm việc và số năm kinh nghiệm. Các yếu tố liên quan khác như là công đoàn, môi trường pháp lý, ngành nghề cũng góp phần vào sự chênh lệch tiền lương này nhưng mức độ ảnh hưởng thấp hơn nhiều. Baker & Fortin (1999), với số liệu của 43
Canada, cho thấy rằng nghề nghiệp của nữ giới ít tác động đến tiền lương của họ. Ở châu Âu, Bettio (2002) tìm ra mối tương quan dương nhẹ giữa mức độ phân biệt nghề nghiệp và thu nhập của nữ giới. Mối quan hệ mơ hồ giữa sự phân hóa nghề nghiệp và tiền lương cũng đã dẫn đến nhiều nghiên cứu khác nhằm làm rõ vấn đề này. Bài nghiên cứu của Baker & Fortin (1999) và Gunderson (2006) chứng tỏ rằng lương của nữ giới so với nam giới ít chênh lệch hơn ở khu vực kinh tế công. Drolet (2002), sau khi kiểm tra sự chênh lệch tiền lương giữa nam và nữ trên bộ số liệu thống kê về tiền lương của Canada, đã kết luận rằng đặc điểm công việc và nơi làm việc tác động đến mức chênh lệch tiền lương nhiều hơn là những đặc điểm cá nhân của người công nhân. 2.1.2. Những nghiên cứu về chênh lệch tiền lương áp dụng hồi quy phân vị được áp dụng vào hồi quy hàm tiền lương Sau khi Koenker và Bassett (1978) giới thiệu phương pháp hồi quy phân vị, Buchinsky (1994) đã khởi xướng việc ứng dụng phương pháp hồi quy phân vị trong việc ước lượng hàm hồi quy biến tiền lương theo trình độ học vấn. Buchinsky dùng hồi quy phân vị với số liệu tiền lương của Mỹ trong giai đoạn 1963 – 1987 để xây dựng và so sánh hàm tiền lương theo thời gian. Từ đó, Buchinsky (1994) kết luận về sự thay đổi cấu trúc tiền lương ở Mỹ theo thời gian. Kết quả nghiên cứu của Buchinsky cho thấy rằng hệ số hồi quy của biến độc lập số năm đi học (schooling) và số năm kinh nghiệm (experience) khác nhau ở những phân vị khác nhau nhưng cấu trúc biến đổi trên các phân vị của hệ số hồi quy hai biến này trong làm hồi quy tiền lương có nét tương đồng. 44
Hình 1. 4: Trích nghiên cứu của Buchinsky (1994) Hình 1. 4 biểu diễn trên đồ thị một trong số các kết quả hồi quy mà Buchinsky đạt được trong bài nghiên cứu của mình. Đồ thị biểu diễn sự khác biệt về hệ số hồi quy của tiền lương theo học vấn qua các năm từ 1963 đến 1987 ở từng phân vị (10%; 25%; 50%; 75% và 90%). Hệ số hồi quy này còn khác nhau ở những nhóm lao động có kỹ năng khác nhau. Trong một nghiên cứu khác, Buchinsky (1998a) cũng áp dụng hồi quy phân vị trong việc xây dựng hàm tiền lương cho lao động nữ ở Mỹ vào các năm 1968 – 1973 – 1979 – 1986 và 1990. Hàm tiền lương được xây dựng theo dạng hàm Mincer (1974) mở rộng và ước lượng trên từng phân vị (10%; 25%; 50%; 75% và 90%) theo từng nhóm tuổi (20 – 24; 25 – 29; 30 – 34; 35 – 39; 40 – 44; 45 – 49; 50 – 54; 55 – 59; và 60 – 64) trong từng năm. Kết quả cho thấy biến động hệ số hồi quy ít hơn ở những phân vị lớn và nhóm lao động có kỹ năng – thể hiện qua trình độ học vấn cao. Kết quả chung cho thấy sự chênh lệch tiền lương theo trình độ lao động là giảm dần theo thời gian, đặc biệt là ở nhóm lao động tốt nghiệp trung học phổ thông. Đối với 45
nhóm lao động có kỹ năng cao hơn thì sự giảm này xảy ra ở cả hai phân vị đuôi (lower tail and upper tail) của hàm phân phối biến tiền lương. Và một nhận xét khác được tác giả rút ra từ kết quả hồi quy đó là khi bằng cấp càng cao thì lao động nữ càng có mức lương cao ở tất cả các phân vị được xét. Nghiên cứu của Ajwad và các cộng sự (2002) cũng áp dụng hồi quy phân vị để nghiên cứu sự khác biệt tiền lương ở Sri Lanka. Các tác giả sử dụng số liệu khảo sát của Sri Lanka năm 1999 – 2000 để hồi quy với bốn mục tiêu nghiên cứu như sau: thứ nhất, liệu có sự khác biệt tiền lương giữa các nhóm lao động theo dân tộc và theo giới tính hay không? Thứ hai, xác định các yếu tố tác động đến tiền lương chênh lệch tiền lương ở Sri Lanka; thứ ba, phân tích sự tác động của các yếu tố này đến tiền lương trên toàn bộ hàm phân phối của biến tiền lương bằng cách xét kết quả trên từng phân vị; thứ tư, sự chênh lệch tiền lương theo giới tính và dân tộc được phân rã thành chênh lệch tiền lương do chênh lệch về đặc điểm lao động thể hiện qua các biến độc lập của hàm hồi quy biến tiền lương và chênh lệch gây ra do sự khác nhau về hệ số hồi quy. Các tác giả dùng số liệu thống kê mô tả về giá trị trung bình và giá trị phân vị của biến tiền lương để thực hiện mục tiêu nghiên cứu thứ nhất, dùng hồi quy OLS cùng với hồi quy phân vị cho mục tiêu nghiên cứu thứ hai và thứ ba. Bên cạnh đó, các tác giả dùng phương pháp phân rã Oaxaca – Blinder (1973) để trả lời cho mục tiêu thứ tư. Kết quả nghiên cứu của các tác giả cho thấy rằng yếu tố dân tộc không thực sự tác động đến tiền lương ở Sri Lanka trong kết quả hồi quy OLS và kể cả hồi quy trên tất cả các phân vị được xét (10% - 25% - 50% - 75% và 90%). Tuy nhiên, tác giả cũng khẳng định có sự chênh lệch về tiền lương theo giới tính ở Sri Lanka. Nam giới nhận mức lương cao hơn nữ giới. Sự chênh lệch tiền lương theo giới tính này khác nhau khi xét ở những nhóm dân tộc khác nhau. Chênh lệch tiền lương khoảng 10% ở nhóm Tamils nhưng gia tăng đến 48% ở những nhóm dân tộc khác. Sự chênh lệch tiền lương theo giới tính không được giải thích bởi các yếu tố đóng vai trò là các biến độc lập trong hàm hồi quy tiền lương. Mức chênh lệch tiền lương theo giới tính là rõ rệt hơn ở những phân vị cao và ít rõ rệt hơn ở những phân vị thấp. 46
Một nghiên cứu nổi tiếng khác cũng đề cập đến vấn đề chênh lệch tiền lương theo giới tính là bài báo về hiệu ứng trần nhà kính (class ceiling) trong hàm tiền lương ở Thụy Điển của Albrecht và các cộng sự (2003). Hiệu ứng trần nhà kính là cụm từ trong kinh tế học dùng để chỉ trường hợp dường như có một rào cản vô hình trong chế độ trả lương làm cho mức lương của những lao động nữ giới (hoặc nhóm lao động thuộc dân tộc) thiểu số không thể đạt đến những bậc lương cao như nam giới (hoặc các dân tộc đa số). Các tác giả dùng hồi quy phân vị và phương pháp phân rã chênh lệch theo Oaxaca – Blinder kết hợp với phương pháp hồi quy phân hạng (rank regression) của Fortin et al (1996) để trả lời cho các câu hỏi nghiên cứu của mình. Sử dụng số liệu thống kê ở Thụy Điển năm 1968, 1981 và 1988; với phương pháp hồi quy phân vị; các tác giả đưa ra câu trả lời cho câu hỏi ở tiêu đề bài viết là có hiệu ứng trần nhà kính trong trả lương ở Thụy Điển. Bằng chứng cho câu trả lời này là chênh lệch tiền lương theo giới tính càng lớn khi xét những phân vị càng cao, đặc biệt là sự chênh lệch về tiền lương theo giới tính rất lớn ở những phân vị cao. Hiệu ứng trần nhà kính này không giảm theo thời gian, thể hiện ở Hình 1. 5 Hình 1. 5: Trích nghiên cứu của Fortin (1996) 47
Khi tiến hành phân tích nguyên nhân dẫn đến chênh lệch tiền lương theo giới tính, các tác giả kết luận rằng các biến độc lập trong mô hình có tham gia giải thích sự chênh lệch tiền lương theo giới tính ở Thụy Điển, nhưng tỷ lệ giải thích ở những phân vị khác nhau là khác nhau và không cao. Năm 2005, Machado & Mata sử dụng số liệu về tiền lương của lao động ở Bồ Đào Nha trong những năm 1986 và 1995 để thực hiện hồi quy phân vị hàm tiền lương của Mincer (1974) theo cách mà Buchinsky (1994) đã áp dụng. Tuy nhiên hai ông đã có một đóng góp lớn trong nghiên cứu của mình khi đề xuất một phương pháp phân rã mức độ chênh lệch tiền lương theo từng phân vị dựa theo phương pháp Oaxaca - Blinder (1973). Phương pháp phân rã, do Machado & Mata (2005) đề xuất, được sử dụng rất phổ biến trong các nghiên cứu chênh lệch tiền lương có sử dụng hồi quy phân vị sau này. Biến phụ thuộc trong nghiên cứu của Machado & Mata là logarit của tiền lương tính theo giờ. Các biến độc lập được xét trong hàm hồi quy bao gồm: giới tính, học vấn, tuổi, thời gian làm công việc hiện tại. Kết quả nghiên cứu cho thấy tiền lương trung bình của nữ giới thấp hơn tiền lương trung bình của nam giới và khoảng chênh lệch tiền lương này càng tăng khi xét ở phân vị càng cao. Hàm phân phối tiền lương của nữ giới ít phân tán hơn so với hàm phân phối tiền lương của nam giới. 48
Hình 1. 6: Trích nghiên cứu của Machado & Mata (2005) Khi phân tích chênh lệch tiền lương giữa hai nhóm lao động nam và nữ, tác động của biến giới tính làm dịch chuyển hàm tiền lương sang trái, nghĩa là nhiều quan sát là lao động nữ hơn trong mẫu và lao động nữ nhận tiền lương tương đối thấp hơn. Tác động của biến tuổi và biến số năm làm việc thì có xu hướng ngược lại với tác động của biến giới tính nhưng không rõ rệt. Cả đặc điểm lao động thể hiện qua các biến độc lập đưa vào mô hình và sự khác biệt trong hệ số hồi quy đều tham gia giải thích chênh lệch tiền lương theo giới tính. Các tác giả cũng kết luận trình độ học vấn đóng vai trò trung tâm trong sự gia tăng của chênh lệch tiền lương. Hệ số hồi quy của biến trình độ học vấn tăng rất nhiều ở hàm hồi quy ứng phân vị cao trong khi gần như không đổi với ở hàm hồi quy phân vị thấp. Ở bất kỳ thời điểm nào trong giai đoạn này, sự phân hóa tiền lương ở những nhóm lao động có trình độ học vấn cao luôn nhiều hơn ở nhóm lao động có trình độ học vấn thấp. Melly (2006) dùng số liệu GSOEP (German Socio - Economic Panel) trong những năm 1984 - 2001 để nghiên cứu chênh lệch tiền lương giữa hai khu vực kinh tế công và tư nhân, có phân tích theo từng nhóm lao động nam và nữ. Đối tượng nghiên cứu được đề cập đến trong mẫu là các lao động từ 18 đến 65 tuổi, đang làm việc toàn thời gian và bán thời gian. Phương pháp hồi quy được thực hiện là phương 49
pháp bình phương nhỏ nhất và phương pháp hồi quy phân vị. Biến phụ thuộc là logarit của tiền lương theo giờ. Tiền lương theo giờ tính được bằng cách chia tiền lương gộp theo tháng cho số giờ làm việc thực tế trong tháng. Các biến độc lập gồm: (1) Số năm kinh nghiệm, được đo bằng giá trị nhỏ nhất của giữa (tuổi - số năm đi học – 6) và (tuổi - 18); (2) giới tính (=1 nếu là nữ, = 0 nếu là nam); (3) các biến giả về trình độ học vấn gồm 5 phạm trù: không bằng cấp, trung học cơ sở, trung học phổ thông, trung học phổ thông có bằng nghề và đại học; (4) các biến giả về nghề nghiệp gồm 8 phạm trù: quản trị, chuyên viên, kỹ thuật viên, thư ký văn phòng, nhân viên dịch, nông nghiệp, thợ thủ công, công nhân vận hành máy móc; (5), biến giả về khu vực làm việc gồm công lập hoặc tư nhân. Kết quả nghiên cứu cho thấy mức chênh lệch tiền lương theo giới tính ở khu vực kinh tế công lập thấp hơn ở khu vực kinh tế tư nhân và điều này xảy ra trên tất cả các phân vị. Đối với lao động nam, phần chênh lệch tiền lương giữa khu vực kinh tế công lập và khu vực kinh tế tư nhân, gây ra do chênh lệch hệ số hồi quy, càng giảm khi xét ở phân vị càng cao. Đối với lao động nữ, xu hướng cũng tương tự. Ngược lại, phần chênh lệch tiền lương được giải thích bởi chênh lệch về đặc điểm lao động giữa khu vực kinh tế công lập và khu vực kinh tế tư nhân dường như không đổi nhiều khi xét trên nhiều phân vị khác nhau. Nếu xét theo trình độ học vấn thì ở tất cả các nhóm học vấn, ở phân vị càng lớn, phần chênh lệch tiền lương giữa khu vực kinh tế công lập và khu vực kinh tế tư nhân ở cả hai nhóm lao động nam và nữ càng giảm, nhưng chưa được giải thích. Ngoài ra, kết quả nghiên cứu còn cho thấy số năm đi học càng tăng thì thu nhập trung bình cũng càng tăng; đồng thời, trình độ học vấn càng cao thì phần chênh lệch thu nhập giữa hai khu vực công và tư càng giảm. Cũng trong năm 2006, Gunawardena (2006) đã sử dụng số liệu của cuộc điều tra lực lượng lao động (QLFS - Quarterly Labour Force Surveys) ở SriLanka trong giai đoạn 1996 – 2004. Năm 1996, mẫu số liệu thu thập được gồm 9834 quan sát trong độ tuổi từ 18 đến 58, có việc làm và được trả lương. Năm 2004, số quan sát chọn lọc được là 10594. Tác giả đã sử dụng hồi quy phân vị để xác định hàm cấu trúc tiền lương theo từng nhóm giới tính giữa nam và nữ. Việc phân rã chênh lệch 50
tiền lương được thực hiện bằng phương pháp Machado - Mata (2005), có so sánh kết quả với phương pháp Oaxaca- Blinder (1973). Kết quả nghiên cứu cho thấy, có sự chênh lệch tiền lương giữa nam và nữ ở Srilanka. Nhưng mức chênh lệch ở khu vực kinh tế công lập thấp hơn mức chênh lệch ở khu vực kinh tế tư nhân. Nghiên cứu này cũng cho thấy có một sự phân biệt rõ rệt trong chính sách trả lương giữa nam và nữ, bởi vì nếu không có sự phân biệt này (tức là giả sử nam và nữ có cùng chế độ đãi ngộ) thì lao động nữ sẽ nhận mức tiền lương cao hơn lao động nam. Khi xét riêng khu vực kinh tế tư nhân, trên 95% chênh lệch tiền lương giữa nam và nữ là do chênh lệch về hệ số hồi quy. Arulampalam và các cộng sự (2007) cũng xét hiệu ứng trần nhà kính cùng với hiệu ứng sàn dính (sticky floor) trong hàm tiền lương của các quốc gia châu Âu. Hiệu ứng sàn dính trong tiền lương xảy ra khi có chênh lệch tiền lương ở những phân vị thấp khi hồi quy hàm tiền lương. Sử dụng số liệu về tiền lương ở châu Âu trong những năm từ 2002 đến 2009, các tác giả cho thấy hồi quy tiền lương bằng OLS không thể hiện được sự khác biệt tiền lương rất khác nhau ở những phân vị khác nhau. Sau khi hồi quy bằng hồi quy phân vị, các tác giả tìm thấy bằng chứng thống kê cho thấy rằng chênh lệch tiền lương thường lớn hơn ở những phân vị cao, chứng tỏ có sự tồn tại của hiệu ứng trần nhà kính. Tác giả kết luận rằng hiệu ứng trần nhà kính có hiện diện ở hầu hết các quốc gia châu Âu. Chênh lệch tiền lương theo giới tính nhìn chung rất khác nhau ở khu vực kinh tế tư và công ở các quốc gia này. Cụ thể, hiệu ứng sàn dính chỉ tồn tại trong khu vực kinh tế tư nhân như Pháp, Ý và chỉ tồn tại trong khu vực kinh tế công ở các nước như Áo, Bỉ, Đức và Ailen. Ở các nước này, phụ nữ được trả lương thấp hơn nam giới một cách đáng kể ở những phân vị thấp của hàm hồi quy. Nestic (2010) đã sử dụng số liệu của cuộc điều tra lực lượng lao động (LFS - Labor Force Survey) ở Croatia năm 1998 và 2008 do Văn phòng thống kê (CBS - Central Bureau of Statistics) thực hiện. Đối tượng nghiên cứu là lao động từ 15 tuổi trở lên, được trả lương, với 10066 quan sát ở năm 1998 và 6072 quan sát ở năm 2008. Tác giả phân tích chênh lệch tiền lương theo giới tính ở Croatia dựa trên hàm 51
tiền lương do Mincer (1974) đề xuất. Đầu tiên, phương pháp hồi quy phân vị được áp dụng để xác định mức chênh lệch tiền lương theo từng phân vị. Sau đó, các tác giả đã dùng phương pháp phân rã Machado – Mata (2005) để phân rã chênh lệch tiền lương theo giới tính. Biến phụ thuộc là logarit của tiền lương trung bình theo giờ, tính bằng tiền lương tháng chia cho số giờ làm việc thực tế trong tháng. Các biến độc lập bao gồm: tuổi, thời gian đảm đương công việc hiện tại, số năm kinh nghiệm, số năm đi học, trình độ học vấn (Không bằng cấp, tiểu học, trung học cơ sở, trung học phổ thông), khu vực kinh tế (khu vực công hoặc tư nhân), các biến giả về nghề nghiệp, biến giả về khu vực sinh sống là thành thị - nông thôn. Kết quả phân tích cho thấy, giữa năm 1998 và 2008, sự phân tán của hàm tiền lương của nam giới giảm trong khi sự phân tán của hàm tiền lương nữ giới lại tăng. Chênh lệch tiền lương trung bình giữa nam và nữ là 13,9% vào năm 1998 và giảm xuống còn 10,5% vào năm 2008. Xu hướng giảm chênh lệch tiền lương này xảy ra ở cả hai khu vực công và tư, nhưng sự giảm ở khu vực công rõ nét hơn. Khi xét trình độ học vấn, nhóm trình độ học vấn càng cao thì chênh lệch thu nhập theo giới tính càng giảm. Theo số liệu năm 2008, khoảng chênh lệch tiền lương theo giới tính ở những phân vị của nửa đầu (0,10 - 0,25 - 0,50) thì cao hơn những phân vị ở nửa cuối (0,75 - 0,90) của hàm phân phối tiền lương. Nghiên cứu của Asplund và các cộng sự (2011) cũng sử dụng hồi quy phân vị và phương pháp phân rã Machado – Mata (2005) để phân tích chênh lệch tiền lương ở Phần Lan trong giai đoạn 2002 – 2009. Asplund so sánh chênh lệch tiền lương giữa nhóm lao động mà nghề nghiệp đòi hỏi nhiều sự sáng tạo (innovation workers - như nhân viên R&D, marketing hay các nhà quản trị) và nhóm lao động thuộc các ngành nghề còn lại (non-innovation workers). Sự chênh lệch tiền lương ở hai nhóm này được thực hiện ở khu vực hoạt động sản xuất và khu vực hoạt động dịch vụ. 52