Tìm kiếm và trình diễn thông tin - Quảng cáo và SPAM

pdf 27 trang vanle 2430
Bạn đang xem 20 trang mẫu của tài liệu "Tìm kiếm và trình diễn thông tin - Quảng cáo và SPAM", để tải tài liệu gốc về máy bạn click vào nút DOWNLOAD ở trên

Tài liệu đính kèm:

  • pdftim_kiem_va_trinh_dien_thong_tin_quang_cao_va_spam.pdf

Nội dung text: Tìm kiếm và trình diễn thông tin - Quảng cáo và SPAM

  1. (IT4853) Tìm kiếm và trình diễn thông tin Quảng cáo và SPAM
  2. Giảng viên  TS. Nguyễn Bá Ngọc  Địa chỉ: Viện CNTT & TT/BM HTTT/B1-603  Email: ngocnb@soict.hust.edu.vn  Website: 2
  3. Tổng quan công cụ tìm kiếm trên Web 3
  4. Nội dung chính  Quảng cáo trong tìm kiếm  Tối ưu hóa nội dung hướng tìm kiếm 4
  5. Mô hình Goto (1996) 5
  6. Mô hình Goto (1996)  Quảng cáo được xếp hạng theo giá  Thu nhập tối đa cho Goto.  Không phân biệt quảng cáo với kết quả tìm kiếm. Chỉ hiển thị một danh sách kết quả duy nhất!  Không xếp hạng theo sự phù hợp, . . . 6
  7. Mô hình Google (2000/2001)  Phân biệt rõ ràng kết quả tìm kiếm và quảng cáo 7
  8. Tài liệu phù hợp và quảng cáo SogoTrade xuất hiện trong kết quả tìm kiếm SogoTrade trong mục quảng cáo Công cụ tìm kiếm có xếp hạng địa chỉ được quảng cáo cao hơn địa chỉ không được quảng cáo? Đa phần các công cụ tìm kiếm hàng đầu đều tuyên bố không. 8
  9. Phương pháp xếp hạng quảng cáo  Nhà quảng cáo đặt giá cho từ khóa – đấu giá.  Bất kỳ ai cũng có thể tham gia đặt giá cho bất kỳ từ khóa nào.  Nhà quảng cáo chỉ phải trả tiền khi ai đó mở quảng cáo.  Xếp hạng quảng cáo, và giá phải trả khi người dùng mở quảng cáo? 9
  10. Phương pháp xếp hạng quảng cáo  Nếu xếp hạng theo giá được trả như trong Goto  Truy vấn và quảng cáo có thể không khớp về nội dung  Cải tiến: Xếp hạng dựa trên giá và sự phù hợp  Tham số chính để đánh giá sự phù hợp là tỉ lệ mở liên kết  Các tiêu chí xếp hạng khác: địa điểm, thời gian, chất lượng và tốc độ tải trang web, v.v.  Kết quả: Quảng cáo kém phù hợp sẽ bị xếp hạng thấp hơn  Mong muốn: Người dùng luôn tìm được thông tin hữu ích.  Sự hài lòng của người dùng và doanh thu của hệ thống sẽ là cực đại. 10
  11. Mô hình đấu giá với giá thứ hai của Google  bid: giá tối đa được trả cho một lần mở quảng cáo  CTR: tỉ lệ bấm quảng cáo: (số lần bấm quảng cáo / số lần hiển thị quảng cáo). CTR thể hiện sự phù hợp.  Xếp hạng quảng cáo: bid × CTR: tổng hợp (i) giá được trả (ii) mức độ phù hợp của quảng cáo  rank: xếp hạng  paid: giá thứ hai được trả bởi nhà quảng cáo 11
  12. Mô hình đấu giá với giá theo giá thứ hai của Google Đấu giá với giá thứ hai: Nhà quảng cáo trả chi phí tối thiểu để duy trì vị trí của họ trong đấu giá và thêm 1 xu (0.01$). price1 × CTR1 = bid2 × CTR2 (kết quả là rank1=rank2) price1 = bid2 × CTR2 / CTR1 p1 = bid2 × CTR2/CTR1 = 3.00 × 0.03/0.06 = 1.50 p2 = bid3 × CTR3/CTR2 = 1.00 × 0.08/0.03 = 2.67 p3 = bid4 × CTR4/CTR3 = 4.00 × 0.01/0.08 = 0.50 12
  13. Mô hình đấu giá theo giá thứ hai của Google  Google:  Thu thêm một xu từ mỗi quảng cáo sẽ bổ xung hàng tỉ lợi nhuận cho Google.  Mô hình quảng cáo có thể là lĩnh vực nghiên cứu quan trọng bậc nhất đối với máy tìm kiếm (computational advertising). 13
  14. Những từ khóa được định giá cao Theo $69.1 mesothelioma treatment options $65.9 personal injury lawyer michigan $62.6 student loans consolidation $61.4 car accident attorney los angeles $59.4 online car insurance quotes $59.4 arizona dui lawyer $46.4 asbestos cancer $40.1 home equity line of credit $39.8 life insurance quotes $39.2 refinancing $38.7 equity line of credit $38.0 lasik eye surgery new york city $37.0 2nd mortgage $35.9 free car insurance quote 14
  15. Quảng cáo trong tìm kiếm: ba bền đều có lợi?  Công cụ tìm kiếm thu lợi mỗi khi ai đó mở quảng cáo.  Người dùng chỉ mở quảng cáo nếu họ thực sự quan tâm.  Công cụ tìm kiếm sẽ phạt những quảng cáo không phù hợp.  để người dùng hài lòng với những gì họ tìm thấy sau khi mở quảng cáo.  Nhà quảng cáo tìm thấy những khách hàng mới với chi phí tối thiểu. 15
  16. Có thể đánh lừa hệ thống? 16
  17. Không phải cả ba bên đều có lợi: Đầu cơ từ khóa  Mua một từ khóa trên Google  Sau đó chuyển hướng lưu lượng tới bên thứ ba (đối tác trả giá cao hơn giá bạn phải trả Google)  Ví dụ, chuyển tới một trang chứa rất nhiều quảng cáo  v.v. 17
  18. Không phải cả ba bên đều có lợi: Sự vi phạm thương hiệu  Ví dụ: Geico  Một thời gian trong năm 2005: Từ khóa tìm kiếm “Geico” trên Google bị mua bởi những đối thủ.  Geico đã thất bại trong trường hợp này ở Mỹ.  Louis Vuitton cũng đã gặp tình huống tương tự ở châu Âu.  Tham khảo complaint.html 18
  19. Nội dung chính  Quảng cáo trong tìm kiếm  Tối ưu hóa nội dung hướng tìm kiếm 19
  20. Sec. 19.2.2 Tối ưu nội dung hướng tìm kiếm  SEO - Search Engine Optimization  Tùy chỉnh nội dung trang web để chiếm thứ hạng cao trong tìm kiếm  Mục đích:  Thương mại, chính trị, tôn giáo  Tài trợ bởi quỹ quảng cáo  Thực hiện dưới dạng dịch vụ bởi các công ty, webmasters, search engine optimizers, v.v. 20
  21. Sec. 19.2.2 Kỹ thuật đơn giản nhất  Kích tf/idf  Đối với những mô hình xếp hạng cổ điển, những trang hàng đầu chứa nhiều từ truy vấn.  SEOs sử dụng các từ được lựa chọn với mật độ dày đặc  Thông thường các từ được lặp lại có mầu trùng màu nền: Vẫn được đưa vào chỉ mục, nhưng vô hình với người dùng Mật độ từ là một tín hiệu xếp hạng kém tin cậy 21
  22. Sec. 19.2.2 Các phương pháp kích từ khóa  Sử dụng thẻ Meta  Văn bản ẩn, mầu sắc, css, v.v. Meta-Tags = “ London hotels, hotel, holiday inn, hilton, discount, booking, reservation, sex, mp3, britney spears, viagra, ” 22
  23. Sec. 19.2.2 Tàng hình  Cung cấp nội dung giả cho bộ thu thập  DNS: Hoán đổi IP. SPAM N Bộ thu thập của công cụ tìm kiếm? Y Nội dung thực 23
  24. Sec. 19.2.2 Những kỹ thuật khác  Doorway pages  Trang với nội dung tối ưu cho một từ khóa, điều hướng tới các trang đích  Link pages  Hidden links,  Domain flooding.  Robots  Luồng truy vấn ảo 24
  25. Sec. 19.2.2 Đối phó với spam  Các tín hiệu chất lượng:  Dựa trên đánh giá của các tác giả và người dùng;  Chính sách tiếp nhận URL:  Phát hiện robot  Hạn chế từ khóa meta  Phân tích liên kết  Phát hiện SPAM bằng học máy  v.v. 25
  26. Tài liệu tham khảo  Chính sách của các công cụ tìm kiếm trên Web đối với SEO (chấp nhận/từ chối).    Quảng cáo trong tìm kiếm: Cuộc chiến kỹ thuật giữa SEOs và công cụ tìm kiếm  26