Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Cải thiện việc tạo tiêu đề cá nhân hóa thông qua việc loại bỏ nhiễu sở thích giả mạo từ phản hồi ngầm định

Created by
  • Haebom

Tác giả

Kejin Liu, Junhong Lian, Xiang Ao, Ningtao Wang, Xing Fu, Yu Cheng, Weiqiang Wang, Xinyu Liu

Phác thảo

Bài báo này nêu bật vấn đề là các phương pháp hiện có để tạo tiêu đề được cá nhân hóa dựa trên dữ liệu nhấp chuột trước đây của người dùng không tính đến tiếng ồn nhấp chuột không liên quan trong luồng nhấp chuột, có khả năng tạo ra các tiêu đề không khớp với sở thích thực tế của người dùng. Để giải quyết vấn đề này, chúng tôi đề xuất một khuôn khổ mới, PHG-DIF (Khung tạo tiêu đề được cá nhân hóa thông qua việc loại bỏ tiếng ồn sở thích giả khỏi phản hồi ngầm). PHG-DIF loại bỏ tiếng ồn luồng nhấp chuột thông qua bộ lọc kép dựa trên thời gian dừng ngắn và các đợt nhấp chuột bất thường, đồng thời mô hình hóa động các sở thích đa dạng và đang phát triển của người dùng thông qua hợp nhất thời gian nhiều cấp để đạt được hồ sơ người dùng chính xác. Hơn nữa, chúng tôi trình bày một tập dữ liệu chuẩn mới, DT-PENS, bao gồm dữ liệu nhấp chuột từ 1.000 người dùng và khoảng 10.000 tiêu đề được cá nhân hóa có chú thích. Kết quả thử nghiệm chứng minh rằng PHG-DIF giảm thiểu đáng kể tác động tiêu cực của tiếng ồn nhấp chuột và đạt được hiệu suất tiên tiến.

Takeaways, Limitations

Takeaways:
Chúng tôi xác định tác động tiêu cực của tiếng ồn từ luồng nhấp chuột đến việc tạo tiêu đề được cá nhân hóa và đề xuất những cách hiệu quả để giảm thiểu tác động này.
Chúng tôi đề xuất PHG-DIF, một khuôn khổ mới có khả năng mô hình hóa hiệu quả các sở thích đa dạng và đang phát triển của người dùng.
Chúng tôi đang phát hành DT-PENS, một bộ dữ liệu chuẩn mới dành cho nghiên cứu tạo tiêu đề cá nhân hóa.
PHG-DIF chứng minh hiệu suất được cải thiện so với các phương pháp hiện có và đạt được hiệu suất tiên tiến.
Limitations:
Bộ dữ liệu DT-PENS có thể tương đối nhỏ (1.000 người dùng và khoảng 10.000 tiêu đề).
Có thể cần nghiên cứu thêm để xác định tính tổng quát và khả năng áp dụng của các tiêu chí loại bỏ tiếng ồn (thời gian dừng ngắn, tiếng ồn bất thường).
Có thể cần phải xác nhận thêm hiệu suất tổng quát cho các loại tiếng ồn nhấp chuột khác nhau.
👍