Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

SPARC: Mô hình truy xuất đa sở thích thích ứng xác suất mềm thông qua sổ mã cho hệ thống đề xuất

Created by
  • Haebom

Tác giả

Jialiang Shi, Yaguang Dou, Tian Qi

Phác thảo

Bài báo này đề xuất một khuôn khổ truy xuất mới, SPARC (Mô hình Truy xuất Thích ứng Xác suất Mềm thông qua Sổ mã), để giải quyết ba thách thức chính của mô hình đa sở thích trong các hệ thống đề xuất thực tế (RS): 1. sở thích bất biến được trích xuất từ kiến thức bên ngoài được xác định trước, 2. chiến lược khai thác quá mức tập trung vào việc khớp các sở thích hiện có, và 3. thiếu khả năng khám phá sở thích mới. SPARC sử dụng Bộ mã hóa Tự động Biến thiên Lượng tử Dư (RQ-VAE) để xây dựng một không gian sở thích rời rạc, sau đó được huấn luyện cùng với một mô hình đề xuất quy mô lớn để khai thác các sở thích dựa trên hành vi, phát triển động và phản ánh phản hồi của người dùng. Hơn nữa, một mô-đun sở thích xác suất dự đoán phân phối xác suất trên toàn bộ không gian sở thích rời rạc động cho phép một chiến lược "tìm kiếm mềm" hiệu quả trong quá trình suy luận trực tuyến, chuyển đổi mô hình từ khớp thụ động sang khám phá chủ động và tạo điều kiện thuận lợi cho việc khám phá sở thích. Thử nghiệm A/B trên một nền tảng công nghiệp với hàng chục triệu người dùng hoạt động hàng ngày đã mang lại những kết quả đáng kể, bao gồm thời gian xem của người dùng tăng +0,9%, lượt xem trang (PV) tăng +0,4% và PV500 (nội dung mới đạt 500 PV trong vòng 24 giờ) tăng +22,7%. Các đánh giá ngoại tuyến sử dụng tập dữ liệu Sản phẩm của Amazon cũng liên tục cho thấy sự cải thiện trong các chỉ số như Recall@K và NDCG@K.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày khả năng xây dựng một không gian sở thích động và riêng biệt bằng cách sử dụng RQ-VAE và phản ánh sở thích của người dùng theo thời gian thực thông qua khai thác sở thích dựa trên hành vi.
Khám phá và tìm hiểu sở thích chủ động thông qua chiến lược "tìm kiếm mềm" bằng cách sử dụng mô-đun sở thích xác suất.
Hiệu quả thực tế được xác thực thông qua thử nghiệm A/B trên các nền tảng công nghiệp quy mô lớn. Cải thiện đáng kể các chỉ số chính như thời gian xem của người dùng, lượt xem trang và phạm vi tiếp cận nội dung mới.
Xác minh thêm về sự cải thiện hiệu suất của thuật toán thông qua đánh giá ngoại tuyến.
Limitations:
Thiếu thảo luận về độ phức tạp và chi phí tính toán khi xây dựng không gian quan tâm bằng RQ-VAE.
Cần nghiên cứu thêm để xác định khả năng tổng quát hóa của kết quả cho các nền tảng công nghiệp cụ thể.
Không có mô tả rõ ràng về chi tiết và các bước xử lý trước của tập dữ liệu Sản phẩm Amazon được sử dụng.
Cần phân tích sâu hơn để xác định khả năng thích ứng của mô hình với những thay đổi lâu dài trong hành vi của người dùng.
👍