Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tăng cường độ nhạy thời gian của mô hình ngôn ngữ lớn để khuyến nghị với điều chỉnh phản thực tế

Created by
  • Haebom

Tác giả

Lưu Ngọc Thiên, Dương Chính Nghĩa, Ngô Kiến Can, Tương Vương

Phác thảo

Bài báo này thảo luận về các xu hướng nghiên cứu gần đây trong việc áp dụng các mô hình ngôn ngữ quy mô lớn (LLM) vào đề xuất tuần tự. Các phương pháp dựa trên LLM hiện tại không tận dụng đầy đủ thông tin thời gian phong phú vốn có trong các chuỗi tương tác trước đây của người dùng. Điều này là do cơ chế tự chú ý của LLM vốn thiếu thông tin trình tự và dựa vào nhúng vị trí, ít phù hợp với các chuỗi tương tác của người dùng hơn ngôn ngữ tự nhiên. Để giải quyết những hạn chế này, chúng tôi đề xuất Khung thời gian tăng cường phản thực tế cho đề xuất dựa trên LLM (CETRec) , tách biệt và đo lường ảnh hưởng của thông tin thời gian dựa trên các nguyên tắc suy luận nhân quả . CETRec nâng cao hiệu quả sự hiểu biết của LLM về cả thứ tự tuyệt đối (thời gian tương tác với các mục) và thứ tự tương đối (mối quan hệ tuần tự giữa các mục) bằng cách sử dụng các điều chỉnh phản thực tế có nguồn gốc từ phân tích nhân quả. Chúng tôi chứng minh hiệu quả của CETRec thông qua các thử nghiệm mở rộng trên các tập dữ liệu thực tế.

Takeaways, Limitations

Takeaways:
Một cách tiếp cận mới để cải thiện hiệu suất của các hệ thống đề xuất tuần tự dựa trên LLM.
Làm rõ và tận dụng tầm quan trọng của thông tin thời gian bằng cách suy luận nhân quả.
Ghi lại chính xác những thay đổi về sở thích của người dùng bằng cách xem xét cả thông tin theo thứ tự thời gian tuyệt đối và tương đối.
Xác thực hiệu quả thông qua kết quả thử nghiệm sử dụng các tập dữ liệu thực tế
Limitations:
Cần phải xác minh thêm hiệu suất tổng quát của phương pháp đề xuất.
Cần có các nghiên cứu về khả năng áp dụng cho các loại hệ thống đề xuất hoặc tập dữ liệu khác.
Cần phải phân tích thêm về chi phí tính toán và độ phức tạp.
👍