Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

RCR-Router: Định tuyến ngữ cảnh nhận biết vai trò hiệu quả cho các hệ thống LLM đa tác nhân với bộ nhớ có cấu trúc

Created by
  • Haebom

Tác giả

Jun Liu, Zhenglun Kong, Changdi Yang, Fan Yang, Tianqi Li, Peiyan Dong, Joannah Nanjekye, Hao Tang, Geng Yuan, Wei Niu, Wenbin Zhang, Pu Zhao, Xue Lin, Dong Huang, Yanzhi Wang

Phác thảo

Bài báo này đề xuất RCR-Router, một khuôn khổ định tuyến mới cho sự cộng tác hiệu quả trong các hệ thống mô hình ngôn ngữ quy mô lớn (LLM) đa tác tử. Để khắc phục những hạn chế của các chiến lược định tuyến ngữ cảnh tĩnh hoặc toàn cục hiện có (tiêu thụ quá nhiều token, sử dụng bộ nhớ không cần thiết và thiếu khả năng thích ứng giữa các vòng tương tác), RCR-Router áp dụng phương pháp tiếp cận mô-đun, nhận biết vai trò, tự động lựa chọn các tập hợp bộ nhớ có liên quan về mặt ngữ nghĩa dựa trên vai trò và giai đoạn tác vụ của từng tác tử. Một chính sách chấm điểm nhẹ sẽ hướng dẫn lựa chọn bộ nhớ và các đầu ra của tác tử được hợp nhất lặp đi lặp lại vào một kho lưu trữ bộ nhớ dùng chung để cải thiện ngữ cảnh một cách gia tăng. Hơn nữa, chúng tôi đề xuất thước đo Điểm Chất lượng Câu trả lời, ghi lại các giải thích do LLM tạo ra vượt quá độ chính xác QA tiêu chuẩn, để đánh giá tốt hơn hành vi của mô hình. Kết quả thử nghiệm trên ba điểm chuẩn QA đa bước nhảy (HotPotQA, MuSiQue và 2WikiMultihop) chứng minh rằng RCR-Router duy trì hoặc cải thiện chất lượng câu trả lời đồng thời giảm mức sử dụng token tới 30%.

Takeaways, Limitations

Takeaways:
Một cách tiếp cận mới cho sự cộng tác hiệu quả trong các hệ thống LLM đa tác nhân (RCR-Router).
Giảm thiểu việc sử dụng mã thông báo và cải thiện chất lượng phản hồi thông qua nhận thức vai trò và đường dẫn bộ nhớ động.
Đề Xuất một thước đo mới (Điểm chất lượng câu trả lời) để đánh giá định tính các giải thích về việc tạo ra LLM.
Nhấn mạnh tầm quan trọng của việc thiết lập các đường dẫn bộ nhớ có cấu trúc và đánh giá khả năng nhận dạng đầu ra.
Limitations:
Cần nghiên cứu thêm để xác định tính tổng quát và tính khách quan của chỉ số Điểm chất lượng câu trả lời được đề xuất.
Cần phải xác thực hiệu suất tổng quát của RCR-Router cho nhiều loại tác vụ LLM đa tác nhân khác nhau.
Cần phải đánh giá khả năng mở rộng của RCR-Router và tính ổn định của nó đối với các tình huống tương tác phức tạp.
👍