Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

RCR-Router: Định tuyến ngữ cảnh nhận biết vai trò hiệu quả cho các hệ thống LLM đa tác nhân với bộ nhớ có cấu trúc

Created by
  • Haebom

Tác giả

Jun Liu, Zhenglun Kong, Changdi Yang, Fan Yang, Tianqi Li, Peiyan Dong, Joannah Nanjekye, Hao Tang, Geng Yuan, Wei Niu, Wenbin Zhang, Pu Zhao, Xue Lin, Dong Huang, Yanzhi Wang

Phác thảo

Bài báo này đề xuất RCR-Router, một khuôn khổ định tuyến mới cho sự cộng tác hiệu quả trong các hệ thống mô hình ngôn ngữ quy mô lớn (LLM) đa tác tử. Để khắc phục những hạn chế của các chiến lược định tuyến tĩnh hoặc toàn ngữ cảnh hiện có, RCR-Router áp dụng phương pháp tiếp cận mô-đun, nhận biết vai trò, tự động lựa chọn các tập hợp bộ nhớ có liên quan về mặt ngữ nghĩa dựa trên vai trò và giai đoạn tác vụ của từng tác tử. Điều này đạt được trong khi vẫn tuân thủ một ngân sách mã thông báo nghiêm ngặt. Chính sách chấm điểm nhẹ sẽ hướng dẫn lựa chọn bộ nhớ và đầu ra của tác tử được hợp nhất lặp đi lặp lại vào kho lưu trữ bộ nhớ dùng chung, cho phép tinh chỉnh ngữ cảnh gia tăng. Hơn nữa, chúng tôi trình bày số liệu Điểm chất lượng câu trả lời, ghi lại các giải thích do LLM tạo ra, để đánh giá hiệu suất mô hình tốt hơn. Kết quả thử nghiệm trên ba điểm chuẩn QA đa bước nhảy—HotPotQA, MuSiQue và 2WikiMultihop—cho thấy RCR-Router duy trì hoặc cải thiện chất lượng câu trả lời đồng thời giảm mức sử dụng mã thông báo tới 30%.

Takeaways, Limitations

_____T73998____:
Chúng tôi giới thiệu RCR-Router, một khuôn khổ định tuyến mới cho sự cộng tác hiệu quả trong các hệ thống LLM đa tác nhân.
ĐịNh tuyến bộ nhớ động và nhận biết vai trò giúp giảm việc sử dụng mã thông báo và duy trì hoặc cải thiện chất lượng phản hồi.
Cải thiện phương pháp đánh giá bằng cách đề xuất chỉ số Điểm chất lượng câu trả lời có tính đến mô tả quá trình tạo LLM.
Nhấn mạnh tầm quan trọng của việc định tuyến bộ nhớ có cấu trúc và đánh giá có nhận thức về đầu ra.
Limitations:
Hiệu suất của RCR-Router được đề xuất dựa trên kết quả thử nghiệm giới hạn trong một chuẩn mực cụ thể. Cần có thêm các thử nghiệm trên nhiều tác vụ và tập dữ liệu khác nhau.
Cần nghiên cứu thêm để xác định tính tổng quát và tính khách quan của chỉ số Điểm chất lượng câu trả lời.
Thiếu giải thích chi tiết về thiết kế và tối ưu hóa chính sách chấm điểm nhẹ.
👍