Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

DynaSwarm: Lựa chọn cấu trúc đồ thị động cho hệ thống đa tác nhân dựa trên LLM

Created by
  • Haebom

Tác giả

Hui Yi Leong, Yuqing Wu

Phác thảo

Bài báo này đề xuất DynaSwarm, một khuôn khổ động để tăng cường các hệ thống đa tác nhân (MAS) dựa trên mô hình ngôn ngữ quy mô lớn (LLM) nhằm khắc phục những hạn chế của các MAS hiện có vốn dựa trên các cấu trúc đồ thị cộng tác tĩnh được thiết kế thủ công. DynaSwarm tận dụng hai cải tiến chính: (1) tối ưu hóa cấu trúc đồ thị thông qua cơ chế học tăng cường tác nhân-nhà phê bình (A2C), giúp cải thiện tính ổn định so với các phương pháp học tăng cường (RL) hiện có, và (2) một bộ chọn đồ thị động có khả năng chọn cấu trúc đồ thị tối ưu một cách thích ứng cho mỗi mẫu đầu vào thông qua tinh chỉnh LLM hiệu quả về tham số. Điều này cho phép DynaSwarm định tuyến động các truy vấn thông qua mạng lưới các tác nhân chuyên biệt bằng cách khai thác các tính năng cụ thể của từng mẫu, thay vì dựa vào kiến trúc đồ thị cố định áp dụng cho tất cả các mẫu. Hơn nữa, chúng tôi đề xuất một phương pháp tinh chỉnh trình tìm kiếm demo để tối đa hóa hiệu quả của học trong ngữ cảnh (ICL). Các thử nghiệm mở rộng về trả lời câu hỏi, lập luận toán học và nhiệm vụ mã hóa chứng minh rằng DynaSwarm luôn vượt trội hơn các mô hình cơ sở MAS và tác nhân đơn tiên tiến trên nhiều nền tảng LLM.

Takeaways, Limitations

Takeaways:
Chúng tôi nhấn mạnh tầm quan trọng của cấu trúc đồ thị động trong MAS dựa trên LLM.
ĐạT được cải tiến hiệu suất ổn định so với các phương pháp RL hiện có thông qua tối ưu hóa cấu trúc đồ thị dựa trên A2C.
Tăng khả năng thích ứng với nhiều tác vụ khác nhau thông qua việc lựa chọn biểu đồ động dựa trên các tính năng mẫu.
Chúng tôi trình bày một kỹ thuật tinh chỉnh trình tìm kiếm demo giúp cải thiện hiệu suất bằng cách tận dụng học tập theo ngữ cảnh (ICL).
Nó vượt trội hơn các mô hình tiên tiến trong nhiều nhiệm vụ khác nhau (trả lời câu hỏi, lập luận toán học và lập trình).
Limitations:
Bài báo này không đề cập cụ thể đến Limitations. Cần phân tích và thực nghiệm thêm để làm rõ Limitations. Ví dụ, cần phân tích chi tiết hơn về chi phí tính toán và tốc độ hội tụ của thuật toán A2C, độ phức tạp của việc lựa chọn đồ thị động và hiệu suất tổng quát hóa cho các loại bài toán cụ thể.
👍