Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Memp: Khám phá bộ nhớ thủ tục của tác nhân

Created by
  • Haebom

Tác giả

Nhuận Nam Phương, Nguyên Lương, Tiểu Tân Vương, Gia Long Ngô, Sóc Phi Kiều, Bành Quân Xie, Phi Hoàng, Hoa Quân Thần, Ninh Vũ Chương

Phác thảo

Bài báo này khám phá các chiến lược để truyền tải bộ nhớ thủ tục có thể học, cập nhật và suốt đời nhằm giải quyết vấn đề bộ nhớ thủ tục mong manh của các tác nhân dựa trên mô hình ngôn ngữ quy mô lớn (LLM). Chúng tôi đề xuất một phương pháp mới, Memp, trích xuất các quỹ đạo trong quá khứ của tác nhân thành các hướng dẫn từng bước chi tiết và các trừu tượng hóa giống như tập lệnh cấp cao. Chúng tôi khám phá tác động của các chiến lược khác nhau để xây dựng, truy xuất và cập nhật bộ nhớ thủ tục, đồng thời xây dựng một kho lưu trữ bộ nhớ phát triển với những trải nghiệm mới thông qua một hệ thống động liên tục cập nhật, sửa đổi và loại bỏ nội dung của nó. Kết quả thử nghiệm trên TravelPlanner và ALFWorld chứng minh rằng khi kho lưu trữ bộ nhớ được tinh chỉnh, tỷ lệ thành công và hiệu quả của tác nhân đối với các tác vụ tương tự sẽ được cải thiện đều đặn. Hơn nữa, bộ nhớ thủ tục được xây dựng trên một mô hình mạnh vẫn giữ nguyên giá trị của nó, dẫn đến những cải tiến hiệu suất đáng kể ngay cả khi chuyển sang một mô hình yếu hơn.

Takeaways, Limitations

Takeaways:
Trình bày giải pháp hiệu quả cho vấn đề bộ nhớ thủ tục dành cho các tác nhân dựa trên LLM.
Chứng minh tính khả thi của việc triển khai bộ nhớ thủ tục có thể học được, cập nhật và suốt đời.
Đề Xuất khả năng cải thiện hiệu suất của các mô hình yếu thông qua việc chuyển giao bộ nhớ thủ tục học được từ các mô hình mạnh.
Cải thiện tỷ lệ thành công và hiệu quả của tác nhân thông qua phương pháp Memp.
Limitations:
Cần nghiên cứu thêm về hiệu suất tổng quát của phương pháp đề xuất.
Cần phải đánh giá khả năng áp dụng vào nhiều nhiệm vụ và môi trường khác nhau.
Cần phải phân tích hiệu quả về kích thước và quản lý bộ nhớ lưu trữ.
ĐáNh giá hiệu suất và phân tích độ mạnh mẽ trong các môi trường phức tạp thực tế là cần thiết.
👍