[공지사항]을 빙자한 안부와 근황 
Show more

Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

MEM1: Học cách kết hợp trí nhớ và lý luận để tạo ra các tác nhân hiệu quả trong thời gian dài

Created by
  • Haebom

Tác giả

Zijian Chu, Ao Qu, Zhaoxuan Wu, Sunghwan Kim, Alok Prakash, Daniela Rus, Jinhua Zhao, Bryan Kian Hsiang Low, Paul Pu Liang

Phác thảo

Bài báo này đề cập đến những hạn chế của các tác nhân ngôn ngữ hiện đại trong việc thu thập thông tin bên ngoài, thích ứng với các quan sát và trả lời các câu hỏi phụ thuộc lẫn nhau trong các tương tác dài hạn, nhiều vòng. Các hệ thống LLM hiện tại dựa vào việc nhắc nhở ngữ cảnh đầy đủ, bổ sung tất cả các vòng trước bất kể mức độ liên quan, dẫn đến tăng trưởng bộ nhớ vô hạn, tăng chi phí tính toán và hiệu suất suy luận kém đối với các độ dài đầu vào nằm ngoài phân phối. Để đáp lại, bài báo này đề xuất MEM1, một khuôn khổ học tăng cường đầu cuối có thể thực hiện các tác vụ dài hạn, nhiều vòng bằng cách sử dụng bộ nhớ hằng số. MEM1 cập nhật trạng thái nội bộ được chia sẻ nén hỗ trợ tích hợp bộ nhớ và suy luận ở mỗi vòng, tích hợp các quan sát mới từ môi trường với các ký ức trước đó đồng thời loại bỏ thông tin không liên quan hoặc dư thừa một cách chiến lược. Ngoài ra, chúng tôi đề xuất một phương pháp đơn giản nhưng hiệu quả và có khả năng mở rộng để hỗ trợ việc học trong các môi trường thực tế và mang tính xây dựng hơn bằng cách kết hợp các tập dữ liệu hiện có thành các chuỗi tác vụ phức tạp tùy ý. Các thử nghiệm trên ba miền, bao gồm QA tìm kiếm nội bộ, QA web miền mở và mua sắm web đa bước nhảy, chứng minh rằng MEM1-7B cải thiện hiệu suất gấp 3,5 lần so với Qwen2.5-14B-Instruct trên tác vụ QA đa bước nhảy 16 mục tiêu, đồng thời giảm mức sử dụng bộ nhớ xuống 3,7 lần, và có khả năng khái quát hóa vượt xa giai đoạn huấn luyện. Kết quả của chúng tôi chứng minh tiềm năng của tích hợp bộ nhớ dựa trên suy luận như một giải pháp thay thế có thể mở rộng cho các giải pháp hiện có để huấn luyện các tác nhân tương tác dài hạn, tối ưu hóa cả hiệu quả và hiệu suất.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày khả năng cải thiện đồng thời hiệu quả và hiệu suất của các tác nhân tương tác nhiều vòng, dài hạn thông qua tích hợp bộ nhớ dựa trên suy luận.
MEM1 giải quyết hiệu quả vấn đề giới hạn bộ nhớ của LLM hiện tại và đạt hiệu suất tuyệt vời ngay cả trong môi trường bộ nhớ hạn chế.
Chúng tôi xác minh khả năng khái quát hóa của MEM1 thông qua các thí nghiệm trong nhiều lĩnh vực khác nhau.
Chúng tôi trình bày một phương pháp xây dựng môi trường đa vòng có khả năng mở rộng bằng cách sử dụng các tập dữ liệu hiện có.
Limitations:
Thiếu giải thích chi tiết về chiến lược cập nhật trạng thái nội bộ của MEM1 và tiêu chí xóa thông tin.
Do sự thiên vị trong việc đánh giá hiệu suất trên các tập dữ liệu và nhiệm vụ cụ thể, cần nghiên cứu thêm về hiệu suất tổng quát trong các môi trường đa dạng.
Cần phải mở rộng môi trường thử nghiệm để bao gồm nhiều tương tác phức tạp và đa dạng hơn.
Cần nghiên cứu thêm để tối ưu hóa các chiến lược quản lý bộ nhớ.
👍