Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Sự diễn đạt bằng lời của bộ nhớ theo từng giai đoạn sử dụng các biểu diễn phân cấp của trải nghiệm robot suốt đời

Created by
  • Haebom

Tác giả

Leonard B armann, Chad DeChant, Joana Plewnia, Fabian Peller-Konrad, Daniel Bauer, Tamim Asfour, Alex Waibel

Phác thảo

Bài báo này tập trung vào khả năng của robot trong việc tóm tắt các trải nghiệm dài hạn và trả lời các câu hỏi—tức là khả năng diễn đạt bằng lời trải nghiệm của robot. Trong khi các nghiên cứu trước đây hạn chế khả năng khái quát hóa và khả năng chuyển giao bằng cách áp dụng các hệ thống dựa trên quy tắc hoặc các mô hình sâu được tinh chỉnh cho dữ liệu trải nghiệm ngắn hạn, nghiên cứu này tận dụng một mô hình ngôn ngữ quy mô lớn, được đào tạo trước để diễn đạt bằng lời trải nghiệm trọn đời của robot thông qua phương pháp học không hoặc học vài lần. Nó tạo ra dữ liệu có cấu trúc cây phân cấp từ các bộ nhớ theo giai đoạn (EM), biểu diễn dữ liệu cảm giác và cảm thụ bản thể thô ở cấp độ thấp và các sự kiện trừu tượng bằng các khái niệm ngôn ngữ tự nhiên ở cấp độ cao. Mô hình ngôn ngữ quy mô lớn hoạt động như một tác nhân để khám phá EM một cách tương tác dựa trên các truy vấn của người dùng, mở rộng các nút cây một cách động để tìm thông tin có liên quan. Cách tiếp cận này duy trì chi phí tính toán thấp ngay cả với dữ liệu trải nghiệm của robot trong nhiều tháng. Chúng tôi đánh giá tính linh hoạt và khả năng mở rộng của phương pháp của mình bằng cách sử dụng dữ liệu robot mô phỏng tại nhà, video quan điểm của con người và các bản ghi robot trong thế giới thực.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một phương pháp mới để diễn đạt hiệu quả các trải nghiệm dài hạn của robot bằng cách tận dụng các mô hình ngôn ngữ quy mô lớn đã được đào tạo trước.
Xử lý hiệu quả lượng dữ liệu lớn và giảm chi phí tính toán thông qua dữ liệu có cấu trúc cây phân cấp.
Xác thực hiệu suất trên nhiều tập dữ liệu khác nhau, bao gồm dữ liệu mô phỏng, video quan điểm của con người và dữ liệu robot thực.
Tiềm năng góp phần cải thiện tương tác giữa con người và robot.
Limitations:
Hiện tại, việc đánh giá chỉ giới hạn ở mô phỏng và dữ liệu thực tế hạn chế. Cần có thêm xác thực trên dữ liệu thực tế đa dạng và phức tạp hơn.
Do bản chất của các mô hình ngôn ngữ lớn, cần phải nghiên cứu thêm về khả năng giải thích và độ tin cậy.
Cần có thêm nghiên cứu về tối ưu hóa và khái quát hóa thiết kế cấu trúc cây.
👍