Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Học cách nắm bắt khéo léo thích nghi từ những minh họa đơn lẻ

Created by
  • Haebom

Tác giả

Liangzhi Shi, Yulin Liu, Lingqi Zeng, Bo Ai, Zhengdong Hong, Hao Su

Phác thảo

AdaDexGrasp là một khuôn khổ học hiệu quả các kỹ thuật nắm bắt khéo léo từ các buổi trình diễn hạn chế của con người và áp dụng chúng một cách thích ứng dựa trên hướng dẫn của người dùng. Nó học nhiều kỹ thuật nắm bắt từ một buổi trình diễn của con người và chọn kỹ thuật phù hợp nhất bằng cách sử dụng mô hình ngôn ngữ thị giác (VLM). Để tăng hiệu quả mẫu, nó đề xuất một phần thưởng theo quỹ đạo, hướng dẫn học tăng cường (RL) đến trạng thái gần hơn với các buổi trình diễn của con người. Nó cũng học vượt ra ngoài một buổi trình diễn duy nhất thông qua học tập chương trình giảng dạy, giúp tăng dần số lượng các biến thể tư thế của vật thể. Khi được triển khai, VLM tìm kiếm các kỹ thuật phù hợp dựa trên hướng dẫn của người dùng, kết nối các kỹ thuật học tập cấp thấp với ý định cấp cao. Các đánh giá trong mô phỏng và môi trường thực tế chứng minh rằng nó cải thiện đáng kể hiệu quả RL và cho phép học các chiến lược nắm bắt giống con người trên nhiều cấu hình vật thể khác nhau. Việc chuyển giao chính sách đã học sang Bàn tay Năng lực PSYONIC thực tế đạt tỷ lệ thành công 90% trên các vật thể, vượt trội đáng kể so với đường cơ sở.

Takeaways, Limitations

Takeaways:
Có thể học được các kỹ năng thực khuẩn hiệu quả và lành nghề thông qua các cuộc trình diễn hạn chế của con người.
Phản ánh ý định cấp cao thông qua việc lựa chọn công nghệ dựa trên ngữ cảnh bằng cách sử dụng mô hình ngôn ngữ thị giác.
Học kỹ năng vững chắc và khái quát thông qua chương trình học.
Chuyển thành công cú đánh số không sang tay robot thực tế.
Học các chiến lược thực khuẩn giống con người.
Limitations:
Thiếu mô tả chi tiết về cấu trúc và hiệu suất cụ thể của VLM được đề xuất.
Hạn chế trong hiệu suất khái quát hóa trên nhiều đối tượng và tình huống khác nhau.
Cần phải thử nghiệm và xác nhận thêm trong môi trường thực tế.
Thiếu thảo luận về việc thiết lập các thông số tối ưu cho việc bù trừ theo dõi quỹ đạo.
👍