AdaDexGrasp là một khuôn khổ học hiệu quả các kỹ thuật nắm bắt khéo léo từ các buổi trình diễn hạn chế của con người và áp dụng chúng một cách thích ứng dựa trên hướng dẫn của người dùng. Nó học nhiều kỹ thuật nắm bắt từ một buổi trình diễn của con người và chọn kỹ thuật phù hợp nhất bằng cách sử dụng mô hình ngôn ngữ thị giác (VLM). Để tăng hiệu quả mẫu, nó đề xuất một phần thưởng theo quỹ đạo, hướng dẫn học tăng cường (RL) đến trạng thái gần hơn với các buổi trình diễn của con người. Nó cũng học vượt ra ngoài một buổi trình diễn duy nhất thông qua học tập chương trình giảng dạy, giúp tăng dần số lượng các biến thể tư thế của vật thể. Khi được triển khai, VLM tìm kiếm các kỹ thuật phù hợp dựa trên hướng dẫn của người dùng, kết nối các kỹ thuật học tập cấp thấp với ý định cấp cao. Các đánh giá trong mô phỏng và môi trường thực tế chứng minh rằng nó cải thiện đáng kể hiệu quả RL và cho phép học các chiến lược nắm bắt giống con người trên nhiều cấu hình vật thể khác nhau. Việc chuyển giao chính sách đã học sang Bàn tay Năng lực PSYONIC thực tế đạt tỷ lệ thành công 90% trên các vật thể, vượt trội đáng kể so với đường cơ sở.