Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Lập kế hoạch chuyển động động học theo kiểu đào tạo một lần, lập kế hoạch mọi lúc mọi nơi thông qua cây khuếch tán

Created by
  • Haebom

Tác giả

Yaniv Hassidof, Tom Jurgenson, Kiril Solovey

Phác thảo

Bài báo này đề cập đến vấn đề lập kế hoạch chuyển động động của việc tính toán quỹ đạo không va chạm trong khi vẫn tôn trọng các ràng buộc động của robot. Các bộ lập kế hoạch dựa trên lấy mẫu (SBP) hiện có xây dựng cây tìm kiếm thông qua lan truyền hành động để khám phá không gian trạng thái nhiều chiều của robot, nhưng việc lấy mẫu ngẫu nhiên của chúng dẫn đến việc khám phá chậm. Các phương pháp tiếp cận dựa trên học máy cung cấp thời gian thực hiện nhanh hơn nhưng không thể khái quát hóa thành các kịch bản ngoài phân phối (OOD) và thiếu các đảm bảo quan trọng như an toàn. Trong bài báo này, chúng tôi trình bày Diffusion Tree (DiTree), một khuôn khổ khái quát hóa có thể kiểm chứng, hướng dẫn hiệu quả việc khám phá không gian trạng thái trong SBP bằng cách tận dụng các Chính sách Khuếch tán (DP) như các bộ lấy mẫu có thông tin. DiTree kết hợp khả năng của DP trong việc mô hình hóa các phân phối phức tạp của các quỹ đạo chuyên gia dựa trên các quan sát cục bộ với tính đầy đủ của SBP để tạo ra các giải pháp an toàn có thể kiểm chứng cho các hệ thống động phức tạp trong một vài lần lặp lan truyền hành động. Chúng tôi chứng minh hiệu suất của DiTree thông qua một triển khai kết hợp bộ lập kế hoạch RRT với bộ lấy mẫu hành động DP được đào tạo trong một môi trường duy nhất. Trong một đánh giá toàn diện về các kịch bản OOD, DiTree đạt tỷ lệ thành công trung bình cao hơn 30% so với DP hoặc SBP độc lập trong các thiết lập xe động và robot kiến ​​Mujoco (trong trường hợp sau, SBP hoàn toàn thất bại). Ngoài mô phỏng, các thử nghiệm xe thực tế cho thấy chất lượng quỹ đạo và độ bền tuyệt vời ngay cả trong những khoảng cách lớn giữa mô phỏng và thực tế, khẳng định tính ứng dụng của DiTree.

Takeaways, Limitations

_____T36983____-:
Chúng tôi cải thiện đáng kể hiệu quả của các nhà lập kế hoạch dựa trên lấy mẫu bằng cách tận dụng các chính sách khuếch tán.
Nó có tỷ lệ thành công cao và hiệu suất tổng quát tuyệt vời ngay cả trong các tình huống ngoài phân phối (OOD).
Tính ứng dụng thực tế của kết quả mô phỏng đã được kiểm chứng thông qua các thí nghiệm robot thực tế.
Chúng tôi cung cấp một khuôn khổ có thể xác minh để đảm bảo các giải pháp an toàn.
Limitations:
Có thể cần nghiên cứu thêm để khám phá khả năng khái quát của DP được đào tạo trong một môi trường duy nhất.
Cần có nhiều thí nghiệm mở rộng hơn trên nhiều hệ thống và môi trường robot khác nhau.
Có thể cần phân tích thêm về lượng dữ liệu và thời gian đào tạo cần thiết cho đào tạo DP.
👍