Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Lý luận nghịch đảo hợp lý

Created by
  • Haebom

Tác giả

Ben Zandonati, Tom trong vai Lozano- Perez, Leslie Pack Kaelbling

Phác thảo

Bài báo này lập luận rằng, không giống như khả năng học hỏi từ các ví dụ đơn lẻ của con người, robot gặp khó khăn trong việc khái quát hóa, cho rằng điều này là do chúng không thể khôi phục lời giải thích cơ bản (chương trình tiềm ẩn) cho hành vi thông minh. Để giải quyết vấn đề này, chúng tôi đề xuất một khuôn khổ Lý luận Nghịch đảo Hợp lý (RIR) suy ra các chương trình tiềm ẩn thông qua một mô hình sinh sản phân cấp về hành vi. RIR giải quyết vấn đề bắt chước từng trường hợp nhỏ thông qua phương pháp quy nạp chương trình Bayesian, trong đó mô hình ngôn ngữ thị giác đề xuất lặp lại các giả thuyết nhiệm vụ biểu tượng có cấu trúc, và một hệ thống suy luận dựa trên lập kế hoạch đánh giá từng giả thuyết dựa trên khả năng xảy ra của các ví dụ quan sát được. Quá trình này tạo ra xác suất hậu nghiệm cho một chương trình ngắn gọn và khả thi. Chúng tôi đánh giá RIR trên một tập hợp các tác vụ thao tác liên tục, đánh giá khả năng khái quát hóa từng trường hợp và từng trường hợp nhỏ trên nhiều tư thế, số lượng, hình dạng hình học và cách sắp xếp đối tượng. Chúng tôi chứng minh rằng RIR có thể suy ra cấu trúc nhiệm vụ dự định và khái quát hóa sang các bối cảnh mới chỉ với một ví dụ duy nhất, vượt trội hơn các mô hình ngôn ngữ thị giác hiện đại.

Takeaways, Limitations

Takeaways:
Chúng tôi đề xuất khả năng cải thiện khả năng học tập nhỏ của robot thông qua khuôn khổ RIR.
Kết hợp mô hình ngôn ngữ trực quan với công cụ lập kế hoạch giúp học tập bắt chước hiệu quả hơn.
Ngay cả một cuộc trình diễn duy nhất cũng có thể đóng góp vào sự phát triển của một hệ thống điều khiển robot có tính tổng quát.
Limitations:
Hiện tại, việc đánh giá chỉ giới hạn ở các nhiệm vụ vận hành liên tục và cần xác minh hiệu suất trong nhiều lĩnh vực nhiệm vụ đa dạng hơn.
Vì hiệu suất của RIR phụ thuộc vào hiệu suất của trình lập kế hoạch nên những hạn chế của thuật toán lập kế hoạch có thể hạn chế hiệu suất của RIR.
Việc khái quát hóa các nhiệm vụ phức tạp hoặc nhiệm vụ liên quan đến tương tác nhiều đối tượng cần được nghiên cứu thêm.
👍