Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

GraspClutter6D: Bộ dữ liệu thực tế quy mô lớn cho nhận thức và nắm bắt mạnh mẽ trong các cảnh lộn xộn

Created by
  • Haebom

Tác giả

Seunghyeok Back, Joosoon Lee, Kangmin Kim, Heeseon Rho, Geonhyup Lee, Raeyoung Kang, Sangbeom Lee, Sangjun Noh, Youngjin Lee, Taeyeop Lee, Kyoubin Lee

Phác thảo

GraspClutter6D là một bộ dữ liệu nắm bắt thực tế quy mô lớn được thiết kế để giải quyết vấn đề nắm bắt vật thể mạnh mẽ trong môi trường phức tạp cho robot. Để khắc phục các cảnh đơn giản và sự thiếu đa dạng của các bộ dữ liệu hiện có, nó chứa 1.000 cảnh phức tạp dày đặc (14,1 đối tượng/cảnh, 62,6% che khuất) , 52.000 hình ảnh RGB-D của 200 đối tượng được chụp từ nhiều góc độ khác nhau trong 75 cấu hình môi trường khác nhau (hộp, kệ và bàn), 736.000 tư thế đối tượng 6D và 9,3 tỷ lần nắm bắt có thể của robot. Trong bài báo này, chúng tôi sử dụng bộ dữ liệu này để đánh giá hiệu suất của các phương pháp phân đoạn, ước tính tư thế đối tượng và phát hiện nắm bắt tiên tiến, đồng thời chứng minh rằng các mạng nắm bắt được đào tạo trên GraspClutter6D vượt trội hơn các mạng được đào tạo trên các bộ dữ liệu hiện có trong cả mô phỏng và thử nghiệm thực địa. Bộ dữ liệu, bộ công cụ và công cụ chú thích được cung cấp công khai.

Takeaways, Limitations

Takeaways:
Cung cấp bộ dữ liệu thực khuẩn phức tạp trên quy mô lớn, khắc phục được những hạn chế của các bộ dữ liệu hiện có.
Góp phần nghiên cứu các vấn đề thực tế về phage, bao gồm nhiều môi trường và vật thể khác nhau, cũng như tỷ lệ tắc nghẽn cao.
Thực nghiệm đã chứng minh rằng việc học bằng GraspClutter6D mang lại hiệu suất ghi nhớ vượt trội so với các tập dữ liệu hiện có.
Tăng khả năng tái tạo và khả năng mở rộng của nghiên cứu thông qua các tập dữ liệu mở, bộ công cụ và công cụ chú thích.
Limitations:
Bất chấp quy mô của tập dữ liệu, nó có thể không phản ánh hoàn hảo mọi môi trường phức tạp của thế giới thực.
Có khả năng sẽ có sự thiên vị đối với một số loại đối tượng hoặc môi trường nhất định.
Cần phải cân nhắc đến tiếng ồn và lỗi có thể xảy ra trong quá trình thu thập dữ liệu.
👍