Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

GraspClutter6D: Bộ dữ liệu thực tế quy mô lớn cho nhận thức và nắm bắt mạnh mẽ trong các cảnh lộn xộn

Created by
  • Haebom

Tác giả

Seunghyeok Back, Joosoon Lee, Kangmin Kim, Heeseon Rho, Geonhyup Lee, Raeyoung Kang, Sangbeom Lee, Sangjun Noh, Youngjin Lee, Taeyeop Lee, Kyoubin Lee

Phác thảo

GraspClutter6D là một bộ dữ liệu nắm bắt thực tế quy mô lớn được thiết kế để giải quyết vấn đề nắm bắt vật thể mạnh mẽ trong môi trường hỗn loạn cho robot. Nó khắc phục được những hạn chế về cảnh đơn giản, tỷ lệ che khuất thấp và sự thiếu đa dạng của các bộ dữ liệu hiện có. Nó bao gồm 1.000 cảnh hỗn loạn dày đặc (trung bình 14,1 vật thể trên mỗi cảnh, tỷ lệ che khuất 62,6%), 200 vật thể và 75 cấu hình môi trường (hộp, kệ, bàn) và các ảnh chụp đa góc nhìn sử dụng bốn camera RGB-D. Bộ chú thích phong phú được cung cấp, bao gồm 736.000 tư thế vật thể 6D và 9,3 tỷ lần nắm bắt khả thi của robot cho hình ảnh RGB-D 52.000. Chúng tôi so sánh các phương pháp phân đoạn, ước tính tư thế vật thể và phát hiện nắm bắt hiện đại để phân tích nhiệm vụ trong môi trường hỗn loạn và chứng minh rằng mạng lưới nắm bắt được đào tạo trên GraspClutter6D vượt trội hơn các mạng lưới được đào tạo trên các bộ dữ liệu hiện có trong cả mô phỏng và thử nghiệm thực tế. Bộ dữ liệu, bộ công cụ và công cụ chú thích được cung cấp công khai.

Takeaways, Limitations

Takeaways:
Cung cấp bộ dữ liệu thực khuẩn thể quy mô lớn, thực tế và phức tạp, khắc phục được những hạn chế của các bộ dữ liệu hiện có.
Cung cấp những hiểu biết quan trọng về nhiệm vụ của phage trong môi trường hỗn loạn.
Thể hiện hiệu suất vượt trội của mạng học tập dựa trên GraspClutter6D (môi trường mô phỏng và thực tế)
Cho phép nghiên cứu thông qua việc phát hành các tập dữ liệu, bộ công cụ và công cụ chú thích.
Limitations:
Mặc dù tập dữ liệu rất lớn nhưng có thể không bao hàm đầy đủ mọi môi trường phức tạp của thế giới thực.
Có khả năng thiên vị đối với một số loại đối tượng hoặc môi trường nhất định.
Cần phải cân nhắc đến tiếng ồn và lỗi có thể xảy ra trong quá trình thu thập dữ liệu.
👍