Bài báo này đề xuất CoDiff, một khuôn khổ mới để cải thiện hiệu suất phát hiện đối tượng 3D cộng tác trong các hệ thống đa tác nhân. Các phương pháp phát hiện đối tượng 3D cộng tác hiện có tạo ra các biểu diễn đặc trưng chứa nhiễu không gian và thời gian do lỗi ước lượng tư thế và độ trễ thời gian, dẫn đến hiệu suất phát hiện kém. CoDiff tận dụng mô hình khuếch tán để giải quyết những vấn đề này. Nó chiếu các bản đồ đặc trưng đa chiều vào không gian tiềm ẩn của bộ mã hóa tự động được đào tạo trước và hướng dẫn việc lấy mẫu mô hình khuếch tán dựa trên thông tin từ mỗi tác nhân, do đó loại bỏ nhiễu và cải thiện các đặc trưng hợp nhất. Kết quả thử nghiệm sử dụng mô phỏng và bộ dữ liệu thực tế chứng minh rằng CoDiff vượt trội hơn các phương pháp hiện có trong phát hiện đối tượng cộng tác và vẫn mạnh mẽ ngay cả khi có mức nhiễu cao trong thông tin tư thế và độ trễ của tác nhân.