Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

Tầm nhìn không cần hình ảnh: Tầm nhìn máy tính đầu cuối từ các phép đo nén đơn lẻ

Created by
  • Haebom

Tác giả

Fengpu Pan, Heting Gao, Jiangtao Wen, Yuxing Han

Phác thảo

Bài báo này trình bày một khuôn khổ thị giác máy tính mới dựa trên Snapshot Compressed Imaging (SCI) sử dụng mặt nạ nhị phân giả ngẫu nhiên 8x8 để khắc phục những hạn chế của các kỹ thuật SCI hiện có, cho thấy hiệu suất kém trong điều kiện ánh sáng yếu và SNR thấp. Cốt lõi của nó là Bộ mã hóa tự động khử nhiễu nén (CompDAE) dựa trên kiến trúc STFormer, được thiết kế để thực hiện trực tiếp các tác vụ tiếp theo như phát hiện cạnh và ước tính độ sâu mà không cần tái tạo hình ảnh. CompDAE tích hợp một chiến lược đào tạo bị ràng buộc về tốc độ lấy cảm hứng từ BackSlash để tạo ra các mô hình có thể nén và cung cấp một nền tảng đa tác vụ tích hợp bằng cách sử dụng bộ giải mã tác vụ cụ thể nhẹ và bộ mã hóa dùng chung. Kết quả thử nghiệm trên nhiều tập dữ liệu khác nhau chứng minh rằng CompDAE đạt được hiệu suất tiên tiến với độ phức tạp giảm đáng kể, đặc biệt là trong điều kiện ánh sáng cực yếu khi các đường ống CMOS và SCI hiện có bị lỗi.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một khuôn khổ thị giác máy tính dựa trên SCI mới có hiệu suất vượt trội trong điều kiện ánh sáng yếu và SNR thấp.
Sử dụng mặt nạ có kích thước nhỏ, dễ dàng lắp đặt vào phần cứng.
Các hoạt động tiếp theo (phát hiện cạnh, ước tính độ sâu, v.v.) có thể được thực hiện trực tiếp mà không cần tái tạo hình ảnh.
Cung cấp nền tảng tích hợp cho đa nhiệm.
ĐạT được hiệu suất tiên tiến với độ phức tạp thấp hơn so với các phương pháp hiện có.
_____T41473____-:
Có thể mất độ phân giải do sử dụng mặt nạ kích thước 8x8.
Chỉ có kết quả thử nghiệm cho các tập dữ liệu cụ thể được trình bày, do đó cần phải xác minh hiệu suất tổng quát hóa.
Cần có thêm lời giải thích về chi tiết cụ thể và hiệu quả của các chiến lược đào tạo có giới hạn tốc độ lấy cảm hứng từ BackSlash.
👍