Arxiv hàng ngày

Đây là trang tổng hợp các bài báo về trí tuệ nhân tạo được xuất bản trên toàn thế giới.
Trang này sử dụng Google Gemini để tóm tắt nội dung và hoạt động phi lợi nhuận.
Bản quyền của các bài báo thuộc về tác giả và tổ chức liên quan; khi chia sẻ, chỉ cần ghi rõ nguồn.

MambaNeXt-YOLO: Mô hình không gian trạng thái lai để phát hiện đối tượng theo thời gian thực

Created by
  • Haebom

Tác giả

Xiaochun Lei, Siqi Wu, Weilin Wu, Zetao Jiang

Phác thảo

Trong bài báo này, chúng tôi đề xuất MambaNeXt-YOLO, một khuôn khổ mới giúp cân bằng tốc độ và độ chính xác trong điều kiện tài nguyên tính toán hạn chế khi phát hiện đối tượng theo thời gian thực. Để giải quyết vấn đề tính toán phức tạp cao của các kiến trúc dựa trên Transformer hiện có, chúng tôi triển khai mô hình chuỗi hiệu quả bằng cách tận dụng Mamba, một mô hình không gian trạng thái tuyến tính. Ba đóng góp chính của chúng tôi bao gồm: giới thiệu MambaNeXt Block, tích hợp CNN và Mamba, để nắm bắt hiệu quả các đặc điểm cục bộ và các phụ thuộc tầm xa; đề xuất MAFPN (Mạng Kim tự tháp Hợp nhất Bất đối xứng Đa nhánh) để cải thiện khả năng phát hiện đối tượng đa quy mô; và đạt được hiệu quả hỗ trợ triển khai trên các thiết bị biên như NVIDIA Jetson Xavier NX và Orin NX. Chúng tôi đạt được mAP 66,6% ở tốc độ 31,9 FPS trên tập dữ liệu PASCAL VOC, chứng minh hiệu suất mà không cần bất kỳ quá trình tiền huấn luyện nào.

Takeaways, Limitations

Takeaways:
Chúng tôi trình bày một khuôn khổ phát hiện đối tượng thời gian thực hiệu quả dựa trên Mamba, góp phần cải thiện hiệu suất phát hiện đối tượng trong môi trường có tài nguyên tính toán hạn chế.
ĐạT được sự cân bằng hiệu quả giữa độ chính xác và tốc độ với MambaNeXt Block và MAFPN.
Trình bày khả năng phát hiện đối tượng theo thời gian thực trên các thiết bị biên.
ĐạT được hiệu suất vượt trội mà không cần đào tạo trước.
Limitations:
Vì chỉ được đánh giá bằng bộ dữ liệu PASCAL VOC nên hiệu suất tổng quát trên các bộ dữ liệu khác cần được nghiên cứu thêm.
Cần có một phân tích so sánh chi tiết hơn về phương pháp đề xuất với các mô hình hiện đại khác.
Thiếu mô tả kỹ thuật chi tiết về việc triển khai thiết bị biên của MambaNeXt-YOLO.
👍