Trong bài báo này, chúng tôi đề xuất MambaNeXt-YOLO, một khuôn khổ mới giúp cân bằng tốc độ và độ chính xác trong điều kiện tài nguyên tính toán hạn chế khi phát hiện đối tượng theo thời gian thực. Để giải quyết vấn đề tính toán phức tạp cao của các kiến trúc dựa trên Transformer hiện có, chúng tôi triển khai mô hình chuỗi hiệu quả bằng cách tận dụng Mamba, một mô hình không gian trạng thái tuyến tính. Ba đóng góp chính của chúng tôi bao gồm: giới thiệu MambaNeXt Block, tích hợp CNN và Mamba, để nắm bắt hiệu quả các đặc điểm cục bộ và các phụ thuộc tầm xa; đề xuất MAFPN (Mạng Kim tự tháp Hợp nhất Bất đối xứng Đa nhánh) để cải thiện khả năng phát hiện đối tượng đa quy mô; và đạt được hiệu quả hỗ trợ triển khai trên các thiết bị biên như NVIDIA Jetson Xavier NX và Orin NX. Chúng tôi đạt được mAP 66,6% ở tốc độ 31,9 FPS trên tập dữ liệu PASCAL VOC, chứng minh hiệu suất mà không cần bất kỳ quá trình tiền huấn luyện nào.