본 논문은 실시간 객체 탐지에서 제한된 계산 자원 하에서 속도와 정확도의 균형을 맞추는 새로운 프레임워크인 MambaNeXt-YOLO를 제안합니다. 기존 Transformer 기반 아키텍처의 높은 계산 복잡도 문제를 해결하기 위해, 선형 상태 공간 모델인 Mamba를 활용하여 효율적인 시퀀스 모델링을 구현합니다. 핵심 기여는 세 가지로, CNN과 Mamba를 통합한 MambaNeXt Block을 통해 국소 특징과 장거리 의존성을 효과적으로 포착하고, 다중 스케일 객체 탐지를 개선하는 MAFPN(Multi-branch Asymmetric Fusion Pyramid Network)을 제시하며, NVIDIA Jetson Xavier NX 및 Orin NX와 같은 에지 디바이스에서의 배포를 지원하는 효율성을 달성하는 데 있습니다. PASCAL VOC 데이터셋에서 31.9 FPS로 66.6% mAP를 달성하였으며, 사전 훈련 없이도 성능을 보였습니다.