En este artículo, proponemos MambaNeXt-YOLO, un novedoso marco de trabajo que busca equilibrar velocidad y precisión con recursos computacionales limitados en la detección de objetos en tiempo real. Para abordar la alta complejidad computacional de las arquitecturas existentes basadas en Transformers, implementamos un modelado de secuencias eficiente aprovechando Mamba, un modelo lineal de espacio de estados. Nuestras principales contribuciones son tres: introducimos MambaNeXt Block, que integra CNN y Mamba, para capturar eficazmente características locales y dependencias de largo alcance; proponemos MAFPN (Red Pirámide de Fusión Asimétrica Multirama) para mejorar la detección de objetos a múltiples escalas; y logramos una eficiencia que facilita la implementación en dispositivos edge como NVIDIA Jetson Xavier NX y Orin NX. Logramos un 66,6 % de mAP a 31,9 FPS en el conjunto de datos PASCAL VOC, lo que demuestra el rendimiento sin preentrenamiento.