Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

MambaNeXt-YOLO: Un modelo híbrido de espacio de estados para la detección de objetos en tiempo real

Created by
  • Haebom

Autor

Xiaochun Lei, Siqi Wu, Weilin Wu, Zetao Jiang

Describir

En este artículo, proponemos MambaNeXt-YOLO, un novedoso marco de trabajo que busca equilibrar velocidad y precisión con recursos computacionales limitados en la detección de objetos en tiempo real. Para abordar la alta complejidad computacional de las arquitecturas existentes basadas en Transformers, implementamos un modelado de secuencias eficiente aprovechando Mamba, un modelo lineal de espacio de estados. Nuestras principales contribuciones son tres: introducimos MambaNeXt Block, que integra CNN y Mamba, para capturar eficazmente características locales y dependencias de largo alcance; proponemos MAFPN (Red Pirámide de Fusión Asimétrica Multirama) para mejorar la detección de objetos a múltiples escalas; y logramos una eficiencia que facilita la implementación en dispositivos edge como NVIDIA Jetson Xavier NX y Orin NX. Logramos un 66,6 % de mAP a 31,9 FPS en el conjunto de datos PASCAL VOC, lo que demuestra el rendimiento sin preentrenamiento.

Takeaways, Limitations

Takeaways:
Presentamos un marco de detección de objetos en tiempo real eficiente basado en Mamba, que contribuye a mejorar el rendimiento de detección de objetos en entornos con recursos computacionales limitados.
Lograr efectivamente un equilibrio entre precisión y velocidad con MambaNeXt Block y MAFPN.
Presentando la posibilidad de detección de objetos en tiempo real en dispositivos de borde.
Consiga un rendimiento superior sin entrenamiento previo.
Limitations:
Dado que se evaluó únicamente utilizando el conjunto de datos PASCAL VOC, el rendimiento de generalización en otros conjuntos de datos requiere más estudios.
Es necesario un análisis comparativo más detallado del método propuesto con otros modelos de última generación.
Falta de descripción técnica detallada de la implementación del dispositivo de borde de MambaNeXt-YOLO.
👍