Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

M3-Net: Un modelo rentable basado en MLP sin gráficos para la predicción del tráfico

Created by
  • Haebom

Autor

Guangyin Jin, Sicong Lai, Xiaoshuai Hao, Mingtao Zhang, Jinlei Zhang

Describir

Este artículo propone M3-Net, un modelo rentable y sin grafos basado en perceptrones multicapa (MLP) para la predicción precisa del volumen de tráfico, esencial para el desarrollo de sistemas de transporte inteligentes. Los modelos existentes de predicción del volumen de tráfico basados en aprendizaje profundo se basan en la estructura completa de la red de transporte o requieren diseños de modelos complejos para capturar dependencias espaciotemporales complejas. M3-Net aborda estos problemas utilizando series temporales e incrustaciones espaciotemporales para un procesamiento eficiente de características e introduciendo una novedosa arquitectura MLP-Mixer con un mecanismo de Mezcla de Expertos (MoE). Experimentos con diversos conjuntos de datos reales demuestran el excelente rendimiento predictivo y la facilidad de implementación del modelo propuesto.

Takeaways, Limitations

Takeaways:
Se presenta un modelo ligero de predicción del volumen de tráfico basado en MLP que supera las limitaciones de los modelos basados en gráficos.
Utilización de series temporales e incrustaciones espaciotemporales para un procesamiento eficiente de características.
Mejora del rendimiento mediante la introducción de la arquitectura MLP-Mixer que utiliza el mecanismo MoE.
Validado por su excelente rendimiento predictivo y capacidad de implementación liviana en varios conjuntos de datos del mundo real.
Limitations:
Se necesita más investigación sobre el rendimiento de generalización del modelo propuesto.
Es necesaria una evaluación de aplicabilidad para redes de transporte de distintos tamaños.
Es necesario analizar los costos computacionales del mecanismo MoE.
👍