Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

TransLLM : un cadre de base multitâche unifié pour le transport urbain via des invites d'apprentissage

Created by
  • Haebom

Auteur

Jiaming Leng, Yunying Bi, Chuan Qin, Bing Yin, Yanyong Zhang, Chao Wang

Contour

Cet article propose TransLLM, un cadre intégré combinant modélisation spatio-temporelle et modèle de langage à grande échelle (LLM) pour relever divers défis des systèmes de transport urbain, notamment la prévision du trafic, la prévision de la demande de recharge de véhicules électriques et la répartition des taxis. TransLLM capture les dépendances complexes grâce à un encodeur spatio-temporel léger et interagit de manière transparente avec le LLM grâce à la construction d'invites apprenables. Un mécanisme de routage d'invites au niveau de l'instance, entraîné par apprentissage par renforcement, personnalise dynamiquement les invites en fonction des caractéristiques d'entrée. Il encode les schémas spatio-temporels sous forme de représentations contextuelles, construit des invites personnalisées pour guider l'inférence du LLM et génère des prédictions spécifiques à la tâche via une couche de sortie spécialisée. Les résultats expérimentaux sur sept jeux de données et trois tâches démontrent que TransLLM est compétitif dans les environnements supervisés et à zéro coup, démontrant une excellente généralisation et une adaptabilité inter-tâches.

Takeaways, Limitations

Takeaways:
Il surmonte les limites des modèles spécifiques aux tâches existants et présente une solution intégrée à divers problèmes de transport urbain.
En combinant efficacement les données spatio-temporelles avec le LLM, nous exploitons les atouts du LLM pour résoudre les problèmes de transport urbain.
Améliorez les performances du modèle et la capacité de généralisation grâce à une configuration d'invite apprenable et à un mécanisme de routage d'invite basé sur l'apprentissage par renforcement.
Il affiche d'excellentes performances même dans des paramètres zéro prise de vue, atténuant ainsi les problèmes de pénurie de données.
Limitations:
Il peut y avoir un manque d’analyse des interactions entre les facteurs qui contribuent à l’amélioration des performances du modèle proposé.
Une évaluation plus approfondie des performances de généralisation dans divers environnements urbains et systèmes de transport est nécessaire.
Des recherches supplémentaires sont nécessaires sur l’évolutivité et les performances de traitement en temps réel pour une application à des systèmes réels.
Une analyse plus détaillée peut être nécessaire pour déterminer comment les caractéristiques de l’ensemble de données utilisé affectent les performances du modèle.
👍