Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Placement et migration d'agents d'IA adaptatifs dans les systèmes d'intelligence périphérique

Created by
  • Haebom

Auteur

Xingdan Wang, Jiayi He, Zhiqing Tang, Jianxiong Guo, Jiong Lou, Liping Qian, Tian Wang, Weijia Jia

Contour

Cet article présente un système permettant de déployer et de gérer efficacement des agents d'IA basés sur des modèles de langage à grande échelle (LLM), tels que ChatGPT et Claude, dans des environnements périphériques dynamiques. Pour relever les défis de latence élevée des déploiements cloud, nous souhaitons déployer des agents d'IA dans des environnements périphériques. Compte tenu de la nature limitée et hétérogène des ressources périphériques, nous modélisons les contraintes de ressources et la latence/coûts. Nous proposons un cadre adaptatif utilisant l'algorithme de colonie de fourmis et l'optimisation basée sur les LLM. Ce système automatise le déploiement et la migration des agents, optimise l'utilisation des ressources et la qualité de service (QoS), et permet une migration légère des agents ne transmettant que l'état essentiel. Implémenté dans un système distribué utilisant AgentScope, le système a été validé sur des serveurs périphériques répartis à l'échelle mondiale, démontrant des réductions significatives de la latence de déploiement et des coûts de migration.

Takeaways, Limitations

Takeaways:
Présentation de la première solution systématique pour le déploiement et la gestion d'un environnement de périphérie dynamique d'agents d'IA basés sur LLM.
Une stratégie efficace de placement et de migration d'agents utilisant l'algorithme de colonie de fourmis et l'optimisation basée sur LLM.
Réduisez les coûts et améliorez l’efficacité grâce à une migration d’agents légère.
Prouver la praticité grâce à la mise en œuvre réelle d'un système distribué et à la vérification globale du serveur de périphérie.
Réduction vérifiée de la latence de déploiement et des coûts de migration
Limitations:
Une vérification supplémentaire de l’évolutivité du cadre proposé est nécessaire.
Une évaluation de l’applicabilité est nécessaire pour différents types d’appareils périphériques et d’environnements réseau.
Nécessité de contre-mesures pour résoudre les problèmes de perte de données et de cohérence qui peuvent survenir lors de la migration de l'agent.
Une analyse de la consommation d’énergie et de la dégradation des performances des appareils périphériques est nécessaire.
👍