Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

EcoAgent : un framework multi-agent collaboratif Edge-Cloud efficace pour l'automatisation mobile

Created by
  • Haebom

Auteur

Biao Yi, Xavier Hu, Yurun Chen, Shengyu Zhang, Hongxia Yang, Fan Wu, Fei Wu

Contour

Dans cet article, nous proposons EcoAgent, un framework multi-agent collaboratif edge-cloud pour l'automatisation mobile. EcoAgent se compose d'un agent de planification basé sur le cloud et d'un agent d'exécution et d'observation basé sur la périphérie. L'agent d'observation compresse les images d'écran en texte concis pour réduire l'utilisation des jetons et la surcharge de communication, et en cas de panne, récupère l'historique de l'écran via le module de mémoire et replanifie via le module de réflexion. Les agents mobiles cloud basés sur des modèles de langage à grande échelle (multimodaux) offrent de puissantes capacités d'inférence, mais souffrent d'une latence et d'un coût élevés. En revanche, les modèles affinés sont capables de déploiement en périphérie, mais présentent de faibles capacités générales et peinent à gérer des tâches complexes. EcoAgent permet une automatisation mobile efficace et pratique en réduisant considérablement la consommation de jetons MLLM tout en obtenant des taux de réussite de tâches similaires à ceux des agents basés sur le cloud.

Takeaways, Limitations

Takeaways:
Résoudre les problèmes de latence et de coût élevés des agents mobiles basés sur le cloud grâce à la collaboration de bout en bout
Résoudre les problèmes courants de dégradation des performances grâce à des modèles affinés
Réduisez l'utilisation des jetons et la surcharge de communication grâce à la compression de l'image de l'écran
Fournit une capacité de replanification en cas de panne via le module de mémoire et le module de réflexion
Obtenez des taux de réussite des tâches comparables à ceux des agents basés sur le cloud
Limitations:
Les expériences ont été menées uniquement dans l’environnement AndroidWorld, et la généralisabilité à d’autres environnements doit être vérifiée.
Manque d’analyse détaillée des performances et des limites du module de pré-compréhension.
Nécessité d'une évaluation supplémentaire des performances pour les tâches de complexité variable
Manque d'examen de l'efficacité énergétique et de la stabilité dans les environnements d'utilisation réels
👍