Dans cet article, nous proposons EcoAgent, un framework multi-agent collaboratif edge-cloud pour l'automatisation mobile. EcoAgent se compose d'un agent de planification basé sur le cloud et d'un agent d'exécution et d'observation basé sur la périphérie. L'agent d'observation compresse les images d'écran en texte concis pour réduire l'utilisation des jetons et la surcharge de communication, et en cas de panne, récupère l'historique de l'écran via le module de mémoire et replanifie via le module de réflexion. Les agents mobiles cloud basés sur des modèles de langage à grande échelle (multimodaux) offrent de puissantes capacités d'inférence, mais souffrent d'une latence et d'un coût élevés. En revanche, les modèles affinés sont capables de déploiement en périphérie, mais présentent de faibles capacités générales et peinent à gérer des tâches complexes. EcoAgent permet une automatisation mobile efficace et pratique en réduisant considérablement la consommation de jetons MLLM tout en obtenant des taux de réussite de tâches similaires à ceux des agents basés sur le cloud.