Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

EcoAgent: Un marco colaborativo multiagente eficiente entre la nube y el borde para la automatización móvil

Created by
  • Haebom

Autor

Biao Yi, Xavier Hu, Yurun Chen, Shengyu Zhang, Hongxia Yang, Fan Wu, Fei Wu

Describir

En este artículo, proponemos EcoAgent, un marco colaborativo multiagente de nube de borde para la automatización móvil. EcoAgent consta de un agente de planificación basado en la nube y un agente de ejecución y observación basado en el borde. El agente de observación comprime las imágenes de la pantalla en texto conciso para reducir el uso de tokens y la sobrecarga de comunicación y, en caso de falla, recupera el historial de la pantalla a través del módulo de memoria y lo replanifica a través del módulo de reflexión. Los agentes móviles en la nube basados ​​en modelos de lenguaje a gran escala (multimodales) brindan potentes capacidades de inferencia, pero sufren de alta latencia y costos. Por otro lado, los modelos ajustados pueden implementarse en el borde, pero tienen capacidades generales deficientes y tienen dificultades con tareas complejas. EcoAgent permite una automatización móvil eficiente y práctica al reducir significativamente el consumo de tokens MLLM y al mismo tiempo lograr tasas de éxito de tareas similares a las de los agentes basados ​​en la nube.

Takeaways, Limitations

Takeaways:
Solución a los problemas de alta latencia y costos de los agentes móviles basados ​​en la nube con colaboración de borde a nube
Abordar problemas comunes de degradación del rendimiento con modelos optimizados
Reducir el uso de tokens y la sobrecarga de comunicación mediante la compresión de imágenes de pantalla
Proporciona capacidad de replanificación en caso de falla a través del módulo de memoria y el módulo de reflexión.
Lograr tasas de éxito de tareas comparables a las de los agentes basados ​​en la nube
Limitations:
Los experimentos se realizaron únicamente en el entorno AndroidWorld y es necesario verificar la generalización a otros entornos.
Falta de análisis detallado del desempeño y limitaciones del Módulo de Pre-Comprensión.
Necesidad de evaluación de desempeño adicional para tareas de diversa complejidad
Falta de revisión de la eficiencia y estabilidad energética en entornos de uso del mundo real
👍