Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

CODA: Coordinación del cerebro y el cerebelo para un agente de uso informático de cerebro dual con aprendizaje de refuerzo desacoplado

Created by
  • Haebom

Autor

Zeyi Sun, Yuhang Cao, Jianze Liang, Qiushi Sun, Ziyu Liu, Zhixiong Zhang, Yuhang Zang, Xiaoyi Dong, Kai Chen, Dahua Lin, Jiaqi Wang

Describir

Este artículo presenta un enfoque novedoso para abordar el diseño de agentes autónomos para interfaces gráficas de usuario (GUI) en campos especializados como la computación científica. Este enfoque supera las limitaciones de los agentes generales y expertos existentes en situaciones que requieren planificación a largo plazo y ejecución precisa. Si bien los enfoques existentes se enfrentan a un equilibrio entre las capacidades de planificación y ejecución, presentamos CODA, un marco de trabajo compositivo y fácil de aprender que integra un planificador general (Cerebrum) y un ejecutor experto (Cerebellum). CODA se entrena mediante un proceso de dos etapas. En la primera etapa, Especialización, los planificadores expertos se entrenan individualmente para cada aplicación científica. En la segunda etapa, Generalización, se agregan todas las trayectorias exitosas y se utilizan para el ajuste fino supervisado del planificador final. Esto garantiza que CODA posea capacidades robustas de ejecución y generalización interdominio. En cuatro tareas del benchmark ScienceBoard, CODA supera significativamente a los métodos existentes y alcanza el mayor rendimiento entre los modelos de código abierto.

Takeaways, Limitations

Takeaways:
Un nuevo enfoque para mejorar el rendimiento de los agentes autónomos de GUI en la computación científica.
Superar las limitaciones existentes combinando habilidades de planificación general con habilidades de ejecución profesional
Adaptabilidad a partir de la experiencia mediante un marco configurable y que se puede aprender
Consiga un rendimiento eficaz incluso en entornos de datos limitados
El mayor rendimiento entre los modelos de código abierto
Limitations:
Es necesaria una evaluación más profunda de la generalización del marco propuesto.
La verificación de escalabilidad es necesaria para varios campos científicos y entornos GUI más complejos.
Se requiere una evaluación del desempeño en puntos de referencia distintos del ScienceBoard.
Necesidad de evaluar la dependencia de la calidad de los datos de entrenamiento
👍