Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

SE-Agent: Optimización de trayectorias de autoevolución en razonamiento multipaso con agentes basados ​​en LLM

Created by
  • Haebom

Autor

Jiaye Lin, Yifu Guo, Yuzhen Han, Sen Hu, Ziyi Ni, Licheng Wang, Mingguang Chen, Hongzhang Liu, Ronghao Chen, Yangfan He, Daxin Jiang, Binxing Jiao, Chen Hu, Huacan Wang

Describir

Este artículo propone SE-Agent, un marco de autoevolución (SE) que aprovecha eficazmente las trayectorias de interacción que surgen durante el proceso de resolución de problemas de un agente basado en un modelo de lenguaje a gran escala (LLM) para mejorar su rendimiento. Para superar las limitaciones de métodos existentes como MCTS, que conducen a resultados subóptimos debido a interdependencias y falta de diversidad, SE-Agent optimiza iterativamente el proceso de inferencia mediante tres operaciones: modificación, recombinación y mejora de trayectorias previas. Esto le permite explorar diversas rutas de solución, mitigar el impacto de rutas ineficientes y mejorar el rendimiento. Los resultados experimentales con SWE-bench Verified demuestran un rendimiento de vanguardia, logrando mejoras de rendimiento de hasta un 55 % en cinco LLM robustos.

Takeaways, Limitations

Takeaways:
Se presenta un nuevo enfoque para optimizar el proceso de resolución de problemas de agentes basados ​​en LLM.
Abordar los problemas de interdependencia y falta de diversidad del MCTS existente, que es Limitations.
Mejora eficiente del rendimiento y espacio de búsqueda ampliado mediante la reutilización de rutas anteriores.
Excelente rendimiento comprobado en tareas reales de resolución de problemas de GitHub.
Ampliar la investigación y sugerir usabilidad a través de la divulgación de código abierto.
Limitations:
La eficacia de SE-Agent puede depender del rendimiento del LLM utilizado.
Dado que estos resultados se basan en un dominio específico (problema de GitHub), se necesita más investigación para determinar su generalización.
Se necesita más investigación sobre estrategias de optimización para las tres operaciones (modificación, recombinación y mejora).
Es necesario verificar la escalabilidad de SE-Agent para problemas con muy alta complejidad.
👍