[공지사항]을 빙자한 안부와 근황 
Show more

Daily Arxiv

Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo.
La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro.
Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.

Razonamiento agéntico: un marco optimizado para mejorar el razonamiento LLM con herramientas agénticas

Created by
  • Haebom

Autor

Junde Wu, Jiayuan Zhu, Yuyuan Liu, Min Xu, Yueming Jin

Describir

En este artículo, presentamos un marco de razonamiento agéntico que mejora la capacidad de razonamiento de los modelos de lenguaje a gran escala (LLM) mediante la integración de agentes externos que utilizan herramientas. Resuelve problemas complejos que requieren investigación profunda aprovechando dinámicamente la búsqueda web, la ejecución de código y la memoria estructurada. La innovación clave es el agente de mapas mentales, que almacena el contexto de inferencia y rastrea las relaciones lógicas para mantener la coherencia durante los procesos de inferencia a largo plazo gracias al uso extensivo de herramientas. Además, desarrollamos un mecanismo de búsqueda altamente eficiente que supera los enfoques existentes mediante la exploración exhaustiva de agentes de búsqueda web. Nuestro método aplicado a DeepSeek-R1 alcanza un rendimiento de vanguardia (SOTA) entre los modelos públicos y es comparable al rendimiento de OpenAI Deep Research, un modelo propietario líder en este campo. Amplios estudios de ablación verifican la selección óptima de herramientas de agente y confirman la eficacia de los agentes de mapas mentales y de búsqueda web. El código se puede encontrar en https://github.com/theworldofagents/Agentic-Reasoning .

Takeaways, Limitations

Takeaways:
Presentamos Agent Inference, un nuevo marco para mejorar la capacidad de inferencia de los LLM.
Garantizar la consistencia de los procesos de razonamiento a largo plazo mediante agentes de mapas mentales.
Desarrollo de un mecanismo de búsqueda web altamente eficiente que supera los métodos existentes.
Logra un rendimiento de última generación entre los modelos públicos y consigue un rendimiento comparable a OpenAI Deep Research.
Selección óptima de herramientas de agente y verificación de la efectividad del agente.
Limitations:
Se necesitan más investigaciones para determinar la generalización del enfoque presentado en este artículo.
Se necesitan más evaluaciones de desempeño para diferentes tipos de problemas.
Se necesita más análisis sobre la escalabilidad y la eficiencia del marco de inferencia del agente.
Tenga en cuenta que esta es una comparación de rendimiento, no una comparación directa con el modelo propietario, OpenAI Deep Research.
👍