Esta página recopila y organiza artículos sobre inteligencia artificial publicados en todo el mundo. La información aquí presentada se resume utilizando Google Gemini y el sitio se gestiona sin fines de lucro. Los derechos de autor de los artículos pertenecen a sus autores y a las instituciones correspondientes; al compartir el contenido, basta con citar la fuente.
VerifiAgent: un agente de verificación unificado en el razonamiento de modelos de lenguaje
Created by
Haebom
Autor
Jiuzhou Han, Wray Buntine, Ehsan Shareghi
Describir
Los modelos de lenguaje a gran escala exhiben capacidades de inferencia notables, pero a menudo generan respuestas poco fiables o incorrectas. Los métodos de verificación existentes suelen ser específicos del modelo o limitados por el dominio, requieren recursos computacionales significativos y carecen de escalabilidad para diversas tareas de inferencia. Para abordar estas limitaciones, este artículo propone VerifiAgent, un agente de verificación integrado que integra dos niveles de verificación. La metaverificación evalúa la integridad y la consistencia de las respuestas del modelo, mientras que la verificación adaptativa basada en herramientas permite a VerifiAgent seleccionar de forma autónoma las herramientas de verificación adecuadas según el tipo de inferencia, incluyendo la matemática, la lógica o la de sentido común. Este enfoque adaptativo garantiza tanto la eficiencia como la robustez en diversos escenarios de verificación. Los resultados experimentales demuestran que VerifiAgent supera a los métodos de verificación de referencia (p. ej., verificadores deductivos y verificadores regresivos) en todas las tareas de inferencia. Además, la retroalimentación de los resultados de la verificación puede utilizarse para mejorar aún más la precisión de la inferencia. VerifiAgent también se puede aplicar eficazmente al escalamiento de inferencia, logrando mejores resultados con menos muestras generadas y a un menor coste en comparación con los modelos de compensación de procesos existentes en el ámbito de la inferencia matemática. El código se encuentra en https://github.com/Jiuzhouh/VerifiAgent .