Daily Arxiv

Cette page résume et organise les publications en intelligence artificielle du monde entier.
Les contenus sont synthétisés grâce à Google Gemini et le service est proposé à but non lucratif.
Les droits d'auteur des articles appartiennent à leurs auteurs ou institutions respectives ; en cas de partage, il suffit d'en mentionner la source.

Cognitive Kernel-Pro : un cadre pour la formation des agents de recherche approfondie et des modèles de fondation d'agents

작성자
  • Haebom

Auteur

Tianqing Fang, Zhisong Zhang, Xiaoyang Wang, Rui Wang, Can Qin, Yuxuan Wan, Jun-Yu Ma, Ce Zhang, Jiaqi Chen, Xiyun Li, Hongming Zhang, Haitao Mi, Dong Yu

Contour

Cognitive Kernel-Pro est un framework d'agents entièrement open source, gratuit et multimodulaire pour les agents d'IA généraux, permettant le raisonnement complexe, l'interaction web, le codage et la recherche autonome. Cet article examine systématiquement la conservation de données d'entraînement de haute qualité pour les modèles basés sur des agents, en se concentrant sur la création de requêtes, de chemins et de réponses vérifiables dans quatre domaines clés : le web, les fichiers, le code et le raisonnement général. De plus, nous explorons de nouvelles stratégies de réflexion et de vote des agents lors des tests afin d'améliorer leur robustesse et leurs performances. Nous avons évalué Cognitive Kernel-Pro sur la base de GAIA, obtenant des résultats de pointe parmi les agents open source et libres. Plus précisément, notre modèle open source de 8 milliards de paramètres surpasse les systèmes leaders précédents tels que WebDancer et WebSailor, établissant ainsi une nouvelle norme de performance pour les agents d'IA accessibles et performants.

Takeaways, Limitations_

Takeaways:
Fournir un cadre d'agent d'IA haute performance, open source et librement accessible.
Présentation d'une stratégie de conservation des données de formation de haute qualité et création d'ensembles de données pour quatre domaines clés : le Web, les fichiers, le code et l'inférence générale.
Nous proposons une stratégie pour améliorer la robustesse et les performances des agents grâce à la réflexion et au vote du temps de test des agents.
Obtenez des performances supérieures à celles des agents open source les plus performants existants.
Contribuer à améliorer l'accessibilité et la reproductibilité de la recherche sur les agents d'IA
Limitations:
L'article ne mentionne pas explicitement le Limitations spécifique. Des recherches supplémentaires sont nécessaires pour améliorer les performances et surmonter les limitations.
Les performances du modèle à 8 milliards de paramètres peuvent être limitées à un benchmark spécifique (GAIA), et ses performances sur d'autres benchmarks ou dans des environnements d'application réels nécessitent une validation supplémentaire.
Bien qu'il soit open source, l'accès aux ressources matérielles et logicielles nécessaires à son exécution peut être limité.
👍